Perplexity guarda tu IP, tus consultas y las asocia a un perfil incluso sin cuenta; Copilot envía tus búsquedas a Microsoft y las cruza con tu actividad en Bing, Edge y Windows; y casi todos los buscadores ia privacidad aparte funcionan con un modelo parecido. La conversación con un chatbot se siente íntima, pero detrás hay logs, entrenamientos y políticas de retención que pocos usuarios leen. Los datos de perplexity datos incluyen historial de prompts, geolocalización aproximada y huella de dispositivo. Lo de copilot privacidad es aún más enredado porque depende de si lo usas con cuenta personal, Microsoft 365 o Entra ID empresarial. Este artículo desglosa qué recoge cada ia buscador datos popular, qué puedes desactivar y dónde está la línea entre búsqueda inteligente privacidad y vigilancia comercial encubierta.
Qué recogen exactamente los buscadores con IA
Un buscador clásico registra la query, la IP y poco más. Un buscador con IA generativa registra eso y la conversación entera, incluidos los follow-ups y el contexto que aportas sin darte cuenta.
La diferencia importa. Cuando escribes "mejores tratamientos para mi problema de tiroides", a Google le das una intención de búsqueda. A Perplexity o Copilot le das un diagnóstico médico asociado a tu identidad.
- Prompts completos: cada palabra que escribes queda almacenada, normalmente con timestamp.
- Metadatos del dispositivo: sistema operativo, navegador, resolución, idioma, zona horaria.
- IP y geolocalización aproximada: ciudad o región, incluso sin permisos de ubicación.
- Identificadores persistentes: cookies, fingerprinting del navegador, ID de cuenta.
- Documentos adjuntos: PDFs, imágenes y archivos que subes para que la IA los analice.
- Conexiones con otras apps: si vinculas Gmail, Drive o calendario, la IA accede a ese contexto.
Las políticas de privacidad lo explican, pero están redactadas para abogados. La traducción honesta es: si no pagas con dinero, pagas con tu historial de pensamientos.
Perplexity: el agregador que sabe demasiado
Perplexity AI nació en 2022 y se vendió como alternativa "más privada" a Google. La realidad matiza esa promesa.
Su política indica que conserva las consultas para entrenamiento por defecto. Puedes desactivarlo en Settings → AI Data Retention, pero la opción está escondida y solo aplica al uso futuro. Lo ya recogido sigue ahí.
Perplexity también comparte datos con proveedores como OpenAI y Anthropic cuando usas sus modelos premium. Tu prompt viaja, mínimo, a tres empresas distintas: Perplexity, el proveedor del modelo y los partners de analítica (Segment, Datadog).
En 2024 fue acusada por Forbes y Wired de ignorar robots.txt y copiar contenido sin permiso. No es un detalle de privacidad del usuario, pero indica el grado de respeto por las normas que tiene la empresa.
Cómo limitar lo que Perplexity guarda
- Activa "AI Data Retention OFF" en ajustes.
- Usa modo Incognito (no guarda historial en tu cuenta).
- Evita subir documentos personales o de clientes.
- No conectes integraciones (Gmail, Notion) salvo necesidad real.
Copilot de Microsoft: tu actividad cruzada con todo Windows
Copilot es el caso más complejo porque no es un producto, son varios. Copilot Free (web), Copilot Pro, Copilot en Microsoft 365 y Copilot en Windows 11 tienen políticas distintas.
Para usuarios particulares, Microsoft almacena las conversaciones asociadas a tu cuenta y las usa para mejorar el servicio. Para empresas con Microsoft 365 Copilot, los datos quedan dentro del tenant de la organización y, según Microsoft, no se usan para entrenamiento del modelo base.
El problema gordo llegó con Recall, la función que capturaba pantallazos del PC cada pocos segundos. Tras la presión de investigadores como Kevin Beaumont en mayo de 2024, Microsoft tuvo que rediseñarla, cifrarla y hacerla opcional. Un buen recordatorio de que las funciones "de IA" pueden cruzar líneas rojas sin que nadie las haya votado.
| Producto | Entrenamiento con tus datos | Retención |
|---|---|---|
| Copilot Free | Sí (por defecto) | Hasta 18 meses |
| Copilot Pro | Sí (por defecto) | Hasta 18 meses |
| Copilot 365 Empresarial | No | Según política del tenant |
Si te interesa el ángulo más amplio sobre qué compartes con un chatbot, hablamos de ello en privacidad y ChatGPT con detalle.
El resto del zoo: Gemini, Claude, You.com, Brave Search AI
Google Gemini hereda toda la infraestructura publicitaria de Alphabet. Tus prompts se guardan por defecto 18 meses y, si tienes el historial de actividad activado, se cruzan con tu cuenta Google completa (búsquedas, YouTube, Maps).
Claude (Anthropic) tiene una política algo más estricta: por defecto no entrena con datos de usuario en el plan de pago, y la retención es de 30 días salvo bandera de seguridad. Es de los menos voraces, aunque tampoco es Suiza.
You.com permite modo anónimo real, sin cuenta, y ofrece YouPro con compromiso de no usar prompts para entrenamiento. Brave Search AI funciona sobre el índice propio de Brave y promete no asociar consultas a identidad.
DuckDuckGo lanzó Duck.ai como proxy anonimizador: tú hablas con Duck, Duck reenvía a GPT-4 o Claude sin pasar tu IP. Es de las opciones más limpias si buscas búsqueda inteligente privacidad sin renunciar a la capacidad de un modelo grande.
El marco legal: RGPD, AI Act y qué derechos tienes
El Reglamento General de Protección de Datos (Reglamento UE 2016/679) aplica a todos estos servicios cuando tratan datos de residentes europeos. Tienes derecho de acceso, rectificación, supresión y portabilidad.
En la práctica, ejercerlos contra una IA generativa es complicado. Si tu nombre aparece en el modelo entrenado, "borrarlo" implica reentrenar, algo que las empresas argumentan que es desproporcionado. La AEPD ya ha abierto expedientes a OpenAI por esto.
El AI Act europeo (Reglamento UE 2024/1689), en vigor desde agosto de 2024 con aplicación escalonada hasta 2026, clasifica los sistemas de IA por riesgo y obliga a transparencia en modelos generativos. Los proveedores deben publicar resúmenes del material de entrenamiento y respetar copyright.
Si trabajas con datos sensibles (clientes, pacientes, menores), conviene revisar también las apps con permisos excesivos en los dispositivos donde uses estos buscadores. La fuga puede venir por el navegador, no por la IA.
Configuraciones prácticas para reducir exposición
No hace falta volver a buscar en libros de papel. Con unos ajustes razonables puedes seguir usando IA sin alimentar al monstruo.
- Cuenta dedicada: usa una cuenta de email separada de tu identidad principal para registrarte en buscadores IA.
- Navegador con contenedores: Firefox con Multi-Account Containers o Brave con perfiles aísla cookies y fingerprint.
- VPN o Tor para consultas sensibles: oculta IP real al proveedor.
- Desactiva personalización: en Gemini, Copilot y Perplexity hay toggles para "no usar mi actividad".
- DNS seguro: configurar un DNS seguro en el router reduce el rastreo a nivel de red.
- Have I Been Pwned: revisa periódicamente si tu email aparece en filtraciones que afecten a estos servicios.
Para empresas, la conversación cambia. Una guía de seguridad cloud aplicada al uso de IA debe incluir políticas claras sobre qué se puede preguntar a un asistente público y qué requiere despliegue privado. Si necesitas ayuda implementando soluciones de inteligencia artificial para empresas con garantías de privacidad, hay arquitecturas de RAG privado que mantienen los datos dentro de tu infraestructura.
Casos reales de fugas y vigilancia comercial
Marzo de 2023: ChatGPT sufrió un bug de Redis que mostró títulos de conversaciones de otros usuarios y datos parciales de pago. OpenAI desconectó el servicio varias horas.
Abril de 2023: Samsung prohibió a sus empleados usar ChatGPT después de que un ingeniero pegara código fuente confidencial y otro subiera un acta de reunión interna. Ambos quedaron almacenados.
Junio de 2024: The Wall Street Journal publicó que Perplexity ignoraba sistemáticamente las cabeceras "no-scrape" de medios como Forbes, Wired y CNBC. La empresa reconoció el problema y prometió cambios.
Estos no son ataques sofisticados al estilo de zero-days. Son fallos de diseño, malas configuraciones y descuidos humanos. La superficie de exposición de una conversación con IA es enorme y crece con cada integración nueva.
Preguntas frecuentes
¿Perplexity vende mis datos a terceros?
No vende datos personales identificables según su política actual, pero comparte información con proveedores de modelos (OpenAI, Anthropic) y partners de analítica. Tu prompt acaba tocando varias empresas, aunque no se "venda" en sentido estricto.
¿Copilot escucha mis reuniones de Teams?
Solo si activas explícitamente la función de transcripción o resumen. En ese caso, el audio se procesa y la transcripción queda almacenada en tu tenant de Microsoft 365. Los participantes deben recibir aviso según el RGPD.
¿Cuál es el buscador con IA más privado en 2026?
Las opciones con menor recogida son Duck.ai (proxy anonimizador de DuckDuckGo), Brave Search AI y Kagi Assistant (de pago, sin publicidad ni perfilado). Ninguno es perfecto, pero todos superan a las grandes plataformas en este aspecto.
¿Puedo pedir que borren mi historial de prompts?
Sí, el RGPD te ampara. La mayoría de servicios tienen un botón "Delete all data" en ajustes. El problema es lo que ya se usó para entrenar: eso es prácticamente irrecuperable y las autoridades europeas lo están investigando.
¿Es seguro usar IA generativa con documentos de clientes?
Con productos gratuitos o de consumo, no. Para uso profesional con datos de terceros necesitas planes empresariales con garantías contractuales de no-entrenamiento, o despliegues privados tipo Azure OpenAI Service, AWS Bedrock o modelos locales.
El siguiente paso
Abre ahora mismo los ajustes del buscador IA que más uses y desactiva la opción de "usar mis datos para mejorar el modelo". Tarda 30 segundos y reduce tu huella de forma inmediata.


