Tu equipo usa IA todos los días: ¿qué pasa con los datos de tus clientes? | nacaIA

Marta es la recepcionista de una asesoría laboral en Sevilla. Un cliente le manda por email un despido que tiene que entender en diez minutos para llamarle al móvil. Marta abre ChatGPT, copia el email entero (con nombre, NIF, sueldo y motivos del despido) y le pide: "Resúmemelo en cinco puntos para llamar al cliente". Treinta segundos después tiene el resumen. Lo que Marta no sabe es que esos datos personales acaban de cruzar el Atlántico y están guardados en servidores de OpenAI en Estados Unidos, probablemente para siempre.

Esto pasa hoy en cientos de pymes españolas. No con mala intención, sino con prisa.

El problema que nadie te ha contado

Tu equipo ya usa IA todos los días. Si trabajan delante de un ordenador, abren ChatGPT, Claude o Copilot varias veces al día sin que nadie se lo haya dicho. Lo usan para:

Redactar emails complicados a clientes.
Resumir documentos largos (contratos, facturas, partes de trabajo).
Traducir mensajes de un proveedor extranjero.
Preparar copys para redes sociales.
Buscar respuestas rápidas a temas técnicos del trabajo.

Trabajan más rápido y se quitan tareas mecánicas de encima. Pero hay un detalle: cada texto que pegan en una IA viaja a los servidores de OpenAI, Anthropic, Google o Microsoft, y la mayoría de las veces ese texto incluye datos personales de tus clientes.

📌 Lo que casi nadie verifica

Pregunta a tu equipo si han usado IA esta semana. Pregúntales luego con qué texto. Si te dicen "un email de un cliente", "un contrato", "un parte de la asistencia técnica" o "la consulta de un paciente", esos datos ya están fuera de tu control.

Por qué pasa y por qué no se va a parar

El recurso más caro de tu empresa es el tiempo. Tu equipo lo sabe, tú lo sabes. La IA es una palanca brutal para ahorrarlo.

Pedirle a tu equipo "no uséis ChatGPT con datos de clientes" tiene tres problemas:

Va contra su productividad, vuelven a tardar el doble.
No lo van a cumplir, lo harán a escondidas.
Crea una dinámica de control que rompe la confianza.

La salida no es prohibir. Es poner una capa entre tu equipo y la IA que limpie los datos sensibles antes de que salgan de tu empresa. Que la IA reciba el texto sin nombres, sin NIFs, sin emails, sin cuentas y sin teléfonos, y devuelva un resultado igual de útil.

Qué pasa de verdad con tus datos en ChatGPT, Claude o Copilot

Tres cosas conviene saber sin entrar en jerga jurídica:

1. Los datos viajan fuera del Espacio Económico Europeo. OpenAI tiene sus servidores en Estados Unidos, Anthropic también, Google y Microsoft tienen centros repartidos por varios países. Cuando tu equipo pega un texto, ese texto cruza la frontera.

2. Los planes gratuitos y personales guardan tus conversaciones para entrenar el modelo. Esto cambia según el plan: ChatGPT Team y Enterprise dicen no entrenar con tu texto, Claude Pro también. Pero la cuenta que abre tu recepcionista para resolver un apuro normalmente no es ninguna de esas: es la gratuita.

3. El RGPD considera "transferencia internacional" cualquier dato personal que salga de la UE. Eso te obliga a tener una base legal y a informar al cliente. La mayoría de pymes no lo hace porque no sabe que está pasando.

Sin entrar en sustos, el resultado práctico es: tienes una fuga de datos silenciosa por la puerta del navegador.

La solución: una capa que limpia el texto antes de subirlo

Microsoft (sí, los mismos) tiene un proyecto gratuito y de código abierto llamado Presidio. Lo que hace es muy concreto: lee un texto, identifica los datos personales (nombres, emails, IBANs, teléfonos, direcciones, ubicaciones) y los sustituye por etiquetas neutras antes de que el texto vaya a ningún sitio.

Se deja funcionando dentro de tu servidor o en un VPS tuyo. Tu equipo (o tus automatizaciones) hablan primero con Presidio. Presidio limpia, y solo el texto limpio llega a ChatGPT, Claude o el LLM que sea.

📌 Lo que ve la IA

Entra: "Marta López, NIF 12345678X, despido procedente con indemnización de 4.500€..."
Sale: "<OCULTO>, NIF <OCULTO>, despido procedente con indemnización de <OCULTO>..."

La IA recibe el texto limpio, hace su resumen y lo devuelve. Tu equipo lee el resumen, ya sabe a quién corresponde. Pero los datos sensibles nunca han cruzado la puerta.

Demo: cómo se ve en la práctica

Imagina que tu asesoría recibe esta consulta por email:

Hola Marta,

Soy María García, NIF 87654321Y. Vivo en Madrid (calle Mayor 22, 28013).
Os escribo porque he recibido carta de despido el 15 de mayo,
indemnización 4.500€.
Mi email es maria.garcia@ejemplo.com y mi teléfono +34 600 000 000.
¿Me podéis ayudar a reclamar?

Sin filtro, tu recepcionista lo pega en ChatGPT y los cinco datos personales (nombre, NIF, dirección completa, email y teléfono) acaban en Estados Unidos.

Con Presidio delante, ChatGPT recibe esto:

Hola Marta,

Soy <OCULTO>, NIF <OCULTO>. Vivo en Madrid (<OCULTO>).
Os escribo porque he recibido carta de despido el 15 de mayo,
indemnización 4.500€.
Mi email es <OCULTO> y mi teléfono <OCULTO>.
¿Me podéis ayudar a reclamar?

ChatGPT resume el caso, identifica que es un despido a revisar, sugiere documentación a pedir y devuelve un resumen útil. Marta tiene su contestación, y los datos del cliente nunca han salido de la empresa.

Esto mismo funciona con Claude, con Copilot, con Gemini, con Mistral y con cualquier modelo de IA en el mercado. Presidio se pone delante, los demás vienen detrás.

Para qué tipo de empresas tiene sentido

Esto encaja si en tu día a día:

Manejas datos personales de clientes (asesorías, despachos, gestorías, clínicas, talleres con historial técnico, agencias inmobiliarias, comerciales con carteras).
Tu equipo ya usa IA por su cuenta sin reglas claras.
Tienes preocupación legal o de imagen si esos datos se filtran.
Quieres mantener la productividad de la IA sin renunciar al control.

No encaja si:

Trabajas con datos puramente públicos (catálogo de productos, descripciones genéricas).
Tu equipo no usa IA todavía, en cuyo caso prepárate para el futuro próximo.
Vas a pagar ChatGPT Enterprise o equivalente, donde el contrato cubre la protección de datos. Aun así, Presidio sigue valiendo como capa extra.

Cómo montarlo en tu empresa

Hay dos caminos:

Camino 1: lo hacemos por ti. En nacaIA montamos la capa Presidio en tu VPS o en un servidor que te dejamos preparado, lo integramos con la IA que ya uses (ChatGPT, Claude, Copilot) o con tu n8n si tienes automatizaciones, y entrenamos a tu equipo en una sesión de una hora. Coste cerrado, resultado garantizado.

Camino 2: lo haces tú. Si tu equipo es técnico o tienes un proveedor que se ocupa de tu infraestructura, te dejamos el manual completo paso a paso. Pegas el Dockerfile, montas dos servicios, los conectas y listo. Está pensado para que lo siga alguien con conocimientos medios.

Descarga el manual completo: Presidio paso a paso en EasyPanel

Guía PDF de 14 figuras y todos los comandos para dejar la capa de privacidad funcionando en español en tu VPS. Lo que aplicamos en nuestros clientes, sin filtros.

Lo que viene después

Proteger los datos es la primera capa. La segunda es entender qué se puede hacer con IA en tu empresa sin contratar a un programador, y cuánto cuesta hacerlo. Cubrimos ambos puntos en estos dos artículos:

Preguntas frecuentes

¿Esto reemplaza a ChatGPT o tengo que dejar de usarlo?
No. Sigues usando ChatGPT, Claude o el que uses. Presidio solo se pone en medio para limpiar los datos antes de que salgan. Tu equipo no nota la diferencia, salvo que ahora el texto que llega a la IA tiene etiquetas en lugar de nombres.

¿Cuánto cuesta?
Si lo haces tú, el coste es de 0€ (el software es gratuito) más unas dos o tres horas de un técnico para montarlo. Si lo subcontratas, depende del proveedor. En nacaIA partimos de 350€ para el montaje básico en un VPS que ya tengas. Más detalle en el artículo de coste.

¿Funciona en español?
Sí. Presidio trae los modelos en inglés por defecto, pero en el manual te enseñamos cómo dejarlo configurado en español para que detecte nombres, ubicaciones y el resto de entidades en castellano.

¿Vale para Claude, Copilot, Gemini y otros LLMs además de ChatGPT?
Sí, vale para cualquiera. Presidio no habla con el LLM, solo limpia el texto. Lo que llegue después es decisión tuya.

¿Y si quiero recuperar los datos originales en la respuesta de la IA?
Se puede. Presidio soporta cifrado reversible: en lugar de borrar el dato, lo cifra. La IA recibe un código, te devuelve la respuesta con ese código, y tú lo descifras al final. El cliente lee su nombre y sus datos sin haberlos enviado a ningún sitio externo.

Jorge Benítez

Fundador de nacaIA · Especialista en automatizaciones con n8n y desarrollo de software

Ayudo a empresas a automatizar procesos con n8n, IA y desarrollo a medida. Más sobre mí →