Saltar al contenido
Todos los artículos
compliance

Anonimización vs. seudonimización: la guía del RGPD

Diferencias clave entre anonimización y seudonimización bajo el RGPD: definiciones legales, reversibilidad, tabla comparativa y errores frecuentes.

Equipo de Medianonymizer9 min de lectura

En reuniones, argumentarios de proveedores e incluso políticas internas, los equipos de cumplimiento escuchan "anonimización" y "seudonimización" como si fueran sinónimos. No lo son, y el RGPD los trata de forma muy distinta. Una de estas técnicas puede sacar tus datos del ámbito de la normativa por completo; la otra nunca lo hace, por mucho que parezca robusta.

Esta guía lo deja claro de una vez. Cubre las definiciones legales del RGPD, el papel de la reversibilidad, exactamente cuándo cada técnica saca los datos del ámbito de aplicación, una tabla comparativa y los malentendidos que hacen tropezar incluso a las organizaciones más cuidadosas. El objetivo es que puedas citarla y apoyarte en ella al diseñar un proceso o defenderlo ante una autoridad de control.

En resumen

  • La seudonimización sustituye los identificadores por tokens reversibles. Los datos siguen siendo datos personales y permanecen plenamente dentro del ámbito del RGPD (artículo 4(5), considerando 26).
  • La anonimización elimina el vínculo con una persona de modo que la re-identificación ya no es razonablemente posible. Los datos verdaderamente anónimos quedan fuera del ámbito del RGPD (considerando 26).
  • La línea divisoria es la reversibilidad: si una clave, un mapeo o información adicional pueden restaurar la identidad, tienes seudonimización —no anonimización.
  • Puedes producir ficheros anonimizados de forma irreversible ahora mismo: los datos sensibles se localizan y luego se destruyen de forma determinista, sin dejar ninguna clave atrás.

Las dos definiciones, directamente del RGPD

Estos términos no son lenguaje de marketing: son categorías jurídicas con consecuencias sobre qué obligaciones se aplican.

Seudonimización (artículo 4(5))

El RGPD define la seudonimización como el tratamiento de datos personales de manera que ya no puedan atribuirse a un interesado específico sin utilizar información adicional, siempre que dicha información adicional se mantenga por separado y protegida. El ejemplo clásico: sustituir el nombre de un cliente por USR_48213 mientras una tabla de referencia segura relaciona el token con la persona.

El rasgo definitorio es que el vínculo sigue existiendo. Se ha separado y protegido, pero puede restaurarse. Por eso la seudonimización es una medida de seguridad y minimización de datos, fomentada explícitamente por el artículo 32, pero nunca una salida de la normativa.

Anonimización (considerando 26)

La información anónima se define por lo que no es: datos que no se refieren a una persona física identificada o identificable, o datos personales que se han anonimizado de tal modo que el interesado ya no sea identificable. Los principios de protección de datos del RGPD "no se aplican a la información anónima".

El matiz clave del considerando 26 es el criterio de los "medios razonablemente susceptibles de ser utilizados": para determinar si alguien es identificable, hay que tener en cuenta todos los medios razonablemente susceptibles de ser utilizados por el responsable del tratamiento u otra persona para identificarlo, considerando el coste, el tiempo y la tecnología disponible. La anonimización no es por tanto una técnica concreta, sino un resultado: la re-identificación ya no es razonablemente posible.

La reversibilidad lo es todo

Si tienes que quedarte con una sola idea, que sea esta: la reversibilidad determina la categoría jurídica.

  • Si existe una clave, un mapeo, una sal, una tabla de referencia o cualquier "información adicional" que pudiera volver a vincular los datos con una persona → es seudonimización, y los datos son datos personales.
  • Si la información identificadora original ha sido destruida y no puede recuperarse por medios razonables → es anonimización, y el resultado puede quedar fuera del ámbito de aplicación.

Por eso el cifrado no es anonimización. Los datos personales cifrados son el ejemplo paradigmático de seudonimización: el texto cifrado carece de sentido sin la clave, pero la clave existe y el texto original puede restaurarse. El cifrado robusto es una excelente medida de seguridad. No es una vía de escape del RGPD.

La misma lógica se aplica a los medios. Difuminar una cara con un filtro reversible, o silenciar audio con una capa que puede eliminarse, es seudonimización en el mejor de los casos. Destruir esos píxeles o muestras de audio es anonimización. La prueba siempre es la misma: ¿puede alguien, por medios razonables, recuperar el original?

Cuándo cada técnica saca los datos del ámbito de aplicación

Esta es la pregunta que realmente importa para la planificación del cumplimiento.

AspectoSeudonimizaciónAnonimización
Base jurídica en el RGPDArtículo 4(5), artículo 32Considerando 26
¿Sigue siendo dato personal?No (si es verdaderamente anónimo)
¿Dentro del ámbito del RGPD?SiempreFuera del ámbito
¿Reversible?Sí — por diseño, con la claveNo — el vínculo se destruye
¿Se conserva clave o mapeo?Sí, almacenado por separadoNo existe ninguno
Finalidad principalReducir riesgo, permitir uso seguroSacar los datos de la regulación
Riesgo de re-identificaciónPresente (controlado)Insignificante / ninguno por medios razonables
Técnicas habitualesTokenización, cifrado, IDs codificadosDestrucción, agregación, k-anonimato, generalización

La seudonimización nunca saca los datos del ámbito de aplicación. Reduce el riesgo, facilita la mitigación de brechas y puede aliviar algunas obligaciones, pero todos los deberes del RGPD —base jurídica, plazos de conservación, derechos de los interesados— siguen vigentes.

La anonimización saca los datos del ámbito de aplicación solo cuando se cumple genuinamente el listón del considerando 26. Es un listón alto. Se juzga frente a todos los medios razonablemente susceptibles de ser utilizados por cualquiera, no solo por ti, y debe mantenerse a lo largo del tiempo a medida que mejoran las técnicas de re-identificación. Un conjunto de datos "anónimo" hoy puede volver a convertirse en datos personales si nuevos datos auxiliares hacen factible la re-identificación.

Una ayuda práctica para decidir

  • ¿Existe una clave, sal, mapeo o copia de seguridad que pudiera restaurar la identidad? → seudonimización.
  • ¿Podría un tercero motivado volver a vincular los registros usando otros conjuntos de datos disponibles? → todavía no es anónimo.
  • ¿Siguen presentes cuasi-identificadores (código postal + fecha de nacimiento + género, cargos poco habituales, marcas de tiempo exactas) y son únicos? → el riesgo de re-identificación persiste.
  • ¿Se ha destruido el contenido identificador original, sin retener nada para revertirlo? → candidato a la verdadera anonimización.

Errores frecuentes

"Hemos eliminado los nombres, así que es anónimo"

El error más costoso con diferencia. Eliminar los identificadores directos deja cuasi-identificadores que, combinados, a menudo permiten identificar a personas concretas. Estudios de re-identificación bien conocidos han demostrado que un pequeño número de atributos —como el código postal, la fecha de nacimiento y el género— puede identificar de forma única a una gran proporción de la población. Borrar los nombres es el punto de partida, no el punto de llegada.

"El cifrado equivale a la anonimización"

No. Los datos cifrados son datos seudonimizados: la clave restaura el original. El cifrado protege los datos; no los saca del ámbito de aplicación.

"El hashing lo hace anónimo"

Aplicar hash a identificadores (correos electrónicos, números de teléfono) es seudonimización, no anonimización. El espacio de entrada suele ser lo bastante pequeño para atacarlo por fuerza bruta o con un diccionario, y un hash es un token estable que sigue vinculando registros a la misma persona. A menos que el hash esté salado, descartado e irrecuperable, el vínculo persiste.

"Los datos seudonimizados tienen menos obligaciones"

Tienen cierto alivio en algunos puntos, pero siguen siendo datos personales con todo el peso del RGPD detrás. Tratar las exportaciones seudonimizadas como si estuvieran libres de obligaciones es un hallazgo frecuente en auditorías.

"La anonimización es permanente y definitiva"

El anonimato es relativo a los medios razonablemente susceptibles de ser utilizados — y esos medios evolucionan. Lo que hoy es anónimo puede no serlo dentro de cinco años. La respuesta robusta es destruir los datos identificadores en lugar de simplemente ocultarlos, de modo que no haya nada que volver a vincular independientemente de la capacidad futura.

Cómo lograr realmente una anonimización irreversible

El patrón fiable separa dos tareas que es fácil confundir:

  1. Localizar los datos sensibles — encontrar dónde está la información personal.
  2. Eliminarlos — destruir esos datos para que no puedan recuperarse.

La IA es realmente buena en la primera tarea: el reconocimiento de voz y la detección de entidades encuentran nombres en el audio, la detección de objetos encuentra caras en el vídeo, el OCR y las reglas de patrón encuentran datos personales en documentos. Pero la segunda tarea nunca debe dejarse a un modelo, porque la edición generativa no es determinista ni auditable.

Esta es la idea central detrás de cómo Medianonymizer aborda cada tipo de fichero: la IA solo LOCALIZA los datos sensibles; el código determinista los ELIMINA. Se dibujan cajas sobre los píxeles, las expresiones regulares con validación por checksum detectan identificadores estructurados, los pitidos o silencios sustituyen las muestras de audio, y los metadatos se eliminan a nivel de byte. Como la eliminación es código transparente y testeable que opera sobre coordenadas y marcas de tiempo exactas, el resultado es el mismo cada vez, irreversible y auditable — exactamente las propiedades que exige el considerando 26.

Puedes ver este principio aplicado a distintos tipos de medios:

Para conocer el estándar operativo detrás de todo esto, consulta las mejores prácticas de anonimización irreversible y auditable.

La conclusión para los equipos de cumplimiento

  • Usa la seudonimización cuando necesites que los datos sigan siendo utilizables y re-vinculables de forma controlada — analítica sobre IDs codificados, procesamiento seguro, reducción del riesgo en caso de brecha. Acepta que siguen dentro del ámbito de aplicación.
  • Usa la anonimización cuando quieras datos permanentemente fuera del ámbito de aplicación — conjuntos de datos publicados, archivos a largo plazo, medios compartidos. Acepta que debe ser verdaderamente irreversible y probada frente a una re-identificación razonable.
  • No confundas nunca las dos en tus políticas ni en los argumentarios de los proveedores. La etiqueta no importa; lo que importa es si sobrevive alguna clave o vínculo.

Anonimiza tus ficheros de forma irreversible

Si tu objetivo es que los datos queden genuinamente fuera del ámbito del RGPD, la técnica tiene que destruir el vínculo — no ocultarlo. Sube tu audio, vídeo, imágenes o documentos, dile al asistente qué eliminar y descarga una copia donde los datos sensibles han desaparecido para siempre, con un registro auditable de lo que se ha redactado.

Anonimizar un fichero ahora →

Preguntas frecuentes

¿Los datos seudonimizados siguen siendo datos personales según el RGPD?
Sí. Los datos seudonimizados son explícitamente datos personales según el artículo 4(5) y el considerando 26, porque una clave o información adicional puede volver a vincularlos con una persona. Siguen estando plenamente dentro del ámbito del RGPD, aunque el riesgo sea menor.
¿Cuándo saca la anonimización los datos del ámbito del RGPD?
Solo cuando la re-identificación ya no es razonablemente posible para nadie, teniendo en cuenta todos los medios que probablemente se emplearían, el coste y el tiempo necesarios. Los datos verdaderamente anónimos quedan fuera del RGPD (considerando 26).
¿Puedo eliminar los nombres y llamarlo anonimización?
No. Eliminar los identificadores directos rara vez produce datos anónimos: la combinación de los campos restantes (código postal, fecha de nacimiento, atributos poco comunes) suele permitir la re-identificación. La anonimización debe eliminar ese riesgo residual, no solo los nombres evidentes.
Más sobre compliance

Artículos relacionados