Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| pan:nociones_privacidad_v2 [2026/01/01 21:21] – thejuanvisu | pan:nociones_privacidad_v2 [2026/01/02 22:13] (actual) – thejuanvisu | ||
|---|---|---|---|
| Línea 19: | Línea 19: | ||
| ===== Ataques de inferencia ===== | ===== Ataques de inferencia ===== | ||
| + | * Tratan de averiguar toras cosas a través de los datos disponibles. | ||
| * Inferencia estadística de datos observados: | * Inferencia estadística de datos observados: | ||
| * Los datos oservados pueden decir mucho más de lo esperado ya que somos predecibles | * Los datos oservados pueden decir mucho más de lo esperado ya que somos predecibles | ||
| Línea 37: | Línea 38: | ||
| ===== Deanonimización por vinculación de datos (data linking) | ===== Deanonimización por vinculación de datos (data linking) | ||
| + | Usando bases de datos externas es posible desanonimizar a personas con atributos externos. El adversario puede acceder por cualquier clase de medio a una base de datos no anonimizada y cruzando los datos es capaz de desanonimizar a cualquier individuo. | ||
| * Los datos anonimizados pueden ser deanonimizados enlazandolos con atributos externos. | * Los datos anonimizados pueden ser deanonimizados enlazandolos con atributos externos. | ||
| * Cuantos más escasos sean los datos, más únicos son, por lo que es más fácil vincularlos. | * Cuantos más escasos sean los datos, más únicos son, por lo que es más fácil vincularlos. | ||
| Línea 43: | Línea 45: | ||
| ==== Deanonimización de Netflix ==== | ==== Deanonimización de Netflix ==== | ||
| - | Tomando un dataset de netflix anonimizado un grupo fue capaz de deanonimizarlo enlazando los datos de este con reviews de webs de reviews de películas (IMDb). | ||
| - | ===== Deanonimización basada en Home Location | + | Netflix lanzó un concurso para buscar herramientas de recomendación para sus usuarios. Lo que hicieron fue ofrecer un premio a quien pudiera crear el mejor sistema de recomendaciones. Cada uno de los datasets estaba conpuesto por el ID de usuario anonimizado, |
| + | |||
| + | La base de datos era bastante dispersa por los miles de atributos que habían, el conjunto de películas que una persona había visto era una variable casi única. Algunas películas habían sido vistas por solo un pequeño grupo de personas, siendo esto atributos únicos. Lo que se hizo fue medir la similitud entre los registros de datos con cierta tolerancia entre la puntuación y la fecha. Se empezaron a utilizar 1 y 0 para indicar si una película gustaba o no. Se tomó la base de datos de netflix y se cruzón con IMDb, buscando la gente que dio puntuaciones parecidas en las mismas fechas consitentemetne. | ||
| + | |||
| + | Con este método se pudieron identificar 2 de cada 50 personas cruzando los datos con IMDB. Las consecuencias de esto fue una denuncia contra netflix por parte de las personas cuyos datos estaban en eld ataset al ser esto una violación de la privacidad. Netflix tuvo que pagar 9 Millones de dólares a los usuarios afectados. | ||
| + | |||
| + | ===== Deanonimización basada en la localización ===== | ||
| + | |||
| + | Se tomaron datos GPS de vehículos en el área de Detroit con un minuto de diferencia. Cuando los coches estaban apagados no enviaban datos. Se eliminaron sitios donde no se trabajaba por la tarde y se eliminaron los coches fuera de las áreas residenciales. Con estos datos fue posible localizar la casa de múltiples individuos. Durante 2 semanas, con los datos de 172 personas, mediante el uso de heurística (Las 3 Am estaba en casa, Luegar donde pasaban más tiempo, Uso de geolocalización reversa y páginas amarillas) para separar los vehículos se logró desanonimizar a un 5% de los sujetos. | ||
| + | |||
| + | ===== GDPR ===== | ||
| + | |||
| + | Datos personales: cualquier información relacionada con un individuo que puede ser directa o indirectamente identificada. Nombres y direcciones de correo son datos personales obvios. Los datos pseudoanónimos también pueden caer bajo esta definición. | ||
| + | |||
| + | ==== Principios de la GDPR ==== | ||
| + | * El procesamiento debe ser legal, justo y transparente para el dueño de los datos. | ||
| + | * Se debe especificar claramente para que son los datos | ||
| + | * | ||
| + | * | ||
| + | * | ||
| + | * | ||