Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
pan:nocpriv [2024/09/12 17:19] – thejuanvisu | pan:nocpriv [2024/09/12 17:45] (actual) – thejuanvisu | ||
---|---|---|---|
Línea 55: | Línea 55: | ||
Netflix sacó un concurso que consistía en buscar herramientas de recomendación para los usuarios. Lo que hicieron fue ofrecer un premio a quien pudiera producir el mejor recomendador. Cada uno de los puntos de datos eran un ID de usuario (anonimizado), | Netflix sacó un concurso que consistía en buscar herramientas de recomendación para los usuarios. Lo que hicieron fue ofrecer un premio a quien pudiera producir el mejor recomendador. Cada uno de los puntos de datos eran un ID de usuario (anonimizado), | ||
- | La base de datos era muy dispersa por los miles de atributos que habían. El conjunto de películas que una persona había visto era casi una variable única. Habían una serie de películas que solo las habían visto un pequeño puñado de personas que resultaron ser atributos casi únicos. Lo que se hizo fue medir la similitud entre los registros de datos, con cierta tolerancia entre la puntuación y la fecha. | + | La base de datos era muy dispersa por los miles de atributos que habían. El conjunto de películas que una persona había visto era casi una variable única. Habían una serie de películas que solo las habían visto un pequeño puñado de personas que resultaron ser atributos casi únicos. Lo que se hizo fue medir la similitud entre los registros de datos, con cierta tolerancia entre la puntuación y la fecha. |
+ | |||
+ | De 50 personas en la base de datos se pudieron identificar 2 personas cruzando los datos con IMDb. Las consecuencias de esto fueron que los que estaban en la base de datos denunciaron a Netflix al considerarse esto una violación de la privacidad y netflix tuvo que pagar 9 millones de dólares a estos usuarios. | ||
+ | |||
+ | ==== Desanonimización basada en la localización ==== | ||
+ | Se tomaron datos de trazas GPS de coches en el área de Detroit con un minuto de resolución. Cuando los coches estaban apagados no enviaban datos. Se eliminaron sitios donde no habían visitas por la tarde y se eliminaron coches fuera de áreas residenciales. Con estos datos se vio que era posible localizar la casa de alguien con estos datos. Durante 2 semanas, con los datos de 172 personas con una resolución de 6 segundos, medianto el uso de heurística para separar los vehículos como: | ||
+ | * A las 3 am estaban en su casa | ||
+ | * El lugar en el que los individuos pasaban más tiempo era su casa | ||
+ | * Se uso geolocalización reversa y páginas amarillas para desanonimizar a los usuarios. | ||
+ | |||
+ | Se logró desanonimizar a un 5% de los sujetos. Incluso con un ruido de std=500m se obtuvo alrededor de un 5% de éxito para localizar las direcciones correctas. | ||
+ | |||
+ | ===== GDPR ===== | ||
+ | |||
+ | Datos personales: cualquier información relacionada con un individuo que puede ser directa o indirectamente identificada. Nombres y direcciones de correo son datos personales obvios. Los datos pseudoanónimos también pueden caer bajo esta definición. | ||
+ | ==== Principios de la GDPR ==== | ||
+ | * El procesamiento debe ser legal, justo y transparente para el dueño de los datos. | ||
+ | * Se debe especificar claramente para que son los datos | ||
+ | * Minimización de datos: solo se deben pedir los datos absolutamente necesarios para el servicio que se ofrece | ||
+ | * Límite de almacenamiento: | ||
+ | * Integridad y confidencialidad: | ||
+ | * Responsabilidad: |