Knoppia

Wiki de Informática y otras historias

Herramientas de usuario

Herramientas del sitio


pan:privdiff

¡Esta es una revisión vieja del documento!


Introducción a la privacidad diferencial

Es un marco que se define sobre operaciones que uno va a hacer sobre una base de datos en la que hay cuasi identificadores y datos privados que se quieren proteger. Cada usuario sería una fila en dicha base de datos. Tenemos un curador que sigue el protocolo y tiene la confianza de los usuarios que publica los datos utilizando un mecanismo M que tiene una salida R=M(D). El curador calcula funciones de los datos y tenemos un analista que trata de hacer inferencias de lo que hay en la base de datos a partir de lo que ve. A través del estudio, el analista puede encontrar una correlación entre dos elementos de la base de datos, por ejemplo, si fuera una base de datos médicos, si tiene un campo de si alguien fuma y otra de si tiene cancer, puede encontrar la relación de que si alguien fuma, entonces tiene altas probabilidades de tener también cáncer.

La privacidad diferencial protege contra el aprendizaje de cosas que no se pueden obtener mediante inferencia de la información lateral. Si tenemos dos bases de datos y en una tenemos a cierto sujeto y este no está en la otra, la privacidad diferencial busca estadísticamente que el resultado de respuesta de ambas bases de datos cuando se hace una solicitud, el resultado no sea distinguible. Se trata de que cuando el curador responda meta ruido en la respuesta para que ambas bases de datos no sean distinguibles. Lo malo de la privacidad diferencial es que puede inutilizar las bases de datos al introducir ruido en exceso.

pan/privdiff.1727277734.txt.gz · Última modificación: 2024/09/25 15:22 por thejuanvisu