Técnicas de anonimidad

Se busca evitar que un dataset revele las identidades de los usuarios almacenados en este. Los datos que se quieren mantener privados son números como el del DNI, la Seguridad Social, el teléfono o el de una tarjeta de crédito, entre otros.

K-Anonimidad

Un dataset es K-anónimo cuando hay al menos K registros diferentes que comparten los mismos Quasi identificadores. Para cualquier registro (fila), hay al menos k-1 otros registros que comparten el mismo set de atributos que podrían ser usados para identificar cualquiera de ellos de forma única. El valor K se usa para medir la privacidad. Si hay pocos usuarios no es muy útil, si no se tiene cuidado y todos los usuarios de un grupo comparten un campo visible, se pueden deducir cosas.