Come anonimizzare i dati
Utilizza il form in questa pagina per contattarci e scoprire se i tuoi dati devono essere anonimizzati.
Se intendi depositare i tuoi dati nel nostro archivio, ricordati che DASSI accetta esclusivamente dati anonimizzati.
Cosa significa?
Che i tuoi dati non devono consentire l’identificazione dei soggetti coinvolti nella ricerca che ha prodotto tali dati.
L’anonimizzazione permette di proteggere la privacy dei partecipanti a una ricerca. In questo modo non è possibile identificare le persone presenti nel dataset o nel corpus di dati, né direttamente attraverso informazioni personali, né indirettamente attraverso altre informazioni aggiuntive o di contesto.
L’anonimizzazione riguarda tutte le informazioni che possono essere utilizzate per identificare una persona. In genere si distingue tra:
- identificatori diretti: dati personali e/o informazioni sufficienti di per sé a identificare univocamente un individuo. Ad esempio: nome e cognome, codice fiscale, indirizzo di residenza, numero di telefono, numero di immatricolazione del veicolo, indirizzo e-mail, ID studente, indirizzo IP del computer, ecc.
- identificatori indiretti: informazioni che da sole non sono sufficienti per identificare qualcuno, ma se legate ad altre informazioni disponibili, potrebbero essere usate per dedurre l’identità della persona. Ad esempio: età, sesso, comune di residenza, professione, grado di istruzione, reddito, stato civile, nazionalità, etnia, malattia rara, ecc.
Non esiste un metodo valido per tutti i tipi di dati. Generalmente, gli identificatori (diretti e indiretti) possono essere rimossi o modificati. Nel secondo caso è possibile generalizzare, aggregare oppure distorcere l’informazione. Le pratiche di anonimizzazione possono variare a seconda del tipo di dati:
- dati quantitativi: prevedono l’aggregazione di una o più variabili, la ricodifica dei valori di una variabile al fine di ridurre il grado di precisione (ad esempio in classi), la trasformazione di variabili testuali in numeriche, l’aggregazione degli intervalli superiori o inferiori (top-coding) di una variabile continua per nascondere gli outliers oppure la ricodifica di variabili testuali con descrizioni più generiche.
- dati qualitativi: prevedono l’utilizzo di pseudonimi o la rimozione degli identificatori diretti, la categorizzazione dei nomi propri (ad esempio “amico”, “sorella”, “città del nord”, “squadra di serie A”, ecc.), la categorizzazione delle informazioni socio-demografiche secondo standard condivisi (ad esempio usando le categorie Istat), la sostituzione dei riferimenti temporali puntuali con periodi o range (ad esempio per l’età o gli anni)
Utilizza il form in questa pagina per contattarci e scoprire se i tuoi dati devono essere anonimizzati.