數(shù)據(jù)匿名化或不足以保護(hù)個(gè)人隱私 | 《自然-通訊》
來(lái)源:VisualHunt
● ● ●
《自然-通訊》發(fā)表的一篇論文 Estimating the success of re-identifications in incomplete datasets using generative models 介紹了一種可以評(píng)估一個(gè)人的身份是否能夠從一個(gè)不完整的匿名化數(shù)據(jù)庫(kù)中被重新識(shí)別出來(lái)的方法。該論文認(rèn)為目前的匿名化和數(shù)據(jù)共享方法可能不足以保護(hù)個(gè)人隱私或滿(mǎn)足數(shù)據(jù)保護(hù)法律法規(guī)的要求,如歐盟的《通用數(shù)據(jù)保護(hù)條例》(GDPR)。
數(shù)據(jù)科學(xué)和人工智能有望變革我們?nèi)粘I畹姆椒矫婷妫玑t(yī)療、衛(wèi)生保健、商業(yè)和治理。這些方法依賴(lài)于大規(guī)模的詳細(xì)個(gè)人數(shù)據(jù),但是收集和共享個(gè)人數(shù)據(jù)引發(fā)了有關(guān)個(gè)人隱私的擔(dān)憂(yōu)。針對(duì)這個(gè)問(wèn)題,目前的解決方法包括匿名化處理和公布不完全的數(shù)據(jù)集。但是,近期發(fā)生了利用匿名數(shù)據(jù)集,包括瀏覽歷史記錄、手機(jī)和信用卡數(shù)據(jù),成功重新識(shí)別出個(gè)體身份的情況,這表明上述措施可能還不夠充分。 英國(guó)帝國(guó)理工學(xué)院的Yves-Alexandre de Montjoye及同事開(kāi)發(fā)了一種統(tǒng)計(jì)方法,能夠準(zhǔn)確估算通過(guò)匿名數(shù)據(jù)集正確地重新識(shí)別個(gè)體身份的可能性。作者發(fā)現(xiàn),只需要知道少數(shù)幾個(gè)屬性,如郵政編碼、出生日期、性別和子女?dāng)?shù)量,一般就能夠以高可信度重新識(shí)別出個(gè)體身份——即使數(shù)據(jù)集是不完整的。已知屬性越多,識(shí)別的可能性越大。例如,99.98%的馬薩諸塞州人口可以通過(guò)15個(gè)人口統(tǒng)計(jì)學(xué)屬性識(shí)別出來(lái)。因此,他們總結(jié)認(rèn)為只公布取樣數(shù)據(jù)集或不完全數(shù)據(jù)集不足以保護(hù)個(gè)人隱私。? 論文信息 NCOMMS|DOI: 10.1038/s41467-019-10933-3
Estimating the success of re-identifications in incomplete datasets using generative models