在大數(shù)據(jù)時(shí)代背景下,頻繁項(xiàng)集挖掘(FIM)技術(shù)被廣泛應(yīng)用于發(fā)現(xiàn)和提取大規(guī)模數(shù)據(jù)集中的有價(jià)值信息。然而,數(shù)據(jù)集中往往包含敏感的私人信息,直接挖掘或共享挖掘結(jié)果可能會(huì)引發(fā)隱私泄露的風(fēng)險(xiǎn)。因此,如何有效地保護(hù)數(shù)據(jù)隱私,同時(shí)又能從數(shù)據(jù)中挖掘出有價(jià)值的信息,成為了一個(gè)亟待解決的問(wèn)題。
差分隱私作為一種先進(jìn)的隱私保護(hù)技術(shù),通過(guò)引入噪聲機(jī)制來(lái)保護(hù)個(gè)人信息,與傳統(tǒng)隱私保護(hù)手段相比,它具有更高的安全標(biāo)準(zhǔn)和更強(qiáng)的防護(hù)能力,同時(shí)還能保持?jǐn)?shù)據(jù)的可用性。在以往的研究中,基于差分隱私的頻繁項(xiàng)集挖掘常采用長(zhǎng)事務(wù)截?cái)嗖呗砸越档退惴ǖ拿舾卸?,但這可能會(huì)引入截?cái)嗾`差,影響隱私預(yù)算的有效利用。
DP-PartFIM算法的提出,為隱私保護(hù)下的數(shù)據(jù)挖掘提供了一種新的解決方案。它不僅提高了數(shù)據(jù)挖掘的效率,同時(shí)也有效地保護(hù)了數(shù)據(jù)隱私,對(duì)于促進(jìn)數(shù)據(jù)挖掘技術(shù)的發(fā)展和應(yīng)用具有重要意義。
論文信息
論文已被期刊IEEE Transactions on Emerging Topics in Computing錄用,DOI: 10.1109/TETC.2024.3443060,作者為碩士生劉鑫宇、博士生余樂(lè)樂(lè)、導(dǎo)師劉憶寧教授(通訊作者),以及暨南大學(xué)的甘文生副教授。