在大數(shù)據(jù)時代背景下,頻繁項集挖掘(FIM)技術被廣泛應用于發(fā)現(xiàn)和提取大規(guī)模數(shù)據(jù)集中的有價值信息。然而,數(shù)據(jù)集中往往包含敏感的私人信息,直接挖掘或共享挖掘結果可能會引發(fā)隱私泄露的風險。因此,如何有效地保護數(shù)據(jù)隱私,同時又能從數(shù)據(jù)中挖掘出有價值的信息,成為了一個亟待解決的問題。
差分隱私作為一種先進的隱私保護技術,通過引入噪聲機制來保護個人信息,與傳統(tǒng)隱私保護手段相比,它具有更高的安全標準和更強的防護能力,同時還能保持數(shù)據(jù)的可用性。在以往的研究中,基于差分隱私的頻繁項集挖掘常采用長事務截斷策略以降低算法的敏感度,但這可能會引入截斷誤差,影響隱私預算的有效利用。
DP-PartFIM算法的提出,為隱私保護下的數(shù)據(jù)挖掘提供了一種新的解決方案。它不僅提高了數(shù)據(jù)挖掘的效率,同時也有效地保護了數(shù)據(jù)隱私,對于促進數(shù)據(jù)挖掘技術的發(fā)展和應用具有重要意義。
論文信息
論文已被期刊IEEE Transactions on Emerging Topics in Computing錄用,DOI: 10.1109/TETC.2024.3443060,作者為碩士生劉鑫宇、博士生余樂樂、導師劉憶寧教授(通訊作者),以及暨南大學的甘文生副教授。