本書主要闡述數據共享中的兩大主要隱私保護模型及其關鍵算法。 全書分為兩篇,及時篇闡述匿名隱私保護數據,由第1~9章組成,主要內容涉及匿名隱私保護相關知識、k匿名組規模的上界討論、關系型數據及其擴展背景(數據增量更新和多敏感屬性數據)下的匿名隱私保護、非關系型數據(包括事務型數據、社會網絡數據和軌跡數據)中的匿名隱私保護模型及算法、面向LBS應用的位置隱私保護等;第二篇闡述差分隱私保護數據,由第10~19章組成,主要內容涉及差分隱私基礎知識、基于k叉平均樹的差分隱私數據、面向任意區間樹結構及其擴展背景(考慮區間查詢分布和異方差加噪)下的差分隱私直方圖、面向其他應用背景(流/連續數據、稀疏/多維數據)的差分隱私保護、差分隱私下的頻繁模式挖掘等。 本書主要面向計算機科學、網絡空間安全、管理科學與工程等相關學科專業高年級本科生、研究生以及廣大研究數據安全隱私保護的科技工作者。
隨著數據挖掘和信息共享等數據庫應用的出現與發展,如何保護隱私數據和防止敏感信息泄露成為當前面臨的重大挑戰。作為數據挖掘與信息共享應用中的重要環節,數據中的隱私保護已成為當前的研究熱點。隱私保護數據自提出以來,已吸引許多學者、數據管理人員以及工程科技人員對其展開研究,并取得大量的研究成果。本書主要闡述數據共享中的兩大主要隱私保護模型及其關鍵算法。
全書分為2篇,第1篇闡述匿名隱私保護數據,由1-9章組成,主要內容涉及:匿名隱私保護相關知識、k-匿名組規模的上界討論、關系型數據及其擴展背景(數據增量更新和多敏感屬性數據)下的匿名隱私保護、非關系型數據(包括事務型數據、社會網絡數據和軌跡數據)中的匿名隱私保護模型及算法、面向LBS應用的位置隱私保護等;第2篇闡述差分隱私保護數據,由10-19章組成,主要內容涉及:差分隱私基礎知識、基于k叉平均樹的差分隱私數據、面向任意區間樹結構及其擴展背景(考慮區間查詢分布和異方差加噪)下的差分隱私直方圖、面向其他應用背景(流/連續數據、稀疏/多維數據)的差分隱私保護、差分隱私下的頻繁模式挖掘等。
本書主要面向計算機科學、網絡空間安全、管理科學與工程等相關學科專業高年級本科生、研究生以及廣大研究數據安全隱私保護的科技工作者。
吳英杰,1979年6月出生,福建安溪人,博士,副教授,碩士生導師,美國賓夕法尼亞州立大學訪問學者。2001年7月畢業于福州大學計算機科學與技術專業,獲學士學位;2004年3月畢業于福州大學計算機軟件與理論專業,獲碩士學位,隨后留校任教。2012年3月獲東南大學計算機應用技術博士學位,2012年7月破格晉升副教授并獲碩士生導師資格。
福州大學國家精品資源共享課程“算法與數據結構”和福建省品質碩士學位課程“算法設計與分析”第二負責人,福州大學精品課程“高級語言程序設計”負責人,同時兼任福州大學ACM國際大學生程序設計競賽代表隊總教練,已帶領福州大學代表隊6次晉級ACM國際大學生程序設計競賽全球總決賽;兼任福建省計算機學會常務理事、教育工作委員會主任委員。曾獲“寶鋼教師獎”、“福建省共產黨員”、“福建青年五四獎章”、“福州大學十佳青年教職工”、“福州大學教學新秀”等稱號。
主要從事數據安全、數據挖掘與算法設計等方面的研究。近年來,先后主持1項國家自然科學基金項目、2項福建省自然科學基金項目和1項福建省教育廳科技項目的研究工作。已授權國家發明專利2項,主持的教改項目獲2014年福建省教學成果一等獎。近期在《軟件學報》、《計算機研究與發展》、Journal of Computer Science and Technology、Information Processing Letter、Journal of Discrete Algorithms等國內外重要學術期刊和國際會議上發表30多篇學術論文。
及時篇基于匿名模型的隱私保護數據第1章緒論3
1.1隱私保護數據3
1.2匿名隱私保護模型4
1.2.1k匿名模型4
1.2.2l多樣性模型5
1.2.3tCloseness6
1.3數據質量度量6
1.4匿名隱私保護的主要研究方向7
1.5隱私保護數據研究展望8
參考文獻8第2章k匿名組規模的上界討論10
2.1引言10
2.2現有算法的k匿名組規模上界10
2.3基于取整劃分函數的k匿名算法11
2.3.1均衡二劃分存在的問題12
2.3.2基于取整劃分函數的劃分策略13
2.3.3基于取整劃分函數的k匿名算法的匿名組規模上界14
2.3.4基于取整劃分函數的k匿名算法(劃分部分)時間復雜度分析16
2.4實驗結果與分析17
2.5本章小結18
參考文獻18第3章基于空間劃分的隱私保護關系型數據算法20
3.1引言20
3.2基于動態規劃的k匿名嚴格劃分算法22
3.2.1相關工作22
3.2.2基于子空間多維劃分的k匿名問題23
3.2.3基于子空間劃分的k匿名動態規劃算法26
3.2.4實驗結果與分析29
3.3基于動態規劃的嚴格劃分數據算法36
3.3.1算法框架37
3.3.2實驗結果與分析38
3.4基于混合劃分技術的數據算法41
3.4.1嚴格劃分的數據可以在信息損失上進一步改進41
3.4.2非嚴格劃分的數據可能在可用性上不如嚴格劃分數據42
3.4.3混合劃分技術及算法44
3.4.4實驗結果與分析45
3.5本章小結48
參考文獻48第4章隱私保護增量數據重50
4.1引言50
4.1.1問題實例50
4.1.2已有研究與不足52
4.2問題與相關知識53
4.2.1問題描述53
4.2.2多維劃分53
4.2.3數據質量度量54
4.3增量更新數據的54
4.3.1增量更新數據的概化54
4.3.2單調概化原則56
4.4增量更新k匿名算法57
4.4.1算法描述57
4.4.2算法的運行實例58
4.4.3算法討論58
4.5實驗分析59
4.5.1隱私泄露比較59
4.5.2數據質量比較60
4.5.3執行時間比較61
4.6本章小結62
參考文獻62第5章面向多敏感屬性的隱私保護數據64
5.1引言64
5.2基礎知識與問題描述65
5.2.1基本定義65
5.2.2問題描述65
5.3p覆蓋k匿名模型66
5.4面向多敏感屬性保護的p覆蓋k匿名算法67
5.4.1相關性質67
5.4.2算法描述68
5.4.3算法實例69
5.5實驗結果與分析69
5.5.1敏感屬性泄露比較70
5.5.2數據質量比較70
5.5.3運行時間比較70
5.6本章小結73
參考文獻74第6章隱私保護事務型數據75
6.1引言75
6.2基于剖分的隱私保護事務型數據75
6.3事務型數據的p剖分l多樣化算法78
6.3.1屬性剖分78
6.3.2記錄劃分78
6.3.3算法時間復雜度分析79
6.4實驗結果與分析79
6.4.1關聯規則數量測試80
6.4.2關聯規則挖掘正確率測試80
6.5本章小結82
參考文獻82第7章隱私保護社會網絡數據84
7.1引言84
7.2基礎知識與相關隱私保護技術85
7.2.1社會網絡的定義和數學表示85
7.2.2社會網絡數據的特點86
7.2.3社會網絡中的隱私模型86
7.2.4攻擊者的背景知識86
7.2.5匿名后的數據可用性86
7.2.6社會網絡數據匿名技術87
7.3面向度數攻擊的隱私保護社會網絡數據88
7.3.1問題提出88
7.3.2相關工作88
7.3.3度數攻擊模型89
7.3.4防止度數攻擊的社會網絡匿名算法89
7.3.5實驗數據與分析91
7.4面向子圖攻擊的隱私保護社會網絡數據96
7.4.1問題提出96
7.4.2相關工作97
7.4.3(d,k)匿名社會網絡模型97
7.4.4防止子圖攻擊的社會網絡匿名算法98
7.4.5實驗結果與分析101
7.5本章小結106
參考文獻106第8章隱私保護軌跡數據108
8.1引言108
8.2基礎知識與相關隱私保護技術108
8.2.1相關定義108
8.2.2基于聚類的軌跡數據隱私保護技術109
8.3基于聚類雜交的隱私保護軌跡數據算法111
8.3.1相關工作111
8.3.2二次聚類攻擊111
8.3.3基于聚類雜交的軌跡數據算法117
8.3.4實驗結果與分析118
8.4隱私保護軌跡數據的l多樣化算法128
8.4.1問題提出128
8.4.2軌跡l多樣化隱私保護算法129
8.4.3實驗結果與分析132
8.5個性化隱私保護軌跡數據137
8.5.1問題提出137
8.5.2問題描述137
8.5.3個性化軌跡隱私保護算法138
8.5.4實驗結果與分析140
8.6基于網格劃分的軌跡分段匿名隱私保護算法145
8.6.1問題提出145
8.6.2基于空間網格劃分的不規則分段軌跡隱私保護算法145
8.6.3防止重疊攻擊的軌跡分段匿名算法147
8.6.4實驗結果與分析148
8.7本章小結152
參考文獻152第9章面向LBS應用的位置隱私保護154
9.1引言154
9.2基礎知識與相關位置隱私保護技術155
9.2.1系統結構155
9.2.2位置隱私保護技術157
9.3歐氏空間下面向連續查詢的位置隱私保護158
9.3.1問題提出158
9.3.2相關定義與問題性質159
9.3.3基于歷史軌跡的連續查詢隱私保護算法161
9.3.4實驗結果與分析162
9.4公路網絡下防止邊權分布攻擊的位置隱私保護165
9.4.1問題提出165
9.4.2基礎知識與相關定義166
9.4.3防止邊權分布攻擊的位置隱私保護算法167
9.4.4實驗結果與分析169
9.5歐氏空間下的交互式位置隱私保護173
9.5.1問題提出173
9.5.2交互式模型與協議173
9.5.3交互式位置隱私保護算法176
9.5.4防止速度關聯攻擊的交互式位置隱私保護算法182
9.6本章小結189
參考文獻189
第二篇基于差分隱私的隱私保護數據
第10章基于差分隱私的統計數據概述195
10.1ε差分隱私模型195
10.2差分隱私的實現機制196
10.2.1Laplace機制197
10.2.2指數機制198
10.3差分隱私的組合特性198
10.4差分隱私數據保護框架198
10.5差分隱私保護方法的性能度量199
參考文獻200第11章基于k叉平均樹的差分隱私數據202
11.1引言202
11.2問題與相關性質203
11.2.1問題提出203
11.2.2相關性質204
11.3基于k叉平均樹的差分隱私直方圖算法204
11.3.1算法思想及描述204
11.3.2算法分析206
11.3.3與同類算法的噪聲比較208
11.3.4實驗結果與分析209
11.4面向多維組合查詢的差分隱私直方圖算法212
11.4.1多維組合查詢問題212
11.4.2算法思想及描述213
11.4.3算法分析215
11.4.4實驗結果與分析215
11.5本章小結219
參考文獻219第12章面向任意區間樹結構的差分隱私直方圖220
12.1引言220
12.2基礎知識與問題提出221
12.2.1基礎知識221
12.2.2問題提出222
12.3面向任意區間樹結構的差分隱私直方圖迭代算法222
12.3.1k區間樹222
12.3.2局部線性無偏估計及其算法224
12.3.3基于LBLUE解全局線性無偏估計的迭代算法225
12.3.4算法分析226
12.3.5實驗結果與分析230
12.4面向任意區間樹結構的差分隱私直方圖線性時間算法235
12.4.1差分隱私區間樹中節點權值的線性無偏估計235
12.4.2求解差分隱私區間樹節點權值線性無偏估計的算法236
12.4.3算法復雜度分析238
12.4.4實驗結果與分析238
12.5本章小結242
參考文獻242第13章基于樹重構的差分隱私直方圖243
13.1引言243
13.2基于區間查詢概率的差分隱私直方圖243
13.2.1問題提出243
13.2.2基于區間計數查詢概率的差分隱私直方圖算法246
13.2.3實驗結果與分析250
13.3基于哈爾小波有損壓縮的直方圖253
13.3.1哈爾小波變換254
13.3.2問題提出257
13.3.3基于哈爾小波零樹壓縮的直方圖算法EHWTDP258
13.3.4實驗結果與分析262
13.4本章小結269
參考文獻269第14章異方差加噪下的差分隱私直方圖270
14.1引言270
14.2基礎知識與問題270
14.3異方差加噪下面向任意樹結構的差分隱私直方圖算法271
14.3.1節點覆蓋概率計算272
14.3.2節點系數計算及隱私預算分配272
14.3.3算法描述與分析276
14.4實驗結果與分析280
14.4.1查詢精度比較281
14.4.2算法運行效率比較284
14.5本章小結285
參考文獻285第15章差分隱私連續數據287
15.1引言287
15.2相關工作與基礎知識288
15.2.1相關工作288
15.2.2矩陣機制289
15.3基于矩陣機制的差分隱私連續數據289
15.4隱私連續數據算法290
15.4.1策略矩陣的構建290
15.4.2查詢均方誤差的降低293
15.4.3最小誤差的快速求解294
15.4.4優化效果分析298
15.5實驗結果與分析299
15.5.1與樸素方法的對比實驗結果與分析300
15.5.2與基于二叉樹方法的對比實驗結果與分析300
15.5.3與靜態數據方法的對比實驗結果與分析301
15.6本章小結302
參考文獻302第16章面向二維數據流的差分隱私統計305
16.1引言305
16.2基礎知識與相關定義306
16.3固定長度二維數據流的差分隱私統計306
16.3.1問題描述306
16.3.2算法思想與描述307
16.3.3算法空間復雜度分析311
16.4任意長度二維數據流的差分隱私連續統計311
16.4.1算法思想與描述311
16.4.2算法分析312
16.5實驗結果與分析312
16.5.1差分隱私統計固定長度二維數據流的可用性312
16.5.2差分隱私統計任意長度二維數據流的可用性313
16.6本章小結314
參考文獻314第17章差分隱私二維空間數據劃分316
17.1引言316
17.2基礎知識與相關定義316
17.3基于kd樹的差分隱私二維空間數據劃分算法318
17.3.1問題提出318
17.3.2算法思想與描述318
17.3.3實驗結果與分析320
17.4基于四分樹的差分隱私二維空間數據劃分算法324
17.4.1問題提出324
17.4.2算法思想與描述325
17.4.3實驗結果與分析328
17.5本章小結332
參考文獻332第18章面向低頻統計值的差分隱私數據334
18.1引言334
18.2面向低頻計數值的差分隱私直方圖334
18.2.1問題提出334
18.2.2算法思想與描述335
18.2.3算法分析及優化336
18.2.4算法運行實例337
18.2.5實驗結果與分析338
18.3差分隱私稀疏列聯表340
18.3.1問題提出340
18.3.2算法思想與描述342
18.3.3實驗結果與分析346
18.4本章小結354
參考文獻354第19章差分隱私下的頻繁模式挖掘355
19.1引言355
19.2基礎知識與問題355
19.3差分隱私下的頻繁模式挖掘問題分析357
19.3.1全局敏感度分析357
19.3.2誤差分析357
19.3.3單調性分析358
19.4基于事務截斷的差分隱私頻繁模式挖掘358
19.4.1基于指數機制的事務截斷方法359
19.4.2基于最小噪聲支持度的差分隱私頻繁模式挖掘360
19.4.3頻繁模式挖掘結果集的單調性調節361
19.5實驗結果與分析363
19.5.1全局敏感度比較365
19.5.2數據可用性比較366
19.5.3引入最小噪聲支持度的實驗分析367
19.5.4頻繁模式挖掘結果集的單調性實驗分析368
19.6本章小結371
參考文獻371
好啊,不錯啊
這本書是我的專業書 ,希望對我專業的成長有所幫助,祝愿當當越來越好。盡量把駐當當商家的積極性也提高一下啊/。