機(jī)器學(xué)習(xí)是計(jì)算機(jī)科學(xué)與人工智能的重要分支領(lǐng)域. 本書(shū)作為該領(lǐng)域的入門(mén)教材,在內(nèi)容上盡可能涵蓋機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)的各方面. 全書(shū)共16 章,大致分為3 個(gè)部分:1 部分(1~3 章)介紹機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí);第2 部分(第4~10 章)討論一些經(jīng)典而常用的機(jī)器學(xué)習(xí)方法(決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、貝葉斯分類(lèi)器、集成學(xué)習(xí)、聚類(lèi)、降維與度量學(xué)習(xí));第3 部分11~16 章)為進(jìn)階知識(shí),內(nèi)容涉及特征選擇與稀疏學(xué)習(xí)、計(jì)算學(xué)習(xí)理論、半監(jiān)督學(xué)習(xí)、概率圖模型、規(guī)則學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)等. 每章都附有習(xí)題并介紹了相關(guān)閱讀材料,以便有興趣的讀者進(jìn)一步鉆研探索。
本書(shū)可作為高等院校計(jì)算機(jī)、自動(dòng)化及相關(guān)專(zhuān)業(yè)的本科生或研究生教材,也可供對(duì)機(jī)器學(xué)習(xí)感興趣的研究人員和工程技術(shù)人員閱讀參考。
內(nèi)容;結(jié)構(gòu)合理;敘述清楚;深入淺出。人工智能領(lǐng)域中文的開(kāi)山之作!
這是一本面向中文讀者的機(jī)器學(xué)習(xí)教科書(shū), 為了使盡可能多的讀者通過(guò)本書(shū)對(duì)機(jī)器學(xué)習(xí)有所了解, 作者試圖盡可能少地使用數(shù)學(xué)知識(shí).
然而, 少量的概率、統(tǒng)計(jì)、代數(shù)、優(yōu)化、邏輯知識(shí)似乎不可避免. 因此, 本書(shū)更適合大學(xué)三年級(jí)以上的理工科本科生和研究,
以及具有類(lèi)似背景的對(duì)機(jī)器學(xué)習(xí)感興趣的人士. 為方便讀者, 本書(shū)附錄給出了一些相關(guān)數(shù)學(xué)基礎(chǔ)知識(shí)簡(jiǎn)介.
周志華,南京大學(xué)計(jì)算機(jī)系教授,ACM杰出科學(xué)家,IEEE Fellow, IAPR Fellow, IET/IEE Fellow, 中國(guó)計(jì)算機(jī)學(xué)會(huì)會(huì)士。
目錄
第1章 1
1.1 引言 1
1.2 基本術(shù) 2
1.3 假設(shè)空間 4
1.4 歸納偏好 6
1.5 發(fā)展歷程 10
1.6 應(yīng)用現(xiàn)狀 13
1.7 閱讀材料 16
習(xí)題 19
參考文獻(xiàn) 20
休息一會(huì)兒 22
第2章 模型評(píng)估與選擇 23
2.1 經(jīng)驗(yàn)誤差與過(guò)擬合 23
2.2 評(píng)估方法 24
2.2.1 留出法 25
2.2.2 交叉驗(yàn)證法 26
2.2.3 自助法 27
2.2.4 調(diào)參與最終模型 28
2.3 性能度量 28
2.3.1 錯(cuò)誤率與精度 29
2.3.2 查準(zhǔn)率、查全率與F1 30
2.3.3 ROC與AUC 33
2.3.4 代價(jià)敏感錯(cuò)誤率與代價(jià)曲線 35
2.4 比較檢驗(yàn) 37
2.4.1 假設(shè)檢驗(yàn) 37
2.4.2 交叉驗(yàn)證t檢驗(yàn) 40
2.4.3 McNemar檢驗(yàn) 41
2.4.4 Friedman檢驗(yàn)與后續(xù)檢驗(yàn) 42
2.5 偏差與方差 44
2.6 閱讀材料 46
習(xí)題 48
參考文獻(xiàn) 49
休息一會(huì)兒 51
第3章 線性模型 53
3.1 基本形式 53
3.2 線性回歸 53
3.3 對(duì)數(shù)幾率回歸 57
3.4 線性判別分析 60
3.5 多分類(lèi)學(xué)習(xí) 63
3.6 類(lèi)別不平衡問(wèn)題 66
3.7 閱讀材料 67
習(xí)題 69
參考文獻(xiàn) 70
休息一會(huì)兒 72
第4章 決策樹(shù) 73
4.1 基本流程 73
4.2 劃分選擇 75
4.2.1 信息增益 75
4.2.2 增益率 77
4.2.3 基尼指數(shù) 79
4.3 剪枝處理 79
4.3.1 預(yù)剪枝 80
4.3.2 后剪枝 82
4.4 連續(xù)與缺失值 83
4.4.1 連續(xù)值處理 83
4.4.2 缺失值處理 85
4.5 多變量決策樹(shù) 88
4.6 閱讀材料 92
習(xí)題 93
參考文獻(xiàn) 94
休息一會(huì)兒 95
第5章 神經(jīng)網(wǎng)絡(luò) 97
5.1 神經(jīng)元模型 97
5.2 感知機(jī)與多層網(wǎng)絡(luò) 98
5.3 誤差逆?zhèn)鞑ニ惴?101
5.4 全局最小與局部極小 106
5.5 其他常見(jiàn)神經(jīng)網(wǎng)絡(luò) 108
5.5.1 RBF網(wǎng)絡(luò) 108
5.5.2 ART網(wǎng)絡(luò) 108
5.5.3 SOM網(wǎng)絡(luò) 109
5.5.4 級(jí)聯(lián)相關(guān)網(wǎng)絡(luò) 110
5.5.5 Elman網(wǎng)絡(luò) 111
5.5.6 Boltzmann機(jī) 111
5.6 深度學(xué)習(xí) 113
5.7 閱讀材料 115
習(xí)題 116
參考文獻(xiàn) 117
休息一會(huì)兒 120
第6章 支持向量機(jī) 121
6.1 間隔與支持向量 121
6.2 對(duì)偶問(wèn)題 123
6.3 核函數(shù) 126
6.4 軟間隔與正則化 129
6.5 支持向量回歸 133
6.6 核方法 137
6.7 閱讀材料 139
習(xí)題 141
參考文獻(xiàn) 142
休息一會(huì)兒 145
第7章 貝葉斯分類(lèi)器 147
7.1 貝葉斯決策論 147
7.2 極大似然估計(jì) 149
7.3 樸素貝葉斯分類(lèi)器 150
7.4 半樸素貝葉斯分類(lèi)器 154
7.5 貝葉斯網(wǎng) 156
7.5.1 結(jié)構(gòu) 157
7.5.2 學(xué)習(xí) 159
7.5.3 推斷 161
7.6 EM算法 162
7.7 閱讀材料 164
習(xí)題 166
參考文獻(xiàn) 167
休息一會(huì)兒 169
第8章 集成學(xué)習(xí) 171
8.1 個(gè)體與集成 171
8.2 Boosting 173
8.3 Bagging與隨機(jī)森林 178
8.3.1 Bagging 178
8.3.2 隨機(jī)森林 179
8.4 結(jié)合策略 181
8.4.1 平均法 181
8.4.2 投票法 182
8.4.3 學(xué)習(xí)法 183
8.5 多樣性 185
8.5.1 誤差--分歧分解 185
8.5.2 多樣性度量 186
8.5.3 多樣性增強(qiáng) 188
8.6 閱讀材料 190
習(xí)題 192
參考文獻(xiàn) 193
休息一會(huì)兒 196
第9章 聚類(lèi) 197
9.1 聚類(lèi)任務(wù) 197
9.2 性能度量 197
9.3 距離計(jì)算 199
9.4 原型聚類(lèi) 202
9.4.1 k均值算法 202
9.4.2 學(xué)習(xí)向量量化 204
9.4.3 高斯混合聚類(lèi) 206
9.5 密度聚類(lèi) 211
9.6 層次聚類(lèi) 214
9.7 閱讀材料 217
習(xí)題 220
參考文獻(xiàn) 221
休息一會(huì)兒 224
第10章 降維與度量學(xué)習(xí) 225
10.1 k近鄰學(xué)習(xí) 225
10.2 低維嵌入 226
10.3 主成分分析 229
10.4 核化線性降維 232
10.5 流形學(xué)習(xí) 234
10.5.1 等度量映射 234
10.5.2 局部線性嵌入 235
10.6 度量學(xué)習(xí) 237
10.7 閱讀材料 240
習(xí)題 242
參考文獻(xiàn) 243
休息一會(huì)兒 246
第11章 特征選擇與稀疏學(xué)習(xí) 247
11.1 子集搜索與評(píng)價(jià) 247
11.2 過(guò)濾式選擇 249
11.3 包裹式選擇 250
11.4 嵌入式選擇與L$_1$正則化 252
11.5 稀疏表示與字典學(xué)習(xí) 254
11.6 壓縮感知 257
11.7 閱讀材料 260
習(xí)題 262
參考文獻(xiàn) 263
休息一會(huì)兒 266
第12章 計(jì)算學(xué)習(xí)理論 267
12.1 基礎(chǔ)知識(shí) 267
12.2 PAC學(xué)習(xí) 268
12.3 有限假設(shè)空間 270
12.3.1 可分情形 270
12.3.2 不可分情形 272
12.4 VC維 273
12.5 Rademacher復(fù)雜度 279
12.6 穩(wěn)定性 284
12.7 閱讀材料 287
習(xí)題 289
參考文獻(xiàn) 290
休息一會(huì)兒 292
第13章 半監(jiān)督學(xué)習(xí) 293
13.1 未標(biāo)記樣本 293
13.2 生成式方法 295
13.3 半監(jiān)督SVM 298
13.4 圖半監(jiān)督學(xué)習(xí) 300
13.5 基于分歧的方法 304
13.6 半監(jiān)督聚類(lèi) 307
13.7 閱讀材料 311
習(xí)題 313
參考文獻(xiàn) 314
休息一會(huì)兒 317
第14章 概率圖模型 319
14.1 隱馬爾可夫模型 319
14.2 馬爾可夫隨機(jī)場(chǎng) 322
14.3 條件隨機(jī)場(chǎng) 325
14.4 學(xué)習(xí)與推斷 328
14.4.1 變量消去 328
14.4.2 信念傳播 330
14.5 近似推斷 331
14.5.1 MCMC采樣 331
14.5.2 變分推斷 334
14.6 話(huà)題模型 337
14.7 閱讀材料 339
習(xí)題 341
參考文獻(xiàn) 342
休息一會(huì)兒 345
第15章 規(guī)則學(xué)習(xí) 347
15.1 基本概念 347
15.2 序貫覆蓋 349
15.3 剪枝優(yōu)化 352
15.4 一階規(guī)則學(xué)習(xí) 354
15.5 歸納邏輯程序設(shè)計(jì) 357
15.5.1 最小一般泛化 358
15.5.2 逆歸結(jié) 359
15.6 閱讀材料 363
習(xí)題 365
參考文獻(xiàn) 366
休息一會(huì)兒 369
第16章 強(qiáng)化學(xué)習(xí) 371
16.1 任務(wù)與獎(jiǎng)賞 371
16.2 $K$-搖臂賭博機(jī) 373
16.2.1 探索與利用 373
16.2.2 $\epsilon $-貪心 374
16.2.3 Softmax 375
16.3 有模型學(xué)習(xí) 377
16.3.1 策略評(píng)估 377
包裝完好,送貨速度快,服務(wù)態(tài)度好,價(jià)格實(shí)惠,還另外送了一本書(shū),雖然送的書(shū)與專(zhuān)業(yè)沒(méi)有聯(lián)系,但是態(tài)度不錯(cuò)。
緊跟技術(shù)發(fā)展
很好!!特滿(mǎn)意,以后還來(lái)買(mǎi),嘿嘿
還不錯(cuò)
書(shū)的印刷蠻好的
很棒的書(shū)!
國(guó)內(nèi)機(jī)器學(xué)習(xí)權(quán)威寫(xiě)的書(shū),平實(shí)易懂。
這書(shū)真tm重。。。紙慘白慘白的。。。努力啃。。。
時(shí)代的潮流
很好,verygood
很不錯(cuò),比較容易讀懂
西瓜西瓜西~
真的給力,周老師的西瓜書(shū),誰(shuí)用誰(shuí)知道!
書(shū)的質(zhì)量很好,包裝也不錯(cuò)。還附贈(zèng)一套兒童讀物,質(zhì)量也很好。