本書(shū)是英文第4版的中文翻譯,大約有五分之一的內(nèi)容更新。主要更新的內(nèi)容包括:增加了一些近期的算法,增加了習(xí)題部分,重寫(xiě)了部分內(nèi)容。更為具體的內(nèi)容更新請(qǐng)參考作者序。本書(shū)是在第3版中文翻譯的基礎(chǔ)上,按照直譯的原則進(jìn)行翻譯的,與英文版形成的對(duì)照。對(duì)于英文版中明顯存在的排印或疏忽類的錯(cuò)誤,都進(jìn)行了更正。由于這些錯(cuò)誤一般都很明顯,因此譯文中沒(méi)有專門(mén)聲明,讀者如果對(duì)照英文版,不難看出其出處。
1)涵蓋十分廣泛的領(lǐng)域,包括人工智能、信號(hào)處理、人工神經(jīng)網(wǎng)絡(luò)、模式識(shí)別、機(jī)器學(xué)習(xí)、模糊數(shù)學(xué)等一系列相關(guān)學(xué)科。(2)圖將復(fù)雜的概念通過(guò)具體示例用易于理解的算法來(lái)描述,提供了大量包含圖示和處理結(jié)果的插圖,特別有助于讀者的學(xué)習(xí)和理解。(3)提供了豐富的參考文獻(xiàn),既列出了經(jīng)過(guò)時(shí)間考驗(yàn)的經(jīng)典論文,也列出了能反映未來(lái)發(fā)展方向的進(jìn)展,適于讀者進(jìn)一步深入探索。
目錄
第1章 引言 1
1.1 動(dòng)機(jī) 1
1.2 計(jì)算機(jī)視覺(jué)為什么是困難的2
1.3 圖像表達(dá)與圖像分析的任務(wù)4
1.4 總結(jié) 7
1.5 習(xí)題 7
1.6 參考文獻(xiàn) 8
第2章 圖像及其表達(dá)與性質(zhì) 9
2.1 圖像表達(dá)若干概念 9
2.2 圖像數(shù)字化 11
2.2.1 采樣 11
2.2.2 量化 12
2.3 數(shù)字圖像性質(zhì) 13
2.3.1 數(shù)字圖像的度量和拓?fù)湫再|(zhì) 13
2.3.2 直方圖 17
2.3.3 熵 18
2.3.4 圖像的視覺(jué)感知 18
2.3.5 圖像品質(zhì) 20
2.3.6 圖像中的噪聲 21
2.4 彩色圖像 22
2.4.1 色彩物理學(xué) 22
2.4.2 人所感知的色彩 23
2.4.3 彩色空間 26
2.4.4 調(diào)色板圖像 28
2.4.5 顏色恒常性 28
2.5 攝像機(jī)概述 29
2.5.1 光敏傳感器 29
2.5.2 黑白攝像機(jī) 30
2.5.3 彩色攝像機(jī) 32
2.6 總結(jié) 32
2.7 習(xí)題 33
2.8 參考文獻(xiàn) 35
第3章 圖像及其數(shù)學(xué)與物理背景 37
3.1 概述 37
3.1.1 線性 37
3.1.2 狄拉克(Dirac)分布和卷積 37
3.2 積分線性變換 38
3.2.1 作為線性系統(tǒng)的圖像39
3.2.2 積分線性變換引言39
3.2.3 1D傅里葉變換 39
3.2.4 2D傅里葉變換 43
3.2.5 采樣與香農(nóng)約束 45
3.2.6 離散余弦變換 47
3.2.7 小波變換 48
3.2.8 本征分析 52
3.2.9 奇異值分解 53
3.2.10 主分量分析 54
3.2.11 Radon變換56
3.2.12 其他正交圖像變換56
3.3 作為隨機(jī)過(guò)程的圖像 57
3.4 圖像形成物理 59
3.4.1 作為輻射測(cè)量的圖像59
3.4.2 圖像獲取與幾何光學(xué)60
3.4.3 鏡頭像差和徑向畸變63
3.4.4 從輻射學(xué)角度看圖像獲取 65
3.4.5 表面反射 67
3.5 總結(jié) 69
3.6 習(xí)題 70
3.7 參考文獻(xiàn) 71
第4章 圖像分析的數(shù)據(jù)結(jié)構(gòu) 73
4.1 圖像數(shù)據(jù)表示的層次 73
4.2 傳統(tǒng)圖像數(shù)據(jù)結(jié)構(gòu) 74
4.2.1 矩陣 74
4.2.2 鏈 76
4.2.3 拓?fù)鋽?shù)據(jù)結(jié)構(gòu) 76
4.2.4 關(guān)系結(jié)構(gòu) 77
4.3 分層數(shù)據(jù)結(jié)構(gòu) 78
4.3.1 金字塔 78
4.3.2 四叉樹(shù) 79
4.3.3 其他金字塔結(jié)構(gòu) 80
4.4 總結(jié) 81
4.5 習(xí)題 82
4.6 參考文獻(xiàn) 83
第5章 圖像預(yù)處理 85
5.1 像素亮度變換 85
5.1.1 位置相關(guān)的亮度校正85
5.1.2 灰度級(jí)變換 86
5.2 幾何變換 88
5.2.1 像素坐標(biāo)變換 88
5.2.2 亮度插值 89
5.3 局部預(yù)處理 91
5.3.1 圖像平滑 91
5.3.2 邊緣檢測(cè)算子 97
5.3.3 二階導(dǎo)數(shù)過(guò)零點(diǎn)100
5.3.4 圖像處理中的尺度104
5.3.5 Canny邊緣提取105
5.3.6 參數(shù)化邊緣模型107
5.3.7 多光譜圖像中的邊緣107
5.3.8 頻域的局部預(yù)處理108
5.3.9 用局部預(yù)處理算子作線檢測(cè) 112
5.3.10 角點(diǎn)(興趣點(diǎn))檢測(cè)113
5.3.11 較大穩(wěn)定極值區(qū)域檢測(cè) 116
5.4 圖像復(fù)原 117
5.4.1 容易復(fù)原的退化118
5.4.2 逆濾波 118
5.4.3 維納濾波 118
5.5 總結(jié) 120
5.6 習(xí)題 121
5.7 參考文獻(xiàn) 126
第6章 分割Ⅰ 130
6.1 閾值化 130
6.1.1 閾值檢測(cè)方法 132
6.1.2 閾值化 133
6.1.3 多光譜閾值化 135
6.2 基于邊緣的分割 136
6.2.1 邊緣圖像閾值化137
6.2.2 邊緣松弛法 138
6.2.3 邊界跟蹤 139
6.2.4 作為圖搜索的邊緣跟蹤143
6.2.5 作為動(dòng)態(tài)規(guī)劃的邊緣跟蹤 149
6.2.6 Hough變換152
6.2.7 使用邊界位置信息的邊界
???檢測(cè) 157
6.2.8 從邊界構(gòu)造區(qū)域 157
6.3 基于區(qū)域的分割 159
6.3.1 區(qū)域歸并 160
6.3.2 區(qū)域分裂 161
6.3.3 分裂與歸并 162
6.3.4 分水嶺分割 165
6.3.5 區(qū)域增長(zhǎng)后處理167
6.4 匹配 167
6.4.1 模版匹配 168
6.4.2 模版匹配的控制策略170
6.5 分割的評(píng)測(cè)問(wèn)題 170
6.5.1 監(jiān)督式評(píng)測(cè) 171
6.5.2 非監(jiān)督式評(píng)測(cè) 173
6.6 總結(jié) 174
6.7 習(xí)題 176
6.8 參考文獻(xiàn) 178
第7章 分割Ⅱ 185
7.1 均值移位分割 185
7.2 活動(dòng)輪廓模型——蛇行190
7.2.1 經(jīng)典蛇行和氣球191
7.2.2 擴(kuò)展 193
7.2.3 梯度矢量流蛇 194
7.3 幾何變形模型——水平集和測(cè)地
?? 活動(dòng)輪廓 198
7.4 模糊連接性 203
7.5 面向基于3D圖的圖像分割 208
7.5.1 邊界對(duì)的同時(shí)檢測(cè)208
7.5.2 次優(yōu)的表面檢測(cè)211
7.6 圖割分割 212
7.7 單和多表面分割217
7.8 總結(jié) 227
7.9 習(xí)題 228
7.10 參考文獻(xiàn) 229
第8章 形狀表示與描述 237
8.1 區(qū)域標(biāo)識(shí) 239
8.2 基于輪廓的形狀表示與描述241
8.2.1 鏈碼 241
8.2.2 簡(jiǎn)單幾何邊界表示242
8.2.3 邊界的傅里葉變換245
8.2.4 使用片段序列的邊界描述 246
8.2.5 B樣條表示 249
8.2.6 其他基于輪廓的形狀描述
???方法 250
8.2.7 形狀不變量 251
8.3 基于區(qū)域的形狀表示與描述253
8.3.1 簡(jiǎn)單的標(biāo)量區(qū)域描述254
8.3.2 矩 257
8.3.3 凸包 259
8.3.4 基于區(qū)域骨架的圖表示262
8.3.5 區(qū)域分解 266
8.3.6 區(qū)域鄰近圖 267
8.4 形狀類別 268
8.5 總結(jié) 268
8.6 習(xí)題 270
8.7 參考文獻(xiàn) 272
第9章 物體識(shí)別 278
9.1 知識(shí)表示 278
9.2 統(tǒng)計(jì)模式識(shí)別 281
9.2.1 分類原理 282
9.2.2 最近鄰 283
9.2.3 分類器設(shè)置 285
9.2.4 分類器學(xué)習(xí) 287
9.2.5 支持向量機(jī) 288
9.2.6 聚類分析 291
9.3 神經(jīng)元網(wǎng)絡(luò) 293
9.3.1 前饋網(wǎng)絡(luò) 294
9.3.2 非監(jiān)督學(xué)習(xí) 295
9.3.3 Hopfield神經(jīng)元網(wǎng)絡(luò) 296
9.4 句法模式識(shí)別 297
9.4.1 語(yǔ)法與語(yǔ)言 298
9.4.2 句法分析與句法分類器300
9.4.3 句法分類器學(xué)習(xí)與語(yǔ)法推導(dǎo) 301
9.5 作為圖匹配的識(shí)別 302
9.5.1 圖和子圖的同構(gòu)303
9.5.2 圖的相似度 305
9.6 識(shí)別中的優(yōu)化技術(shù) 306
9.6.1 遺傳算法 307
9.6.2 模擬退火 308
9.7 模糊系統(tǒng) 309
9.7.1 模糊集和模糊隸屬函數(shù)310
9.7.2 模糊集運(yùn)算 311
9.7.3 模糊推理 312
9.7.4 模糊系統(tǒng)設(shè)計(jì)與訓(xùn)練314
9.8 模式識(shí)別中的Boosting方法 315
9.9 隨機(jī)森林 317
9.9.1 隨機(jī)森林訓(xùn)練 318
9.9.2 隨機(jī)森林決策 321
9.9.3 隨機(jī)森林?jǐn)U展 322
9.10 總結(jié) 322
9.11 習(xí)題 325
9.12 參考文獻(xiàn) 330
第10章 圖像理解 335
10.1 圖像理解控制策略336
10.1.1 并行和串行處理控制336
10.1.2 分層控制 337
10.1.3 自底向上的控制337
10.1.4 基于模型的控制337
10.1.5 混合的控制策略338
10.1.6 非分層控制 341
10.2 SIFT:尺度不變特征轉(zhuǎn)換 342
10.3 RANSAC:通過(guò)隨機(jī)抽樣一致來(lái)
???擬合 344
10.4 點(diǎn)分布模型 347
10.5 活動(dòng)表觀模型 355
10.6 圖像理解中的模式識(shí)別方法 362
10.6.1 基于分類的分割362
10.6.2 上下文圖像分類364
10.6.3 梯度方向直方圖-HOG367
10.7 Boosted層疊分類器用于快速物體
???檢測(cè) 370
10.8 基于隨機(jī)森林的圖像理解372
10.9 場(chǎng)景標(biāo)注和約束傳播377
10.9.1 離散松弛法 378
10.9.2 概率松弛法 379
10.9.3 搜索解釋樹(shù) 381
10.10 語(yǔ)義圖像分割和理解382
10.10.1 語(yǔ)義區(qū)域增長(zhǎng)383
10.10.2 遺傳圖像解釋384
10.11 隱馬爾可夫模型390
10.11.1 應(yīng)用 394
10.11.2 耦合的HMM394
10.11.3 貝葉斯信念網(wǎng)絡(luò)395
10.12 馬爾科夫隨機(jī)場(chǎng)397
?10.12.1 圖像和視覺(jué)的應(yīng)用 398
10.13 高斯混合模型和期望較大化 399
10.14 總結(jié) 404
10.15 習(xí)題 407
10.16 參考文獻(xiàn) 410
第11章 3D幾何,對(duì)應(yīng),從亮度到3D 419
11.1 3D視覺(jué)任務(wù) 419
11.1.1 Marr理論421
11.1.2 其他視覺(jué)范疇:主動(dòng)和
有目的的視覺(jué) 422
11.2 射影幾何學(xué)基礎(chǔ) 423
11.2.1 射影空間中的點(diǎn)和超平面 424
11.2.2 單應(yīng)性 426
11.2.3 根據(jù)對(duì)應(yīng)點(diǎn)估計(jì)單應(yīng)性 427
11.3 單透視攝像機(jī) 430
11.3.1 攝像機(jī)模型 430
11.3.2 齊次坐標(biāo)系中的投影和
反投影 432
11.3.3 從已知場(chǎng)景標(biāo)定一個(gè)
攝像機(jī) 432
11.4 從多視圖重建場(chǎng)景433
11.4.1 三角測(cè)量 433
11.4.2 射影重建 434
11.4.3 匹配約束 435
11.4.4 光束平差法 436
11.4.5 升級(jí)射影重建和自標(biāo)定 437
11.5 雙攝像機(jī)和立體感知438
11.5.1 極線幾何學(xué)——基本矩陣 438
11.5.2 攝像機(jī)的相對(duì)運(yùn)動(dòng)——本質(zhì)
矩陣 440
11.5.3 分解基本矩陣到攝像機(jī)
矩陣 441
11.5.4 從對(duì)應(yīng)點(diǎn)估計(jì)基本矩陣 441
11.5.5 雙攝像機(jī)矯正結(jié)構(gòu)442
11.5.6 矯正計(jì)算 444
11.6 三攝像機(jī)和三視張量445
11.6.1 立體對(duì)應(yīng)點(diǎn)算法446
11.6.2 距離圖像的主動(dòng)獲取451
11.7 由輻射測(cè)量到3D信息 453
11.7.1 由陰影到形狀453
11.7.2 光度測(cè)量立體視覺(jué)455
11.8 總結(jié) 456
11.9 習(xí)題 457
11.10 參考文獻(xiàn) 459
第12章 3D視覺(jué)的應(yīng)用 464
12.1 由X到形狀 464
12.1.1 由運(yùn)動(dòng)到形狀464
12.1.2 由紋理到形狀468
12.1.3 其他由X到形狀的技術(shù) 469
12.2 的3D物體 471
12.2.1 3D物體、模型以及相關(guān)
問(wèn)題 471
12.2.2 線條標(biāo)注 472
12.2.3 體積表示和直接測(cè)量474
12.2.4 體積建模策略475
12.2.5 表面建模策略476
12.2.6 為獲取完整3D模型的面元
標(biāo)注與融合 478
12.3 3D場(chǎng)景的2D視圖表達(dá) 482
12.3.1 觀察空間 482
12.3.2 多視圖表達(dá)和示象圖482
12.4 從無(wú)組織的2D視圖集合進(jìn)行
3D重建,從運(yùn)動(dòng)到結(jié)構(gòu) 483
12.5 重建場(chǎng)景幾何 485
12.6 總結(jié) 487
12.7 習(xí)題 487
12.8 參考文獻(xiàn) 488
第13章 數(shù)學(xué)形態(tài)學(xué) 493
13.1 形態(tài)學(xué)基本概念 493
13.2 形態(tài)學(xué)四原則 494
13.3 二值膨脹和腐蝕 495
13.3.1 膨脹 495
13.3.2 腐蝕 497
13.3.3 擊中擊不中變換498
13.3.4 開(kāi)運(yùn)算和閉運(yùn)算499
13.4 灰度級(jí)膨脹和腐蝕499
13.4.1 頂面、本影、灰度級(jí)膨脹和
腐蝕 500
13.4.2 本影同胚定理和膨脹、腐
及開(kāi)、閉運(yùn)算的性質(zhì) 502
13.4.3 頂帽變換 502
13.5 骨架和物體標(biāo)記 503
13.5.1 同倫變換 503
13.5.2 骨架、中軸和較大球503
13.5.3 細(xì)化、粗化和同倫骨架 505
13.5.4 熄滅函數(shù)和最終腐蝕506
13.5.5 最終腐蝕和距離函數(shù)508
13.5.6 測(cè)地變換 509
13.5.7 形態(tài)學(xué)重構(gòu) 510
13.6 粒度測(cè)定法 511
13.7 形態(tài)學(xué)分割與分水嶺513
13.7.1 粒子分割、標(biāo)記和分水嶺 513
13.7.2 二值形態(tài)學(xué)分割513
13.7.3 灰度級(jí)分割和分水嶺515
13.8 總結(jié) 516
13.9 習(xí)題 517
13.10 參考文獻(xiàn) 518
第14章 圖像數(shù)據(jù)壓縮 520
14.1 圖像數(shù)據(jù)性質(zhì) 521
14.2 圖像數(shù)據(jù)壓縮中的離散圖像變換 521
14.3 預(yù)測(cè)壓縮方法 523
14.4 矢量量化 525
14.5 分層的和漸進(jìn)的壓縮方法525
14.6 壓縮方法比較 526
14.7 其他技術(shù) 527
14.8 編碼 527
14.9 JPEG和MPEG圖像壓縮 528
14.9.1 JPEG——靜態(tài)圖像壓縮 528
14.9.2 JPEG-2000壓縮 529
14.9.3 MPEG——全運(yùn)動(dòng)的視頻
壓縮 531
14.10 總結(jié) 532
14.11 習(xí)題 533
14.12 參考文獻(xiàn) 535
第15章 紋理 537
15.1 統(tǒng)計(jì)紋理描述 539
15.1.1 基于空間頻率的方法539
15.1.2 共生矩陣 540
15.1.3 邊緣頻率 541
15.1.4 基元長(zhǎng)度(行程)542
15.1.5 Laws紋理能量度量 543
15.1.6 局部二值模式(LBPs) 544
15.1.7 分形紋理描述547
15.1.8 多尺度紋理描述——小波
域方法 549
15.1.9 其他紋理描述的統(tǒng)計(jì)方法 551
15.2 句法紋理描述方法552
15.2.1 形狀鏈語(yǔ)法 553
15.2.2 圖語(yǔ)法 554
15.2.3 分層紋理中的基元分組 555
15.3 混合的紋理描述方法556
15.4 紋理識(shí)別方法的應(yīng)用557
15.5 總結(jié) 557
15.6 習(xí)題 559
15.7 參考文獻(xiàn) 561
第16章 運(yùn)動(dòng)分析 566
16.1 差分運(yùn)動(dòng)分析方法568
16.2 光流 571
16.2.1 光流計(jì)算 571
16.2.2 全局和局部光流估計(jì)573
16.2.3 局部和全局相結(jié)合的光流
估計(jì) 575
16.2.4 運(yùn)動(dòng)分析中的光流575
16.3 基于興趣點(diǎn)對(duì)應(yīng)關(guān)系的分析 578
16.3.1 興趣點(diǎn)的檢測(cè)578
16.3.2 Lucas-Kanade點(diǎn)跟蹤 578
16.3.3 興趣點(diǎn)的對(duì)應(yīng)關(guān)系580
16.4 特定運(yùn)動(dòng)模式的檢測(cè)582
16.5 視頻跟蹤 585
16.5.1 背景建模 585
16.5.2 基于核函數(shù)的跟蹤588
16.5.3 目標(biāo)路徑分析592
16.6 輔助跟蹤的運(yùn)動(dòng)模型596
16.6.1 卡爾曼濾波器596
16.6.2 粒子濾波器 600
16.6.3 半監(jiān)督跟蹤——TLD603
16.7 總結(jié) 605
16.8 習(xí)題 607
16.9 參考文獻(xiàn) 608
詞匯 613