日韩偷拍一区二区,国产香蕉久久精品综合网,亚洲激情五月婷婷,欧美日韩国产不卡

在線客服
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)·WEKA應(yīng)用技術(shù)與實(shí)踐(第二版)圖書
人氣:86

數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)·WEKA應(yīng)用技術(shù)與實(shí)踐(第二版)

系統(tǒng)講解經(jīng)典的數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)工具Weka,初學(xué)者的入門經(jīng)典,研究者的鉆研利器

內(nèi)容簡介

本書借助代表當(dāng)今數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)較高水平的著名開源軟件Weka,通過大量的實(shí)踐操作,使讀者了解并掌握數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的相關(guān)技能,拉近理論與實(shí)踐的距離。全書共分9章,主要內(nèi)容包括Weka介紹、探索者界面、知識流界面、實(shí)驗(yàn)者界面、命令行界面、Weka高級應(yīng)用、Weka API、學(xué)習(xí)方案源代碼分析和機(jī)器學(xué)習(xí)實(shí)戰(zhàn)。 本書系統(tǒng)講解Weka 3.7.13的操作、理論和應(yīng)用,內(nèi)容、實(shí)例豐富、可操作性強(qiáng),做到理論與實(shí)踐的統(tǒng)一。本書適合數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)相關(guān)人員作為技術(shù)參考書使用,也適合用作計(jì)算機(jī)專業(yè)高年級本科生和研究生的教材或教學(xué)參考用書。

編輯推薦

系統(tǒng)講解數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)工具Weka 經(jīng)典的開源挖掘工具、開放的Java環(huán)境

作者簡介

袁梅宇,男,工學(xué)博士,碩士導(dǎo)師,現(xiàn)在昆明理工大學(xué)計(jì)算機(jī)系任教。為本科生和研究生主講Java程序設(shè)計(jì)、Java EE技術(shù)、數(shù)據(jù)庫原理、人工智能、Dot Net技術(shù)等核心課程,參加過863 CIMS Net建設(shè)、中歐合作項(xiàng)目DRAGON和多項(xiàng)國家基金和省基金項(xiàng)目,及時(shí)作者公開十余篇,軟件著作權(quán)(頒證)六項(xiàng)。

目錄

目錄

第1章 Weka介紹 1

1.1 Weka簡介 2

1.1.1 Weka歷史 3

1.1.2 Weka功能簡介 3

1.2 基本概念 5

1.2.1 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí) 5

1.2.2 數(shù)據(jù)和數(shù)據(jù)集 5

1.2.3 ARFF格式 6

1.2.4 預(yù)處理 7

1.2.5 分類與回歸 10

1.2.6 聚類分析 12

1.2.7 關(guān)聯(lián)分析 12

1.3 Weka系統(tǒng)安裝 13

1.3.1 系統(tǒng)要求 13

1.3.2 安裝過程 14

1.3.3 Weka使用初步 16

1.3.4 系統(tǒng)運(yùn)行注意事項(xiàng) 18

1.4 訪問數(shù)據(jù)庫 24

1.4.1 配置文件 25

1.4.2 數(shù)據(jù)庫設(shè)置 26

1.4.3 常見問題及解決辦法 27

1.5 示例數(shù)據(jù)集 28

1.5.1 天氣問題 29

1.5.2 鳶尾花 30

1.5.3 CPU 31

1.5.4 玻璃數(shù)據(jù)集 32

1.5.5 美國國會投票記錄 33

1.5.6 乳腺癌數(shù)據(jù)集 33

課后強(qiáng)化練習(xí) 34

第2章 探索者界面 35

2.1 圖形用戶界面 36

2.1.1 標(biāo)簽頁簡介 36

2.1.2 狀態(tài)欄 37

2.1.3 圖像輸出 37

2.1.4 手把手教你用 37

2.2 預(yù)處理 40

2.2.1 加載數(shù)據(jù) 40

2.2.2 屬性處理 43

2.2.3 過濾器 44

2.2.4 過濾器算法介紹 46

2.2.5 手把手教你用 52

2.3 分類 59

2.3.1 分類器選擇 59

2.3.2 分類器訓(xùn)練 61

2.3.3 分類器輸出 62

2.3.4 分類算法介紹 65

2.3.5 分類模型評估 79

2.3.6 手把手教你用 81

2.4 聚類 98

2.4.1 Cluster標(biāo)簽頁的操作 98

2.4.2 聚類算法介紹 99

2.4.3 手把手教你用 101

2.5 關(guān)聯(lián) 107

2.5.1 Associate標(biāo)簽頁的操作 107

2.5.2 關(guān)聯(lián)算法介紹 108

2.5.3 手把手教你用 111

2.6 選擇屬性 117

2.6.1 Select attributes標(biāo)簽頁的

操作 118

2.6.2 選擇屬性算法介紹 119

2.6.3 手把手教你用 120

2.7 可視化 128

2.7.1 Visualize標(biāo)簽頁 128

2.7.2 邊界可視化工具 131

2.7.3 代價(jià)/收益分析可視化 133

2.7.4 手把手教你用 134

課后強(qiáng)化練習(xí) 140

第3章 知識流界面 143

3.1 知識流介紹 144

3.1.1 知識流特性 144

3.1.2 知識流界面布局 145

3.2 知識流組件 148

3.2.1 數(shù)據(jù)源 148

3.2.2 數(shù)據(jù)接收器 151

3.2.3 評估器 155

3.2.4 可視化器 156

3.2.5 其他工具 158

3.3 使用知識流組件 160

3.4 手把手教你用 162

課后強(qiáng)化練習(xí) 181

第4章 實(shí)驗(yàn)者界面 183

4.1 簡介 184

4.2 標(biāo)準(zhǔn)實(shí)驗(yàn) 185

4.2.1 簡單實(shí)驗(yàn) 185

4.2.2 高級實(shí)驗(yàn) 190

4.2.3 手把手教你用 198

4.3 遠(yuǎn)程實(shí)驗(yàn) 210

4.3.1 遠(yuǎn)程實(shí)驗(yàn)設(shè)置 210

4.3.2 手把手教你用 213

4.4 分析結(jié)果 221

4.4.1 獲取實(shí)驗(yàn)結(jié)果 221

4.4.2 動作 221

4.4.3 配置測試 222

4.4.4 保存結(jié)果 225

4.4.5 手把手教你用 225

課后強(qiáng)化練習(xí) 229

第5章 命令行界面 231

5.1 命令行界面介紹 232

5.1.1 命令調(diào)用 233

5.1.2 命令自動完成 234

5.2 Weka結(jié)構(gòu) 235

5.2.1 類實(shí)例和包 235

5.2.2 weka.core包 236

5.2.3 weka.classifiers包 237

5.2.4 其他包 238

5.3 命令行選項(xiàng) 238

5.3.1 常規(guī)選項(xiàng) 239

5.3.2 特定選項(xiàng) 241

5.4 過濾器和分類器選項(xiàng) 242

5.4.1 過濾器選項(xiàng) 242

5.4.2 分類器選項(xiàng) 245

5.4.3 手把手教你用 247

5.5 包管理器 252

5.5.1 命令行包管理器 252

5.5.2 運(yùn)行安裝的算法 254

課后強(qiáng)化練習(xí) 255

第6章 Weka高級應(yīng)用 257

6.1 貝葉斯網(wǎng)絡(luò) 258

6.1.1 簡介 258

6.1.2 貝葉斯網(wǎng)絡(luò)編輯器 261

6.1.3 在探索者界面中使用貝葉斯

網(wǎng)絡(luò) 269

6.1.4 結(jié)構(gòu)學(xué)習(xí) 270

6.1.5 分布學(xué)習(xí) 272

6.1.6 查看貝葉斯網(wǎng)絡(luò) 273

6.1.7 手把手教你用 276

6.2 神經(jīng)網(wǎng)絡(luò) 286

6.2.1 GUI使用 286

6.2.2 手把手教你用 289

6.3 文本分類 293

6.3.1 文本分類示例 294

6.3.2 分類真實(shí)文本 298

6.3.3 手把手教你用 300

6.4 時(shí)間序列分析及預(yù)測 306

6.4.1 使用時(shí)間序列環(huán)境 306

6.4.2 手把手教你用 318

課后強(qiáng)化練習(xí) 326

第7章 Weka API 327

7.1 加載數(shù)據(jù) 328

7.1.1 從文件加載數(shù)據(jù) 328

7.1.2 從數(shù)據(jù)庫加載數(shù)據(jù) 329

7.1.3 手把手教你用 330

7.2 保存數(shù)據(jù) 335

7.2.1 保存數(shù)據(jù)至文件 335

7.2.2 保存數(shù)據(jù)至數(shù)據(jù)庫 335

7.2.3 手把手教你用 336

7.3 處理選項(xiàng) 339

7.3.1 選項(xiàng)處理方法 339

7.3.2 手把手教你用 340

7.4 內(nèi)存數(shù)據(jù)集處理 341

7.4.1 在內(nèi)存中創(chuàng)建數(shù)據(jù)集 341

7.4.2 打亂數(shù)據(jù)順序 345

7.4.3 手把手教你用 345

7.5 過濾 349

7.5.1 批量過濾 350

7.5.2 即時(shí)過濾 351

7.5.3 手把手教你用 351

7.6 分類 355

7.6.1 分類器構(gòu)建 355

7.6.2 分類器評估 356

7.6.3 實(shí)例分類 358

7.6.4 手把手教你用 359

7.7 聚類 370

7.7.1 聚類器構(gòu)建 370

7.7.2 聚類器評估 371

7.7.3 實(shí)例聚類 373

7.7.4 手把手教你用 373

7.8 屬性選擇 379

7.8.1 使用元分類器 380

7.8.2 使用過濾器 380

7.8.3 使用底層API 381

7.8.4 手把手教你用 381

7.9 可視化 384

7.9.1 ROC曲線 385

7.9.2 圖 385

7.9.3 手把手教你用 386

7.10 序列化 391

7.10.1 序列化基本方法 391

7.10.2 手把手教你用 392

7.11 文本分類綜合示例 395

7.11.1 程序運(yùn)行準(zhǔn)備 395

7.11.2 源程序分析 396

7.11.3 運(yùn)行說明 403

課后強(qiáng)化練習(xí) 404

第8章 學(xué)習(xí)方案源代碼分析 405

8.1 NaiveBayes源代碼分析 406

8.2 實(shí)現(xiàn)分類器的約定 427

課后強(qiáng)化練習(xí) 429

第9章 機(jī)器學(xué)習(xí)實(shí)戰(zhàn) 431

9.1 數(shù)據(jù)挖掘過程概述 432

9.1.1 CRISP-DM過程 432

9.1.2 數(shù)據(jù)預(yù)處理 433

9.1.3 挖掘項(xiàng)目及工具概述 434

9.2 實(shí)戰(zhàn)KDD Cup 1999 434

9.2.1 任務(wù)描述 435

9.2.2 數(shù)據(jù)集描述 436

9.2.3 挖掘詳細(xì)過程 438

9.3 實(shí)戰(zhàn)KDD Cup 2010 447

9.3.1 任務(wù)描述 447

9.3.2 數(shù)據(jù)集描述 447

9.3.3 挖掘詳細(xì)過程 450

9.3.4 更接近實(shí)際的挖掘過程 459

課后強(qiáng)化練習(xí) 471

附錄A 中英文術(shù)語對照 472

附錄B Weka算法介紹 476

過濾器算法介紹 476

分類算法介紹 498

聚類算法介紹 526

關(guān)聯(lián)算法介紹 530

選擇屬性算法介紹 532

參考文獻(xiàn) 537

在線預(yù)覽

第2章 探索者界面

探索者(Explorer)界面是Weka的主要圖形用戶界面,其全部功能都可通過菜單選擇或表單填寫進(jìn)行訪問。本章介紹探索者的圖形用戶界面、預(yù)處理、分類、聚類、關(guān)聯(lián)、選擇屬性和可視化等內(nèi)容,內(nèi)容非常豐富,學(xué)習(xí)這些知識可以了解Weka的功能,快速上手實(shí)際的挖掘任務(wù)。

2.1 圖形用戶界面

啟動Weka GUI 選擇器窗口之后,單擊Explorer按鈕,即可啟動探索者界面。這時(shí),由于沒有加載數(shù)據(jù)集,除Preprocess標(biāo)簽頁外,其他標(biāo)簽頁都變灰而不可用。可以使用Open file、Open URL、Open DB或者Generate按鈕加載或產(chǎn)生數(shù)據(jù)集,加載數(shù)據(jù)集之后,其他標(biāo)簽頁才可以使用。

這里以打開文件為例進(jìn)行說明。單擊Open file按鈕,通過彈出的“打開”對話框,選擇打開data子目錄下的iris.arff文件,加載數(shù)據(jù)集后的探索者界面如圖2.1所示。

圖2.1 探索者界面

下面按照先整體后局部的順序介紹圖形用戶界面。

2.1.1 標(biāo)簽頁簡介

圖2.1所示界面的頂部有六個(gè)不同的標(biāo)簽頁,分別對應(yīng)Weka所支持的多種數(shù)據(jù)挖掘方式。

這六個(gè)標(biāo)簽頁的介紹如下。

1) Preprocess(預(yù)處理):選擇數(shù)據(jù)集,并以不同方式對其進(jìn)行修改。

2) Classify(分類):訓(xùn)練用于分類或回歸的學(xué)習(xí)方案,并對其進(jìn)行評估。

3) Cluster(聚類):學(xué)習(xí)數(shù)據(jù)集聚類方案。

4) Associate(關(guān)聯(lián)):學(xué)習(xí)數(shù)據(jù)關(guān)聯(lián)規(guī)則,并對其進(jìn)行評估。

5) Select attributes(選擇屬性):選擇數(shù)據(jù)集中預(yù)測效果好的部分屬性。

6) Visualize(可視化):查看不同的二維數(shù)據(jù)散點(diǎn)圖,并與其進(jìn)行互動。

每個(gè)標(biāo)簽頁都可完成不同工作,單擊相應(yīng)的標(biāo)簽即可實(shí)現(xiàn)標(biāo)簽頁的切換。

界面底部包括Status(狀態(tài))欄、Log(日志)按鈕和一只Weka鳥,這些都一直保持可見,不論用戶切換到哪一個(gè)標(biāo)簽頁。

2.1.2 狀態(tài)欄

狀態(tài)欄位于界面最下部,可以讓用戶了解到現(xiàn)在進(jìn)行到哪一步。例如,如果Weka探索者正在忙于加載數(shù)據(jù)文件,狀態(tài)欄中會顯示相應(yīng)的狀態(tài)信息。

除了顯示狀態(tài)之外,還可以右擊鼠標(biāo)來顯示內(nèi)存信息,以及運(yùn)行垃圾回收器以清理內(nèi)存。在狀態(tài)欄的任意位置右擊,彈出的快捷菜單中只包括兩個(gè)菜單項(xiàng):Memory information(內(nèi)存信息)和Run garbage collector(運(yùn)行垃圾回收器)。及時(shí)個(gè)菜單項(xiàng)用于顯示W(wǎng)eka當(dāng)前可用的內(nèi)存空間;第二個(gè)菜單項(xiàng)用于啟動Java垃圾回收器,搜尋不再使用的內(nèi)存并釋放,以回收部分內(nèi)存空間,提供給新的任務(wù)使用。需要指出的是,垃圾回收器是一個(gè)不間斷運(yùn)行的后臺任務(wù),如果不強(qiáng)制進(jìn)行垃圾回收,Java虛擬機(jī)也會在適當(dāng)時(shí)候自動啟動垃圾回收器。

Log按鈕位于狀態(tài)欄的右面,單擊該按鈕會打開可以滾動的日志窗口,顯示在此次運(yùn)行期間內(nèi)Weka 進(jìn)行的全部活動以及每項(xiàng)活動的時(shí)間戳。不管是使用GUI、命令行還是Simple CLI,日志都會包含分類、聚類、屬性選擇等操作的完整的設(shè)置字符串,用戶可以進(jìn)行復(fù)制和粘貼操作。順便提醒讀者,通過學(xué)習(xí)日志里記錄的命令,可以深層次地了解Weka的內(nèi)部運(yùn)行機(jī)制。

在Log按鈕的右邊,可以看到被稱為Weka狀態(tài)圖標(biāo)的鳥。如果沒有處理過程在運(yùn)行,小鳥會坐下來打個(gè)盹。“´”符號旁邊的數(shù)字顯示目前有多少個(gè)正在進(jìn)行處理的進(jìn)程,當(dāng)系統(tǒng)空閑時(shí),該數(shù)字為零,數(shù)字會隨著正在進(jìn)行處理進(jìn)程數(shù)的增加而增加。當(dāng)啟動處理進(jìn)程時(shí),小鳥會站起來不停走動。如果小鳥長時(shí)間站著不動,說明Weka出現(xiàn)運(yùn)行錯(cuò)誤,此時(shí)用戶需要關(guān)閉并重新啟動探索者界面。

2.1.3 圖像輸出

Weka中顯示的大部分圖形,包括本章的探索者界面和后面章節(jié)的知識流界面、實(shí)驗(yàn)者界面顯示的圖形,以及通過Weka GUI選擇器菜單帶出的GraphVisualizer(圖可視化工具)或TreeVisualizer(樹可視化工具)顯示的圖形,都可以保存為圖像文件以備將來使用。保存方法是,在按住Alt鍵和Shift鍵的同時(shí),在要保存的圖形上單擊,啟動保存文件對話框。Weka支持的圖像文件格式有BMP、JPEG、PNG和Postscript的EPS,用戶可以選擇圖像文件格式,還可以修改輸出圖像文件的尺寸。

2.1.4 手把手教你用

1. 啟動Weka

雙擊桌面上的Weka 3.7快捷方式,啟動Weka GUI選擇器窗口,如圖2.2所示。

單擊Explorer按鈕啟動探索者界面,如圖2.3所示。現(xiàn)在,除Preprocess標(biāo)簽頁可用外,其余標(biāo)簽頁都不可用。

圖2.2 Weka GUI選擇器窗口

圖2.3 探索者界面

2. 了解標(biāo)簽頁

單擊圖2.3所示界面中的Open file按鈕,彈出“打開”對話框,導(dǎo)航至Weka安裝目錄下的data子目錄,選擇iris.arff文件,如圖2.4所示。單擊“打開”按鈕,打開該文件。

圖2.4 “打開”對話框

打開文件(或稱為加載數(shù)據(jù))后的探索者界面如圖2.5所示。可以看到,加載數(shù)據(jù)后,六個(gè)標(biāo)簽頁都變?yōu)榭捎脿顟B(tài)。

圖2.5 打開文件后的探索者界面

讀者可以自行切換標(biāo)簽頁,初步了解各標(biāo)簽頁的功能,為后續(xù)學(xué)習(xí)打下基礎(chǔ)。

3. 了解狀態(tài)欄

不論切換到哪個(gè)標(biāo)簽頁,都可在探索者界面下部的狀態(tài)欄中查看狀態(tài)信息。在狀態(tài)欄任意位置右擊,在彈出的快捷菜單中選擇Memory information菜單項(xiàng),狀態(tài)欄顯示用斜杠分割的內(nèi)存信息,格式為:空閑內(nèi)存/全部內(nèi)存/較大內(nèi)存,單位是字節(jié),如圖2.6所示。

圖2.6 內(nèi)存信息

如果在快捷菜單中選擇Run garbage collector菜單項(xiàng),狀態(tài)欄中會顯示OK信息,表示已經(jīng)啟動了垃圾回收器,如圖2.7所示。

圖2.7 運(yùn)行垃圾回收器

單擊狀態(tài)欄右邊的Log按鈕,可以查看當(dāng)前日志,如圖2.8所示。

圖2.8 日志窗口

4. 保存圖像文件

單擊圖2.5所示界面右邊的Visualize All(全部可視化)按鈕,打開如圖2.9所示的全部可視化窗口。

圖2.9 全部可視化窗口

同時(shí)按住Alt鍵和Shift鍵,并在圖2.9所示的五幅圖標(biāo)中任選一圖標(biāo),在圖標(biāo)的任意位置單擊,啟動Save as對話框。設(shè)置“文件名”為test,選擇“文件類型”為jpg(或其他格式),單擊“保存”按鈕,就可將其保存為圖像文件,如圖2.10所示。

圖2.10 Save as對話框

在圖2.10的右邊,還可以定制圖像文件的長、寬尺寸,單位為像素。選中Use custom dimensions(使用自定義尺寸)復(fù)選框,就可以設(shè)置圖像尺寸。如果選中Keep aspect ratio(保持寬高比)復(fù)選框,則在修改圖像長(或?qū)?的同時(shí),會按比例自動縮放寬(或長)。

網(wǎng)友評論(不代表本站觀點(diǎn))

來自無昵稱**的評論:

不錯(cuò)

2016-09-13 13:20:16
來自微笑每**的評論:

very good book!

2016-11-10 15:05:00
來自楚天浩**的評論:

書很不錯(cuò),等著看了過后再評論

2016-11-15 16:19:47
來自無昵稱**的評論:

作者很負(fù)責(zé),難得。

2016-11-28 22:04:04
來自無昵稱**的評論:

不錯(cuò)

2016-11-28 23:21:39
來自無昵稱**的評論:

等著寒假啃

2016-12-13 15:47:15
來自匿名用**的評論:

不錯(cuò)的一本書

2017-01-01 13:08:19
來自無昵稱**的評論:

紙質(zhì)不錯(cuò),很重,內(nèi)容還沒來得及看

2017-01-10 18:07:27
來自匿名用**的評論:

數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)·WEKA應(yīng)用技術(shù)與實(shí)踐(第二版) 好好學(xué)習(xí),好好研究!!!

2017-03-11 10:53:57
來自獅***羊**的評論:

好好好,正版

2017-03-15 13:14:23
來自匿名用**的評論:

軟件的使用介紹的比較詳細(xì),不錯(cuò)。

2017-03-19 20:55:43
來自草***4(**的評論:

嗯。。。。。。。我準(zhǔn)備學(xué)完再來評。。。。

2017-03-25 16:25:58
來自m***w(**的評論:

機(jī)器學(xué)習(xí)的專用軟件,不錯(cuò)。

2017-03-27 21:58:38
來自班***(**的評論:

物流感人。謝謝物流先生。

2017-04-18 18:48:52
來自***(匿**的評論:

weka非常牛逼的數(shù)據(jù)挖掘軟件

2017-05-15 20:13:08
來自匿名用**的評論:

還沒看質(zhì)量可以

2017-09-15 06:15:50
來自ddsuton**的評論:

很不錯(cuò)。。。。很不錯(cuò)。。。不錯(cuò)

2017-10-18 08:53:38

免責(zé)聲明

更多出版社
主站蜘蛛池模板: 梧州市| 滨州市| 东海县| 梨树县| 济南市| 区。| 闵行区| 图片| 东光县| 乌恰县| 石屏县| 泗阳县| 和顺县| 霸州市| 淅川县| 灵寿县| 襄城县| 宁夏| 渭源县| 二连浩特市| 乐山市| 枣阳市| 申扎县| 壤塘县| 黄龙县| 古交市| 宝山区| 东丰县| 南投市| 鹿邑县| 民勤县| 巴塘县| 新干县| 沧州市| 嘉善县| 荔浦县| 留坝县| 买车| 铅山县| 常州市| 拉孜县|