日韩偷拍一区二区,国产香蕉久久精品综合网,亚洲激情五月婷婷,欧美日韩国产不卡

在線客服
R語言與數據挖掘圖書
人氣:46

R語言與數據挖掘

公認教材,數據挖掘博學專家10余年大數據挖掘與實施經驗結晶。華南師范大學、廣東工業大學、廣西科技大學等20余所大學選為教材,附贈源代碼,配有教學PPT和上機實驗

內容簡介

這是公認的、的適合教學和零基礎自學的R語言與數據挖掘教程,華南師范大學、廣東工業大學、廣西科技大學等20余所大學選為教材。即便你沒有R語言編程基礎和數據挖掘基礎,根據本書中的理論知識和上機實踐,你也能迅速掌握如何使用R語言進行數據挖掘。本書已經被多少高校預定為教材,為了便于教學,書中還提供了大量的上機實驗和教學資源。

本書主要分為三個部分:

基礎篇(1~5章),主要包括R語言及圖形操作工具RStudio的安裝及使用方法、數據類型和數據對象、數據預處理的常用操作(包括數據重命名、缺失值分析、排序、抽樣等)、繪圖功能(包括散點圖、直方圖、條形圖、箱線圖等)。

建模應用篇(6~10章),主要對數據挖掘中的常用算法的函數在R語言中的使用方法及其結果解釋進行了介紹。涵蓋了目前數據挖掘的5大類算法,包括分類與預測、聚類分析、關聯規則、智能推薦和時序模式。按照模型建立至模型評價的架構進行介紹,使讀者能熟練的掌握從建模到對模型評價的完整建模過程。

Rattle篇(11章),此工具能夠在一個圖形化的界面上對本書所介紹的R語言功能進行操作,使讀者能更好的體驗到使用R語言進行數據挖掘的整個流程。

書中配套提供了原始樣本數據文件及對應章節示例代碼。每個章節有對應的練習實驗和教學PPT,讀者可通過完成對應的練習,迅速掌握R語言的用法和數據挖掘的方法。

編輯推薦

10余位數據挖掘領域博學專家和科研人員,10余年大數據挖掘咨詢與實施經驗結晶。

為零基礎R語言與數據挖掘教學和自學量身打造,系統講解R語言與數據挖掘的必備知識,配有大量的上機實驗、源代碼和教學PPT資源。

作者簡介

張良均

博學大數據挖掘專家,高級信息項目管理師,有近20年的大數據挖掘應用、咨詢和培訓經驗,被稱為“中國大數據挖掘培訓教父”。為電信、電力、政府、互聯網、生產制造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗豐富。現任廣東工業大學、華南師范大學、華南農業大學等6所高校兼職教授。著有《神經網絡實用教程》《數據挖掘:實用案例分析》《R語言數據分析與挖掘實戰》等暢銷圖書。

謝佳標

博學R語言專家,多次于中國R語言大會發表演講,具有十余年的數據挖掘實戰經驗。目前于某上市互聯網游戲公司,任高級數據分析師,負責大數據挖掘及可視化。培訓過的精品課程有:《R語言基礎培訓》《數據分析之R語言實戰》《機器學習與R語言實踐》等。

萬正勇

某國際投行VP,有超過10年的金融系統大數據挖掘及分析經驗,超過15年的大型金融機構核心交易系統規劃設計開發經驗。數據庫及中間件專家,先后獲得中國首屆十大杰出數據庫工程師,Oracle 中間件 ACE Director以及 Oracle 數據庫 ACE 等稱號。曾為電信,電力,航空,銀行,保險,互聯網,交通,制造等等行業相關龍頭企業提供過咨詢服務。著有《衍生數學》,《Oracle數據庫DBA專題技術精粹》等暢銷書。

目錄

前 言

及時部分 基礎篇

第1章 R語言的安裝與使用 2

1.1 R安裝與升級 3

1.2 R使用入門 4

1.2.1 R操作界面 4

1.2.2 RStudio窗口介紹 5

1.2.3 R常用操作 6

1.3 R數據分析包 8

1.4 配套資源使用說明 10

1.5 小結 10

1.6 上機實驗 10

第2章 數據對象與數據讀寫 12

2.1 數據類型 12

2.2 數據結構 16

2.2.1 向量 16

2.2.2 矩陣 19

2.2.3 數組 24

2.2.4 數據框 25

2.2.5 因子 28

2.2.6 列表 31

2.3 數據文件的讀寫 34

2.3.1 鍵盤輸入數據 34

2.3.2 讀取不同格式的數據 35

2.3.3 從其他統計軟件獲取數據 37

2.3.4 從數據庫獲取數據 37

2.3.5 從網頁獲取數據 39

2.4 小結 40

2.5 上機實驗 40

第3章 R語言常用數據管理 42

3.1 變量的重命名 42

3.2 缺失值分析 45

3.3 數據排序 46

3.4 隨機抽樣 48

3.5 數值運算函數 49

3.6 字符串處理 52

3.7 文本分詞 56

3.8 apply函數族 62

3.9 數據整合 65

3.10 控制流 68

3.11 函數的編寫 71

3.12 小結 72

3.13 上機實驗 73

第4章 圖形探索 75

4.1 圖形元素 76

4.1.1 顏色 76

4.1.2 點 80

4.1.3 文本 82

4.1.4 線條 86

4.1.5 圖例 91

4.1.6 坐標軸 92

4.2 圖形組合 94

4.3 圖形保存 97

4.4 圖形函數 98

4.5 小結 116

4.6 上機實驗 116

第5章 高級繪圖工具 117

5.1 lattice包繪圖工具 117

5.1.1 繪圖特色 117

5.1.2 基本圖形 122

5.2 ggplot2包繪圖工具 135

5.2.1 從qplot開始 135

5.2.2 ggplot作圖 137

5.3 交互式繪圖工具簡介 142

5.3.1 rCharts包 143

5.3.2 recharts包 147

5.3.3 googleVis包 147

5.3.4 htmlwidgets包 148

5.3.5 shiny包 153

5.4 小結 163

5.5 上機實驗 163

第二部分 建模應用篇

第6章 分類與預測 166

6.1 回歸分析 166

6.2 決策樹 175

6.2.1 C4.5算法 176

6.2.2 CART算法 178

6.2.3 C5.0算法 180

6.3 人工神經網絡 181

6.4 KNN算法 183

6.5 樸素貝葉斯分類 185

6.6 其他分類與預測算法函數 187

6.7 分類與預測算法評價 192

6.8 小結 196

6.9 上機實驗 196

第7章 聚類分析 198

7.1 K-Means聚類分析函數 199

7.2 層次聚類算法 204

7.3 其他聚類分析函數 207

7.4 小結 211

7.5 上機實驗 212

第8章 關聯規則 213

8.1 Apriori關聯規則 214

8.2 小結 226

8.3 上機實驗 226

第9章 智能推薦 228

9.1 智能推薦模型構建 228

9.2 智能推薦模型評價 232

9.3 小結 235

9.4 上機實驗 235

第10章 時間序列 237

10.1 ARIMA模型 237

10.2 其他時間序列模型 245

10.3 小結 250

10.4 上機實驗 251

第三部分 Rattle篇

第11章 可視化數據挖掘工具Rattle 254

11.1 Rattle簡介及其安裝 254

11.1.1 Rattle簡介 254

11.1.2 Rattle安裝 254

11.2 功能預覽 255

11.3 數據導入 256

11.3.1 導入CSV數據 256

11.3.2 導入ARFF數據 261

11.3.3 導入ODBC數據 262

11.3.4 R Dataset——導入其他數據源 264

11.3.5 導入RData File數據集 267

11.3.6 導入Library數據 268

11.4 數據探索 269

11.4.1 數據總體概況 269

11.4.2 數據分布探索 272

11.4.3 相關性 275

11.4.4 主成分 277

11.4.5 交互圖 278

11.5 數據建模 283

11.5.1 聚類分析 283

11.5.2 關聯規則 288

11.5.3 決策樹 291

11.5.4 隨機森林 293

11.6 模型評估 296

11.6.1 混淆矩陣 296

11.6.2 風險圖 296

11.6.3 ROC圖及相關圖表 297

11.6.4 模型得分數據集 298

11.7 小結 299

11.8 上機實驗 299

參考資料 301

網友評論(不代表本站觀點)

免責聲明

更多出版社
主站蜘蛛池模板: 巧家县| 岳阳市| 平顶山市| 龙游县| 固镇县| 炉霍县| 东丰县| 柞水县| 盱眙县| 招远市| 额敏县| 钟祥市| 宁德市| 楚雄市| 浏阳市| 晴隆县| 阿坝| 明溪县| 汤原县| 南宁市| 炎陵县| 钟祥市| 什邡市| 白沙| 沈阳市| 宾阳县| 白沙| 明溪县| 含山县| 连山| 商河县| 巴青县| 天水市| 涞水县| 建德市| 滦南县| 丹东市| 外汇| 句容市| 丘北县| 富阳市|