日韩偷拍一区二区,国产香蕉久久精品综合网,亚洲激情五月婷婷,欧美日韩国产不卡

在線客服
數(shù)據(jù)挖掘:R語言實(shí)戰(zhàn)圖書
人氣:23

數(shù)據(jù)挖掘:R語言實(shí)戰(zhàn)

在大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘無疑將是最炙手可熱的技術(shù)。數(shù)據(jù)挖掘的理論和方法正日新月異地發(fā)展,數(shù)據(jù)挖掘的技術(shù)及工具,已經(jīng)滲透到互聯(lián)網(wǎng)、金融、電商、管理、生產(chǎn)、決策等各個(gè)領(lǐng)域,數(shù)據(jù)挖掘的軟件也是層出不窮,其中...

內(nèi)容簡(jiǎn)介

推薦購買:

數(shù)據(jù)分析:R語言實(shí)戰(zhàn)

數(shù)據(jù)挖掘技術(shù)是當(dāng)下大數(shù)據(jù)時(shí)代最關(guān)鍵的技術(shù),其應(yīng)用領(lǐng)域及前景不可估量。R是一款極其的統(tǒng)計(jì)分析和數(shù)據(jù)挖掘軟件,《數(shù)據(jù)挖掘:R語言實(shí)戰(zhàn)》側(cè)重使用R進(jìn)行數(shù)據(jù)挖掘,重點(diǎn)講述了R的數(shù)據(jù)挖掘流程、算法包的使用及相關(guān)工具的應(yīng)用,同時(shí)結(jié)合大量精選的數(shù)據(jù)挖掘?qū)嵗龑?duì)R軟件進(jìn)行深入潛出和的介紹,以便讀者能深刻理解R的精髓并能快速、高效和靈活地掌握使用R進(jìn)行數(shù)據(jù)挖掘的技巧。

通過《數(shù)據(jù)挖掘:R語言實(shí)戰(zhàn)》,讀者不僅能掌握使用R及相關(guān)的算法包來快速解決實(shí)際問題的方法,而且能得到從實(shí)際問題分析入手,到利用R進(jìn)行求解,以及對(duì)挖掘結(jié)果進(jìn)行分析的訓(xùn)練。

《數(shù)據(jù)挖掘:R語言實(shí)戰(zhàn)》適用于計(jì)算機(jī)、互聯(lián)網(wǎng)、機(jī)器學(xué)習(xí)、信息、數(shù)學(xué)、經(jīng)濟(jì)金融、管理、運(yùn)籌、統(tǒng)計(jì)以及有關(guān)理工科專業(yè)的本科生、研究生使用,也能幫助市場(chǎng)營(yíng)銷、金融、財(cái)務(wù)、人力資源管理人員及產(chǎn)品經(jīng)理解決實(shí)際問題,還能幫助從事咨詢、研究、分析行業(yè)的人士及各級(jí)管理人士提高專業(yè)水平。

目錄

第0章 致敬,R!

致敬,肩膀!

致敬,時(shí)代!

致敬,人才!

致敬,R瑟!

上篇 數(shù)據(jù)預(yù)處理

第1章 數(shù)據(jù)挖掘?qū)б?/p>

1.1 數(shù)據(jù)挖掘概述

1.1.1 數(shù)據(jù)挖掘的過程

1.1.2 數(shù)據(jù)挖掘的對(duì)象

1.1.3 數(shù)據(jù)挖掘的方法

1.1.4 數(shù)據(jù)挖掘的應(yīng)用

1.2 數(shù)據(jù)挖掘的算法

1.3 數(shù)據(jù)挖掘的工具

1.3.1 工具的分類

1.3.2 工具的選擇

1.3.3 商用的工具

1.3.4開源的工具

1.4 R在數(shù)據(jù)挖掘中的優(yōu)勢(shì)

第2章 數(shù)據(jù)概覽

2.1 nm 數(shù)據(jù)集

2.2 數(shù)據(jù)的分類

2.2.1 一般的數(shù)據(jù)分類

2.2.2 R的數(shù)據(jù)分類

2.2.3 用R簡(jiǎn)單處理數(shù)據(jù)

2.3 數(shù)據(jù)抽樣及R實(shí)現(xiàn)

2.3.1 簡(jiǎn)單隨機(jī)抽樣

2.3.2 分層抽樣

2.3.3 整群抽樣

2.4 訓(xùn)練集與測(cè)試集

2.5 本章匯總

第3章 用R獲取數(shù)據(jù)

3.1 獲取內(nèi)置數(shù)據(jù)集

3.1.1 datasets 數(shù)據(jù)集

3.1.2 包的數(shù)據(jù)集

3.2 獲取其他格式的數(shù)據(jù)

3.2.1 CSV 與TXT 格式

3.2.2 從Excel 直接獲取數(shù)據(jù)

3.2.3 從其他統(tǒng)計(jì)軟件中獲取數(shù)據(jù)

3.3 獲取數(shù)據(jù)庫數(shù)據(jù)

3.4 獲取網(wǎng)頁數(shù)據(jù)

3.5 本章匯總

第4章 探索性數(shù)據(jù)分析

4.1 數(shù)據(jù)集

4.2 數(shù)字化探索

4.2.1 變量概況

4.2.2 變量詳情

4.2.3 分布指標(biāo)

4.2.4 稀疏性

4.2.5 缺失值

4.2.6 相關(guān)性

4.3 可視化探索

4.3.1 直方圖

4.3.2 累積分布圖

4.3.3 箱形圖

4.3.4 條形圖

4.3.5 點(diǎn)陣圖

4.3.6 餅圖

4.5 本章匯總

第5章 數(shù)據(jù)預(yù)處理

5.1 數(shù)據(jù)集加載

5.2 數(shù)據(jù)清理

5.2.1 缺失值處理

5.2.2 噪聲數(shù)據(jù)處理

5.2.3 數(shù)據(jù)不一致的處理

5.3 數(shù)據(jù)集成

5.4 數(shù)據(jù)變換

5.5 數(shù)據(jù)歸約

5.6 本章匯總

中篇 基本算法及應(yīng)用

第6章 關(guān)聯(lián)分析

6.1 概述

6.2 R中的實(shí)現(xiàn)

6.2.1 相關(guān)軟件包

6.2.2 核心函數(shù)

6.2.3 數(shù)據(jù)集

6.3 應(yīng)用案例

6.3.1 數(shù)據(jù)初探

6.3.2 對(duì)生成規(guī)則進(jìn)行強(qiáng)度控制

6.3.3 一個(gè)實(shí)際應(yīng)用

6.3.4 改變輸出結(jié)果形式

6.3.5 關(guān)聯(lián)規(guī)則的可視化

6.4 本章匯總

第7章 聚類分析

7.1 概述

7.1.1 K-均值聚類

7.1.2 K-中心點(diǎn)聚類

7.1.3 系譜聚類

7.1.4 密度聚類

7.1.5 期望較大化聚類

7.2 R中的實(shí)現(xiàn)

7.2.1 相關(guān)軟件包

7.2.2 核心函數(shù)

7.2.3 數(shù)據(jù)集

7.3 應(yīng)用案例

7.3.1 K-均值聚類

7.3.2 K-中心點(diǎn)聚類

7.3.3 系譜聚類

7.3.4 密度聚類

7.3.5 期望較大化聚類

7.4 本章匯總

第8章 判別分析

8.1 概述

8.1.1 費(fèi)希爾判別

8.1.2 貝葉斯判別

8.1.3 距離判別

8.2 R中的實(shí)現(xiàn)

8.2.1 相關(guān)軟件包

8.2.2 核心函數(shù)

8.2.3 數(shù)據(jù)集

8.3 應(yīng)用案例

8.3.1 線性判別分析

8.3.2 樸素貝葉斯分類

8.3.3 K 最近鄰

8.3.4 有權(quán)重的K 最近鄰算法

8.4 推薦系統(tǒng)綜合實(shí)例

8.4.1 kNN 與推薦

8.4.2 MovieLens 數(shù)據(jù)集說明

8.4.3 綜合運(yùn)用

8.5 本章匯總

第9章 決策樹

9.1 概述

9.1.1 樹形結(jié)構(gòu)

9.1.2 樹的構(gòu)建

9.1.3 常用算法

9.2 R中的實(shí)現(xiàn)

9.2.1 相關(guān)軟件包

9.2.2 核心函數(shù)

9.2.3 數(shù)據(jù)集

9.3 應(yīng)用案例

9.3.1 CART 應(yīng)用

9.3.2 C4.5 應(yīng)用

9.4 本章匯總

下篇 高級(jí)算法及應(yīng)用

第10章 集成學(xué)習(xí)

10.1 概述

10.1.1 一個(gè)概率論小計(jì)算

10.1.2 Bagging 算法

10.1.3 AdaBoost 算法

10.2 R中的實(shí)現(xiàn)

10.2.1 相關(guān)軟件包

10.2.2 核心函數(shù)

10.2.3 數(shù)據(jù)集

10.3 應(yīng)用案例

10.3.1 Bagging 算法

10.3.2 Adaboost 算法

10.4 本章匯總

第11章 隨機(jī)森林

11.1 概述

11.1.1 基本原理

11.1.2 重要參數(shù)

11.2 R中的實(shí)現(xiàn)

11.2.1 相關(guān)軟件包

11.2.2 核心函數(shù)

11.2.3 可視化分析

11.3 應(yīng)用案例

11.3.1 數(shù)據(jù)處理

11.3.2 建立模型

11.3.3 結(jié)果分析

11.3.4 自變量的重要程度

11.3.5 優(yōu)化建模

11.4 本章匯總

第12章 支持向量機(jī)

12.1 概述

12.1.1 結(jié)構(gòu)風(fēng)險(xiǎn)最小原理

12.1.2 函數(shù)間隔與幾何間隔

12.1.3 核函數(shù)

12.2 R中的實(shí)現(xiàn)

12.2.1 相關(guān)軟件包

12.2.2 核心函數(shù)

12.2.3 數(shù)據(jù)集

12.3 應(yīng)用案例

12.3.1 數(shù)據(jù)初探

12.3.2 建立模型

12.3.3 結(jié)果分析

12.3.4 預(yù)測(cè)判別

12.3.5 綜合建模

12.3.6 可視化分析

12.3.7 優(yōu)化建模

12.4 本章匯總

第13章 神經(jīng)網(wǎng)絡(luò)

13.1 概述

13.2 R中的實(shí)現(xiàn)

13.2.1 相關(guān)軟件包

13.2.2 核心函數(shù)

13.3 應(yīng)用案例

13.3.1 數(shù)據(jù)初探

13.3.2 數(shù)據(jù)處理

13.3.3 建立模型

13.3.4 結(jié)果分析

13.3.5 預(yù)測(cè)判別

13.3.6 模型差異分析

13.3.7 優(yōu)化建模

13.4 本章匯總

第14章 模型評(píng)估與選擇

14.1 評(píng)估過程概述

14.2 安裝Rattle包

14.3 Rattle 功能簡(jiǎn)介

14.3.1 Data——選取數(shù)據(jù)

14.3.2 Explore——數(shù)據(jù)探究

14.3.3 Test——數(shù)據(jù)相關(guān)檢驗(yàn)

14.3.4 Transform——數(shù)據(jù)預(yù)處理

14.3.5 Cluster——數(shù)據(jù)聚類

14.3.6 Model——模型評(píng)估

14.3.7 Evaluate——模型評(píng)估.

14.3.8 Log——模型評(píng)估記錄

14.4 模型評(píng)估相關(guān)概念

14.4.1 誤判率.

14.4.2 正確/錯(cuò)誤的肯定判斷、正確/錯(cuò)誤的否定判斷.

14.4.3 度、敏感度及特異性

14.5 Rattle 在模型評(píng)估中的應(yīng)用

14.5.1 混淆矩陣

14.5.2 風(fēng)險(xiǎn)圖

14.5.3 ROC 圖及相關(guān)圖表

14.5.4 模型得分?jǐn)?shù)據(jù)集

14.6 綜合實(shí)例

14.6.1 數(shù)據(jù)介紹

14.6.2 模型建立

14.6.3 模型結(jié)果分析

在線預(yù)覽

在大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘無疑將是最炙手可熱的技術(shù)。數(shù)據(jù)挖掘的理論和方法正日新月異地發(fā)展,數(shù)據(jù)挖掘的技術(shù)及工具,已經(jīng)滲透到互聯(lián)網(wǎng)、金融、電商、管理、生產(chǎn)、決策等各個(gè)領(lǐng)域,數(shù)據(jù)挖掘的軟件也是層出不窮,其中R 是最引人關(guān)注的軟件。

R 是一個(gè)免費(fèi)的開源軟件,它提供了首屈一指的統(tǒng)計(jì)計(jì)算和繪圖功能,尤其是大量的數(shù)據(jù)挖掘方面的算法包,使得它成為一款的、不可多得的數(shù)據(jù)挖掘工具軟件。

本書的主要目的是向讀者介紹如何用R 進(jìn)行數(shù)據(jù)挖掘,通過大量的精選實(shí)例,循序漸進(jìn)、系統(tǒng)地講述R 在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用。

全書分為14 章,以數(shù)據(jù)預(yù)處理、基本算法及應(yīng)用和高級(jí)算法及應(yīng)用這三篇展開。

(1)上篇:數(shù)據(jù)預(yù)處理

由第1~5 章組成,首先簡(jiǎn)要介紹數(shù)據(jù)挖掘流程、算法和工具,然后介紹R 中數(shù)據(jù)分類和數(shù)據(jù)集,以及R 獲取數(shù)據(jù)的多種靈活的方法。講述對(duì)數(shù)據(jù)進(jìn)行探索性分析和預(yù)處理的方法。這些內(nèi)容是使用R 進(jìn)行數(shù)據(jù)挖掘的最基礎(chǔ)內(nèi)容。

(2)中篇:基本算法及應(yīng)用

由第6~9 章組成,主要講述數(shù)據(jù)挖掘的基本算法及應(yīng)用,包括關(guān)聯(lián)分析、聚類分析、判別分析和決策樹,這些算法也是數(shù)據(jù)挖掘使用最多最普遍的算法。R 中提供了豐富的、功能強(qiáng)大的算法包和實(shí)現(xiàn)函數(shù),數(shù)據(jù)挖掘的初級(jí)和中級(jí)用戶務(wù)必掌握。

(3)下篇:高級(jí)算法及應(yīng)用

由第10~14 章組成,主要講述數(shù)據(jù)挖掘的高級(jí)算法及應(yīng)用,包括集成學(xué)習(xí)、隨機(jī)森林、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò),以及使用R 中的工具對(duì)數(shù)據(jù)挖掘的模型進(jìn)行評(píng)估與選擇。對(duì)于中高級(jí)的用戶,可以深入學(xué)習(xí)一下本篇的內(nèi)容。

R 的特點(diǎn)是入門非常容易,使用也非常簡(jiǎn)單,因此本書不需要讀者具備R 和數(shù)據(jù)挖掘的基礎(chǔ)知識(shí)。不管是R 初學(xué)者,還是熟練的R 用戶都能從書中找到對(duì)自己有用的內(nèi)容,快速入門和提高。

讀者既可以把本書作為學(xué)習(xí)如何應(yīng)用R 的一本的教材,也可以作為數(shù)據(jù)挖掘的工具書。

全書以實(shí)際問題、解決方案和對(duì)解決方案的討論為主線來組織內(nèi)容,脈絡(luò)清晰,并且各章自成體系。讀者可以從頭至尾逐章學(xué)習(xí),也可以根據(jù)自己的需要進(jìn)行學(xué)習(xí),根據(jù)自己在實(shí)際中遇到的問題尋找解決方案。

本書所編寫的源程序,都通過了反復(fù)調(diào)試,讀者可在www.broadview.com.cn 網(wǎng)站下載,方便讀者使用。

本書主要由黃文、王正林編寫,其他參與編寫的人員有付東旭、王思琪、鐘太平、劉擁軍、陳菜枚、李燦輝、鐘事沅、王曉麗、王龍躍、夏路生、鐘頌飛、鐘杜清、王殿祜等。在此對(duì)所有參與編寫的人員表示感謝!對(duì)關(guān)心、支持我們的讀者表示感謝!

由于時(shí)間倉促,作者水平和經(jīng)驗(yàn)有限,書中錯(cuò)漏之處在所難免,敬請(qǐng)讀者指正,我們的電子郵箱是:wa_2003@126.com。

編 者

2014 年4 月18 日于北京

網(wǎng)友評(píng)論(不代表本站觀點(diǎn))

免責(zé)聲明

更多出版社
主站蜘蛛池模板: 通化县| 河源市| 静海县| 正镶白旗| 仁化县| 锦州市| 黔东| 敦化市| 伊吾县| 昔阳县| 巴林左旗| 故城县| 金堂县| 德钦县| 苍南县| 方正县| 宁津县| 噶尔县| 额尔古纳市| 沿河| 温州市| 荆门市| 海宁市| 孝感市| 临潭县| 运城市| 高碑店市| 文登市| 五家渠市| 那坡县| 科尔| 万年县| 南皮县| 邓州市| 宁明县| 宜春市| 鹤峰县| 那坡县| 荔浦县| 格尔木市| 金堂县|