本書是國內(nèi)絕大多數(shù)高校采用的知名教材《云計算》(1-3版)的姊妹篇,是中國大數(shù)據(jù)專家委員會劉鵬教授聯(lián)合國內(nèi)多位專家歷時兩年的心血之作。大數(shù)據(jù)領(lǐng)域一直缺乏一本教材,希望本書能夠填補空白。本書系統(tǒng)地介紹了大數(shù)據(jù)的理論知識和實戰(zhàn)應(yīng)用,包括大數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)挖掘算法和工具和大數(shù)據(jù)可視化等,并深度剖析了大數(shù)據(jù)在互聯(lián)網(wǎng)、商業(yè)和典型行業(yè)的應(yīng)用。劉鵬教授創(chuàng)辦的網(wǎng)站中國大數(shù)據(jù)(thebigdata.cn)、中國云計算(chinacloud.cn)和微信公眾號劉鵬看未來(lpoutlook)將免費提供本書配套PPT和其他資料。本書配套的大數(shù)據(jù)實驗體系已經(jīng)在鄭州大學(xué)等高校成功應(yīng)用。
劉鵬,清華大學(xué)博士,解放軍理工大學(xué)教授、學(xué)科帶頭人,中國云計算專家委員會委員。主要研究方向為信息網(wǎng)格和云計算,完成科研課題18項,70余篇,獲部級科技進(jìn)步獎6項。曾奪得國際計算機排序比賽冠軍,并二次奪得全國高??萍急荣愝^高獎,獲“全軍十大學(xué)習(xí)成才標(biāo)兵”、“南京十大杰出青年”和“清華大學(xué)學(xué)術(shù)新秀”等稱號。2002年首倡的“網(wǎng)格計算池”和2003年研發(fā)的“反垃圾郵件網(wǎng)格”分別為云計算和云安全的前身。創(chuàng)辦了知名的中國網(wǎng)格和中國云計算網(wǎng)站。
目 錄
第1章 大數(shù)據(jù)概念與應(yīng)用
1.1 大數(shù)據(jù)之“大”
1.2 大數(shù)據(jù)的來源
1.3 大數(shù)據(jù)的技術(shù)支撐
1.4 大數(shù)據(jù)應(yīng)用場景
1.5 如何開展大數(shù)據(jù)研發(fā)
習(xí)題
參考文獻(xiàn)
第2章 數(shù)據(jù)采集與預(yù)處理
2.1 大數(shù)據(jù)采集架構(gòu)
2.2 數(shù)據(jù)預(yù)處理原理
2.3 數(shù)據(jù)倉庫與ETL工具
習(xí)題
參考文獻(xiàn)
第3章 數(shù)據(jù)挖掘算法
3.1 數(shù)據(jù)挖掘概述
3.2 分類
3.3 聚類
3.4 關(guān)聯(lián)規(guī)則
3.5 預(yù)測模型
3.6 數(shù)據(jù)挖掘算法綜合應(yīng)用
習(xí)題
參考文獻(xiàn)
第4章 大數(shù)據(jù)挖掘工具
4.1 Mahout
4.2 Spark MLlib
4.3 其他數(shù)據(jù)挖掘工具
習(xí)題
參考文獻(xiàn)
第5章 R語
5.1 R語言簡介
5.2 R與數(shù)據(jù)挖掘
5.3 SparkR
習(xí)題
參考文獻(xiàn)
第6章 大數(shù)據(jù)可視化
6.1 數(shù)據(jù)可視化基
6.2 大數(shù)據(jù)可視化方法
6.3 大數(shù)據(jù)可視化軟件與工具
習(xí)題
參考文獻(xiàn)
第7章 互聯(lián)網(wǎng)大數(shù)據(jù)處理
7.1 互聯(lián)網(wǎng)信息抓取
7.2 文本分詞
7.3 倒排索引
7.4 網(wǎng)頁排序算法
7.5 歷史信息檢索
習(xí)題
參考文獻(xiàn)
第8章 大數(shù)據(jù)商業(yè)應(yīng)用
8.1 用戶畫像與精準(zhǔn)營
8.2 廣告推薦
8.3 互聯(lián)網(wǎng)金融
習(xí)題
參考文獻(xiàn)
第9章 行業(yè)大數(shù)據(jù)
9.1 地震大數(shù)據(jù)
9.2 交通大數(shù)據(jù)
9.3 環(huán)境大數(shù)據(jù)
9.4 警務(wù)大數(shù)據(jù)
習(xí)題
參考文獻(xiàn)
附錄:大數(shù)據(jù)實驗一體機
內(nèi)容一般,理論偏多,不好理解
感謝,非常好!
沒看沒看沒看沒看沒看沒看哦
包裝很好,沒有缺損,很不錯
,,,,,,,,,,,,,,,,,,,,,,,
給我發(fā)的書和圖片不同 內(nèi)容也不同 懷疑盜版
買的書和圖片不同 內(nèi)容也不一樣 懷疑是盜版 還是當(dāng)當(dāng)自營呢 啪啪打臉吧
還可以吧。。