當下,大數(shù)據(jù)是一個熱門的話題,很多領域的學者,從不同的角度進行了深入的討論。本書從大數(shù)據(jù)的歷史、內(nèi)涵、哲學和技術四個角度,解析大數(shù)據(jù),讓讀者對大數(shù)據(jù)有更深入的了解。 《品味大數(shù)據(jù)》共11章,大致分為4塊:第1-3章主要漫談了大數(shù)據(jù)的有趣的歷史,包括數(shù)據(jù)的啟蒙、信息載體的演變和數(shù)據(jù)管理的發(fā)展脈絡。第4-6章主要聊聊大數(shù)據(jù)的內(nèi)涵,包括大數(shù)據(jù)與哲學及第四科學范式的關聯(lián)。第7-9張是大數(shù)據(jù)的雜談,包括大數(shù)據(jù)的用途、可能面臨的陷阱以及通過小故事對大數(shù)據(jù)進行一些煩死,第10-11章主要涉及大數(shù)據(jù)的技術,包括100余篇大數(shù)據(jù)論文的漫讀及Hadoop的初級實戰(zhàn)篇。
品味大數(shù)據(jù)》與市面上圖書不同的是從多維度對大數(shù)據(jù)的歷史、內(nèi)涵、哲學與技術四個方面對大數(shù)據(jù)進行了深入的探討,用百位大牛的觀點論辯來幫助讀者形成自己的大數(shù)據(jù)認知體系。
圖書行文幽默、結構完整、圖文并茂通俗易懂,讓讀者寓學于樂。
率先采用正反辯論的方法對觀點形成闡述,讓讀者可以從辯證的角度去品味大數(shù)據(jù)。
張玉宏 留美博士,曾跟隨導師Alok Choudhary教授參加了奧巴馬總統(tǒng)辦公室有關Big Data(大數(shù)據(jù))研討會。
張玉宏 / 在路上,學而時習之 序
及時章 大數(shù)據(jù)簡史漫談之一——數(shù)字的來源及數(shù)據(jù)思維的發(fā)展
人類的“數(shù)覺”與計數(shù)系統(tǒng) 1.1
1.2 關于二進制的一點討論
數(shù)字的誕生與廣泛應用的匹配法 1.3
數(shù)學的“問世”與“算法”的祖師爺 1.4
文字的“出爐”與羅馬語言的來歷 1.5
古代的數(shù)據(jù)保存之道與文言文的“無奈”精簡 1.6
古代的“數(shù)據(jù)中心”——圖書館 1.7
古代計算工具的誕生及其演變 1.8
1.9 統(tǒng)計學誕生——數(shù)據(jù)思維的漸起
美國式的人口普查——大數(shù)據(jù)催生新技術 1.10
1.11 中國式的人口統(tǒng)計與數(shù)目字管理
本章小結與思考 1.12
大數(shù)據(jù)簡史漫談之二——近代存儲體系發(fā)展中的那些人和事 第二章
2.1 數(shù)據(jù)復制與傳播中的問題及解決方案
影響人類發(fā)展進程的幾次能源革命 2.2
2.3 不能遺忘的電氣時代的傳奇——特斯拉
霍爾瑞斯的穿孔卡 2.4
2.5 現(xiàn)代通用計算機的奠基者——圖靈和馮 諾伊曼
波弗勞姆的磁帶發(fā)明 2.6
華人王安電腦的磁芯存儲器 2.7
IBM 的傳奇磁存儲世界 2.8
網(wǎng)絡存儲世界的興起 2.9
2.10 本章小結與思考
大數(shù)據(jù)簡史漫談之三——數(shù)據(jù)庫的發(fā)展與大數(shù)據(jù)的興起 第三章
3.1 近代“數(shù)據(jù)中心”之夢殤
“窮”則思變之網(wǎng)狀數(shù)據(jù)庫 3.2
濃墨重彩之關系數(shù)據(jù)庫 3.3
突破數(shù)據(jù)共享封鎖線的領頭人 3.4
高手對決的數(shù)據(jù)倉庫領域兩俠客 3.5
向非結構化進發(fā)的數(shù)據(jù)大趨勢 3.6
大數(shù)據(jù)術語的歷史淵源 3.7
現(xiàn)代大數(shù)據(jù)的誕生 3.8
3.9 在混沌和秩序轉化中螺旋上升
本章小結與思考 3.10
第四章 大數(shù)據(jù)的內(nèi)涵
從數(shù)據(jù)、信息到知識、智慧的飛躍 4.1
大數(shù)據(jù)的多版本定義 4.2
4.3 大數(shù)據(jù)——新時代的生產(chǎn)資料
信息(數(shù)據(jù))化、第二經(jīng)濟與數(shù)據(jù)思維的轉變 4.4
4.5 大數(shù)據(jù)——來自學術界的青睞
大數(shù)據(jù)——來自政府層面的重視 4.6
大數(shù)據(jù)——來自工商業(yè)的熱捧 4.7
大數(shù)據(jù)內(nèi)涵——“豈止于大” 4.8
大數(shù)據(jù)之“大”有不同(Volume) 4.8.1
大數(shù)據(jù)之唯“快”不破(Velocity) 4.8.2
大數(shù)據(jù)之五彩繽紛(Variety) 4.8.3
大數(shù)據(jù)之價“值”無限(Value) 4.8.4
包括但不限于 4V 4.8.5
4.9 本章小結與思考
大數(shù)據(jù)時代的一點哲學思考 第五章
5.1 哲學與科學的關系——為什么計算機專業(yè)博士也發(fā)個哲學文憑(Ph.D)
大、小數(shù)據(jù)的“質(zhì)”不同 5.2
5.3 大數(shù)據(jù)的數(shù)理哲學基礎——同構關系
大數(shù)據(jù)認識主體的變化——“替人消災”式的認識能免責嗎 5.4
5.5 波普爾的世界 3——秦始皇的長生夢,找錯了空間
大數(shù)據(jù)認識對象的變化——提升普羅大眾的權重 :“長尾理論” 5.6
認識論對大數(shù)據(jù)研究的指導意義 5.7
科學始于觀察——證實主義 5.7.1
證實主義的困頓——來自波普爾的批判 5.7.2
科學始于問題——波普爾的貢獻 5.7.3
科學始于數(shù)據(jù)——大數(shù)據(jù)時代的科學轉機與思考 5.7.4
大數(shù)據(jù)的悲觀思潮 5.7.5
本章小結與思考 5.8
大數(shù)據(jù)研究的第四范式 第六章
6.1 谷歌公司的“不務正業(yè)”
塞吉 布林的“秘密”病情 6.2
布林病情的“治療”方案 6.3
詹姆斯 格雷的科學第四范式 6.4
科學研究的其他三個范式 6.5
6.6 本章小結與思考
大數(shù)據(jù),大有為 第七章
洞察帶來價值 7.1
7.2 案例 1 :谷歌是如何“越俎代庖”地預測流感的
流感治療網(wǎng)絡化 7.2.1
“無意間”生產(chǎn)的搜索數(shù)據(jù) 7.2.2
谷歌工程師們的杰作——流感預測趨勢(GFT) 7.2.3
谷歌的“越俎代庖”為何成功 7.2.4
案例小結 :數(shù)據(jù)、模型與理論 7.2.5
7.3 案例 2 :“全數(shù)據(jù)”是如何為葉詩文抱不平的
葉詩文事件的新聞背景 7.3.1
什么是性能分析法 7.3.2
質(zhì)疑的合理性在哪里 7.3.3
“大數(shù)據(jù) = 全數(shù)據(jù)”的威力——為葉詩文抱不平 7.3.4
案例小結 7.3.5
案例 3 :大數(shù)據(jù)是如何對抗癌癥的 7.4
7.4.1 癌癥大數(shù)據(jù)的特征是什么
癌癥從哪里來 7.4.2
大數(shù)據(jù)用之于癌癥斗爭,挑戰(zhàn)何在 7.4.3
癌癥診療的基礎大數(shù)據(jù)——獲取難 7.4.4
數(shù)據(jù)化帶來的顛覆式醫(yī)療——執(zhí)行難 7.4.5
哪些機構在用大數(shù)據(jù)對抗癌癥 7.4.6
癌癥大數(shù)據(jù)的重要源頭——基因組數(shù)據(jù) 7.4.7
大數(shù)據(jù)對抗癌癥,前景如何 7.4.8
案例小結 7.4.9
更多大數(shù)據(jù)應用案例 7.5
7.6 本章小結與思考
大數(shù)據(jù)之坑與小數(shù)據(jù)之美 第八章
引子——哪個 V 8.1 才是大數(shù)據(jù)最重要的特征
“大”有不同——Volume(大量) 8.1.1
8.1.2 數(shù)據(jù)共征——Velocity(快速)與 Value(價值)
五彩繽“紛”——Variety(多樣) 8.1.3
大數(shù)據(jù)的力量與陷阱 8.2
大數(shù)據(jù)的力量 8.2.1
大數(shù)據(jù)的陷阱 8.2.2
今日王謝堂前燕,暫未飛入百姓家——大數(shù)據(jù)還沒那么普及 8.2.3
8.2.4 你若安好,便是晴天——小數(shù)據(jù)之美
本章小結與思考 8.3
12 第九章 個小故事,思考大數(shù)據(jù)
故事 1 :大數(shù)據(jù)都是騙人的啊——大數(shù)據(jù)預測得準嗎 9.1
故事 2 9.2 :顛簸的街道——對不起,“n=all”只是一個幻覺
故事 3 :醉漢路燈下找鑰匙——大數(shù)據(jù)的研究方法可笑嗎 9.3
故事 4 :園中有金不在金——大數(shù)據(jù)的價值 9.4
故事 5 9.5 :蓋洛普抽樣的成功——大小之爭,“大”數(shù)據(jù)一定勝過小抽樣嗎
故事 6 :點球成金——數(shù)據(jù)流 PK 9.6 球探,誰更重要
故事 7 :啤酒和尿布——經(jīng)典故事是偽造的,你知道嗎 9.7
故事 8 9.8 :谷歌流感預測——預測是如何失效的
故事 9 :Target 超市預測女孩懷孕——“大數(shù)據(jù)”智慧,還是愚蠢 9.9
故事 10 :你的一夜情我知道——大數(shù)據(jù)的隱私之痛 9.10
故事 11 9.11 . :大數(shù)據(jù),無須懼——比薩店員更能知道顧客所有的信息嗎
故事 12 9.12 :撲朔離迷的“因果關系”——蘇格拉底的“詭辯術”
本章小結與思考 9.13
第十章 大數(shù)據(jù)技術漫談——需要讀懂的 100 篇大數(shù)據(jù)文獻
大數(shù)據(jù)價值的實現(xiàn) 10.1
10.2 大數(shù)據(jù)分析的關鍵架構層
架構的演進 10.3
幾個重要的概念 10.4
10.5 文件系統(tǒng)層
數(shù)據(jù)存儲層 10.6
Managers) 資源管理器層(Resource 10.7
調(diào)度器(Schedulers) 10.8
協(xié)調(diào)器(Coordination) 10.9
Frameworks) 計算框架(Computational 10.10
10.11 Analysis) 數(shù)據(jù)分析層(Data
Integration) 數(shù)據(jù)集成層(Data 10.12
Frameworks) 操作框架層(Operational 10.13
10.14 本章小結與思考
牛刀小試之 Hadoop 實戰(zhàn) 第十一章
什么是 Hadoop 11.1
Hadoop 發(fā)展歷程 11.2
Hadoop 集群服務器的安裝與配置 11.3
7 安裝 CentOS 11.3.1
配置 Java 環(huán)境 11.3.2
11.3.3 啟動和配置 SSH 服務
安裝 Hadoop 11.3.4
啟動 11.3.5 Hadoop
World 版 Hadoop 程序——WordCount 運行 Hello 11.4
11.5 全分布模式下的 Hadoop 集群構建
Linux 以運行等級 3 啟動 11.5.1
在 11.5.2 OS 環(huán)境下克隆虛擬機 Windows 和 Mac
設置靜態(tài) IP 地址 11.5.3
修改 11.5.4 hosts 文件
虛擬機的同步配置 11.5.5
SSH 的免密碼登錄 11.5.6
全分布模式下安裝 Hadoop 11.5.7
同步配置文件 11.5.8
11.5.9 創(chuàng)建所需目錄
關閉防火墻 11.5.10
格式化文件系統(tǒng) 11.5.11
11.5.12 啟動 Hadoop 守護進程
驗證全分布模式 11.5.13
默認配置文件所在位置 11.5.14
關閉 Hadoop 11.5.15
Hadoop 的運行錯誤查找 11.5.16
WordCount 代碼詳解 11.6
MapReduce 編程模型 11.6.1
WordCount 的 MapReduce 處理流程 11.6.2
WordCount 源碼解讀 11.6.3
本章小結與思考 11.7
記 后
5.2 大、小數(shù)據(jù)的“質(zhì)”不同
大數(shù)據(jù)的實質(zhì)是什么?在第四章中,我們已經(jīng)討論過這個議題。雖然當前學術界和實業(yè)界對此都還沒有一個統(tǒng)一的定義或認知,但從狹義的字面來理解的話,它應該與小數(shù)據(jù)相對應,大數(shù)據(jù)是指數(shù)據(jù)量特別巨大,超出了常規(guī)的處理能力,需要引入新的科學工具和技術手段,方能夠進行處理的數(shù)據(jù)集合。
于此對應的,所謂的小數(shù)據(jù)指的是,數(shù)據(jù)規(guī)模比較小,用傳統(tǒng)的工具和方法就足以完成處理的數(shù)據(jù)集合。下面我們用一段天文學家第谷 布拉赫和約翰尼斯 開普勒的故事來舉例說明小數(shù)據(jù)的應用。
在16 世紀,有位杰出的占星學家、天文學學家,名叫第谷 布拉赫(TychoBrahe,1546—1601)。第谷出生于丹麥的一個貴族家庭。早在1572 年,第谷憑借自己出色的觀察能力,發(fā)現(xiàn)仙后座中的一顆新星,后來受惜才的普魯士國王腓特烈二世(Friedrich Ⅱ)b 的邀請,他在汶島建造天堡觀象臺,經(jīng)過20 年的觀測,發(fā)現(xiàn)了許多新的天文現(xiàn)象。第谷是天文史上的一位奇人。他對于星象所做的觀測精度之高,是他同時代的人望塵莫及的,他編纂的星表的數(shù)據(jù)甚至接近了肉眼分辨率的極限。
1597 年, 有位才華橫溢的年輕人約翰尼斯 開普勒(Johannes Kepler,1571—1630)漸露頭角,年僅26 歲的他出版了自己對宇宙模型猜想的著作——《神秘的宇宙》(Mysterium Cosmographicum)。在這本書中,開普勒設計了一個非常有趣的、由許多有規(guī)則的幾何形體構成的宇宙模型。
1599 年,第谷看到這本書,十分欣賞開普勒的智慧和才能,立即誠邀他做自己的助手。開普勒來到第谷身邊以后,師徒二人“珠聯(lián)璧合”,朝夕相處,對天文學領域共同的狂熱,讓他們結成忘年交。
但是,好景不長,開普勒受多疑的妻子的挑唆,突然和第谷決裂,不辭而別。開普勒的離去,使愛才如命的第谷非常傷心。他意識到這是一種誤會,立即寫信給開普勒解釋,并胸懷寬廣地請他回來繼續(xù)合作。開普勒讀了第谷的誠摯來信,感到十分愧疚。當兩人重修舊時,第谷不記舊怨,不但把才華出眾的開普勒推薦給國王腓特烈二世,還把自己20 多年辛勤工作積累下來的觀測資料和手稿,全部交給開普勒使用。他對開普勒說:“除了火星所給予你的麻煩之外,其他一切麻煩都沒有了。現(xiàn)在我把火星的研究也要交托于你,它夠你一個人麻煩的了。”
開普勒在接手第谷觀測的數(shù)據(jù)后,這批花費第谷20 多年時間得到的數(shù)據(jù),很快就在開普勒手中“妙筆生花”,開普勒經(jīng)過手工計算,從中發(fā)現(xiàn)了著名的“行星運動三大定律”,即軌道定律、面積定律和周期定律。這三大定律最終使開普勒贏得了“天空立法者”的美名。開普勒的成就,來自堅實的數(shù)據(jù)支撐。他憑借手工,就能處理完第谷20 多年收集而來的數(shù)據(jù)。這一案例反映的是他處在一個“小數(shù)據(jù)時代”。
隨后,與開普勒同時代的牛頓,通過論證開普勒行星運動定律與他的引力理論間的一致性,證明了地面物體與天體的運動都遵循著相同的自然定律,從而發(fā)現(xiàn)了萬有引力和三大運動定律,現(xiàn)在看來,這也是基于小數(shù)據(jù)的。這些經(jīng)典理論的提出,奠定了此后三個世紀里物理學領域的科學觀點,并成為了現(xiàn)代工程學的基礎。再后來,隨著科學的發(fā)展,數(shù)據(jù)量有了較大的增加,為了處理那些在當時看來的“大數(shù)據(jù)”,統(tǒng)計學家發(fā)明了抽樣方法,其基本要求是,在確保所抽取樣品具備“隨機性”的基礎上,來保障樣本可以對全體具有充分的代表性,從而推斷全體樣品的特性,由此解決了“大”數(shù)據(jù)處理的難題。
而當前的大數(shù)據(jù),不僅是所謂數(shù)據(jù)海量,而且各種數(shù)據(jù)的差別非常大,用抽樣方法難以保障它的有效性。傳統(tǒng)的統(tǒng)計方法,之所以不能適用于現(xiàn)在的大數(shù)據(jù),大致源于如下三點原因。
(1)在第四章中,我們討論了大數(shù)據(jù)的“4V”特征,其中最能反映大數(shù)據(jù)和小數(shù)據(jù)不同之處,就是它的“多樣性”(Variety):由多種數(shù)據(jù)來源組成的一個的數(shù)據(jù)。在多種數(shù)據(jù)源的應用環(huán)境中,抽樣很難保障它的“無偏性”(unbiasedness)。
(2)統(tǒng)計學家們設計的統(tǒng)計模型,其結論的性,強烈依賴于與結論有關的應用類型。目前大數(shù)據(jù)的主力軍——網(wǎng)絡數(shù)據(jù)呈現(xiàn)長尾分布(長尾理論將在后面的小節(jié)介紹),使得傳統(tǒng)的標準方差等衡量標準失效,“長相依”和“不平穩(wěn)”常常超過了經(jīng)典時間序列的基本假設。
(3)傳統(tǒng)的機器學習方法,通過先在較小的數(shù)據(jù)集樣本中學習,然后調(diào)整參數(shù),驗證分類、判定等“假設”和“模型”的適用性,再推而廣之到更大的數(shù)據(jù)集上。通常來說,一般的NlogN、N2 N2 等級別的算法復雜度,是可以容忍的,然而面對PB 級別(1PB=1 024TB=1 024×1 024GB=1 125 899 906 842 624 Bytes)的大數(shù)據(jù)處理,這種算法復雜度已經(jīng)難以忍受,因此需要設計新的數(shù)據(jù)處理算法來適應這一新情況。江西財經(jīng)大學科技哲學教授黃欣榮,對小數(shù)據(jù)和大數(shù)據(jù)“質(zhì)”的區(qū)別也做了比較到位的描述。
(1)從采集手段上來說,小數(shù)據(jù)屬于人工數(shù)據(jù),是有意測量、采集的數(shù)據(jù);而大數(shù)據(jù)大多數(shù)是由智能系統(tǒng)自動采集或人們無意留下的數(shù)據(jù)(比如,用戶在搜索引擎中使用的搜索關鍵字、服務器運行的各種日志等),因為當時沒有什么明顯的用途,很多大數(shù)據(jù)一度被稱為“垃圾數(shù)據(jù)”。目前,“數(shù)據(jù)排放”(data emission)——互聯(lián)網(wǎng)用戶留下的點點滴滴(如點擊記錄、瀏覽時間、評價內(nèi)容等),都可以發(fā)掘出價值,目前正成為網(wǎng)絡經(jīng)濟主流。在大數(shù)據(jù)時代,有個口號就是,記錄一切數(shù)據(jù),等待有趣的事發(fā)生。在特定的生態(tài)環(huán)境下,用適合的工具挖掘,大數(shù)據(jù)中的所謂“垃圾數(shù)據(jù)”就不再垃圾。
(2)從存儲介質(zhì)和處理平臺來看,小數(shù)據(jù)因為容量較小,常存儲于本地存儲介質(zhì)中,其處理平臺僅需單機即可完成,數(shù)據(jù)的處理者清楚地知道數(shù)據(jù)“身處何地”,可以“親力親為”地編寫對應的數(shù)據(jù)分析程序。而現(xiàn)在的大數(shù)據(jù),往往因數(shù)量過大,而不得已存放于“云端”中,“云深不知處”,云計算利用自己的“虛擬化”技術,讓用戶不知道也不需要知道數(shù)據(jù)存在哪臺“云計算”的服務器上。就如同用水、用電一樣,用戶無須知道自來水廠和發(fā)電廠在哪里一樣,僅僅打開水龍頭、按下開關就能得到水資源和電資源。所謂的云計算,就其本質(zhì)而言,就是一種以互聯(lián)網(wǎng)為連接中介,以租賃服務的方式,為用戶提供動態(tài)可伸縮的虛擬化資源的計算模式。中國寬帶資本基金董事長田溯寧先生曾總結說,大數(shù)據(jù)與云計算就好比一個問題的兩面。如果說大數(shù)據(jù)是有待解決的問題,那么云計算就是問題的解決方法。通過云計算對大數(shù)據(jù)進行分析、預測,會使決策更加精準,釋放出更多的隱藏價值。大數(shù)據(jù),這個21 世紀人類探索的新邊疆,正在被新的計算模式——云計算所發(fā)現(xiàn)和征服。
(3)從數(shù)據(jù)性質(zhì)來說,小數(shù)據(jù)因“有意采集”來支持研究者的假設或觀點,因此可歸屬于“主觀數(shù)據(jù)”。相比較而言,大數(shù)據(jù)則因沒有事先滲透主觀意圖,數(shù)據(jù)的生產(chǎn)者反而能“真情流露”,從而更顯客觀性,因此屬于“客觀數(shù)據(jù)”。此外,根據(jù)舍恩伯格教授的觀點,大數(shù)據(jù)不再是隨機樣本,而是全體數(shù)據(jù)。全數(shù)據(jù)是由多維度數(shù)據(jù)構成的。一個事物的全息可見,自然比單維度的采集要來得客觀。有些商家(特別是大型電商)就是利用顧客的多維度、多層面“用戶畫像”來更刻畫客戶特征,從而達到精準營銷。舍恩伯格教授在其著作《大數(shù)據(jù)時代》一書中,開門見山地提出了大數(shù)據(jù)的哲學意義:“大數(shù)據(jù)開啟了一次重大的時代轉型。就像借助望遠鏡,讓我們能夠感知浩瀚的宇宙,借助顯微鏡,我們能夠觀測渺小的微生物一樣,大數(shù)據(jù)正作為人類認知世界的新手段、新方法、新工具,改變我們的生活、工作以及理解世界的方式,成為新發(fā)明和新服務的源泉,而更多的改變正蓄意待發(fā)……”由此可見,大數(shù)據(jù),除了在信息科學領域成為研究熱點外,在哲學層面的認知,也應有所突破,這也是人類進一步認識世界的迫切需求。
買書必**當!書還真不錯,一直信賴當當。希望當當一直以這種良好姿態(tài)、健康的發(fā)展、負責的態(tài)度來服務書友。十分感謝當當給我?guī)淼膶嵒荨⒎奖愫涂鞓罚?
很不錯的,內(nèi)容詳實,文筆也不錯,開卷有益!
文筆不錯,講的還不錯,質(zhì)量還行。
不錯的書,很有深度!
文筆好啊,內(nèi)容也不錯,花了功夫?qū)懙臅?
包裝挺好的,整體也很不錯!
內(nèi)容不錯,文筆不錯,值得一讀!GG…
本書章節(jié)設置合理,作者從大數(shù)據(jù)的歷史、內(nèi)涵、哲學與技術幾個維度進行了系統(tǒng)的闡述。無論是文科生還是理科生的科技愛好者,都能夠有所啟發(fā)。
書的排版不錯,紙質(zhì)也不錯。剛剛翻閱了一下,書中還有掃碼尋寶。非常期待!
還不錯啊,挺通俗易懂的。但內(nèi)容有點豐富,而排版有點擁擠,讀起來有點累。
這本書對我很有啟發(fā),作者是名嚴謹?shù)膶W者,論述有依據(jù),但語言又很有趣,讀后既長了知識,又感覺很有意思,一本非常好的書,滿分推薦。
行文如流水,將本是非常枯燥的內(nèi)容娓娓道來,引人入勝。書中的小故事、小事例生動有趣,語風詼諧幽默。專業(yè)人士抑或非專業(yè)人士,皆可讀!
非常經(jīng)典的一本大數(shù)據(jù)科普圖書,謝謝作者的用心和努力!已經(jīng)是第二次購買了!送給朋友學習。好評,好評!
淺顯易懂,文筆生動。是不可多得的介紹大數(shù)據(jù)入門或科普好書。
挺不錯的!大數(shù)據(jù)的抽象各種概念娓娓道來,淺顯易懂!故事性,可讀性都很好!喜歡!
看了幾天才來評論論,難得的一本好書,作為門外漢,從作者生動的講解中,對大數(shù)據(jù)有了基本的了解,受益匪淺。推薦給像我一樣的初學者
本書博采眾長,深入淺出,科普類的圖書居然被作者寫出了文學作品的色彩,一直不喜歡太學術的東西,但這本書卻增加了很多的趣味,實在難得。包裝設計也很棒,看上去挺高端大氣上檔次的,基本上每頁都有題注,作者真是參考了不少內(nèi)容,才有這么精彩的內(nèi)容呈現(xiàn)!
《品味大數(shù)據(jù)》這本書從歷史,哲學與技術等多個角度進行了大數(shù)據(jù)的相關闡述,行文生動,詳列得當,使我受益匪淺。通過該書讓我對大數(shù)據(jù)有了更深的理解,許多恰如其分的例子,讓我明白了大數(shù)據(jù)的魅力和價值。該書不同于以往我讀到的關于大數(shù)據(jù)方面的書籍,避開晦澀的知識講解和相關闡述。這是一本值得人手一冊的好書籍,感謝作者的傾心打造,呈現(xiàn)給我們一個大數(shù)據(jù)史詩!!!
這本書將目前對于大數(shù)據(jù)不一樣的看法一一羅列,內(nèi)容深入淺出,它由數(shù)據(jù)的來源講起,深入到大數(shù)據(jù)的實際應用。讀過之后令人受益匪淺,是一本不可多得的好書。
買回來花了幾天時間讀完,才過來評論。大數(shù)據(jù)是這幾年比較流行的技術話題,也讀了幾本相關的書籍。相比而言,這本《品位大數(shù)據(jù)》頗具獨到之處。作者以輕松寫意的筆調(diào)將相介紹了大數(shù)據(jù)這一枯燥嚴肅的技術話題,對于人文社科背景的閱讀者來說,很容易輕松愉悅地接受這一內(nèi)容。書本的前半部分介紹了大數(shù)據(jù)基本的概念和應用,其間穿插著有關的歷史哲學小故事,使得科技文獻也顯示出搖曳生姿的趣味,吸引讀者一步步讀下去。后半部分則著重介紹大數(shù)據(jù)相關的技術和科研現(xiàn)狀,文風也偏向簡潔,在并不算長的內(nèi)容里對大數(shù)據(jù)相關的技術進行了全面而有重點的展示,非常有助于初學…
這是一本關于大數(shù)據(jù)的很好的書,作者力求將高深的理論敘述的淺顯易懂,可以讓那些對大數(shù)據(jù)方面的了解較少,但是又對此感興趣的讀者,通過閱讀此書,能夠比較容易和快速的學習到相關知識。
這本有關大數(shù)據(jù)的圖書寫得深入淺出、妙趣橫生,在輕松的閱讀中卻能深深領悟到很多大數(shù)據(jù)的內(nèi)涵知識。作者文筆不錯,又閱讀大量文獻,使得該書不僅易讀,而且內(nèi)容詳實可信,是一本難得的大數(shù)據(jù)入門書籍。
整體讀下來,不像是技術類的書籍 ,語風很幽默,通俗易懂。非專業(yè)人的我對大數(shù)據(jù)時代有了自己的領悟,從事營銷的家人 也是一口氣讀完,各有所得。真心評價不錯
通過該書對大數(shù)據(jù)有了更深的理解,許多恰如其分的例子,體現(xiàn)了大數(shù)據(jù)的魅力和價值。講解得風趣幽默,娓娓道來,是特別適合年輕人(或初學者)來讀的一本大數(shù)據(jù)入門書,---看后受益匪淺。是不可多得的大數(shù)據(jù)書,力薦推介….
《品味大數(shù)據(jù)》這本書和《大數(shù)據(jù)時代》都是大數(shù)據(jù)科普類圖書,只不過《品味大數(shù)據(jù)》更具“本土性”,書中例子妙趣橫生,配圖頁相當有意思,甚至還有涉及運用的章節(jié),看后受益匪淺。如果書中能夠再多一些趣味性的實踐例子就更好了,五分。