令人著迷的,有趣的……—— 《西雅圖郵訊報(bào)》
全書充滿了生動(dòng)的例子……——《金融時(shí)報(bào)》
作為大數(shù)據(jù)的核心應(yīng)用,預(yù)測正在繁榮發(fā)展。它改寫了行業(yè),驅(qū)動(dòng)世界向前。潮流引領(lǐng)者比如大通銀行、臉譜網(wǎng)、谷歌、HP、IBM、Match.com、網(wǎng)飛公司、優(yōu)步等正借助大數(shù)據(jù)的力量對人類的行為進(jìn)行預(yù)測——其中也包括你的。公司、政府、執(zhí)法機(jī)關(guān)、醫(yī)院和高校正利用來自預(yù)測的力量,預(yù)測你否會(huì)點(diǎn)擊、購買、撒謊或者死去。
為什么要對人類的行為進(jìn)行預(yù)測?我們有充分的理由:預(yù)測人類行為,可以戰(zhàn)勝危機(jī)、促進(jìn)銷售、提升醫(yī)療保健、簡化生產(chǎn)流程、攔截垃圾信息、優(yōu)化社交網(wǎng)絡(luò)、強(qiáng)化打擊犯罪,以及贏得選舉,等等。
預(yù)測由世界上有效、豐富的非自然資源——數(shù)據(jù)驅(qū)動(dòng)。作為人們各種日常及社會(huì)活動(dòng)的副產(chǎn)品,數(shù)據(jù)正在被不斷被記錄和整理,并日漸成為一座金礦。大數(shù)據(jù)技術(shù)通過對數(shù)據(jù)進(jìn)行學(xué)習(xí),正不斷釋放數(shù)據(jù)的能量。 令人著迷的, 有趣的……—— 《西雅圖郵訊報(bào)》
全書充滿了生動(dòng)的例子……——《金融時(shí)報(bào)》
作為大數(shù)據(jù)的核心應(yīng)用,預(yù)測正在繁榮發(fā)展。它改寫了行業(yè),驅(qū)動(dòng)世界向前。潮流引領(lǐng)者比如大通銀行、臉譜網(wǎng)、谷歌、HP、IBM、Match.com、網(wǎng)飛公司、優(yōu)步等正借助大數(shù)據(jù)的力量對人類的行為進(jìn)行預(yù)測——其中也包括你的。公司、政府、執(zhí)法機(jī)關(guān)、醫(yī)院和高校正利用來自預(yù)測的力量,預(yù)測你否會(huì)點(diǎn)擊、購買、撒謊或者死去。
為什么要對人類的行為進(jìn)行預(yù)測?我們有充分的理由:預(yù)測人類行為,可以戰(zhàn)勝危機(jī)、促進(jìn)銷售、提升醫(yī)療保健、簡化生產(chǎn)流程、攔截垃圾信息、優(yōu)化社交網(wǎng)絡(luò)、強(qiáng)化打擊犯罪,以及贏得選舉,等等。
預(yù)測由世界上有效、豐富的非自然資源——數(shù)據(jù)驅(qū)動(dòng)。作為人們各種日常及社會(huì)活動(dòng)的副產(chǎn)品,數(shù)據(jù)正在被不斷被記錄和整理,并日漸成為一座金礦。大數(shù)據(jù)技術(shù)通過對數(shù)據(jù)進(jìn)行學(xué)習(xí),正不斷釋放數(shù)據(jù)的能量。
在這本內(nèi)容豐富、有趣的書中,預(yù)測分析專家埃里克•西格爾解讀了預(yù)測是如何工作和影響我們每個(gè)人的。它不僅是一本技術(shù)實(shí)踐指導(dǎo)手冊,更通過提供新的研究案例以及前沿技術(shù),幫助普通讀者和專業(yè)人士更好地了解大數(shù)據(jù)預(yù)測。
!! “得到”創(chuàng)始人羅振宇、360公司創(chuàng)始人周鴻祎理性推薦,了解大數(shù)據(jù)預(yù)測必讀書目;
!!獲獎(jiǎng)作品,全球翻譯為9種語言,美國30多所大學(xué)選為課堂教材;
!!預(yù)測分析頂ji專家生動(dòng)有趣解說數(shù)據(jù)與預(yù)測技術(shù),本書是了解預(yù)測技術(shù)不容錯(cuò)過的實(shí)踐指導(dǎo)手冊,修訂版增加zui新企業(yè)研究案例;
!!一點(diǎn)預(yù)測,無限可能。預(yù)測連接過去與未來,預(yù)測技術(shù)的應(yīng)用貫穿商業(yè)、政界、醫(yī)療、高校和執(zhí)法系統(tǒng)。身處預(yù)測繁榮發(fā)展的時(shí)代,想知道我們的世界會(huì)因?yàn)轭A(yù)測變成什么樣子,來讀《大數(shù)據(jù)預(yù)測》。
埃里克 西格爾, 博士, Predictive Analytics World創(chuàng)始人,《預(yù)測時(shí)報(bào)》( The Predictive Analytics Times)主編,前哥倫比亞大學(xué)教授,預(yù)測分析領(lǐng)域知名演講人、教育家和領(lǐng)導(dǎo)者。
序言
前言 預(yù)測分析的職業(yè)風(fēng)險(xiǎn)
導(dǎo)論 預(yù)測效應(yīng)
及時(shí)章升空!預(yù)測開始發(fā)威
開始實(shí)踐
人人愛預(yù)言,雖然不
防護(hù)預(yù)測
價(jià)值100 萬美元的無聲革命
個(gè)性化的危險(xiǎn)
預(yù)測分析程序的安裝:迂回和拖延
運(yùn)行過程中
基本要素:觀察
序 言
前 言 預(yù)測分析的職業(yè)風(fēng)險(xiǎn)
導(dǎo) 論 預(yù)測效應(yīng)
及時(shí)章 升空!預(yù)測開始發(fā)威
開始實(shí)踐
人人愛預(yù)言,雖然不
防護(hù)預(yù)測
價(jià)值100 萬美元的無聲革命
個(gè)性化的危險(xiǎn)
預(yù)測分析程序的安裝:迂回和拖延
運(yùn)行過程中
基本要素:觀察
行動(dòng)就是決策
危險(xiǎn)的啟動(dòng)
呼叫休斯敦,我們有麻煩了
能做到的小模型
休斯敦,發(fā)射
熱情的科學(xué)家
讓預(yù)測走入內(nèi)心
第二章 權(quán)力越大,責(zé)任越大:惠普、Target超市、警察和美國國家安全局會(huì)窺探你的秘密
Target 超市的預(yù)測及其預(yù)測目標(biāo)
意味深長的停頓
我的15 分鐘
曝光于聚光燈下
你無法禁錮那些可傳輸?shù)臇|西
法律與秩序:政策和數(shù)據(jù)監(jiān)管
數(shù)據(jù)之戰(zhàn)
數(shù)據(jù)挖掘并不是“攫取”數(shù)據(jù)
惠普自我學(xué)習(xí)
洞悉員工還是侵犯隱私
辭職風(fēng)險(xiǎn):我不干了!
洞見:辭職背后的因素
危險(xiǎn)品
辭職風(fēng)險(xiǎn)評(píng)估的價(jià)值
預(yù)測犯罪,提前杜絕犯罪
數(shù)據(jù)犯罪和犯罪數(shù)據(jù)
無法測量的機(jī)器風(fēng)險(xiǎn)
偏見的輪回
好的預(yù)測 壞的預(yù)測
第三章 數(shù)據(jù)效應(yīng):彩虹之后的饕餮
焦慮指數(shù)
將情緒可視化
在數(shù)據(jù)里尋寶
一切都數(shù)據(jù)化
把所有艙門都封死:信息太多了
誰的數(shù)據(jù)會(huì)成為你的囊中之物?
彩虹之末
預(yù)測之汁
遙遠(yuǎn)、奇特和驚人的洞察力
有關(guān)系,并不意味著是因果關(guān)系
第四章 學(xué)習(xí)的機(jī)器:大通銀行對房產(chǎn)抵押風(fēng)險(xiǎn)的預(yù)測分析
男孩與銀行的相遇
銀行面臨著風(fēng)險(xiǎn)
預(yù)測抵御風(fēng)險(xiǎn)
風(fēng)險(xiǎn)業(yè)務(wù)
學(xué)習(xí)機(jī)器
創(chuàng)建機(jī)器學(xué)習(xí)
從負(fù)面經(jīng)驗(yàn)中學(xué)習(xí)
機(jī)器如何學(xué)習(xí)
你可以決定決策樹的規(guī)模
計(jì)算機(jī),為自己編程吧
學(xué)吧,寶貝
越大越好
過度學(xué)習(xí):假設(shè)太多
歸納之謎
機(jī)器學(xué)習(xí)的藝術(shù)和科學(xué)
感覺真實(shí):測試數(shù)據(jù)
去粗取精是藝術(shù)
在大通銀行應(yīng)用分類—回歸決策樹
搖錢樹
回歸—為何顯微鏡無法觀察到宇宙碰撞
后續(xù)
第五章 集團(tuán)效應(yīng):Netflix、眾包以及增壓預(yù)測
業(yè)余火箭科學(xué)家
黑馬
思想外包:集思廣益
眾包如星火燎原
生于憂患
聯(lián)合國
元學(xué)習(xí)
兩個(gè)預(yù)測模型的組合
好戲在后頭
集體信息
群體和模型的智慧
一袋子模型
集體智慧開始發(fā)威
泛化悖論:過猶不及
挑戰(zhàn)極限
第六章 “沃森”和《危險(xiǎn)邊緣》節(jié)目
文本分析
英語的愛恨情仇
在理解問題之后就要回答
知識(shí)終極源泉
人工智能悖論
學(xué)習(xí)回答問題
學(xué)人走路,學(xué)人說話
更好的捕鼠器
應(yīng)答機(jī)器
投機(jī)取巧的《危險(xiǎn)邊緣》
從證據(jù)中尋找答案
基礎(chǔ)知識(shí),親愛的“沃森”
證據(jù)如山
用組合模型來判斷證據(jù)
組合模型的組合
機(jī)器學(xué)習(xí)使自然語言處理成為可能
自信但不自負(fù)
需要速度
雙重危險(xiǎn)—“沃森”會(huì)贏嗎?
《危險(xiǎn)邊緣》的惶恐
為了勝利
比賽之后:榮譽(yù)、嘉獎(jiǎng)和崇拜
非對稱性IBM 人工智能
對的預(yù)測
第七章 用數(shù)字說話:挪威電信和美國合眾銀行工程師
如何通過預(yù)測來施加影響
攪拌吧,用力攪拌
沉睡的狗
要預(yù)測新的內(nèi)容
眼睛看不到
預(yù)測說服
具有說服性的選擇
商業(yè)刺激和商業(yè)反饋
定量人性
量子人性—他是否可被影響?
通過上提模型預(yù)測影響力
銀行業(yè)對影響力的運(yùn)用
預(yù)測錯(cuò)誤之事
響應(yīng)上提模型
上提模型的原理
上提模型如何發(fā)揮作用
說服效應(yīng)
不同行業(yè)的影響
讓移動(dòng)客戶不移動(dòng)
結(jié) 語
價(jià)值100 萬美元的無聲革命
當(dāng)組織采用預(yù)測分析時(shí),其意義不啻發(fā)動(dòng)了一支龐大軍隊(duì),只不過這是由“螞蟻”組成的軍隊(duì)。這些“螞蟻”會(huì)走上組織運(yùn)營的各大前線,與消費(fèi)者、學(xué)生或病人等服務(wù)對象直接接觸。之后,這個(gè)“螞蟻軍團(tuán)”會(huì)在預(yù)測結(jié)果的引導(dǎo)下改善數(shù)百個(gè)決策。這一過程可能并不是轟轟烈烈的,但用心觀察其綜合效果之后,會(huì)發(fā)現(xiàn)這些細(xì)小變化所產(chǎn)生的合力。每一個(gè)被改善的決策本身可能都顯得無足輕重,但成千上萬的決策合起來就大為不同。2005 年,某位客戶讓我想辦法提高他網(wǎng)站的點(diǎn)擊量,為此我把自己埋在了相關(guān)數(shù)據(jù)中,希望能找出辦法幫助這位客戶。這位客戶希望其網(wǎng)頁上的廣告能獲得更多的點(diǎn)擊量。這關(guān)乎收入,廣告的點(diǎn)擊量越多,這位客戶的收入就越高。這家網(wǎng)站在創(chuàng)辦幾年后已擁有數(shù)千萬用戶,用戶數(shù)據(jù)大概有5000 萬條,這就是用來做預(yù)測的寶貴的原始材料庫,而預(yù)測的對象竟然是:點(diǎn)擊!
廣告是媒體不可分割的部分,無論是紙媒、電視還是網(wǎng)絡(luò)媒體都離不開廣告。本杰明•富蘭克林曾說,人生中不可避免的兩樣?xùn)|西是死亡和稅。如果他現(xiàn)在還活著,一定會(huì)加上第三樣?xùn)|西:廣告?;ヂ?lián)網(wǎng)巨頭Google 承認(rèn),廣告是其較大的收入來源。Facebook也是如此。
但對于我要研究的這家網(wǎng)站來說,廣告的功能略有不同,只要能預(yù)測用戶的點(diǎn)擊率,其潛在收益就會(huì)更大。這家網(wǎng)站提供搜索高校獎(jiǎng)學(xué)金的服務(wù),在美國所有準(zhǔn)備上大學(xué)的高中生中,大約有1/3 都是這家網(wǎng)站的用戶。這雖是不顯眼的細(xì)分市場,但對于許多大學(xué)和軍校的招生工作人員來說,卻是不容錯(cuò)過的網(wǎng)站。在該網(wǎng)站上,有一則大學(xué)招生廣告很霸氣,它自稱是“美國創(chuàng)新型教育的領(lǐng)導(dǎo)者”,上面還附加了鏈接讓用戶點(diǎn)擊。不難想象,一些提供學(xué)生貸款的機(jī)構(gòu)也選擇在這家網(wǎng)站上投放廣告,讓報(bào)考學(xué)生沒有財(cái)務(wù)上的后顧之憂。這些廣告商為每次點(diǎn)擊支付25 美元。對于網(wǎng)站而言,如果一次點(diǎn)擊就能換來這樣豐厚的收入,那真是太棒了。此外,網(wǎng)站上的廣告與網(wǎng)站主題緊密相關(guān),而網(wǎng)站的用戶也有很強(qiáng)的目的性,因此平均下來每100 次點(diǎn)擊就能產(chǎn)生5 筆成功交易,這是令普通網(wǎng)站難以企及的業(yè)績!因此,擁有這家網(wǎng)站的獵頭公司從中獲利頗豐。任何微小的改善都意味著總收入的顯著提升。
但要想改善用戶的廣告選擇卻不是件容易的事。網(wǎng)頁切換時(shí),用戶面前可能會(huì)出現(xiàn)很多廣告。最難的就是讓用戶點(diǎn)擊最適合他們的廣告鏈接。目前,網(wǎng)站根據(jù)各廣告的平均點(diǎn)擊率來排序,沒有考慮用戶的獨(dú)特需求。因此,點(diǎn)擊最多的廣告總是擺在最顯眼的位置。這樣的安排降低了廣告與單個(gè)用戶的匹配度,而且廣告一旦被推到顯眼的位置,就很難被替換下來,因?yàn)榇罅坑脩艨偸菚?huì)不經(jīng)意地點(diǎn)擊最顯眼處的鏈接。某些大學(xué)對每次點(diǎn)擊都愿意支付高價(jià),而且因?yàn)槲恢蔑@眼,其廣告鏈接的點(diǎn)擊率也很高。因此,似乎沒有理由用冷門的廣告去替換主流廣告,因?yàn)檫@樣做很可能會(huì)失去唾手可得的收入。
價(jià)值100 萬美元的無聲革命
當(dāng)組織采用預(yù)測分析時(shí),其意義不啻發(fā)動(dòng)了一支龐大軍隊(duì),只不過這是由“螞蟻”組成的軍隊(duì)。這些“螞蟻”會(huì)走上組織運(yùn)營的各大前線,與消費(fèi)者、學(xué)生或病人等服務(wù)對象直接接觸。之后,這個(gè)“螞蟻軍團(tuán)”會(huì)在預(yù)測結(jié)果的引導(dǎo)下改善數(shù)百個(gè)決策。這一過程可能并不是轟轟烈烈的,但用心觀察其綜合效果之后,會(huì)發(fā)現(xiàn)這些細(xì)小變化所產(chǎn)生的合力。每一個(gè)被改善的決策本身可能都顯得無足輕重,但成千上萬的決策合起來就大為不同。2005 年,某位客戶讓我想辦法提高他網(wǎng)站的點(diǎn)擊量,為此我把自己埋在了相關(guān)數(shù)據(jù)中,希望能找出辦法幫助這位客戶。這位客戶希望其網(wǎng)頁上的廣告能獲得更多的點(diǎn)擊量。這關(guān)乎收入,廣告的點(diǎn)擊量越多,這位客戶的收入就越高。這家網(wǎng)站在創(chuàng)辦幾年后已擁有數(shù)千萬用戶,用戶數(shù)據(jù)大概有5000 萬條,這就是用來做預(yù)測的寶貴的原始材料庫,而預(yù)測的對象竟然是:點(diǎn)擊!
廣告是媒體不可分割的部分,無論是紙媒、電視還是網(wǎng)絡(luò)媒體都離不開廣告。本杰明•富蘭克林曾說,人生中不可避免的兩樣?xùn)|西是死亡和稅。如果他現(xiàn)在還活著,一定會(huì)加上第三樣?xùn)|西:廣告。互聯(lián)網(wǎng)巨頭Google 承認(rèn),廣告是其較大的收入來源。Facebook也是如此 。
但對于我要研究的這家網(wǎng)站來說,廣告的功能略有不同,只要能預(yù)測用戶的點(diǎn)擊率,其潛在收益就會(huì)更大。這家網(wǎng)站提供搜索高校獎(jiǎng)學(xué)金的服務(wù),在美國所有準(zhǔn)備上大學(xué)的高中生中,大約有1/3 都是這家網(wǎng)站的用戶。這雖是不顯眼的細(xì)分市場,但對于許多大學(xué)和軍校的招生工作人員來說,卻是不容錯(cuò)過的網(wǎng)站。在該網(wǎng)站上,有一則大學(xué)招生廣告很霸氣,它自稱是“美國創(chuàng)新型教育的領(lǐng)導(dǎo)者”,上面還附加了鏈接讓用戶點(diǎn)擊。不難想象,一些提供學(xué)生貸款的機(jī)構(gòu)也選擇在這家網(wǎng)站上投放廣告,讓報(bào)考學(xué)生沒有財(cái)務(wù)上的后顧之憂。這些廣告商為每次點(diǎn)擊支付25 美元。對于網(wǎng)站而言,如果一次點(diǎn)擊就能換來這樣豐厚的收入,那真是太棒了。此外,網(wǎng)站上的廣告與網(wǎng)站主題緊密相關(guān),而網(wǎng)站的用戶也有很強(qiáng)的目的性,因此平均下來每100 次點(diǎn)擊就能產(chǎn)生5 筆成功交易,這是令普通網(wǎng)站難以企及的業(yè)績!因此,擁有這家網(wǎng)站的獵頭公司從中獲利頗豐。任何微小的改善都意味著總收入的顯著提升。
但要想改善用戶的廣告選擇卻不是件容易的事。網(wǎng)頁切換時(shí),用戶面前可能會(huì)出現(xiàn)很多廣告。最難的就是讓用戶點(diǎn)擊最適合他們的廣告鏈接。目前,網(wǎng)站根據(jù)各廣告的平均點(diǎn)擊率來排序,沒有考慮用戶的獨(dú)特需求。因此,點(diǎn)擊最多的廣告總是擺在最顯眼的位置。這樣的安排降低了廣告與單個(gè)用戶的匹配度,而且廣告一旦被推到顯眼的位置,就很難被替換下來,因?yàn)榇罅坑脩艨偸菚?huì)不經(jīng)意地點(diǎn)擊最顯眼處的鏈接。某些大學(xué)對每次點(diǎn)擊都愿意支付高價(jià),而且因?yàn)槲恢蔑@眼,其廣告鏈接的點(diǎn)擊率也很高。因此,似乎沒有理由用冷門的廣告去替換主流廣告,因?yàn)檫@樣做很可能會(huì)失去唾手可得的收入。
未來,大數(shù)據(jù)會(huì)變得越來越重要,其核心應(yīng)用預(yù)測也會(huì)成為互聯(lián)網(wǎng)行業(yè)以及產(chǎn)業(yè)變革的重要力量,我們很有必要對數(shù)據(jù)預(yù)測及其分析方法進(jìn)行且深入的了解。在這一點(diǎn)上,《大數(shù)據(jù)預(yù)測》是本很好的讀物,適合大數(shù)據(jù)所有相關(guān)行業(yè)的人閱讀。
——周鴻祎 360公司創(chuàng)始人、董事長兼CEO,奇酷CEO和知名天使投資人
我對不確定性懷有敬畏之心,但科學(xué)技術(shù)的發(fā)展尤其是大數(shù)據(jù)時(shí)代的來臨以及數(shù)據(jù)加工技術(shù)的進(jìn)步,使人類行為可預(yù)測成為可能。我想,20年后,我們是不是會(huì)利用數(shù)據(jù)也就是預(yù)測的方法,去框定一個(gè)人的行為,或者說,我們的世界會(huì)因?yàn)轭A(yù)測技術(shù)改變到什么程度?讀完這本《大數(shù)據(jù)預(yù)測》,基本就能找到答案了。
——羅振宇 得到App創(chuàng)始人 未來,大數(shù)據(jù)會(huì)變得越來越重要,其核心應(yīng)用預(yù)測也會(huì)成為互聯(lián)網(wǎng)行業(yè)以及產(chǎn)業(yè)變革的重要力量,我們很有必要對數(shù)據(jù)預(yù)測及其分析方法進(jìn)行且深入的了解。在這一點(diǎn)上,《大數(shù)據(jù)預(yù)測》是本很好的讀物,適合大數(shù)據(jù)所有相關(guān)行業(yè)的人閱讀。
——周鴻祎 360公司創(chuàng)始人、董事長兼CEO,奇酷CEO和知名天使投資人
我對不確定性懷有敬畏之心,但科學(xué)技術(shù)的發(fā)展尤其是大數(shù)據(jù)時(shí)代的來臨以及數(shù)據(jù)加工技術(shù)的進(jìn)步,使人類行為可預(yù)測成為可能。我想,20年后,我們是不是會(huì)利用數(shù)據(jù)也就是預(yù)測的方法,去框定一個(gè)人的行為,或者說,我們的世界會(huì)因?yàn)轭A(yù)測技術(shù)改變到什么程度?讀完這本《大數(shù)據(jù)預(yù)測》,基本就能找到答案了。
——羅振宇 得到App創(chuàng)始人
關(guān)于大數(shù)據(jù)的《魔鬼經(jīng)濟(jì)學(xué)》 。
——斯坦•克雷辛格 Advertising.com創(chuàng)始執(zhí)行人
本書是21世紀(jì)生活的使用說明手冊。利用大數(shù)據(jù)進(jìn)行預(yù)測幾乎成為所有領(lǐng)域的關(guān)機(jī)鍵,不管是科技、商業(yè)、財(cái)經(jīng)、運(yùn)動(dòng),還是政治。而埃里克•西格爾正是我們理想的向?qū)А?/p>
——斯蒂芬•貝克 《數(shù)字迷宮與終極風(fēng)險(xiǎn)》作者
本書有趣、有益、細(xì)膩入微,西格爾進(jìn)行了深入探究,并讓科學(xué)變得激動(dòng)人心。
——雷伊德•加尼 奧巴馬2012年美國大選團(tuán)隊(duì)首席數(shù)據(jù)科學(xué)家
商業(yè)、政界以及醫(yī)療衛(wèi)生領(lǐng)域的《點(diǎn)球成金》。
——吉姆•斯特恩 eMetrics Summit創(chuàng)始人,Digital Analytics Association主席
包裝精美,內(nèi)容豐富,值得購買。
正版圖書 ,包裝不錯(cuò) , 整體感覺不錯(cuò) ,
大數(shù)據(jù)大數(shù)據(jù)
好書收藏待看
今后發(fā)展趨勢
院長推薦的書,專業(yè)