如今,很多企業(yè)被淹沒在數(shù)據(jù)洪流之中,數(shù)據(jù)并沒有給它們帶來太多好處。企業(yè)數(shù)字化競爭力的提升也并沒有像在公司戰(zhàn)略會議上渲染“大數(shù)據(jù)”這一概念時所描述的那樣快。其實,在大多數(shù)應(yīng)用領(lǐng)域,數(shù)據(jù)量的多寡并不是衡量數(shù)據(jù)價值創(chuàng)造力的決定性標(biāo)準(zhǔn)。本書描繪了一條走出“大數(shù)據(jù)帶來的失望”的更智慧的路線,適用于那些已經(jīng)意識到“起決定作用的不是數(shù)據(jù)量,而是正確地整合數(shù)據(jù),物盡其用”的企業(yè)。這一路線被稱為“智能數(shù)據(jù)”。
智能數(shù)據(jù)的出發(fā)點是:“在不增加技術(shù)、人員和資金投入的情況下,我們?nèi)绾胃咝У乩每蛻魯?shù)據(jù)信息?”其本身就是一種切實可行的方法論。從這個方法論出發(fā),我們可以得出一套不斷迭代更新的、在逐步摸索中的、基于假設(shè)的行為方式。智能數(shù)據(jù)的理念是,在你所在的行業(yè)內(nèi)成為數(shù)字智能化非常高的企業(yè),在面對直接的數(shù)字化競爭時,借助數(shù)據(jù)分析,能夠一步步地打造自身的競爭優(yōu)勢。
一般來說,導(dǎo)致數(shù)字變革宣告破產(chǎn)的,并非是技術(shù)力量的匱乏,而是源于企業(yè)內(nèi)部的對抗、過于刻板的組織構(gòu)架和失誤的變革期管理。本書介紹了企業(yè)如何通過改革自身的管理、企業(yè)文化以及組織構(gòu)架以成為智能數(shù)據(jù)時代的佼佼者。在大數(shù)據(jù)時代,少即是多——只要是對的,那么更少的數(shù)據(jù)將更有成效。今天的企業(yè)需要提高“數(shù)字素養(yǎng)”。 如今,很多企業(yè)被淹沒在數(shù)據(jù)洪流之中,數(shù)據(jù)并沒有給它們帶來太多好處。企業(yè)數(shù)字化競爭力的提升也并沒有像在公司戰(zhàn)略會議上渲染“大數(shù)據(jù)”這一概念時所描述的那樣快。其實,在大多數(shù)應(yīng)用領(lǐng)域,數(shù)據(jù)量的多寡并不是衡量數(shù)據(jù)價值創(chuàng)造力的決定性標(biāo)準(zhǔn)。本書描繪了一條走出“大數(shù)據(jù)帶來的失望”的更智慧的路線,適用于那些已經(jīng)意識到“起決定作用的不是數(shù)據(jù)量,而是正確地整合數(shù)據(jù),物盡其用”的企業(yè)。這一路線被稱為“智能數(shù)據(jù)”。
智能數(shù)據(jù)的出發(fā)點是:“在不增加技術(shù)、人員和資金投入的情況下,我們?nèi)绾胃咝У乩每蛻魯?shù)據(jù)信息?”其本身就是一種切實可行的方法論。從這個方法論出發(fā),我們可以得出一套不斷迭代更新的、在逐步摸索中的、基于假設(shè)的行為方式。智能數(shù)據(jù)的理念是,在你所在的行業(yè)內(nèi)成為數(shù)字智能化非常高的企業(yè),在面對直接的數(shù)字化競爭時,借助數(shù)據(jù)分析,能夠一步步地打造自身的競爭優(yōu)勢。
一般來說,導(dǎo)致數(shù)字變革宣告破產(chǎn)的,并非是技術(shù)力量的匱乏,而是源于企業(yè)內(nèi)部的對抗、過于刻板的組織構(gòu)架和失誤的變革期管理。本書介紹了企業(yè)如何通過改革自身的管理、企業(yè)文化以及組織構(gòu)架以成為智能數(shù)據(jù)時代的佼佼者。在大數(shù)據(jù)時代,少即是多——只要是對的,那么更少的數(shù)據(jù)將更有成效。今天的企業(yè)需要提高“數(shù)字素養(yǎng)”。
面對巨量數(shù)據(jù),還能找到寶石和金子嗎?
如果谷歌即將踏足你的市場,該怎么辦?
成本高昂的IT工具真的能夠解決問題嗎?
羅蘭貝格專家?guī)阃黄拼髷?shù)據(jù)的價值瓶頸!
比約恩 布勞卿(Björn Bloching),羅蘭貝格管理咨詢公司的高級合伙人、數(shù)字化部門全球主管,羅蘭貝格數(shù)字中樞創(chuàng)建者,經(jīng)驗豐富的營銷專家,領(lǐng)導(dǎo)著該咨詢公司的國際市場與銷售技術(shù)中心。 拉斯 拉克(Lars Luck),麥德龍集團首席組合戰(zhàn)略專家,此前曾任羅蘭貝格管理咨詢公司合伙人,領(lǐng)導(dǎo)“銷售和有針對性營銷”實踐小組。 托馬斯 拉姆什(Thomas Ramge),德國著名財經(jīng)雜志《brand eins》記者,報道領(lǐng)域涵蓋技術(shù)、IT及營銷領(lǐng)域。《經(jīng)濟學(xué)人》特約編輯。著作頗豐,曾獲得德國《金融時報》頒發(fā)的卓著商業(yè)圖書獎。
引言 以少博多的智能數(shù)據(jù)使用者
規(guī)模并不重要 // 001
成為行業(yè)“智者” // 004
智能數(shù)據(jù)理念梗概 // 005
新“數(shù)據(jù)合同” // 007
及時部分從大數(shù)據(jù)向智能數(shù)據(jù)轉(zhuǎn)變
第1 章深陷數(shù)據(jù)過載的愁云慘霧
流感預(yù)測器也鬧“流感” // 013
技術(shù)成熟度曲線(Hype-Cycling) // 019
沒有“大爆炸”的大數(shù)據(jù) // 022
以守為攻戰(zhàn)術(shù) // 027
第2 章數(shù)字化海嘯—不關(guān)注數(shù)據(jù)也行不通
沿價值鏈產(chǎn)生分化 // 033
機智,聯(lián)合,進攻 // 036 引 言 以少博多的智能數(shù)據(jù)使用者
規(guī)模并不重要 // 001
成為行業(yè)“智者” // 004
智能數(shù)據(jù)理念梗概 // 005
新“數(shù)據(jù)合同” // 007
及時部分 從大數(shù)據(jù)向智能數(shù)據(jù)轉(zhuǎn)變
第1 章 深陷數(shù)據(jù)過載的愁云慘霧
流感預(yù)測器也鬧“流感” // 013
技術(shù)成熟度曲線(Hype-Cycling) // 019
沒有“大爆炸”的大數(shù)據(jù) // 022
以守為攻戰(zhàn)術(shù) // 027
第2 章 數(shù)字化海嘯—不關(guān)注數(shù)據(jù)也行不通
沿價值鏈產(chǎn)生分化 // 033
機智,聯(lián)合,進攻 // 036
到處都土崩瓦解! // 041
投資者眼光 // 057
第3 章 智能數(shù)據(jù)冠軍—選擇正確的數(shù)據(jù)是成功的基礎(chǔ)
聰明的數(shù)據(jù)使用者 // 063
找對數(shù)據(jù)比擁有超多數(shù)據(jù)更有用 // 066
“3W”:為什么?如何做?做什么? // 069
概率擊敗偶然 // 075
第二部分 智能數(shù)據(jù)的循環(huán)
第4 章 五步流程實現(xiàn)增值
提出正確的問題 // 081
使用正確的數(shù)據(jù) // 090
客戶需求理解 // 095
提出自己獨特的銷售主張 // 111
正確地吸引客戶 // 114
結(jié)論:實現(xiàn)增值 // 122
第三部分 冠軍企業(yè)的智能數(shù)據(jù)應(yīng)用領(lǐng)域
第5 章 更加智慧地接近客戶—在合適的時間、
以合理的價格、提供所需的產(chǎn)品
時尚策劃 // 127
策劃式配件 // 129
哈,這個賣家是真正了解我的! // 133
貿(mào)易方面的分析小知識 // 137
在價格發(fā)現(xiàn)過程中,好貨也得便宜 // 140
物理網(wǎng)點銷售打敗網(wǎng)絡(luò)化銷售 // 142
第6 章 從貿(mào)易伙伴轉(zhuǎn)變?yōu)閿?shù)據(jù)伙伴—通過中介共同提高
客戶潛力
一切對抗一切? // 147
協(xié)同型客戶關(guān)系管理 // 150
瑞士法典 // 156
假名的力量 // 158
雙重選擇性加入?是的! // 163
第7 章 智能優(yōu)化選址、產(chǎn)品線和產(chǎn)品
“錯誤的旗桿” // 167
在正確的地點采用正確的銷售模式 // 171
實時優(yōu)化產(chǎn)品線 // 176
第8 章 多渠道到底是什么意思—為客戶和企業(yè)提供好
的“客戶旅程”
多渠道發(fā)展—內(nèi)外有別 // 187
彈球機而不是保齡球 // 190
每人一個蘋果賬戶! // 193
客戶旅程中的渠道斷點 // 198
在線產(chǎn)品展示廳 // 202
第四部分 企業(yè)的智能化之路
第9 章 能夠接受錯誤才是正確的經(jīng)營態(tài)度
彈道式思維 // 211
用不斷嘗試打敗加農(nóng)炮理論 // 215
無計劃時代的企業(yè)管理 // 217
孔子說…… // 224
數(shù)據(jù)大狂歡 // 227
第10 章 使組織更加靈活—選擇正確的組織構(gòu)架、流程
和技術(shù)
可以自由選擇工作崗位嗎? // 229
智能數(shù)據(jù)的折中路線 // 232
數(shù)字化變革中的“四步走” // 233
迭代增量,小步快跑! // 243
第11 章 智能化地引進人才和開展培訓(xùn)—正確選擇員工
戰(zhàn)略規(guī)劃官 // 246
數(shù)據(jù)科學(xué)家 // 247
項目經(jīng)理 // 251
變革管理經(jīng)理 // 252
第五部分 贏得數(shù)據(jù)
第12 章 選擇客戶真正需要的數(shù)字化戰(zhàn)略
公眾眾口鑠金 // 257
隱私精神分裂癥 // 259
透明的“數(shù)據(jù)章魚”? // 262
贏得數(shù)據(jù) // 265
后NSA時代的人 // 271
全新模式 // 273
客戶細(xì)分黑盒子
客戶細(xì)分的目的是,基于現(xiàn)有數(shù)據(jù)的特征,將客戶識別為盡可能同質(zhì)的,或是盡可能彼此異質(zhì)的群組(簇)。在將相似的要素進行分組或在發(fā)現(xiàn)數(shù)據(jù)中潛藏的模式方面,存在著不同的操作方法,這些方法源自機器學(xué)習(xí)領(lǐng)域“無監(jiān)督學(xué)習(xí)”范疇。最重要的幾個分類操作方法如下:
1. 分層聚類分析
這種操作方法是基于前期已經(jīng)識別出來的數(shù)據(jù)特征(例如通過識別市場上同質(zhì)化群組的社會人口統(tǒng)計學(xué)特征、使用行為和觀念)測算出被觀察者(個人或公司)之間的差異,并據(jù)此建立矩陣。這個矩陣也分為許多行,同數(shù)據(jù)庫中被觀察者的分類占比保持一致。被觀察者之間的差異涵蓋了所有已識別的數(shù)據(jù)特征,并且可以通過不同的方法計算出來。在分層聚合的過程中,一對兒被觀察者在一個循環(huán)流程中被反復(fù)概括比對,就連最小的差異也會被發(fā)現(xiàn)。這個流程會一直不停地循環(huán)重復(fù),直到所有的被觀察者都被納入某一個簇中。這個積聚的過程可以通過多種不同的算法實現(xiàn)。比較常見的算法包括單聯(lián)聚類法(即SL聚類,又稱鄰近算法)和凝聚層次聚類(沃德法)。根據(jù)算法之間不同的聚合邏輯,會產(chǎn)生不同的聚合結(jié)果。采用單聯(lián)聚類法可以識別出一些較小的邊緣群體,若采用凝聚層次聚類法,那么簇的規(guī)模一般會比較均衡。
分層分析方法的優(yōu)點是,不需要事先就知道簇數(shù),而是借助于統(tǒng)計學(xué)參數(shù)預(yù)估出理想的簇數(shù),從統(tǒng)計學(xué)的角度出發(fā),理想簇數(shù)的確定需要考慮到組內(nèi)同質(zhì)和組間異質(zhì)之間的平衡問題。分層分析方法的缺點是,計算量非常大,且只適用于小規(guī)模的數(shù)據(jù)量。很多時候,分層分析方法被用于分析通過社會調(diào)查形式獲得的數(shù)據(jù)。分層分析流程也適用于從大數(shù)據(jù)中進行隨機抽樣,目的是獲得穩(wěn)定的分類并且確定簇的數(shù)量。后續(xù),數(shù)據(jù)科學(xué)家會采取分區(qū)操作,將聚合結(jié)果擴展到整個數(shù)據(jù)庫。
2. 劃分聚類分析
在分層聚類分析過程中,不需要事先就確定簇的數(shù)量,這對模式探索型的聚合分析流程來說是一大優(yōu)點。然而,在劃分聚類分析中,必須要預(yù)先就確定好簇的數(shù)量。總體來看,劃分聚類分析的各種方法間存在共性,都是根據(jù)預(yù)先確定好的簇的數(shù)量選擇出相應(yīng)數(shù)量的對象,將每個對象的初始值作為單一簇的平均值或者中心點,然后反復(fù)調(diào)整聚類劃分,直到誤差函數(shù)最小化為止。其中,最著名且應(yīng)用最廣泛的誤差函數(shù)是K均值(K-Means)算法:先根據(jù)既定的簇數(shù)隨機選擇出相應(yīng)數(shù)量的對象,將這些對象的初始值作為每個簇的平均值,對剩余的每個對象,根據(jù)其與初始均值之間的差異程度,將其歸入相應(yīng)的簇。然后再重新計算每個簇的誤差函數(shù)平均值。這個過程不斷重復(fù),直到每個簇中各對象的差異不顯著(或者說誤差最小化)。劃分聚類分析中還有一種算法是K中位數(shù)(K-Medians)或者模糊C均值(Fuzzy C-Means)。K均值的較大好處是,它尤其適合大規(guī)模的數(shù)據(jù)分析,因為它在算法方面不像分層聚類分析那么復(fù)雜。但是K均值算法的問題在于對異常值的敏感度過大,偶爾會導(dǎo)致十分小的聚類被劃分出來。 客戶細(xì)分黑盒子
客戶細(xì)分的目的是,基于現(xiàn)有數(shù)據(jù)的特征,將客戶識別為盡可能同質(zhì)的,或是盡可能彼此異質(zhì)的群組(簇)。在將相似的要素進行分組或在發(fā)現(xiàn)數(shù)據(jù)中潛藏的模式方面,存在著不同的操作方法,這些方法源自機器學(xué)習(xí)領(lǐng)域“無監(jiān)督學(xué)習(xí)”范疇。最重要的幾個分類操作方法如下:
1. 分層聚類分析
這種操作方法是基于前期已經(jīng)識別出來的數(shù)據(jù)特征(例如通過識別市場上同質(zhì)化群組的社會人口統(tǒng)計學(xué)特征、使用行為和觀念)測算出被觀察者(個人或公司)之間的差異,并據(jù)此建立矩陣。這個矩陣也分為許多行,同數(shù)據(jù)庫中被觀察者的分類占比保持一致。被觀察者之間的差異涵蓋了所有已識別的數(shù)據(jù)特征,并且可以通過不同的方法計算出來。在分層聚合的過程中,一對兒被觀察者在一個循環(huán)流程中被反復(fù)概括比對,就連最小的差異也會被發(fā)現(xiàn)。這個流程會一直不停地循環(huán)重復(fù),直到所有的被觀察者都被納入某一個簇中。這個積聚的過程可以通過多種不同的算法實現(xiàn)。比較常見的算法包括單聯(lián)聚類法(即SL聚類,又稱鄰近算法)和凝聚層次聚類(沃德法)。根據(jù)算法之間不同的聚合邏輯,會產(chǎn)生不同的聚合結(jié)果。采用單聯(lián)聚類法可以識別出一些較小的邊緣群體,若采用凝聚層次聚類法,那么簇的規(guī)模一般會比較均衡。
分層分析方法的優(yōu)點是,不需要事先就知道簇數(shù),而是借助于統(tǒng)計學(xué)參數(shù)預(yù)估出理想的簇數(shù),從統(tǒng)計學(xué)的角度出發(fā),理想簇數(shù)的確定需要考慮到組內(nèi)同質(zhì)和組間異質(zhì)之間的平衡問題。分層分析方法的缺點是,計算量非常大,且只適用于小規(guī)模的數(shù)據(jù)量。很多時候,分層分析方法被用于分析通過社會調(diào)查形式獲得的數(shù)據(jù)。分層分析流程也適用于從大數(shù)據(jù)中進行隨機抽樣,目的是獲得穩(wěn)定的分類并且確定簇的數(shù)量。后續(xù),數(shù)據(jù)科學(xué)家會采取分區(qū)操作,將聚合結(jié)果擴展到整個數(shù)據(jù)庫。
2. 劃分聚類分析
在分層聚類分析過程中,不需要事先就確定簇的數(shù)量,這對模式探索型的聚合分析流程來說是一大優(yōu)點。然而,在劃分聚類分析中,必須要預(yù)先就確定好簇的數(shù)量。總體來看,劃分聚類分析的各種方法間存在共性,都是根據(jù)預(yù)先確定好的簇的數(shù)量選擇出相應(yīng)數(shù)量的對象,將每個對象的初始值作為單一簇的平均值或者中心點,然后反復(fù)調(diào)整聚類劃分,直到誤差函數(shù)最小化為止。其中,最著名且應(yīng)用最廣泛的誤差函數(shù)是K均值(K-Means)算法:先根據(jù)既定的簇數(shù)隨機選擇出相應(yīng)數(shù)量的對象,將這些對象的初始值作為每個簇的平均值,對剩余的每個對象,根據(jù)其與初始均值之間的差異程度,將其歸入相應(yīng)的簇。然后再重新計算每個簇的誤差函數(shù)平均值。這個過程不斷重復(fù),直到每個簇中各對象的差異不顯著(或者說誤差最小化)。劃分聚類分析中還有一種算法是K中位數(shù)(K-Medians)或者模糊C均值(Fuzzy C-Means)。K均值的較大好處是,它尤其適合大規(guī)模的數(shù)據(jù)分析,因為它在算法方面不像分層聚類分析那么復(fù)雜。但是K均值算法的問題在于對異常值的敏感度過大,偶爾會導(dǎo)致十分小的聚類被劃分出來。
另外,該算法是基于隨機選取的初始值,因此在反復(fù)調(diào)整過程中,劃分結(jié)果不是很穩(wěn)定。此外,結(jié)果缺乏可再現(xiàn)性也是缺點之一。分層聚類分析可以補償劃分聚類分析的缺陷,因此可以將分層聚類分析中產(chǎn)生出的聚合分類結(jié)果作為K均值分析方法的簇數(shù)起點值。
3. 密度聚類分析
密度聚類分析背后的邏輯是,將被觀察者視為一個空間內(nèi)的點,盡管這些觀察者之間存在很多差異化特征。首先我們要識別出這個空間內(nèi)的高密度區(qū)和低密度區(qū),并以此為基礎(chǔ)建立起簇。這種分析方法的核心流程就是所謂的“具有噪聲的基于密度的聚類方法”(Density-Based Spatial Clustering of Applications with Noise,簡稱DBSCAN)。根據(jù)這個空間內(nèi)點之間的距離,我們會識別出密度較高的區(qū)域,并將這個高密區(qū)內(nèi)的點作為核心點。還有一些點處于中等密度區(qū)域,我們將這些點稱為邊界點,被歸至周邊的簇。還有一些點,分布非常稀疏,我們將這些點稱為噪聲點。DBSCAN分析方法的優(yōu)點之一,是不需要提前就確定簇的數(shù)量,這與分層聚類分析法有異曲同工之妙。與K均值分析法相比,DBSCAN方法具有一個關(guān)鍵優(yōu)勢,即可以識別非線性聚類,并可以有效對抗異常值。但是當(dāng)空間簇的密度不均勻、間距差相差很大時,DBSCAN聚類質(zhì)量較差。DBSCAN是相對比較新的聚類分析方法(1996 年才被提出),目前已經(jīng)發(fā)展成為機器學(xué)習(xí)領(lǐng)域最重要的算法之一。
4. 模糊聚類分析
目前既存的系統(tǒng)化聚類分析流程都是將一個因素明確地歸入某一個簇中,這是所謂的“硬流程”。模糊聚類分析屬于“軟流程”,即某一個因素可以被歸入一個以上的簇,換句話說,就是在識別聚類從屬性的不同等級。模糊聚類分析中最有名的算法是模糊C均值(FCM)。首先假定每一個被觀察對象都能夠或者傾向于被歸入一個簇,那么處于簇中心位置的被觀察者歸入這個簇的可能性高一些,處于簇邊緣的被觀察者納入這個簇的可能性相對低一些,或者說簇邊緣的被觀察者也有可能被納入其他簇。
從技術(shù)層面上看,模糊聚類分析的邏輯與K均值算法類似。模糊聚類分析這一設(shè)想的目的是,實現(xiàn)一個被觀察對象被歸入不止一個簇中,這在某些特定的應(yīng)用案例中更具現(xiàn)實價值。如果市場和客戶細(xì)分部門希望獲得明確的聚類結(jié)果(例如要去評估某一聚類集合的市場潛力),在對客戶針對不同商品種類的消費行為和購買決策進行統(tǒng)計分析時,多維的聚類可能更有意義。例如,為了精準(zhǔn)定位并營銷旅行社潛在客戶,我們可以利用模糊聚類分析方法,通過分析交易數(shù)據(jù)信息,從而去識別客戶的旅行類型。此時,有些客戶或被歸入多個特征組,例如海灘度假組、城市游組等,這可以幫助我們?yōu)榭蛻籼峁┒鄻踊倪x擇。