全書以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1為工具,提供了醫療、金融、保險、汽車、快速消費品、市場研究、互聯網等多個行業的數據分析/挖掘案例,基于實戰需求,詳細講解整個案例的完整分析過程,并將模型和軟件的介紹融于案例講解之中,使讀者在閱讀時能突破方法和工具的局限,真正聚集于對數據分析精髓的領悟。本書所附光盤包括案例數據和分析程序/流文件,讀者可完整重現全部的分析內容。
本書適合從初學者到專家各個級別的數據分析人員閱讀,尤其適合于以下讀者群:需要提升實戰能力的數據分析專業人員;在市場營銷、金融、財務、人力資源管理中需要應用數據分析的人士;從事咨詢、科研等工作的專業人士;同時也適合于各專業的本科和研究生作為學習數據分析應用的參考書。
全書以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1為工具,提供了醫療、金融、保險、汽車、快速消費品、市場研究、互聯網等多個行業的數據分析/挖掘案例,基于實戰需求,詳細講解整個案例的完整分析過程,并將模型和軟件的介紹融于案例講解之中,使讀者在閱讀時能突破方法和工具的局限,真正聚集于對數據分析精髓的領悟。本書所附光盤包括案例數據和分析程序/流文件,讀者可完整重現全部的分析內容。
本書適合從初學者到專家各個級別的數據分析人員閱讀,尤其適合于以下讀者群:需要提升實戰能力的數據分析專業人員;在市場營銷、金融、財務、人力資源管理中需要應用數據分析的人士;從事咨詢、科研等工作的專業人士;同時也適合于各專業的本科和研究生作為學習數據分析應用的參考書。
張文彤 博士,數據挖掘、市場研究、統計軟件教學與應用領域專家,現任全球第八大市場研究集團INTAGE中國公司全國技術總監。曾在復旦大學任教數載,期間協助SPSS在中國建立并完善了其培訓體系,是國內知名的SPSS培訓師之一。在數據挖掘、市場研究、醫藥數據分析等領域均經驗豐富,曾負責為知名跨國公司完成了中國城市女性市場細分模型、銷量預測模型、商圈選址模型等各類項目,并協助完成多項IT、電信、稅務、銀行等行業的數據挖掘項目。
鐘云飛 博學數據分析專家,擁有超過10年的統計分析與數據挖掘在各行業的軟件應用及咨詢經驗,歷任SPSS、SAS軟件公司首席咨詢顧問,目前在國際商業機器(中國)有限公司軟件部工作,從事SPSS軟件企業應用的推廣工作。主要關注統計分析與數據挖掘在銀行、電信、政府、保險、零售等行業的應用實踐,致力于使用數據分析方法幫助企業和政府組織從數據中獲取有價值的信息,從而提高管理水平。
1.1 三種數據分析方法論 3
1.1.1 嚴格設計支持下的統計
方法論 3
1.1.2 半試驗研究支持下的統計
方法論 4
1.1.3 偏智能化、自動化分析的
數據挖掘應用方法論 5
1.2 CRISP-DM方法論介紹 6
1.2.1 概述 6
1.2.2 商業理解 8
1.2.3 數據理解 8
1.2.4 數據準備 9
1.2.5 建立模型 9
1.2.6 模型評價 9
1.2.7 結果部署 10
第2章 數據分析方法體系簡介 11
2.1 統計軟件中的數據存儲格式 11
2.1.1 二維數據表 11
2.1.2 變量的存儲類型 12
2.1.3 變量的測量尺度 12
2.2 數據的統計描述與參數估計 13
2.2.1 連續變量的統計描述 13
2.2.2 連續變量的參數估計 16
2.2.3 分類變量的統計描述和參數
估計 18
2.2.4 統計圖形體系 21
2.3 常用假設檢驗方法 24
2.3.1 假設檢驗的基本原理 25
2.3.2 單變量假設檢驗方法 26
2.3.3 雙變量假設檢驗方法 28
2.4 多變量模型 31
2.4.1 方差分析/一般線性模型 31
2.4.2 廣義線性模型和混合線性
模型 32
2.4.3 回歸模型 34
2.4.4 其他常見模型 36
2.5 多元統計分析模型 38
2.5.1 信息濃縮 38
2.5.2 變量間內在關聯結構的
探討 38
2.5.3 數據分類 39
2.5.4 分析元素間的關聯 41
2.6 智能統計分析/數據挖掘方法 42
2.6.1 樹模型 42
2.6.2 神經網絡 43
2.6.3 支持向量機 43
2.6.4 貝葉斯網絡 44
2.6.5 最近鄰元素分析 44
2.6.6 關聯規則與序列分析 44
第3章 IBM SPSS Statistics操作
入門 46
3.1 案例背景 46
3.2 數據文件的讀入與變量整理 47
3.2.1 SPSS的基本操作界面 47
3.2.2 數據準備 49
3.3 問卷數據分析 53
3.3.1 生成頻數表 53
3.3.2 計算均值 54
3.3.3 對多選題進行描述 55
3.4 項目總結和討論 56
第4章 IBM SPSS Statistics操作
進階 57
4.1 案例背景 57
4.1.1 項目背景 57
4.1.2 分析思路 59
4.2 問卷錄入 59
4.2.1 開放題的定義 59
4.2.2 單選題的定義 60
4.2.3 多選題的定義 60
4.3 問卷質量校驗 62
4.3.1 去除重復記錄 62
4.3.2 發現異常值 64
4.3.3 邏輯校驗 65
4.4 問卷數據分析 67
4.4.1 問卷加權 67
4.4.2 業務分析 70
4.5 項目總結和討論 71
第5章 IBM SPSS Modeler操作入門 73
5.1 IBM SPSS Modeler概述 73
5.1.1 IBM SPSS Modeler的界面 73
5.1.2 IBM SPSS Modeler的架構
與產品構成 76
5.2 IBM SPSS Modeler相關操作
與技巧 77
5.2.1 IBM SPSS Modeler的基本
操作 77
5.2.2 IBM SPSS Modeler中的
表達式 79
5.2.3 IBM SPSS Modeler的若干
使用技巧 79
5.3 IBM SPSS Modeler功能介紹 81
5.3.1 數據整理案例 81
5.3.2 探索性數據分析案例 82
5.3.3 建立模型、模型檢驗與模型
應用案例 83
5.4 案例分析:藥物選擇決策支持 86
5.4.1 背景介紹 86
5.4.2 數據說明 86
5.4.3 商業理解 87
5.4.4 數據理解 87
5.4.5 數據準備 88
5.4.6 模型建立和評估 89
5.4.7 模型 91
5.5 如何進一步學習IBM SPSS
Modeler 93
第二部分 影響因素發現與數值預測
第6章 酸奶飲料新產品口味測試
研究案例 97
6.1 案例背景 97
6.1.1 研究項目概況 97
6.1.2 分析思路與商業理解 98
6.2 數據理解 98
6.2.1 研究設計框架復查 98
6.2.2 均值的列表描述 99
6.2.3 均值的圖形描述 101
6.3 不同品牌的評分差異分析 102
6.3.1 單因素方差分析模型簡介 103
6.3.2 品牌作用的總體檢驗 104
6.3.3 組間兩兩比較 105
6.3.4 方差齊性檢驗 108
6.4 兩因素方差分析模型分析 108
6.4.1 兩因素方差分析模型簡介 109
6.4.2 擬合包括交互項的飽
和模型 110
6.4.3 擬合只包含主效應的模型 111
6.4.4 組間兩兩比較 112
6.4.5 隨機因素分析 114
6.5 分析結論與討論 116
6.5.1 分析結論 116
6.5.2 Benchmark:用還是不用 116
第7章 偏態分布的激素水平影響
因素分析 118
7.1 案例背景 118
7.1.1 研究項目概況 118
7.1.2 分析思路與商業理解 119
7.2 數據理解 119
7.2.1 單變量描述 119
7.2.2 變量關聯探索 122
7.3 對因變量變換后的建模分析 127
7.3.1 常見的變量變換方法 127
7.3.2 本案例的具體操作 128
7.4 秩變換分析 131
7.5 利用Cox模型進行分析 132
7.5.1 Cox回歸模型的基本原理 133
7.5.2 本案例的具體操作 134
7.6 項目總結與討論 136
7.6.1 分析結論 136
7.6.2 如何正確選擇分析模型 136
第8章 某車企汽車年銷量預測案例 138
8.1 案例背景 138
8.1.1 研究項目概況 138
8.1.2 分析思路和商業理解 139
8.2 數據理解 140
8.3 變量變換后的線性回歸 142
8.3.1 線性回歸模型簡介 142
8.3.2 變量變換后擬合線性回歸
模型 143
8.3.3 模型擬合效果的判斷 146
8.3.4 存儲預測值和區間估計值 148
8.4 曲線擬合 148
8.4.1 用曲線估計過程同時擬合
多個曲線模型 149
8.4.2 模型擬合效果的判斷 151
8.4.3 模型的預測 153
8.5 利用非線性回歸進行擬合 154
8.5.1 模型簡介 154
8.5.2 構建分段回歸模型 155
8.5.3 不同模型效果的比較 157
8.6 項目總結與討論 158
8.6.1 分析結論 158
8.6.2 行走在理想與現實之間 158
第9章 腦外傷急救后遲發性顱腦損傷
影響因素分析案例 160
9.1 案例背景 160
9.1.1 研究項目概況 160
9.1.2 分析思路和商業理解 161
9.2 數據理解 161
9.2.1 變量關聯的圖表描述 161
9.2.2 變量關聯的單變量檢驗 164
9.3 構建二分類Logistic回歸模型 167
9.3.1 模型簡介 167
9.3.2 初步嘗試建模 169
9.3.3 構建最終模型 174
9.4 利用樹模型發現交互項 175
9.4.1 模型簡介 176
9.4.2 進行樹模型分析 178
9.5 使用廣義線性過程進行分析 181
9.5.1 模型簡介 181
9.5.2 構建僅包括主效應的模型 182
9.5.3 在模型中加入交互項 185
9.6 項目總結與討論 186
9.6.1 分析結論 186
9.6.2 尺有所短,寸有所長 187
第10章 中國消費者信心指數影響
因素分析 188
10.1 案例背景 188
10.1.1 項目背景 188
10.1.2 項目問卷 189
10.1.3 分析思路和商業理解 192
10.2 數據理解 193
10.2.1 考察時間、地域對信心
指數的影響 193
10.2.2 考察性別、職業、婚姻狀況
等對信心指數的影響 195
10.2.3 考察年齡對信心指數的
影響 196
10.3 標準GLM框架下的建模分析 197
10.3.1 建立總模型 197
10.3.2 兩兩比較的結果 200
10.4 多元方差分析模型的結果 202
10.4.1 模型簡介 202
10.4.2 擬合多元方差分析模型 203
10.5 尺度回歸 209
10.5.1 方法簡介 210
10.5.2 利用尺度回歸進行
分析 211
10.6 多水平模型框架下的建模分析 214
10.6.1 模型簡介 215
10.6.2 針對時間擬合多水平模型 216
10.7 項目總結與討論 221
10.7.1 分析結論 221
10.7.2 什么時候運用復雜模型
來建模 222
第三部分 信息濃縮、分類與感知圖呈現
第11章 探討消費者購買保健品的
動機 225
11.1 案例背景 225
11.1.1 研究項目概況 225
11.1.2 分析思路和商業理解 227
11.2 數據理解 227
11.2.1 單變量描述 227
11.2.2 變量關聯探索 228
11.3 利用因子分析進行信息濃縮 229
11.3.1 模型簡介 229
11.3.2 因子分析的具體操作 231
11.4 基于因子分析結果進行市場細分 238
11.4.1 不同婚姻狀況受訪者的
差異 238
11.4.2 不同品牌保健品使用者的
因子偏好差異 240
11.5 項目總結與討論 241
11.5.1 研究結論 241
11.5.2 合理解讀因子分析的結果 242
第12章 1988年漢城奧運會男子十項
全能成績分析 244
12.1 案例背景 244
12.1.1 項目概況 244
12.1.2 分析思路和商業理解 245
12.2 數據理解 246
12.2.1 單變量描述 246
12.2.2 變量關聯性探索 246
12.2.3 嘗試初步建模 247
12.3 利用因子分析進行信息濃縮 249
12.3.1 初步分析 249
12.3.2 因子旋轉 252
12.3.3 繼續尋找更好的分析結果 253
12.3.4 結果存儲與 254
12.4 主成分回歸 255
12.5 將主成分回歸方程還原回原始
變量的形式 257
12.6 項目總結與討論 257
12.6.1 研究結論 257
12.6.2 正確詮釋因子的方差解釋
比例 258
第13章 打敗SARS 259
13.1 案例背景 259
13.1.1 研究項目概況 259
13.1.2 分析思路和商業理解 262
13.2 數據理解與數據準備 263
13.2.1 消費者關注的信息 263
13.2.2 突發事件保險產品購買
傾向 265
13.2.3 未來消費者生活方式的
變化 267
13.3 “非典”信息關注傾向的多維偏好
分析 269
13.3.1 模型簡介 269
13.3.2 多維偏好分析的SPSS
操作 270
13.3.3 嘗試初步建模 272
13.3.4 引入更多的背景變量 275
13.4 突發事件險種購買傾向的多重
對應分析 278
13.4.1 模型簡介 278
13.4.2 簡單對應分析 280
13.4.3 多重對應分析 284
13.5 “非典”對未來生活方式的影響 289
13.5.1 采用多維偏好分析進行
初步探索 289
13.5.2 換用因子分析進行信息
匯總 291
13.6 項目總結與討論 295
13.6.1 研究結論 295
13.6.2 對多維偏好分析等信息濃縮
方法本質的討論 297
第14章 住院費用影響因素挖掘 299
14.1 案例背景 299
14.1.1 項目概況 299
14.1.2 分析思路/商業理解 302
14.2 數據理解與數據準備 303
14.2.1 費用數據分布 303
14.2.2 變量合并 305
14.2.3 極端值清理 306
14.2.4 病種分布考察 306
14.2.5 變量變換 307
14.3 采用聚類分析尋找費用類型 308
14.3.1 用因子分析匯總信息 308
14.3.2 聚類分析方法簡介 310
14.3.3 對費用數據進行聚類分析 312
14.4 住院費用影響因素的神經網絡
分析 315
14.4.1 模型簡介 316
14.4.2 初步嘗試用神經網絡建模 318
14.4.3 對年齡離散化后重新建模 323
14.4.4 構建雙因變量神經網絡 325
14.4.5 進一步尋找更清晰的結果
解釋 327
14.5 不同療法療效與費用比較的神經
網絡分析 328
14.5.1 生成工作用數據集 329
14.5.2 進行神經網絡的建模預測 330
14.5.3 模型預測值的比較 332
14.6 項目總結與討論 334
14.6.1 研究結論 334
14.6.2 數據挖掘方法和經典方法的
取舍 335
第四部分 數據挖掘案例精選
第15章 淘寶大賣家之營銷數據
分析 339
15.1 案例背景 339
15.1.1 賣家張三 339
15.1.2 分析思路和商業理解 340
15.2 利用RFM模型定位促銷名單 341
15.2.1 RFM模型簡介 341
15.2.2 對數據進行RFM模型
分析 343
15.3 尋找有重購行為買家的特征 348
15.3.1 數據理解與數據準備 348
15.3.2 利用直銷模塊尋找重購
人群的特征 354
15.4 總結與討論 356
15.4.1 可使用的其他營銷分析
方法 356
15.4.2 研究總結 357
第16章 超市商品購買關聯分析 358
16.1 案例背景 358
16.1.1 研究背景 358
16.1.2 分析思路和商業理解 358
16.2 數據準備 359
16.3 商品購買關聯分析 362
1
印刷有缺頁現象,從50頁直接到了67頁,其他的都還好,內容詳細,但不適合入門級學員,看這本書最好有一定SPSS基礎和數理統計知識
很好,不過需要一定基礎才讀的懂,而且唯一不足是書中比較喜歡讓人參考前面某章某節,很不方便
果然為SPSS高級教程,內容非常好,總共買了8本相關專業書,這本是我見過最好的一本!初學者不建議買這本,可以買張文彤編寫的初級教程。中級以上水平者可以參考。
不錯~一直在當當買書,比其他的電商感覺要好。書的包裝都很新,還沒有看很期待迅速掌握它。
例子蠻有意思的,就是實際導到電腦里操作還需要好好研究研究。
張老師的前一版書用了覺得特別好,現在把新版的基礎,高級,數據分析三本都備齊了,潛心學習中。
數據分析與挖掘實戰案例精粹,發貨速度很快,及時讓我遇到的困難得到解決,非常感謝
好好好好好好好好好好好好好好好好32個贊
書很詳細,作者在這方面很有經驗,閱讀后能學到不少東西,有些關鍵點作者都指出來了,讀后有共鳴!
應該還不錯同學買的,我問他問題他就在這本書上查完了教我
很實用,介紹得簡要清楚,范例實用性強,正好是我需要的。很實用,介紹得簡要清楚,范例實用性強,正好是我需要的。很實用,介紹得簡要清楚,范例實用性強,正好是我需要的。
幾天前買的,今天剛開始看,但是這個黃黃的東西是什么啊染了五六頁紙...
挺好的,看了些,前面是spss兩款軟件的基本操作介紹,后面是例子
數據分析與挖掘實戰案例精粹中案例精辟,不僅能學會spss的操作,也會學會統計分析的經典模型。
細細讀真的可以學到很多,作者通過每個案例細細分析每個參數的含義,如何將數學語言聯系到實際分析案例討論中。讓我這個菜鳥中新手都想著手做分析論文了。
適合有數據分析底子的人學習 一開始學習的不建議
肯定是全5分的。張文彤老師編的書,還是一如既往的好。50塊錢買這么一本厚的書,值了。更關鍵的是,書里面傳遞出來的現實事例背后的統計分析思維,這個最重要。倘若看本書時能結合張老師在人大經濟論壇上的培訓視頻(初級和中高級),那更是受益匪淺。強烈推薦本書。
IBM SPSS數據分析與挖掘實戰案例精粹(配光盤)不錯的
整體感覺真的很不錯~頭一天晚上下的訂單,第二天中午就送到了,特別方便便捷~書肯定是正版的了,質量就不用說什么了,值得信賴!!!小票和發票都有,很正規,而且價格比其他網站上的要便宜,因此性價比很高,何樂而不為呢~!!!
市面上SPSS的書很多,還在猶豫買不買的時候,看到張文彤老師的大名就立刻下單了。推薦的三個理由:第一,張老師在SPSS高級統計方面的確很有見地;第二,目前市面上在新版本界面的著作不多;最后,書中很多實例,既幫助操作,又加深理解。
一直想找一本案例多的操作書,無疑這些書比較讓人滿意,數據分析與工具操作還不錯。值得好好學習一下,按圖操作具體案例。可以收藏學習使用。
首先作者的名字讓我選擇了這本書,但也是這個選擇讓我不能理解大家的思想。這本書偏向于見建模,是站在一個已經掌握了SPSS基本知識,方法的基礎上編輯的專業書。有很強計算機基礎、并且向解決生活中一些數據分析的人建議購買。初學者不建議購買。
習第二部分影10響因素發現與數值預測第章酸奶飲K料新產品口M味10測試研究案例案例背景數據理解不同品牌的評分差異IBM SPSS數據分析與挖掘實戰案例精粹(配光盤)推薦語 業內資深專家十余年實戰經驗總結,從上千個真