R數(shù)據(jù)分析——方法與案例詳解(雙色)》是一本R 語(yǔ)言和數(shù)據(jù)分析的入門(mén)教材,循序漸進(jìn)、深入淺出,每個(gè)知識(shí)點(diǎn)盡量從實(shí)際的應(yīng)用案例出發(fā),以問(wèn)題為導(dǎo)向,在解決問(wèn)題中學(xué)習(xí)統(tǒng)計(jì)方法、R 語(yǔ)言的基本使用以及編程技巧。
R數(shù)據(jù)分析——方法與案例詳解(雙色)》內(nèi)容涵蓋R 數(shù)據(jù)結(jié)構(gòu)、函數(shù)與優(yōu)化、抽樣模擬、統(tǒng)計(jì)分析、假設(shè)檢驗(yàn)、回歸分析、統(tǒng)計(jì)繪圖和R 包制作等內(nèi)容。
R數(shù)據(jù)分析——方法與案例詳解(雙色)》的定位是為業(yè)界數(shù)據(jù)分析人員、經(jīng)濟(jì)管理類、醫(yī)學(xué)的學(xué)生提供方法和程序上的參考,在寫(xiě)作過(guò)程中盡量刪去比較理論的數(shù)學(xué)原理,這樣能夠幫助讀者輕松上手學(xué)習(xí)。
1.濃縮十年R統(tǒng)計(jì)分析、數(shù)據(jù)分析與R包開(kāi)發(fā)經(jīng)驗(yàn)。
2.統(tǒng)計(jì)分析理論與實(shí)踐并重,知道怎么用,更懂其來(lái)龍去脈。
3.通俗易懂,注釋一目了然,插圖清新,雙色閱讀好體驗(yàn)。
方匡南
廈門(mén)大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系副教授、博士生導(dǎo)師、美國(guó)耶魯大學(xué)博士后。主要研究大數(shù)據(jù)與數(shù)據(jù)挖掘、計(jì)量經(jīng)濟(jì)學(xué)等。主持過(guò)多項(xiàng)國(guó)家自然科學(xué)基金、國(guó)家社會(huì)科學(xué)基金以及企業(yè)橫向課題。精通R語(yǔ)言并編寫(xiě)過(guò)多個(gè)R軟件包。
朱建平
廈門(mén)大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系教授、博士生導(dǎo)師、教育部新世紀(jì)人才、國(guó)家社科基金重大項(xiàng)目首席專家,福建省哲學(xué)社會(huì)科學(xué)領(lǐng)軍人才。現(xiàn)任廈門(mén)大學(xué)數(shù)據(jù)挖掘研究中心主任,中國(guó)統(tǒng)計(jì)學(xué)會(huì)副會(huì)長(zhǎng)、國(guó)務(wù)院學(xué)位辦統(tǒng)計(jì)專業(yè)學(xué)位研究生教育指導(dǎo)委員會(huì)委員、教育部高等學(xué)校統(tǒng)計(jì)學(xué)類專業(yè)教學(xué)指導(dǎo)委員會(huì)秘書(shū)長(zhǎng)。
姜葉飛方匡南
廈門(mén)大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系副教授、博士生導(dǎo)師、美國(guó)耶魯大學(xué)博士后。主要研究大數(shù)據(jù)與數(shù)據(jù)挖掘、計(jì)量經(jīng)濟(jì)學(xué)等。主持過(guò)多項(xiàng)國(guó)家自然科學(xué)基金、國(guó)家社會(huì)科學(xué)基金以及企業(yè)橫向課題。精通R語(yǔ)言并編寫(xiě)過(guò)多個(gè)R軟件包。
朱建平
廈門(mén)大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系教授、博士生導(dǎo)師、教育部新世紀(jì)人才、國(guó)家社科基金重大項(xiàng)目首席專家,福建省哲學(xué)社會(huì)科學(xué)領(lǐng)軍人才。現(xiàn)任廈門(mén)大學(xué)數(shù)據(jù)挖掘研究中心主任,中國(guó)統(tǒng)計(jì)學(xué)會(huì)副會(huì)長(zhǎng)、國(guó)務(wù)院學(xué)位辦統(tǒng)計(jì)專業(yè)學(xué)位研究生教育指導(dǎo)委員會(huì)委員、教育部高等學(xué)校統(tǒng)計(jì)學(xué)類專業(yè)教學(xué)指導(dǎo)委員會(huì)秘書(shū)長(zhǎng)。
姜葉飛
廈門(mén)大學(xué)統(tǒng)計(jì)學(xué)碩士,現(xiàn)任某軟件公司博學(xué)數(shù)據(jù)分析師。精通R語(yǔ)言、數(shù)據(jù)庫(kù)、統(tǒng)計(jì)圖形、數(shù)據(jù)挖掘等,具有多年移動(dòng)互聯(lián)網(wǎng)、金融數(shù)據(jù)分析等經(jīng)驗(yàn)。
第 1 章 初識(shí)R語(yǔ)言..................................... 1
1.1 什么是R語(yǔ)言........................................ 1
1.2 為什么用R語(yǔ)言.................................... 2
1.3 安裝R..................................................... 4
1.4 R擴(kuò)展包................................................. 4
1.4.1 R擴(kuò)展包的安裝與載入............ 5
1.4.2 R包的使用................................ 6
1.5 R編輯器................................................. 7
1.6 工作空間............................................. 11
第 2 章 數(shù)據(jù)結(jié)構(gòu)與基本運(yùn)算.................... 13
2.1 數(shù)據(jù)類型............................................. 13
2.2 數(shù)據(jù)對(duì)象............................................. 14
2.2.1 向量......................................... 15
2.2.2 矩陣......................................... 21
2.2.3 數(shù)組......................................... 31
2.2.4 因子......................................... 32
2.2.5 列表......................................... 33
2.2.6 數(shù)據(jù)框..................................... 34
2.3 習(xí)題..................................................... 36
第 3 章 函數(shù)與優(yōu)化.................................. 38
3.1 常用的R內(nèi)置函數(shù).............................. 38
3.2 條件控制語(yǔ)句..................................... 38
3.2.1 if/else語(yǔ)句............................... 38
3.2.2 ifelse 語(yǔ)句............................... 39
3.2.3 switch語(yǔ)句............................... 39
3.3 循環(huán)語(yǔ)句............................................. 40
3.3.1 for循環(huán).................................... 40
3.3.2 while循環(huán)................................ 40
3.3.3 repeat語(yǔ)句............................... 41
3.4 編寫(xiě)自己的函數(shù)................................. 41
3.4.1 函數(shù)名..................................... 42
3.4.2 關(guān)鍵詞function........................ 42
3.4.3 參數(shù)......................................... 42
3.4.4 函數(shù)體和函數(shù)返回值............ 44
3.5 程序調(diào)試............................................. 45
3.6 程序運(yùn)行時(shí)間與效率......................... 46
3.7 用R做優(yōu)化求解.................................. 47
3.7.1 一元函數(shù)優(yōu)化求解................ 48
3.7.2 多元函數(shù)優(yōu)化求解................ 48
3.7.3 約束條件下的優(yōu)化求解........ 50
3.8 習(xí)題..................................................... 52
第 4 章 隨機(jī)數(shù)與抽樣模擬........................ 54
4.1 一元隨機(jī)數(shù)的產(chǎn)生............................. 54
4.1.1 均勻分布隨機(jī)數(shù).................... 54
4.1.2 正態(tài)分布隨機(jī)數(shù).................... 56
4.1.3 指數(shù)分布隨機(jī)數(shù).................... 57
4.1.4 離散分布隨機(jī)數(shù)的生成........ 58
4.1.5 常見(jiàn)分布函數(shù)表.................... 59
4.2 多元隨機(jī)數(shù)的生成............................. 61
4.2.1 多元正態(tài)分布隨機(jī)數(shù)............ 61
4.2.2 多元正態(tài)分布密度函數(shù)、分位數(shù)與累積概率................ 63
4.2.3 多元t分布隨機(jī)數(shù)................... 64
4.3 隨機(jī)抽樣............................................. 65
4.3.1 放回與無(wú)放回抽樣................ 65
4.3.2 bootstrap重抽樣...................... 66
4.4 統(tǒng)計(jì)模擬............................................. 67
4.4.1 幾種常見(jiàn)的模擬方法............ 67
4.4.2 模擬函數(shù)的建立方法............ 70
4.5 習(xí)題..................................................... 73
第 5 章 數(shù)據(jù)讀寫(xiě)與預(yù)處理........................ 74
5.1 數(shù)據(jù)的讀入......................................... 74
5.1.1 直接輸入數(shù)據(jù)........................ 74
5.1.2 讀R包中的數(shù)據(jù)...................... 75
5.1.3 從外部文件讀入數(shù)據(jù)............ 75
5.2 寫(xiě)出數(shù)據(jù)............................................. 79
5.3 數(shù)據(jù)預(yù)處理......................................... 80
5.3.1 變量預(yù)處理............................ 81
5.3.2 變量重編碼............................ 82
5.3.3 變量重命名............................ 84
5.3.4 變量類型的轉(zhuǎn)換.................... 85
5.3.5 日期變量的變換.................... 86
5.4 缺失數(shù)據(jù)處理..................................... 87
5.4.1 缺失數(shù)據(jù)的識(shí)別.................... 87
5.4.2 缺失數(shù)據(jù)的探索與檢驗(yàn)........ 88
5.4.3 缺失數(shù)據(jù)的處理.................... 89
5.5 數(shù)據(jù)集的合并與拆分......................... 90
5.5.1 數(shù)據(jù)框的合并與拆分............ 90
5.5.2 數(shù)據(jù)集的合并........................ 92
5.5.3 數(shù)據(jù)集的抽取........................ 92
5.6 習(xí)題..................................................... 93
第 6 章 探索性數(shù)據(jù)分析........................... 94
6.1 主要分析工具..................................... 94
6.1.1 探索性數(shù)據(jù)分析的工具........ 94
6.1.2 數(shù)據(jù)的類型............................ 98
6.2 單變量數(shù)據(jù)分析................................. 99
6.2.1 分類型數(shù)據(jù)............................ 99
6.2.2 數(shù)值型數(shù)據(jù).......................... 101
6.2.3 離群值探索.......................... 106
6.3 雙變量數(shù)據(jù)分析............................... 109
6.3.1 分類數(shù)據(jù)對(duì)分類數(shù)據(jù).......... 109
6.3.2 分類數(shù)據(jù)對(duì)數(shù)值型數(shù)據(jù)...... 111
6.3.3 數(shù)值型數(shù)據(jù)對(duì)數(shù)值型數(shù)據(jù).... 112
6.4 多變量數(shù)據(jù)分析............................... 115
6.4.1 訪問(wèn)數(shù)據(jù)框數(shù)據(jù).................. 115
6.4.2 多變量數(shù)據(jù)的分析.............. 118
6.5 習(xí)題................................................... 124
第 7 章 參數(shù)假設(shè)檢驗(yàn)............................. 126
7.1 假設(shè)檢驗(yàn)的思想與步驟................... 126
7.1.1 假設(shè)檢驗(yàn)的基本思想.......... 126
7.1.2 假設(shè)檢驗(yàn)的基本步驟.......... 128
7.2 正態(tài)總體單樣本參數(shù)假設(shè)檢驗(yàn)....... 129
7.2.1 均值的檢驗(yàn).......................... 130
7.2.2 方差檢驗(yàn)............................... 132
7.3 正態(tài)總體雙樣本參數(shù)假設(shè)檢驗(yàn)....... 134
7.3.1 雙樣本方差的檢驗(yàn)(方差齊性檢驗(yàn)).............. 134
7.3.2 兩樣本均值檢驗(yàn).................. 135
7.4 比例假設(shè)檢驗(yàn)................................... 139
7.4.1 單樣本比例檢驗(yàn).................. 139
7.4.2 兩樣本比例檢驗(yàn).................. 141
7.5 習(xí)題................................................... 142
第 8 章 非參數(shù)假設(shè)檢驗(yàn)......................... 144
8.1 圖示法............................................... 144
8.2 卡方檢驗(yàn)........................................... 146
8.2.1 卡方分布(χ 2 distribution)...... 147
8.2.2 卡方擬合優(yōu)度檢驗(yàn).............. 148
8.2.3 卡方獨(dú)立性檢驗(yàn).................. 151
8.2.4 卡方兩樣本同質(zhì)性檢驗(yàn)...... 151
8.3 秩和檢驗(yàn)........................................... 152
8.3.1 秩的概念............................... 153
8.3.2 單樣本符號(hào)秩檢驗(yàn).............. 153
8.3.3 兩獨(dú)立秩和檢驗(yàn).................. 154
8.3.4 多個(gè)獨(dú)立樣本的秩和檢驗(yàn).... 155
8.3.5 多個(gè)相關(guān)樣本的秩和檢驗(yàn).... 158
8.4 K-S檢驗(yàn)............................................ 160
8.4.1 K-S單樣本總體分布驗(yàn)證.... 160
8.4.2 K-S兩獨(dú)立樣本同質(zhì)檢驗(yàn).... 160
8.5 常用正態(tài)性檢驗(yàn)............................... 162
8.5.1 偏度、峰度檢驗(yàn)法.............. 162
8.5.2 Shapiro-Wilk(W檢驗(yàn))..... 163
8.5.3 其他常用正態(tài)檢驗(yàn).............. 165
8.6 習(xí)題................................................... 167
第 9 章 方差分析.................................... 169
9.1 單因素方差分析............................... 170
9.2 雙因素方差分析............................... 174
9.2.1 不考慮交互作用的雙因素方差分析.......................... 174
9.2.2 考慮交互作用的雙因素分析....................................... 178
9.3 習(xí)題................................................... 183
第 10 章 線性回歸模型........................... 184
10.1 問(wèn)題提出......................................... 184
10.2 一元線性回歸................................. 185
10.2.1 一元線性回歸概述............ 186
10.2.2 一元線性回歸的參數(shù)估計(jì).... 188
10.2.3 一元線性回歸模型的檢驗(yàn).... 195
10.2.4 一元線性回歸的預(yù)測(cè)........ 197
10.2.5 一元線性回歸綜合案例.... 201
10.3 多元線性回歸分析......................... 205
10.3.1 多元線性回歸模型及假定.... 206
10.3.2 參數(shù)估計(jì)............................. 207
10.3.3 模型檢驗(yàn)............................. 209
10.3.4 預(yù)測(cè)..................................... 211
10.3.5 多元線性回歸綜合案例.... 213
10.4 習(xí)題................................................. 218
第 11 章 線性回歸模型的擴(kuò)展................ 220
11.1 多重共線性..................................... 220
11.1.1 問(wèn)題的提出........................ 220
11.1.2 多重共線性定義及后果..... 222
11.1.3 多重共線性檢驗(yàn)................ 222
11.1.4 多重共線性克服................ 225
11.2 異方差性......................................... 229
11.2.1 問(wèn)題的提出........................ 229
11.2.2 異方差性定義及后果........ 231
11.2.3 異方差性檢驗(yàn).................... 232
11.2.4 異方差性克服.................... 236
11.3 序列相關(guān)性..................................... 240
11.3.1 問(wèn)題的提出........................ 241
11.3.2 序列相關(guān)性定義及后果..... 243
11.3.3 序列相關(guān)性檢驗(yàn)................ 245
11.3.4 序列相關(guān)性克服................ 248
11.4 習(xí)題................................................. 251
第 12 章 非線性回歸分析....................... 254
12.1 問(wèn)題的提出..................................... 254
12.2 可線性化的非線性回歸................. 255
12.2.1 Cobb-Douglas生產(chǎn)函數(shù)..... 255
12.2.2 多項(xiàng)式方程模型................ 257
12.2.3 指數(shù)函數(shù)模型.................... 259
12.3 不可線性化的非線性回歸............. 260
12.3.1 非線性模型的參數(shù)估計(jì)與迭代算法......................... 262
12.3.2 初始值選取........................ 269
12.3.3 收斂性................................. 270
12.4 非線性回歸評(píng)價(jià)和假設(shè)檢驗(yàn)......... 271
12.4.1 可決系數(shù)............................. 271
12.4.2 參數(shù)顯著性的F 檢驗(yàn)....... 271
12.4.3 似然比檢驗(yàn)........................ 272
12.5 習(xí)題................................................. 274
第 13 章 二元選擇模型........................... 275
13.1 問(wèn)題的提出..................................... 276
13.2 線性概率(LP)模型原理............ 277
13.3 Probit模型原理................................ 279
13.4 Logit模型原理................................. 280
13.5 邊際效應(yīng)分析................................. 281
13.6 較大似然估計(jì)(MLE)................. 282
13.7 似然比檢驗(yàn)和擬合優(yōu)度................. 282
13.8 案例分析:經(jīng)濟(jì)學(xué)教學(xué)新方法的效果............................................. 284
13.9 擴(kuò)展案例:信用卡違約預(yù)測(cè)分析..... 289
13.9.1 描述性統(tǒng)計(jì)........................ 290
13.9.2 模型建立與參數(shù)估計(jì)........ 291
13.9.3 系數(shù)意義與邊際分析........ 295
13.9.4 擬合與預(yù)測(cè)........................ 296
13.9.5 結(jié)論與建議........................ 297
13.10 習(xí)題............................................... 297
第 14 章 多元選擇模型........................... 299
14.1 有序選擇模型................................. 299
14.1.1 問(wèn)題的提出:本科生申請(qǐng)研究生的影響因素........ 300
14.1.2 有序選擇模型.................... 300
14.1.3 案例分析:本科生申請(qǐng)研究生的影響因素......
該書(shū)深入淺出、通俗易懂、案例詳實(shí),從數(shù)據(jù)分析角度講解R在實(shí)際數(shù)據(jù)分析中的使用,是難得的一本R和數(shù)據(jù)分析入門(mén)的好書(shū)。
謝邦昌,教授,臺(tái)灣輔仁大學(xué)統(tǒng)計(jì)資訊系
該書(shū)的每一章以實(shí)際問(wèn)題啟發(fā)的方式引出統(tǒng)計(jì)方法,再介紹數(shù)據(jù)分析和R軟件的使用,輔以詳細(xì)、恰當(dāng)?shù)陌咐@樣讓枯燥乏味的數(shù)據(jù)分析和軟件課程變得生動(dòng)活潑,這是一本很好的數(shù)據(jù)分析入門(mén)教材,值得推薦。
馬雙鴿,副教授,美國(guó)耶魯大學(xué)生物統(tǒng)計(jì)系
方老師在R領(lǐng)域著墨多年,今將多年的教學(xué)及研究成果整理成冊(cè),對(duì)讀者而言乃是一大福音。 該書(shū)深入淺出、通俗易懂、案例詳實(shí),從數(shù)據(jù)分析角度講解R在實(shí)際數(shù)據(jù)分析中的使用,是難得的一本R和數(shù)據(jù)分析入門(mén)的好書(shū)。
謝邦昌,教授,臺(tái)灣輔仁大學(xué)統(tǒng)計(jì)資訊系
該書(shū)的每一章以實(shí)際問(wèn)題啟發(fā)的方式引出統(tǒng)計(jì)方法,再介紹數(shù)據(jù)分析和R軟件的使用,輔以詳細(xì)、恰當(dāng)?shù)陌咐@樣讓枯燥乏味的數(shù)據(jù)分析和軟件課程變得生動(dòng)活潑,這是一本很好的數(shù)據(jù)分析入門(mén)教材,值得推薦。
馬雙鴿,副教授,美國(guó)耶魯大學(xué)生物統(tǒng)計(jì)系
方老師在R領(lǐng)域著墨多年,今將多年的教學(xué)及研究成果整理成冊(cè),對(duì)讀者而言乃是一大福音。
本書(shū)淺顯易懂,理論與實(shí)務(wù)兼具,是非常實(shí)用的書(shū)籍!
李御璽,教授、系主任,臺(tái)灣銘傳大學(xué)計(jì)算機(jī)工程學(xué)系
我很喜歡這本書(shū)的編寫(xiě)體例,從問(wèn)題出發(fā),然后介紹方法和R語(yǔ)言的實(shí)現(xiàn),非常適合需要用R來(lái)解決實(shí)際分析問(wèn)題的讀者。
李艦,Mango Solutions,中國(guó)區(qū)數(shù)據(jù)總監(jiān)
包裝簡(jiǎn)單,而且書(shū)還破了一點(diǎn)!!!!
不錯(cuò)的書(shū) 買給朋友的家的孩子 努力學(xué)習(xí)中
物流很快,當(dāng)天下午就到了!
好
東西挺好
雙色內(nèi)容,容易查找,就是內(nèi)容太基本了
好
看著不錯(cuò),希望對(duì)自己有幫助
不錯(cuò)啊 還會(huì)來(lái)的!
還沒(méi)看,感覺(jué)不錯(cuò)
滿意
非常滿意的一次購(gòu)物。
換開(kāi)個(gè)發(fā)票這么難么?
不錯(cuò)的圖書(shū)
買貴了買貴了買貴了買貴了
很好
感覺(jué)還不錯(cuò)。
這次一下買了幾十本書(shū),當(dāng)當(dāng)服務(wù)很好,其中有一本破損了,很快過(guò)來(lái)?yè)Q,服務(wù)很好。
琪奶奶啊琪奶奶
非常好的書(shū),值得入手啊
正品,很好
很好的R語(yǔ)言書(shū),紙張不錯(cuò),物流服務(wù)也很快
對(duì)編程感興趣,慢慢看
紙張很好!
紙張很好!
包裝完好,物流很快!
雙色印刷是噱頭,沒(méi)有什么很有建樹(shù)的內(nèi)容,抄襲較多~
買了一大堆,來(lái)不及看,準(zhǔn)備休假了好好學(xué)習(xí)一下