Stata是公認的應用廣泛的專業數據分析軟件之一,因其功能豐富、效率高、操作簡便,深受廣大用戶,尤其受在校師生的青睞。 本書為《Stata統計分析與行業應用案例詳解》的升級版本(Stata 14.0),沿用版(Stata 12.0)的寫作風格,采用先講解Stata的各個操作功能再通過綜合案例講述Stata在各個行業中實際應用的思路編寫。本書內容共分為兩個部分:第1部分是第1~16章,按照統計類型講述Stata的具體應用;第2部分是第17~23章,分行業講述了Stata的具體應用。各章均附有與正文部分對應的上機操作練習題,目的是著重培養讀者的動手能力,使讀者在實際練習的過程中能夠快速提高應用水平。 本書面向具備一定統計學基礎和計算機操作基礎的在校各專業學生,以及企事業單位的相關數據統計分析人員。
解讀Stata在統計分析中的行業應用(適用范圍為Stata 12.0到14.0)57 個基礎案例及 7 個大型行業應用案例詳解Stata統計分析方法、思路和分析流程61 個上機練習讓讀者學練結合,快速掌握Stata統計分析方法
張甜,行業資料專家,已出版多部作品,受到讀者歡迎。
目 錄
第1章 Stata 14.0的基本窗口及管理變量與數據 1
1.1 Stata 14.0窗口說明 1
1.2 Stata 14.0數據文件的創建與讀取 2
1.2.1 Stata 14.0數據文件的創建 2
1.2.2 Stata 14.0數據文件的讀取 3
1.3 創建和替代變量 4
1.3.1 創建和替代變量概述 4
1.3.2 相關數據來源 4
1.3.3 Stata分析過程 4
1.3.4 結果分析 5
1.3.5 案例延伸 6
1.4 分類變量和定序變量的基本操作 7
1.4.1 分類變量和定序變量概述 7
1.4.2 相關數據來源 7
1.4.3 Stata分析過程 8
1.4.4 結果分析 9
1.4.5 案例延伸 9
1.5 數據的基本操作 10
1.5.1 數據的基本操作概述 10
1.5.2 相關數據來源 10
1.5.3 Stata分析過程 11
1.5.4 結果分析 12
1.5.5 案例延伸 14
1.6 定義數據的子集 14
1.6.1 定義數據的子集概述 14
1.6.2 相關數據來源 15
1.6.3 Stata分析過程 15
1.6.4 結果分析 16
1.6.5 案例延伸 17
1.7 本章習題 17
第2章 Stata圖形繪制 20
2.1 實例一——直方圖 20
2.1.1 直方圖的功能與意義 20
2.1.2 相關數據來源 20
2.1.3 Stata分析過程 21
2.1.4 結果分析 21
2.1.5 案例延伸 22
2.2 實例二——散點圖 24
2.2.1 散點圖的功能與意義 24
2.2.2 相關數據來源 24
2.2.3 Stata分析過程 24
2.2.4 結果分析 25
2.2.5 案例延伸 25
2.3 實例三——曲線標繪圖 27
2.3.1 曲線標繪圖的功能與意義 27
2.3.2 相關數據來源 27
2.3.3 Stata分析過程 28
2.3.4 結果分析 28
2.3.5 案例延伸 29
2.4 實例四——連線標繪圖 31
2.4.1 連線標繪圖的功能與意義 31
2.4.2 相關數據來源 31
2.4.3 Stata分析過程 31
2.4.4 結果分析 32
2.4.5 案例延伸 33
2.5 實例五——箱圖 34
2.5.1 箱圖的功能與意義 34
2.5.2 相關數據來源 34
2.5.3 Stata分析過程 35
2.5.4 結果分析 35
2.5.5 案例延伸 36
2.6 實例六——餅圖 37
2.6.1 餅圖的功能與意義 37
2.6.2 相關數據來源 37
2.6.3 Stata分析過程 37
2.6.4 結果分析 38
2.6.5 案例延伸 38
2.7 實例七——條形圖 39
2.7.1 條形圖的功能與意義 39
2.7.2 相關數據來源 40
2.7.3 Stata分析過程 40
2.7.4 結果分析 41
2.7.5 案例延伸 41
2.8 實例八——點圖 42
2.8.1 點圖的功能與意義 42
2.8.2 相關數據來源 42
2.8.3 Stata分析過程 43
2.8.4 結果分析 43
2.8.5 案例延伸 44
2.9 本章習題 45
第3章 Stata描述統計 48
3.1 實例一——定距變量的描述性統計 48
3.1.1 定距變量的描述性統計功能與意義 48
3.1.2 相關數據來源 48
3.1.3 Stata分析過程 49
3.1.4 結果分析 49
3.1.5 案例延伸 50
3.2 實例二——正態性檢驗和數據轉換 53
3.2.1 正態性檢驗和數據轉換功能與意義 53
3.2.2 相關數據來源 53
3.2.3 Stata分析過程 53
3.2.4 結果分析 54
3.2.5 案例延伸 55
3.3 實例三——單個分類變量的匯總 57
3.3.1 單個分類變量的匯總功能與意義 57
3.3.2 相關數據來源 57
3.3.3 Stata分析過程 57
3.3.4 結果分析 58
3.3.5 案例延伸 58
3.4 實例四——兩個分類變量的列聯表分析 59
3.4.1 兩個分類變量的列聯表分析功能與意義 59
3.4.2 相關數據來源 59
3.4.3 Stata分析過程 59
3.4.4 結果分析 60
3.4.5 案例延伸 61
3.5 實例五——多表和多維列聯表分析 61
3.5.1 多表和多維列聯表分析功能與意義 61
3.5.2 相關數據來源 62
3.5.3 Stata分析過程 62
3.5.4 結果分析 63
3.5.5 案例延伸 65
3.6 本章習題 65
第4章 Stata參數檢驗 68
4.1 實例一——單一樣本T檢驗 68
4.1.1 單一樣本T檢驗的功能與意義 68
4.1.2 相關數據來源 68
4.1.3 Stata分析過程 69
4.1.4 結果分析 69
4.1.5 案例延伸 70
4.2 實例二——獨立樣本T檢驗 70
4.2.1 獨立樣本T檢驗的功能與意義 70
4.2.2 相關數據來源 71
4.2.3 Stata分析過程 71
4.2.4 結果分析 72
4.2.5 案例延伸 72
4.3 實例三——配對樣本T檢驗 73
4.3.1 配對樣本T檢驗的功能與意義 73
4.3.2 相關數據來源 74
4.3.3 Stata分析過程 74
4.3.4 結果分析 75
4.3.5 案例延伸 75
4.4 實例四——單一樣本方差的假設檢驗 76
4.4.1 單一樣本方差假設檢驗的功能與意義 76
4.4.2 相關數據來源 76
4.4.3 Stata分析過程 76
4.4.4 結果分析 77
4.4.5 案例延伸 77
4.5 實例五——雙樣本方差的假設檢驗 78
4.5.1 雙樣本方差假設檢驗的功能與意義 78
4.5.2 相關數據來源 78
4.5.3 Stata分析過程 79
4.5.4 結果分析 79
4.5.5 案例延伸 80
4.6 本章習題 80
第5章 Stata非參數檢驗 83
5.1 實例一——單樣本正態分布檢驗 83
5.1.1 單樣本正態分布檢驗的功能與意義 83
5.1.2 相關數據來源 83
5.1.3 Stata分析過程 84
5.1.4 結果分析 84
5.1.5 案例延伸 85
5.2 實例二——兩獨立樣本檢驗 85
5.2.1 兩獨立樣本檢驗的功能與意義 85
5.2.2 相關數據來源 86
5.2.3 Stata分析過程 86
5.2.4 結果分析 87
5.2.5 案例延伸 87
5.3 實例三——兩相關樣本檢驗 88
5.3.1 兩相關樣本檢驗的功能與意義 88
5.3.2 相關數據來源 88
5.3.3 Stata分析過程 88
5.3.4 結果分析 89
5.3.5 案例延伸 90
5.4 實例四——多獨立樣本檢驗 90
5.4.1 多獨立樣本檢驗的功能與意義 90
5.4.2 相關數據來源 91
5.4.3 Stata分析過程 91
5.4.4 結果分析 92
5.4.5 案例延伸 92
5.5 實例五——游程檢驗 92
5.5.1 游程檢驗的功能與意義 92
5.5.2 相關數據來源 93
5.5.3 Stata分析過程 93
5.5.4 結果分析 94
5.5.5 案例延伸 94
5.6 本章習題 95
第6章 Stata方差分析 97
6.1 實例一——單因素方差分析 97
6.1.1 單因素方差分析的功能與意義 97
6.1.2 相關數據來源 97
6.1.3 Stata分析過程 98
6.1.4 結果分析 98
6.1.5 案例延伸 99
6.2 實例二——多因素方差分析 100
6.2.1 多因素方差分析的功能與意義 100
6.2.2 相關數據來源 100
6.2.3 Stata分析過程 100
6.2.4 結果分析 101
6.2.5 案例延伸 103
6.3 實例三——協方差分析 103
6.3.1 協方差分析的功能與意義 103
6.3.2 相關數據來源 104
6.3.3 Stata分析過程 104
6.3.4 結果分析 105
6.3.5 案例延伸 107
6.4 實例四——重復測量方差分析 108
6.4.1 重復測量方差分析的功能與意義 108
6.4.2 相關數據來源 108
6.4.3 Stata分析過程 109
6.4.4 結果分析 110
6.4.5 案例延伸 110
6.5 本章習題 111
第7章 Stata相關分析 113
7.1 實例一——簡單相關分析 113
7.1.1 簡單相關分析的功能與意義 113
7.1.2 相關數據來源 113
7.1.3 Stata分析過程 114
7.1.4 結果分析 114
7.1.5 案例延伸 115
7.2 實例二——偏相關分析 117
7.2.1 偏相關分析的功能與意義 117
7.2.2 相關數據來源 117
7.2.3 Stata分析過程 117
7.2.4 結果分析 118
7.2.5 案例延伸 119
7.3 本章習題 119
第8章 Stata主成分分析與因子分析 121
8.1 實例一——主成分分析 121
8.1.1 主成分分析的功能與意義 121
8.1.2 相關數據來源 121
8.1.3 Stata分析過程 122
8.1.4 結果分析 123
8.1.5 案例延伸 125
8.2 實例二——因子分析 127
8.2.1 因子分析的功能與意義 127
8.2.2 相關數據來源 127
8.2.3 Stata分析過程 127
8.2.4 結果分析 130
8.2.5 案例延伸 149
8.3 本章習題 151
第9章 Stata聚類分析 152
9.1 實例一——劃分聚類分析 152
9.1.1 劃分聚類分析的功能與意義 152
9.1.2 相關數據來源 152
9.1.3 Stata分析過程 153
9.1.4 結果分析 154
9.1.5 案例延伸 161
9.2 實例二——層次聚類分析 164
9.2.1 層次聚類分析的功能與意義 164
9.2.2 相關數據來源 164
9.2.3 Stata分析過程 164
9.2.4 結果分析 168
9.2.5 案例延伸 178
9.3 本章習題 186
第10章 Stata最小二乘線性回歸分析 187
10.1 實例一——簡單線性回歸分析 187
10.1.1 簡單線性回歸分析的功能與意義 187
10.1.2 相關數據來源 187
10.1.3 Stata分析過程 188
10.1.4 結果分析 188
10.1.5 案例延伸 192
10.2 實例二——多重線性回歸分析 194
10.2.1 多重線性回歸分析的功能與意義 194
10.2.2 相關數據來源 194
10.2.3 Stata分析過程 195
10.2.4 結果分析 196
10.2.5 案例延伸 200
10.3 本章習題 202
第11章 Stata回歸診斷與應對 204
11.1 實例一——異方差檢驗與應對 204
11.1.1 異方差檢驗與應對的功能與意義 204
11.1.2 相關數據來源 204
11.1.3 Stata分析過程 205
11.1.4 結果分析 206
11.1.5 案例延伸 214
11.2 實例二——自相關檢驗與應對 217
11.2.1 自相關檢驗與應對的功能與意義 217
11.2.2 相關數據來源 218
11.2.3 Stata分析過程 218
11.2.4 結果分析 220
11.2.5 案例延伸 226
11.3 實例三——多重共線性檢驗與應對 227
11.3.1 多重共線性檢驗與應對的功能與意義 227
11.3.2 相關數據來源 228
11.3.3 Stata分析過程 228
11.3.4 結果分析 229
11.3.5 案例延伸 233
11.4 本章習題 235
第12章 Stata非線性回歸分析 237
12.1 實例一——非參數回歸分析 237
12.1.1 非參數回歸分析的功能與意義 237
12.1.2 相關數據來源 237
12.1.3 Stata分析過程 238
12.1.4 結果分析 239
12.1.5 案例延伸 242
12.2 實例二——轉換變量回歸分析 244
12.2.1 轉換變量回歸分析的功能與意義 244
12.2.2 相關數據來源 244
12.2.3 Stata分析過程 245
12.2.4 結果分析 246
12.2.5 案例延伸 251
12.3 實例三——非線性回歸分析 251
12.3.1 非線性回歸分析的功能與意義 251
12.3.2 相關數據來源 251
12.3.3 Stata分析過程 252
12.3.4 結果分析 253
12.3.5 案例延伸 257
12.4 本章習題 259
第13章 Stata Logistic回歸分析 261
13.1 實例一——二元Logistic回歸分析 261
13.1.1 二元logistic回歸分析的功能與意義 261
13.1.2 相關數據來源 261
13.1.3 Stata分析過程 262
13.1.4 結果分析 263
13.1.5 案例延伸 268
13.2 實例二——多元Logistic回歸分析 270
13.2.1 多元Logistic回歸分析的功能與意義 270
13.2.2 相關數據來源 270
13.2.3 Stata分析過程 271
13.2.4 結果分析 272
13.2.5 案例延伸 274
13
第1章 Stata 14.0的基本窗口及管理變量與數據Stata是一種功能的統計軟件包,是目前歐美最為流行的計量軟件之一。它具有容易操作、運行速度快、功能強大的特點。Stata不僅包括一整套預先編排好的分析與數據功能,同時還允許軟件使用者根據自己的需要來創建程序,從而添加更多的功能。該軟件自從被引入我國后,迅速得到了廣大學者的認可與厚愛,適用范圍越來越廣泛。Stata 14.0是目前Stata的近期版本。本章將初步介紹Stata 14.0的基本窗口、變量管理與數據管理。1.1 Stata 14.0窗口說明在正確安裝好Stata 14.0以后,單擊Stata主程序的圖標文件,即可打開Stata的主界面,如圖1.1所示。 圖1.1 Stata 14.0主界面與大部分的程序窗口類似,Stata 14.0也有自己的菜單欄、工具欄,但其特色在于主界面中的5個區域:Review、Variables、Command、Results、Properties。? Review(歷史窗口)顯示的是自本次啟動Stata 14.0以來執行過的所有命令。? Variables(變量窗口)顯示的是當前Stata數據文件中的所有變量。? Command(命令窗口)是最重要的窗口,在本窗口內可輸入準備執行的命令。? Results(結果窗口)顯示的是每次執行Stata命令后的執行結果,無論成功還是失敗。? Properties(性質窗口)顯示的是當前數據文件中制定變量以及數據的性質。各個窗口的大小都可以調節,讀者可以用鼠標進行伸縮操作,使其符合自己的風格。1.2 Stata 14.0數據文件的創建與讀取1.2.1 Stata 14.0數據文件的創建 下載資源:\video\chap01\… 下載資源:\sample\chap01\正文\案例1.1.dta[例1.1]表1.1記錄的是我國2000-2009年上市公司數量的數據。試創建Stata格式的數據文件并保存。表1.1 我國2000-2009年的上市公司數量年份 上交所 深交所2000 572 5162001 646 5142002 715 5092003 780 5072004 837 5402005 834 5472006 842 5922007 860 6902008 864 7612009 870 848操作過程如下: 進入Stata 14.0,打開主程序,彈出如圖1.2所示的主界面。 選擇“Data”|“Data Editor”|“Data Editor(Edit)”命令,彈出如圖1.3所示的“Data Editor(Edit)”對話框。 圖1.2 主界面 圖1.3 “Data Editor”對話框 在“Data Editor(Edit)”對話框左上角的單元格中輸入我們的第1個數據“2000”,系統即自動創建“var1”變量,如圖1.4所示。 單擊右下方“Properties”(性質窗口)中的“Variables”,“Variables”中的變量特征(包括名稱、類型、長度等)即可進入可編輯狀態,如圖1.5所示。 圖1.4 “Data Editor”對話框 圖1.5 編輯變量特征 我們對變量名稱進行必要的修改,因為第1個變量是年份,所以把“var1”修改為“year”,其他采取系統默認設置,修改完成后在左側數據輸入區域單擊,即可彈出如圖1.6所示的對話框。 逐一數據錄入,其他兩個變量參照年份進行設置,并分別將其定義為“shangjiao”和“shenjiao”,數據錄入完畢后如圖1.7所示。 圖1.6 修改“Name”變量 圖1.7 錄入數據 關閉“Data Editor(Edit)”對話框,在主界面的工具欄里面單擊 按鈕進行數據保存。1.2.2 Stata 14.0數據文件的讀取讀取以前創建的Stata格式的數據文件比較簡單,有3種方式:? 直接雙擊該文件,即可打開數據。? 在主界面的菜單欄里面選擇“File”|“Open”命令,找到文件后打開即可。? 在主界面的“Command”(命令窗口)中,輸入命令:use filename(文件的名稱)。1.3 創建和替代變量1.3.1 創建和替代變量概述前面已經介紹了創建、修改數據文件和變量的通用方式,但在有些情況下,我們需要利用現有的變量生成一個新的變量,那么如何快捷方便地實現這種操作呢?Stata 14.0提供了generate以及replace命令以供我們選擇使用,其中generate命令是利用現有變量生成一個新的變量,并保留原來的變量不變;而replace命令則是利用現有變量生成一個新的變量替換原來的變量。下面我們就用實例的方式來講解一下這兩個重要命令的應用。1.3.2 相關數據來源 下載資源:\video\chap01\… 下載資源:\sample\chap01\正文\案例1.2.dta[例1.2]我國2009年各地區的就業人口以及工資總額數據如表1.2所示。請使用Stata命令進行操作:(1)試生成新的變量來描述各地區的平均工資情況;(2)試生成平均工資變量來替代原有的工資總額變量;(3)對生成的平均工資變量數據均做除以10的處理;(4)對就業人口變量進行對數平滑處理,從而產生新的變量。