數(shù)據(jù)管理是介于原始數(shù)據(jù)收集和統(tǒng)計(jì)分析之間的一項(xiàng)重要工作,其包含了數(shù)據(jù)分析中那些挑戰(zhàn)性的方面。《Stata環(huán)境下的數(shù)據(jù)管理實(shí)務(wù)手冊》從Stata入手,展示了Stata在管理數(shù)據(jù)工作中的作用,而非僅僅是其在統(tǒng)計(jì)上的優(yōu)勢。
一本非常實(shí)用的社會統(tǒng)計(jì)軟件Stata數(shù)據(jù)管理的指導(dǎo)書!
有效提升大數(shù)據(jù)時代的數(shù)據(jù)管理能力和處理能力!
社會科學(xué)工作者、數(shù)據(jù)工作者的數(shù)據(jù)管理參考書!
手把手逐步演示數(shù)據(jù)管理的流程,易上手,易操作,突出實(shí)務(wù)!
國際Stata出版社授權(quán),中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心翻譯,、經(jīng)得起檢驗(yàn)的數(shù)據(jù)管理實(shí)務(wù)手冊。
一本生動可讀的數(shù)據(jù)管理書。作者就像是一個坐在對面娓娓道來的講故事的人,將數(shù)據(jù)管理的流程和步驟一一展現(xiàn),讓我們重新認(rèn)識到Stata在數(shù)據(jù)管理方面的迷人魅力。大數(shù)據(jù)時代,讓數(shù)據(jù)為我所用,易用,樂用,是這本書的一個出發(fā)點(diǎn)。
該書的翻譯也是可圈可點(diǎn)的,,流暢,譯者唐麗娜不虧是科班出身并長期致力于社會統(tǒng)計(jì)的專家,她在社會數(shù)據(jù)的管理與統(tǒng)計(jì)方面的專業(yè)經(jīng)驗(yàn),以及在CGSS(中國綜合社會調(diào)查)項(xiàng)目中豐富的實(shí)操經(jīng)驗(yàn),也極大保障了這本書的翻譯質(zhì)量。
邁克爾 N 米歇爾(Michael N. Mitchell),是一位醫(yī)療衛(wèi)生服務(wù)領(lǐng)域的高級統(tǒng)計(jì)師。12年來,他一直在加州大學(xué)洛杉磯分校學(xué)術(shù)技術(shù)服務(wù)部門的統(tǒng)計(jì)咨詢組工作。所著書籍有A Visual Guide to Stata Graphics,Interpreting and Visualizing Regression Models Using Stata,Stata for the Behavioral Sciences等。
唐麗娜,社會學(xué)博士,就職于中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心。研究領(lǐng)域?yàn)樽诮躺鐣W(xué)、社會調(diào)查方法與技術(shù)、社會科學(xué)數(shù)據(jù)管理及數(shù)據(jù)可視化、數(shù)據(jù)庫建設(shè)。
及時章 入門介紹
1.1 本書的使用
1.2 本書的概要
1.3 本書使用的案例
第二章 讀取和錄入數(shù)據(jù)
2.1 簡 介
2.2 讀入Stata數(shù)據(jù)
2.3 保存Stata數(shù)據(jù)
2.4 讀取逗號或制表符作分隔符的文件
2.5 讀取空格作分隔符的文件
2.6 讀取固定格式文件
2.7 讀取一條觀測值包含多行原始數(shù)據(jù)的固定格式的文件
2.8 讀取SAS XPORT文件
2.9 讀取數(shù)據(jù)時的常見錯誤
2.10 在Stata數(shù)據(jù)編輯器中直接輸入數(shù)據(jù)
2.11 保存逗號或制表符作分隔符的文件
2.12 保存空格作分隔符的文件
2.13 保存SAS XPORT文件
第三章 數(shù)據(jù)清理
3.1 簡 介
3.2 數(shù)據(jù)的雙錄
3.3 單個變量檢查
3.4 用分類變量檢查分類變量
3.5 用連續(xù)變量檢查分類變量
3.6 用連續(xù)變量檢查連續(xù)變量
3.7 修正數(shù)據(jù)中的錯誤
3.8 識別重復(fù)錄入
3.9 關(guān)于數(shù)據(jù)清理的總結(jié)性思考
第四章 給數(shù)據(jù)加標(biāo)簽
4.1 簡 介
4.2 描述數(shù)據(jù)
4.3 給變量加標(biāo)簽 4.4 給取值加標(biāo)簽
4.5 標(biāo)簽的作用
4.6 用不同的語言給變量和取值加標(biāo)簽
4.7 給數(shù)據(jù)添加注釋
4.8 格式化變量的顯示
4.9 改變數(shù)據(jù)中的變量順序
第五章 創(chuàng)建變量
5.1 簡 介
5.2 創(chuàng)建和修改變量
5.3 數(shù)值表達(dá)式和函數(shù)
5.4 字符表達(dá)式和函數(shù)
5.5 重新編碼
5.6 給缺失值編碼
5.7 虛擬變量
5.8 日期變量
5.9 日期-時間變量
5.10 變量間的計(jì)算
5.11 個案間的計(jì)算
5.12 更多的使用egen命令的例子
5.13 把字符型變量轉(zhuǎn)換成數(shù)值型變量
5.14 把數(shù)值型變量轉(zhuǎn)換成字符型變量
5.15 變量重命名和變量排序
第六章 合并數(shù)據(jù)
6.1 簡 介
6.2 添加數(shù)據(jù)
6.3 添加數(shù)據(jù)時存在的問題
6.4 一對一匹配合并數(shù)據(jù)
6.5 一對多匹配合并數(shù)據(jù)
6.6 合并多個數(shù)據(jù)
6.7 更新合并
6.8 合并數(shù)據(jù)時的其他選項(xiàng)
6.9 合并數(shù)據(jù)時的問題
6.10 連接數(shù)據(jù)
6.11 交叉合并數(shù)據(jù)
第七章 處理分組的觀測值
7.1 簡 介
7.2 為每個分組獲取獨(dú)立的結(jié)果
7.3 分組獨(dú)立計(jì)算數(shù)值
7.4 組內(nèi)計(jì)算:加下標(biāo)的觀測值
7.5 組內(nèi)計(jì)算:跨觀測值計(jì)算
7.6 組內(nèi)計(jì)算:求和
7.7 組內(nèi)計(jì)算:更多示例
7.8 比較by命令和tsset命令
第八章 改變數(shù)據(jù)形狀
8.1 簡 介
8.2 寬數(shù)據(jù)和長數(shù)據(jù)
8.3 長數(shù)據(jù)轉(zhuǎn)換成寬數(shù)據(jù)
8.4 長數(shù)據(jù)轉(zhuǎn)寬數(shù)據(jù)時的問題
8.5 寬數(shù)據(jù)轉(zhuǎn)換成長數(shù)據(jù)
8.6 寬數(shù)據(jù)轉(zhuǎn)長數(shù)據(jù)時的問題
8.7 多層次數(shù)據(jù)
8.8 延展數(shù)據(jù)
第九章 數(shù)據(jù)管理編程
9.1 簡 介
9.2 對數(shù)據(jù)管理長期目標(biāo)的建議
9.3 執(zhí)行do文件和制作日志文件
9.4 數(shù)據(jù)檢驗(yàn)的自動化
9.5 合并do文件
9.6 介紹Stata中的宏
9.7 使用Stata中的宏
9.8 通過變量循環(huán)實(shí)現(xiàn)命令的重復(fù)執(zhí)行
9.9 通過數(shù)字循環(huán)實(shí)現(xiàn)命令的重復(fù)執(zhí)行
9.10 任何數(shù)據(jù)管理都能用循環(huán)實(shí)現(xiàn)命令的重復(fù)執(zhí)行
9.11 獲取Stata命令保存的結(jié)果
9.12 把estimation命令的結(jié)果保存為數(shù)據(jù)
9.13 編寫Stata程序
第十章 附加資源
10.1 本書的在線資源
10.2 搜索并安裝其他程序
有個濾油機(jī)公司曾經(jīng)做過這么一則廣告:一個機(jī)修工一邊修理一臺發(fā)動機(jī)一邊說, 如果能夠定期給發(fā)動機(jī)換油,就可以不用修理它。那個機(jī)修工說:“你可以現(xiàn)在花錢,也可以等將來再花錢。”這里的暗示是你要么現(xiàn)在花3美元在一個濾油器上,要么將來花3 000美元去修理發(fā)動機(jī)。我覺得這是一個很好的類比,雙錄數(shù)據(jù)的努力(成本)相當(dāng)于廣告中濾油器的費(fèi)用。開始的數(shù)據(jù)雙錄代價很小(在數(shù)據(jù)錄入過程中拿出一定的時間來清理數(shù)據(jù)),但如果一開始只是單錄數(shù)據(jù),后期就需要付出更大的代價來清理數(shù)據(jù)(檢查所有變量中可能出現(xiàn)的錯誤和不一致的地方)。如果你自己正在錄入一份問卷或拿到其他的已經(jīng)搜集好的原始資料,我強(qiáng)烈建議進(jìn)行數(shù)據(jù)雙錄。本節(jié)將介紹如何用 Stata實(shí)現(xiàn)數(shù)據(jù)的雙錄。
數(shù)據(jù)雙錄,顧名思義,就是把同一數(shù)據(jù)錄入兩次,且保存成兩個不同的數(shù)據(jù)文件。然后把兩個數(shù)據(jù)文件做比對。如果出現(xiàn)不一致的地方,就意味著數(shù)據(jù)錄入時出錯了,然后可以通過檢查原始資料(如原始問卷)找到正確的取值來糾正發(fā)現(xiàn)的錯誤。如果比對以后沒有出現(xiàn)不一致的地方,也不一定證明錄入的數(shù)據(jù)是正確的;因?yàn)橐灿锌赡軆纱螖?shù)據(jù)錄入的時候出錯的方式是一樣的。在大多數(shù)情況中,很難想象在兩次錄入出現(xiàn)一模一樣的錯誤,這種事情不會經(jīng)常發(fā)生。比如,假設(shè)調(diào)查用的是紙筆問卷,答案都是手填的,且兩次是同一個人錄入。及時次錄入的時候把數(shù)字4誤認(rèn)為數(shù)字9,如果是同一個錄入員,有可能把以后遇到的所有4都誤認(rèn)為9。這一點(diǎn)提示我們:獨(dú)立雙錄數(shù)據(jù)是必要的,這樣能夠減少錄入數(shù)據(jù)時重復(fù)犯錯的可能性。
有人說收集數(shù)據(jù)就像收垃圾一樣:收集之前就應(yīng)該想好怎么處理它。
——羅素.福克斯,馬克思.哥白尼和羅伯特.虎克
在看
1萬個贊
非常滿意!
一本很實(shí)用的書!好!!!!!
學(xué)術(shù)用書
hao
整體上感覺還不錯。
紙張很好!