自然語言處理(Natural Language Processing,NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它研究能夠?qū)崿F(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法,涉及所有用計(jì)算機(jī)對自然語言進(jìn)行的操作。
《Python自然語言處理》是自然語言處理領(lǐng)域的一本實(shí)用入門指南,旨在幫助讀者學(xué)習(xí)如何編寫程序來分析書面語言?!禤ython自然語言處理》基于Python編程語言以及一個(gè)名為NLTK的自然語言工具包的開源庫,但并不要求讀者有Python編程的經(jīng)驗(yàn)。全書共11章,按照難易程度順序編排。第1章到第3章介紹了語言處理的基礎(chǔ),講述如何使用小的Python程序分析感興趣的文本信息。第4章討論結(jié)構(gòu)化程序設(shè)計(jì),以鞏固前面幾章中介紹的編程要點(diǎn)。第5章到第7章介紹語言處理的基本原理,包括標(biāo)注、分類和信息提取等。第8章到第10章介紹了句子解析、句法結(jié)構(gòu)識別和句意表達(dá)方法。第11章介紹了如何有效管理語言數(shù)據(jù)。后記部分簡要討論了NLP領(lǐng)域的過去和未來。
《Python自然語言處理》的實(shí)踐性很強(qiáng),包括上百個(gè)實(shí)際可用的例子和分級練習(xí)。《Python自然語言處理》可供讀者用于自學(xué),也可以作為自然語言處理或計(jì)算語言學(xué)課程的教科書,還可以作為人工智能、文本挖掘、語料庫語言學(xué)等課程的補(bǔ)充讀物。
Python自然語言處理方面的之作
快速了解一些概念及基本工作原理的必讀
提供豐富英文語料庫和代碼,方便練習(xí)
從輸入法聯(lián)想提示(predictive text)、email過濾到自動(dòng)文本匯總、機(jī)器翻譯,大量的語言相關(guān)的技術(shù)都離不開自然語言處理的支持,而這本書提供了自然語言處理的入門指南。通過本書,你將學(xué)到如何編寫能處理大量非結(jié)構(gòu)化文本的Python程序。你可以訪問具有豐富標(biāo)注的、涵蓋了語言學(xué)各種數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)集,而且你將學(xué)習(xí)分析書面文檔的內(nèi)容以及結(jié)構(gòu)的主要算法。
通過大量的例子和練習(xí),本書將幫助你:
從非結(jié)構(gòu)化文本中提取信息,無論是猜測主題還是識別“命名實(shí)體”;
分析文本的語言學(xué)結(jié)構(gòu),包括語法和語義分析;
訪問流行的語言學(xué)數(shù)據(jù)集,包括WordNet和treebanks;
整合從語言學(xué)到人工智能等多個(gè)領(lǐng)域的技術(shù)。
通過使用Python程序設(shè)計(jì)語言和自然語言工具包(NTLK)的開源庫,本書將幫助你增加自然語言處理的實(shí)際經(jīng)驗(yàn)。如果你對開發(fā)Web應(yīng)用、分析多語言的新聞源或編制瀕危語言感興趣,或者只是想要從程序員的視角看人類語言如何運(yùn)作,你將發(fā)現(xiàn)本書不僅有趣而且極其有用。
Steven Bird是墨爾本大學(xué)計(jì)算機(jī)科學(xué)和軟件工程系副教授,賓夕法尼亞大學(xué)語言學(xué)數(shù)據(jù)聯(lián)盟高級研究助理。
Ewan Klein是愛丁堡大學(xué)信息學(xué)院語言技術(shù)教授。
Edward Loper是畢業(yè)于賓夕法尼亞大學(xué)專注于機(jī)器學(xué)習(xí)的自然語言處理方向的博士,現(xiàn)在在波士頓的BBN Technologies擔(dān)任研究員。
第1章語言處理與Python
1.1語言計(jì)算:文本和詞匯
1.2近觀Python:將文本當(dāng)做詞鏈表
1.3計(jì)算語言:簡單的統(tǒng)計(jì)
1.4回到Python:決策與控制
1.5自動(dòng)理解自然語言
1.6小結(jié)
1.7深入閱讀
1.8練習(xí)
第2章獲得文本語料和詞匯資源
2.1獲取文本語料庫
2.2條件頻率分布
2.3更多關(guān)于Python:代碼重用
2.4詞典資源
2.5WordNet
2.6小結(jié)
2.7深入閱讀
2.8練習(xí)
第3章處理原始文本
3.1從網(wǎng)絡(luò)和硬盤訪問文本
3.2字符串:最底層的文本處理
3.3使用Unicode進(jìn)行文字處理
3.4使用正則表達(dá)式檢測詞組搭配
3.5正則表達(dá)式的有益應(yīng)用
3.6規(guī)范化文本
3.7用正則表達(dá)式為文本分詞
3.8分割
3.9格式化:從鏈表到字符串
3.10小結(jié)
3.11深入閱讀
3.12練習(xí)
第4章編寫結(jié)構(gòu)化程序
4.1回到基礎(chǔ)
4.2序列
4.3風(fēng)格的問題
4.4函數(shù):結(jié)構(gòu)化編程的基礎(chǔ)
4.5更多關(guān)于函數(shù)
4.6程序開發(fā)
4.7算法設(shè)計(jì)
4.8Python庫的樣例
4.9小結(jié)
4.10深入閱讀
4.11練習(xí)
第5章分類和標(biāo)注詞匯
5.1使用詞性標(biāo)注器
5.2標(biāo)注語料庫
5.3使用Python字典映射詞及其屬性
5.4自動(dòng)標(biāo)注
5.5N-gram標(biāo)注
5.6基于轉(zhuǎn)換的標(biāo)注
5.7如何確定一個(gè)詞的分類
5.8小結(jié)
5.9深入閱讀
5.10練習(xí)
第6章學(xué)習(xí)分類文本
6.1監(jiān)督式分類
6.2監(jiān)督式分類的舉例
6.3評估
6.4決策樹
6.5樸素貝葉斯分類器
6.6較大熵分類器
6.7為語言模式建模
6.8小結(jié)
6.9深入閱讀
6.10練習(xí)
第7章從文本提取信息
7.1信息提取
7.2分塊
7.3開發(fā)和評估分塊器
7.4語言結(jié)構(gòu)中的遞歸
7.5命名實(shí)體識別
7.6關(guān)系抽取
7.7小結(jié)
7.8深入閱讀
7.9練習(xí)
第8章分析句子結(jié)構(gòu)
8.1一些語法困境
8.2文法的用途
8.3上下文無關(guān)文法
8.4上下文無關(guān)文法分析
8.5依存關(guān)系和依存文法
8.6文法開發(fā)
8.7小結(jié)
8.8深入閱讀
8.9練習(xí)
第9章建立基于特征的文法
9.1文法特征
9.2處理特征結(jié)構(gòu)
9.3擴(kuò)展基于特征的文法
9.4小結(jié)
9.5深入閱讀
9.6練習(xí)
第10章分析語句的含義
10.1自然語言理解
10.2命題邏輯
10.3一階邏輯
10.4英語語句的語義
10.5段落語義層
10.6小結(jié)
10.7深入閱讀
10.8練習(xí)
第11章語言數(shù)據(jù)管理
11.1語料庫結(jié)構(gòu):案例研究
11.2語料庫生命周期
11.3數(shù)據(jù)采集
11.4使用XML
11.5使用Toolbox數(shù)據(jù)
11.6使用OLAC元數(shù)據(jù)描述語言資源
11.7小結(jié)
11.8深入閱讀
11.9練習(xí)
后記
參考文獻(xiàn)
“少有的一本書,用如此清晰的方法如此優(yōu)美整潔的代碼處理一個(gè)如此復(fù)雜的計(jì)算機(jī)問題……這是一本從中可以學(xué)習(xí)自然語言處理的書。”
——Ken Getz, MCW Technologies高級顧問
書是湊合,我本身要求店家開一個(gè)普通發(fā)票,有稅號的就行,用于學(xué)校報(bào)銷,店家給我開的發(fā)票沒按我的要求,沒稅號,聯(lián)系客服,告訴我月底開。結(jié)果到月底,說還是開不了,要我把發(fā)票寄回去,重新開,郵費(fèi)還要我自己掏。同一時(shí)間我在當(dāng)當(dāng)買了另一本書,人家店家就開的合適。而你們這家一開始就推脫我,一點(diǎn)誠意都沒有,到月底還讓我自己把發(fā)票寄回去。差評。。糟心的一次購物
很好,質(zhì)量不錯(cuò),實(shí)用性強(qiáng)專業(yè)性強(qiáng)好。
內(nèi)容不錯(cuò),和我想的不太一樣
要好好學(xué)習(xí)
喜歡python的喜歡數(shù)據(jù)挖掘的朋友可以看一下
是根據(jù)影印版翻譯的,其實(shí)建議看網(wǎng)頁上的最新版...
期待已久的一本書,國內(nèi)終于引進(jìn)了。網(wǎng)上之前有人義務(wù)翻譯了一個(gè)電子版,很贊
書很不錯(cuò),只是包裝太單薄,兩本書都被磨的很厲害,快遞太不負(fù)責(zé)了。
有幾處黏頁的現(xiàn)象,用手輕輕撕開,個(gè)別字也被撕掉了
還不錯(cuò),不過原作者是外國人,處理都是英文,如果來做中文的話,還是需要更進(jìn)一步的努力!
理論與實(shí)踐結(jié)合相當(dāng)緊密,將PYTHON編程落實(shí)到NLP各個(gè)方面,有利于讀者掌握NLTK。
慢慢看,雖然以前沒接觸過,但總得學(xué)點(diǎn)什么不是嗎
實(shí)用性強(qiáng),推薦。對于初學(xué)或入門級的讀者都考慮到,書的內(nèi)容編排對讀者很友好。
書很好,但是翻譯的不太好,網(wǎng)站有英文版適用Python3的教程
好書,實(shí)踐性很強(qiáng),python是無所不能的,適合擴(kuò)充python的知識,有一定難度
雖然是英文翻譯過來的,但是總體思想還是值得一看的
不錯(cuò),挺實(shí)用的,但是需要一定的Python的基礎(chǔ)
從最基本的金融數(shù)據(jù)分析工具入手,可以很快的上手python數(shù)據(jù)分析
好,對于實(shí)戰(zhàn)較好。解決課程實(shí)驗(yàn),與報(bào)告,很有幫助。
在學(xué)習(xí)Python 機(jī)器學(xué)習(xí),這本書非常適合
統(tǒng)計(jì)專業(yè)R已經(jīng)不夠用了,必須要學(xué)習(xí)Python了。。。。老師推薦用書。
這是一本很不錯(cuò)的值得學(xué)習(xí)的書,比較系統(tǒng)和全面,只是更多的是對英文的語言處理,收益很多
很適合python和自然語言處理的初學(xué)者,內(nèi)容深入淺出,一開始對基礎(chǔ)知識幾乎沒有什么要求,學(xué)過編程的話更容易上手
還沒看,不過應(yīng)該要看啦!Python還是比較好用的!
這本書簡述了python2.x的一些簡單的語法與使用,只要具備了一部分編程基礎(chǔ)的人都能在短期內(nèi)迅速上手,這樣可以把更多的時(shí)間放在語言處理上。
主要介紹英文自然語言的數(shù)據(jù)挖掘,很詳細(xì),要是能介紹中文文本的數(shù)據(jù)挖掘就更好,畢竟中文比英文更難挖掘分析
《Python自然語言處理》是關(guān)于python進(jìn)階的教材,涉及到大量自然語言處理的實(shí)際應(yīng)用案例,具有極強(qiáng)的參考價(jià)值和學(xué)習(xí)價(jià)值,非常值得購買。
很好啊,這本書非常經(jīng)典,六一兒童節(jié)優(yōu)惠很大,一次性買了好多。書真的不錯(cuò),尤其是內(nèi)容