揭示了Apache Hadoop如何為你釋放數據的力量。這本內容的書籍展示了如何使用Hadoop架構搭建和維護、可伸縮的分布式系統。Hadoop架構是MapReduce算法的一種開源應用,是Google開創其帝國的重要基石。程序員可從中探索如何分析海量數據集,管理員可以了解如何建立與運行Hadoop集群。 《Hadoop指南(影印版第2版修訂版)》涵蓋了Hadoop最近的更新,包括諸如Hive、Sqoop和Avro之類的新特性。它也提供了案例學習來展示Hadoop如何解決特殊問題。期待盡情享受你的數據?這就是你要的書。本身由Tom White著。
Tom White從2007年起就是Apache Hadoop的理事。他是Apache軟件基金會的成員和Cloudera的工程師。Tom為oreilly.com,java.net~llBM的developerWorks撰文,并為業內會議演講。
Foreword Preface 1. Meet Hadoop Data! Data Storage and Analysis Comparison with Other Systems RDBMS Grid Computing Volunteer Computing A Brief History of Hadoop Apache Hadoop and the Hadoop Ecosystem 2. MapReduce A Weather Dataset Data Format Analyzing the Data with Unix Tools Analyzing the Data with Hadoop Map and Reduce Java MapReduce Scaling Out Data Flow Combiner Functions Running a Distributed MapReduce Job Hadoop Streaming Ruby Python Hadoop Pipes Compiling and Running 3. The Hadoop Distributed Filesystem The Design of HDFS HDFS Concepts Blocks Namenodes and Datanodes The Command-Line Interface Basic Filesystem Operations Hadoop Filesystems Interfaces The Java Interface Reading Data from a Hadoop URL Reading Data Using the FileSystem API Writing Data Directories Querying the Filesystem Deleting Data Data Flow. Anatomy of a File Read Anatomy of a File Write Coherency Model Parallel Copying with distcp Keeping an HDFS Cluster Balanced Hadoop Archives Using Hadoop Archives Limitations 4. Hadoop I/0 Data Integrity Data Integrity in HDFS LocalFileSystem ChecksumFileSystem Compression Codecs Compression and Input Splits Using Compression in MapReduce Serialization The Writable Interface Writable Classes Implementing a Custom Writable Serialization Frameworks Avro File-Based Data Structures SequenceFile ……
印刷質量和那好,紙張也很厚實,內容還沒看
大家作品 非常經典 內容詳實 沒得說!!!
非常棒
了解hadoop的權威書籍
很好
HADOOP權威指南果然不錯
送快遞的人很有禮貌~
分析詳盡
正在看
可以提高專業英語閱讀水平
基礎教育可以深度稍微
不錯。
該領域的經典的書籍。
據說這本書不錯,我們教研室買了兩本。中文版啊和英文版都買了。
原版書還是比翻譯本強很多,建議當當多出一些原版的,不會產生翻譯歧義,尤其是技術類的書籍。
正如其名字所言,絕對是權威,學習hadoop必看。有個缺點就是由于hadoop更新太快,好書也容易過時。