日韩伦理一区二区三区,国产精品成久久久久,精品福利一区二区

內容簡介

本書強調HBase在企業的實際應用，立足于企業的實際生產環境，旨在幫助企業切實解決大數據技術如何落地的問題。三位作者都是奮戰在中國大數據技術一線的實踐派專家，本書是他們實踐經驗的結晶。

本書內容在三個維度上具有重要特色：功能維度，從HBase的安裝配置、參數設置，到數據模型、表結構設計、客戶端使用、高級特性，本書做了系統且詳盡的介紹；實戰維度，不僅通過3個典型的應用案例詳細講解了如何使用HBase設計大型的數據應用系統，而且還結合實際生產系統講解了HBase的集群運維、監控和性能調優；理論維度，則深入分析了HBase、框架設計、模式設計和基本原理。可謂是理論與實踐結合，深度與廣度兼備！

編輯推薦

國內博學Hadoop技術專家實踐經驗結晶，從企業實際生產環境和需求出發，旨在幫助企業真正解決大數據的落地問題

系統介紹HBase的功能使用、框架設計、基本原理和高級特性；詳細講解使用HBase設計大型數據應用系統的實踐方法和技巧；深刻總結系統運維、監控和性能調優的實踐

作者簡介

馬延輝博學Hadoop技術專家，對Hadoop生態系統相關技術有深刻的理解。曾就職于、Answers.com、暴風影音等知名互聯網公司，從事Hadoop相關的技術工作，在企業級的大數據系統的研發、運維和管理方面積累了豐富的實戰經驗。開源HBase監控工具Ella作者。在國內Hadoop社區內非常活躍，經常在各種會議和沙龍上做技術分享，深受歡迎。現在專注于大數據技術在傳統行業的落地，致力于大數據技術的普及和推廣。

孟鑫博學Hadoop技術專家，在軟件行業從業近10年，對海量數據處理技術有著深刻的認識，曾負責Hadoop平臺建設工作，在Hadoop開發和運維方面積累了大量的實戰經驗。于2013年獲取了Cloudera的Hadoop Developer認證，多次到企業和社區去分享Hadoop、HBase等方面的技術知識和經驗。對技術擁有極大的興趣，熱衷于研究各種新技術，總結和分享經驗及教訓，目前從事管理工作，但依然熱衷于產品設計和實現。

李立松博學Hadoop技術專家，Easyhadoop技術社區創始人之一，對HDFS、MapReduce、HBase、Hive等Hadoop生態系統中的技術有比較深入的研究，在Hadoop開發方面積累了豐富的經驗。曾就職于暴風，負責暴風大數據平臺開發與應用，暴風大數據項目負責人。現在就職于締元信，擔任Hadoop高級工程師，負責締元信DMP平臺的研發工作。

在線預覽

及時部分 Part 1

基礎篇

第1章認識HBase

第2章 HBase安裝與配置

第3章數據模型

第4章 HBase表結構設計

第5章 HBase客戶端

Chapter 1 第1章

認識HBase

本章將介紹大數據背景和HBase的基本概念，從大數據引申到NoSQL，并闡述HBase出現的契機。隨后，將介紹HBase的概念、發展歷史、發行版本和基本特性。其中，HBase的核心功能模塊將作為一個小節單獨重點介紹，通過介紹HBase的使用場景和經典案例，讓讀者朋友能夠清晰地了解HBase可以做什么。

作為NoSQL家庭的一員，HBase的出現彌補了Hadoop只能離線批處理的不足，同時能夠存儲小文件，提供海量數據的隨機檢索，并保障一定的性能。而這些特性也完善了整個Hadoop生態系統，泛化其大數據的處理能力，結合其高性能、穩定、擴展性好的特行，給使用大數據的企業帶來了福音。

因為本章是全書的開篇，唯有簡明扼要地介紹才能幫助正在學習和想要學習HBase的讀者，所以本章將提綱掣領地介紹HBase的相關知識，重點介紹HBase是什么以及HBase能做什么兩部分。

1.1 理解大數據背景

經美國機構IDC調查發現，現如今的公司正在以前所未有的速度和豐富的類型產生數據，并且也有能力存儲這些數據，但是，如何關聯這兩方面以便產生較大的商業價值，是所有公司共同面臨的挑戰。這個問題非常復雜：雖然業務人員在技能提升和專業工具的幫助下，越來越了解數據，但由于數據的增長速度越來越快，積累量級越來越大，公司可以利用的數據比例正在迅速下降。

1.1.1 什么是大數據

Gartner認為與過去相關概念相比，大數據強調3V特征，即Volume(量級)、Varity(種類)和Velocity(速度)，如圖1-1所示。

圖1-1 大數據三大特性

如今存儲的數據量正在急劇增長，2000年全球存儲了EB級別的數據，預計到2020年，該值將變為ZB級別。僅Twitter每天就會生成超過10TB的數據，Facebook的數據為幾十TB，一些特殊的企業在每小時就會產生TB級別的數據。

上面這些企業是一些典型的案例，其實我們生活的方方面面都會形成很多"軌跡"。例如，打開手機會生成一個事件；乘坐公共交通刷卡，這是一個事件；檢票登機、打卡上班、App Store上購買應用、更換電視頻道、使用高速路電子收費系統等。每一項操作都會生成數據，并且該數據的量級與參與的人數相關，全球60億人口，如果僅僅1/10的人參與進來，那么這個數據量級就已經非常驚人。就在10年前IT界超過1TB的數據倉庫屈指可數，而現在則是"舉不勝舉"。

隨著傳感器、智能設備以及社交協作技術的激增，企業中的數據也變得更加復雜，因為它不僅包含傳統的關系型數據，還包含來自網頁、Web日志文件、社交媒體論壇、電子郵件、文檔、傳感器數據等原始、半結構化和非結構化數據。

傳統系統可能很難存儲、分析這些數據的內容，更不要說挖掘有價值的信息。因為傳統的數據庫、數據倉庫、聯機事務處理等技術并不適合處理這些數據。盡管一些公司正在朝大數據方向大力發展，但總體而言，大部分公司只是剛開始理解大數據。當回首整個數據庫發展的歷程會發現，人們將大部分時間都花在僅20%的數據上：這些數據格式整齊且符合嚴格模式的關系類型。但事實是，全球80%的數據是非結構化的或者半結構化的。

視頻和圖片不能輕松或高效地存儲在關系型數據庫中，某些事件信息可能動態地更改(如氣象)，它們不太適合嚴格的模式。要利用大數據，企業必須能夠分析所有類型的數據，包括關系和非關系數據：文本、傳感器數據、音頻和視頻等。

有效處理大數據需要在數據變化的過程中對它的數量和種類進行分析，而不只是在"靜止"狀態進行分析。業界定義這種情況為從單純批量計算模式到實時動態計算模式的內涵式轉變。內涵式在這里也比較容易理解，即結構優化、質量提高，是一種實現實質性的跨越式的進程。大數據平臺允許用戶將所有數據存儲為其原生的業務對象格式，通過可用組件上的大規模并行計算實現價值，不僅僅是批量處理和離線分析，同時支持實時查詢和處理等特征，甚至要求響應時間在毫秒級別，并且可承受大規模的并發訪問，這些都是"速度"特征的范疇。

日韩偷拍一区二区,国产香蕉久久精品综合网,亚洲激情五月婷婷,欧美日韩国产不卡

HBase企業應用開發實戰

內容簡介

編輯推薦

作者簡介

目錄

在線預覽

看過該圖書的還看過

企業信息化初階

企業財務業務一體化實訓教程(用友ERP-U8 72版)

UCD火花集：有效的互聯網產品設計交互/信息設計用戶研究討論

ERP登堂入室之路

SAP公用事業行業營銷解決方案

性能之巔：洞悉系統、企業與云計算

協同辦公·Lotus Domino/Notes實驗教程

性能之巔：洞悉系統·企業與云計算

企業管理的計算機化

Vivado從此開始

相關圖書

企業信息化初階

企業財務業務一體化實訓教程(用友ERP-U8 72版)

UCD火花集：有效的互聯網產品設計交互/信息設計用戶研究討論

ERP登堂入室之路

SAP公用事業行業營銷解決方案

網友評論(不代表本站觀點)

免責聲明

更多出版社

日韩偷拍一区二区,国产香蕉久久精品综合网,亚洲激情五月婷婷,欧美日韩国产不卡

HBase企業應用開發實戰

內容簡介

編輯推薦

作者簡介

目錄

在線預覽

看過該圖書的還看過

企業信息化初階

企業財務業務一體化實訓教程(用友ERP-U8 72版)

UCD火花集：有效的互聯網產品設計 交互/信息設計 用戶研究討論

ERP登堂入室之路

SAP公用事業行業營銷解決方案

性能之巔：洞悉系統、企業與云計算

協同辦公·Lotus Domino/Notes實驗教程

性能之巔：洞悉系統·企業與云計算

企業管理的計算機化

Vivado從此開始

相關圖書

企業信息化初階

企業財務業務一體化實訓教程(用友ERP-U8 72版)

UCD火花集：有效的互聯網產品設計 交互/信息設計 用戶研究討論

ERP登堂入室之路

SAP公用事業行業營銷解決方案

網友評論(不代表本站觀點)

免責聲明

更多出版社

UCD火花集：有效的互聯網產品設計交互/信息設計用戶研究討論

UCD火花集：有效的互聯網產品設計交互/信息設計用戶研究討論