国产精品理论片_日韩激情视频一区_91免费版在线看_日韩专区在线_中文字幕国产一区_wwwjizz日本

您現(xiàn)在所在的位置:首頁 >關于奇酷 > 行業(yè)動態(tài) > 大數(shù)據(jù)培訓機構:淺談Hive vs. HBase

大數(shù)據(jù)培訓機構:淺談Hive vs. HBase

來源:奇酷教育 發(fā)表于:

  大數(shù)據(jù)培訓機構:淺談Hive vs HBase。對于剛接觸大數(shù)據(jù)分析的用戶來說,要想?yún)^(qū)分Hive與HBase是有一定難度的。本文將嘗試從其各自的

  大數(shù)據(jù)培訓機構:淺談Hive vs. HBase。對于剛接觸大數(shù)據(jù)分析的用戶來說,要想?yún)^(qū)分Hive與HBase是有一定難度的。本文將嘗試從其各自的定義、特點、限制、應用場景等角度來進行分析,以作拋磚引玉之用。
大數(shù)據(jù)培訓機構 大數(shù)據(jù)分析
  Hive是什么?
  Apache Hive是一個構建于Hadoop(分布式系統(tǒng)基礎架構)頂層的數(shù)據(jù)倉庫,注意這里不是數(shù)據(jù)庫。Hive可以看作是用戶編程接口,它本身不存儲和計算數(shù)據(jù);它依賴于HDFS(Hadoop分布式文件系統(tǒng))和MapReduce(一種編程模型,映射與化簡;用于大數(shù)據(jù)并行運算)。其對HDFS的操作類似于SQL—名為HQL,它提供了豐富的SQL查詢方式來分析存儲在HDFS中的數(shù)據(jù);HQL經(jīng)過編譯轉為MapReduce作業(yè)后通過自己的SQL 去查詢分析需要的內容;這樣一來,即使不熟悉MapReduce 的用戶也可以很方便地利用SQL 語言查詢、匯總、分析數(shù)據(jù)。而MapReduce開發(fā)人員可以把己寫的mapper 和reducer 作為插件來支持Hive 做更復雜的數(shù)據(jù)分析。
  HBase是什么?
  Apache HBase是運行于HDFS頂層的NoSQL(=Not Only SQL,泛指非關系型的數(shù)據(jù)庫)數(shù)據(jù)庫系統(tǒng)。區(qū)別于Hive,HBase具備隨即讀寫功能,是一種面向列的數(shù)據(jù)庫。HBase以表的形式存儲數(shù)據(jù),表由行和列組成,列劃分為若干個列簇(row family)。例如:一個消息列簇包含了發(fā)送者、接受者、發(fā)送日期、消息標題以及消息內容。每一對鍵值在HBase會被定義為一個Cell,其中,鍵由row-key(行鍵),列簇,列,時間戳構成。而在HBase中每一行代表由行鍵標識的鍵值映射組合。Hbase目標主要依靠橫向擴展,通過不斷增加廉價的商用服務器,來增加計算和存儲能力。
  特性
  遵從JDBC的Hive不但可以讓具SQL知識的用戶來間接執(zhí)行MapReduce作業(yè),同時里面也整合了目前基于SQL的操作工具。不過,由于默認的數(shù)據(jù)讀取是全表遍歷的,其時間的耗費也不可避免地相對較大。盡管如此,不盡相同的Hive分區(qū)方法,其遍歷讀取的數(shù)據(jù)量也是能夠有所限制的。Hive分區(qū)允許對存儲在獨立文件上的數(shù)據(jù)進行篩選查詢,返回的是篩選后的數(shù)據(jù)。例如針對日期的日志文件訪問,前提是該類文件的文件名包含日期信息。
  HBase以鍵值對的形式儲存數(shù)據(jù)。其包含了4種主要的數(shù)據(jù)操作方式:
  添加或更新數(shù)據(jù)行
  掃描獲取某范圍內的cells
  為某一具體數(shù)據(jù)行返回對應的cells
  從數(shù)據(jù)表中刪除數(shù)據(jù)行/列,或列的描述信息
  列信息可用于獲取數(shù)據(jù)變動前的取值(透過HBase壓縮策略可以刪除列信息歷史記錄來釋放存儲空間)。
  限制
  Hive不支持常規(guī)的SQL更新語句,如:數(shù)據(jù)插入,更新,刪除。因為其對數(shù)據(jù)分析的操作是針對整個數(shù)據(jù)表的。同時該特點也使得數(shù)據(jù)查詢用時以數(shù)分鐘甚至數(shù)小時來進行計算。此外,其MapReduce轉換過程必須遵從預定義的轉換規(guī)則。
  HBase的數(shù)據(jù)查詢是有一套屬于自己類似SQL的操作語言的,這個需要一定的學習來掌握。此外,要運行HBase,ZooKeeper是需要配備的。ZooKeeper是一個針對大型分布式系統(tǒng)的可靠協(xié)調系統(tǒng),提供的功能包括:配置維護、名字服務、分布式同步、組服務等。
  應用舉例
  Hive適用于網(wǎng)絡日志等數(shù)據(jù)量大、靜態(tài)的數(shù)據(jù)查詢。例如:用戶消費行為記錄,網(wǎng)站訪問足跡等。但是不適用于聯(lián)機實時在線查詢的場合。
  HBase能在大數(shù)據(jù)聯(lián)機實時查詢場合大展身手。例如:Fackbook就利用其對用戶間的傳送的消息進行聯(lián)機實時分析。
  小結
  Hive與HBase兩者是基于Hadoop上不同的技術。Hive是一種能執(zhí)行MapReduce作業(yè)的類SQL編程接口,Hbase是一種非關系型的數(shù)據(jù)庫結構。結合這兩者自身的特點,互相結合使用或許能收到相得益彰的效果。例如:利用Hive處理靜態(tài)離線數(shù)據(jù),利用HBase進行聯(lián)機實時查詢,而后對兩者間的結果集進行整合歸并,從而使得數(shù)據(jù)完整且永葆青春,為進一步的商業(yè)分析提供良好支持。
主站蜘蛛池模板: 日本成人二区 | 99热这里都是精品 | 在线观看中文字幕亚洲 | 嫩呦国产一区二区三区av | 中日字幕大片在线播放 | 亚洲欧美一区二区三区1000 | 日本小视频网站 | 国产一区二区三区在线 | 国产在线一区二区三区 | 久久精品网 | 亚洲精品成人在线 | 91精品国产综合久久婷婷香蕉 | 亚洲一区二区在线播放 | 成人在线精品视频 | 亚洲精品一区国语对白 | 福利视频网 | 亚州国产 | 久久新| 亚洲一区二区三区桃乃木香奈 | 国产精品色 | 欧美午夜一区 | 国产伦一区二区三区视频 | 久久久久久综合 | 午夜欧美一区二区三区在线播放 | 久久久久国产一区二区三区 | 在线观看电影av | 精品一级 | 成年视频在线观看福利资源 | 国产激情一区二区三区 | 成人羞羞国产免费视频 | 毛片毛片毛片毛片 | 国产99久久精品 | 欧美成人激情 | 精品一区国产 | 国产一级片精品 | 午夜国产在线 | 一级做a爰片性色毛片16美国 | 香蕉久久久久久 | 欧美日韩在线一区二区 | 午夜精品久久久久久不卡欧美一级 | 中文字幕久久久 |