Hive與關聯式資料庫的區別
Hive因為是建立在Hadoop生態下,是為了大數據而產生,有較高的延遲並且在工作提交和調度的時候需要大量的開銷,因此,Hive並不能够在大規模數据集上實現低延遲快速的査詢。Hive的最佳使用場合是海量數據的離線分析處理,對讀多寫少、響應時間要求不高的場合。
存儲檔案的系統不同,Hive使用Hadoop的分佈式檔案系統,關聯式資料庫則是服務器本地的檔案系統
計算模型不同,Hive使用MapReduce進行計算,關係數據則是自己設計的計算模型
實时性區別,關聯式資料庫都是為實時査詢的業務進行設計的,而Hive則是為海量數據做資料挖掘設計的,實时性很差
擴展能力區別,Hive很容易擴展自己的存儲能力和計算能力(繼承Hadoop),而關聯式資料庫在這方面要差很多
Last updated