Hive與關聯式資料庫的區別

Hive因為是建立在Hadoop生態下，是為了大數據而產生，有較高的延遲並且在工作提交和調度的時候需要大量的開銷，因此，Hive並不能够在大規模數据集上實現低延遲快速的査詢。Hive的最佳使用場合是海量數據的離線分析處理，對讀多寫少、響應時間要求不高的場合。

存儲檔案的系統不同，Hive使用Hadoop的分佈式檔案系統，關聯式資料庫則是服務器本地的檔案系統
計算模型不同，Hive使用MapReduce進行計算，關係數據則是自己設計的計算模型
實时性區別，關聯式資料庫都是為實時査詢的業務進行設計的，而Hive則是為海量數據做資料挖掘設計的，實时性很差
擴展能力區別，Hive很容易擴展自己的存儲能力和計算能力（繼承Hadoop），而關聯式資料庫在這方面要差很多

Previous認識開發環境：Hadoop與Hive Next認識Hue與Table

Last updated 4 years ago