6.最常見的分析問題:匯總與分組
最常見的分析問題:匯總與分組
【本章重點】在許多的分析場景,我們不需要明細,而是想直接統計出匯總結果,本章將學習最常用的三個聚合函數。
在許多的分析場景,我們通常感興趣的是整理解個表的屬性,而不僅是查看個別的字段或明細,例如今年每個月的總訂單數、總訂單金額、平均訂單數、平均訂單金額;某客戶購買過幾次、客戶主要集中在哪個城市...等
這種將多個值聚合再一起的計算(例如求和、求平均值等),hive提供了相應的函數,稱為聚合函數,例如count()
、sum()
、avg()
等;配合 group by
指定分組對象 、having
對計算結果再進行條件過濾。
Last updated