👋
數據分析與Hive SQL
CtrlK
  • Introduction
    • About This Book
    • Why Learning Hive SQL
  • Part I-工具準備與基礎知識
    • Part I Intro
    • 1.大數據基本概念:認識大數據
      • 什麼是大數據
      • 認識開發環境:Hadoop與Hive
      • Hive與關聯式資料庫的區別
      • 認識Hue與Table
    • 2.大數據環境安裝與數據導入
      • Hadoop環境安裝
      • 課程數據模型與導入
  • Part II-基本統計篇
    • Part II Intro
    • 3.初次見面:SELECT基礎查詢
      • SELECT起手式與語句順序
      • 單個檢索、多個檢索與*符號
      • LIMIT 限制返回行數
      • ORDER BY排序檢索
      • DISTINCT排除重複
    • 4.過濾你想要的數據
      • 比較運算
      • BETWEEN...AND
      • IN與NOT IN過濾
      • 模糊查詢:LIKE與通配符(%)
      • NULL的過濾
      • 多過濾條件组合
    • 5.生成新的字段-字段運算
      • Column的四則運算
      • 好用的取別名(alias)
      • 取別名後如何排序
      • 代碼註釋
    • 6.最常見的分析問題:匯總與分組
      • 聚合函數基本用法
      • GROUP BY 指定分組對象
      • DISTINCT與聚合函數的配合
      • HAVING過濾分組後的數據
      • GROUP BY 去重
      • Hive語句的執行順序
  • Part III-數據預處理篇
    • Part III Intro
    • 7.好用的CASE與WHEN IF
      • CASE WHEN函數
      • IF函數
    • 8.用函數高效處理數據
      • 常用數值處理函數
      • 常用時間處理函數
      • 常用字符串處理函數
    • 9.煩人的缺失數據與極端值
      • 評估數據質量
      • 缺失值對聚合函數及算術運算的影響
      • 缺失值的處理方法
      • 查找極端值
  • Part IV-數據分析進階
    • Part IV Intro
    • 10.實現多表查詢:子查詢
    • 11.利用JOIN實現表的橫向連接
    • 12.利用UNION實現表的縱向連接
    • 13.改變表結構:行列互轉
    • 14.強大的窗口函數
    • 15.庫、表的操作
  • 關於資料倉庫,你需要知道的幾件事
    • 什麼是資料倉庫(Data Warehouse)
    • 為什麼需要Data Warehouse
    • ETL與Pipeline
    • 維度建模理論
    • 元數據(Meta Data)管理
  • Home work
    • Home work Anser
Powered by GitBook
On this page
  1. Part IV-數據分析進階

Part IV Intro

數據分析進階

10.實現多表查詢:子查詢11.利用JOIN實現表的橫向連接12.利用UNION實現表的縱向連接13.改變表結構:行列互轉14.強大的窗口函數15.庫、表的操作
Previous查找極端值Next10.實現多表查詢:子查詢

Last updated 3 years ago