經驗

hive內部表和外部表的區別

本文已影響 2.86W人 

hive內部表和外部表的區別

Hive創建內部表時,會將數據移動到數據倉庫指向的路徑。創建外部表時,僅記錄數據所在的路徑,不對數據的位置做任何改變,在刪除表的時候,內部表的元數據和數據會被一起刪除,而外部表只刪除元數據,不刪除數據。這樣外部表相對來說更加安全些,數據組織也更加靈活,方便共享源數據。需要注意的是傳統數據庫對錶數據驗證是寫時模式,而Hive在load時是不檢查數據是否符合schema的,Hive遵循的是讀時模式,只有在讀的時候Hive才檢查解析具體的數據字段。

hive:

hive是基於Hadoop的一個數據倉庫工具,用來進行數據提取、轉化、加載,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規模數據的機制。hive數據倉庫工具能將結構化的數據文件映射爲一張數據庫表,並提供SQL查詢功能,能將SQL語句轉變成MapReduce任務來執行。Hive的優點是學習成本低,可以通過類似SQL語句實現快速MapReduce統計,使MapReduce變得更加簡單,而不必開發專門的MapReduce應用程序。hive十分適合對數據倉庫進行統計分析。

猜你喜歡

熱點閱讀

最新文章

推薦閱讀