經驗

hive內部表和外部表的區別

本文已影響 2.86W人 

hive內部表和外部表的區別

Hive建立內部表時,會將資料移動到資料倉庫指向的路徑。建立外部表時,僅記錄資料所在的路徑,不對資料的位置做任何改變,在刪除表的時候,內部表的元資料和資料會被一起刪除,而外部表只刪除元資料,不刪除資料。這樣外部表相對來說更加安全些,資料組織也更加靈活,方便共享源資料。需要注意的是傳統資料庫對錶資料驗證是寫時模式,而Hive在load時是不檢查資料是否符合schema的,Hive遵循的是讀時模式,只有在讀的時候Hive才檢查解析具體的資料欄位。

hive:

hive是基於Hadoop的一個數據倉庫工具,用來進行資料提取、轉化、載入,這是一種可以儲存、查詢和分析儲存在Hadoop中的大規模資料的機制。hive資料倉庫工具能將結構化的資料檔案對映為一張資料庫表,並提供SQL查詢功能,能將SQL語句轉變成MapReduce任務來執行。Hive的優點是學習成本低,可以通過類似SQL語句實現快速MapReduce統計,使MapReduce變得更加簡單,而不必開發專門的MapReduce應用程式。hive十分適合對資料倉庫進行統計分析。

猜你喜歡

熱點閱讀

最新文章

推薦閱讀