著作權宣告:本文為博主原創文章,于2021年4月17日首發于CSDN,轉載請附上原文出處鏈接和本宣告,本文鏈接:https://blog.csdn.net/u011046671/article/details/115756193
一、簡介
資源庫,顧名思義,是存放轉換和作業腳本的地方,可以統一對腳本進行管理,當然,我們也可以不使用資源庫,將腳本保存在本地硬碟的任意位置,但是在后期管理和運行中會有一些麻煩,
二、分類
常見的資源庫有兩種,為 檔案資源庫 和 資料庫資源庫,檔案資源庫 是以 ktr 和 kjb 檔案的形式(本質上是 xml 檔案,可以使用文本工具打開查看編輯 )保存在本地計算機的硬碟的目錄中,資料庫資源庫 是將腳本存放在資料庫中,kettle 可以在常見的資料庫中創建資源庫,
三、特點
- 檔案資源庫 將腳本保存在本地創建的目錄中,打開資源庫可以管理所有的腳本,可以解決在作業中參考其它腳本帶來的路徑問題,避免因不同平臺(如Windows 和 Linux )中的路徑分隔符不同,造成運行失敗,因為腳本檔案為文本檔案,通過與其他版本管理工具(如 SVN 和 GIT )配合,可以管理不同版本的腳本,但是因為腳本保存在本地計算機中,只能在本地運行,不能遠程呼叫,
- 資料庫資源庫 將腳本保存資料庫中,kettle 通過 JDBC 連接資源庫,資料庫可以是本地計算機,也可以是遠程計算機,可以統一管理腳本,利用資料庫備份工具可以對腳本進行備份,保證腳本的安全,資料庫連接資訊保存在資料庫中,當資訊變更的時候,在任意腳本中修改后,所有腳本使用的該資料庫連接資訊同時變更,
- 綜上所述,我建議在有資料庫的條件下,優先選擇資料庫資源庫,在沒有資料庫的資源庫的情況下,選擇檔案資源庫,或者在開發環境選擇檔案資源庫,在生產環境選擇資料庫資源庫,
三、創建資源庫
- 創建 檔案資源庫 步驟:
1、使用快捷鍵 【Windows + R】打開 運行對話框,輸入:spoon 按回車,稍等片刻后,就會打開 spoon ,然后點擊右上角的【connect】按鈕,
2、然后點擊 【Other Repositories 】,然后點擊右下角 【Get Started 】,
3、點擊選擇 【 File Repository】 后,點擊右下角 【Get Started 】,
4、填寫資源庫資訊:[ Display Name ]為 [ 顯示名稱 ],可以隨意設定,此處設定為:master-file-repo,[ Location ] 為 [ 位置 ],需要在本地創建一個目錄,作為存盤路徑,點擊 【Browse】進行選擇, [ Show hidden folders ] 為 [ 顯示隱藏檔案夾 ] , [ Description ] 為 [ 資源庫描述 ],默認即可,[ Launch connection on startup ] 為 [ 啟動時自動連接 ] ,建議勾選上,然后點擊右下角的 【Finsh】,
5、檔案資源庫創建完成,點擊按鈕【Connect Now 】可以立即連接,
- 創建 資料資源庫 步驟:
1、kettle 支持在常見的資料庫中創建資源庫,建議創建單獨的資料庫或用戶進行管理,不要與其他資料混合,以免造成沖突,如:MySQL建議創建單獨的資料庫,Oracle 建議創建單獨的用戶,此處以 Oracle 資料庫為例,創建用戶的 SQL 代碼為:
--清理用戶及資料
drop user db_kettle cascade;
-- 創建用戶
create user db_kettle
identified by db_kettle
default tablespace users
quota unlimited on users
temporary tablespace temp;
-- 授予權限
grant connect to db_kettle;
grant resource to db_kettle;
2、使用快捷鍵 【Windows + R】打開 運行對話框,輸入:spoon 按回車,稍等片刻后,就會打開 spoon ,然后點擊右上角的【connect】按鈕,
3、然后點擊 【Other Repositories 】,然后點擊右下角 【Get Started 】,
4、點擊選擇 【 Database Repository】 后,點擊右下角 【Get Started 】,
5、填寫資源庫資訊:[ Display Name ]為 [ 顯示名稱 ],可以隨意設定,此處設定為:master-db-repo,[Database connection ] 為資料庫連接,點擊【None】選擇一個資料庫連接,如果沒有資料庫連接,可以點擊 【 Create New Connection 】創建一個資料連接,連接名稱:可以隨意填寫,此處填寫:kettle-repodb;連接型別:默認為:Oracle;可以根據需要選擇其他資料庫型別,主機名稱:填寫IPv4地址;資料庫名稱:填寫資料庫的SID,大小寫均可;埠號:默認為1521 ,如果修改成其他埠號請在此處修改;用戶名:填寫資料庫的用戶名,此處填寫:db_kettle ;密碼:填寫資料庫的密碼,此處填寫:db_kettle ;填寫完成后,點擊【測驗】按鈕進行測驗,是否可以成功連接,彈出“ 正確連接到資料庫”,說明可以成功連接,點擊【確定】回傳,然后點擊 【Back】 回傳資源庫資訊頁面, [ Description ] 為 [ 資源庫描述 ],默認即可,[ Launch connection on startup ] 為 [ 啟動時自動連接 ] ,建議勾選上,然后點擊右下角的 【Finsh】,
6、資料庫資源庫創建完成,點擊按鈕【Connect Now 】可以立即連接,彈出登陸框,username 默認為:admin ;password 默認為:admin ,
其他說明:檔案資源庫和資料庫資源庫在創建和連接程序中會在相關的目錄或資料庫中寫入系統資料,如果目標目錄或者目標資料庫已經存在相關資料,則不會洗掉相關的資料,因此不用擔心原有資料丟失,
四、管理資源庫
創建資源庫并連接后,在 spoon 中可以依次點擊 【工具】-【資源庫】-【探索資源庫】或者使用快捷鍵 【Ctrl + E 】打開資源庫,
在【瀏覽】標簽中,點擊右鍵可以進行 創建目錄 / 打開 / 洗掉 / 重命名,建議轉換和作業分類存放,創建兩個目錄:轉換,作業,
在【連接】標簽中,可以看到所有的資料庫連接,可以點擊右上角的相關功能按鈕進行修改、增加、洗掉,
在【安全】標簽中,可以看到所有的資源庫用戶,可以點擊右上角的相關功能按鈕進行修改、增加、洗掉,
連接上資源庫之后可以進行創建腳本,編輯完成后點擊【檔案】-【保存】按鈕,就可以將腳本保存在資源庫中,
如果想打開資源庫之外的腳本,可以點擊【檔案】-【從URL打開檔案】,然后點擊【檔案】-【另存為】將腳本保存在資源庫中,
如果想將資源庫內的腳本保存在本地計算機中,可以點擊【檔案】-【另存為VFS】,選擇相應的路徑,輸入相應的名稱后,點擊【OK】,
五、備份資源庫
檔案資源庫:可以直接備份保存腳本的檔案夾,
資料庫資源庫:可以使用資料庫備份工具進行備份,也可以與主資料使用腳本統一備份,
著作權宣告:本文為博主原創文章,于2021年4月17日首發于CSDN,轉載請附上原文出處鏈接和本宣告,本文鏈接:https://blog.csdn.net/u011046671/article/details/115756193
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/277481.html
標籤:其他
上一篇:豪擲197億美元!微軟收購Siri背后的語音技術研發公司
下一篇:論文《Attentive Collaborative Filtering: Multimedia Recommendation with Item- and Componet-Level ...》閱讀
