組件結構
核心行程
在 MongoDB 中,核心行程主要包含了 mongod、mongos 和 mongosh 三個,
其中最主要的是 mongod 程式,其在不同的部署方案中(單機部署、副本集部署、分片集群部署),通過不同的配置,可以扮演多種不同的角色:
- 在單機部署中作為資料庫服務器(提供所有讀寫功能)
- 在副本集部署中,通過配置,可以部署為 Primary 節點(負責寫資料,也可以提供查詢)、Secondary 節點(從主節點復制資料,也可以提供查詢)、以及 Arbiter 節點(不保存資料,主要用于參與選舉投票)
- 在分片集群中,除了在每個分片中扮演上述角色外,還扮演著配置服務器的角色(存盤有分片集群的所有元資料資訊,mongos 的資料路由分發等都要依賴于它)
在一臺服務器上,可以啟動多個 mongod 服務,但在實際生產部署中,通常是建議一臺服務器部署一個 mongod 實體,這樣不僅減少資源競爭,而且服務器故障也不會同時影響到多個服務,
mongos 在分片集群中扮演路由的角色,提供客戶端和分片之間的介面,
mongosh 是 MongoDB 集成的互動式 shell 工具,
資料庫工具
MongoDB 資料庫工具是用于處理 MongoDB 部署的命令列實用程式的集合,資料庫工具包括以下二進制檔案:
- 二進制匯入匯出
- mongodump: 匯出 mongod 資料庫的二進制資料
- mongorestore: 恢復 mongodump 匯出檔案的資料到 mongod 或 mongos 資料庫
- bsondump: 轉換 BSON 匯出檔案成 JSON 格式
- 資料匯入匯出
- mongoimport: 從外部 JSON、CSV 或 TSV 檔案中加載資料
- mongoexport: 從 mongod 實體中匯出資料到 JSON 或 CSV 檔案中
- 診斷工具
- mongostat: 快速診斷當前運行的 mongod 或 mongos 實體的狀態
- mongotop: 統計 mongod 實體讀取和寫入資料的時間
- GridFS 工具
- mongofiles: 支持在 GridFS 物件中操作 MongoDB 實體中存盤的檔案
資料邏輯結構
MongoDB 資料邏輯結構分為資料庫 database、集合 collection、檔案 document 三層 :
- 一個 mongod 實體中允許創建多個資料庫
- 一個資料庫中允許創建多個集合,集合相當于關系型資料庫的表
- 一個集合則是由若干個檔案構成,檔案相當于關系型資料庫的行,是 MongoDB 中資料的基本單元
資料庫
一個資料庫中可以創建多個集合,原則上應把邏輯相近的集合都放在一個資料庫中,
在 MongoDB 中,會有以下幾個內建的資料庫:
- admin: 存放有資料庫帳號相關資訊,在身份驗證和授權時使用
- local: 特定于單個服務器的資料會存盤在此資料庫中,在副本集中,local 資料庫用于存盤復制程序中所使用的資料,而其本身不會被復制,
- config: 用于分片集群環境,存放了分片相關的元資料資訊
- test: 默認創建的測驗庫,連接 mongod 服務時,如果不指定連接的具體資料庫,默認就會連接到 test 資料庫
集合
和 SQL 的表不同,集合是動態模式,不需要在讀寫資料前創建模式就可以使用,集合中的檔案也可以擁有不同的欄位,隨時可以任意增減某個檔案的欄位,
默認情況下,集合不要求其檔案具有相同的模式,但這是一種很好的實踐,可以通過使用 MongoDB 的檔案驗證功能和可用于多種編程語言的物件–檔案映射(object-document mapping)庫來實作檔案驗證,
集合由其名稱進行標識,集合名稱可以是任意 UTF-8 字串,但有以下限制:
- 不能是空字串(
""), - 不能含有
\0(空字符),這個字符用于表示集合名稱的結束 - 不能以
system.開頭,該前綴為內部集合保留
集合名稱使用 . 字符可以創建子集合,用與區分不同組織集合,雖然子集合沒有任何特殊屬性,但它們很有用,許多 MongoDB 工具整合了子集合,
檔案
檔案是 MongoDB 中資料的基本存盤單元,以一種叫作 BSON 的檔案結構表示,
檔案中的鍵值對是有序的,不同序則是不同檔案,并且鍵是區分大小寫的,否則也為不同檔案,
檔案的鍵是字串,而值除了字串,還可以是 Int、Long、Double、Boolean、陣列、嵌入檔案等多種型別,
每個檔案都有一個默認的 _id 鍵,它相當于關系型資料庫中的主鍵,這個鍵的值在同一個集合中必須是唯一的,
_id 鍵的值默認是 ObjectId 型別,在插入檔案的時候,如果用戶不設定檔案的 _id 值的話,MongoDB 會自動生成一個唯一的 ObjectId 值進行填充,
資料庫檔案
MongoDB 在 3.2 版本已經將 WiredTiger 作為默認的存盤引擎,其作為存盤引擎的時候,資料庫會有以下存盤檔案:
collection-*.wt: 存盤集合的資料index-*.wt: 存盤索引的資料WiredTiger: 存盤基本配置資訊WiredTiger.wt: 存盤所有其他集合的元資料資訊WiredTiger.lock: 存盤行程 ID,用于防止多個行程連接同一個 WiredTiger 資料庫WiredTiger.turtle: 存盤WiredTiger.wt的元資料資訊journal: 存盤資料庫的寫日志
命令列工具
MongoDB 提供的 mongosh 是一個 JavaScript 的 shell,其提供了許多高級功能和自定義功能,
使用技巧
對于 MongoDB 提供的功能,shell 內置了幫助檔案,可以輸入 help 命令進行訪問,使用 db.help() 可以查看資料庫級別的幫助檔案,使用 db.foo.help() 可以查看集合級別的幫助檔案,
在 shell 中使用函式之前,在不使用括號的情況下輸入函式名,這樣會列印出函式的源代碼,這是一個可以查看函式具體行為的好方法,
執行腳本
shell 不止可以直接執行 JavaScript 的腳本代碼,還可以用于執行 JavaScript 的腳本檔案,簡單執行 mongo script.js 即可,
如果已經進入到 shell 中,可以使用 load() 函式加載 JavaScript 腳本檔案,
創建 .mongorc.js 檔案
對于需要頻繁被加載的腳本,可以將它們添加到 .mongorc.js 中,此檔案會在啟動 shell 時自動運行,
在更實際一些的場景中,使用此腳本可以設定全域變數,或者為長名稱設定一個簡短的別名,也可以重寫內置函式,
定制提示資訊
通過將 prompt 變數設定為一個字串或函式,可以重寫默認的 shell 提示,如下示例:
prompt = function() {
if (typeof db == 'undefined') {
return '(nodb)> ';
}
// 檢查最后的資料庫操作
try {
db.runCommand({getLastError: 1});
} catch (e) {
print(e);
}
return db+"> ";
};
提示函式應該回傳一個字串,通常應該包含對 getLastError 的呼叫,這樣可以捕獲輸入時的錯誤,并在 shell 斷開連接時自動重新連接,
編輯復雜變數
使用 shell 時,編輯多行的時候不能再編輯前面的行,這對于較大的代碼塊或物件非常不友好,
為此,可以在 shell 中設定 EDITOR 變數,則可以使用 edit varname 的方式編輯一個變數,完成更改后只需保存并退出編輯器,變數將被重新決議并加載回 shell 中,
不便使用的集合名稱
大多數情況下可以使用 db.collectionName 語法來獲得一個集合的內容,但如果集合名稱是保留字或是無效的 JavaScript 屬性名稱時,那么此方法就不能正常作業了,
對于上述的情況,可以使用 db.getCollection() 的方式繞過無效屬性,
首發于翔仔的個人博客,點擊查看更多,
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/533565.html
標籤:其他
