MongoDB 是一個(gè)跨平臺(tái)的,面向文檔的數(shù)據(jù)庫,提供高性能,高可用性和可擴(kuò)展性方便。 MongoDB 工作在收集和文件的概念。
數(shù)據(jù)庫
數(shù)據(jù)庫是一個(gè)物理容器集合。每個(gè)數(shù)據(jù)庫都有自己的一套文件系統(tǒng)上的文件。一個(gè)單一的MongoDB服務(wù)器通常有多個(gè)數(shù)據(jù)庫。
集合
集合是一組MongoDB的文檔。它相當(dāng)于一個(gè)RDBMS表。收集存在于一個(gè)單一的數(shù)據(jù)庫。集合不執(zhí)行模式。集合內(nèi)的文檔可以有不同的領(lǐng)域。通常情況下,一個(gè)集合中的所有文件是相同或相關(guān)的目的。
文檔
文檔是一組鍵 - 值對(duì)。文件動(dòng)態(tài)模式。動(dòng)態(tài)模式是指,在相同集合中的文檔不需要具有相同的字段或結(jié)構(gòu)組的公共字段的集合的文檔,可以容納不同類型的數(shù)據(jù)。
1. 單表數(shù)據(jù)的導(dǎo)出
針對(duì)單表數(shù)據(jù)的導(dǎo)出操作,MongoDB 提供了 mongoexport 命令。mongoexport 既可以將數(shù)據(jù)導(dǎo)出為 CSV 格式的文件,也可以導(dǎo)出 JSON 格式的文件。這兩者之間的區(qū)別是:
JSON 是 mongoexport 默認(rèn)的導(dǎo)出格式,不需要指定,而要導(dǎo)出 CSV 格式的話需要明確指定;導(dǎo)出 CSV 格式必須顯式指定各屬性名,而導(dǎo)出 JSON 格式不需要。由此可見導(dǎo)出 JSON 格式更靈活、更方便,而且對(duì)于復(fù)雜的表結(jié)構(gòu)還不會(huì)有屬性丟失的風(fēng)險(xiǎn),因此筆者比較傾向于這種導(dǎo)出格式。本文示例用的就是這種格式。
trans.sp 表結(jié)構(gòu)如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
{ "_id" : ObjectId( "56ea7cc7ec8d83257c013844" ), "orderNum" : "804918166317174541239" , "sysOrderNum" : "43fd399715df4e874c773373c422a896" , "respCode" : "09" , "merId" : "991653448160401" , "transAmt" : NumberLong(300), "transStatus" : "10" , "transType" : NumberInt(1), "chanMerId" : "1244891002" , "chanCode" : "WXP" , "createTime" : "2016-03-17 17:45:43" , "updateTime" : "2016-03-17 17:45:43" , "refundStatus" : NumberInt(0), "fee" : NumberLong(2), "netFee" : NumberLong(2), "tradeFrom" : "openapi" , "lockFlag" : NumberInt(0), "settRole" : "WXP" , "currency" : "CNY" , "busicd" : "PAUT" , "agentCode" : "25911283" , "qrCode" : "weixin://wxpay/bizpayurl?pr=lh73Vjt" , "terminalid" : "802918" , "errorDetail" : "處理中" , "goodsInfo" : "雙山趣兒85g,3.0,1" , "discountAmt" : NumberLong(0), "merName" : "云高科技服務(wù)有限公司" , "agentName" : "白山機(jī)構(gòu)" } |
使用 mongoexport 將該表導(dǎo)出:
$ mongoexport --host localhost --port 27017 --username quicktest --password quicktest --collection trans.sp --db quicktest --out trans.sp.json
2016-03-14T14:23:36.985+0800 connected to: localhost:27017
2016-03-14T14:29:28.085+0800 exported 2823382 records
trans.sp.json 大小為 2.6 G,共計(jì)兩百八十萬條記錄,本次導(dǎo)出耗時(shí) 6 分鐘。各參數(shù)具體說明:
--host 后的 localhost:要導(dǎo)出數(shù)據(jù)庫 ip--port 后的 27017:要導(dǎo)出的實(shí)例節(jié)點(diǎn)端口號(hào)--username 后的 quicktest:數(shù)據(jù)庫用戶名--password 后的 quicktest:數(shù)據(jù)庫用戶密碼--collection 后的 trans.sp:要導(dǎo)出的表名--db 后的 quicktest:要導(dǎo)出的表所在數(shù)據(jù)庫名--out 后的 trans.sp.json:要導(dǎo)出的文件路徑(默認(rèn)為當(dāng)前文件夾)
2. 單表數(shù)據(jù)的導(dǎo)入
有借有還,MongoDB 提供了與 mongoexport 命令相對(duì)應(yīng)命令 mongoimport。以下是導(dǎo)入命令:
$ mongoimport --host localhost --port 27019 --username quicktest --password quicktest --collection trans.sp --db quicktest --file /opt/kdf/trans.sp.json
2016-03-17T18:15:33.909+0800 connected to: localhost:27019
2016-03-17T18:15:36.888+0800 [........................] quicktest.trans.sp 1
5.0 MB/2.5 GB (0.6%)
各參數(shù)具體說明:
-- host 后的 localhost:要導(dǎo)入的數(shù)據(jù)庫 ip--port 后的 27019:要導(dǎo)入的實(shí)例節(jié)點(diǎn)端口號(hào)--username 后的 quicktest:數(shù)據(jù)庫用戶名--password 后的 quicktest:數(shù)據(jù)庫用戶密碼--collection 后的 trans.sp:要導(dǎo)入的表名--db 后的 quicktest:要導(dǎo)入的表所在數(shù)據(jù)庫名--file 后的 /opt/kdf/trans.sp.json:要導(dǎo)入的源文件路徑(默認(rèn)為當(dāng)前文件夾)就這么簡單。
但是有一些地方還是需要注意一下的:
mongoimport 執(zhí)行導(dǎo)入前,新數(shù)據(jù)庫中沒有 trans.sp 表一樣可以導(dǎo)入成功;mongoexport 和 mongoimport 所需的各個(gè)參數(shù)輸入的先后順序不嚴(yán)格;對(duì)于副本集,mongoexport 的數(shù)據(jù)導(dǎo)出可以是副本集中的 primary 節(jié)點(diǎn),也可以是 secondary 節(jié)點(diǎn);對(duì)于副本集,mongoimport 的數(shù)據(jù)導(dǎo)入必須是 primary 節(jié)點(diǎn);對(duì)于大數(shù)據(jù)量的導(dǎo)出,用 mongoexport 操作完全不會(huì)有生產(chǎn)問題;對(duì)于大數(shù)據(jù)量的導(dǎo)入(超過 500 MB),用 mongoimport 操作的話會(huì)很容易將 primary 節(jié)點(diǎn)拖垮,因?yàn)檫@會(huì)導(dǎo)致全量同步導(dǎo)致主節(jié)點(diǎn)崩潰,所以要避免生產(chǎn)環(huán)境中大數(shù)據(jù)量的導(dǎo)入。正確的做法是先建立單點(diǎn),導(dǎo)入,之后再建立副本集。本文示例中所用 MongoDB 版本號(hào)為 3.2.1。
關(guān)于MongoDB單表數(shù)據(jù)的導(dǎo)出和恢復(fù)實(shí)例講解知識(shí)就給大家介紹到這里,希望對(duì)大家有所幫助!