国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Mysql|Sql Server|Oracle|Redis|MongoDB|PostgreSQL|Sqlite|DB2|mariadb|Access|數據庫技術|

服務器之家 - 數據庫 - Sql Server - SQL Server 全文搜索功能介紹

SQL Server 全文搜索功能介紹

2020-05-24 15:14悅光陰 Sql Server

SQL Server 的全文搜索(Full-Text Search)是基于分詞的文本檢索功能,依賴于全文索引。下面通過本文給大家介紹SQL Server 全文搜索功能介紹,需要的朋友參考下吧

SQL Server 的全文搜索(Full-Text Search)是基于分詞的文本檢索功能,依賴于全文索引。全文索引不同于傳統的平衡樹(B-Tree)索引和列存儲索引,它是由數據表構成的,稱作倒轉索引(Invert Index),存儲分詞和行的唯一鍵的映射關系。倒轉索引是在創建全文索引或更新全文索引時,由SQL Server自動創建和維護的。全文索引主要包含三種分析器:分詞器(Word Breaker)、詞干分析器(stemmer)和同義詞分析器。全文索引中存儲的數據是分詞及其位置等信息,分詞是基于特定語言的語法規則,按照特定的符號尋找詞語的邊界,把文本分解為“單詞”,每一個單詞叫做一個分詞(term);全文索引有時會提取分詞的詞干,把詞干的多種派生形式存儲為單一詞干,這個過程叫做提取詞干;根據用戶提供的自定義同義詞列表,把相關的單詞轉換為同義詞,這個過程叫做提取同義詞。

生成全文索引是把用戶表中的文本數據進行分詞(Word breaker)和提取詞干(Stemmer),并轉換同義詞(Thesaurus),過濾掉分詞中的停用詞(Stopword),最后把處理之后的數據存儲到全文索引中。把數據存儲到全文數據的過程叫做填充(Populate)或爬蟲(Crawl)進程,全文索引的更新方式可以手動填充,自動填充,或增量填充。

一,創建全文目錄和唯一索引

創建全文索引之前,必須創建全文目錄(Full-Text Catalog),全文目錄用于組織全文索引,是全文索引的容器。每一個全文索引必須屬于一個全文目錄。全文目錄是個邏輯結構,跟數據庫的架構(Schema)相同,根據全文索引的存儲位置無關。

?
1
2
create fulltext catalog catalog_test
as default;

為了創建全文索引,基礎表上必須存在一個唯一的(unique)、單列的(single-column)、非空的(non-nullable)的索引,全文引擎使用該索引把基礎表上的每行數據映射唯一索引鍵上,倒轉索引存儲的就是該索引鍵和分詞之間的映射關系。

?
1
2
3
create unique index uidx_dbLogID
on [dbo].[DatabaseLog]
([DatabaseLogID]);

二,創建全文索引

每個表只能創建一個全文索引,創建全文索引時,必須考慮全文索引存儲的文件組,全文索引關聯的停用詞列表,全文索引的更新方式,以及跟文本關聯的語言,全文索引列必須是文本字段,例如:

?
1
2
3
4
5
6
7
8
create fulltext index
on [dbo].[DatabaseLog]
(
[tsql] language 1033
)
key index ui_dbLogID
on (catalog_test,filegroup [primary])
with(change_tracking=off ,no population ,stoplist=system);

1,語言(language)

選項 language 是可選的,用于指定列級別的語言,該選項的值可以是語言的名稱或LCID,如果沒有指定language選項,那么使用SQL Server實例的默認語言。從系統視圖 sys.fulltext_languages (Transact-SQL)中查看系統支持的語言及其對應的LCID 和名稱。

2,全文目錄(fulltext_catalog)

選項fulltext_catalog_name 用于指定全文索引的分組,

3,文件組(filegroup)

選項 filegroup filegroup_name 用于指定全文索引存儲的文件組,如果沒有指定文件組,那么全文索引和基礎表存儲在相同的文件組中。由于更新全文索引是IO密集型操作,因此,為了更快的更新全文索引,最好把全文索引存儲在不同于基礎表的的物理硬盤或文件組上,以達到最大的IO并發。

4,填充全文索引的方式

和普通的索引相同,當基礎表數據更新時,全文索引必須自動更新,這是系統默認的行為,也可以配置手動更新全文索引,或者間隔特定的時間點自動更新全文索引。

選項CHANGE_TRACKING 用于指定跟全文索引列相關的數據更新(Update,Delete,或Insert)是否需要同步到全文索引,
•CHANGE_TRACKING = MANUAL :手動更新
•CHANGE_TRACKING =AUTO:自動更新,默認設置,當基礎表數據變化時,全文索引自動更新,
•CHANGE_TRACKING =OFF , NO POPULATION:不更新,指定選項NO POPULATION,表明在創建全文索引之后,SQL Server不會更新(populate)全文索引;如果未指定選項NO POPULATION,在創建全文索引之后,SQL Server更新全文索引。

5,停用詞(STOPLIST)

停用詞(StopWord)也稱作噪音詞,每一個全文索引都會關聯一個停用詞列表,默認情況下,全文索引關聯的是系統停用詞(system stoplist)。全文引擎把停用詞從分詞中刪除,使全文索引不會包含停用詞。

?
1
STOPLIST [ = ] { OFF | SYSTEM | stoplist_name }

三,填充全文索引

填充全文索引也叫做爬蟲(crawl)進程,或填充(Population)進程。由于創建或填充全文索引會消耗大量的系統(IO、內存)資源,因此盡量選擇在系統空閑時對全文索引進行填充。在創建全文索引時,通過指定選項 CHANGE_TRACKING= MANUAL,或 CHANGE_TRACKING= OFF, NO POPULATION,新建的全文索引不會立即填充,用戶可以選擇在系統空閑時,使用 alter fulltext index 語句執行填充操作。只有填充全文索引之后,全文索引才包含基礎表的分詞數據。

?
1
2
3
alter fulltext index
on table_name
start { full | incremental | update } population;

更新全文索引有三種方式:

•FULL POPULATION:全部填充,從基礎表中獲取每一行,重新編入全文索引;
•INCREMENTAL POPULATION:增量填充,前提是基礎表中包含timestamp字段,從上一次填充之后,只把更新之后的數據編入全文索引;
•UPDATE POPULATION:更新填充,從上一次填充之后執行更新(insert、update、或delete)操作的數據行重新編入索引;

在創建全文索引時,如果指定CHANGE_TRACKING=AUTO   或   CHANGE_TRACKING=  OFF , 那么新建的全文索引會立即開始填充進程。

四,使用 contains 謂詞查詢全文索引

如果想要在查詢中使用全文索引,通常使用CONTAINS謂詞來調用全文索引,實現比LIKE關鍵字更復雜的文本匹配查詢,而LIKE關鍵字是模糊匹配,不會調用全文索引。

例如,利用contains謂詞執行單個分詞的完全匹配查詢:

?
1
2
3
select [tsql]
from [dbo].[DatabaseLog]
where contains([tsql], 'searchword', language 1033);

全文查詢跟Like相比,速度更快,支持的搜索功能更復雜,使用contains謂詞,不僅能夠執行分詞的完全匹配或分詞的前綴匹配查詢,還能夠執行基于詞根的查詢,基于自定義同義詞的查詢,基于距離和順序的相鄰分詞查詢。但是,和Like 相比,contains謂詞不能進行后綴匹配查詢。

contains謂詞返回的結果是布爾值,如果全文索引列中包含指定的關鍵字或查找模式(pattern),返回TRUE;否則,返回FALSE。

contains謂詞支持word查詢和短語查詢,word是指單個分詞,短語(phrase)是由多個word和間隔的空格組成的,對于短語,必須使用雙引號,將多個word組成一個短語。

1,邏輯組合查詢

使用and ,and not, 或 or 邏輯運算符 匹配多個word 或 多個phrase

?
1
2
CONTAINS(Name, '"Mountain" OR "Road" ')
CONTAINS(Name, ' Mountain OR Road ')

2,前綴查詢

使用contains謂詞進行前綴匹配,和like 'prefix%'功能相同,只不過contains謂詞使用“*”作為通配符,“*”匹配0,1或多個字符,前綴匹配的寫法是:'"prefix*"',全文索引只能執行前綴匹配。

?
1
2
CONTAINS(Name, ' "Chain*" ')
CONTAINS(Name, '"chain*" OR "full*"')

3,查詢同義詞(thesaurus)或詞干(stemmer)

Stemmer(詞干),例如,根據語法規程,英語的動詞 根據數(單數,復數),人稱,時態的不同而存在不同的變化形式,這些單詞都是同源的。

?
1
CONTAINS(Description, ' FORMSOF (INFLECTIONAL, ride) ')

THESAURUS (同義詞),需要導入XML進行配置,SQL Server 提供一個默認的Thesaurus file,是Empty的。如果在Thesaurus file 配置“Author”,“Writer”,“journalist” 是同義詞,在使用fulltext index查詢時,只要滿足任意一個同義詞,都匹配成功。

?
1
CONTAINS(Description, ' FORMSOF (THESAURUS, author) ')

4,距離查詢

使用 near 函數,查詢匹配相鄰分詞的數據行,near函數的定義如下,用于需要在查詢模式中指定距離查詢的查詢模式:

?
1
NEAR ( ( { <simple_term> | <prefix_term> } [ ,…n ] ) [, <maximum_distance> ] [, <match_order> ] )

例如:使用Near 函數指定相鄰分詞的距離和匹配順序,near((term1,term2,term3),5)表示任意兩個term之間的距離不能超過5, near((term1,term2,term3),5,true),表示任意兩個term的距離不能超過5,并且按照 term1,term2,term3的順序存在于字符串中。

?
1
2
3
4
5
6
--regardless of the intervening distance and regardless of order
CONTAINS(column_name, 'NEAR(term1,"term3 term4")')
--searches for "AA" and "BB", in either order, within a maximum distance of five
CONTAINS(column_name, 'NEAR((AA,BB),5)')
--in the specified order with regardless of the distance
CONTAINS(column_name, 'NEAR ((Monday, Tuesday, Wednesday), MAX, TRUE)')

對于 near((term1,term2,term3),5,true),term1 和 term5之間最多存在5個term,不包括內部的搜索分詞,“term2”,例如:

?
1
CONTAINS(column_name, 'NEAR((AA,BB,CC),5)')

這個查詢會匹配下面的文本,注意,內部的搜索分詞CC沒有計算距離:

?
1
BB one two CC three four five AA

例如,在原文本中,分詞bike和control的最大距離不能超過10,分詞bike必須出現在分詞control的前面:

?
1
CONTAINS(Comments , 'NEAR((bike,control), 10, TRUE)')

SQL Server提供的全文搜索功能,比LIKE關鍵字豐富,具備初級的全文搜索功能,速度快,維護簡單,缺點是,全文搜索功能非常有限,在實際的開發中,可以配合開源的全文搜索引擎,例如,Solr,Elasticsearch等來開發功能更強大的全文搜索功能。

總結

以上所述是小編給大家介紹的SQL Server 全文搜索功能介紹,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復大家的!

原文鏈接:http://www.cnblogs.com/ljhdo/archive/2017/12/15/5041605.html

延伸 · 閱讀

精彩推薦
Weibo Article 1 Weibo Article 2 Weibo Article 3 Weibo Article 4 Weibo Article 5 Weibo Article 6 Weibo Article 7 Weibo Article 8 Weibo Article 9 Weibo Article 10 Weibo Article 11 Weibo Article 12 Weibo Article 13 Weibo Article 14 Weibo Article 15 Weibo Article 16 Weibo Article 17 Weibo Article 18 Weibo Article 19 Weibo Article 20 Weibo Article 21 Weibo Article 22 Weibo Article 23 Weibo Article 24 Weibo Article 25 Weibo Article 26 Weibo Article 27 Weibo Article 28 Weibo Article 29 Weibo Article 30 Weibo Article 31 Weibo Article 32 Weibo Article 33 Weibo Article 34 Weibo Article 35 Weibo Article 36 Weibo Article 37 Weibo Article 38 Weibo Article 39 Weibo Article 40
主站蜘蛛池模板: chinese国产一区二区 | 黄色片在线看 | 亚洲 中文 欧美 日韩 在线观看 | 99热精品视 | 一级黄色a毛片 | 成人av一区二区三区 | 91精品国产综合久久久久 | 国产 日韩 欧美 中文 在线播放 | 韩国精品一区二区 | 精品国产欧美一区二区三区成人 | 久草电影网| 黄色在线观看视频网站 | 亚洲黄色特级片 | 国产在线视频一区 | www.日韩在线观看 | 久久久久成人精品 | 五月婷婷丁香在线 | 精品久久一二三区 | 成人激情在线 | 日韩国产高清在线 | 黄视频网站免费观看 | 国产一级一级特黄女人精品毛片 | 日韩精品久久久 | 久草在线 | 亚洲电影二区 | 国产精品久久久久久久久 | www.888www看片 | a资源在线观看 | 婷婷五月在线视频 | x99av成人免费 | 日韩中文字幕一区 | 高清免费毛片 | 国产又色又爽又黄 | 亚洲一区三区 | a级片在线观看 | 欧美亚洲视频在线观看 | 不卡视频在线 | 26uuu成人免费毛片 | 99热a| 91视频免费看 | 91短视频版在线观看www免费 |