国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|JAVA教程|ASP教程|編程技術|正則表達式|

服務器之家 - 編程語言 - JAVA教程 - 淺談JAVA字符串匹配算法indexOf函數的實現方法

淺談JAVA字符串匹配算法indexOf函數的實現方法

2020-07-15 14:43黃林晴 JAVA教程

這篇文章主要介紹了淺談字符串匹配算法indexOf函數的實現方法,indexOf函數我們可以查找一個字符串(模式串)是否在另一個字符串(主串)出現過。對此感興趣的可以來了解一下

前言

相信每個學習過Java的人都使用過indexOf函數,indexOf函數我們可以查找一個字符串(模式串)是否在另一個字符串(主串)出現過,返回結果表示出現位置的下標,如果返回-1,表示模式串在主串中不存在,那么,你可曾想過這些查找函數又是如何實現的呢?

淺談JAVA字符串匹配算法indexOf函數的實現方法

從indexOf源碼看起

首先我們先來看一下indexOf的源碼,indexOf的使用方式比較多,這是我們以一個形參的為例。

?
1
2
3
4
5
6
static String mainString = "Hello my name is HuangLinqing";
static String patternString = "HuangLinqing";
 
public static void main(String[] args) {
 System.out.printf(mainString.indexOf(patternString, 0) + "");
}

運行上面代碼的結果,返回的結果是17,說明模式串在主串中存在,并且第一次出現的位置下標是17

indexOf方法最終會走到下面方法中,源碼如下所示:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
/**
 * Code shared by String and StringBuffer to do searches. The
 * source is the character array being searched, and the target
 * is the string being searched for.
 *
 * @param source the characters being searched.
 * @param sourceOffset offset of the source string.
 * @param sourceCount count of the source string.
 * @param target the characters being searched for.
 * @param targetOffset offset of the target string.
 * @param targetCount count of the target string.
 * @param fromIndex the index to begin searching from.
 */
static int indexOf(char[] source, int sourceOffset, int sourceCount,
 char[] target, int targetOffset, int targetCount,
 int fromIndex) {
 if (fromIndex >= sourceCount) {
 return (targetCount == 0 ? sourceCount : -1);
 }
 if (fromIndex < 0) {
 fromIndex = 0;
 }
 if (targetCount == 0) {
 return fromIndex;
 }
 char first = target[targetOffset];
 int max = sourceOffset + (sourceCount - targetCount);
 for (int i = sourceOffset + fromIndex; i <= max; i++) {
 /* Look for first character. */
 if (source[i] != first) {
  while (++i <= max && source[i] != first);
 }
 /* Found first character, now look at the rest of v2 */
 if (i <= max) {
  int j = i + 1;
  int end = j + targetCount - 1;
  for (int k = targetOffset + 1; j < end && source[j]
   == target[k]; j++, k++);
  if (j == end) {
  /* Found whole string. */
  return i - sourceOffset;
  }
 }
 }
 return -1;
}

代碼行數不多,接下來我們來分析一下,上面的代碼,fromIndex默認是0,target是模式串,targetCount是模式串的大小,source是主串,sourceCount是主串的大小

?
1
2
3
4
5
6
7
8
9
if (fromIndex >= sourceCount) {
 return (targetCount == 0 ? sourceCount : -1);
}
if (fromIndex < 0) {
 fromIndex = 0;
}
if (targetCount == 0) {
 return fromIndex;
}

如果開始查找的位置大于主串的大小,如果模式串是空串就返回主串的大小,否則返回-1,如果模式串的大小等于0就是開始查找的位置,這幾行代碼很好理解,就不舉例子了,主要是下面的代碼:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
char first = target[targetOffset];
int max = sourceOffset + (sourceCount - targetCount);
 
for (int i = sourceOffset + fromIndex; i <= max; i++) {
 /* Look for first character. */
 if (source[i] != first) {
 while (++i <= max && source[i] != first);
 }
 /* Found first character, now look at the rest of v2 */
 if (i <= max) {
 int j = i + 1;
 int end = j + targetCount - 1;
 for (int k = targetOffset + 1; j < end && source[j]
  == target[k]; j++, k++);
 if (j == end) {
  /* Found whole string. */
  return i - sourceOffset;
 }
 }
}

indexOf底層使用的方法是典型的BF算法,我們先來簡單介紹BF算法,再回過頭來理解上面的代碼就比較容易了

BF與RK算法

BF算法

BF算法就是Brute Force,暴力匹配算法,也成為樸素匹配算法,主串的大小是sourceSize,模式串的大小是targetSize,因為我們要在主串中查找模式串,所以sourceZize > targetSize,所以從主串下標為0開始,連續查找targetSize個字符,再從下標為1開始后,一直到,下標為sourceSize - targetSize ,舉個簡單的例子在ABCDEFG中查找EF:

淺談JAVA字符串匹配算法indexOf函數的實現方法

上圖依次表示從i為0,到i為4時的依次比較,從圖中我們也可以看出,BF算法是比較耗時的,因為比較的次數較多,但是實際比較的時候主串和模式串都不會太長,所以這種比較的方法更容易使用。

現在我們回過頭看看indexOf的下半部分源碼,我相信其實不用解釋了。

RK算法

RK算法其實就是對BF算法的升級,還是以上面的圖為例,在ABCDEFG中查找EF的時候,比如下標為0的時候,我們去比較A和E的值,不相等就不繼續往下比較了,但是比如我們現在查找CDF是否在主串中存在,我們要從C已知比較大E發現第三位不相等,這樣當模式串前一部分等于主串,只有最后一位不相等的時候,比較的次數太多了,效率比較低,所以我們可以采用哈希計算來比較,哈希計算 后面我會補充一篇。

我們要將模式串和sourceSize - targetSize + 1 個字符串相比,我們可以先將sourceSize - targetSize + 1個模式串進行哈希計算。與哈希計算后的模式串相比較,如果相等則存在,對于哈希沖突在一般實現中概率比較低,不放心的話我們可以在哈希值相等時候再比較一次原字符串確保準確,哈希的沖突概率也和哈希算法的本身設計有關。這樣的話,我們首先計算AB的哈希值 與 模式串的相比較,然后計算BC的哈希值與模式串相比較,直到比較出相等的返回下標即可。

到此這篇關于淺談字符串匹配算法從indexOf函數的實現方法的文章就介紹到這了,更多相關字符串匹配算法從indexOf函數的實現方法內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://blog.csdn.net/huangliniqng/article/details/103677768

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日韩亚洲| 午夜在线影院 | 国产视频黄在线观看 | 欧美精品1区 | 欧美日韩一区二区三区在线观看 | 亚洲成人一区二区三区 | 色香蕉在线 | 国产精品免费久久久久久久久久中文 | 午夜影院在线 | 在线一区视频 | 日韩欧美在线一区 | 久草视频免费看 | 在线观看a视频 | 免费看国产片在线观看 | 日本视频免费 | 99re热精品视频 | 中文字幕一区二区三 | 成人午夜在线播放 | 欧美激情免费 | 看av的网址 | 欧美1区2区 | 国产传媒视频 | 91在线观看高清视频 | 99精品久久久| 蜜桃国精产品二三三区视频 | 精品国产子伦久久久久久小说 | 中文字幕精品一区 | 日韩中文视频 | 在线观看亚洲 | 亚洲综合色自拍一区 | 欧美黑人一级爽快片淫片高清 | 成人在线欧美 | 你懂的免费在线观看 | 午夜在线观看视频网站 | 亚洲色图一区二区三区 | 国产v日产∨综合v精品视频 | 精品精品 | 午夜精品久久久久久久久久久久 | 一本a道v久大 | 中文字幕啪啪 | 国产三级在线观看 |