亚洲成色777777在线观看影院,99在线精品视频,国产美女视频

java中文分詞之正向最大匹配法實例代碼

2021-01-29 11:59xiaoyeyopulei Java教程

中文分詞應(yīng)用很廣泛，網(wǎng)上也有很多開源項目，下面這篇文章主要給大家介紹了關(guān)于java中文分詞之正向最大匹配法的相關(guān)資料，文中通過示例代碼介紹的非常詳細，需要的朋友可以參考借鑒，下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。

前言

基于詞典的正向最大匹配算法（最長詞優(yōu)先匹配），算法會根據(jù)詞典文件自動調(diào)整最大長度，分詞的好壞完全取決于詞典。

所謂詞典正向最大匹配就是將一段字符串進行分隔，其中分隔的長度有限制，然后將分隔的子字符串與字典中的詞進行匹配，如果匹配成功則進行下一輪匹配，直到所有字符串處理完畢，否則將子字符串從末尾去除一個字，再進行匹配，如此反復(fù)。

算法流程圖如下：

java中文分詞之正向最大匹配法實例代碼

下面給大家主要講一下中文分詞里面算法的簡單實現(xiàn)，廢話不多說了，現(xiàn)在先上代碼

示例代碼

java" id="highlighter_468380">

									package com; 

									import java.util.arraylist; 

									import java.util.list; 

									public class segmentation1 { 

									 private list<string> dictionary = new arraylist<string>(); 

									 private string request = "北京大學(xué)生前來應(yīng)聘"; 

									 public void setdictionary() { 

									 dictionary.add("北京"); 

									 dictionary.add("北京大學(xué)"); 

									 dictionary.add("大學(xué)"); 

									 dictionary.add("大學(xué)生"); 

									 dictionary.add("生前"); 

									 dictionary.add("前來"); 

									 dictionary.add("應(yīng)聘"); 

									 } 

									 public string leftmax() { 

									 string response = ""; 

									 string s = ""; 

									 for(int i=0; i<request.length(); i++) { 

									  s += request.charat(i); 

									  if(isin(s, dictionary) && aheadcount(s, dictionary)==1) { 

									  response += (s + "/"); 

									  s = ""; 

									  } else if(aheadcount(s, dictionary) > 0) { 

									  } else { 

									  response += (s + "/"); 

									  s = ""; 

									  } 

									 } 

									 return response; 

									 } 

									 private boolean isin(string s, list<string> list) { 

									 for(int i=0; i<list.size(); i++) { 

									  if(s.equals(list.get(i))) return true; 

									 } 

									 return false; 

									 } 

									 private int aheadcount(string s, list<string> list) { 

									 int count = 0; 

									 for(int i=0; i<list.size(); i++) { 

									  if((s.length()<=list.get(i).length()) && (s.equals(list.get(i).substring(0, s.length())))) count ++; 

									 } 

									 return count; 

									 } 

									 public static void main(string[] args) { 

									 segmentation1 seg = new segmentation1(); 

									 seg.setdictionary(); 

									 string response1 = seg.leftmax(); 

									 system.out.println(response1); 

									 } 

									}