国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語言編程技術(shù)及教程分享平臺!
分類導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - 編寫簡單的Python程序來判斷文本的語種

編寫簡單的Python程序來判斷文本的語種

2020-05-31 10:49腳本之家 Python

這篇文章主要介紹了編寫簡單的Python程序來判斷語種,代碼非常簡單,主要用到了langid工具包,需要的朋友可以參考下

1.問題的描述

用Python進(jìn)行文本處理時,有時候處理的文本中包含中文、英文、日文等多個語系的文本,有時候不能同時進(jìn)行處理,這個時候就需要判別當(dāng)前文本是屬于哪個語系的。Python中有個langid工具包提供了此功能,langid目前支持97種語言的檢測,非常好用。


2.程序的代碼

以下Python是調(diào)用langid工具包來對文本進(jìn)行語言檢測與判別的程序代碼:
 

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
import langid                             #引入langid模塊
  
def translate(inputFile, outputFile):
  fin = open(inputFile, 'r')                  #以讀的方式打開輸入文件
  fout = open(outputFile, 'w')                 #以寫的方式打開輸出文件
  
  for eachLine in fin:                     #依次讀入每一行
    line = eachLine.strip().decode('utf-8', 'ignore')   #去除每行的首位空格等,并統(tǒng)一轉(zhuǎn)化成Unicode
    lineTuple = langid.classify(line)           #調(diào)用langid來對該行進(jìn)行語言檢測
    if lineTuple[0] == "zh":               #如果該行語言大部分為中文,則不進(jìn)行任何處理
      continue
  
    outstr = line                     #如果該行語言為非中文,則準(zhǔn)備輸出
    fout.write(outstr.strip().encode('utf-8') + '\n')   #輸出非中文的行,從Unicode轉(zhuǎn)化成utf-8輸出
  
  fin.close()
  fout.close()
  
if __name__ == '__main__':                      #相當(dāng)于main函數(shù)
  translate("myInputFile.txt", "myOutputFile.txt")

 以上代碼是用來處理一個文本,將不屬于中文的行依次輸出到一個新的文件。

 
3.注意

第9、10行代碼,langid.classify(line)的輸出結(jié)果是一個二元組,二元組的第一項表示該文本所屬的語系,如:zh表示中文、en表示英語、等等;二元組的第二項表示該文本中屬于第一項中語系的所占比例。

 

希望對大家有所幫助。

延伸 · 閱讀

精彩推薦
Weibo Article 1 Weibo Article 2 Weibo Article 3 Weibo Article 4 Weibo Article 5 Weibo Article 6 Weibo Article 7 Weibo Article 8 Weibo Article 9 Weibo Article 10 Weibo Article 11 Weibo Article 12 Weibo Article 13 Weibo Article 14 Weibo Article 15 Weibo Article 16 Weibo Article 17 Weibo Article 18 Weibo Article 19 Weibo Article 20 Weibo Article 21 Weibo Article 22 Weibo Article 23 Weibo Article 24 Weibo Article 25 Weibo Article 26 Weibo Article 27 Weibo Article 28 Weibo Article 29 Weibo Article 30 Weibo Article 31 Weibo Article 32 Weibo Article 33 Weibo Article 34 Weibo Article 35 Weibo Article 36 Weibo Article 37 Weibo Article 38 Weibo Article 39 Weibo Article 40
主站蜘蛛池模板: 亚洲视频一区二区三区 | 在线播放亚洲 | 免费一级片在线观看 | 性做久久久久久久免费看 | 久久久网 | 亚洲精品99| 国产欧美精品一区二区三区 | 在线国产视频 | 国产最好的精华液网站 | 91精品视频在线 | 精品九色| 国产精品自产拍在线观看 | 天天干天天操 | 亚洲一区视频在线 | 在线观看亚洲专区 | 色婷网| a久久 | 欧美日韩第一页 | 日韩中文字幕在线播放 | 国产一区二区三区四区在线观看 | 人和拘一级毛片 | 综合网av | 激情欧美日韩一区二区 | 日韩一区二区三区精品 | 日韩视频免费 | 国产一级在线免费观看 | 欧美大片一区 | 成人毛片久久 | 久久三区 | 亚洲国产精品99久久久久久久久 | 欧美专区在线观看 | 欧美国产一区二区三区 | 色综合视频在线 | 欧美日韩国产一区 | 国产激情 | 日韩欧美一区二区三区免费观看 | 日本一区二区免费在线观看 | 欧美日韩中文 | 国产高清精品在线 | 亚洲在线视频 | 成年免费观看 |