国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語(yǔ)言編程技術(shù)及教程分享平臺(tái)!
分類(lèi)導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

2021-05-19 00:32老_大叔o Python

無(wú)論是是自動(dòng)化登錄還是爬蟲(chóng),總繞不開(kāi)驗(yàn)證碼,這次就來(lái)談?wù)刾ython中光學(xué)識(shí)別驗(yàn)證碼模塊Tesseract,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下

無(wú)論是是自動(dòng)化登錄還是爬蟲(chóng),總繞不開(kāi)驗(yàn)證碼,這次就來(lái)談?wù)?a href="/article/86900.html">python中光學(xué)識(shí)別驗(yàn)證碼模塊tesserocrpytesseracttesserocrpytesseract是python的一個(gè)ocr識(shí)別庫(kù),但其實(shí)是對(duì)tesseract做的一層python api封裝,pytesseract是google的tesseract-ocr引擎包裝器;所以它們的核心是tesseract,因此在安裝tesserocr之前,我們需要先安裝tesseract

下載安裝

下載地址:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v4.0.0.20181030.exe

下載完成后,雙擊安裝,可以勾選additional language data(download)選項(xiàng)來(lái)安裝ocr識(shí)別支持的語(yǔ)言包,但下載語(yǔ)言包實(shí)在是慢,我們可以直接從https://github.com/tesseract-ocr/tessdata/下載zip的語(yǔ)言包壓縮文件,解壓后將tessdata-master中的文件復(fù)制到tesseract的安裝目錄c:\program files (x86)\tesseract-ocr\tessdata目錄下,最后我們配置下環(huán)境變量,我們將c:\program files (x86)\tesseract-ocr添加到環(huán)境變量中。進(jìn)入命令提示符,輸入tesseract,顯示下圖結(jié)果,說(shuō)明配置完成

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

查看安裝了的語(yǔ)言包:tesseract --list-langs

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

顯示我一共安裝了167種語(yǔ)言包,里邊包含英文或者其他字符。

測(cè)試

實(shí)驗(yàn)用的二維碼

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

基本使用語(yǔ)法
tesseract image.png result (tesseract 圖片名稱(chēng) 生成文件名稱(chēng))

結(jié)果

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

由結(jié)果來(lái)看,識(shí)別出來(lái)了p、2和x,但是把c識(shí)別成了g,識(shí)別度還是比較高,接下來(lái)看在python中的使用

python引入tesseract

在python下使用pip命令即可完成下載安裝 pip install pytesseract

識(shí)別驗(yàn)證碼腳本

?
1
2
3
4
import pytesseract
from pil import image
im=image.open('pin.png')
print(pytesseract.image_to_string(im))

結(jié)果

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

這樣識(shí)別的結(jié)果同樣跟上文一樣,個(gè)別字符識(shí)別的不是很準(zhǔn)確

圖像處理

現(xiàn)在網(wǎng)站上的二維碼設(shè)計(jì)的通常很難復(fù)雜,如果直接識(shí)別的話(huà)很難識(shí)別出來(lái),下面這段代碼是進(jìn)行灰度處理和二值化

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import pytesseract
from pil import image
im=image.open('5.jpg')
#進(jìn)行置灰處理
im=im.convert('l')
#這個(gè)是二值化閾值
threshold=150
table=[]
for i in range(256):
 if i<threshold:
  table.append(0)
 else:
  table.append(1)
#通過(guò)表格轉(zhuǎn)換成二進(jìn)制圖片,1的作用是白色,0就是黑色
im=im.point(table,"1")
im.show()
print(pytesseract.image_to_string(im))

原圖

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

置灰和二值化后

python利用Tesseract識(shí)別驗(yàn)證碼的方法示例

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持服務(wù)器之家。

原文鏈接:https://nolon.xyz/archives/77/

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日韩av免费在线 | 国产狂做受xxxxx高潮 | 云南一级毛片 | 一区二区三区中文字幕 | 欧美视频区 | 免费看的av | 国产精品1区2区3区 久久免费一区 | 激情综合五月天 | 亚洲综合自拍 | 国产一区 | 国产精品免费一区 | 精品在线一区二区三区 | 久久中文字幕一区二区三区 | 一区二区中文 | 国产成人精品一区二区三区视频 | 成人激情在线 | 日本三级一区二区 | 中文字幕精品一区久久久久 | 亚洲福利片 | 精品三级三级三级三级三级 | 中文字幕 国产精品 | 91av在线视频播放 | 国产精品亚洲视频 | 色之久久综合 | 日韩视频精品在线 | 国产日韩免费视频 | 亚洲国产精品网站 | 国产黄色91视频 | 99久久精品国产一区二区三区 | 亚洲精品视频在线 | 国产综合久久 | 免费av在线播放 | 欧美一区二区黄色 | 国产精品一卡二卡三卡 | 亚洲欧美中文字幕 | 亚洲aaa在线观看 | 一级片在线观看 | 中文字幕在线观看日本 | 九九福利 | 精品久久久久久久久久久 | 久久久久久夜 |