国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - 正則表達式 - 基于Python正則表達式提取搜索結果中的站點地址

基于Python正則表達式提取搜索結果中的站點地址

2020-08-18 14:20正則教程網 正則表達式

正則表達式對于Python來說并不是獨有的,最近在鼓搗一個東西把google搜索的結果中所有的站點地址導出,于是想到用python正則表達式提取搜索結果中的站點地址,小編把具體實現思路整理分享給大家

正則表達式對于Python來說并不是獨有的,最近在把google搜索的結果中所有的站點地址導出,于是想到用python正則表達式提取搜索結果中的站點地址。

這其中涉及幾個需要解決的問題:

1、獲取搜索的結果文本

為了獲得更多的地址,我使用了Google的高級搜索功能,每個頁面顯示100條結果。

獲得顯示的結果后,可以查看源碼,并保持成文本文件就有了搜索的結果文本

2、分析如何提取站點信息

首先需要分析獲取的頁面,查看以怎樣的方式可以提取出站點信息。

我使用IE8自帶的開發工具(按F12就會彈出來)中的探查器功能查看自己要關心的內容有什么特殊的格式

基于Python正則表達式提取搜索結果中的站點地址

從上圖可以看出我需要的站點在標簽<cite></cite>中,所以我使用正則表達式提取這其中的文本是否就可以呢?

3、編寫正則表達式來獲取站點地址

接下來的就是寫表達式了,我使用Python3.2編寫的,方便好用(~_~)

代碼如下,先把搜索結果頁面保持到e:/t3.txt中,在執行如下代碼

?
1
2
3
4
5
import re
p = re.compile(r'<cite>([^<>\/].+?)</cite>')
f = open("e:/t3.txt", encoding='utf-8')
content = f.read()
print ("\n".join(p.findall(content)))

運行如下:基于Python正則表達式提取搜索結果中的站點地址

大家可以對照一下運行效果圖,看看所有的站點地址是不是都給獲取到了。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日本99精品| 国产欧美久久一区二区三区 | av网站免费在线观看 | 亚洲欧美成人综合 | 一级毛片免费看 | 中文字幕91 | 亚洲成av人影片在线观看 | 亚洲一区二区精品在线观看 | 日韩成人一区 | 日韩性视频 | 欧美电影在线观看网站 | 成人在线国产 | 中文字幕一区二区三区不卡 | 亚洲国产精品久久久 | 成人久久18免费观看 | 国产福利视频在线 | 中文字幕乱码视频32 | 成人免费大片黄在线播放 | 久久免费一区 | 香蕉大人久久国产成人av | 羞羞视频在线播放 | 毛片av在线播放 | 黄色在线不卡 | 男人天堂网av | 色网网站| 国产成人精品亚洲日本在线观看 | 成人不卡视频 | 午夜精品一区二区三区免费视频 | 激情久久久 | 国产在线成人 | 日韩国产高清在线 | 欧美激情五月 | 久久久久9999国产精品 | 成人黄色在线 | 亚洲国产精品久久久久久 | 91精品久久久久久综合五月天 | 亚洲一区二区三区在线免费观看 | 日韩成人一区 | 在线视频 亚洲 | 久久亚洲一区 | 亚洲 欧美 日韩 在线 |