国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - 編程技術 - 火車頭采集器采集多頁內容的抓取教程

火車頭采集器采集多頁內容的抓取教程

2020-07-19 00:44編程技術網 編程技術

本文主要講解使用火車頭采集器采集多頁內容的抓取教程,有需要的朋友可以參考下

我們以內容頁網址http://kimi201406.1688.com/page/creditdetail.htm為例,來獲取它的公司介紹和聯系方式頁面的聯系方式信息。

公司介紹在網址http://kimi201406.1688.com/page/creditdetail.htm里獲取,而聯系方式信息在網址http://kimi201406.1688.com/page/contactinfo.htm里獲取。所以我們需要借助多頁功能來實現。前者叫默認頁地址,后者叫做多頁地址。

流程:點擊①創建多頁,進行②多頁設置,然后在數據來源③選擇多頁調用,最后根據多頁源代碼設置提取方式。

火車頭采集器采集多頁內容的抓取教程

下面重點講解②,多頁地址的兩種獲取方式:頁面地址替換和源碼中截取。

1.頁面地址替換:也就是默認頁和多頁地址有相同的地方,通過簡單的替換就可以變成多頁地址。

比較默認頁“http://kimi201406.1688.com/page/creditdetail.htm”和多頁地址:“http: //kimi201406.1688.com/page/contactinfo.htm”之間的共同點,可以發現默認頁“creditdetail.htm”替換為“contactinfo.htm”就是我們的多頁地址了。

設置如下圖:

火車頭采集器采集多頁內容的抓取教程

注:正則表達式中 (.*) 為任意通配符。$1,$2…$數字來按照順序對應上面(.*)表示的部分。若要對多頁源碼部分區域做限定,可在指定多頁源碼區域設置。

若留空則默認返回多頁整個源代碼。設置好以后,點擊測試查看結果即可。

2.源碼中截取:也就是多頁的地址在默認頁的頁面源代碼里面。

如圖,可以看到默認頁源碼中存在多頁地址。

火車頭采集器采集多頁內容的抓取教程

所以設置如下:

火車頭采集器采集多頁內容的抓取教程

測試后如正確則保存即可。最后設置數據來源和提取方式,如圖:

火車頭采集器采集多頁內容的抓取教程

注:如需要多級多頁,則在多頁地址獲取方式選擇需要的多頁即可

火車頭采集器采集多頁內容的抓取教程

這兩種獲取方式大家掌握了嗎,今后在抓取網站時使用火車采集器V9的上述操作就可以很容易地獲取到關聯的多頁地址了,作為一款功能全面的網站抓取精靈,火車采集器一定會充分考慮到用戶的使用需求,以及如何最大化實現便利

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 久久久www成人免费无遮挡大片 | 观看av | 狠狠操狠狠干 | 国产免费一区二区三区 | 亚洲精品一区二区三区四区高清 | 国产精品亚洲第一区在线暖暖韩国 | 久久女人网 | 国色天香成人网 | 不卡一区二区av | 欧美亚洲视频 | av资源在线 | 天天av网| 亚洲精品久久久久久下一站 | 国产精品国产精品国产专区不片 | 久久久久久国产精品高清 | 久久综合成人精品亚洲另类欧美 | 超碰97国产精品人人cao | 国产精品一二三区 | www.日韩视频| 欧美日本在线 | 中文字幕亚洲一区 | 色婷婷精品国产一区二区三区 | 最新毛片在线观看 | 成人午夜在线 | 亚洲国产精品久久久久秋霞蜜臀 | 国产精品视频网站 | 高清久久| 中文字幕免费看 | 懂色av一区二区三区免费观看 | 国产精品久久久久久久久久东京 | 欧美激情视频一区二区三区在线播放 | 久久久久久成人 | 日韩成人一区二区 | 欧美成人精品激情在线观看 | 亚洲亚色| 91在线看 | 免费成人av在线 | 免费看黄的视频网站 | 亚洲精品久久久久久下一站 | 黄视频免费 | 91久色|