国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - PHP教程 - 小談php正則提取圖片地址

小談php正則提取圖片地址

2020-06-20 14:41PHP教程網 PHP教程

最近在開發程序的時候需要獲取提取內容中的圖片地址,這里簡單分享下方法,需要的朋友可以參考下

迷上了正則,不斷嘗試著新花招,首先感謝TNA 的非完全輸出RSS,然后再次感謝SH的強迫性學習。沒有TNA,我不會去看正則,更不知道世界上有種這么牛的表達式;不是SH的死活說他不懂不知道,我也不會硬著頭皮去琢磨,去改進。達到同一個目的,正則的表達方式可以不唯一,沒有做不到,只有你沒想到。可以這樣說吧,正則就是玩設定規律,我大愛這種東西。沒有比設定規律篩選東西更讓我興奮、感到awesome的了。

分享一下在php環境下使用正則提取圖片地址的一些小心得:

圖片網址規范的html代碼無非就是

 

復制代碼 代碼如下:

<img id="code27431">
(?<=img.src=").*?(?=")


復制代碼 代碼如下:

(?<=img\ssrc=").*?(?=")

 

可能可以,但不保證100%沒問題。

你也許會問,單純

 

復制代碼 代碼如下:

(?<=src=").*?(?=")

 

不行嗎?通常情況,可以,但,搜索過頁面的盆友應該知道,除了圖片地址用src開頭以外,javascript地址也用src開頭!而且,太多神通廣大的不可預知因素隱含其中,于是這個貌似很簡短完美的寫法就行不通了。

你又或許會問,聰明簡短的不行,我把圖片的后綴列出來,總該可以了吧,如

 

復制代碼 代碼如下:

(?<=src=").*?\.(jpg|jpeg|gif|png|bmp|JPG|JPEG|GIF|PNG|BMP)

 

的確,這個寫法實在是很老實,不過,你見過沒有后綴的圖片?wwe.com 有很多這種例子呢

RAW http://us.wwe.com/content/media/images/Headers/15559182
SmackDown http://us.wwe.com/content/media/images/Headers/15854138
NXT http://us.wwe.com/content/media/images/Headers/15929136
Superstars http://us.wwe.com/content/media/images/Headers/15815850

上面的網址都是圖片,但都沒有傳統后綴,你老實也沒用,還是不能獲取到它們。

怎么辦呢?還可以這樣

 

復制代碼 代碼如下:

<img(.*?)src="(.*?)(?=")

 

和上面的表達式不同,這次的結果中array[0]的內容不是我們想要的,我們要的圖片地址在array[2]里。為什么呢?因為我們用了2個 (.*?),每個“()”的東西會自動存在一個組里,而array[0]代表結果的匯總,array[1]包含了img和src里的所有東西,array[2]才輪到我們想要的圖片地址。這種匹配方法,既能匹配有傳統后綴的圖片,也能匹配一些無后綴的圖片文件,同時又不會殺錯其它src=文件。個人感覺還是不錯的,呵呵。當然了,如果你還有更好的建議,請馬上留言,全球人民都會感謝你!

你到底要什么樣的圖片,是固定格式還是其它?得具體情況具體分析呢。

我的建議是:

如果你要的圖片地址的格式是img空格src=的,請使用:(?<=img.src=").*?(?=") ,數組唯一,你懂的。

否則,請使用<img(.*?)src="(.*?)(?=") ,記得留意有用內容所在的數組位置哦!

再談php正則提取圖片地址

前天寫了小談php正則提取圖片地址 ,但其實,提取src=里面的圖片地址還不足夠,因為不能保證那個地址一定是絕對地址,完全的地址,如果那是相對的呢?如果地址諸如:

albums/Candids/thumb_P1050338.jpg
/content/media/touts/5271608/5271654/15320982

那該如何是好?

有時在這些地址前面需要加http://example1.com/ ,有些甚至要加http://example1.com/example2/.../ 于是,要寫出出一種法則符合所有要求,簡直是天方夜譚。只能見機行事對癥下藥。有時,需要從前面動刀,有時需要從后面砍斷。

今天,我驚訝地知道了一個道理,原來http://example.com/ 和http://example.com////// 是一樣的!

http://img3.douban.com/pics/nav/lg_main_a6.png

http://img3.douban.com////pics////nav///lg_main_a6.png

最終你都能到達

于是,對于一開始提到的兩個相對地址如果要強行加入某前綴恢復成絕對地址的話,也不管前面有沒有“/”,只管加一個“/”就好,“有殺錯,沒放過” 嘛,多一個顯示仍會正常,但少一個“/”,嘿嘿,你就別想成功了。開始的時候我還沒意識到這種東西,復制了一大段代碼,把一樣的東西硬生生弄兩份,一份加 “./.”,一份不加。我這個火星來的,浪費時間了。

放出2個地址,公測一下網頁獲取圖片的情況:

針對任何網頁,需要登入的除外:http://xyark.serw5.com/img.php
針對Coppermine Photo Gallery 系統:http://xyark.serw5.com/g.php (如果你認為彈出原圖的js頁面也需要的話,我只好囧你了)

普頁是個對抓取任何圖片的嘗試,系統專頁是為了展示什么叫做具體情況具體分析。試過的童鞋會知道,普頁對某些使用Coppermine Photo Gallery系統的網站是行不通的,原因何在?就是那個前綴搞的鬼!但系統專頁就能很好地避開了這個問題。

如果大家在測試時發現任何bug,歡迎留言告知。請低調測試,謝謝合作。

注:以上話題純粹出于就正則談正則,光技術談技術,不可作非正當用途。若非正當使用而引發任何杯具、餐具本人概不負責。

轉載時請以超鏈接形式標明文章原始出處和作者信息及本聲明
http://www.blogbus.com/xrspook-logs/85330456.html

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 日韩在线一区二区 | 亚洲精品九九 | 久久综合伊人77777蜜臀 | 成人欧美 | 久久在线看 | 国产视频综合在线 | 吴梦梦到粉丝家实战华中在线观看 | 国产 欧美 日韩 一区 | 国产精品网站在线观看 | 国产视频三区 | 午夜精品久久久久久 | 精品久| 狠狠操一区二区三区 | 亚洲国产精品99久久久久久久久 | 国产午夜精品一区二区三区 | 国产精品久久久久久久久久久久冷 | 精品日韩一区二区 | 日本一区二区三区免费观看 | 日韩a∨| 国产区在线观看 | 日韩综合网 | 久久亚洲欧美日韩精品专区 | 国产精品久久久久一区二区三区 | 一级久久 | 一久久久 | 亚洲精品欧美一区二区三区 | 国产精品久久久久久久久久免费 | 综合久久综合 | 日本中文字幕一区 | 伊人激情影院 | 毛片网| 久久久精品日本 | 成人国内精品久久久久一区 | 日韩一区二区在线观看 | 99视频精品在线 | 九九综合久久 | 99久久久国产精品 | aaa级大片 | 日韩综合网 | 久久国| 国产一区自拍视频 |