国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - python中requests爬去網頁內容出現亂碼問題解決方法介紹

python中requests爬去網頁內容出現亂碼問題解決方法介紹

2020-12-13 00:37Winterto1990 Python

這篇文章主要介紹了python中requests爬去網頁內容出現亂碼問題解決方法,有需要的朋友可以參考一下

最近在學習python爬蟲,使用requests的時候遇到了不少的問題,比如說在requests中如何使用cookies進行登錄驗證,這可以查看這篇文章。這篇博客要解決的問題是如何避免在使用requests的時候出現亂碼

?
1
2
3
import requests 
res=requests.get("https://www.baidu.com"
print res.content

以上就是使用requests進行簡單的網頁請求數據的方式。但是很容易出現亂碼的問題。

我們可以通過在網頁上右擊查看源代碼中查看編碼方式:content="text/html;charset=utf-8"->

我們便可以知道網頁的編碼方式是utf8.由于中文的編碼方式為gbk,所以我們需要將編碼方式改變為gbk。

我查看了一些資料,說requests可以自動獲取網頁的編碼方式的,并且通過res.encode輸出一看是utf8,是的 沒錯。但是輸出來的內容中文存在亂碼。 有說可以直接指定獲取到內容的encode屬性即可,"res.encode='gbk'",但我嘗試了不可以的。

python內部的編碼方式為utf8,也就是說python在處理其他字符串內容的時候首先要先將內容轉化為utf8的編碼方式,然后在解碼為你想要的編碼方式輸出。

例如s=”中文” 為str類型的字符串 編碼方式為gb2312

需要 s.decode("gb2312")將gb2312編碼方式的內容解碼為Unicode編碼

然后輸出的時候要將s的編碼方式規定為gbk->s.encode("gbk")

言歸正傳,我們獲取到網頁內容res后, 通過res.content.decode("utf8","ignore").encode("gbk","ignore")就不會有亂碼了。

這里所使用的ignore屬性意思是忽略其中有一場的編碼,僅顯示有效的編碼。

總結

以上就是本文關于python中requests爬去網頁內容出現亂碼問題解決方法的全部內容,希望對大家有所幫助。如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

原文鏈接:http://blog.csdn.net/winterto1990/article/details/51217363

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 一区二区三区久久久 | 激情网站免费观看 | 97色伦97色伦国产欧美空 | 国产成人一区二区三区在线观看 | 少妇精品久久久久久久久久 | 国产日韩欧美一二三区 | 日韩一区二区在线观看 | 午夜精品久久久久久久久久久久久 | www.日韩.com| 波多野结衣先锋影音 | 性福视频在线观看 | 久久一区 | 九九九久久国产免费 | 色婷婷国产精品综合在线观看 | 亚洲欧美激情精品一区二区 | 久在线视频 | 色综合天天天天做夜夜夜夜做 | 久久精品一级毛片 | 国产成人久久 | 久久精品亚洲成在人线av网址 | 免费黄色在线 | 性做久久久久久久免费看 | 亚洲国产精品一区 | 欧美综合激情 | 中文字幕在线免费视频 | 日本中文字幕在线免费观看 | 性免费网站 | 中文字幕一区二区三区四区 | 成人黄页在线观看 | 免费观看一区二区三区毛片软件 | 国产v亚洲v天堂无码 | 免费黄色网页 | 欧美视频免费在线 | 欧美视频免费看 | 久久久免费电影 | 久久综合国产 | 午夜免费av| 日本高清一区 | 日本一区二区高清不卡 | 国产成人精品一区二 | 激情久久av一区av二区av三区 |