中文字幕不卡视频在线观看,国产资源在线视频,午夜精品一区二区三区在线播放

介紹

本篇文章主要介紹如何爬取麥子學院的課程信息（本爬蟲仍是單線程爬蟲），在開始介紹之前，先來看看結果示意圖

Python 爬蟲學習筆記之單線程爬蟲

怎么樣，是不是已經躍躍欲試了？首先讓我們打開麥子學院的網址，然后找到麥子學院的全部課程信息，像下面這樣

Python 爬蟲學習筆記之單線程爬蟲

這個時候進行翻頁，觀看網址的變化，首先，第一頁的網址是 http://www.maiziedu.com/course/list/, 第二頁變成了 http://www.maiziedu.com/course/list/all-all/0-2/, 第三頁變成了 http://www.maiziedu.com/course/list/all-all/0-3/ ，可以看到，每次翻一頁，0后面的數字就會遞增1，然后就有人會想到了，拿第一頁呢？我們嘗試著將 http://www.maiziedu.com/course/list/all-all/0-1/ 放進瀏覽器的地址欄，發現可以打開第一欄，那就好辦了，我們只需要使用 re.sub() 就可以很輕松的獲取到任何一頁的內容。獲取到網址鏈接之后，下面要做的就是獲取網頁的源代碼，首先右擊查看審查或者是檢查元素，就可以看到以下界面

Python 爬蟲學習筆記之單線程爬蟲

找到課程所在的位置以后，就可以很輕松的利用正則表達式將我們需要的內容提取出來，至于怎么提取，那就要靠你自己了，嘗試著自己去找規律才能有更大的收獲。如果你實在不知道怎么提取，那么繼續往下，看我的源代碼吧

實戰源代碼

									# coding=utf-8

									 import re

									 import requests

									 import sys

									 reload(sys)

									 sys.setdefaultencoding("utf8")

									 class spider():

									   def __init__(self):

									     print "開始爬取內容。。。"

									    def changePage(self, url, total_page):

									     nowpage = int(re.search('/0-(\d+)/', url, re.S).group(1))

									     pagegroup = []

									     for i in range(nowpage, total_page + 1):

									       link = re.sub('/0-(\d+)/', '/0-%s/' % i, url, re.S)

									       pagegroup.append(link)

									     return pagegroup

									def getsource(self, url):

									  html = requests.get(url)

									  return html.text

									def getclasses(self, source):

									  classes = re.search('<ul class="zy_course_list">(.*?)</ul>', source, re.S).group(1)

									  return classes

									def geteach(self, classes):

									  eachclasses = re.findall('<li>(.*?)</li>', classes, re.S)

									  return eachclasses

									def getinfo(self, eachclass):

									  info = {}

									  info['title'] = re.search('<a py" id="highlighter_90957">
			
				?

									import requests

									html=requests.get("http://gupowang.baijia.baidu.com/article/283878")

									html.encoding='utf-8'

									print(html.text)




	第一行引入requests庫，第二行使用requests的get方法獲取網頁源代碼，第三行設置編碼格式，第四行文本輸出。

	把獲取到的網頁源代碼保存到文本文件中：

	
		
			
				?
			
				
					
						
							
								1
							
								2
							
								3
							
								4
							
								5
							
								6
							
								7
						
						
							
								
									import requests
								
									import os
								
									 
								
									html=requests.get("http://gupowang.baijia.baidu.com/article/283878")
								
									html_file=open("news.txt","w")
								
									html.encoding='utf-8'
								
									print(html.text,file=html_file)
							
						
					
				
			
		
	


			
					    
			
			
			
				
			
		
		
			
				 
				Python
				
				爬蟲
				
				單線程
				
			
			
				
			
		
		
			
				延伸 · 閱讀
			
			
				2022-03-11用Python實現一個模仿UP主彈幕控制的直播間功能
2022-03-11Python實戰之設計一個多功能辦公小工具
2022-03-11Python數據分析之缺失值檢測與處理詳解
2022-03-11Python變量的作用域詳解
2022-03-11Python之捕捉異常詳解
2022-03-11Python進度條可視化之監測程序運行速度

			
		
		
		
		
			
				
			
		
		
			
				精彩推薦
			
		
		
			
				
					
				
				Python
				
					在Windows系統上搭建Nginx+Python+MySQL環境的教程
					
						這篇文章主要介紹了在Windows系統上搭建Nginx+Python+MySQL環境的教程,文中使用flup中間件及FastCGI方式連接,需要的朋友可以參考下
...
					
					
						沒有終點的列車13232020-08-05
					
				
				
Python
				
					python 列表轉為字典的兩個小方法(小結)
					
						這篇文章主要介紹了python 列表轉為字典的兩個小方法(小結)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的...
					
					
						出泥的魚16532021-07-25
					
				
				
Python
				
					Python的dict字典結構操作方法學習筆記
					
						這篇文章主要介紹了Python的dict字典結構操作方法學習筆記本,字典的操作是Python入門學習中的基礎知識,需要的朋友可以參考下...
					
					
						Lizo_Is_Me4402020-08-22
					
				
				
Python
				
					python直接訪問私有屬性的簡單方法
					
						下面小編就為大家帶來一篇python直接訪問私有屬性的簡單方法。小編覺得挺不錯的，現在就分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
...
					
					
						Python教程網5152020-09-03
					
				
				
Python
				
					使用NumPy和pandas對CSV文件進行寫操作的實例
					
						今天小編就為大家分享一篇使用NumPy和pandas對CSV文件進行寫操作的實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧...
					
					
						qq_2468356113602021-03-05
					
				
				
Python
				
					python 插入Null值數據到Postgresql的操作
					
						這篇文章主要介紹了python 插入Null值數據到Postgresql的操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧...
					
					
						MichaelZhu6452021-09-16
					
				
				
Python
				
					Python實現ping指定IP的示例
					
						今天小編就為大家分享一篇Python實現ping指定IP的示例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧...
					
					
						EpisodeOne12902021-02-28
					
				
				
Python
				
					Python3以GitHub為例來實現模擬登錄和爬取的實例講解
					
						在本篇內容里小編給大家分享的是關于Python3以GitHub為例來實現模擬登錄和爬取的實例講解，需要的朋友們可以參考下。
...
					
					
						愛喝馬黛茶的安東尼5262020-07-31
					
				
				

			
		
	
	
最近更新
用Python實現一個模仿UP主彈幕控制的直播間功
Python實戰之設計一個多功能辦公小工具
Python數據分析之缺失值檢測與處理詳解
Python變量的作用域詳解
Python之捕捉異常詳解
編輯推薦
十個好用的Python開發工具（IDE）
 2PyCharm設置SSH遠程調試的方法
2021-03-18
 3Python安裝圖文教程 Pycharm安裝教程
2021-01-25
4python是什么意思？python有什么用？
2020-04-03
5使用Python抓取模板之家的CSS模板
2019-12-07
6Python 列表(List)操作方法詳解
2019-11-22
閱讀排行
1 2020最新pycharm漢化安裝（python工程獅親測有效
2 Pycharm 2020最新永久激活碼（附最新激活碼和插
3 分享PyCharm最新激活碼(真永久激活方法)不用每
 4 python高手之路python處理excel文件(方法匯總)
5 Python sklearn中的.fit與.predict的用法說明
6 Python爬蟲中Requests設置請求頭Headers的方法
7 Python中讀取圖片的6種方式
8 python保留小數位的三種實現方法
9 使用Python判斷質數(素數)的簡單方法講解
10 教你如何將Python程序打包成Linux可執行文件
熱門標簽
 2048 　  6006 　  contextlib 　  SLOTS 　  MELIAE 　  FEEDPARSER 　  暫存 　  持久性管理 　  pickle模塊 　  THREADING 　  reduce 　  nignx 　  裝飾器 　  函數式編程 　  兔子毒藥 　  監控文件 　  流量監控 　  Web框架 　  辦公工具 　  PIL庫 　  高斯模糊 　  wxPython 　  import 　  自定義模塊 　  Python開發 　  元類 　  metaclass 　  魔術方法 　  DNSPod 　  動態解析域名 　 




© 2019-2023 腳本之家 | 服務器之家(www.jfrwli.cn)旗下站點 版權所有關于我們聯系我們版權申明網站地圖


	







感谢您访问我们的网站，您可能还对以下资源感兴趣：
国产片侵犯亲女视频播放|亚洲精品二区|在线免费国产视频|欧美精品一区二区三区在线|少妇久久久|在线观看av不卡









主站蜘蛛池模板：
国产电影一区二区三区图片
|
欧美成人精品一区二区三区
|
成年人视频免费在线看
|
羞羞在线观看
|
久久精品无码一区二区日韩av
|
性色国产|
亚洲一区二区免费视频
|
大白屁股一区二区视频
|
国产精品久久久久久久久
|
激情毛片|
人人99|
成人福利电影在线观看
|
狠狠狠狠狠狠
|
欧美激情一区二区三级高清视频
|
亚洲免费精品
|
国产精品一区二区av
|
成人在线视频网站
|
久久精品一区
|
国产福利一区二区三区四区
|
国产伦精品一区二区三区四区视频
|
欧美国产精品一区二区三区
|
羞羞视频免费网站
|
国产精品免费视频观看
|
色中色av|
亚洲午夜成激人情在线影院
|
欧美综合激情
|
国产伦精品一区二区三区四区视频_
|
欧美国产精品一区
|
精品国产欧美一区二区三区成人
|
国产精品久久久久久久久久免费
|
欧美精品1
|
成人精品
|
久久国产成人
|
久久国产免费
|
91亚洲国产成人久久精品网站
|
成人久久久
|
久久久91
|
日韩欧美精品一区二区三区
|
国外成人在线视频网站
|
日韩超碰|
国产免费一区二区三区
|