国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - python使用xpath獲取頁面元素的使用

python使用xpath獲取頁面元素的使用

2022-01-04 00:32Sun@Python Python

本文主要介紹了python使用xpath獲取頁面元素的使用,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下

關于python 使用xpath獲取網頁信息的方法?

1、xpath的使用方法?

? XPath 使用路徑表達式來選取 XML 文檔中的節點或節點集。節點是通過沿著路徑 (path) 或者步 (steps) 來選取的。

常用路徑表達式含義

 

表達式 描述
/ 從根節點選?。ㄈ∽庸濣c)
// 選擇的當前節點選擇文檔中的節點
. 選取當前節點。
選取當前節點的父節點。
@ 選取屬性
* 表示任意內容(通配符)
| 運算符可以選取多個路徑

常用功能函數

 

函數 用法 解釋
startswith() xpath(‘//div[starts-with(@id,”ma”)]‘) #選取id值以ma開頭的div節點
contains() xpath(‘//div[contains(@id,”ma”)]‘) #選取id值包含ma的div節點
and() xpath(‘//div[contains(@id,”ma”) and contains(@id,”in”)]‘) #選取id值包含ma的div節點
text() _.xpath('./div/div[4]/a/em/text()') #選取em標簽下文本內容

備注:

1、html中當相同層次存在多個標簽例如div,它們的順序是從1開始,不是0
2、瀏覽器中使用開發者工具可以快速獲取節點信息

python使用xpath獲取頁面元素的使用

2、實例:

#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time    : 2021/9/7 9:35
# @Author  : Sun
# @Email   : 8009@163.com
# @File    : sun_test.py
# @Software: PyCharm


import requests
from lxml import etree


def get_web_content():
  try:
      url = "htpps://***keyword=%E6%97%A0%E9%92%A2%E5%9C%88&wq=%E6%97%A0%E"
"9%92%A2%E5%9C%88&ev=1_68131%5E&pvid=afbf41410b164c1b91d"
      "abdf18ae8ab5c&page=5&s=116&click=0 "
      header = {
          "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64)"
          "AppleWebKit/537.36 (KHTML, like Gecko) "
                        "Chrome/75.0.3770.100 Safari/537.36 "}
      response = requests.request(method="Get", url=url, headers=header)
      result = response.text
      return result
  except TimeoutError as e:
      return None


def parsing():
  result = get_web_content()
  if result is not None:
      html = etree.HTML(result)
      # 先獲取一個大的節點,包含了想要獲取的所有信息
      ii = html.xpath('//*[@id="J_goodsList"]/ul/li')
     
      for _ in ii:
      # 采用循環,依次從大節點中獲取小的節點內容
          # ''.join() 將列表中的內容拼接成一個字符串
          infoResult = {
          	# @href 表示:獲取屬性為href的內容
              'href': "https:" + _.xpath('./div/div[1]/a/@href')[0],
              'title': ''.join(
                      _.xpath('./div/div[2]/div/ul/li/a/@title')),
              # text()表示獲取節點i里面的文本信息
              'price': _.xpath('./div/div[3]/strong/i/text()')[0],
              'info': ''.join(
                      _.xpath('./div/div[4]/a/em/text()')).strip(),
              'province': _.xpath('./div/div[9]/@data-province')[0]}
          print(infoResult)
  else:
      raise Exception("Failed to get page information, please check!")
  
  return None


if __name__ == '__main__':
  parsing()

結果圖片:

python使用xpath獲取頁面元素的使用

到此這篇關于python使用xpath獲取頁面元素的使用的文章就介紹到這了,更多相關python xpath獲取頁面元素內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://blog.csdn.net/qq_40267002/article/details/120197707

延伸 · 閱讀

精彩推薦
Weibo Article 1 Weibo Article 2 Weibo Article 3 Weibo Article 4 Weibo Article 5 Weibo Article 6 Weibo Article 7 Weibo Article 8 Weibo Article 9 Weibo Article 10 Weibo Article 11 Weibo Article 12 Weibo Article 13 Weibo Article 14 Weibo Article 15 Weibo Article 16 Weibo Article 17 Weibo Article 18 Weibo Article 19 Weibo Article 20 Weibo Article 21 Weibo Article 22 Weibo Article 23 Weibo Article 24 Weibo Article 25 Weibo Article 26 Weibo Article 27 Weibo Article 28 Weibo Article 29 Weibo Article 30 Weibo Article 31 Weibo Article 32 Weibo Article 33 Weibo Article 34 Weibo Article 35 Weibo Article 36 Weibo Article 37 Weibo Article 38 Weibo Article 39 Weibo Article 40
主站蜘蛛池模板: 亚洲 欧美 另类 综合 偷拍 | 欧美黄视频在线观看 | 成人中文字幕在线观看 | 国产成人久久精品麻豆二区 | 香蕉成人啪国产精品视频综合网 | 成人激情免费 | 国产资源在线观看 | 精品一区二区久久久久久久网站 | 久久精品在线 | 国产亚洲精品久久久久久无几年桃 | 久久久婷婷 | 91国在线产 | 中文字幕日韩欧美一区二区三区 | 亚洲成人精品在线观看 | www.av在线| 99久久精品一区二区成人 | 亚洲精品久久久久久久久久久久久 | 久久久一区二区 | 91se在线 | 午夜视频在线观看网站 | 国产剧情一区 | 亚洲国产久 | 国产精品一二三区 | 91精品国产综合久久久久 | 成人精品久久久 | 一区二区日本 | 在线一级片 | 亚洲国产精品成人女人久久久 | 嫩草在线视频 | 日韩欧美久久 | 亚洲国产高清在线播放 | h在线免费| 日韩无 | 国产成人一区 | 欧美视频在线看 | 成人在线视频网站 | 中文字幕一区二区三区在线视频 | 91黄色免费视频 | 中文字幕 国产精品 | 黄片毛片在线观看 | 干片网|