国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|JAVA教程|ASP教程|

香港云服务器
服務器之家 - 編程語言 - JAVA教程 - java抓取網頁數據獲取網頁中所有的鏈接實例分享

java抓取網頁數據獲取網頁中所有的鏈接實例分享

2019-10-26 16:58java教程網 JAVA教程

java抓取網頁數據獲取網頁中所有的鏈接實例分享,使用方法,只要實例化HtmlParser時傳入網頁地址就可以了

效果圖

java抓取網頁數據獲取網頁中所有的鏈接實例分享
 

復制代碼代碼如下:


import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.ArrayList;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

 

public class HtmlParser {
 /**
  * 要分析的網頁
  */
 String htmlUrl;

 /**
  * 分析結果
  */
 ArrayList<String> hrefList = new ArrayList();

 /**
  * 網頁編碼方式
  */
 String charSet;

 public HtmlParser(String htmlUrl) {
  // TODO 自動生成的構造函數存根
  this.htmlUrl = htmlUrl;
 }

 /**
  * 獲取分析結果
  * 
  * @throws IOException
  */
 public ArrayList<String> getHrefList() throws IOException {

  parser();
  return hrefList;
 }

 /**
  * 解析網頁鏈接
  * 
  * @return
  * @throws IOException
  */
 private void parser() throws IOException {
  URL url = new URL(htmlUrl);
  HttpURLConnection connection = (HttpURLConnection) url.openConnection();
  connection.setDoOutput(true);

  String contenttype = connection.getContentType();
  charSet = getCharset(contenttype);

  InputStreamReader isr = new InputStreamReader(
    connection.getInputStream(), charSet);
  BufferedReader br = new BufferedReader(isr);

  String str = null, rs = null;
  while ((str = br.readLine()) != null) {
   rs = getHref(str);

   if (rs != null)
    hrefList.add(rs);
  }

 }

 /**
  * 獲取網頁編碼方式
  * 
  * @param str
  */
 private String getCharset(String str) {
  Pattern pattern = Pattern.compile("charset=.*");
  Matcher matcher = pattern.matcher(str);
  if (matcher.find())
   return matcher.group(0).split("charset=")[1];
  return null;
 }

 /**
  * 從一行字符串中讀取鏈接
  * 
  * @return
  */
 private String getHref(String str) {
  Pattern pattern = Pattern.compile("<a href=.*</a>");
  Matcher matcher = pattern.matcher(str);
  if (matcher.find())
   return matcher.group(0);
  return null;
 }

 public static void main(String[] arg) throws IOException {
  HtmlParser a = new HtmlParser("http://news.163.com/");
  ArrayList<String> hrefList = a.getHrefList();
  for (int i = 0; i < hrefList.size(); i++)
   System.out.println(hrefList.get(i));

 }

}

 

 

延伸 · 閱讀

精彩推薦
655
主站蜘蛛池模板: 日韩欧美一区二区三区免费观看 | 精品久久av | 中文字幕av一区二区 | 91香蕉视频在线 | 中文字幕一区二区三区精彩视频 | 天天久久综合网 | 欧美午夜一区二区三区免费大片 | 成av在线 | 在线视频 亚洲 | 日韩av片无码一区二区不卡电影 | 欧美精三区欧美精三区 | 国产成人久久av免费高清密臂 | 国产一区二区三区在线免费 | 日韩av一区二区在线观看 | 久久高清精品 | 91免费视频在线 | 国产乱来视频 | 亚洲国产精品久久 | 亚洲一区二区在线 | 国产福利电影一区 | 狠久久 | 爱操av | 久久久av | 欧美精品久久久 | 精品午夜久久 | 中文字幕亚洲一区二区三区 | 午夜激情影院 | 国产精品久久久久久久午夜片 | 国产免费拔擦拔擦8x高清在线人 | 色在线视频网站 | аⅴ资源新版在线天堂 | 免费a爱片猛猛 | 91色乱码一区二区三区 | 中文字幕一区二区三区在线视频 | 欧美午夜精品久久久久免费视 | 中文在线一区 | 久久久久国产精品 | 欧美在线网站 | 日韩欧美在线观看 | 日本午夜视频 | 精品国产欧美一区二区 |