国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|JAVA教程|ASP教程|

服務器之家 - 編程語言 - JAVA教程 - java使用htmlparser提取網頁純文本例子

java使用htmlparser提取網頁純文本例子

2019-11-19 14:19Java教程網 JAVA教程

這篇文章主要介紹了java使用htmlparser提取網頁純文本例子,需要的朋友可以參考下

代碼如下:


package com.test;

 

import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags.TableTag;
import org.htmlparser.util.NodeList;

/**
* 標題:利用htmlparser提取網頁純文本的例子
*/
public class TestHTMLParser {
  public static void testHtml() {
    try {
        String sCurrentLine;
        String sTotalString;
        sCurrentLine = "";
        sTotalString = "";
        java.io.InputStream l_urlStream;
        java.net.URL l_url = new java.net.URL("http://www.ideagrace.com/html/doc/2006/07/04/00929.html");
        java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();
        l_connection.connect();
        l_urlStream = l_connection.getInputStream();
        java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));
        while ((sCurrentLine = l_reader.readLine()) != null) {
          sTotalString += sCurrentLine+"/r/n";
        //  System.out.println(sTotalString);
        }
        String testText = extractText(sTotalString);
        System.out.println( testText );

    } catch (Exception e) {
        e.printStackTrace();
    }

  }

  public static String extractText(String inputHtml) throws Exception {
    StringBuffer text = new StringBuffer();
    Parser parser = Parser.createParser(new String(inputHtml.getBytes(),"GBK"), "GBK");
    // 遍歷所有的節點
    NodeList nodes = parser.extractAllNodesThatMatch(new NodeFilter() {
        public boolean accept(Node node) {
          return true;
        }
    });

    System.out.println(nodes.size()); //打印節點的數量
    for (int i=0;i<nodes.size();i++){
         Node nodet = nodes.elementAt(i);
         //System.out.println(nodet.getText()); 
        text.append(new String(nodet.toPlainTextString().getBytes("GBK"))+"/r/n");          
    }
    return text.toString();
  }

  public static void test5(String resource) throws Exception {
    Parser myParser = new Parser(resource);
    myParser.setEncoding("GBK");
    String filterStr = "table";
    NodeFilter filter = new TagNameFilter(filterStr);
    NodeList nodeList = myParser.extractAllNodesThatMatch(filter);
    TableTag tabletag = (TableTag) nodeList.elementAt(11);

  }

  public static void main(String[] args) throws Exception {
    // test5("http://www.google.com");
    testHtml();
  }
}

 

 

延伸 · 閱讀

精彩推薦
  • JAVA教程Java for循環詳解

    Java for循環詳解

    這篇文章主要介紹了Java for循環方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來...

    東邊的雨田3482019-06-23
  • JAVA教程通過代碼快速理解Java的三種代理模式

    通過代碼快速理解Java的三種代理模式

    這篇文章主要介紹了通過代碼快速理解Java的三種代理模式,代理(Proxy)是一種設計模式,提供了對目標對象另外的訪問方式,即通過代理對象訪問目標對象。...

    mseddl2832019-06-29
  • JAVA教程java的arrays數組排序示例分享

    java的arrays數組排序示例分享

    排序算法,基本的高級語言都有一些提供。C語言有qsort()函數,C++有sort()函數,java語言有Arrays類(不是Array)。用這些排序時,都可以寫自己的排序規則 ...

    java教程網4072019-11-11
  • JAVA教程java實現策略模式使用示例

    java實現策略模式使用示例

    在使用圖像處理軟件處理圖片后,需要選擇一種格式進行保存。然而各種格式在底層實現的算法并不相同,這剛好適合策略模式。編寫程序,演示如何使用...

    java教程網1342019-11-08
  • JAVA教程grails不能運行fork模式解決方法

    grails不能運行fork模式解決方法

    這篇文章主要介紹了如何解決grails2.3.2中不能運行fork模式的異常,大家參考使用吧 ...

    java技術網1382019-10-21
  • JAVA教程Logger.getLogger()與LogFactory.getLog()的區別詳解

    Logger.getLogger()與LogFactory.getLog()的區別詳解

    LogFactory來自common-logging包。如果用LogFactory.getLog,你可以用任何實現了通用日志接口的日志記錄器替換log4j,而程序不受影響 ...

    java教程網2412019-10-14
  • JAVA教程eclipse怎么引入spring boot項目插件的方法

    eclipse怎么引入spring boot項目插件的方法

    這篇文章主要介紹了eclipse怎么引入spring boot項目插件的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的...

    莫采4082019-07-08
  • JAVA教程簡單的java讀取文件示例分享

    簡單的java讀取文件示例分享

    這篇文章主要介紹了java讀取txt文件內容,示例很簡單,代碼里有注釋,大家直接看代碼吧 ...

    java教程網2532019-11-03
主站蜘蛛池模板: 久久久久久国产精品 | 精品网 | 不卡的一区二区 | 久免费视频 | 我我色综合 | 成人中文网 | 国产99久久 | av电影免费观看 | 欧美国产综合一区 | 亚洲天堂一区二区 | 极品一区 | 日韩一区精品 | 国产乱淫精品一区二区三区毛片 | 国产中文字幕网 | 欧美中文字幕在线 | 日本视频免费高清一本18 | 69久久久 | 爱色av网址 | 欧美午夜精品久久久久免费视 | 国产视频色 | av三级| 精品粉嫩超白一线天av | 日韩不卡一区二区 | 久久久久久久成人 | 日本中文一区二区 | 午夜视频在线观看一区二区三区 | 亚洲男人av | 欧美日韩高清在线一区 | 美女黄18| 亚洲h视频| 成人av网页 | 亚洲专区国产精品 | 欧美顶级毛片在线播放 | 久久草在线视频 | 中文在线中文a | 成年免费观看 | 亚洲成人精选 | 天天色天天草 | 国产精品3区 | 亚洲国产精品久久久 | 欧美永久精品 |