国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|JAVA教程|ASP教程|

服務器之家 - 編程語言 - JAVA教程 - crawler4j抓取頁面使用jsoup解析html時的解決方法

crawler4j抓取頁面使用jsoup解析html時的解決方法

2019-11-18 14:34Java教程網 JAVA教程

crawler4j對response沒有指定編碼的頁面,解析成亂碼,很讓人煩惱,下面給出解決方法,需要的朋友可以參考下

crawler4j對已有編碼的頁面抓取效果不錯,用html">jsoup解析,很多會jquery的程序員都可以操作。但是,crawler4j對response沒有指定編碼的頁面,解析成亂碼,很讓人煩惱。在找了苦悶之中,無意間發現一年代已久的博文,可以解決問題,修改 Page.load() 中的 contentData 編碼即可,這讓我心中頓時舒坦了很多,接下來的問題都引刃而解了。

 

復制代碼代碼如下:

public void load(HttpEntity entity) throws Exception {
 contentType = null;  
    Header type = entity.getContentType();  
    if (type != null) {  
        contentType = type.getValue();  
    }  

    contentEncoding = null;  
    Header encoding = entity.getContentEncoding();  
    if (encoding != null) {  
        contentEncoding = encoding.getValue();  
    }  

    Charset charset = ContentType.getOrDefault(entity).getCharset();  
    if (charset != null) {  
        contentCharset = charset.displayName();   
    }else{
     contentCharset = "utf-8";
    }

   //源碼
   //contentData = EntityUtils.toByteArray(entity);  
    //修改后的代碼
    contentData = EntityUtils.toString(entity, Charset.forName("gbk")).getBytes();

}

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 久久综合久久综合久久综合 | 韩日欧美| 亚洲国产精品一区二区久久 | 精品一区视频 | 亚洲三级在线 | 日韩一区中文字幕 | 国产色| 成人三级视频网站 | 国产精品美女久久久久久久久久久 | 成人免费黄色毛片 | 欧洲另类交 | 欧美久久久久 | 亚洲精品乱码久久久久久金桔影视 | 亚洲精品中文字幕在线观看 | 欧美一级片免费在线观看 | 精品一区二区久久久久久久网站 | 国产黄色av| 亚洲一区中文字幕 | 91国在线产 | 一级黄色一级毛片 | 久久精品国产欧美亚洲人人爽 | 久久国产精品亚洲 | 精品综合 | 中文字幕日韩在线 | 国产精品一区二区三区在线播放 | 日韩小视频在线观看 | 精品在线一区 | 亚洲国产传媒99综合 | 久久久久久久久国产成人免费 | av亚洲在线| 色视频在线免费观看 | 免费激情| 精品国产欧美一区二区 | 中文字幕乱码一区二区三区 | 美女视频一区二区三区 | 亚洲在线观看免费视频 | 日本黄色一级电影 | 自拍视频一区 | 久久久久久久久综合 | av天天网| 亚洲a网 |