国产片侵犯亲女视频播放_亚洲精品二区_在线免费国产视频_欧美精品一区二区三区在线_少妇久久久_在线观看av不卡

服務(wù)器之家:專注于服務(wù)器技術(shù)及軟件下載分享
分類導(dǎo)航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術(shù)|正則表達(dá)式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務(wù)器之家 - 編程語言 - Java教程 - JAVA過濾標(biāo)簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法示例

JAVA過濾標(biāo)簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法示例

2020-11-28 14:54johennes Java教程

這篇文章主要介紹了JAVA過濾標(biāo)簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法,涉及java針對HTML代碼的正則替換相關(guān)操作技巧,需要的朋友可以參考下

本文實例講述了JAVA過濾標(biāo)簽實現(xiàn)將html內(nèi)容轉(zhuǎn)換為文本的方法。分享給大家供大家參考,具體如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
/**
* 把html內(nèi)容轉(zhuǎn)為文本
* @param html 需要處理的html文本
* @param filterTags 需要保留的html標(biāo)簽樣式
* @return
*/
public static String trimHtml2Txt(String html, String[] filterTags){
    html = html.replaceAll("\\<head>[\\s\\S]*?</head>(?i)", "");//去掉head
    html = html.replaceAll("\\<!--[\\s\\S]*?-->", "");//去掉注釋
    html = html.replaceAll("\\<![\\s\\S]*?>", "");
    html = html.replaceAll("\\<style[^>]*>[\\s\\S]*?</style>(?i)", "");//去掉樣式
    html = html.replaceAll("\\<script[^>]*>[\\s\\S]*?</script>(?i)", "");//去掉js
    html = html.replaceAll("\\<w:[^>]+>[\\s\\S]*?</w:[^>]+>(?i)", "");//去掉word標(biāo)簽
    html = html.replaceAll("\\<xml>[\\s\\S]*?</xml>(?i)", "");
    html = html.replaceAll("\\<html[^>]*>|<body[^>]*>|</html>|</body>(?i)", "");
    html = html.replaceAll("\\\r\n|\n|\r", " ");//去掉換行
    html = html.replaceAll("\\<br[^>]*>(?i)", "\n\r");
    List<String> tags = new ArrayList<String>();
    List<String> s_tags = new ArrayList<String>();
    List<String> halfTag = Arrays.asList(new String[]{"img","table","thead","th","tr","td"});//
    if(filterTags != null && filterTags.length > 0){
      for (String tag : filterTags) {
        tags.add("<"+tag+(halfTag.contains(tag)?"":">"));//開始標(biāo)簽
        if(!"img".equals(tag)) tags.add("</"+tag+">");//結(jié)束標(biāo)簽
        s_tags.add("#REPLACETAG"+tag+(halfTag.contains(tag)?"":"REPLACETAG#"));//盡量替換為復(fù)雜一點的標(biāo)記,以免與顯示文本混合,如:文本中包含#td、#table等
        if(!"img".equals(tag)) s_tags.add("#REPLACETAG/"+tag+"REPLACETAG#");
      }
    }
    html = StringUtils.replaceEach(html, tags.toArray(new String[tags.size()]), s_tags.toArray(new String[s_tags.size()]));
    html = html.replaceAll("\\</p>(?i)", "\n\r");
    html = html.replaceAll("\\<[^>]+>", "");
    html = StringUtils.replaceEach(html,s_tags.toArray(new String[s_tags.size()]),tags.toArray(new String[tags.size()]));
    html = html.replaceAll("\\ ", " ");
    return html.trim();
}

希望本文所述對大家java程序設(shè)計有所幫助。

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 亚洲一区视频网站 | 亚洲精品视频在线 | 成人午夜免费视频 | 亚洲高清视频在线 | 国产一级一级特黄女人精品毛片 | 成人网视频在线观看 | 国产欧美精品区一区二区三区 | 美女h视频 | 美女搞黄网站 | 亚洲免费在线观看 | 欧美一区二区在线播放 | 永久免费看黄色 | 91av免费在线观看 | 69久久久久久 | av毛片免费 | 欧美日韩一区二区在线观看 | 国产精品美女久久久久aⅴ国产馆 | 成人观看免费视频 | 九九成人| 日韩一区二区不卡 | 网站黄色在线 | 国产视频在线播放 | 精品国产乱码久久久久久牛牛 | 精品无码久久久久久国产 | 久久亚洲欧美日韩精品专区 | 亚洲在线中文字幕 | 99热在线播放 | 国产亚洲精品美女久久久久久久久久 | 亚洲成av人影片在线观看 | 免费成人在线电影 | 亚洲一区中文字幕在线观看 | 亚洲精品久久久久久一区二区 | 欧美一级二级视频 | 在线中文字幕第一页 | 中文字幕视频 | 91人人 | 久久久精品久久久 | 亚洲 中文 欧美 日韩 在线观看 | 九九国产 | 国产一级免费 | 国产精品久久久久久久久久久久 |