Java 怎么清除HTML,并且不破坏XML

2019年8月2日23:35:10Java 怎么清除HTML,并且不破坏XML已关闭评论 671 436字阅读1分27秒

1.简介

Java 怎么清除HTML,并且不破坏XML?——请看下文。

2.示例代码

/**
 * 版权所有 编程十万个怎么办(www.tah1986.com)
 */



public class Main {
    public static void main(String[] argv) throws Exception {
        String in = "tah1986.com";
        System.out.println(cleanup(in));
    }

    
    static String cleanup(String in) {
        String out = in.replaceAll("<!\\[CDATA\\[", "");
        out = out.replaceAll("\\]\\]>", "");
        out = out.replaceAll("&(?!amp;)", "&");
        out = out.replaceAll("<br>", "<br />");
        out = out.replaceAll("<p>\\s*?</li>", "</p>\n</li>");
        return out;
    }
}

 
编程十万个怎么办