Java里面去掉网页里的HTML标记的方法 - 编程入门网
作者 佚名技术
来源 NET编程
浏览
发布时间 2012-06-22
Java里面去掉网页里的HTML标记的方法时间:2010-12-25 csdn 老紫竹01./**02. * 去掉字符串里面的html代码。<br>03. * 要求数据要规范,比如大于小于号要配套,否则会被集体误杀。04. *05. * @param content06. * 内容07. * @return 去掉后的内容08. */09.public static String stripHtml(String content) {10. // <p>段落替换为换行11. content = content.replaceAll("<p .*?>", "\r\n");12. // <br><br/>替换为换行13. content = content.replaceAll("<br\\s*/?>", "\r\n");14. // 去掉其它的<>之间的东西15. content = content.replaceAll("\\<.*?>", "");16. // 还原HTML17. // content = HTMLDecoder.decode(content);18. return content;19.} |
凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢! |
你可能对下面的文章感兴趣
关于Java里面去掉网页里的HTML标记的方法 - 编程入门网的所有评论