即使世界明天毁灭,我也要在今天种下我的葡萄树。
posts - 112, comments - 14, trackbacks - 0, articles - 11

如何利用正则表达式去掉文本中的HTML标签

Posted on 2006-08-30 16:09 阅读(4432) 评论(6)  编辑  收藏 所属分类: WEB Design

 有时候,我们在数据库中存储的是一段段的HTML文本,但是取出来的时候,有时又不需要那些HTML标签,而只是需要纯文本,就像我们在页面上看到的文字一样,所以,就需要去掉那些HTML标签,只保留文本的内容。利用正则表达式就可以很容易做到这一点:

String noHtmlContent = content.replaceAll("<[^>]*>","");

一句代码搞定。

Feedback

# re: 如何利用正则表达式去掉文本中的HTML标签  回复  更多评论   

2007-03-06 12:02 by 网友

很好 帮了我一个大忙

# re: 如何利用正则表达式去掉文本中的HTML标签  回复  更多评论   

2008-12-05 12:23 by aminta
replaceAll 好像没有这个方法呢

string b="<html>aaaa</html>"

string a=b.replaceALL("<[^>]*>","");


是这意思吗,
不好意思,没测出来

# re: 如何利用正则表达式去掉文本中的HTML标签[未登录]  回复  更多评论   

2010-06-08 11:44 by summer
放在java代码里面用,可以,已试过,谢谢.

# re: 如何利用正则表达式去掉文本中的HTML标签  回复  更多评论   

2010-11-08 15:05 by XZLIULIn
非常好,谢谢

# re: 如何利用正则表达式去掉文本中的HTML标签[未登录]  回复  更多评论   

2010-11-19 10:36 by june
String noHtmlContent = content.replaceAll("<[^>]*>","");
可以吗

# re: 如何利用正则表达式去掉文本中的HTML标签  回复  更多评论   

2011-09-02 13:18 by 张军林
找了 好久啊 网上有好多方法 试验了下 还是这个给力 谢谢啊!!

只有注册用户登录后才能发表评论。


网站导航:
博客园   IT新闻   Chat2DB   C++博客   博问