Posted on 2009-06-29 18:55
周竞先 阅读(468)
评论(0) 编辑 收藏 所属分类:
J2EE
这几天用到了java.util.regex.*;
顺便写个简单的例子
1 package com.potevio.telecom;
2
3 //java中的正则表达式处理相关类
4 import java.util.regex.Matcher;
5 import java.util.regex.Pattern;
6
7 //JUnit单元测试类
8 import junit.framework.TestCase;
9
10 /**
11 * 根据规则匹配出需要的内容
12 * @author Zhou-Jingxian
13 *
14 */
15 public class TestParseFileWithFormula extends TestCase{
16
17 /**
18 * 根据规则匹配出需要的内容
19 * @param content 要解析的内容
20 * @param formula 解析的匹配规则
21 * @return
22 */
23 public String getContentWithFormula(String content,String formula) {
24 Pattern p = Pattern.compile(formula);
25 Matcher m = p.matcher(content);
26 String fianl_content = new String();
27 while(m.find()){
28 fianl_content = m.group(0);
29 System.out.println("要解析的代码:\n"+m.group(0));
30 }
31 return fianl_content;
32 }
33
34 /**
35 * 测试一下
36 */
37 public void testContent(){
38 //刚随便新建的一个HTML,得到的一个字符串内容
39 String content = "<!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\"><HTML><HEAD><TITLE> New Document </TITLE></HEAD><BODY>测试文件</BODY></HTML>";
40
41 //写一个匹配标题的正则表达式,仅作代表
42 String formula = "<TITLE>(.*)</TITLE>";
43
44 getContentWithFormula(content,formula);
45 }
46 }
47
输出结果如下:
要解析的代码:
<TITLE> New Document </TITLE>
运行,需要JUnit单元测试环境,这个应该都会吧,实在不会从我文档中找
Life,simple and happy!