一、
Antlr
的主要类:
Antlr
中有主要类有两种(其实还有一种
TreeLexer
)
Lexer:
文法分析器类。主要用于把读入的字节流根据规则分段。既把长面条根据你要的尺寸切成一段一段:)并不对其作任何修改。
Parser:
解析器类。主要用于处理经过
Lexer
处理后的各段。一些具体的操作都在这里。
二、
Antlr
文法文件形式:
Antlr
文件是
*.g
形式,即以
g
为后缀名。
例如:
t.g
class P extends Parser;
startRule
: n:NAME
{System.out.println("Hi there, "+n.getText());}
;
class L extends Lexer;
// one-or-more letters followed by a newline
NAME: ( 'a'..'z'|'A'..'Z' )+ NEWLINE
;
NEWLINE
: '\r' '\n' // DOS
| '\n' // UNIX
;
具体成分分析:
1
、总体结构
Class P extends Parser
Class L extends Lexer
两行同
JAVA
继承一样,
P
继承
Parser
类;
L
继承
Lexer
类。每个
.g
文件只能各有一个。
2
、
Lexer
类分析
一般按照
类型名:
匹配的具体规则
;
的形式构成。是分隔字节流的依据。同时可以看到里面可以互相引用。如本例中的类型名
NEWLINE
出现在
NEW
的匹配规则中。
3
、
Parser
类分析
一般按照
起始规则名:
规则实例名:类型名或规则名
{Java
语句。。。;
}
;
。。。。。。。。。
的形式构成。
起始规则名:任意。
规则实例名:就象
Java
中“
String s
;”的
s
一样。规则实例名用于在之后的
JAVA
语句中调用。
类型名或规则名:可以是在
Lexer
中定义的类型名,也可以是
Parser
中定义的规则名。感觉就像是
int
与
Integer
的区别。
Java
语句:指当满足当前规则时所执行的语句。
Antlr
会自动嵌入生成的
java
类中。
三、生成
Java
类
1
、从
www.antlr.org
上下载
antlr-x.x.x.jar
2
、配置环境变量:
classpath=.;x:\jdk\lib\tools.jar;x:\antlr-x.x.x.jar
3
、在
t.g
所在目录下执行:
java antlr.Tool t.g
会在当前目录下生成如下文件:
L.java
:
Lexer
文法分析器
java
类。
P.java
:
Parser
解析器
java
类。
PTokenTypes.java
:
Lexer
中定义的类型具体化,供
Parser
解析器调用。
PTokenTypes.txt
:当外部的(如
t2.g
)要调用当前的类型或规则时要用到本文件。
四、执行
1
、编写
Main
类
import java.io.*;
class Main {
public static void main(String[] args) {
try {
L lexer = new L(new DataInputStream(System.in));
P parser = new P(lexer);
parser.startRule();
} catch(Exception e)
{
System.err.println("exception: "+e);
}
}
}
2
、执行
c:\> javac *.java
c:\> java Main
Terence
^Z
Hi there, Terence
c:\>
本文作者kingchou是CowNew开源团队SQL解析引擎项目组负责人。
更多内容请见CowNew开源团队网站
www.cownew.com
论坛
http://www.cownew.com/newpeng/