xml约束
编写一个文档来约束一个xml文档的书写规范
常用的约束技术
XML DTD
XML Schema
DTD(Document Type Definition),全程为文档类型定义
举例:
文件清单:book.xml
- <?xml version="1.0" encoding="UTF-8"?>
- <!DOCTYPE 图书 SYSTEM "book.dtd">
- <图书>
- <书>
- <书名>西游记</书名>
- <作者>吴承恩</作者>
- <售价>18</售价>
- </书>
- <书>
- <书名>三国演义</书名>
- <作者>罗贯中</作者>
- <售价>20</售价>
- </书>
- </图书>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 图书 SYSTEM "book.dtd">
<图书>
<书>
<书名>西游记</书名>
<作者>吴承恩</作者>
<售价>18</售价>
</书>
<书>
<书名>三国演义</书名>
<作者>罗贯中</作者>
<售价>20</售价>
</书>
</图书>
文件清单:book.dtbd
- <?xml version="1.0" encoding="UTF-8"?>
- <!ELEMENT 图书 (书+)>
- <!ELEMENT 书 (书名,作者,售价)>
- <!ELEMENT 书名 (#PCDATA)>
- <!ELEMENT 作者 (#PCDATA)>
- <!ELEMENT 售价 (#PCDATA)>
<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT 图书 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
ELEMENT 元素
PCDATA 的意思是已经解析的字符数据,文本中的标签会被当作标记来处理,而实体会被展开。
用book.dtd约束book.xml,如果在book.xml的书标签下添加出版日期,会报错,因为文档格式已经固定。
注意:DTD文件应使用utf-8保存或者encoding="gb2312",否则会报错。
引用DTD约束
xml文件使用DOCTYPE声明语句来指明它所遵循的DTD文件,声明语句有两种形式
(1)当引用的文件在本地时 ,采用如下方式:
<!DOCTYPE 文档根节点 system "DTD文件的URL">
例如:<!DOCTYPE 图书 SYSTEM "book.dtd">
(2)当引用的文件是一个公共的文件时 ,采用如下方式:
<!DOCTYPE 文档根节点 public "DTD名称" "DTD文件的URL">
例如:<!DOCTYPE struts-config PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 1.3//EN"
"http://struts.apache.org/dtds/struts-config_1_3.dtd">
struts2的DTD文件,一般做框架都会用到DTD
DTD约束语法细节
元素定义
属性定义
实体定义
元素定义
在DTD文件中使用element声明一个xml元素,语法格式所示:
<!ELEMENT 元素名称 元素类型>
(1)元素类型可以是元素内容或者类型
如为元素内容:则需要使用()括起来,如
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
(2)如为元素类型,则直接书写 ,DTD规范定义如下几种类型:
EMPTY:用于定义空元素,例如<br></br>
ANY:表示元素内容为任意类型
-----------------------------------------------------
元素内容可以使用如下方式,描述内容的组成关系用逗号分隔,表示内容的出现顺序必须与声明时一致
用逗号分隔,表示内容的出现顺序必须与声明时一致。
<!ELEMENT 书 (书名,作者,售价)>
用|分隔,表示任选其一,即多个只能出现一个
<!ELEMENT 书 (书名|作者|售价)>
在元素内容中也可以使用+,*,?等符号表示元素出现的次数:
+:一次或多次(书+)
0:0次或一次(书?)
*:0次或多次(书*)
什么都不写 (书)只出现一次
也可以使用原括号()批量设置,例
<!ELEMENT 书((书名*,作者?售价)*|COMMENT)>
属性定义
xml文档的标签性需要通过ATTLIST为其设置属性
语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
......
>
属性声明举例
<!ATTLIST 图书
书名 CDATA #REQUIRED
售价 CDATA #IMPLED
>
对应xml文件:
<图书 书名="三国演义" 售价="20">...</图书>
<图书 书名="西游记" 售价="18">...</图书>
设置说明:
#REQUIRED 必须设置该属性
#IMPLED 可以设置也可以不设置
#FIXED:说明该属性的值固定为一个值
直接使用默认值:在xml中可以设置该值也可以不设置该属性值。如果没设置则使用默认值
举例:
<!ATTLST 图书
书名 CDATA #REQUIRED
售价 CDATA #IMPLED
类别 CDATA #FIXED "文学"
评价 CDATA "好"
>
-----------------------------------------------
CDATA表示属性值为普通文本字符串
ENUMERATED(枚举)
ID,表示设置值为一个唯一值,ID属性的值只能由字母,下划线开始,不能出现空白字符
ENTITY(实体)
实体定义
实体用于为一段内容创建一个别名,以后在xml文档中就可以使用别名引用这段内容
在DTD定义一个实体,一条<!ENTITY>语句用于定义一个实体
实体可分为两种类型:引用实体个参数实体
(1)引用实体主要在xml文档中被应用
语法格式:
<!ENTITY 实体名称 "实体内容">: 直接转变成实体内容
引用方式:
&实体名称;
举例
<!ENTITY name "I am a student">
.....
&name;
(2)参数实体被DTD文件自身使用
语法格式:
<!ENTITY % 实体名称 "实体内容">
&实体名称;
在struts1里action标签必须要设置的属性:path
- <!ELEMENT action (icon?, display-name?, description?, set-property*, exception*, forward*)>
- <!ATTLIST action id ID #IMPLIED>
- <!ATTLIST action attribute %BeanName; #IMPLIED>
- <!ATTLIST action className %ClassName; #IMPLIED>
- <!ATTLIST action forward %RequestPath; #IMPLIED>
- <!ATTLIST action include %RequestPath; #IMPLIED>
- <!ATTLIST action input %RequestPath; #IMPLIED>
- <!ATTLIST action name %BeanName; #IMPLIED>
- <!ATTLIST action parameter CDATA #IMPLIED>
- <!ATTLIST action path %RequestPath; #REQUIRED>
- <!ATTLIST action prefix CDATA #IMPLIED>
- <!ATTLIST action roles CDATA #IMPLIED>
- <!ATTLIST action scope %RequestScope; #IMPLIED>
- <!ATTLIST action suffix CDATA #IMPLIED>
- <!ATTLIST action type %ClassName; #IMPLIED>
- <!ATTLIST action unknown %Boolean; #IMPLIED>
- <!ATTLIST action validate %Boolean; #IMPLIED>