DOM教程（什么是DOM）-----来源：IBM developerWorks -

DOM教程（什么是DOM）-----来源：IBM developerWorks

DOM教程（什么是DOM）
                        作为结构的 DOM
      DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中导航仪寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而 DOM 被认为是基于树或基于对象的。
      对于特别大的文档，解析和加载整个文档可能很慢且很耗资源，因此使用其他手段来处理这样的数据会更好。这些基于事件的模型，比如 Simple API for XML（SAX），适用于处理数据流，即随着数据的流动而依次处理数据。基于事件的 API 消除了在内存中构造树的需要，但是却不允许开发人员实际更改原始文档中的数据。
     另一方面，DOM 还提供了一个 API，允许开发人员添加、编辑、移动或删除树中任意位置的节点，从而创建一个引用程序。
     解析器是一个软件应用程序，设计用于分析文档（这里是指 XML 文件），以及做一些特定于该信息的事情。在诸如 SAX 这样基于事件的 API 中，解析器将向某种监听器发送事件。在诸如 DOM 这样基于树的 API 中，解析器将在内存中构造一颗数据树。
作为 API 的 DOM
     从 DOM Level 1 开始，DOM API 包含了一些接口，用于表示可从 XML 文档中找到的所有不同类型的信息。它还包含使用这些对象所必需的方法和属性。
Level 1 包括对 XML 1.0 和 HTML 的支持，每个 HTML 元素被表示为一个接口。它包括用于添加、编辑、移动和读取节点中包含的信息的方法，等等。然而，它没有包括对 XML 名称空间（XML Namespace）的支持，XML 名称空间提供分割文档中的信息的能力。
     DOM Level 2 添加了名称空间支持。Level 2 扩展了 Level 1，允许开发人员检测和使用可能适用于某个节点的名称空间信息。Level 2 还增加了几个新的模块，以支持级联样式表、事件和增强的树操作。
     当前正处于定稿阶段的 DOM Level 3 包括对创建 Document 对象（以前的版本将这个任务留给实现，使得创建通用应用程序很困难）的更好支持、增强的名称空间支持，以及用来处理文档加载和保存、验证以及 XPath 的新模块；XPath 是在 XSL 转换（XSL Transformation）以及其他 XML 技术中用来选择节点的手段。
     DOM 的模块化意味着作为开发人员，您必须知道自己希望使用的特性是否受正在使用的 DOM 实现所支持。
                                        确定特性可用性
     DOM 推荐标准的模块性质允许实现者挑选将要包括到产品中的部分，因而在使用某个特定的特性之前，首先确定该特性是否可用可能是必要的。本教程仅使用 DOM Level 2 Core API，不过在着手您自己的项目时，了解如何能够检测特性是有所帮助的。
     DOM 中定义的接口之一就是 DOMImplementation。通过使用 hasFeature() 方法，您可以确定某个特定的特性是否受支持。DOM Level 2 中不存在创建DOMImplementation 的标准方法，不过下面的代码将展示如何使用 hasFeature() 来确定 DOM Level 2 样式表模块在某个 Java 应用程序中是否受支持。
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.DOMImplementation;
public class ShowDomImpl {
   public static void main (String args[]) {
      try {
         DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
         DocumentBuilder docb = dbf.newDocumentBuilder();
         DOMImplementation domImpl = docb.getDOMImplementation();
         if (domImpl.hasFeature("StyleSheets", "2.0")) {
            System.out.println("Style Sheets are supported.");
         } else {
            System.out.println("Style Sheets are not supported.");
         }
      } catch (Exception e) {}
}
}
（DOM Level 3 将包括用于创建 DOMImplementation 的标准方法。）
     本教程将使用单个文档来展示 DOM Level 2 Core API 的对象和方法。
                                        基本的 XML 文件
     本教程中的所有例子都是用了一个包含如下节点的 XML 文件，它表示输入某个商业系统的订单。回顾一下，XML 文件的基本组成部分包括：
     XML 声明：基本的声明 <?xml version"1.0"?> 将这个文件定义为 XML 文档。在声明中指定一种字符编码的情况并不鲜见，如下所示。通过这种方式，不管该 XML 文件使用的语言或字符编码是什么，只要解析器理解特定的编码，它就能够正确地读取该 XML 文件。
     DOCTYPE 声明：XML 是人机之间交换信息的便利手段，但是要使它能够顺利地工作，必须要有一个公共的词汇表。可选的 DOCTYPE 声明可用于指定一个应该用来与此文件做比较的文档（在本例中为 orders.dtd），以确保不会产生任何混淆或丢失信息（例如，丢失一个 userid 或错误拼写某个元素名称）。以这种方式处理过的文档称为有效的文档。成功的有效性检查并不是 XML 所必需的，后面的例子实际上从文档中省略了 DOCTYPE 声明。
     数据本身：XML 文档中的数据必须包含在单个根元素内，比如下面的 orders 元素。要使 XML 文档得到处理，它必须是格式良好的（well-formed）。
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ORDERS SYSTEM "orders.dtd">
<orders>
   <order>
      <customerid limit="1000">12341</customerid>
      <status>pending</status>
      <item instock="Y" itemid="SA15">
         <name>Silver Show Saddle, 16 inch</name>
         <price>825.00</price>
         <qty>1</qty>
      </item>
      <item instock="N" itemid="C49">
         <name>Premium Cinch</name>
         <price>49.00</price>
         <qty>1</qty>
      </item>
   </order>
   <order>
      <customerid limit="150">251222</customerid>
      <status>pending</status>
      <item instock="Y" itemid="WB78">
         <name>Winter Blanket (78 inch)</name>
         <price>20</price>
         <qty>10</qty>
      </item>
   </order>
</orders>
    在 DOM 中，使用 XML 信息意味着首先将它划分为节点。

posted on 2007-08-09 12:55 九宝阅读(315) 评论(0) 编辑收藏所属分类: XML

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理
相关文章: 关于SAX，DOM，JAXP，JDOM，DOM4J的一些理解 DOM教程（什么是DOM）-----来源：IBM developerWorks

导航

留言簿(4)

随笔分类

随笔档案

阅读排行榜

评论排行榜

常用链接

统计

最新评论

DOM教程（什么是DOM）-----来源：IBM developerWorks