2006年9月20日随笔档案 - My Blog JAVA

2006年9月20日 #

Apache Cocoon入门

在某种意义上，可将Cocoon视为一个基于XML的内容管理系统，因其提供了一种机制来描述Web信息项目（内容）的结构和语义、这些项目的关系、它们如何随着时间的推移而发生改变（逻辑）以及在请求时如何向用户呈现（它们的样式）。事实上，Cocoon项目作为Apache Web服务器项目的一部分，它的作用之一就是组织和控制Apache麾下众多项目的文档化过程。

作为对其真实用途的一个比喻，Cocoon（茧）这个名字具有深远的意义。它代表一种包裹结构，其中的某些东西将从幼虫阶段成长为美丽的蝴蝶，并准备展翅飞翔。但在Apache Cocoon的主页上，没有对这个巧妙的比喻进行说明。相反，它只是对这个项目进行了准确的技术性解释：“Apache Cocoon是一个XML发布框架，它将XML和XSLT技术在服务器应用程序中的应用提升到一个新级别。Cocoon的宗旨是提升管道化SAX处理的性能和扩展性，通过对内容、逻辑和样式的分离来营造一个灵活的环境。”

到底什么是Cocoon?

Cocoon最初的型态是一个简单的Java servlet，全部使用标准W3C组件：用文档对象模型（DOM）来解析文档，用XML来捕捉和格式化数据，用XSLT来转换数据和合并/操纵XML文档，并用XSL来管理文档的表示以便通过Web传送。但人们很快就要求它为其他类型的内容提供服务（比如程序和文档），所以Cocoon逐渐发展成为一个完整的、基于XML的发布框架及系统。

随着时间的推移，几个新的XML组件问世了，比如SAX。另外，XSL也逐渐细分为几个不同的组件，分别提供Transforms、Formatting Objects和XPath功能。这些新标准直接促成了Cocoon 2在2002年的问世，它定义了一个标准的（而且仍在发展的）内容管理系统，并面向公众开放。

就目前来说，我们可采取几种不同的方式来描述Cocoon：一个XML发布框架，一个数据源聚合器以及一系列管道和组件的集合。

作为发布框架的Cocoon

Cocoon基于对SAX事件的管道式处理。Web应用程序如果围绕这个框架来构建，将获得较好的扩展性和性能。利用一个集中式的配置系统，你可以方便地创建、部署和维护Web应用程序。Cocoon使用了一个缓存系统，所有组件都可根据需要进行动态配置。接收到用户请求后，会自动检查缓存，判断请求的URI（统一资源标识符）是否存在。如果存在，就直接传递缓存的内容，不需要通过一个管道来处理它。

Cocoon作为数据源聚合器

Cocoon可作为一个抽象的引擎使用（通过一个Java servlet），它基于自定义的协议处理程序，能通过标准URI来访问外部数据源。Cocoon甚至能递归调用自身，使数据流能在多个管道化阶段同时处理，从而提高处理速度和效率。

管道和组件

Cocoon体系结构的核心设计思想是模块化和抽象处理。Cocoon管道在概念上和UNIX系统中使用的管道差不多，只是Cocoon管道中的所有元素都是通过解析XML文档而创建的SAX事件。Cocoon识别3种类型的管道元素（组件），分别是生成器（generators）、转换器（transformers）和序列化器（serializers）。其中，生成器使用一个请求的URI来生成SAX事件；转换器使用SAX事件并生成其他SAX事件；序列化器使用SAX事件并生成一些响应。

Cocoon的用途

简单地说，Cocoon管道用于生成和递送内容。内容采用的是某种可识别的形式，由一个生成器和一个序列化器构成。在较典型的Cocoon管道中，生成器之后可能紧接着一个或多个转换器链，而序列化器用于生成不同格式的输出。采取这种方式，同一个源文档可为Web浏览器生成HTML格式的内容，为WAP设备生成WML格式的内容，为打印输出生成PDF格式的内容。

作为一个开发平台，Cocoon最吸引人的地方在于它提供了品种丰富的生成器、转换器和序列化器。人们为Cocoon 2项目开发和捐赠了许多这样的组件。一经捐赠，这些组件就可进行定制，以添加新功能或者进行扩展，从而创建出新的组件。表A总结了适用于Cocoon的一些常用生成器、转换器和序列化器。

表A

类别	名称	说明
生成器	DirectoryGenerator	将目录列表转换成XML格式，以便从中生成SAX事件
生成器	FileGenerator	解析一个文件或URI，并生成SAX事件
生成器	JSPGenerator	根据JSP页来生成XML和SAX事件
生成器	ServerPagesGenerator	根据XSP页来生成XML和SAX
转换器	i18nTransformer	使用i18n字典和语言参数值来转换SAX事件
转换器	XincludeTransformer	通过为现有的SAX流添加SAX事件，从而处理xinclude命名空间，并包括外部源
转换器	XSLTransformer	根据XSLT样式表定义来转换SAX事件流
序列化器	HTMLSerializer	根据SAX事件来生成HTML响应
序列化器	PDFSerializer	根据SAX事件，使用Apache FOP（格式输出处理器）来生成PDF
序列化器	SVG2JPGSerializer	根据SVG SAX事件，使用Apache Batik来生成JPEG图像
序列化器	TextSerializer	根据SAX事件来生成纯文本输出，适用于非XML文本，比如CSS或程序语言代码
序列化器	XMLSerializer	根据SAX事件来生成XML响应

可由Cocoon使用的部分组件

如所你见，Cocoon的功能并非只是简单地将数据格式化成HTML。在未来的文章中，我们将研究如何在Cocoon环境中创建和处理文档，并更详细地介绍在这个环境中工作所牵涉的问题。就目前来说，你只需理解Cocoon是针对多种目的来捕捉、呈现和递送Web内容的一种方式。

posted @ 2006-10-19 12:23 My JAVA Blog 阅读(1970) | 评论 (2) | 编辑收藏

Apt 使用备忘

命令                                                               作用
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache search package                 搜索包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache show package                   获取包的相关信息，如说明、大小、版本等
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get install package                      安装包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get install package - - reinstall    重新安装包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get remove package                   删除包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get remove package - - purge    删除包，包括删除配置文件等
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get update                                   更新源
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get dist-upgrade                          升级系统
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get -f install                                  强制安装
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache depends package             了解使用依赖
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache rdepends package            了解某个具体的依赖
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get build-dep package                 安装相关的编译环境
----------------------------------------------------------------------------------------------------------------------------------------

posted @ 2006-09-23 01:09 My JAVA Blog| 编辑收藏

用XML和XSL来生成动态页面

XML（可扩展标记语言）看起来可能像某种W3C标准——现在没有什么实际影响，即使以后能派上用场，也是很久以后的事。但实际上，它现在已经得到了应用。所以，不要等到XML已被加进了你最喜爱的HTML编辑器中才开始使用它。它现在就可以解决各种内部问题和B2B系统问题。

在Sparks.com，我们使用XML来标准化从Java对象到HTML数据显示等不同系统之间的数据表示。

特别需要指出的是，我们发现，只要以非常基本的XML结构来实现标准化，就可以更容易地共享和操作数据。在这一过程中，我们发现了使用XML的很多有效方法。下面详细介绍我们现在的应用情况。

标准化
在使用XML之前，建立与你要使用的信息不同的XML数据格式。

生成动态XML
从数据库中生成HTML并不新鲜，但生成XML却很新鲜。这里我们介绍具体的生成步骤。

用XSL作为模板语言
XSL（可扩展样式表语言）是定义XML数据显示格式的好方法，如果写成几个静态模板会更有效。

生成HTML
XML加上XSL就等于HTML。这听起来似乎不对，但用户所见的我们的HTML页面其实就是XML和XSL共同产生的效果。

一、标准化

XML的能力来自于它的灵活性。但不幸的是，它有时太灵活了，以至于你会面对一个空白的页面，发愁该怎么解决问题。

在任何XML的项目中，第一步工作都是创建标准的数据格式。为此你要作出以下决定：

• 要涉及哪些数据
• 是否要使用DTD（文件类型定义）
• 是否要使用DOM（文档对象模型）或SAX（XML的简化API）解析

确定数据：
因为没有标准的XML格式，开发者可以自由地开发自己的格式。然而，如果你的格式只能被一个应用程序识别，那么你只能运行这个程序来使用该格式。如果还有其他程序也能读懂你的XML格式，那显然会更有帮助。如果某个XML格式被修改，则使用它的系统可能也需要被修改，所以你应该建立尽可能完整的格式。因为大多数系统忽略它们无法识别的标签，所以改变一个XML格式的最安全的方法是添加标签，而不是修改标签。

单击此处查看XML数据格式实例

在Sparks.com，我们查看了不同的产品展示需要的所有产品数据。尽管并不是所有的页面都使用全部数据，但我们还是由此开发出适用于所有数据的非常完整的XML数据格式。例如，我们的产品明细信息页面显示的数据要比产品浏览页面多。然而，我们在这两种情况下仍然使用相同的数据格式，因为每个页面的XSL模板都只使用它所需要的字段。

是否使用DTD
在Sparks.com，我们使用组织良好的XML，而不使用仅仅是正确的XML，因为前者不需要DTD。DTD在用户点击和看到页面之间加入了一个处理层。我们发现这一层需要太多的处理。当然，在以XML格式与其他公司通信时，使用DTD还是很不错的。因为DTD能在发送和接受时能保证数据结构正确。

选择解析引擎
现在，可以使用的解析引擎有好几个。选择哪一个几乎完全取决于你的应用需要。如果你决定使用DTD，那么这个解析引擎必须能使你的XML被DTD验证。你可以将验证另放到一个进程中，但那样会影响性能。

SAX和DOM是两个基本的解析模型。SAX基于事件，所以在XML被解析时，事件被发送给引擎。接下来，事件与输出文件同步。DOM解析引擎为动态XML数据和XSL样式表建立层次树状结构。通过随机访问DOM树，可以提供XML数据，就象由XSL样式表来决定一样。SAX模型上的争论主要集中于对DOM结构的内存降低过度和加快XSL样式表解析时间缩短方面。

然而，我们发现使用SAX的很多系统并没有充分发挥它的能力。这些系统用它来建立DOM结构并通过DOM结构来发送事件。用这种方法，在任何XML处理之前必须从样式表中建立DOM，所以性能会下降。

二、生成动态XML

一旦建立了XML格式，我们需要一种能够将其从数据库中动态移植的方法。

生成XML文档相对来说比较简单，因为它只需要一个可以处理字符串的系统。我们建立了一个使用Java Servlet、Enterprise JavaBean server、JDBC和RDBMS（关系型数据库管理系统）的系统。

• Servlet通过把生成XML文档的任务交给Enterprise JavaBean (EJB)来处理产品信息请求。
• EJB使用JDBC从数据库里查询所需的产品详细信息。
• EJB生成XML文件并把它传递给Servlet。
• Servlet调用解析引擎，从XML文件和静态的XSL样式表中创建HTML输出。

（有关XSL应用的其他信息，请参阅用XSL作为模板语言。）

生成XML的例子
在Java中创建XML文档字符串的真正代码可以分成几个方法和类。

启动XML生成过程的代码放在EJB方法里。这一实例会立即创建一个StringBuffer，以便存储生成的XML字符串。

StringBuffer xml = new StringBuffer();
xml.append(XmlUtils.beginDocument("/browse_find/browse.xsl", "browse", request));
xml.append(product.toXml());
xml.append(XmlUtils.endDocument("browse");
out.print(xml.toString());

后面的三个xml.append()变元本身就是对其他方法的调用。
产生文件头
第一个附加方法调用XmlUtils类来产生XML文件头。我们的Java Servlet中的代码如下：

public static String beginDocument(String stylesheet, String page)
{
StringBuffer xml = new StringBuffer();
xml.append("<?xml version=\"1.0\"?>\n")
.append("<?xml-stylesheet href=\"")
.append(stylesheet).append("\"")
.append(" type =\"text/xsl\"?>\n");
xml.append("<").append(page).append(">\n");
return xml.toString();
}

这段代码生成了XML文件头。<?xml>标签把本文件定义为支持1.0版本的XML文件。第二行代码指向用以显示数据的正确样式表的位置。最后包括进去的是项级标签（本实例中为<browse>）。在文件末尾，只有<browse>标签需要被关闭。

<?xml version="1.0"?> <?xml-stylesheet href="/browse_find/browse.xsl" type="text/xsl"?> <browse>

填入产品信息
完成了文件头后，控制方法会调用Java对象来产生它的XML。本例中调用的是product对象。product对象使用两个方法来产生它的XML表示。第一个方法toXML()通过产生<product>和</product>标签来建立product节点。然后它会调用internalXML()，这样就能提供产品XML所需的内容。internalXML()是一系列的StringBuffer.append()调用。StringBuffer也被转换成字符串并返回给控制方法。
public String toXml()
{
StringBuffer xml = new StringBuffer("<product>\n");
xml.append(internalXml());
xml.append("</product>\n");
return xml.toString();
}

public String internalXml()
{
StringBuffer xml = new
StringBuffer("\t")
.append(productType).append("\n");
xml.append("\t").append(idValue.trim())
.append("\n");
xml.append("\t").append(idName.trim())
.append("\n");
xml.append("\t").append(page.trim())
.append("\n");
厖?
xml.append("\t").append(amount).append("\n");
xml.append("\t").append(vendor).append("\n");
xml.append("\t\n");
xml.append("\t").append(pubDesc).append("\n");
xml.append("\t").append(venDesc).append("\n";
厖?
return xml.toString();
}

关闭文件
最后，XMLUtils.endDocument()方法被调用。这个调用关闭XML标签（本例中为），并最终完成架构好的XML文件。来自控制方法的整个StringBuffer也转换成字符串，并返回给处理最初HTTP请求的servlet。

三、用XSL作为模板语言

为了得到HTML输出，我们把生成的XML文件和控制XML数据如何表示的XSL模板相结合。我们的XSL模板由精心组织的XSL和HTML标签组成。

开始建模板
我们的XSL模板开始部分与下面这段代码类似。第一行代码为必需代码，将本文件定义为XSL样式表。xmlns:xsl=属性引用本文件所使用的XML名称空间，而version=属性则定义名称空间的版本号。在文件的末尾，我们关闭标签。

由<xsl:template>开始的第二行代码确定了XSL模板的模式。Match属性是必需的，在这里指向XML标签<basketPage>。在我们的系统里，<basketPage>标签里包含<product> 标签，这使得XSL模板可以访问嵌在<product>标签内的产品信息。我们又一次必须在文件末尾关闭<xsl:template>标签。

接下来，我们来看一看组织良好的HTML。由于它将被XML解析引擎处理，所以必须符合组织良好的XML的所有规则。从本质上来讲，这意味着所有的开始标签必须有对应的结束标签。例如，通常不被结束的标签，必须用关闭。

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
<xsl:template match="basketPage">
<html>
<head>
<title>Shopping Bag / Adjust Quantity</title>
</head>
<body bgcolor="#cccc99" bgproperties="fixed" link="#990000" vlink="#990000">
 
?br> </xsl:template>
</xsl:stylesheet>

在模板的主体内，有很多XSL标签被用于为数据表示提供逻辑。下面解释两个常用的标签。
Choose
<xsl:choose>标签类似于传统编程语言中if-then-else结构的开始部分。在XSL中，choose标签表示在代码进入的部分中，赋值将触发动作的发生。拥有赋值属性的<xsl:when>标签跟在choose标签后面。如果赋值是正确的，位于<xsl:when>的开始和结束标签之间的内容将被使用。如果赋值错误，就使用<xsl:otherwise>的开始和结束标签之间的内容。整个部分用</xsl:choose>来结束。

在这个例子里，when标签会为quantity标签检查XML。如果quantity标签里含有值为真的error属性，quantity标签将会显示列在下面的表格单元。如果属性的值不为真，XSL将会显示otherwise标签间的内容。在下面的实例里，如果error属性不真，则什么都不会被显示。

<xsl:choose>
<xsl:when test="quantity[@error='true']">
<td bgcolor="#ffffff"><img height="1" width="1" src="http://img.sparks.com/Images/I-Catalog/sparks_images/sparks_ui/clearpixel.gif"/></td>
<td valign="top" bgcolor="#ffffff" colspan="2">*Not enough in stock. Your quantity was adjusted accordingly.</td>
</xsl:when>
<xsl:otherwise>
</xsl:otherwise>
</xsl:choose>

For-each
<xsl:for-each>标签可以用来对相似XML数据的多种情况应用同一个样式表。对于我们来说，可以从数据库中取出一系列产品信息，并在Web页上进行统一格式化。这里有一个例子：
<xsl:for-each select="package">
<xsl:apply-templates select="product"/>
</xsl:for-each>

for-each 循环在程序遇到标签时开始。这个循环将在程序遇到标签时结束。一旦这个循环运行，每次标签出现时都会应用这个模板。

四、生成HTML

将来的某一时刻，浏览器将会集成XML解析引擎。到那时，你可以直接向浏览器发送XML和XSL文件，而浏览器则根据样式表中列出的规则显示XML数据。不过，在此之前开发者们将不得不在他们服务器端的系统里创建解析功能。

在Sparks.com，我们已经在Java servlet里集成了一个XML解析器。这个解析器使用一种称为XSLT (XSL Transformation)的机制，按XSL标签的说明向XSL模板中添加XML数据。

当我们的Java servlet处理HTTP请求时，servlet检索动态生成的XML，然后XML被传给解析引擎。根据XML文件中的指令，解析引擎查找适当的XSL样式表。解析器通过DOM结构创建HTML文件，然后这个文件再传送给发出HTTP请求的用户。

如果你选择使用SAX模型，解析器会通读XML源程序，为每个XML标签创建一个事件。事件与XML数据对应，并最终按XSL标签向样式表中插入数据。

posted @ 2006-09-22 12:16 My JAVA Blog| 编辑收藏