My Blog JAVA

My Blog JAVA

导航

<2006年9月>
272829303112
3456789
10111213141516
17181920212223
24252627282930
1234567

统计

常用链接

留言簿(4)

随笔档案

文章档案

搜索

最新评论

阅读排行榜

评论排行榜

2006年9月20日 #

Apache Cocoon入门

在某种意义上,可将Cocoon视为一个基于XML的内容管理系统,因其提供了一种机制来描述Web信息项目(内容)的结构和语义、这些项目的关系、它们如何随着时间的推移而发生改变(逻辑)以及在请求时如何向用户呈现(它们的样式)。事实上,Cocoon项目作为Apache Web服务器项目的一部分,它的作用之一就是组织和控制Apache麾下众多项目的文档化过程。

作为对其真实用途的一个比喻,Cocoon(茧)这个名字具有深远的意义。它代表一种包裹结构,其中的某些东西将从幼虫阶段成长为美丽的蝴蝶,并准备展翅飞翔。但在Apache Cocoon的主页上,没有对这个巧妙的比喻进行说明。相反,它只是对这个项目进行了准确的技术性解释:“Apache Cocoon是一个XML发布框架,它将XML和XSLT技术在服务器应用程序中的应用提升到一个新级别。Cocoon的宗旨是提升管道化SAX处理的性能和扩展性,通过对内容、逻辑和样式的分离来营造一个灵活的环境。”

到底什么是Cocoon?

Cocoon最初的型态是一个简单的Java servlet,全部使用标准W3C组件:用文档对象模型(DOM)来解析文档,用XML来捕捉和格式化数据,用XSLT来转换数据和合并/操纵XML文档,并用XSL来管理文档的表示以便通过Web传送。但人们很快就要求它为其他类型的内容提供服务(比如程序和文档),所以Cocoon逐渐发展成为一个完整的、基于XML的发布框架及系统。

随着时间的推移,几个新的XML组件问世了,比如SAX。另外,XSL也逐渐细分为几个不同的组件,分别提供Transforms、Formatting Objects和XPath功能。这些新标准直接促成了Cocoon 2在2002年的问世,它定义了一个标准的(而且仍在发展的)内容管理系统,并面向公众开放。

就目前来说,我们可采取几种不同的方式来描述Cocoon:一个XML发布框架,一个数据源聚合器以及一系列管道和组件的集合。

作为发布框架的Cocoon

Cocoon基于对SAX事件的管道式处理。Web应用程序如果围绕这个框架来构建,将获得较好的扩展性和性能。利用一个集中式的配置系统,你可以方便地创建、部署和维护Web应用程序。Cocoon使用了一个缓存系统,所有组件都可根据需要进行动态配置。接收到用户请求后,会自动检查缓存,判断请求的URI(统一资源标识符)是否存在。如果存在,就直接传递缓存的内容,不需要通过一个管道来处理它。

Cocoon作为数据源聚合器

Cocoon可作为一个抽象的引擎使用(通过一个Java servlet),它基于自定义的协议处理程序,能通过标准URI来访问外部数据源。Cocoon甚至能递归调用自身,使数据流能在多个管道化阶段同时处理,从而提高处理速度和效率。

管道和组件

Cocoon体系结构的核心设计思想是模块化和抽象处理。Cocoon管道在概念上和UNIX系统中使用的管道差不多,只是Cocoon管道中的所有元素都是通过解析XML文档而创建的SAX事件。Cocoon识别3种类型的管道元素(组件),分别是生成器(generators)、转换器(transformers)和序列化器(serializers)。其中,生成器使用一个请求的URI来生成SAX事件;转换器使用SAX事件并生成其他SAX事件;序列化器使用SAX事件并生成一些响应。

Cocoon的用途

简单地说,Cocoon管道用于生成和递送内容。内容采用的是某种可识别的形式,由一个生成器和一个序列化器构成。在较典型的Cocoon管道中,生成器之后可能紧接着一个或多个转换器链,而序列化器用于生成不同格式的输出。采取这种方式,同一个源文档可为Web浏览器生成HTML格式的内容,为WAP设备生成WML格式的内容,为打印输出生成PDF格式的内容。

作为一个开发平台,Cocoon最吸引人的地方在于它提供了品种丰富的生成器、转换器和序列化器。人们为Cocoon 2项目开发和捐赠了许多这样的组件。一经捐赠,这些组件就可进行定制,以添加新功能或者进行扩展,从而创建出新的组件。A总结了适用于Cocoon的一些常用生成器、转换器和序列化器。

表A

类别名称说明
生成器DirectoryGenerator将目录列表转换成XML格式,以便从中生成SAX事件
生成器FileGenerator解析一个文件或URI,并生成SAX事件
生成器JSPGenerator根据JSP页来生成XML和SAX事件
生成器ServerPagesGenerator根据XSP页来生成XML和SAX
转换器i18nTransformer使用i18n字典和语言参数值来转换SAX事件
转换器XincludeTransformer通过为现有的SAX流添加SAX事件,从而处理xinclude命名空间,并包括外部源
转换器XSLTransformer根据XSLT样式表定义来转换SAX事件流
序列化器HTMLSerializer根据SAX事件来生成HTML响应
序列化器PDFSerializer根据SAX事件,使用Apache FOP(格式输出处理器)来生成PDF
序列化器SVG2JPGSerializer根据SVG SAX事件,使用Apache Batik来生成JPEG图像
序列化器TextSerializer根据SAX事件来生成纯文本输出,适用于非XML文本,比如CSS或程序语言代码
序列化器XMLSerializer根据SAX事件来生成XML响应
可由Cocoon使用的部分组件

如所你见,Cocoon的功能并非只是简单地将数据格式化成HTML。在未来的文章中,我们将研究如何在Cocoon环境中创建和处理文档,并更详细地介绍在这个环境中工作所牵涉的问题。就目前来说,你只需理解Cocoon是针对多种目的来捕捉、呈现和递送Web内容的一种方式。

posted @ 2006-10-19 12:23 My JAVA Blog 阅读(1932) | 评论 (2)编辑 收藏

Apt 使用备忘

命令                                                               作用
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache search package                 搜索包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache show package                   获取包的相关信息,如说明、大小、版本等
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get install package                      安装包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get install package - - reinstall    重新安装包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get remove package                   删除包
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get remove package - - purge    删除包,包括删除配置文件等
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get update                                   更新源
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get dist-upgrade                          升级系统
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get -f install                                  强制安装
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache depends package             了解使用依赖
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-cache rdepends package            了解某个具体的依赖
----------------------------------------------------------------------------------------------------------------------------------------
sudo apt-get build-dep package                 安装相关的编译环境
----------------------------------------------------------------------------------------------------------------------------------------

posted @ 2006-09-23 01:09 My JAVA Blog| 编辑 收藏

用XML和XSL来生成动态页面

XML(可扩展标记语言)看起来可能像某种W3C标准——现在没有什么实际影响,即使以后能派上用场,也是很久以后的事。但实际上,它现在已经得到了应用。所以,不要等到XML已被加进了你最喜爱的HTML编辑器中才开始使用它。它现在就可以解决各种内部问题和B2B系统问题。

在Sparks.com,我们使用XML来标准化从Java对象到HTML数据显示等不同系统之间的数据表示。

特别需要指出的是,我们发现,只要以非常基本的XML结构来实现标准化,就可以更容易地共享和操作数据。在这一过程中,我们发现了使用XML的很多有效方法。下面详细介绍我们现在的应用情况。

标准化
在使用XML之前,建立与你要使用的信息不同的XML数据格式。

生成动态XML
从数据库中生成HTML并不新鲜,但生成XML却很新鲜。这里我们介绍具体的生成步骤。

用XSL作为模板语言
XSL(可扩展样式表语言)是定义XML数据显示格式的好方法,如果写成几个静态模板会更有效。

生成HTML
XML加上XSL就等于HTML。这听起来似乎不对,但用户所见的我们的HTML页面其实就是XML和XSL共同产生的效果。


一、标准化

XML的能力来自于它的灵活性。但不幸的是,它有时太灵活了,以至于你会面对一个空白的页面,发愁该怎么解决问题。

在任何XML的项目中,第一步工作都是创建标准的数据格式。为此你要作出以下决定:

&#8226; 要涉及哪些数据
&#8226; 是否要使用DTD(文件类型定义)
&#8226; 是否要使用DOM(文档对象模型)或SAX(XML的简化API)解析

确定数据:
因为没有标准的XML格式,开发者可以自由地开发自己的格式。然而,如果你的格式只能被一个应用程序识别,那么你只能运行这个程序来使用该格式。如果还有其他程序也能读懂你的XML格式,那显然会更有帮助。如果某个XML格式被修改,则使用它的系统可能也需要被修改,所以你应该建立尽可能完整的格式。因为大多数系统忽略它们无法识别的标签,所以改变一个XML格式的最安全的方法是添加标签,而不是修改标签。

单击此处查看XML数据格式实例

在Sparks.com,我们查看了不同的产品展示需要的所有产品数据。尽管并不是所有的页面都使用全部数据,但我们还是由此开发出适用于所有数据的非常完整的XML数据格式。例如,我们的产品明细信息页面显示的数据要比产品浏览页面多。然而,我们在这两种情况下仍然使用相同的数据格式,因为每个页面的XSL模板都只使用它所需要的字段。

是否使用DTD
在Sparks.com,我们使用组织良好的XML,而不使用仅仅是正确的XML,因为前者不需要DTD。DTD在用户点击和看到页面之间加入了一个处理层。我们发现这一层需要太多的处理。当然,在以XML格式与其他公司通信时,使用DTD还是很不错的。因为DTD能在发送和接受时能保证数据结构正确。

选择解析引擎
现在,可以使用的解析引擎有好几个。选择哪一个几乎完全取决于你的应用需要。如果你决定使用DTD,那么这个解析引擎必须能使你的XML被DTD验证。你可以将验证另放到一个进程中,但那样会影响性能。

SAX和DOM是两个基本的解析模型。SAX基于事件,所以在XML被解析时,事件被发送给引擎。接下来,事件与输出文件同步。DOM解析引擎为动态XML数据和XSL样式表建立层次树状结构。通过随机访问DOM树,可以提供XML数据,就象由XSL样式表来决定一样。SAX模型上的争论主要集中于对DOM结构的内存降低过度和加快XSL样式表解析时间缩短方面。

然而,我们发现使用SAX的很多系统并没有充分发挥它的能力。这些系统用它来建立DOM结构并通过DOM结构来发送事件。用这种方法,在任何XML处理之前必须从样式表中建立DOM,所以性能会下降。

二、生成动态XML

一旦建立了XML格式,我们需要一种能够将其从数据库中动态移植的方法。

生成XML文档相对来说比较简单,因为它只需要一个可以处理字符串的系统。我们建立了一个使用Java Servlet、Enterprise JavaBean server、JDBC和RDBMS(关系型数据库管理系统)的系统。

&#8226; Servlet通过把生成XML文档的任务交给Enterprise JavaBean (EJB)来处理产品信息请求。
&#8226; EJB使用JDBC从数据库里查询所需的产品详细信息。
&#8226; EJB生成XML文件并把它传递给Servlet。
&#8226; Servlet调用解析引擎,从XML文件和静态的XSL样式表中创建HTML输出。

(有关XSL应用的其他信息,请参阅用XSL作为模板语言。)

生成XML的例子
在Java中创建XML文档字符串的真正代码可以分成几个方法和类。

启动XML生成过程的代码放在EJB方法里。这一实例会立即创建一个StringBuffer,以便存储生成的XML字符串。

StringBuffer xml = new StringBuffer();
xml.append(XmlUtils.beginDocument("/browse_find/browse.xsl", "browse", request));
xml.append(product.toXml());
xml.append(XmlUtils.endDocument("browse");
out.print(xml.toString());


后面的三个xml.append()变元本身就是对其他方法的调用。
产生文件头
第一个附加方法调用XmlUtils类来产生XML文件头。我们的Java Servlet中的代码如下:

public static String beginDocument(String stylesheet, String page)
{
    StringBuffer xml = new StringBuffer();
    xml.append("<?xml version=\"1.0\"?>\n")
    .append("<?xml-stylesheet href=\"")
    .append(stylesheet).append("\"")
    .append(" type =\"text/xsl\"?>\n");
  xml.append("<").append(page).append(">\n");
  return xml.toString();
}

这段代码生成了XML文件头。<?xml>标签把本文件定义为支持1.0版本的XML文件。第二行代码指向用以显示数据的正确样式表的位置。最后包括进去的是项级标签(本实例中为<browse>)。在文件末尾,只有<browse>标签需要被关闭。

<?xml version="1.0"?> <?xml-stylesheet href="/browse_find/browse.xsl" type="text/xsl"?> <browse>

填入产品信息
完成了文件头后,控制方法会调用Java对象来产生它的XML。本例中调用的是product对象。product对象使用两个方法来产生它的XML表示。第一个方法toXML()通过产生<product>和</product>标签来建立product节点。然后它会调用internalXML(),这样就能提供产品XML所需的内容。internalXML()是一系列的StringBuffer.append()调用。StringBuffer也被转换成字符串并返回给控制方法。
public String toXml()
    {
    StringBuffer xml = new StringBuffer("<product>\n");
    xml.append(internalXml());
    xml.append("</product>\n");
    return xml.toString();
    }

public String internalXml()
    {
    StringBuffer xml = new
    StringBuffer("\t")
        .append(productType).append("\n");
    xml.append("\t").append(idValue.trim())
        .append("\n");
    xml.append("\t").append(idName.trim())
        .append("\n");
    xml.append("\t").append(page.trim())
        .append("\n");
厖?
      xml.append("\t").append(amount).append("\n");
    xml.append("\t").append(vendor).append("\n");
    xml.append("\t\n");
    xml.append("\t").append(pubDesc).append("\n");
    xml.append("\t").append(venDesc).append("\n";
厖?
    return xml.toString();
}


关闭文件
最后,XMLUtils.endDocument()方法被调用。这个调用关闭XML标签(本例中为),并最终完成架构好的XML文件。来自控制方法的整个StringBuffer也转换成字符串,并返回给处理最初HTTP请求的servlet。

三、用XSL作为模板语言

为了得到HTML输出,我们把生成的XML文件和控制XML数据如何表示的XSL模板相结合。我们的XSL模板由精心组织的XSL和HTML标签组成。

开始建模板
我们的XSL模板开始部分与下面这段代码类似。第一行代码为必需代码,将本文件定义为XSL样式表。xmlns:xsl=属性引用本文件所使用的XML名称空间,而version=属性则定义名称空间的版本号。在文件的末尾,我们关闭标签。

由<xsl:template>开始的第二行代码确定了XSL模板的模式。Match属性是必需的,在这里指向XML标签<basketPage>。在我们的系统里,<basketPage>标签里包含<product> 标签,这使得XSL模板可以访问嵌在<product>标签内的产品信息。我们又一次必须在文件末尾关闭<xsl:template>标签。

接下来,我们来看一看组织良好的HTML。由于它将被XML解析引擎处理,所以必须符合组织良好的XML的所有规则。从本质上来讲,这意味着所有的开始标签必须有对应的结束标签。例如,通常不被结束的<P>标签,必须用</P>关闭。


<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
<xsl:template match="basketPage">
<html>
<head>
<title>Shopping Bag / Adjust Quantity</title>
</head>
<body bgcolor="#cccc99" bgproperties="fixed" link="#990000" vlink="#990000">
<br>
?br> </xsl:template>
</xsl:stylesheet>


在模板的主体内,有很多XSL标签被用于为数据表示提供逻辑。下面解释两个常用的标签。
Choose
<xsl:choose>标签类似于传统编程语言中if-then-else结构的开始部分。在XSL中,choose标签表示在代码进入的部分中,赋值将触发动作的发生。拥有赋值属性的<xsl:when>标签跟在choose标签后面。如果赋值是正确的,位于<xsl:when>的开始和结束标签之间的内容将被使用。如果赋值错误,就使用<xsl:otherwise>的开始和结束标签之间的内容。整个部分用</xsl:choose>来结束。

在这个例子里,when标签会为quantity标签检查XML。如果quantity标签里含有值为真的error属性,quantity标签将会显示列在下面的表格单元。如果属性的值不为真,XSL将会显示otherwise标签间的内容。在下面的实例里,如果error属性不真,则什么都不会被显示。

<xsl:choose>
<xsl:when test="quantity[@error='true']">
<td bgcolor="#ffffff"><img height="1" width="1" src="http://img.sparks.com/Images/I-Catalog/sparks_images/sparks_ui/clearpixel.gif"/></td>
<td valign="top" bgcolor="#ffffff" colspan="2"><font face="Verdana, Arial" size="1" color="#cc3300"><b>*Not enough in stock. Your quantity was adjusted accordingly.</b></font></td>
</xsl:when>
<xsl:otherwise>
</xsl:otherwise>
</xsl:choose>


For-each
<xsl:for-each>标签可以用来对相似XML数据的多种情况应用同一个样式表。对于我们来说,可以从数据库中取出一系列产品信息,并在Web页上进行统一格式化。这里有一个例子:
<xsl:for-each select="package">
<xsl:apply-templates select="product"/>
</xsl:for-each>


for-each 循环在程序遇到标签时开始。这个循环将在程序遇到标签时结束。一旦这个循环运行,每次标签出现时都会应用这个模板。

四、生成HTML

将来的某一时刻,浏览器将会集成XML解析引擎。到那时,你可以直接向浏览器发送XML和XSL文件,而浏览器则根据样式表中列出的规则显示XML数据。不过,在此之前开发者们将不得不在他们服务器端的系统里创建解析功能。

在Sparks.com,我们已经在Java servlet里集成了一个XML解析器。这个解析器使用一种称为XSLT (XSL Transformation)的机制,按XSL标签的说明向XSL模板中添加XML数据。

当我们的Java servlet处理HTTP请求时,servlet检索动态生成的XML,然后XML被传给解析引擎。根据XML文件中的指令,解析引擎查找适当的XSL样式表。解析器通过DOM结构创建HTML文件,然后这个文件再传送给发出HTTP请求的用户。

如果你选择使用SAX模型,解析器会通读XML源程序,为每个XML标签创建一个事件。事件与XML数据对应,并最终按XSL标签向样式表中插入数据。

posted @ 2006-09-22 12:16 My JAVA Blog| 编辑 收藏

修改源并升级更新ubuntu

http://wiki.ubuntu.org.cn/%E5%BF%AB%E9%80%9F%E8%AE%BE%E7%BD%AE%E6%8C%87%E5%8D%97/DapperDrake

posted @ 2006-09-20 21:50 My JAVA Blog| 编辑 收藏