大音希声、大象无形

Java企业级应用软件开发探讨

关于基于JavaSript的RIA客户端数据处理(下)

一、引子

上一篇讨论了关于客户端数据处理的一些问题,以简单的用例场景的方式描述了出来。很明显,要想实现一个功能完整的Rich客户端的话,必须能够满足上述用例场景的需求。能否根据这些需求做出合理的设计,是一个挑战。尤其对于设计而言,不同的人有着不同的风格,而且由于背景不同,也会有不同的见解。本文中,我只是陈述出自己的一些想法和设想,更多的是希望能够抛砖引玉,通过在这个方面的讨论也能增进我的理解。呵呵。

很显然,blog的形式更适合作为思路的介绍以及探讨的平台,而不是详细设计的文档。而且很明显这一篇文章是承载不了所有的详细设计的。我争取把我在各个细化的方面的想法在后续的文章里面发出来。如果时间允许的话,整理出初始的文档和代码,建立一个小的开源项目未尝不可(因为如此,所有的JS都是采用英文来注释──其实还有一个原因是练习英文 :))。这都是后话了。

二、缩略语

  1. RIARich Internet Application的缩写。RIA是拥有传统本地应用的功能和效果的Web应用。RIA一般把UI相关的处理交给了Web客户端,但是大量的数据(包括应用的状态、数据等)还是交给服务端处理

  2. Ajax:又写为AJAX,是"Asynchronous JavaScript and XML"的缩写。是一种使用浏览器技术进行RIA开发的技术

  3. Prototype:开源的优雅的Ajax以及JavaScript基础扩展框架。由于被Rails采用而闻名,使用相当广泛
  4. jQuery:功能类似Prototype + script.aculo.us的开源Ajax框架。据我所知,Google用得比较多
  5. Ext:对YUI的一个扩展的UI构件库。经过改进后,可以使用jQuery或者Prototype作为基础。目前好像正在完善自身的基础Ext base。以优秀的构件闻名。虽然目前仍然属于商业构件库,但是License相对宽松,一般的商业应用可以免费使用
  6. dojo:由dojo foundation管理的一个开源JavaScript框架。提供了很好的JavaScript扩展,目前被IBMSun等大公司支持和使用

  7. JsonJavaScript Object Notation的缩写。它是一种纯文本的数据对象传输协议,在Ajax的应用中被广泛采用

  8. CRUDCreate(创建)、Retrieve(获取)、Update(更新)和Delete(删除)这四种简单的数据操作的缩写

  9. Form:本文中的Form指的是经过Ajax扩展的简单的HTML电子表单。表单内部可以拥有很多如ComboBoxTextBox等构件。一般来说,一个表单对应着一个业务的数据对象

  10. Tree:树形显示结构化数据的构件,由于数据是高度结构化的,往往可以采用懒加载等技术来提高性能

  11. Grid:以表格形式显示和编辑数据的UI构件。一般分为表头(标题栏)、表身(数据列表)和表尾(合计、状态显示等)三个部分。其中,表头可以是复合的表头,而表身可以是复合的格式(TreeGridComboBoxCheckBox等)。一个Grid可以有一个复杂的Grid定义

  12. Enhanced Grid:下面简称为EGrid,是Grid的扩展。在Grid的功能基础之上提供了数据获取和数据持久化的能力,可以大大的减少开发应用的时间(Ext中的Grid可以认为是一个简化了的EGrid

  13. CodeList:代码表,一般用在下拉列表数据处,在系统的实现中,由于性能以及标准的要求,下拉列表一般都是采用代码保存数据,但是用户在填写表单的时候需要看到正常的文字而不是代码,这就需要系统通过CodeList进行文字和代码的转换

  14. LRULeast Recent Used的缩写,是一种简单的缓存策略,如果缓存已满,那么就释放最近最少使用的那个缓存数据

  15. REST:是REpresentational State Transfer的缩写,是一种基于轻量级WebService协议

  16. JDBC:是Java DataBase Connectivity对缩写,是基于Java的数据库连接规范。

三、基础

既然决定采用Ajax,就最好采用一个基础,在这个有很多优秀的Ajax框架可供选择的时代,谁要是还要赤手空拳的来写Ajax应用,就未免有点儿过于勇敢,而近于鲁莽了。这篇文章不是Ajax框架对比文章,我不打算在这里一一列举各个流行的Ajax框架的优缺点,我只拿下面几个进行讨论,dojo、Prototype、jQuery、Ext。

先提需求,框架应该:
  1. 以一种形式支持面向对象(毕竟开发人员多数都是Java程序员,更有可能的是,他/她只对Java熟悉)
  2. 以一种方式来支持命名空间和分包机制(开发企业应用与开发网站不同,复杂的不是技术而是业务。没有命名空间和分包支持,对于大型应用,基本不可控制。──设想一下如果Java没有package关键字会怎样)
  3. 有完善的模块封装与管理规范或者最佳实践,能够自动处理模块间的依赖则更好(模块的定义不在这里解释了,一个例子说明吧,一个Jar就是一个模块。模块化和构件化是实现、维护和管理大型应用的重要手段)
  4. 提供丰富的调优选项,使得对复杂的应用调优是可能的(这一点对于UI层尤为重要,因为它直接面对使用者)
  5. 便于调试(这一点对于开发者致关重要)

综合上面几点,我选择dojo作为基础。Sorry Prototype。

四、整体构架


整体构架如下图所示(为了便于理解UI构件与其对关系,我把需要数据处理的UI构件也加了上去,图中蓝背景色的部分就是):



一目了然,整个客户端数据处理由3个部分构成,DataSource、DataSet和DataStore。下面分别进行简单的介绍。

五、DataSet

DataSet的概念很简单,就是数据对象的集合。它的构架如下图所示(注意:DataSet只是一套标准的API,可以有不同的实现——比如XML形式的):

如图所示,DataSet由四个部分构成,Record Set(数据集合)、Change Tracker(数据变更追踪)、Meta Data(数据对象源信息)和Cursors(游标API)。

分别介绍如下:
  1. Record Set:Record Set就是Record的集合,一个Record就是一个数据对象,它由一系列的属性(Property)构成,属性是一个简单的字符串,其对应的值可以是任意类型。Record提供属性读写的方法,可以直接在Record上对属性进行读写,并且,Record会为写操作提供一个事件。Record Set内部的元素必须是Record,Record Set支持对内部Record的CRUD操作。并且会有相应的事件触发
  2. Change Tracker:ChangeTracker为DataSet提供所有写操作的追踪,可以通过配置选择Change Tracker是否记录修改,如果记录修改,采用的是针对每一个Record记录增加、删除以及针对每一个属性记录First和Last修改的策略
  3. Meta Data:提供DataSet中Record的元数据(属性名、属性对应类型、其他自定义数据——校验、Form Label信息、表头信息等)以及DataSet的元数据(在全部数据中的位置等)。
  4. Cursors:Cursor其实就是Record的迭代器,可以通过对dataset查询(一般都是非常简单的filter或者range)得到,推荐通过Cursor进行Record访问,而不是通过Index,因为通过迭代器访问Record,DataSet拥有更多的能力。虽然通过Cursor完全可以访问所有的Record及其中的数据,但是由于DataSet拥有MetaData,所以还是采用DataSet作为数据绑定的主体

DataSet是整个客户端数据处理构架的核心,所有的数据访问都应该通过DataSet的API。这样客户端的数据处理才是统一的一个整体。

解决的用例问题:
  • 数据绑定:Form绑定、Grid绑定
  • 数据变更追踪:Grid变更提示、数据集合变更追踪、Form修改的追踪
  • 数据访问:数据对象元数据信息访问、数据写操作的统一事件定义、统一的数据读取方式

六、DataSource

DataSource的功能是提供对数据进行查询以及数据的持久化(持久化到客户端或者服务器端)。与DataSet一样,不同的格式数据就会有不同的DataSource,一种DataSource代表了一种客户端与服务端的数据传输协议。但是由于DataSource的逻辑与结构过于复杂(事实上,DataSet的实现也完全依赖DataSource的实现,可以类比JDBC),不应该对每一种格式都重新实现一个DataSource,由此,DataSource不应该是一套标准的API,而是使用了Adapter模式,来满足不同的数据来源,其构架如下图所示:
看上去很简单?实际上这是最复杂的部分,关于这个部分,至少可以再写3篇文章来详细探讨,在本文中,就不过度讨论了。:)

如图所示,DataSource由Cache、Query、Persist以及Providers构成,分别介绍如下:
  1. Cache:Cache的概念在前面已经阐述了,不在这里多说了。在这里简单的介绍一下客户端Cache的策略以及技术,由于基于浏览器的数据缓存技术非常重要,拟在后续的文档《客户端的缓存策略与相关技术》中对其进行详细讨论
    • 缓存策略(这一方面客户端数据的缓存与服务端的数据缓存考虑的问题应该是类似的,唯一的区别是,客户端的数据缓存不必考虑集群支持。:))
      • LRU:基础的Cache算法,如果缓存已满时,根据最近很少使用算法来确定哪些对象需要被清除
      • Priority:按照优先级高低来清理缓存空间的策略,当缓存已满时,按照优先级高低来确定哪些对象需要被清除,可以与LRU算法共存
      • Refreshable:有时效性的数据,或者在运行时有可能会被修改需要同步或者刷新的数据。可以设置数据过期时间,到时间则数据处于stale状态,再度访问该数据时,如果不能重新获得该数据,则报错
      • Expireable:临时性数据,可以设置失效时间,到时间则数据失效,在缓存需要清理时,缓存会清理掉这些失效的对象
    • 缓存持久化(属于高级的缓存策略,依赖客户端基于JavaScript的数据存储技术)
      • Save(持久化):把缓存当中的数据持久化到本地或者服务端,其用处如下
        • 通过把数据持久化可以增加Cache的容量
        • 数据本地缓存提供了离线表单填写的能力
      • Retrieve、Delete:对缓存中数据的基本操作
      • Sync:离线缓存的本地数据,可以与远程服务端进行同步,从而实现离线表单提交以及实现离线CodeList等功能
    • 缓存技术
      • Client
        • 内存引用
        • Cookie
        • Google Gear
      • Server(服务端协助客户端做一些缓存,这在传统的B/S下是匪夷所思的设计,在RIA的情况下却未尝不是一种手段)
        • WebService或者REST
        • Post + Get
  2. Query:其实Query只是一个方法,由于有可能会向服务端发XmlHttpRequest,所以这个方法需要回调方法。其参数应该是一个Query对象,一个配置对象,有一些事件的关键字(onBegin、onError、onSuccess等)。Query对象以及配置对象的格式在本文中就不详细说明了,留给以后慢慢说(因为这个部分是我最喜欢的部分)。很明显,如果查询成功,查询的结果应该是DataSet,一般来说,DataSource是DataSet来源。不同的DataSource,查询的语言未必相同。不一定所有的查询对象都支持SQL语法(比如可以支持HQL或者XQuery啊),而且我最推荐采用的是服务端提供一个服务抽象层,接受Json格式的查询请求,并返回Json格式的数据
  3. Persist:数据持久化。只是Save和Update两个方法。接受DataSet和配置对象作为参数(这两个方法也应该是异步的)。如果DataSet里面没有足够的元数据信息,需要在配置对象里面提供这些信息。这个部分不比Query部分复杂
  4. Providers:数据的来源,提供了Query和Persist API的实现,是DataSource的底层实现,它使DataSource的实现可以跨不同协议而使用。给DataSource提供不同的Provider,DataSource就可以支持不同的数据传输协议。

DataSource是数据查询和持久化的核心,所有的客户端的数据查询和持久化基本都应该采用DataSource,从而获得DataSource提供的强大而灵活的特性。

解决的用例问题:
  • 数据缓存:离线运行的CodeList、离线表单填写、性能考虑
  • 数据查询:样本查询、模糊查询、Range查询、逻辑查询、自定义查询
  • 数据处理:数据处理事件、过滤、排序

七、DataStore

DataStore基于DataSource和DataSet的实现,实现了dojo的data api。这样既实现了对需要dojo api的dojo构件的支持,又满足了类似Tree、EGrid这种既需要绑定又需要数据来源的高级构件的要求。总体来说,DataStore只是薄薄的一层接口,实际的实现完全依赖于DataSource。

解决的用例问题:
  • 数据绑定、查询、处理:Tree绑定、ComboBox数据源、EGrid绑定

八、待讨论的问题

客户端的数据处理事实上要比我想象得还要复杂,我还有一些设计决策没有确定,列举下来以供讨论吧。

8.1 客户端的事务处理?

由于很多数据处理都放在了客户端。客户端的数据处理操作相应增多而且复杂,是否应该在DataSource中添加写事务的处理?以便对数据操作进行更细粒度的管理,而不是仅仅停留在Query、Save和Track阶段?

8.2 权限数据的来源

如果可以连接到服务端,用户在向服务端登录后,服务端会返回用户的权限信息列表。客户端接收后,可以相应的提供权限控制。但是,如果客户端离线运行,用户无法向服务的登录,权限信息列表无从获得,怎么提供权限控制?

探讨方案1:离线客户端无须登录,由于没有权限控制列表,默认拥有系统最低权限(固定的配置在客户端),由系统开发人员决定用户在离线时可以进行何种操作。用户在线提交数据的时候,服务端也要根据相应的权限进行验证以防止越权的数据操作

探讨方案2:离线客户端仍须登录,权限控制列表使用用户在线登录时缓存的数据。其余与在线方式相同。如果用户没有在线登录过,那么离线应用无法使用。

8.3 跨域数据的来源

由于浏览器的安全性策略,JavaScript无法向除本身域之外的其他服务器发送请求。也就是说,对于JavaScript而言,所有的数据必须来源于同一个域的服务器。对客户端进行集成非常不利。

探讨方案1:服务端提供一个服务接入层,接受如Spring Bean、EJB、JMS、WebService等形式的服务,并且把所有的服务都转化成为一种固定格式的协议与客户端交互。所有的服务集成与协议转化都交给服务端,对客户端完全透明。

探讨方案2:服务端提供一个简单的Proxy,通过一定的协议把请求和回复转发给客户端,处理交给客户端来做

九、小结

虽然到了这里,但是对于基于JavaScript的RIA客户端数据处理的讨论却才刚刚开始,还需要很多后续的展开讨论。但是,上午已经过去了,需要去吃午饭了。:)

posted on 2007-12-15 13:15 guitarpoet 阅读(1424) 评论(2)  编辑  收藏 所属分类: 展现层

Feedback

# re: 关于基于JavaSript的RIA客户端数据处理(下)[未登录] 2008-07-01 16:51 111

标题写错了
re: 关于基于JavaSript的RIA客户端数据处理(下)
改为
re: 关于基于JavaScript的RIA客户端数据处理(下)  回复  更多评论   

# re: 关于基于JavaSript的RIA客户端数据处理(下)[未登录] 2008-07-01 16:52 111

从baidu里搜索到的...囧rz  回复  更多评论   


只有注册用户登录后才能发表评论。


网站导航: