狼爱上狸

我胡汉三又回来了

网格观点: Ian Foster 评价 Globus Toolkit 4.0 的意义

Globus Toolkit 4.0 是程序员相信代码质量已经足以满足企业需求的第一个版本。与 GT 以前的版本相比,GT4 包括很多 Web 服务和标准。网格先驱 Ian Foster 讨论了 Globus Toolkit 4.0 中的新增内容和重要内容。
Globus Toolkit 4.0 的发布
在 4 月 30 日,Globus Alliance 正式向开发社区发布了 4.0 版本。要下载这个版本,请参阅 参考资料。

IBM developerWorks 抓住了机会,就这个新发行版的重要性,对开源网格先驱 Ian Foster 进行了采访。

developerWorks:最新发布的 Globus Toolkit 4.0 被称为是距今为止“最能满足企业需求”的版本。您可以快速回顾一下 Globus Toolkit 的由来,并重点介绍一下 Globus Toolkit 4.0 中的新特性和功能吗?

Foster:在开始从事 Globus 方面的工作时,大约是在 10 年之前,我们的研究重点是试图确认一些允许通过科学上的合作和资源共享来解决一些复杂问题的机制和软件。这个工作的成果就是 Globus Toolkit。大约在 2001 年,随着 GT2 的发布,我们开始看到业界中许多用户对此很感兴趣,所以我们花费了大量的时间,吸引 Globus 软件的潜在商业用户的注意。

这些讨论对于我们来说是一剂强心针,使我们能更好地理解如何将科学界环境中的开发思想在 Web 服务框架中进行重塑,并且能够使用一种对业界非常有用的方法来提供这种重塑。在得到 IBM 的赞助之后,我们就可以真正开展工作了,随后推出的第一个产品是 2003 年 6 月发布的 GT3,这是第一个可以支持 Web 服务的 Globus Toolkit 版本,它利用了 OGSI(Open Grid Services Infrastructure),这是 WSRF(WS-Resource Framework)的前身。不幸的是,OSGI 不是一个业界普遍认可的标准,因此,坦白地说,GT3 软件并没有达到产品级别的质量。

从 GT3 发布以后的最近两年的时间里,我们已经在很多前端都取得了进步。一些重要规范已经在 Global Grid Forum(GGF)、OASIS 和 W3C 中得到了改进 —— 特别是 WSRF。我们非常努力地开发 GT4,在此过程中,我们已经实现了最新的 Web 服务标准,其中包括 WS-Security 和 WSRF。我们已经开发了一个代码集,现在它已经达到了产品级别的质量。我们还与早期采用此软件的组织进行紧密合作,例如位于 North Carolina 的 Microelectronics Center(MCNC),他是 Globus Consortium 的成员之一;还与很多研究网格的人一起合作,他们非常努力地从事最新版本的压力测试工作。我们觉得现在这个软件的质量已经足以满足企业的设置需求了。这就是为什么 IBM、Sun、HP、Intel 和其他一些著名的公司现在都对 GT4 非常感兴趣的原因。

GT4 中最引人注目的特性是:与 GT 以前的版本相比,GT4 包括很多 Web 服务和标准。GT4 基于 Web 服务实现了对各种资源类的标准接口,这一事实可以显著简化设计,从而增加这些标准被接受的可能。当然,通过开源社区开发人员和 Globus 社区中的用户的努力工作,与之前的版本相比,GT4 在测试质量、文档、性能和可靠性方面都得到了很大的提高。

您可以认为 GT4 是一组支持创建 SOA(Service Oriented Architectures) 的核心功能。这些核心功能包括支配置应计算和数据资源的执行和数据管理功能 —— 大量数据的移动和管理,以及支持资源发现和监视的服务。

developerWorks:哪些领域在推动 GT4 的开发?

Foster:在过去 3、4 年中,促进 Globus 发展的一大领域是对大量数据驱动问题的关注,例如,以 CERN 的下一代监测器阵列为代表,它每年将产生数千兆字节的数据。人们需要从大型社区中获得这些数据,并对分布式复制、处理和数据驱动的任务流进行管理。

几年前,我们最初是这样说的,“我们如何才能构建适当的协议和软件来管理大量数据在网络和机器之间的移动呢?”我们当时关注的是又大又昂贵的 SMP 机器,以及同样大型并且昂贵的存储解决方案,这也正是网格环境要解决的问题。

因此我们怀疑是否可以使用集群,利用它的并行处理能力作为解决大量数据传输的方法。这个概念带来了一些突破性进展 —— 例如,使用 Grid FTP 作为一种条带化数据移动的基础设施。今年秋天,通过使用我们构建的新型服务器,我们展示了如何跨国家在 IBM Linux® 集群之间使用 General Parallel File System(GPFS)实现 20 GB/s 的不间断的端到端数据传输。

我们还开始开发对数据传输进行管理的各种功能。我们不用担心 A 点到 B 点之间可靠性的问题,而是相信网格会要求服务允许我们“开火之后就忘记”—— 让服务来负责“重试”、“备份”和“故障迁移”的工作。我们还开发了数据复制的技术 —— 分析如何对分布在社区中的数据副本进行跟踪和管理。有一个社区正在使用 Globus 软件将 1 TB 的数据复制到全球的 6 个站点上,平均故障时间是 1 个月。

执行管理是 GT4 中的另一大特性,它的架构重新进行了设计,这让我们踏上了一条更好的途径。因此我们正在查看当某个组织有工作负载时,它是否希望在特殊的基础设施上运行,他们可以将必需的组件放在基础设施的适当位置上,以便运行这些组件。在 GT4 中,这个过程依然在进行之中 —— 但是我们最近已经开展了大量的工作,允许进行更多操作执行的管理 —— 可以根据需要为任务负载管理锁定整个堆栈,从 OS 到上层(通过虚拟机)。

developerWorks:在网格/虚拟化领域中,最新的一些产品的使用情况如何?它们与网格(尤其是 Globus 所提供的功能)的关系如何?

Foster:目前您可以看到的是很多人正在使用不同的方法来实现网格。通常,我们会看到一些允许我们对企业中或跨企业的资源进行聚合的软件,但是采用的一般都不是可以互操作的方式。因此这些解决方案大多是私有的,而且不必基于标准来开发。例如,如果您在自己的解决方案中使用 Platform 的 LSF —— 这是一个很好的产品,很好用 —— 但是之后又使用了另外一个使用不同工作负载管理器的应用程序,那么这两个应用程序不能对相同的底层资源进行共享。Globus 的目标是使您能够将网格基础设施部署到所有资源上,让高级的软件包来使用相同的公共基础设施组件。

采用这种公共基础设施所需要的标准已经在标准社区中有大约 18 个月的时间了。现在可以采用一个开源的实现,人们可以开始构建自己的基于标准的基础设施,其他应用程序和系统可以在此基础上进行构建。

developerWorks:因此,您是说诸如 Web 服务接口之类的开放标准对于网格的采用来说非常关键?

Foster:对于网格社区,我们的观点和目标是:在其中建立一些标准的接口,使您可以以标准方式管理不同类型的资源。Globus Alliance 的目标是为这些接口提供一个高质量的开源实现。我们相信开放标准非常重要,开源软件可以成为这些开放标准的一个强有力的驱动工具。毕竟,我们已经具有 Internet 和 Web 方面的经验:通过 BSD UNIX 来提供 TCP/IP 通信,通过 Apache 提供 HTTP 服务。

有关接口的一个优点是,它们可以启用多级的创新。可以通过创建不同的高级服务,在接口之上进行创新;但是也可以在接口之下进行创新,例如在网格环境中,通过创建更好的操作系统、文件系统和网络管理系统,所有这些都可以通过 Web 服务接口进行管理。这样,[Globus Toolkit] 本身就成为一种可以启用的技术。它不是一个固定不变的解决方案;而是一个平台和一组工具,您可以在此基础上可以构建其他工具和应用程序。

developerWorks:安全性方面的情况如何呢?

Foster:目前我们为安全性提供的是一组基于标准的授权和身份验证功能的一个很好的开源实现。我们实现了 WS-Security 及其相关规范,这使得用户在应用程序中只需进行一次身份验证,就可以访问整个企业或其他企业中的计算资源和数据资源,而不需要再进行任何身份验证。我们目前尚未提供(将来会解决)的功能是整合企业的单点登录解决方案。我希望那些关注 Globus 在企业中的应用情况的组织(例如 Globus Consortium 和 Univa Corp.)花费一些精力来解决这个问题。

developerWorks:就 GT4 的采用情况来说,您认为什么是它取得成功的原因?

Foster:目前的一个趋势是业界人士对 Web 服务的使用正在不断增加。因此,Globus Toolkit 的出现,以及它为各种资源类别实现了基于 Web 服务的接口的事实,引起了人们的共鸣。当然,Web 服务的使用显著简化了设计和实现,这也对它的采用有所促进。

我认为采用 GT4 的一条重要途径是通过 ISV。目前您看到的主要是一些拥有相当多 IT 基础设施的公司(例如金融服务和制药公司)正在部署自己的网格项目,这些部署工作不但完全在本公司内部进行的,而且通常是与 IBM 和 HP 之类的公司合作进行的。对于很多(尤其是小型的)企业来说,通过将网格技术集成在自己的产品中的 ISV 来部署网格可能会更好一些。这一点在 GlobusWORLD 上得到了很好的展示,在 GlobusWORLD 中,SAP 显示了一些应用程序的实验原型,这些原型已经被修改,以便使用 Globus 软件为这些应用程序动态配置资源。我认为我们将从这个例子中看到更多的东西。

GT4 是 Globus 进化的一个延续。其重要之处在于,这是我们第一次觉得可以告诉其他组织 —— 代码质量足以满足企业需求了。

Globus Toolkit 4.0 的新特性


GT4 遵守最新的 Web Services Interoperability Organization(WS-I) Web 服务标准,在不同环境之间提供了最大的互操作性。
GT4 包含对一些重要授权标准的初步支持,其中包括 Security Markup Language(SAML)和 eXtensible Access Control Markup Language(XACML)。
GT4 实现了 WSRF 和 WS-Notification 规范。
GT4 具有复杂的授权和安全功能。Globus 在网格安全性方面一直非常努力,从安全性的观点来看,GT4 已经是“满足企业需求的”了。
GT4 提供了高级的执行和数据管理功能。

作者简介
Travis Van 是硅谷的一位专注于新技术的技术 PR 宣传者。

除了自由撰稿和提供咨询服务之外,Dave Rosenberg 还负责 LinuxWorld 的会议程序。他所梦想的技术是在基于 Linux 的蜂窝电话上运行网格应用程序。

http://www-128.ibm.com/developerworks/cn/grid/gr-gt4/

posted on 2007-07-06 04:39 狼爱上狸 阅读(565) 评论(0)  编辑  收藏 所属分类: Globus


只有注册用户登录后才能发表评论。


网站导航: