From:Click Here
作者 Scott Delap译者 Jason Lai 发布于 2007年3月29日 上午9时28分
IBM Alphaworks网站发布了一个新的Eclipse插件,使用开源Java MapReduce框架Hadoop来简化应用程序的开发。Hadoop框架的产生最初是为了支持Nutch项目。Hadoop包含了一个分布式文件系统以及MapReduce编程结构的一个实现,该实现被Google广泛用于进行跨集群海量数据集的并行处理。今年在Hadoop上所做的集成工作使得在Amazon的EC2平台上运行Hadoop MapReduce应用和使用Amazon的S3平台进行存储等更为容易。Amazon Web服务博客表示:“由于EC2实体和存储于S3上的数据之间的带宽尚未度量或发布,这是处理大量数据的一种很节约成本的方式”。
IBM MapReduce插件包含以下功能:
- 允许Java™项目以JAR(Java Archive)文件形式打包并部署到(本地和远程的)Hadoop服务器上
- 提供辅助开发过程的备忘单(Cheat Sheets)
- 增加了一个独立的Eclipse透视图(Perspective),以及用于显示Hadoop服务器、Hadoop分布式文件系统(DFS)和当前任务状态的视图
- 提供了一些向导,使基于MapReduce框架的类的开发变得更加容易
此外,它还包括了改进的备忘单,并且完全兼容OS X。插件使用SCP和SSH与Hadoop服务器进行交互,通过HTTP协议获取工作状态。