amp@java

  BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  99 随笔 :: 0 文章 :: 228 评论 :: 0 Trackbacks
前段时间听了一家公司介绍分布式存储产品,号称性能超过传统的磁盘阵列+小型机,但价格却比这种组合低,而且具有维护简单、数据安全等优点,其核心就是把一些PC服务器通过网络连接起来,把数据分散存储在这些服务器上,查找的时候把任务分配到这些服务器上,让它们分别完成各自的小任务,最后再汇合出结果,核心就是:每个节点都是一个数据存储单元和运算单元的结合,这些节点性能要求不高,可以是各种各样的配置,只要在上面运行集群要求的软件即可,一台挂了不要紧,换上去一台就能自动恢复,增加一台就能提高性能,减少一台也不会有很大影响,只是性能稍微下降,每份数据都有多个备份,能够平衡分布在各服务器上。这种架构的缺点是,只要用上了这套东西,所有的软件就必须从这家公司购买,因为整个集群的控制和访问接口都是他们提供的。
该公司也坦言这其实就是google的服务器应用技术,实际上就是google提出来的云计算。

今天看了一些文章介绍,发现上面介绍的东西实际上已经通过Apache的一个项目Hadoop实现,不知道那家公司是不是就是简单包装了一下这个项目。

Hadoop包含两个主要的模块,分别是HDFS分布式文件系统和MapReduce集群计算机制。刚刚发布了1.0.0版本。

主页: http://hadoop.apache.org/

blogjava有位高手已经翻译了HDFS的架构说明:http://www.blogjava.net/killme2008/archive/2008/06/05/206043.html,但对应的是上一个版本0.20的,里面说到了很多没有实现的东西,不知道是否已经在1.0版本实现,目前官方网站上该文章的版本还是0.20的。

这里有三篇文章介绍Hadoop在单机环境、多机环境下的安装和配置,还有应用程序的开发:http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/index.html

看起来还是挺有意思的,以前就曾经有过想法,把单位淘汰下来的那一大堆台式电脑组成一个存储或者计算的小集群,也许能够代替一两台PC服务器,现在看来可以试试,以后的趋势就是云计算了,先自己搞点小云看看效果如何。
posted on 2012-01-19 14:47 amp@java 阅读(223) 评论(0)  编辑  收藏

只有注册用户登录后才能发表评论。


网站导航: