不经意看到了程序员的一期算法专题,细细研读多位高手(包括李开复)的文字之后,对算法的重要性重新进行了反思。我研究生毕业
2
年,一直从事
J2EE
开发,由于项目的原因,很少需要自己去设计算法,甚至
stack
,
tree
这些数据结构都很少使用。还好自己也不甘于平淡,如
Effective Java
,
Practical Java
,
Refactory
,
Design Pattern
等等这些流行书还是抽空学习,这些书的确很是经典,对我的编码风格,模式的理解,设计能力都起到了很好的促进。也快速的由一个程序员成长为架构师(只是公司的,离真正的架构师还差得远)。
因为项目需要,去年下半年开始全面接触开源软件,使用了
spring
,
maven
,
hibernate
,
ibatis
等众多开源软件,也对开源软件产生了浓厚的兴趣,于是拿这些开源软件做了
openfans
,一方面是推进开源软件在中国的使用的交流,一方面也为自己在实践中更多使用这些软件(因为没有项目和利益因素,可以做想做的事,用想用的软件)。使用这些开源软件倒很是顺利,很多软件拿来就能用,都有
sample
,简单使用还是不难的。
但一些关键的问题一直悬而未决!比如
tag
的设计:我现在简单的使用平铺的模型,
tag
没有层次之分,
tag
间产生双向关联。但这样是最符合
tag
特性的模型吗?如何对这些
tag
进行分类,如何定义
tag
的多级关联(如
spring
和
hibernate
有关联,
hibernate
又与持久层关联,
spring
是否与持久层有间接关联,依次类推)。。。。。。而做出一个好的
tag
模型,可能就需要图论方面的知识。再比如用户相似度设计(号称是豆瓣的核心,难以复制):每个用户拥有了一些
tag
,如何根据这些
tag
定义用户的相似度,一个用户有
spring
,
hibernate
这
2
个
tag
,一个用户有
spring
,
ibatis
这
2
个
tag
,他们相似度为多少,如果每个人
tag
都很多,再加上权重的概念,问题又复杂的多。简单的做法就是每个用户
tag
一个个匹配,匹配的越多相似度越大,但这样设计一是不准确,二是时间复杂度很大,最坏情况为
n*n*m*m
,
n
为用户数,
m
为每个用户的
tag
数。
这些都需要扎实的算法基础。而我的基础就很薄弱:本科学的比文科还文科的专业,研究生又学的比较上层的东西(
UML
,
RUP
,
PM
等,也都一知半解),选修了一门算法导论,又被
1000
多页的经典英文教材吓趴下了,上了几次课就直接放弃,没敢参加最后考试。现在想临时抱佛脚,谈何容易。
所以算法也并非没有用处,关键要看你在做什么,想做什么。想去
google
、百度不用会
spring
,算法基础扎实,只会
c
语言都行;一些行业如电信、金融也很是需要算法高手。而国内更多的企业做企业应用,一般是连连数据库,写写页面,最多引入些开源框架和软件,如
spring
,
hibernate
,
struts
等。这方面的需求较大,会了
spring
,省了公司的培训成本,自然还是给找工作加了一些砝码。
所以有时听到某些人对某项技术不以为然,说“这些东西有什么是我在几个星期学不会的”的时候,一方面是对其狂妄进行些鄙视,一方面也真要问问自己,我的核心价值到底在哪。这个问题很重要,涉及面很广,选择也很多,而我也只是有些模糊的答案,等以后再仔细写写。
不管如何,我是要开始研究算法了,得解决问题阿!先在
openfans
开个算法的
tag
,一边学一边积累,对算法有兴趣的同学也可以跟我一块进步。
PS
:做个广告,
blogjava
很多好的
bloger
,能否到
www.openfans.net
导入下
blog
,跟大家分享下你的感悟,谢谢!