Dedian  
-- 关注搜索引擎的开发
日历
<2006年5月>
30123456
78910111213
14151617181920
21222324252627
28293031123
45678910
统计
  • 随笔 - 82
  • 文章 - 2
  • 评论 - 228
  • 引用 - 0

导航

常用链接

留言簿(8)

随笔分类(45)

随笔档案(82)

文章档案(2)

Java Spaces

搜索

  •  

积分与排名

  • 积分 - 64904
  • 排名 - 816

最新评论

阅读排行榜

评论排行榜

 
由于工作的需要,最近对搜索引擎感兴趣起来,下面有些心得:
 
1。 其实要让自己的Blog的点击率狂涨的办法很简单,就是写一个最简单的webcrawler程序,不断的访问自己的主页(发送http请求),很多计数器的原理就是根据这个来计算的,而不会核实IP地址,不信,只要自己F5刷新一下自己的页面就知道了。照这样下去,点击率超过老徐是肯定没有问题的。不过,新浪本来就玩点击率猫腻的,因为他们可以自己修改计数器,所以和他们玩这个没有意义。
 
2。点击率高并不表示你的页面排名高(PageRank)。PageRank是一个技术含量比较高的词,想当初Google那两个毛头小伙子Larry Page(真的很巧和,那小子的姓居然是Page,真的想不做Page的老大都不行)和 Sergey Brin就是靠在斯坦福期间有关PageRank的研究发家的,如今年纪轻轻就可以和MS叫板。当然,Google的PageRank的算法是商业秘密。不过网上牛人不乏其数,居然有人根据Google的一些搜索行为和利用概率建模等数学知识硬是弄出一套PageRank的解释,在网上大为流行。那篇Paper只要Google一下PageRank Uncovered(by Chris Ridings and Mike Shishigin)就可以找到。据说,还有人利用里面的机制大大戏弄了一把Google的搜索引擎。不过已无法考证,因为Google也在不断完善自己。
 
3。简单来说,PageRank就是一个衡量自己网站或网页的重要性的一个很关键的指标。其概念的核心简单来说就是看有多少网页链接到你的网页,特别是有多少重要的网页链接到你的网页。换句话说,如果老徐的Blog因为其点击率或在全国人民的博客世界的影响力使得其PageRank达到10,即为一非常重要之网页,而你又有幸得到老徐的青睐加为友情链接,即她之重要网页有链接指向了你的网页,则你的PageRank必有所提高。当然,这只是一个非常简单的例子,具体的公式还没那么简单,自己有兴趣可以在网上查到,即便这样,这只是一个因素而已。不过这就不难理解为什么会有那么多的人会在名人的博客上抢沙发甚至故意大放厥词已引起各方注意了。也就不难理解广告做到博客上去了。
 
4.其实,PageRank的idea来源于我们平时的生活中。比如,我想买一个电脑,我希望一个懂电脑的人告诉我买什么电脑。比如我知道小王比较懂,我就会问小王,小王说,恩,dedian牌电脑不错,就买dedian牌电脑吧。我说,好吧,就买它了,可你是怎么知道的呢,哪里有介绍呢,有哪些优点呢?小王说,这。。。,我也不是很清楚,我也是听小李那丫说的,你去问那小子吧。这时,即便我不认识小李,可他在我心目中的形象一下高大了许多,小王都要听他丫的。。。
 
5。所以,要让自己的网页或网站就有影响力,就要千方百计让别人来连接你,来引用你。当然还有一种办法,就是不断的引用别人的文章,这里的引用不是说在你自己的网页里嵌上别人的连接,而是利用别人的网页嵌上自己网页。怎么做,其实就是很多Blog的Trackback的功能,细心可以发现,只要你Trackback别人的Blog,你的Blog地址就留在别人的Blog的网页里(comments一样)。不过,现在大都的blog都开始有设置不允许别人Trackback或comments.新浪好像也开始做了手脚,名人的博客不让引用了好像,不过新浪的博客对很多的搜索引擎都不友好,也就别动他的主意了。倒是MSN space似乎可以,可以写一段代码自动连到各个网页上fetch出每个blog的permalink然后执行一段MSN自己提供的javascript就可以trackback了,不过这只是我最近想到的,还没有写代码实现。如果可以成功的话,很多其他的博客也一样可以成功。这个想法是最近老看到一些乱七八糟的网站出现在我的trackback里想到的。
 
6。不过现在网上提供越来越多的服务会杜绝类似的不友好攻击行为。比如,如果你很讨厌有人在你的博客里乱引用,乱写评论。你可以申请一个类似托管的服务,就是让另一个网站先收集那些留言或评论,再筛选,再放到你的博客上。总之,网络的林子大了,什么鸟都有。
posted on 2006-05-19 16:15 Dedian 阅读(1525) 评论(3)  编辑  收藏
评论:
  • # re: 最近的一些心得 -- 关于搜索引擎  david.turing Posted @ 2006-05-21 17:26
    有没有办法帮我把PageRank提高到5?我努力了很久了  回复  更多评论   

  • # re: 最近的一些心得 -- 关于搜索引擎  Dedian Posted @ 2006-05-22 02:32
    4和5之间确实差距比较大,就连老徐的博克也只是5,现在想通过简单的非正常手段的方法获取PageRank的提高,越来越难了,原因很多网站的Publisher对网页的请求有了对IP地址或其他信息如cookie的监测,另外Google的PageRank的算法也在不断的完善。真的要让自己的网页的PageRank提高,只有提高网页的质量,让更多不同地方,不同组织的人过来看,过来评论,来连接你,订阅你。这一点,需要努力,不过你的PageRank已经是4了,很不错了。  回复  更多评论   

  • # re: 最近的一些心得 -- 关于搜索引擎  tolib Posted @ 2006-12-19 14:11
    欢迎您把您的BLOG连接放到我新做的网络书签网站上去,www.tolib.com,这样将会有更多的网友看到您的BLOG,也可以提高BLOG的浏览量.谢谢.也欢迎您到我的网络书签网站来做客,谢谢啦!
      回复  更多评论   


只有注册用户登录后才能发表评论。


网站导航:
博客园   IT新闻   Chat2DB   C++博客   博问  
 
 
Copyright © Dedian Powered by: 博客园 模板提供:沪江博客