Posted on 2008-05-08 13:07
qiyadeng 阅读(1163)
评论(0) 编辑 收藏
在刚刚结束的的WWW2008的会议中,有篇超短的paper 《Size Matters: Word Count as a Measure of Quality on Wikipedia》,这篇文章针对Wikipedia的质量的评估,提出了一种方法来评估一个Wikipedia文章的质量,这种方法很简单,就是数文章字数(Word Count)。
作者认为这种方法的好处有如下几点:
1.文章的长度很容易测量;
2.许多其他的方法需要一些其他的信息,而这些信息不是很容易得到;
3.许多其他的方式对用户来说不容易理解;
4.文章的长度评估的方法比其他的复杂的方法更有意义。
(说的好像是一点简单^_^)这确实是一种简单的方法,但是效率怎么样?根据作者的实验,这个方法在二个分类(featured and random)的情况下能得到96.3%的准确率。
当然,作者也比较实事求是,也不会夸大这种方法的作用,作者将寻找新的方法来评估Wikipedia文章质量。
除了这篇文章,其实还有其他几种方法,可以参看下面这些论文:
1.Information Quality Discussion in Wikipedia
2.Assessing Information Quality of a Community-Base Encyclopedia
3.Measuring Wikipedia
4.Wikipedia Article Quality Assessment and Ranking Tips for Users and Search Engine Engineers
这些文章虽然都是关于wiki质量讨论的,但是研究的意义很重大。特别是针对目前网络的信息泛滥的情况下,需要用一种方式来评估信息的有用性,这样可以让我们更轻松找到我们需要的有用信息,同样搜索引擎如果能判断提供给我们的文章的质量好坏,这也就免去了我们很多时间去挑选了。
对于推荐系统(如新闻、文章推荐系统),用户很少评分的情况下,可以采用这种方法自动给项目评分。