posts - 30,  comments - 3,  trackbacks - 0
<2012年2月>
2930311234
567891011
12131415161718
19202122232425
26272829123
45678910

常用链接

留言簿

随笔档案

搜索

  •  

最新评论

阅读排行榜

评论排行榜

术语:
followee/friend 用户关注的对象(即新浪微博中的“关注”)
follower 关注用户的对象(即微博中的“粉丝”)
collaborative filtering 协同过滤

大致内容:
本文作者及其团队对twitter用户推荐做了深入研究,并制作了一个在线的twitter用户推荐的应用。并以profile推荐和search推荐两种方式呈现给用户。
profile推荐即用户不需要自己输入查询,该应用将根据用户的profile自动生成查询,来查找相关用户。
search推荐即用户自行输入查询,来寻找自己感兴趣的用户。
本文列举了9种生成用户profile的策略:
S1:由用户U本身的tweets
S2:由用户U的followees的tweets产生
S3:由用户U的followers的tweets产生
S4:由S1,S2,S3的并集产生
S5:由用户U的followee ID产生
S6:由用户U的follower ID产生
S7:由S5,S6并集产生
S8:结合S1-S7,得分函数依赖于S1和S6
S9:结果S1-S7,得分函数基于推荐列表中用户位置。

※以上方法中,S1-S4为content based,S5-S7是collaborative filtering。

然后用lucene对这9种策略分别建立索引,进行实验。其中,基于内容的策略中,采用tf-idf权值。

评价指标:
1、①Precision:即推荐列表与已有followee重复的百分比,S5-S7(Collaborative filtering)好于S1-S4(content based),S3高于S2,Precision随Recommendation List Size增大而降低
    ②Position:相关用户的位置因素亦很重要,在此,基于内容方法略好于协同过滤。

2、以上两个指标均为脱机(offline)评价指标,实际上即便是followee中没有存在的那些出现在Recommendation List中的用户,也并非不相关,有很多为potential followees。因此,本文还做了一个live-user trial,选取了34位参与者参加实验,结果30个推荐列表中,平均采取6.9人,且位置主要集中在推荐列表的top10。另外,search中(31名参与)结果并不如profile,平均4.9人采纳。作者分析了这个原因,在于search中用户所提供信息远小于profile中的信息,因此效果不如profile推荐。

论文:
John Hannon, Mike Bennett, Barry Smyth:Recommending Twitter Users to Follow Using Content and Collaborative Filtering Approaches. Proceedings of the fourth ACM conference on Recommender systems, Sep. 2010
论文链接:
2010_RECSYS_RecommendingTwitterUsers.pdf
posted on 2012-02-18 11:28 Seraphi 阅读(673) 评论(0)  编辑  收藏

只有注册用户登录后才能发表评论。


网站导航: