Resys China all about recommender systems

Resys Group 第四次活动总结 (by xlvector)

03.28.2010 · Posted in resysevent

昨天邀请到了IBM CRL的3位研究人员给resys group的成员们介绍了他们在推荐系统方面的一些研究成果,首先要感谢Intel社区给我们提供了场地。 因为我最近半年在IBM CRL实习,和 3为researcher在一个组,所以对他们的工作比较了解,所以在这里总结一 下我的一些看法。 第一个演讲的是赵石顽,他的演讲内容是 Pharos: Soical map based visual recommender for content-centric website。Pharos是他们去年做的一个项目,这个项目的主要内容是基于挖掘IBM Blog中的用户数据,给用户提供一个全新的浏览web2.0的方式。我们知道,很多web2.0网站都有他们独特的UI,比如delicous, digg,他们的UI设计都比较独到。不过他们的设计大都还是基于传统的网页设计,就是首先有分类,然后分类里面有分类,这样的层次结构。这种结构的缺点 就是不利于用户通过浏览的方式来找到自己感兴趣的东西。所以Pharos是希望提供一种新的浏览方式。他的主要手段,是通过数据挖掘,将用户,博主,关键 字以tag cloud的形式展现出来。当用户进入系统的时候,在首页上就可以看到很多聚类,每个聚类里用不同的颜色来区分了这个聚类的关键词,和主要用户。tag cloud的优点是可以在有限的空间里展示非常大量的信息。 Pharos里面用到的聚类方法主要是基于LDA的,他们用LDA将不同种类的entity(user, keyword, article)来聚类,而每个类里面通过pagerank来确定entity的权重。 第二个演讲的是袁泉,他主要是介绍了graph model。因为我在IBM的前一段时间就是研究Graph Model融合temporal信息的,所以对他的工作比较了解。Graph Model是一个历史非常悠久的模型,他的特点是万金油,什么东西都可以往上面放。不过他的缺点是很难确定不同种类数据的权重,以及边的转移概率。 graph上目前比较常用的都是基于随机游走的ranking算法,这类算法速度非常快。但是,有很多精度高的代数算法,却速度相对比较慢,比如对图的 Laplacian矩阵的分析,就需要借助SVD等等手段,当图的规模大了之后,效率还是有一定的问题。 另外,构图也是一个见仁见智的问题,一般来说构图比较简单,只需要将有关系的东西连在一起就行了,不过边的权重很难确定。另外图的算法大都是非 learning的算法,我个人一直希望提出一种有目标函数的情况下,自己学习边的权重的算法。 最后一个演讲的是张夏天,他主要介绍了对 tag推荐的研究。tag最近是推荐研究的一个热门。他有两个问题,一个是推荐tag,一个是利用tag改 善对item的推荐。不过我对这个方面研究的不是很多。在netflix prize中,我们用过一些类似tag的文本信息,比如电影的演员,导演作为tag。当时起的作用不是很大,这也许和电影的diversity不够大有关 系。不过tag起作用的,个人感觉还是在top-N推荐上,它对rating prediction的影响有限。 tag分布随时间的演化也许是一个值得研究的方面,夏天介绍了前人的tag对后人的影响,可以发现后人打tag非常依赖于前人的tag,所以tag的冷启 动也许是个问题(似乎这个只能通过自然语言理解,来提供了) 总之,非常感激三位的精彩演讲,这一次的演讲比较学术一点,公式稍微多了一点,不过大家如果仔细消化,还是可以获得不少的收获。 ...

KDD Cup2010:教育方面的数据挖掘竞赛

03.25.2010 · Posted in resysmag

KDD Cup由SIGKDD(ACM Special Interest Group on Knowledge Discovery and Data Mining)组织。每年一次的KDD Cup,和SIGKDD国际会议同期举行。同时面向学术界和产业界。 今年KDD Cup的主要内容是通过智能辅导教学系统和学生交互的日志预测学生数学题的成绩。这次的任务是一次有趣的科技挑战,兼具实践重要性和科学趣味性。 ...

Resys 第四次线下活动 – IBM CRL 专场

03.25.2010 · Posted in resysevent

本次活动,非常荣幸地邀请到了 IBM China Research Lab – User Mining & Personalized Recommendation Team 的三位朋友,前来分享他们的研究心得! 活动时间:2010年3月27日 周六 14:00 活动地点:北京市海淀区中关村科学院南路2号融科资讯中心A座8层英特尔公司 共三个主题,各个精彩! 1. Pharos: Soical map based visual recommender for content-centric website 基于社区地图的可视化推荐 — 赵石顽 [slideshare id=3645395&doc=pharos-socialmapbasedrecommendationforcontent-centricsocialwebsites-100406002518-phpapp01] 2. Soical Recommender System 社会化推荐 — 袁泉 [slideshare id=3645396&doc=socialrecommendation-100406002525-phpapp02] 3. Tag-based Recommender System 基于tag的推荐 — 张夏天 [slideshare id=3645394&doc=tagandtag-basedrecommender-100406002520-phpapp02] 活动总结: Resys Group 第四次活动总结 (by xlvector) IBM CRL at Resys Group,活动总结 Update: 相关录音稍后配上,敬请期待。 ...

推荐系统五大问题

03.18.2010 · Posted in resysmag

本文翻译于互联网观察媒体“读写网”在2009年初发布的一篇文章。读写网在2009年初的时候编辑了一系列针对推荐系统的文章,在荷兰阿姆斯特丹举办的一次专门针对推荐系统的兴趣小组会议上,一些公司提出了实施和建设推荐系统需要面对的几个问题,本文针对这些问题,进行了初步的分析。在此与大家分享 ...

Early Amazon: The first week

03.10.2010 · Posted in Uncategorized

原文链接:http://glinden.blogspot.com/2006/01/early-amazon-first-week.html Greg Linden 毕业于华盛顿大学计算机学院,1997 年加入 Amazon,领导开发了享誉业界的 Amazon 推荐引擎。 著名的 Item-based 推荐算法的提出者之一;Findory.com 创始人。 其 Blog – Geeking with Greg 是个性化推荐领域最有影响力的博客(没有之一)。 1997 年初的亚马逊公司,邋遢、混沌、但令人兴奋。 亚马逊公司位于美国西雅图市,办公室在第二大道的哥伦比亚大厦里,这是一座砖体结构的建筑物,已经有些年头了,离派克市场不远。从办公室的窗户望出去感觉 还不错,有一个本地的美沙酮诊所,还有一个贩卖怪诞假发的商店。你甚至隐约可以看见一些脱衣舞俱乐部,它们就藏在几个街区远的地方。插播八卦:派克市场有一个著名的 Athenian 餐厅,传世经典爱情影片《西雅图夜未眠》中,汤大哥就是在这里泡梅甜心的。 当然了,我现在还只是一个眨巴着大眼睛的刚刚研究生毕业的菜鸟,还不敢奢望有这样一个靠窗的工位。 我的工位在厨房。在亚马逊公司,空间从来都是一种奢侈,那个时候自然也是这样。报到的那天,我被领到我的办公室——一张安装在厨房角落里的牌桌,上面放着一台 PC。 在厨房办公还是着实有些乐趣的。在亚马逊,我几乎什么人都不认识,大多数同事都沉浸在无聊的窃窃私语之中。不过,他们倒经常会到离我不远的柜台上去取茶和咖啡。我弄了一个糖果瓶——嗯,免费的——尽力和他们搞关系,以求套出些什么来。 我的第一项任务是开始学习代码库。打开一个 shell 窗口,调出 emacs,然后开始阅读代码。我花了一些天来跟踪针对不同 URL 的分发器,研究 ol’ obidos ——一个用来支持 Amazon 网站运转的大型 CGI 程序——是怎样漂亮地处理不同的请求,主页,书籍详情页,搜索,购物车,以及订单流转。至今,大多数亚马逊 URL 里面还包含着“/exec/obidos”。插播八卦:不用为不知道 Obidos 为何物而犯囧,哥只是个传说。这里是正解。 更多精彩文章,请看 Resys China 创刊号。 ...

Resys China 创刊号

03.07.2010 · Posted in resysmag

《Resys China》,是依托于 Resys Group 并专注于推荐系统领域的一份电子杂志。 下面是创刊号的内容目录。 业界新闻 学术动态 Workshop on Social Recommender Systems Collaborative Filtering Over Time 精品推荐 YouTube’s Quest to Suggest More Recommendation Systems: Increasing Profit by Long Tail 推荐系统五大问题 系列连载 Greg Linden,Early Amazon:The First Week 精彩应用 开源推荐框架 DUINE 概览 Resys 精华帖 大家觉得推荐系统和长尾的关系是什么 基于 SNS/Lifestream 的推荐 轻松一下 感谢 yoyo、gary wang及阿稳同学在内容编辑方面的大力协助,感谢百分点科技在 pdf 文件制作方面的鼎力支持。 现在网络阅读越来越倾向于浅阅读,希望这份人工精编的内容能够给大家带来一些思考和收获。 [slideshare id=3358040&doc=resys-100307110414-phpapp02&type=d&w=480] PDF 可以从这里下载:Resys China 创刊号 ...