<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet type='text/xsl' href='http://scenery9.spaces.live.com/mmm2008-07-24_12.50/rsspretty.aspx?rssquery=en-US;http%3a%2f%2fscenery9.spaces.live.com%2fcategory%2fRecommendation%2ffeed.rss' version='1.0'?><rss version="2.0" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:msn="http://schemas.microsoft.com/msn/spaces/2005/rss" xmlns:live="http://schemas.microsoft.com/live/spaces/2006/rss" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" xmlns:wfw="http://wellformedweb.org/CommentAPI/"><channel><title>风之谷: Recommendation</title><description /><link>http://scenery9.spaces.live.com/?_c11_BlogPart_BlogPart=blogview&amp;_c=BlogPart&amp;partqs=catRecommendation</link><language>en-US</language><pubDate>Thu, 28 Aug 2008 04:04:48 GMT</pubDate><lastBuildDate>Thu, 28 Aug 2008 04:04:48 GMT</lastBuildDate><generator>Microsoft Spaces v1.1</generator><docs>http://www.rssboard.org/rss-specification</docs><ttl>60</ttl><cf:parentRSS>http://scenery9.spaces.live.com/blog/feed.rss</cf:parentRSS><live:type>blogcategory</live:type><live:identity><live:id>-6558363559019881103</live:id><live:alias>scenery9</live:alias></live:identity><cf:listinfo><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="typelabel" label="Type" /><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="tag" label="Tag" /><cf:group element="category" label="Category" /><cf:sort element="pubDate" label="Date" data-type="date" default="true" /><cf:sort element="title" label="Title" data-type="string" /><cf:sort ns="http://purl.org/rss/1.0/modules/slash/" element="comments" label="Comments" data-type="number" /></cf:listinfo><item><title>Digg推荐系统</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1479.entry</link><description>&lt;font style="color:rgb(99, 36, 35)" size=3&gt;让Digger们期待了数月的&lt;a target="_blank" href="http://www.digg.com"&gt;Digg&lt;/a&gt;推荐系统终于揭开了她神秘的面纱。从采用的算法来看，多少有些让人失望。就是传统的CF算法：根据当前用户Digg过的网页集合，找到Digg过这个集合里面的网页的其他用户，再根据他们Digg过的其他网页的次数来推荐这些网页。这种CF算法对Digg过很多网页的老Digger会挺有效的。对我这样很少Digg网页的人，结果就很一般了。相信Digg在过去的数月中尝试过很多算法，可能也考虑过网页内容分析的方法，但最终还是选择了简单常用的CF。对推荐算法来说，对推荐内容本身理解的越深入，推荐才会越准确。理解了音乐的Pandora胜过“不懂”音乐的Last.fm就是一个最好的例子。&lt;/font&gt;
				&lt;span style="display:none"&gt; &lt;/span&gt;&lt;span style="display:none"&gt; &lt;/span&gt;&lt;br&gt;&lt;a href="http://www.vimeo.com/1233352?pg=embed&amp;amp;sec=1233352"&gt;Digg Recommendation Engine&lt;/a&gt; from &lt;a href="http://www.vimeo.com/user344320?pg=embed&amp;amp;sec=1233352"&gt;Kevin Rose&lt;/a&gt; on &lt;a href="http://vimeo.com?pg=embed&amp;amp;sec=1233352"&gt;Vimeo&lt;/a&gt;.&lt;br&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+Digg%e6%8e%a8%e8%8d%90%e7%b3%bb%e7%bb%9f&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1479.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1479.entry</guid><pubDate>Fri, 04 Jul 2008 04:03:23 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!1479/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1479.entry#comment</wfw:comment><dcterms:modified>2008-07-04T04:26:42Z</dcterms:modified></item><item><title>DiggFilter vs. DiggSuggest</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1424.entry</link><description>&lt;div&gt;
&lt;p&gt;&lt;font color="#632423" size=3&gt;RWW的&lt;span&gt;&lt;a href="http://www.readwriteweb.com/archives/diggfilter_vs_diggsuggest.php" rel=nofollow&gt;&lt;u&gt;一篇文章&lt;sup&gt;&lt;img height=7 alt="" src="http://scenery9.spaces.live.com/confluence/images/icons/linkext7.gif" width=7 align=absMiddle border=0&gt;&lt;/sup&gt;&lt;/u&gt;&lt;/a&gt;&lt;/span&gt;对比了针对Digg平台的第三方推荐应用&lt;span&gt;&lt;a href="http://www.diggfilter.com/" rel=nofollow&gt;&lt;u&gt;DiggFilter&lt;sup&gt;&lt;img height=7 alt="" src="http://scenery9.spaces.live.com/confluence/images/icons/linkext7.gif" width=7 align=absMiddle border=0&gt;&lt;/sup&gt;&lt;/u&gt;&lt;/a&gt;&lt;/span&gt;和&lt;span&gt;&lt;a href="http://diggsuggest.smashsworld.com/" rel=nofollow&gt;&lt;u&gt;DiggSuggest&lt;sup&gt;&lt;img height=7 alt="" src="http://scenery9.spaces.live.com/confluence/images/icons/linkext7.gif" width=7 align=absMiddle border=0&gt;&lt;/sup&gt;&lt;/u&gt;&lt;/a&gt;&lt;/span&gt;。&lt;/font&gt;
&lt;p&gt;&lt;font color="#632423" size=3&gt;Digg因其以一种简单优雅的方式整合了大量网民的群体阅读智慧而大获成功。但Digg的模式也有其潜在的问题。一个问题是Digg行为本身的信息量太少。一个人Digg一篇文章其实是因为它的某方面对自己有意义，而这个方面是无法体现在Digg这个简单的行为中的。另一方面，Digg无法发现长尾的信息，因为对这些内容关注的人群的基数决定了它们不太可能会到Digg的主页上去。更重要的是，用户会陷入到大量和自己兴趣不是很一致的人所关注的信息海洋中而迷失方向。我曾经尝试过用Digg，后来还是放弃了，重新回到了RSS订制的模式。为了解决上述的问题，Digg需要更细致的理解自己的内容和用户，提供更为个性化的服务（Friends功能在某种程度上做了些个性化，但我认为还是不够。因为每个人的兴趣都是多面的，朋友只是少数几个方面的同好而已，他（她）其他方面的兴趣会起到干扰的作用）。因此，Digg很早就开始筹划自己的推荐系统了。Digg做推荐是有比较好的基础的。推荐所需要的几个关键因素它都具备。比如，长期积累的大量用户数据（Dugg的文章），用户的好友信息等等。但和Amazon的推荐系统不同（Amazon需要推荐的内容大部分是旧的），Digg面临的一个挑战是他要推荐的内容大部分是新的。这就导致基于协同过滤的方法不会很有效。因此Digg如果想做比较好的推荐，就需要对推荐的文章内容做细致的理解。这可能也是Digg的推荐系统迟迟没有推出的原因吧。&lt;/font&gt;
&lt;p&gt;&lt;font color="#632423" size=3&gt;说回DiggFilter和DiggSuggest，这两个系统还是各有特色的。DiggFilter倾向于推荐一些和用户Dugg过的内容很相似同时还比较主流的内容。这样的推荐结果虽然看起来比较漂亮，但并不是很实用。正如文章作者所言，它推荐的内容很容易找到（比如，有大量RWW的内容（甚至是作者自己写过的文章））。我想这说明了site这个属性在推荐系统中还是很重要的。我们应该尽量推荐用户没有看过的site的内容。因为对于他经常会看的site，其实是不怎么需要推荐的。与DiggFilter推荐主流内容不同，DiggSuggest倾向于推荐长尾（Digg数&amp;lt;10）的内容。DiggSuggest还在推荐的时候考虑了时间因素。比如，作者之前喜欢Digg政治类的东西，最近喜欢Digg技术类的东西，它就会在主要推荐技术类东西的同时，适量的推荐一些政治类的。这种学习用户长期兴趣的行为值得表扬&lt;img height=20 alt="" src="http://scenery9.spaces.live.com/confluence/images/icons/emoticons/smile.gif" width=20 align=absMiddle border=0&gt;。作为总结，作者认为DiggSuggest要比DiggFilter更有效些，因为它能够推荐一些用户不太可能看到，但又会感兴趣的内容。&lt;/font&gt;
&lt;p&gt;&lt;font color="#632423"&gt;&lt;font size=3&gt;让我们拭目以待Digg自己的推荐系统吧！&lt;/font&gt;&lt;br clear=all&gt;&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+DiggFilter+vs.+DiggSuggest&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1424.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1424.entry</guid><pubDate>Fri, 28 Mar 2008 04:40:02 GMT</pubDate><slash:comments>3</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!1424/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!1424.entry#comment</wfw:comment><dcterms:modified>2008-03-28T04:40:02Z</dcterms:modified></item></channel></rss>