<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet type='text/xsl' href='http://scenery9.spaces.live.com/mmm2008-07-24_12.50/rsspretty.aspx?rssquery=en-US;http%3a%2f%2fscenery9.spaces.live.com%2fcategory%2fWeb%2bScience%2ffeed.rss' version='1.0'?><rss version="2.0" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:msn="http://schemas.microsoft.com/msn/spaces/2005/rss" xmlns:live="http://schemas.microsoft.com/live/spaces/2006/rss" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" xmlns:wfw="http://wellformedweb.org/CommentAPI/"><channel><title>风之谷: Web Science</title><description /><link>http://scenery9.spaces.live.com/?_c11_BlogPart_BlogPart=blogview&amp;_c=BlogPart&amp;partqs=catWeb%2bScience</link><language>en-US</language><pubDate>Thu, 28 Aug 2008 04:04:48 GMT</pubDate><lastBuildDate>Thu, 28 Aug 2008 04:04:48 GMT</lastBuildDate><generator>Microsoft Spaces v1.1</generator><docs>http://www.rssboard.org/rss-specification</docs><ttl>60</ttl><cf:parentRSS>http://scenery9.spaces.live.com/blog/feed.rss</cf:parentRSS><live:type>blogcategory</live:type><live:identity><live:id>-6558363559019881103</live:id><live:alias>scenery9</live:alias></live:identity><cf:listinfo><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="typelabel" label="Type" /><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="tag" label="Tag" /><cf:group element="category" label="Category" /><cf:sort element="pubDate" label="Date" data-type="date" default="true" /><cf:sort element="title" label="Title" data-type="string" /><cf:sort ns="http://purl.org/rss/1.0/modules/slash/" element="comments" label="Comments" data-type="number" /></cf:listinfo><item><title>WebScience</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!956.entry</link><description>&lt;div&gt;&lt;font color="#800080" size=2&gt;The inventor of WWW Tim Berners Lee has co-founded this Web Site to publish and share the most important things at &lt;/font&gt;&lt;a href="http://www.webscience.org/"&gt;&lt;font color="#800080" size=2&gt;http://www.webscience.org/&lt;/font&gt;&lt;/a&gt;&lt;font color="#800080" size=2&gt;.  &lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;顺便抱怨一下，刚刚在读上面的相关的东西的时候，一段话读了5遍没读懂。原因不是写的不清楚，也不是我的理解力差，是被STC的Happy Hour闹腾的。烦死我了。他们还算有自知之明是关着门打牌。要是开着门，我就只能打车回家work at home了。我知道大家每天工作都很辛苦，需要发泄和放松自己。但是这个得分场合和时间。在其他人工作的时间和工作的地点附近闹腾总不太好吧。至少是让我觉得他们的Happy建立在了我的Pain之上，呵呵。&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+WebScience&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!956.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!956.entry</guid><pubDate>Fri, 22 Dec 2006 08:27:19 GMT</pubDate><slash:comments>1</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!956/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!956.entry#comment</wfw:comment><dcterms:modified>2006-12-24T02:56:03Z</dcterms:modified></item><item><title>Science Papers</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!946.entry</link><description>&lt;div&gt;&lt;font color="#800080" size=2&gt;I decided to submit two paper to the Science Journal.  One is about the two basic issues of Web search: relevance and quality assessment.  The other is about the post processing of Web search: search result clustering and query suggestion.  I've only seen few Science papers before.  If anyone who has studied Science papers before, please give me some advice on the style of the papers.  Thanks:-).&lt;/font&gt;&lt;/div&gt;
&lt;div&gt; &lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+Science+Papers&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!946.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!946.entry</guid><pubDate>Wed, 20 Dec 2006 02:24:23 GMT</pubDate><slash:comments>8</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!946/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!946.entry#comment</wfw:comment><dcterms:modified>2006-12-24T02:56:56Z</dcterms:modified></item><item><title>Web 3.0 (Cont.)</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!848.entry</link><description>&lt;div&gt;&lt;font color="#800080" size=2&gt;在和王烁一起准备这次offsite的slides的时候。王烁想到要借用林肯的那三句明言来说明User的重要性。我把他引申了一下，作为对Web发展的一个高度概括。林肯的原话是&amp;quot;Of the people, by the people and for the people&amp;quot;。翻译过来是“民有，民治，民享”。针对Web改编一下就是：&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;Of the user: Web 1.0 (大家写网页构建Web)&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;By the user: Web 2.0 (重视用户的参与，利用用户去改善Web)&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;For the user: Web 3.0 (利用已有的体系结构和用户产生的内容来更好的为用户服务）&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;&lt;/font&gt; &lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;真理是能通用的，呵呵。&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+Web+3.0+(Cont.)&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!848.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!848.entry</guid><pubDate>Fri, 24 Nov 2006 15:54:56 GMT</pubDate><slash:comments>2</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!848/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!848.entry#comment</wfw:comment><dcterms:modified>2006-12-24T14:48:46Z</dcterms:modified></item><item><title>Web 3.0</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!825.entry</link><description>&lt;div&gt;&lt;font color="#800080" size=2&gt;Web 1.0阶段积累了原始数据并构建了基本的infrastructure来处理数据（Search）。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;Web 2.0把Web做为了交流的平台，突出了人的作用。产生了大量有价值的数据。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;Web 3.0的核心应该是智能。利用Web 1.0的工具（Search），和Web 2.0的数据（User Created Content）来实现真正的智能。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;其实几点儿0，一点儿都不重要。作为1.0的代表，Google的AdSense其实体现了很多Web 2.0里面的核心观点（比如Service Everywhere）。关键是如何让Web满足人们更多的需求帮助人们解决更多的问题。我的一个感觉是有了前面10几年的探索和积累，智能Web的时代已经离我们不远了。谁能够真正领悟其中的真谛，把握住这个千载难逢的机会，谁就是下一个MS和Google。&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+Web+3.0&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!825.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!825.entry</guid><pubDate>Thu, 16 Nov 2006 05:31:01 GMT</pubDate><slash:comments>5</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!825/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!825.entry#comment</wfw:comment><dcterms:modified>2006-12-24T14:52:11Z</dcterms:modified></item><item><title>什么是智能？</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!816.entry</link><description>&lt;div&gt;&lt;font color="#800080" size=2&gt;最近一段时间在文本和图像理解方面有了一些新的认识。总结了一下，进而对机器智能这个经典又神奇的问题也有了一些自己的看法。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;有人说智能就是分类能力。我很认同这种观点。比如，一些低等动物只能区别动和不动两种情况。从这个角度来看，狗要比猫有智能。狗能知道自己的名字，很多猫都不知道自己的名字（我之前养的小伍就不知道&lt;img src="http://scenery9.spaces.live.com/mmm2006-10-27_23.09/rte/emoticons/smile_sad.gif"&gt;）。人类的智能也可以用分类能力来衡量。一个人成不成熟的一个标准就是有没有认识到其他人看世界和自己是不一样的。记得本科的时候，大家经常因为某种个人观点的问题争得面红耳赤。力争说服对方。现在想来还是挺可爱得，呵呵。认识到每个人都是独特的，都有自己的世界观对一个人来说是一个认识上的飞跃。另外，在做决策的时候，其实也是一种分类。首先分成很多决策，然后分成好的决策和坏的决策。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;既然智能是分类能力。那么如何提高分类正确率就是变“聪明”的最佳途径。我认为分类有三个重要的步骤。第一是记忆。用机器学习的语言来说就是训练数据。第二是分析。用机器学习的话来说就是特征提取。第三是总结。用机器学习的话说是统计。如果只有记忆能力，那就是“雨人”。如果只有分析能力，那就是“&lt;/font&gt;&lt;a href="http://www.imdb.com/title/tt0209144/"&gt;&lt;font color="#ff0000" size=2&gt;记忆碎片（Memento）&lt;/font&gt;&lt;/a&gt;&lt;font color="#800080" size=2&gt;”里面的那个可怜的家伙（他只有10分钟的记忆，被人玩得很惨）。更惨的是如果只有总结能力，那就是通常大家认为的“笨蛋”了。因为他会不停的犯同样的错误，呵呵。可见三个步骤都是十分必要的。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;举两个我认为真正有智能的机器的例子吧。一个是许峰雄的深蓝。据他说没有用什么machine learning里面的东西（比如神经网络，专家系统）。就是存了大量的棋谱。然后有一个很好的infrastructure和硬件系统来支持快速查找等操作。另一个例子我觉得是search engine (Google)。search engine的能力我想没有人会怀疑吧。他能够根据很少几个查询短语，判断你的查询意图，并返回相应的结果。search engine的基础包括大量的网页（数据），比较有效的特征和强大的infrastructure（用来总结）。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;机器学习领域近年来最有代表性的工作是支持向量机（SVM）。虽然SVM的一个最大的优势是能够在小规模样本上做学习。但是他还是基于独立同分布假设(IID)和大数定理的。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;当然特征提取也是很关键的，只有对数据有了比较深入的理解，才能得到很好的结果。这好比同样经历一些事情的人，从中学到的东西是不一样的。聪明人不会犯同样的错误。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;从上述观点来看，做Web search &amp;amp; mining的人才是真正在做Machine learning的人。因为他们在三个阶段都有能力（至少是潜力）。&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;&lt;font color="#800080" size=2&gt;&lt;/font&gt; &lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+%e4%bb%80%e4%b9%88%e6%98%af%e6%99%ba%e8%83%bd%ef%bc%9f&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!816.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!816.entry</guid><pubDate>Wed, 15 Nov 2006 05:48:36 GMT</pubDate><slash:comments>9</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!816/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!816.entry#comment</wfw:comment><dcterms:modified>2006-12-24T14:53:26Z</dcterms:modified></item><item><title>Web 2.0</title><link>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!227.entry</link><description>&lt;div&gt;&lt;font size=3&gt;&lt;font color="#800080"&gt;最近看了&lt;strong&gt;提姆·奥莱理（Tim O'Reilly）&lt;/strong&gt;写的关于Web 2.0的介绍，写的颇有见地。摘录一些观点如下&lt;strong&gt;：&lt;/strong&gt;&lt;/font&gt;&lt;/font&gt;&lt;/div&gt;
&lt;div&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　1. 长尾&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　小型网站构成了互联网内容的大部分内容；细分市场构成了互联网的大部分可能的应用程序。所以，利用客户的自服务和算法上的数据管理来延伸到整个互联网，到达边缘而不仅仅是中心，到达长尾而不仅仅是头部。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　2. 数据是下一个Intel Inside&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　应用程序越来越多地由数据驱动。因此：为获得竞争优势，应设法拥有一个独特的，难于再造的数据资源。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　3. 用户增添价值&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　对互联网程序来说，竞争优势的关键在于，用户多大程度上会在你提供的数据中，添加他们自己的数据。因而，不要将你的“参与的体系”局限于软件开发。要让你的用户们隐式和显式地为你的程序增添价值。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　4. 默认的网络效应&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　只有很小一部分用户会不嫌麻烦地为你的程序增添价值。因此：要将默认设置得使聚合用户的数据，成为用户使用程序的副产品。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　5. 一些权力保留&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　知识产权保护限制了重用也阻碍了实验。因而，在好处来自于集体智慧而不是私有约束的时候，应确认采用的门槛要低。遵循现存准则，并以尽可能少的限制来授权。设计程序使之具备可编程性和可混合性。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　6. 永远的测试版&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　当设备和程序连接到互联网时，程序已经不是软件作品了，它们是正在展开的服务。因此，不要将各种新特性都打包到集大成的发布版本中，而应作为普通用户体验的一部分来经常添加这些特性。吸引你的用户来充当实时的测试者，并且记录这些服务以便了解人们是如何使用这些新特性的。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　7. 合作，而非控制&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　Web 2.0的程序是建立在合作性的数据服务网络之上的。因此：提供网络服务界面和内容聚合，并重用其他人的数据服务。支持允许松散结合系统的轻量型编程模型。&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　8. 软件超越单一设备&lt;/font&gt;
&lt;p&gt;&lt;font color="#800080" size=3&gt;　　PC不再是互联网应用程序的唯一访问设备，而且局限于单一设备的程序的价值小于那些相连接的程序。因此：从一开始就设计你的应用程序，使其集成跨越手持设备，PC机，和互联网服务器的多种服务。&lt;/font&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-6558363559019881103&amp;page=RSS%3a+Web+2.0&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=scenery9.spaces.live.com&amp;amp;GT1=scenery9"&gt;</description><comments>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!227.entry#comment</comments><guid isPermaLink="true">http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!227.entry</guid><pubDate>Sun, 11 Dec 2005 10:37:44 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://scenery9.spaces.live.com/blog/cns!A4FC03173CC0DD71!227/comments/feed.rss</wfw:commentRss><wfw:comment>http://scenery9.spaces.live.com/Blog/cns!A4FC03173CC0DD71!227.entry#comment</wfw:comment><dcterms:modified>2006-12-24T15:34:20Z</dcterms:modified></item></channel></rss>