重新索引互联网

2011-05-18 09:04 稿源:爱范儿  0条评论

 Facebook 雇佣公关抹黑 Google 的过程已经水落石出。问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感?

Google :索引互联网

Google 号称自己的使命是“索引互联网”。

这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来?

Google 的搜索结果排序有其他算法的辅助和人工调整,但是,他最基本的核心规则还是 Pagerank ,其理念并不复杂: “被许多优质网页引用的网页,仍然是优质网页。”

领域

Pagerank 是革命性的。而另一场革命似乎被我们忽视了: Tags 。

语义网络长期不靠谱的忽悠之后,简单的 Tags 可以终于可以给我们一些东西,让我们分辨这个网页是关于哪些方面的。从此“领域”也被引入网络。

具体些的“领域”的例子,就是 Quora 或者 Stack Overflow 的 Tags 。问题本身是属于“技术”领域,还是“设计”领域?是关于“ J2EE ”领域,还是“ Objcet-C ”领域?

某些没有 Tag 化的网页到底属于什么领域,还没有清晰的答案。但是已经有人在尝试解决这些问题。比如豆瓣九点,他是依靠算法来给 Blog 自动分类的。

专家

像Quora , Stack Overflow 这种网站的颠覆性意义在于:他同时具有“人”和“领域”两种概念。

“领域”和“人”结合,就会产生“专家”:特别擅长某个“领域”的“人”。

和 Blog 时代那些说话无操守的“砖家”不同,实名网络加上 Quora 这种问答网站,让我们不需要而非头衔,证书或者学历,就可以用数据去检验一个人在某个领域的专业程度:回答某个领域的问题特别多,并且评价特别好的,很可能是个专家。

网络上的“专家”不仅仅是概念而已。有些网站已经走到了分辨专家的门槛上。 知乎虽然被称作 Quora 的拷贝版,但是他有个比 Quora 更酷的功能:邀请别人回答问题的时侯,系统会推荐可能合适的用户。

背后的算法不难猜测:用问题的“领域”( Tags )去匹配回答过类似问题的“人”。回答过类似问题并且获得赞成多的,很可能也适合回答这个问题。

Stack Overflow 其实也有类似的评价机制,叫做 Reputation (声望)。可惜并没有详细到领域(谁在标记着 Object-C 这个 Tag 的问题中拥有最高的声望?)。但是,如果 Stack Overflow 想得到这个数据,也是分分钟的事。

有好的文章希望站长之家帮助分享推广,猛戳这里我要投稿

相关文章

相关热点

查看更多