时下,以Twitter为代表的实时网络成为互联网最热门的应用领域之一。而正是基于网民对新兴资讯速度和实时性的更高要求,搜索引擎领域应需而动,“实时搜索(Real Time Search)”概念应孕而生。以谷歌为代表的国外搜索巨头相继推出相应服务。而在国内,网易有道则成为“第一个吃螃蟹”者。
2010年4月13日,网易有道率先推出了其实时搜索服务,成为国内首家提供此项搜索服务的搜索引擎。尽管网易有道此次上线实时搜索还处于测试阶段,因此颇为低调和谨慎并没做大规模宣传,但这一有趣的新服务一上线还是被众多细心用户发掘出来,也因此大大提升了网易有道的用户粘度。
所谓“实时搜索”简而言之就是对互联网上的一些信息进行即时、快速搜索,实现即搜即得的效果。当用户打开有道搜索页面中,在输入一个关键词出现搜索结果之后,可以发现在页面左侧有一个“最新消息”按钮,那里就是实时搜索的入口。单击“最新消息”后,可以很明显的看到在每个搜索结果的前方都有一个时间标识,并且页面也在自动进行刷新。
每个结果都是来自草根微博,有新浪、搜狐、QQ等等,单击“详细”即可查看该结果的完整内容。有些微博附带的图片也可以进行放大的预览,单击需要放大的图片即可完整显示该图的实际尺寸,而对于长链接的结果,有道会自动加以修改,并且在搜索结果中,如果有视频文件,会在每个视频文件前加一个小的视频标识来区分。实时搜索按照时间顺序排序,实时地动态滚动,因此可以给用户一种对某一事件“直播”的感觉。
近日,专门就网易有道“实时搜索”的功能实现,ZOL记者对网易高级副总裁周枫博士进行了采访。
网易高级副总裁周枫博士接受ZOL记者采访
实时搜索从技术上有本质区别 难度更大
对于最终用户来讲,实时搜索与传统搜索结果相比,似乎只是搜索结果更快了,而且以滚动的方式实时呈现。那么从搜索引擎技术上,这一新功能有哪些难点呢?周枫表示:传统搜索引擎的工作方式要经历很多程序,首先要抓取信息、存储到本地,然后对资讯进行分词、重要级别区分以及索引等工作,因此从资讯源出现到被搜索引擎录入总会有一个时间差,这个时间差可能从至少几十分钟到几天时间。而采用实时搜索,我们采用一种叫“置换技术”,就是将数据量不太大的实时信息减化算法,不经过磁盘存储的过程 ,直接从内存和网络中进行处理,因此将搜索收录时间降至几秒钟。
当然,由于这种实时搜索技术对时效性的高要求,不可避免地涉及到不良信息过滤等问题。特别是在中国特有的互联网国情下,如何解决这一问题?周枫表示,由于在推出该产品之前公司已经做好的充份准备,因此在技术手段等方面有把握保证资讯的可控性和不良信息的过滤,而且未来还将对该技术进一步升级和优化。