今日(2006年9月6日)推出一项新的搜索服务——历史新闻搜索(http://news.google.com/archivesearch)。该搜索服务的链接今天出现在Google新闻的英文版首页,著名blogger Philipp Lenssen 撰写文章指出,这个历史新闻搜索服务的推出,恰好印证了此前Google注册的新域名“archivesearchgoogle.com”。普通用户借助该服务甚至可搜索到18世纪的新闻报导。同时,有新闻报道称,此举可能会拓展存档新闻服务市场。
通过使用,该项历史新闻搜索服务主要有以下特点和功能:
在历史搜索首页,Google惯例性的给出了若干个引导用户使用该服务的“关键词例子”,如“president bush,martina hingis”等。
搜索某些关键词,如“Germany”(德国),能检索到1900年的新闻报导。据报道,最早能回溯到18世纪的新闻报导。显而易见,那个时代没有互联网和电脑,这些古老的历史新闻都是由现在的某些商业公司在法律的许可范围之内重新制作成电子版本的。与Google的合作公司包括,纽约时报公司(New York Times),华盛顿邮报公司(Washington Post),Reed Elsevier旗下的新闻检索服务公司LexisNexis。这些公司提供资料,共同合作,实现上述新闻搜索服务功能。《华尔街日报》,道琼斯公司(Dow Jones & Co.)与路透集团(Reuters Group)合资的商业资讯查询系统道琼斯路透商业资讯(Factiva)也正在与Google合作,以便使用该服务的用户同时可以搜索到这两家公司的文章。
搜索结果分为“付费”和“免费”之分,普通的搜索当中,两种性质的新闻混杂在一起,都会显示摘要;而在高级检索当中,可以进行选择。
该项历史新闻搜索服务不仅仅局限于英文新闻,利用高级搜索功能,可以实现数十中语言和国家的历史新闻搜索。例如,搜索“百度”,检索结果最早显示的是2000年9月18日的新闻。与普通的百度新闻搜索相比,有很大不同,主要在于:
新闻数量少。历史新闻搜索没有收录所有的新闻,即便选择2006年的新闻,也并没有将2006年所有的新闻展现出来。
侧重点不同。历史新闻强调浏览者“向前追溯、求证、考察”的过程,不在乎大量的信息堆积,而在乎是否条理、思路是否清晰。
强调时间层次。历史新闻搜索最小的时间跨度是 年。展现少量的大新闻事件,能够让浏览者很清楚的看到一年当中的重要新闻事件,对宏观有较好的把握。
错误率增大。历史新闻的网页格式很不规范,除非新闻媒体公司提供准确数据,否则2004年之前的新闻很容易提取错误,例如时间错误、正文错误等,也就不奇怪检索“百度”时,会出现八十年代年的新闻了^_^
搜索结果同样也进行了“相关新闻聚类”:All XXX related,聚合的新闻并不全是转载的相同新闻,也包括相关新闻,将所有报道同一事件的相关新闻聚合在一起。
检索结果中,新闻的时间一般来说是该新闻的发布时间,但也出现了很多显示时间和实际新闻报道网页上的时间不匹配现象,这一点尤其显现在“非合作”新闻机构的新闻中。
特色在于,历史新闻检索结果的排序方式,分为:Search articles和Show timeline。在Search articles排序中,检索结果并不是按照时间排序的,猜测是按照相关性进行排序;检索结果的右边,提供以年为最小单位的时间过滤选项和重要新闻媒体过滤选项。而在Show timeline排序中,这是此项服务最大的特点之一,可以自动的生成以时间为纵轴的新闻时间排序,十分清晰、明了的展现了在各个不同历史时期的新闻报道和新闻事件。
对于此项新的历史新闻搜索服务,Reto Meier评论指出:“timeline(时间轴)的排序方式赋予了新闻“历史的感觉”(sense of history),这项服务将会被学校、研究人员和那些愿意追寻历史的人所利用。”
虽然历史新闻搜索服务不是一个大众化的功能,也许还带有一些作秀的成分,但此项功能的推出无疑增强了Google作为一家技术创新性公司的特点。同时,利用此项服务,在时间轴浏览上,也确实能够追溯某家公司、某个人、某个特定时期的故事。
Tuesday, December 05, 2006
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment