ReadWriteWeb 介绍了一个名叫 Infovell 的深度搜索引擎,据称作用是索引那些没有被主流搜索引擎如 Google 抓过的网页,包括各大学术出版商如 Oxford University Press, SAGE, Taylor & Francis, Annual Reviews 等等。Infovell 自己的定义也是 "Research engine"。我这里由于网络质量不佳只能看到 ReadWriteWeb 上的截图,看起来 Infovell 主要的特色是结合了 Web of Knowledge 将搜索结果按学科分类的功能并提供了方便的关键词修改系统,还有些提高可用性的改进例如高亮含有搜索词的句子和显示有同一关键词的不同主题文档之间的关系。
虽然 Google Scholar 现在并不是一个好用的搜索引擎,这个 Infovell 貌似也不是特别让人激动。它在描述自己使用的技术时提到了关键词搜索的一些固有缺点,例如关键词越多,得到的结果越少而且很可能相关程度反而不高。Infovell 宣称它索引了每一段话中各种可能的词语和短语的组合,而且没有网页语言的限制,这似乎说明它使用的不是语义的方法。现在像 Google Scholar 这样的搜索引擎的问题在于它不能搞懂关键词之间的语义关系,而且只会用文章被引用次数等等指标来排序搜索结果,用户可能很难找到含有特定信息的文档。比如我想找一篇关于澳大利亚北部降水对沙漠影响的文章,Google Scholar 给出的第一页结果中可能就有澳大利亚的学者研究纳米比亚沙漠的文章,而 "precipitation" 这个词只是在其参考文献中出现了一次。对于非语义的搜索引擎能把这个问题解决到什么程度,我持相当的怀疑态度。
Infovell 将在9月22日正式上线,按收费方式提供服务,并提供了30天的免费试用。目前的数据库似乎以生物科学期刊和文献为主。这个搜索引擎是否比 Scholar + Web of Knowledge 更有价值要到下周才知道了。
![Reblog this post [with Zemanta]](http://img.zemanta.com/reblog_e.png?x-id=d04d488f-a718-4ca6-b2d7-a3cca359b6d0)
没有评论:
发表评论