从上个世纪90年代初到现在的20年里,理论界把中国搜索引擎的发展分为三代,但对于年代的划分尚没有统一的标准。
一、第一代搜索引擎的主要特征是依靠人工分类目录式搜索。无论是纯技术型的搜索引擎还是分类目录,都可以认为是互联网上的第一代搜索引擎,出现于1994年前后,以yahook为代表。其特点是用人工的方式把网站放在各种目录下,允许客户通过各种方式找到想要的网站,现在这种方式依然还在采用。
二、第二代搜索引擎的主要特征是基于关键词搜索。
随着搜索引擎应用技术的发展,用户不再满足于对网站分类和摘要的简单查找,希望对内容进行查找,1998年,以Google为代表的第二代搜索引擎出现在互联网上,它使用关键字网页搜索,内容可以覆盖互联网全部网页内容。
三、第三代搜索引擎的主要特征是基于自然语言搜索。
人们在日常工作和生活中的交流是使用自然语言而非关键词,因为关键词表达的意思和意图不完整不准确,反映在关键词搜索结果上的缺陷更是淋漓尽致。这就赋予第三代搜索引擎的主要特征是基于自然语言智能搜索,即从基于关键词层面搜索提升到基于自然语言和人工智能的知识层面搜索,使搜索过程由原来的关键词匹配提升为内容概念相互关联的匹配,从而解决仅表达形式匹配所带来的种种缺陷,实现基于自然语言的智能搜索。新华云科搜索引擎是第三代搜索引擎的代表。
综上所述,搜索引擎的技术仍在快速发展中,现在,很多用户甚至还不明白第三代搜索引擎意味着什么,第四代搜索引擎的概念也开始广为流传,一般的用户要分清这些搜索引擎技术的差别,并不是一件容易的事情,不过好在用户关心的只是搜索引擎能带来的基本价值——以更方便、更快捷的方式获取符合自己期望的有价值的信息,搜索引擎的发展方向也不会超出用户需求的基本方向。
搜索引擎既是一门技术,又是一项服务,因此搜索引擎的发展应该包括搜索引擎产品技术的研发及其服务方式的改进与发展。不管搜索引擎技术如何发展,服务方式如何改进,都不应偏离用户快速、准确、方便查找信息的主导方向,基于自然语言的智能搜索技术将成为未来搜索引擎发展的新趋势。