搜索引擎有两种基本类型:一类是纯技术型的全文检索搜索引擎,如google、AltaVista、Inktomi等,其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。需要说明的是,这些信息并不是搜索引擎即时从互联网上检索得到的,通常所说的搜索引擎,其实是一个收集了大量网站/网页资料并按照一定规则建立索引的在线数据库,如2004年3月底google收录的网页数量已经超过42亿个,这样,当用户检索时才可以在很短的时间内反馈大量的结果。
另一类称为分类目录,这种“搜索引擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。yahoo是分类目录的典型代表,国内的搜狐、新浪等搜索引擎也是从分类目录发展起来的。分类目录的好处是,用户可以根据目录有针对性地逐级查询自己需要的信息,而不是像技术性搜索引擎一样同时反馈大量的信息,而这些信息之间的关联性并不一定符合用户的期望。