1. 便于排名打分。2. 存储资料,用户搜索时便于迅速提供给用户。3. 数据挖掘和分析,比如热榜,这也是一笔数据财富。4. 还有存储网页的快照。
搜索引擎的工作过程大体可以分为三个阶段:1.对网页进行抓取建库,搜索引擎蜘蛛通过抓取页面上的链接访问其他网页,将获得的HTML代码存入数据库。2.预处理,索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,为后面排名程序使用时做准备。3.给搜索结果进行排名,用户输入关键词后,排名程序调用索引库数据,计算数据和关键词的相关性,然后按照一定格式生成搜索结果页面。