搜索引擎排名大致可以分为四个步骤。
1爬行和爬行搜索引擎发出一个程序,可以在网上找到新的网页和抓取文件。这个程序通常被称为蜘蛛或机器人。搜索引擎蜘蛛从数据库中已知的网页开始,就像普通用户的浏览器一样,访问这些网页并获取文件。而搜索引擎蜘蛛会跟随网页上的链接,访问更多的网页,这个过程叫做爬网。当通过链接找到新的网址时,蜘蛛会将新的URL记录到数据库中,等待抓取。跟踪网页链接是搜索引擎蜘蛛寻找新网站最基本的方法,因此反向链接被称为SEO中最基本的因素之一。没有反向链接,搜索引擎甚至找不到页面,更别说排名了。搜索引擎蜘蛛抓取的页面文件与用户浏览器的页面文件完全相同,居住区的文件存储在数据库中。
2索引搜索引擎索引程序对蜘蛛抓取的页面文件进行分解分析,并以大表的形式存储到数据库中。这个过程称为索引。在索引数据库中,记录了页面文本内容关键字位置字体颜色粗体斜体等相关信息。
搜索引擎索引数据库存储着大量的数据,而主流搜索引擎通常有数十亿的页面。
3搜索词处理:用户在搜索引擎页面上输入关键词后,搜索引擎程序将对输入的搜索词进行处理,如中文分词关键字词序分离停止词删除是否开始综合搜索判断是否有拼写错误或错别字。搜索词的处理必须非常快。
4排序在对搜索词进行处理后,搜索引擎排序程序开始工作,从索引数据库中找出包含搜索词的所有页面,并根据排名算法计算出哪些页面应该排在最前面,然后以某种格式返回搜索页面。
尽管排序过程在一两秒钟内完成,并返回用户想要的搜索结构,但这实际上是一个非常复杂的过程。排序算法需要实时从索引数据库中找出所有相关页面,实时计算相关性,并添加过滤算法。它复杂的程序是外人无法想象的。搜索引擎是最复杂的计算系统之一。
但是即使是较好的搜索引擎也无法在识别页面方面与人们相比,这就是为什么网站需要SEO。没有SEO的帮助,搜索引擎往往无法返回最相关最权威和最有用的信息。