为什么在SEO优化中,一般不建议动态页面,什么是动态页面,它又有什么影响呢下面一起来看看。
动态页面通常以: phpaspaspx jsp cgi 等后缀的。动态页面是直接提取后台数据库的数据展现给用户的一种页面,动态网页不是独立存在于服务器上的网页文件,只有当用户请求时服务器才返回一个完整的网页,我们常见的有.asp , .php , jsp等,还有ASP.netCGI等,动态页面的对于搜索引擎不是很友好,因为搜索引擎可能由于-些变量的url进入死循环 ,称为”搜索机器人陷阱(Spidertraps)”, 所以很多时候带较多变量的地址搜索引擎是不会进去的。
设计爬虫时,通常都回避动态网页(如Charkabarti,Joshi,Punera,&Pennock,2002)。识别动态网页时,只需要看URL中是否出现问号,含问号的就是动态网页。忽略动态网页是因为它们容易造成蜘蛛陷阱。蜘蛛陷阱理论上是一个无限的网页集合,而蜘蛛永远不能完整地遍历这个集合。在线日历就是一个容易被忽略的蜘蛛陷阱,它生成的动态网页中可以标上任何日期,并包含指向后一天网页的链接。一个爬虫从这个日历中找到一个网页后,便会无止境地请求后一天的网页。这样是不利于SEO优化的。
动态的页面(url)属于蜘蛛陷阱,SEO优化搜索引擎蜘蛛一旦爬行进入,很有可能会出不来或是难以流畅的抓取,所以建议网页一定是 静态或是经过伪静态处理的。