百度收录的原则是:文章需要符合:
1、有价值
2、原创。
具体表现为以下几个方面:
1、较重视第一次收录印象
公司的营销型网站给百度的第一印象比较重要,相对谷歌而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录网页而不是由机器来决定.所以,网站在登录百度搜索引擎之前最好把内容做得丰富点、原创内容多一点、网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象.
2、对网页的更新较敏感
百度对网页的更新相对Google而言更加敏感,可能这与百度的本土性格有关.百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间.所以在百度的搜索结果中基本上都标明了收录时间.
3、较重视首页
百度对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承.百度在显示搜索结果时也常常把网站首页显示出来,而不具体到某个内容页(当其认为不够重要时).相对而言,其用户体验打了折扣,而增加了其“百度快照”的用户量.
4、较重视绝对地址的链接
百度在收录网页时比较重视绝对地址的收录,百度提供的网页快照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现.
5、较重视收录日期
百度对网页的收录日期非常看重,也是其搜索结果排名的参考点,被收录得越早排名会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息.这是百度需要改进的技术。