早期的关键字堆砌SPAM作弊方式之一,是将中文词库中的单词直接用软件拼凑成文章,这样的文章没有实际的意义,只能给搜索引擎看。那么对于这样的文章,搜索引擎是通过什么方式来识别的呢
我们知道,每个搜索引擎都有网页质量监控部门,对于百度等掺杂人工处理的搜索引擎而言,用户发现这样的网站,投诉到百度,百度直接封了这个网站了事。但对于Google这样的封站也是自动处理的搜索引擎而言,对关键字堆砌作弊的识别就显得更为重要了。 对于关键字堆砌作弊方式的识别,搜索引擎一般采用统计分析的方法进行。
搜索引擎首先将网页进行分词,分词完成后可以得到词的数量N和文章长度L,从大量文章的统计中发现文章的长度L和词的数量N两个数字之间存在一定的分布关系,一般而言L/N界于4至8之间,均值大约在56之间。也就是说一篇长度为1000字节的文章中,应该有125250个分词,由于中文和英文的词的组成不一致,因此在英文和中文中这个比值的范围会有所不同。如果搜索引擎发现L/N特别大,那么这篇文章就存在关键字堆砌现象了,如果L/N特别小,则可能是这篇文章是由一些词所组成的没有意义的文章。
进一步,通过大量正常文章统计发现,文章中密度最高的几个关键字出现的次数之和与N/L存在一定的分布关系,搜索引擎就可以通过网页中的分布与统计结果的分布图进行比较得出文章是否存在关键字堆砌的现象。 1、关键词堆砌容易k站吗
答复:一般来说,关键词堆砌比较多的是降权重,k站的可能性不大,除非是做了其他的作弊行为或者站点没有用户体验才会k站的,仅仅关键词堆砌一般不容易k站的。
2、一般关键词堆砌多少密度才不算堆砌呢
答复:这个没有具体的标准,一般来说只要我们网站围绕用户体验来进行运营,即使关键词密度达到10个点也不算是关键词堆砌的,所以只要我们不要非常的刻意堆砌关键词,那么都是ok的。
3、搜索引擎对关键字堆砌如何来判断呢
答复:搜索引擎排版关键词堆砌是从综合性的方法来进行判断的,除了采用统计分析的方法进行,还会通过用户的跳转率、用户访问行为等方面判断,统计分析的方法就是搜索引擎将一篇文章进行词语数量的统计,专业点称为“分词”,也就是“L/N”的概念,N代表得到词的数量,L代表文章长度,2者相除就有搜索引擎数据统计中的密度了。通过统计分析肯定不能完全的判断,搜索引擎分析用户的访问行为、跳转率、浏览时间,浏览页面数等都是一个参考的,所以搜索引擎的对此的算法还是非常复杂的。
4、有看到一些网站有做关键词堆砌的行为,但是用百度百科没有k也没有降权,而且关键词排名老好了
答复:关键词堆砌是黑帽seo行为,这是肯定的,如今的百度搜索引擎算法并不是直接能看的出来,百度对于网站的考察也不可能短期就下定论给你降权或者k站,但是长时间采用这种手法一定会降权的,黑帽seo往往只能保持短期排名,所以这方面大家不要抱着侥幸心理。 关键词堆砌会被搜索引擎视为作弊,影响网站排名,甚至有被K站的风险。避免这一现象,我们应把关键词控制在3%8%之间。