分析日志是seo每天都要做的事情,这是每天查看百度蜘蛛对网站页面的抓取情况。久而久之就会发现百度抓取页面是很有规律性的,基本上每个页面百度蜘蛛都会不定期的进行抓取,但是有的页面会频繁的不断抓取,有的页面却很少去抓取,这就可以分析出百度蜘蛛抓取页面的喜好了,也知道了我们页面所存在的问题了。
百度蜘蛛.png
一、首先先介绍一下seo的几个概念,我们再来分析抓取频率存在的问题吧。
1、概念性有效索引:
当你的页面开始有了收录,并且有了相对应的排名,且在百度搜索关键词时显示的760个搜索结果里面的时候,这个页面就是一个有效索引页面了,也是属于有效的收录。
2、概念性缓存机制:
当您搜索某个关键词时,会看到固定的搜索结果,这个时候就是百度搜索引擎的缓存机制了,但过段时间搜索该词的时候,会发现排名页面结果有变动或者进行了更换,这个就是搜索引擎的淘汰机制以及更新机制。
3、百度是有详细的分类库的,分部是底层库,普通库,优质库,这里给大家说明一下
百度将网站分为四个等级,分别是d、c、b、a等级:
d等级:百度进行蜘蛛爬行过页面后,并没有抓取该页面,也就没有收录该页面了,原因有2,要么页面内容质量差,要么权重低;
c等级:这个等级也可以叫做百度的底层库,百度虽然会进行抓取收录该页面,但是并没有带来任何流量,但是我们要怎么去分辨是否页面进入了百度的底层库呢。
以下的情况就是进入了百度的底层库情况
(1)、可以把页面的标题全复制,然后放在百度里搜索以下,当然这个时候搜索是没有结果的,因为这个页面是没有排名。
(2)、把页面的链接放到百度进行搜索,然后点击百度快照进去后,如果发现快照的日期一直没有更新,已经停留在了以前的日期了,那证明蜘蛛已经忽略了此页面,并没有再次抓取了。
未收录标题.png
b等级:也定义为百度的普通库,页面参与了排名,也带来了少部分的流量,我们要怎么分辨页面是否进入了b等级百度普通库呢?
以下做法可以判断是否进入了普通库
(1)、搜索收录页面的全标题的时候可以显示出该页面,但是如果搜索标题中的部分标题的时候,会发现该页面已经不在首页显示了;
(2)、一样的做法,搜索页面的链接,百度快照里有更新,说明了百度蜘蛛有隔断时间就会来抓取该页面;
(3)、进入普通库的页面一般不容易在搜索结果中显示图片。
收录的文章.png
那么我们已经知道了什么是底层库,普通库、以及优质库页面了,我们建设网站的时候就要注意了,接下来就可以搭建优质库的网站页面了。
本文来自:www.lonwin.net