现在业界对网站不收录怎么的问题都不能给出一个明确的答案,不是回答权重不高,就是说原创度不行或者外链不够。而提出的解决建议是多发外链,买点友链,好好写原创文章。一个问题给出这样的答案,让一些工作者们迷雾一团,难道要靠猜测去工作。这应该是很多人都不想的,大家都希望很多问题能透析透明化,而不是含糊其词。
其实很久以前针对网站收录的问题,就有相关公式来进行了很好的表示:网站收录量=页面抓取量×页面质量。这是国平提出的,收录本来就是靠蜘蛛抓取,能被蜘蛛留下的页面就是质量高的。
蜘蛛对网站页面的抓取量应该是跟网站的所在域名主机服务器以及程序有着密切关系的,如果这两者并未干扰或者限制蜘蛛的访问,那这方面应该是稳定正常的。页面有哪些类型呢?基本有三种:1、链接型2、文字型3、图片型。链接型是一个页面里面内容以链接为主,最明显的是导航站的页面,其实门户也是一个链接页面。如果一个页面既有图片又有文字,那么我们可以将其分到文字型,因为这种页面还是文章主导。
另外还有外链的作用,因为外链基本一来可以提高其他网站对自己本网站的投票率,二来可以引导蜘蛛去爬取,如果你的外链发到位了,能引来蜘蛛,而且服务器正常,那么你网站已经做好一半了。其实这个是很好做的,一般站长进行网站建设会选择虚拟主机,找个有口碑的品牌,你申请网站一般不会有这些问题,而网站程序也是利用开源的默认程序,以所程序也不会有问题。
如果像上面所说,那文章页面的细节问题就是分析的关键所在了。判断一个网页是好是坏应该有两个直接因素,文章的质量和页面的布局。页面的布局就做到第一:内链主要是形成一张链接网,为的是让蜘蛛好爬取;第二:内链主要是为了传递权重。
但是文章的质量是最难把握的,这个概念也相对模糊。站长和SEOer的从侧重点不同,我们可以说站长一般是从“是否符合用户体验,可读性如何”以及“百度飘红不要多,不要让百度认为是伪原创”两个角度,SEOer们多数认为是后者,可读性这点应该可以做到,写文章一定要有相关性,而且最好是用户感兴趣的,这样降低跳出率,而有人研究说跳出率也是判断页面质量的因素之一。
其实站在站长的角度来说网站的质量也有两个点:1、是不是符合用户体验,可读性怎么样?2、不要让百度认为是伪原创,百度飘红不要多。第二点是多数seoer们所认为的。可读性这点应该可以做到,写文章一定要有相关性,而且最好是用户感兴趣的,这样降低跳出率,而有人研究说跳出率也是判断页面质量的因素之一。至于不要让百度认为你是伪原创,或者说原创度很低。搜索引擎判断文章是否为伪原创是有自己的机制的。大家可以针对不同搜索引擎深人研究。
(本文"吴昊SEO:收录量、页面抓取量与页面质量"的责任编辑:雪豹)