看似不难实际极复杂的问题,要搞明白的话涉及到对搜索引擎不同数据口径的反推。
从结论而言是,我几乎不看这些数,除非是看着翻了几倍心里爽。
所谓收录,要去关心的话就是去解决流量问题的。而基于这个目的,要量化的总是细分页面类型的收录情况而非整站情况(站长平台索引量可以拆分部分页面类型,有时能简单点处理事情,但不推荐),这时候最佳方法一般是取页面类型所有URL再随机采样。这个解决方案在绝大多数情况下都好用。
搜狗站长平台把收录量索引量放在一起两张图,意思多半是前者是进正排索引,后者是建立了倒排索引的(见走进搜索引擎等基础书籍)。
猜百度也是这样,硬要去解读的话可以这么来看。痞子瑞的SEO深度解析里面也更具体提到了一些site数量的规则。
正排倒排网页数量不同的最主要影响可能是,低质量页面在建倒排过程中被分析出来过滤了。也可能是其中一个库清了一些页面,另一个库还没跟上。等等。
不管怎么样不要觉得这两个数对不起来是件什么奇怪的事情,本就不是一回事。之前碰到有人因为索引量多了,觉得收录索引必一样的趋势,看到乙方(非我们)统计的收录下降,就怪罪乙方算的什么破数据。
(本文"ZeroSEO:百度收录量和索引量的终极解读"的责任编辑:雪豹)