一只优雅的小爬虫诞生记(跟着小虫爬呀爬故事)
962
2022-07-28
常常会有人问到网站为什么不收录,网站为什么收录这么少的问题,其实网站的收录并不与排名有直接的联系,那么本文来分析网站不收录的因素有哪些:
第一、层级
我们说到网站的层级会影响蜘蛛的爬去容易程度,其实并不是这样的。大型网站到了第四层或者第五层、六层都有收录,那是为什么我们企业站在第四层的内容就难以被收了?所有的网站都是一样的,不管是新浪还是我们的企业站,通常为了吸引用户的点击,都会把重要的内容放在放在首页和栏目页。所以百度蜘蛛就默认放在网站首页的链接进去的内容是网站最重要的内容,比如我们内页的一篇文章推荐在首页,可能通过路径来看已经是第四层了,但是因为在首页有做链接,所以还是属于第二层。对于重要的内容蜘蛛就会去抓取和收录,企业站的内容非常少并且受众哦也非常少,百度给予企业站收录的层次是3层,3层以下的内容就被自动认为是没有价值的内容。
第二、网站的信用度
网站的信用度主要由两个方面决定,一个是网站的时间长短,另外一个是给予网站的投票。一个网站做的时间越长在其他条件相同的情况下更新文章收录的可能性就会越高。网站的的时间不是指域名注册的时间,是指网站做好以后并且持续管理的时间的长短,如果网站做好之后没有去管理那么也是没有效果的。投票就是网站的外链,类似于现实生活中的找工作一样,如果在求得一份工作的时候有这个公司的高管的推荐,那么得到这份功能做的可能性就会更大。相同的如果你的网站有高权重的链接指向,那么前期收录可能性就会大。
第三、更新频率
更新的频率越高收录就会更加的容易,但是需要注意看行业来定。对于一个小型的机械类的企业站就不需要每天更新那么多文章,更新再多也很难有好的收录,但是像娱乐行业就需要每时每刻更新。
第四、注册老域名做站
很多人喜欢捡便宜或者认为老域名做站能继承之前的权重,其实是错的。老域名再拿来做站信用期会比新注册的域名时间要长2-3个月,也就是说人家的新站1个月收录内页,而你的可能要2个月三个月收录内页,并且收录首页的时间也会拉长。如果是之前被降权或者被K或的域名再次做站收录就更加困难,可能一个月都不能收录首页。如何看是否之前有用过?在百度搜索框搜索域名,如果有任何的相关域就说明之前这个域名被使用过。
第五、网站模板
有的SEO在看到竞争对手的一个网站做的非常好就直接把模板拷贝过来,或者直接把人家的站仿制下来修改下自己的内容就成了自己的新站了。对于在同一个产品下的同模板的站点百倍会给与更长的信用周期。因为很简单,同产品大多数的参数和内容是一样的,很容易被识别为作弊站点。但是如果不是同产品的,比如我看到人家一个led的模板非常好,我拿来做切割机,这就没有问题了。虽然都是机械,但是做的产品不是同一个产品。
总结:网站的收录越多并不能代表越有利于主关键词的排名,但是能带来长尾关键词排名的流量。只要不投机取巧的使用老域名或者贪图方便复制一个模板,做好网站的结构以及内容就不用担心收录不上。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~