新站百度不收录的原因和解决办法(2022最新)
如果您有SEO优化、网站建设需求请致电:18510193015
SEO 相关工作开展已近两个月,从谷歌的数据反馈来看,效果颇为理想。然而,百度方面却迟迟未见更新动态,近期百度蜘蛛的抓取频率相对较低。与几位同行交流后得知,自惊雷 3.0 算法推出以来,新站想要收录内页,通常需要三五个月的时间。为何延长观察期呢?原因大家都心知肚明,主要是为了防范垃圾站群以及黑帽 SEO 利用快排工具在短时间内将网站的‘假权重’刷高,从而严重影响百度搜索结果的用户体验。
SEO 相关工作开展已近两个月,从谷歌的数据反馈来看,效果颇为理想。然而,百度方面却迟迟未见更新动态,近期百度蜘蛛的抓取频率相对较低。与几位同行交流后得知,自惊雷 3.0 算法推出以来,新站想要收录内页,通常需要三五个月的时间。为何延长观察期呢?原因大家都心知肚明,主要是为了防范垃圾站群以及黑帽 SEO 利用快排工具在短时间内将网站的‘假权重’刷高,从而严重影响百度搜索结果的用户体验。
无蜘蛛访问
对于新站而言,既然百度有此规定,我们也无可奈何。所以,若是新站有蜘蛛爬取,且谷歌也有排名,那就无需过度担忧,按日常工作流程进行即可。但倘若百度蜘蛛不来,谷歌也未收录,那就需要审视是否是网站自身存在问题。以下列举几个可能的因素。
域名刚注册
新域名在信用权重方面相较于老域名确实处于劣势。对于刚注册几天或十几天的域名,没有搜索引擎蜘蛛来访属于正常现象。可若过了一个月左右,依旧没有蜘蛛光顾,那就需检查是否是网站服务器屏蔽了蜘蛛,或者未导入链接。不过,一般而言,这种可能性较小,最有可能是 robots.txt 规则设置有误。所以,首先要检查 robots 文件是否编写错误。若是用 WordPress 搭建的网站,要查看设置 - 阅读菜单中是否勾选了‘建议搜索引擎不索引本站点’项,若有勾选则需取消。
新域名在信用权重方面相较于老域名确实处于劣势。对于刚注册几天或十几天的域名,没有搜索引擎蜘蛛来访属于正常现象。可若过了一个月左右,依旧没有蜘蛛光顾,那就需检查是否是网站服务器屏蔽了蜘蛛,或者未导入链接。不过,一般而言,这种可能性较小,最有可能是 robots.txt 规则设置有误。所以,首先要检查 robots 文件是否编写错误。若是用 WordPress 搭建的网站,要查看设置 - 阅读菜单中是否勾选了‘建议搜索引擎不索引本站点’项,若有勾选则需取消。
网站打开太慢
谷歌的收录规则中有一条,若网站打开速度过慢,也会导致不被收录。通常来说,能在 3 秒之内实现页面交互的站点可视为合格,这里所说的页面交互,并非指网站加载完成。二者有何区别呢?当你看到浏览器图标位置的加载图标一直在转动时,表明网站正在加载;当加载图标停止转动,即表示加载完成。而页面交互是指网站 DomContentLoaded事件发生之后的时间。
谷歌的收录规则中有一条,若网站打开速度过慢,也会导致不被收录。通常来说,能在 3 秒之内实现页面交互的站点可视为合格,这里所说的页面交互,并非指网站加载完成。二者有何区别呢?当你看到浏览器图标位置的加载图标一直在转动时,表明网站正在加载;当加载图标停止转动,即表示加载完成。而页面交互是指网站 DomContentLoaded事件发生之后的时间。
服务器不稳定
倘若服务器网络不稳定,可能会因网络原因致使百度爬虫无法访问网站。试想一下,若总是吃闭门羹,哪只蜘蛛还愿意再来呢?所以,可以查看服务器的 accesslog 文件,了解是否有搜索引擎蜘蛛访问过。最简捷的方法是使用 Ping 功能查看丢包率,若丢包情况严重,那就更换服务器为好。最好将服务器放置在国内并进行备案,百度对备案站点会有一定的权重加成。
倘若服务器网络不稳定,可能会因网络原因致使百度爬虫无法访问网站。试想一下,若总是吃闭门羹,哪只蜘蛛还愿意再来呢?所以,可以查看服务器的 accesslog 文件,了解是否有搜索引擎蜘蛛访问过。最简捷的方法是使用 Ping 功能查看丢包率,若丢包情况严重,那就更换服务器为好。最好将服务器放置在国内并进行备案,百度对备案站点会有一定的权重加成。
蜘蛛被屏蔽
新手站长确实容易出现这样的问题,一边向百度搜索引擎提交链接、sitemap 地图,一边却用 Robots.txt 文件屏蔽蜘蛛爬取收录。我们可以借助站长平台自带的 robots 工具,检测 robots.txt 规则是否存在问题。就像 SEO 相关案例中,前段时间因规则写错导致收录下降,及时修正后收录便恢复了。大家可以参考‘错误的 robots 文件设置对 SEO 的影响’这篇文章。
新手站长确实容易出现这样的问题,一边向百度搜索引擎提交链接、sitemap 地图,一边却用 Robots.txt 文件屏蔽蜘蛛爬取收录。我们可以借助站长平台自带的 robots 工具,检测 robots.txt 规则是否存在问题。就像 SEO 相关案例中,前段时间因规则写错导致收录下降,及时修正后收录便恢复了。大家可以参考‘错误的 robots 文件设置对 SEO 的影响’这篇文章。
有蜘蛛访问
如果在服务器中发现有蜘蛛访问,如下所示:
如果在服务器中发现有蜘蛛访问,如下所示:
且已超过半年时间仍未被收录,就要考虑以下两种原因:
网站结构太深
这里所说的结构包括目录结构和代码结构。首先要检查网站代码,查看 HTML 标签是否嵌套过多,导致网站代码冗余、内容分散。同时,也要留意目录结构的层级是否过深。要知道,新站最好保持在二层目录结构,即最多进行三次点击就能进入文章页,否则爬虫分配的时间可能不足以抓取全部内容。
对于相关案例而言,百度的抓取时间和频率在不断上升,所以不必过于担心不被百度收录。只要持续更新文章、优化内容,有空时优化网站内链、提升用户体验,偶尔发布一些高质量的外链,被百度收录只是时间问题。
缺乏原创内容
对于新站,部分站长为图方便,直接从网络上复制粘贴内容,而非原创。这类网站长时间未被收录实属正常,毕竟百度的算法工程师们可不是吃素的,没那么容易被忽悠。所以,如果因网站缺乏原创内容而未被收录,那么站长们就需要调整策略,以质量取胜来实现收录目的,否则有可能被搜索引擎‘关进小黑屋’。
其它原因
新站不收录的原因远不止上述提到的这些,每个网站都有其独特情况,需具体问题具体分析。但上述几种是较为常见的情况。若不是上述问题,可考虑请教有经验的站长帮忙查看,切勿盲目尝试各种方法,频繁更改网站设置,这对收录影响极大。
百度不收录解决办法
上文已分析了百度不收录的大致原因,可尝试以下方法加快收录:
百度站长平台反馈
新手站长们一定要善于利用百度自身的产品,百度站长平台设有反馈中心。首先,我们可以提交申请,让百度工作人员协助查看。若网站正规合法且内容原创,就无需担心不被收录。点击下方红框反馈问题链接:
新手站长们一定要善于利用百度自身的产品,百度站长平台设有反馈中心。首先,我们可以提交申请,让百度工作人员协助查看。若网站正规合法且内容原创,就无需担心不被收录。点击下方红框反馈问题链接:
之后会看到一个反馈表单,选择已验证的网站地址:
填写好问题描述,附带几个优质的文章内页链接,再上传几张网站截图和一张百度 site 命令的截图,等待工作人员反馈处理。虽说这个反馈入口有时如同石沉大海,但有总比没有好。
自动提交收录
百度站长平台提供了自动提交的 API,我们可以修改网站发文部分的代码,当有新文章发布时,就向百度自动提交收录请求,以便百度及时知晓网站在持续更新,并非垃圾站点。如今,百度对于非企业站和新域名站的观察期明显延长,站长们要做好长期奋战的准备。
其他解决办法
除上述两种方法外,我们还可以发布一些优质外链,添加高质量友链来吸引蜘蛛。网站内部优化要持续进行,很多时候使用百度 Site 命令查看未收录并不意味着网站存在问题,只是百度还在观察。例如,相关案例网站在百度虽未显示多个页面,但从流量监控中发现已有百度来的关键词流量,使用关键词搜索后,确实能看到自己的网站。持续做好内容更新、网站结构优化以及外链优化,排名和收录便无需忧虑。此文就分享到这里,如有疑问,可留言评论。