关于如何避免软404给网站带去的错误

尊敬的 http://www.mmonice.com/ 网站拥有者或网站站长:在抓取您的网站时,我们发现通用协调时间(UTC,伦敦、都柏林、爱丁堡)2012-11-27 20:00 左右的瞬时软 404 错误数量有所增加。您的网站服务可能出现过中断,但问题得到了解决。下面列举了一些会导致软 404 错误的网页示例:

http://www.mmonice.com/Priest-Warlock-Mage-160-A2-p-1915.html?number_of_uploads=0

http://www.mmonice.com/Fire-Cape-for-80-Magic-43-Prayer-60-HP-1-Def-p-40111.html

http://www.mmonice.com/Priest-Warlock-Mage-160-A2-p-1889.html?number_of_uploads=0

——————————————————————————————————————

以上,是关于MMONICE站点,谷歌发来的错误报告。从中看到“在抓取您的网站时,我们发现通用协调时间(UTC,伦敦、都柏林、爱丁堡)2012-11-27 20:00 左右的瞬时软 404 错误数量有所增加。”里面有提及到软404。而大部分时候,当请求的链接发生错误就会出现两种错误代码信息,一种就是我们经常说的404,另一种就是软404。

正常情况下,当一个网页不存在的时候,会返回一个404代码来表示,软404是这些不存在的网页返回的不是404错误代码,而是200代码。对于那些经常使用谷歌网站管理员工具的朋友可能会在故障诊断中的抓取错误中发现一些软404错误提示。

软404与普通404的区别主要是软404向用户返回错误提示页面(并非404错误提示),HTTP状态码为200;普通404像用户返回404错误页面,HTTP状态码为404;

这里,为什么会出现软404呢?软404代码出现的情况大致为4种:服务器配置错误;网站程序或模版出错;网站被恶意攻击导致;网站管理员失误造成。在很多的时候网站管理员难免发生一些小的失误,失误造成的软404错误有时候由于误操作或者程序问题,对于不存在的网页,直接返回到首页。

软404代码会让普通用户感到困惑,看见一个很感兴趣的链接,点击后却不是自己想要的内容;对于搜索引擎的蜘蛛程序来讲,会花很多时间在网站上爬行和索引那些并不存在、而且经常重复的URL。会造成网站收录量比较低(因为蜘蛛程序花了大量时间在爬行一些并不存在的网页,导致一部分含有独特内容的网页反而有可能无法被及时发现),甚至更严重的大量重复页面的降权、K站行为。

对于软404,最好的处理方法是返回404代码,这样用户可以根据404错误链接来寻找相关页面,爬虫程序也会很好的处理404错误,另外可以根据上面提到的导致软404的几种可能性来检查网页,从而修复错误。

但有时候现实并不是预料的那么理想,这时候我们可以利用robots.txt文件或者nofollow来阻止爬虫程序,在普通用户方面,软404必然会导致页面的跳出率过高,那么,为了达到更好的用户体验,建议始终返回 404(未找到)或 410(已删除)响应代码。您可以将自己的网站配置为在返回 404 响应代码时显示自定义 404 网页,从而改善用户体验。

Seo先生博客发布,本文固定链接地址:https://seosir.cc/735.html?转载请注明。

讨论区

  • Jaylyn

    I rkecon you are quite dead on with that.

    2013 年 2 月 12 日 07:58