Google met en garde contre les erreurs Soft 404 et leur impact sur le référencement

Dans un récent article publié sur LinkedIn, l’analyste de Google Gary Illyes a attiré l’attention sur deux problèmes qui affectent les robots d’indexation : les erreurs soft 404 et autres erreurs « cryptographiques ». Ces erreurs apparemment anodines peuvent avoir un impact négatif sur les efforts de référencement.

Comprendre les erreurs logicielles 404

Les erreurs logicielles 404 se produisent lorsqu’un serveur Web renvoie un code d’état HTTP standard « 200 OK » pour des pages qui n’existent pas ou contiennent des messages d’erreur. Cela induit les robots d’exploration en erreur, les obligeant à gaspiller des ressources sur du contenu inexistant ou inutile. Illyes a comparé l’expérience à la visite d’un café où chaque article n’est pas disponible bien qu’il soit indiqué sur le menu. Bien que ce scénario puisse être frustrant pour les clients humains, il pose un problème plus grave pour les robots d’exploration Web. Comme l’explique Illyes : « Les robots utilisent les codes d’état pour interpréter si une récupération a réussi, même si le contenu de la page n’est essentiellement qu’un message d’erreur. Ils pourraient revenir volontiers à la même page encore et encore, gaspillant vos ressources, et s’il existe de nombreuses pages de ce type, cela augmentera exponentiellement vos ressources.

Les coûts cachés des erreurs douces

Les conséquences des erreurs logicielles 404 s’étendent au-delà de l’utilisation inefficace des ressources du robot. Selon Illyes, il est peu probable que ces pages apparaissent dans les résultats de recherche car elles sont filtrées lors de l’indexation. Pour lutter contre ce problème, Illyes conseille de fournir le code d’état HTTP approprié lorsque le serveur ou le client rencontre une erreur. Cela permet aux robots d’exploration de comprendre la situation et d’allouer leurs ressources plus efficacement. Illyes a également mis en garde contre les robots d’exploration limitant le débit avec des messages tels que « TROP DE DEMANDES RALENTISSENT », car les robots d’exploration ne peuvent pas interpréter de telles instructions textuelles.

Pourquoi SEJ s’en soucie

Les erreurs soft 404 peuvent avoir un impact sur la capacité d’exploration et l’indexation d’un site Web. En résolvant ces problèmes, les robots d’exploration peuvent se concentrer sur la recherche et l’indexation de pages contenant du contenu intéressant, ce qui peut potentiellement améliorer la visibilité du site dans les résultats de recherche. L’élimination des erreurs soft 404 peut également conduire à une utilisation plus efficace des ressources du serveur, car les robots d’exploration ne gaspilleront pas de bande passante en visitant à plusieurs reprises les pages d’erreur.

Comment cela peut vous aider

Pour identifier et résoudre les erreurs logicielles 404 sur votre site Web, tenez compte des étapes suivantes :

  1. Surveillez régulièrement les rapports d’exploration et les journaux de votre site Web pour identifier les pages renvoyant des codes d’état HTTP 200 malgré la présence de messages d’erreur
  2. Implémentez une gestion appropriée des erreurs sur votre serveur pour garantir que les pages d’erreur sont servies avec les codes d’état HTTP appropriés (par exemple, 404 pour non trouvé, 410 pour supprimées définitivement)
  3. Utilisez des outils tels que Google Search Console pour surveiller la couverture de votre site et identifier toutes les pages signalées comme erreurs 404 logicielles

Traiter de manière proactive les erreurs soft 404 peut améliorer la capacité d’exploration, l’indexation et le référencement de votre site Web. Image en vedette : Julia Tim/Shutterstock

Tags: