Google met à jour les codes d'état HTTP, Googlebot et la documentation d'aide sur les offres d'emploi

Google a apporté des modifications à quelques-unes de ses documentations d’aide à la recherche Google au cours des deux derniers jours. Les documents mis à jour incluent les codes d’état HTTP, le Googlebot et la documentation d’aide aux offres d’emploi. A noter, l’aspect HTTP status code n’est pas nouveau, le contenu a juste été déplacé d’un emplacement à un autre.

Googlebot

Sur le Googlebot, combien d’octets de contenu textuel, tel que HTML, Googlebot explorera spécifiquement ici. Voici les nouvelles lignes de texte  :Googlebot peut explorer les 15 premiers Mo de contenu d’un fichier HTML ou d’un fichier texte pris en charge. Après les 15 premiers Mo du fichier, Googlebot arrête l’exploration et ne prend en compte que les 15 premiers Mo de contenu pour l’indexation.

Offres d’emploi

vous devez également inclure la propriété addressCountry.

Codes d’état HTTP

johnmuh3>erreurs 404 logicielles

Une erreur soft 404 se produit lorsqu’une URL renvoie une page indiquant à l’utilisateur que la page n’existe pas et aussi un code d’état 200 (succès). Dans certains cas, il peut s’agir d’une page sans contenu principal ou d’une page vide. Ces pages peuvent être générées pour diverses raisons par le serveur Web ou le système de gestion de contenu de votre site Web, ou par le navigateur de l’utilisateur. Par exemple :

  • Un fichier d’inclusion côté serveur manquant
  • Une connexion interrompue à la base de données
  • Une page de résultats de recherche interne vide
  • Un fichier JavaScript déchargé ou autrement manquant

C’est une mauvaise expérience utilisateur de renvoyer un code d’état 200 (succès), puis d’afficher ou de suggérer un message d’erreur ou une sorte d’erreur sur la page. Les utilisateurs peuvent penser que la page est une page de travail en direct, mais se voient ensuite présenter une sorte d’erreur. Ces pages sont exclues de la recherche. Lorsque les algorithmes de Google détectent que la page est en fait une page d’erreur basée sur son contenu, la Search Console affiche une erreur logicielle 404 dans le rapport de couverture de l’index du site. Correction des erreurs soft 404 En fonction de l’état de la page et du résultat souhaité, vous pouvez résoudre les erreurs soft 404 de plusieurs manières : Essayez de déterminer quelle solution serait la meilleure pour vos utilisateurs. La page et le contenu ne sont plus disponibles Si vous avez supprimé la page et qu’il n’y a pas de page de remplacement sur votre site avec un contenu similaire, renvoyez un code de réponse (état) 404 (introuvable) ou 410 (disparu) pour la page. Ces codes de statut indiquent aux moteurs de recherche que la page n’existe pas et que le contenu ne doit pas être indexé. Si vous avez accès aux fichiers de configuration de votre serveur, vous pouvez rendre ces pages d’erreur utiles aux utilisateurs en les personnalisant. Une bonne page 404 personnalisée aide les internautes à trouver les informations qu’ils recherchent et fournit également d’autres contenus utiles qui encouragent les internautes à explorer davantage votre site. Voici quelques conseils pour concevoir une page 404 personnalisée utile  :

/li>

  • Assurez-vous que votre page 404 a la même apparence (y compris la navigation) que le reste de votre site
  • Envisagez d’ajouter des liens vers vos articles ou publications les plus populaires, ainsi qu’un lien vers la page d’accueil de votre site
  • Pensez à fournir aux utilisateurs un moyen de signaler un lien brisé
  • La page et le contenu existent toujours Si une page par ailleurs correcte a été signalée par une erreur 404 logicielle Si la page rendue est vide, presque vide ou que le contenu comporte un message d’erreur, il se peut que votre page fasse référence à de nombreuses ressources qui ne peuvent pas être chargées (images, scripts et autres éléments non textuels), qui peuvent être interprétées en tant que logiciel 404. Les raisons pour lesquelles les ressources ne peuvent pas être chargées incluent les ressources bloquées (bloquées par robots.txt), le fait d’avoir trop de ressources sur une page, diverses erreurs de serveur, un chargement lent ou des ressources très volumineuses. Astuce de chapeau à ce sujet de Kenichi Suzuki sur Twitter. Ce sont les changements repérés au cours des deux derniers jours dans la documentation d’aide de Google. Forum de discussion sur Twitter.

    Tags: ,