Comprendre le problème “Découvert – actuellement non indexé”

Si tu vois “Découvert – actuellement non indexé” dans Google Search Console, cela signifie que Google est au courant de l’URL, mais qu’il ne l’a pas encore explorée et indexée.

Cela ne veut pas forcément dire que la page ne sera jamais traitée. Comme indiqué dans leur documentation, Google pourrait y revenir plus tard sans que tu aies besoin de faire des efforts supplémentaires.

Cependant, d’autres facteurs pourraient empêcher Google d’explorer et d’indexer la page, notamment :

– Des problèmes de serveur ou des problèmes techniques sur le site qui restreignent ou empêchent la capacité de Google à explorer.
– Des problèmes liés à la page elle-même, tels que sa qualité.

Demander l’indexation via Google Search Console C’est une solution évidente et dans la plupart des cas, cela résoudra le problème.

Parfois, Google met simplement du temps à explorer de nouvelles adresses URL – cela arrive. Mais d’autres fois, des problèmes sous-jacents sont responsables.

Lorsque vous demandez l’indexation, deux choses peuvent se produire :

  1. L’URL devient “Explorée – actuellement non indexée”
  2. Indexation temporaire

Les deux sont des symptômes de problèmes sous-jacents.

Le deuxième cas se produit parce que demander l’indexation donne parfois à votre URL un “coup de frais” temporaire, ce qui peut amener l’URL au-dessus du seuil de qualité requis et, par conséquent, entraîner une indexation temporaire.

Problèmes de qualité de la page

Ici, le vocabulaire peut être déroutant. On m’a demandé : “Comment Google peut-il déterminer la qualité de la page s’il ne l’a pas encore explorée ?”

C’est une bonne question, et la réponse est qu’il ne peut pas.

Google fait une supposition sur la qualité de la page en se basant sur d’autres pages du domaine. Leurs classifications sont également basées sur les motifs d’URL et l’architecture du site web.

Par conséquent, le déplacement de ces pages de la catégorie “connaissance” à la file d’attente d’exploration peut être moins prioritaire en raison du manque de qualité qu’ils ont constaté sur des pages similaires.

Il est possible que les pages ayant des motifs d’URL similaires ou situées dans des zones similaires de l’architecture du site aient une proposition de faible valeur par rapport à d’autres contenus ciblant les mêmes intentions d’utilisateur et mots-clés.

Les causes possibles comprennent :

– La profondeur du contenu principal.
– La présentation.
– Le niveau de contenu de soutien.
– L’unicité du contenu et des perspectives offertes.
– Ou même des problèmes plus manipulatifs (c’est-à-dire un contenu de faible qualité et généré automatiquement, tourné ou duplicata direct d’un contenu déjà établi).

Travailler sur l’amélioration de la qualité du contenu au sein du groupe de sites et des pages spécifiques peut avoir un impact positif sur le regain d’intérêt de Google pour explorer votre contenu avec un objectif plus important.

Vous pouvez également mettre en “noindex” d’autres pages du site que vous reconnaissez comme n’étant pas de la plus haute qualité pour améliorer le ratio de pages de bonne qualité par rapport aux pages de mauvaise qualité sur le site.

Budget et efficacité d’exploration

Le budget d’exploration est un mécanisme souvent mal compris en SEO.

La plupart des sites web n’ont pas besoin de s’en soucier. En fait, Gary Illyes de Google a affirmé que probablement 90 % des sites web n’ont pas besoin de penser au budget d’exploration. C’est souvent considéré comme un problème pour les sites web d’entreprise.

L’efficacité d’exploration, en revanche, peut affecter des sites web de toutes tailles. S’il est négligé, cela peut entraîner des problèmes dans la façon dont Google explore et traite le site web.

Par exemple, si votre site web :

– Duplique des URL avec des paramètres.
– Résout des URL avec et sans barres obliques à la fin.
– Est disponible en HTTP et HTTPS.
– Propose du contenu à partir de plusieurs sous-domaines (par exemple, https://website.com et https://www.website.com).

Alors vous pourriez avoir des problèmes de duplication qui affectent les suppositions de Google sur la priorité d’exploration en fonction des suppositions plus larges du site.

Vous pourriez épuiser le budget d’exploration de Google avec des URL et des demandes inutiles. Étant donné que Googlebot explore les sites web par portions, cela peut empêcher les ressources de Google de s’étendre suffisamment pour découvrir toutes les nouvelles URL publiées aussi rapidement que vous le souhaiteriez.

Vous voulez explorer régulièrement votre site web et vous assurer que :

– Les pages renvoient à un seul sous-domaine (comme souhaité).
– Les pages renvoient à un seul protocole HTTP (comme souhaité).
– Les URL avec des paramètres sont canonisées vers la racine (comme souhaité).
– Les liens internes n’utilisent pas de redirections inutiles.

Si votre site web utilise des paramètres, tels que des filtres de produits de commerce électronique, vous pouvez limiter l’exploration de ces chemins d’URI en les interdisant dans le fichier robots.txt.

Votre serveur peut également être important dans la façon dont Google alloue le budget pour explorer votre site web.

Si votre serveur est surchargé et répond trop lentement, des problèmes d’exploration peuvent survenir. Dans ce cas, Googlebot ne pourra pas accéder à la page, ce qui empêchera une partie de votre contenu d’être exploré.

Par conséquent, Google essaiera de revenir plus tard pour indexer le site web, mais cela entraînera sans aucun doute un retard dans l’ensemble du processus.

Liens internes

Lorsque vous avez un site web, il est important d’avoir des liens internes d’une page à une autre.

Google accorde généralement moins d’attention aux URL qui n’ont aucun ou pas assez de liens internes – et peut même les exclure de son index.

Vous pouvez vérifier le nombre de liens internes vers les pages à l’aide d’outils d’exploration tels que Screaming Frog et Sitebulb.

Avoir une structure de site web organisée et logique avec des liens internes est la meilleure approche pour optimiser votre site web.

Mais si vous avez des problèmes avec cela, une manière de vous assurer que toutes vos pages internes sont connectées est d’utiliser des plans du site HTML.

Source: Searchengineland

Leave a Reply

Your email address will not be published. Required fields are marked *