Comment corriger les erreurs & exploiter les opportunités d’un rapport de crawl


Vous venez de recevoir votre premier rapport de crawl d’Oseox SENTINEL ?

En fonction de votre site et de votre configuration de SENTINEL, vous obtiendrez plus ou moins d’onglets dans votre rapport de crawl.

Cet article va vous expliquer ce qu’il est possible de faire après avoir reçu votre rapport.

A noter que votre rapport est accessible à la fois en ligne via Google Sheet et via un fichier XLS (si vous téléchargez l’archive zip)

paramètre du crawler oseox sentinel

404

L’onglet 404 contient 3 colonnes

erreur 404 crawler seo sentinel

La colonne « B » (« DEPUIS URL ») indique où il y a un problème à corriger.

Cette colonne (la deuxième donc) vous indique l’URL où il faut intervenir pour ne plus diriger les moteurs de recherche vers des ressources en 404.

Les robots ne doivent voir que des URL en HTTP 200, c’est à dire qu’il ne faut pas faire des liens ou appeler des images, fichiers… qui ne correspondent à aucun contenu.

La première colonne (« URL ») indique la ressource qui est en 404. Vous pouvez vérifier en visitant cette URL afin de constater qu’il n’y a aucun contenu valide sur cette URL.

Il faut donc :

  • Passer sur toutes les URL de la deuxième colonne (B)
  • Trouver où il y a l’URL de la première colonne (A) dans le code/sur la page
  • Modifier l’URL en 404 par une URL valide (HTTP 200) ou alors carrément supprimer toute mention de cette URL

301

L’onglet 301 contient 3 colonnes

erreur 404 crawler seo sentinel

La colonne « B » (DEPUIS URL),  indique où il y a un problème à corriger, c’est à dire l’erreur 301.

Une 301 est une redirection d’une URL vers une autre. L’URL change quand vous essayez d’y accéder et vous redirige vers une autre URL.

Cette deuxième colonne vous indique donc l’URL où il faut intervenir pour ne plus diriger les moteurs de recherche vers des ressources en 301.

Les robots doivent voir idéalement que des URL en HTTP 200, c’est à dire qu’il faut faire des liens ou appeler des images, fichiers… qui ne sont pas des URL qui sont des redirections.

La première colonne (« URL ») indique la ressource qui est en 301. Vous pouvez essayer de visiter cette URL afin de constater qu’elle redirige vers une autre URL. On parle de redirection HTTP 301.

Il faut donc :

  • Passer sur toutes les URL de la deuxième colonne
  • Trouver où il y a l’URL de la première colonne dans le code/sur la page
  • Modifier l’URL en 301 par une URL valide (HTTP 200) ou alors carrément supprimer l’URL qui est redirigée

Parfois, certains liens ou fichiers sont conçus techniquement sur certains sites pour fonctionner ainsi. Il n’y a alors rien à corriger. Cela n’est pas une erreur importante.

302

C’est exactement pareil que l’onglet 301. La nuance est qu’une URL en 302 est théoriquement un redirection temporaire contrairement à la 301 qui est théoriquement permanente.

De nombreux sites (CMS) font des liens par défaut en 302 vers les pages d’administration ou des pages permettant de se connecter.

Vous ne pourrez pas corriger ce type d’erreur car il s’agit du fonctionnement technique du site. Cela n’est pas une erreur importante.

TITLE LONG

La plupart du temps, vous pouvez ignorer cet onglet. Il n’apparait d’ailleurs pas par défaut dans nos rapports de crawl.

Google affiche souvent dans ses pages de résultats le contenu de la balise TITLE. Il s’agit la plupart du temps du texte cliquable du lien.

Google n’affichera pas en entier le contenu de la balise TITLE s’il est trop long.

La véritable limite est en pixel mais afin de rendre les choses plus simple, vous pouvez considérer qu’au delà de 65 caractères, il y a très peu de chance que votre TITLE s’affiche sans être tronqué.

Ainsi si vous voulez que l’utilisateur puisse voir la totalité de cette balise alors il ne faut pas dépasser cette limite.

Dans les options de SENTINEL, vous pouvez changer cette valeur.

Attention, il est très risqué de changer la balise TITLE d’une page qui se positionne en top 10 sur un ou plusieurs mots clés.

TITLE COURT

La balise TITLE est l’un des critères ONpage les plus puissants. Il suffit parfois d’ajouter un mot pour se positionner sur une nouvelle expression contenant ce mot.

Ainsi, lorsqu’une page puissante a une balise TITLE courte, vous passez peut être à coté d’une opportunité de trafic facile à saisir.

SENTINEL considère qu’une balise TITLE courte fait moins de 30 caractères. Dans les options du crawler, vous pouvez changer cette valeur.

L’idée de ce rapport est d’obtenir la liste des URL dont la balise TITLE est courte. Puis d’allonger les balises TITLE avec de nouveaux mots clés. Idéalement entre 30 et 60 caractères.

Attention, il est très risqué de changer la balise TITLE d’une page qui se positionne en top 10 sur un ou plusieurs mots clés.

Il est donc conseillé d’intervenir en priorité sur les pages qui ne se positionnent pas en top 10 par sécurité. A moins de savoir précisément ce que vous faites, bien entendu 🙂

TITLE DUPLICATE

Une balise TITLE dupliquée est un contenu identique que SENTINEL va trouver dans les balises TITLE de 2 URL.

Chaque URL indexable doit avoir un TITLE unique et donc différent des autres URL.

Il faut donc modifier les TITLE afin qu’aucun ne soit identique. Notez bien qu’avoir des balises TITLE différentes n’est pas une fin en soi.

C’est aussi et surtout une opportunité de cibler de nouveaux mots clés !

TITLE VIDE

Un TITLE vide est un catastrophe étant donné l’importance de ce critère.

Optimisez ces URL en priorité en ajoutant des expressions clés pertinentes.

Chaque balise TITLE doit être unique.

Meta DESCRIPTION LONGUE

La meta Description  est souvent le petit texte qui s’affiche sous le lien cliquable dans les pages de résultats de Google.

Google n’affichera pas en entier le contenu de la balise meta Description s’il est trop long.

La véritable limite est en pixel mais afin de rendre les choses plus simple, vous pouvez considérer qu’au delà de 155 caractères, il y a très peu de chance que votre meta Description s’affiche sans être tronquée.

Ainsi si vous voulez que l’utilisateur puisse voir la totalité de cette balise alors il ne faut pas dépasser cette limite.

Dans les options de SENTINEL, vous pouvez changer cette valeur.

La meta Description doit inciter au clic. L’objectif est d’augmenter votre CTR (taux de clic) en donnant l’envie irrésistible aux utilisateurs de cliquer et donc de visiter votre site.

Le seul moyen de consulter en entier le contenu d’une meta Description trop longue est de consulter le code HTML d’une page. Autant dire que peu d’utilisateur le font : – )

Reformulez vos meta Description trop longues afin de ne pas dépasser 155 caractères (espace compris)

La meta Description n’a pas d’impact direct sur le positionnement des pages (ranking). Il est donc peu risqué de modifier cette balise.

Meta DESCRIPTION COURTE

La balise meta Description doit donner à l’internaute de visiter votre site lorsqu’il lit le contenu de cette balise.

Chaque argument supplémentaire pour permettre de générer plus de clics. Par exemple : « Produit en stock » ou « Livraison rapide ».

SENTINEL considère qu’une balise meta Description courte fait moins de 120 caractères. Dans les options du crawler, vous pouvez changer cette valeur.

Pourquoi ? Car en dessous de 120 caractères, le descriptif de votre URL va la plupart du temps occuper qu’une seule ligne sur la page de résultats de Google. alors qu’il est possible d’en occuper 2 avant d’être tronqué.

Pourquoi laisser plus de place à vos compétiteurs ?

L’idée de ce rapport est d’obtenir la liste des URL dont la balise meta Description est courte. Puis d’allonger ces balises afin d’aboutir à au moins 120 caractères et ainsi occuper 2 lignes.

Idéalement, une meta Description doit faire entre 120 et 155 caractères.

La meta Description n’a pas d’impact direct sur le positionnement des pages (ranking). Il est donc peu risqué de modifier cette balise.

Notez que la véritable taille se calcule en pixel et que tous les SEO ne sont pas tous d’accord sur les limites en nombre de caractères.

Les options de SENTINEL vous permette de choisir ces limites en 1 clic.

Meta DESCRIPTION DUPLICATE

Si vous décrivez 2 objets exactement de la même manière c’est certainement que ces 2 objets sont identiques non ?

C’est la même chose avec les URL.

Google n’aimant pas généralement le duplicate, il est recommandé de personnaliser le contenu de chacune de vos balises meta Description.

A noter qu’il suffit d’un seul caractère différent pour considérer qu’une balise meta Description n’est pas dupliquée.

Meta DESCRIPTION VIDE

La meta Description ne joue pas un rôle direct sur le positionnement.

Ainsi, certains décident de ne pas renseigner cette balise. Dans ce cas, Google va lui même proposer un descriptif dans ces pages de résultats.

Il ne s’agit pas d’une grosse erreur mais on peut penser qu’une optimisation manuelle avec une belle touche de marketing pourrait permettre de proposer un contenu donnant à l’internaute de cliquer davantage sur votre URL.

Rédigez des meta Description entre 120 et 155 caractères en pensant marketing et incentive plutôt qu’en SEO cherchant à placer des mots clés.

H1 DUPLICATE

Cet onglet liste les balises H1 qui sont identiques sur plusieurs URL.

Le contenu de la balise H1 étant le titre de la plus haute importance d’une page, généralement il n’est pas recommandé d’avoir des balises H1 identiques.

Si vous avez 2 balises H1 identiques, changez l’une des 2 en l’optimisant avec des mots clés appropriés.

H1 VIDE

Le contenu le plus puissant visible sur une page est à encadrer d’une balise H1.

Se passer des balises H1 est un peu embêtant. Cet onglet vous permettra d’identifier rapidement les pages sans H1.

Rédigez des balises H1 comportant les mots clés ciblés par la page.

URL CANONICALISEE

Une URL dite canonicalisée est une URL dont la balise meta canonical ou l’entête HTTP canonical ne correspond pas à l’URL crawlée.

Cela permet d’indiquer aux moteurs de ne pas indexer cette URL et de lui indiquer la véritable URL à indexer à la placer.

Grossièrement, c’est traité comme une redirection 301 mais sans rediriger l’utilisateur.

Une URL canonicalisée n’est généralement pas une erreur. Toutefois, une URL canonicalisé epar erreur est une erreur critique à corriger… car cela signifie interdire à l’indexation une URL qui pourrait vous apporter du trafic !

Vérifiez que les URL canonicalisées le sont volontairement.

URL NON INDEXABLE

Cet onglet liste toutes les URL non indexable et vous indique pourquoi ces URL ne sont pas indexables (ou crawlable d’ailleurs…).

Il n’y a rien de pire qu’une URL non indexable par erreur.

Consultez attentivement cet onglet afin de vous assurer que toutes les URL listées sont volontairement non indexables.

AUTRES ONGLETS

Notre crawler SEO SENTINEL propose régulièrement de nouveaux rapports et donc de nouveaux onglets.

Il faut consulter les options, l’interface en ligne, et l’archive compressée des données si vous voulez connaitre l’intégralité des rapports disponibles.