XML Sitemap Validator
La plupart du temps, les webmasters et les référenceurs se penchent sur les messages d’erreurs HTTP qui peuvent affecter l’expérience des utilisateurs.
Cependant, les pages qui renvoient à des messages d’erreurs sur votre site peuvent affecter son référencement puisque Google les considère comme des contenus inexistants.
Pour éviter cela, il est primordial de trouver les liens brisés de votre site en utilisant par exemple XML Sitemap Validator.
À travers cette description, nous découvrons comment se servir de cet outil pour détecter les pages qui renvoient aux messages d’erreurs sur votre site.
Qu’est-ce que XML Sitemap Validator ?
XML Sitemap Validator est un outil SEO qui permet de vérifier le sitemap pour détecter les URL cassées. En effet, les crawlers se basent sur les fichiers sitemap XML pour savoir quelles pages doivent être explorées.
Pour ce fait, il est important de disposer de fichiers sitemap bien formés, propres et optimisés pour les moteurs de recherche. Autrement dit, toutes les URL de votre sitemap doivent renvoyer une réponse en-tête de statut 200.
C’est l’intérêt de l’outil XML Sitemap Validator, car il permet de contrôler la présence de liens brisés dans votre sitemap XML. Cet état de choses peut entraîner une perte de confiance venant des moteurs de recherche.
Comme d’autres problèmes de référencement liés au sitemap qu’il peut vous aider à résoudre, on a :
- Balisage XML mal formé : Le balisage du sitemap est cassé et non analysable par les moteurs de recherche ;
- « Sitemap sale » : sitemap XML qui contient des liens vers des URL que les moteurs de recherche ne devraient pas explorer. Il s’agit d’URL qui renvoient des codes d’état non-200 (liens brisés, redirections, erreurs internes) ;
- Les sitemaps de sites Web qui contiennent des liens vers des URL non canoniques qui renvoient le code d’état 200.
Le plus souvent, ces problèmes font que les moteurs de recherche gaspillent des ressources techniques/budgets d’exploration pour explorer des pages non importantes.
À qui s’adresse l’outil XML Sitemap Validator ?
XML Sitemap Validator s’adresse particulièrement aux professionnels de référencements et aux personnes qui disposent un site Web.
Si votre but est de vous protéger des liens briser ainsi que de leur conséquence en matière de référencement et d’expérience utilisateur, cet outil sera certainement un grand atout pour vous.
En plus d’être entièrement gratuit, l’outil est simple à utiliser et vous propose d’exporter les résultats de votre vérificateur dans un format CSV pour les utilisations ultérieures.
Pour l’utiliser, vous devez soumettre le sitemap de votre site à l’outil. Ce qui est intéressant, vous avez la possibilité d’inscrire directement l’URL du sitemap ou de choisir un fichier.
Comment trouver le sitemap de votre site pour soumettre à l’outil XML Sitemap Validator ?
Les sitemaps sont des plans du site et constituent un moyen simple d’informer les moteurs de recherche, en particulier leurs robots d’exploration (ex. Googlebot) des contenus importants de votre site Web.
Ils fournissent également des informations sur les différentes URL d’un site et comprennent également des méta données. Pour trouver votre sitemap, voici comment procéder :
Vérifiez manuellement les emplacements courant du plan Sitemap XML
La méthode la plus courante pour trouver le sitemap d’un site Web consiste à vérifier manuellement quelques emplacements standards.
Il vous suffit d’entrer l’URL de votre site dans le navigateur, puis d’essayer avec quelques variantes différentes comme ceci :
www.mondomaine.com/sitemap.xml
Cet emplacement est le plus populaire, mais si vous ne le retrouvez pas, essayez à nouveau le schéma d’URL suivant :
www.mondomaine.com/sitemap_index.xml
Vérifiez le fichier Robots.txt
Le fichier robots.txt est un fichier spécial que tous les référenceurs connaissent. Il fournit des directives utiles aux araignées des moteurs de recherche. De plus, c’est aussi l’endroit où l’on trouve très souvent un lien vers le plan d’un site Web.
L’idée est que, étant donné que les moteurs de recherche visitent ces fichiers robots.txt, il est cohérent d’y ajouter un lien vers le plan du site. De cette façon, il leur sera plus facile de détecter le plan du site en premier lieu afin de l’explorer le site Web.
Pour trouver ce fichier, il vous suffit d’ajouter /robots.txt à votre nom de domaine dans le navigateur et d’appuyer sur « Entrée ». C’est similaire à l’étape précédente où nous avons ajouté les différentes routes possibles pour le sitemap.
Ainsi, vous obtenez une URL comme ceci :
https://mondomaine.com/robots.txt
Si vous l’avez déjà ouvert, vous verrez presque instantanément le petit bijou que vous cherchez : le fichier sitemap :
Vérifiez Google Search Console
Si vous ne retrouvez toujours votre sitemap, nous allons maintenant le chercher directement dans Google Search Console.
Lorsque vous vous connectez à cet outil, l’étape suivante consiste à vous rendre dans le menu de gauche et choisir Sitemaps comme sur l’image ci-dessous :
Source : seocrawl
Outre l’adresse URL exacte du sitemap, vous trouverez des informations supplémentaires telles que le type de sitemap, la date de soumission, la dernière lecture, le statut et le nombre d’URL qu’il contient.
Source : seocrawl
Dès lors, vous n’avez qu’à soumettre le sitemap à l’outil XML Sitemap Validator afin de détecter les liens brisés. Mais si vous n’êtes pas parvenu à le trouver, nous avons encore quelques astuces pour le trouver.
Utilisez les opérateurs de recherche de Google
Si votre sitemap est soumis à Google, il est certainement déjà indexé par le moteur de recherche. Nous pourrons donc le trouver très facilement en nous servant des opérateurs de recherche.
Pour ce faire, nous utiliserons les opérateurs :
- site: ;
- filetype:xml ;
- inurl:sitemap.
Par exemple, vous pouvez rechercher site:mondomaine.com filetype:xml inurl:sitemap.
N’oubliez pas de remplacer le nom de votre domaine dans l’URL en lieu et place de “mondomaine”.
Utilisez un outil en ligne
Une autre technique pour trouver le sitemap afin de le soumettre à l’outil XML Sitemap Validator consiste à utiliser un outil en ligne comme Site Checker.
Il vous suffit de coller l’URL de votre site Web et de cliquer sur Check et vous obtiendrez alors quelque chose comme ceci :
Copiez alors l’URL et copiez-la dans l’outil de vérification pour obtenir les liens brisés de votre site.
En somme, l’outil XML Sitemap Validator aide les professionnels de référencement et les webmasters à trouver les URL qui renvoient à un message d’erreurs sur leurs sites afin de les corriger.
Ce faisant, ils améliorent la manière dont les moteurs de recherche perçoivent leurs sites et les rendent plus confiants vis-à-vis des utilisateurs.