Une balise canonique (rel = canonical) est un morceau de code HTML qui aide Google à classer une page spécifique à partir d’un ensemble de pages similaires ou dupliquées.
Généralement, tous les sites Web, notamment les sites de commerce en ligne contiennent des contenus dupliqués.
Pourtant, c’est une pratique sanctionnée par Google qui pourrait affecter la visibilité et le classement d’un site Web dans les résultats de recherche.
Heureusement, il y a un moyen très efficace pour résoudre définitivement ce problème : Il s’agit de l’utilisation des URL canoniques.
Cependant :
- Comment les utiliser efficacement ?
- Dans quel contexte peut-on les utiliser ?
- Comment vérifier leur état sur un blog ou un site Web ?
On en parle dans ce guide !
Chapitre 1 : Canonical URL : C’est quoi et quelle est son importance dans le référencement d’un site Web ?
Dans ce chapitre, je vais apporter plus d’explication sur l’URL canonique et énumérer les facteurs qui justifient son importance dans le référencement d’un site Web.
Pour cela, les points suivants seront abordés :
- Balise canonique : Ce que vous devez savoir
- Comment les moteurs de recherche gèrent les pages en double ou similaires ?
- Pourquoi les balises canoniques sont-elles importantes dans l’optimisation du référencement ?
- Qu’est ce qui différencie un rel canonical d’une redirection 301 ?
1.1. Qu’est ce qu’une balise canonique ?
La balise rel = canonical, également appelé « lien canonique », est un élément HTML qui aide les webmasters à éviter les problèmes de contenu dupliqué : L’un des fléaux que l’on retrouve souvent sur les sites Web, notamment les sites d’e-commerce.
Lorsqu’un tel type de contenu est présent sur un site Web, ce site fait face au risque de cannibalisation. C’est-à-dire que le moteur de recherche peut parfois indexer et classer la mauvaise version d’une page dans les résultats de recherche.
Pour cela, cette balise canonique a été créée par l’ensemble des principaux moteurs de recherche tels que Google, Microsoft puis Yahoo afin de résoudre rapidement et facilement les problèmes liés aux duplications de contenus.
1.1.1. Synonymes du terme URL canonique
Bien que leur signification diffère, les termes suivants sont souvent utilisés pour désigner l’URL canonique :
- Balise canonique ;
- Lien canonique ;
- rel canonique ;
- Canonical URL ;
- Balise Canonical ;
- rel= »canonical ».
Ils sont tous utilisés pour faire référence à l’élément HTML canonique.
1.1.2. À quoi ressemble une balise rel = canonical ?
La syntaxe des balises canoniques qu’on retrouve dans la section “head” d’une page Web est la suivante :
Le code a deux composants importants :
- link rel = « canonical »
rel signifie relation. Par conséquent, la relation du lien se définit comme canonique.
- href = « URL »
href spécifie le point d’arrivée du lien. C’est là où se place l’URL que Google doit indexer et classer. Ceci est également appelé l’URL canonique.
Découvrez dans la section suivante, la manière de gestion des contenus dupliqués par les moteurs de recherche.
1.2. Comment les pages en double ou similaires sont gérées par les moteurs de recherche ?
Lorsque la plupart des moteurs de recherche rencontrent deux pages ou plus avec un contenu très similaire, ils se retrouvent dans la confusion totale. Ainsi, ils indexent une seule page et abandonnent les autres.
L’URL de page dupliquée qu’ils décident de choisir est souvent basée sur un certain nombre de facteurs, notamment :
- Celle qui a été exploré en premier ;
- Celle qui dispose du plus grand nombre de liens internes et externes.
Le contenu dupliqué n’est pas seulement mauvais pour le référencement, mais il peut également nuire aux taux de conversion.
Il y aura souvent des situations où vous aurez un certain nombre de pages qui seront vitales pour l’infrastructure de votre site Web, mais qui contiennent des contenus similaires ou identiques.
Plutôt que de risquer une pénalité pour le contenu dupliqué, vous pouvez ajouter une balise rel = canonical sur la page qui vous semble être la source d’information préférée. Cela permettra aux moteurs de recherche de se retrouver.
Vous trouverez plus de détails dans l’exemple ci-dessous.
1.2.1. Cas pratique : Exemple de duplication de page produit
Prenons un exemple de site Web qui vend des jouets (camion) et qui contient trois pages produits différentes pour le même contenu.
- /toys/trucks/red
- /toys/sale/red
- /toys/under-10/red
Toutes les trois pages de produits ont exactement le même contenu avec seulement de petits changements, comme le lien de fil d’Ariane supérieur.
Avec le même produit sur trois différentes pages, la présence d’une balise canonique est indispensable afin de spécifier la page originale :
En utilisant la balise canonique, je signale aux moteurs de recherche que la version principale de page produit se trouve à l’adresse http://www.example.com/toys/trucks/red, tandis que les deux autres URL ne sont que de simples copies.
Ainsi, la balise canonique donnera :
<link rel = « canonical » href = « http://www.example.com/toys/trucks/red » />
Cependant, il est préférable de choisir comme page principale, la page produit permanente qui ne fait pas partie des catégories suivantes :
- Ventes (les ventes peuvent prendre fin un jour) ;
- Marchandises de moins de 10 € (le prix peut dépasser 10 € du jour au lendemain).
Passons aux avantages que cette balise apporte dans le référencement d’un site Web.
1.3. Balise Canonical : Pourquoi est-elle importante dans l’optimisation du référencement ?
Que vous soyez une agence ou un professionnel de référencement, la canonisation devrait faire partie de votre liste d’activités pour l’optimisation du SEO On-Page.
Voici une liste des principaux points qui font que les balises canoniques sont si importantes dans le référencement d’un site Web.
1.3.1. Économise le budget d’exploration
En spécifiant une balise canonique, vous faites gagner un temps précieux au robot d’exploration qui explore votre site Web.
Cela lui permet d’atteindre plus facilement d’autres URL et contenus importants sur votre site Web, et donc d’économiser votre budget d’exploration.
1.3.2. Gestion appropriée du Jus de Lien
L’utilisation de balises canoniques garantit que le jus de lien (ou link juice en anglais) est transmis à la version correcte de la page. Normalement, si vous avez différentes pages avec un contenu similaire, Google distribue uniformément le jus de lien vers toutes ces pages.
Mais, en spécifiant une balise canonique, vous indiquez à Google la page à laquelle vous souhaitez donner de l’importance et qui doit être classée dans les SERPs. Google transmet ensuite tout le jus de lien à la page importante, ignorant toutes les pages en double.
Cela garantit une gestion appropriée du jus de lien sur votre site Web.
1.3.3. Assure le classement des URL pertinentes pour les requêtes
Les balises canoniques permettent de garantir le classement des URL pertinentes pour les mots clés recherchés. Le problème ici, c’est qu’il est possible que deux URL de votre site Web se fassent concurrence pour le même mot-clé sur les SERPs.
Mais, en utilisant rel = canonical, vous pouvez éviter cette situation. Assurez-vous de spécifier l’URL canonique appropriée que vous souhaitez que Google indexe et classe dans le code HTML de la balise canonique.
1.3.4. Les balises canoniques facilitent la tâche de Google sur les grands sites
Lorsque vous avez un gigantesque site Web avec de nombreuses URL, l’exploration et l’indexation de toutes ces URL peuvent devenir ennuyeuses pour Google. Cela se traduit par la confusion des pages dupliquées et d’autres variantes auxquelles il fait face.
En effet, cela peut entraîner d’énormes conséquences pour votre site Web. Ainsi, pour faciliter le travail de Google, vous devez spécifier des balises canoniques appropriées sur toutes les pages.
Cela garantit l’exploration et l’indexation des bonnes pages par Google.
1.3.5. Empêche le contenu dupliqué en interne et en externe
Avec l’URL canonique, vous pouvez empêcher le contenu dupliqué non seulement en interne, mais aussi en externe.
Le contenu dupliqué interne se produit uniquement sur votre site Web.
Celui d’externe se produit lorsqu’il existe des pages en double ou très similaires sur deux différents sites Web.
Avant de clôturer ce chapitre, je dois parler de la différence entre l’URL canonique et la redirection 301 afin d’éclairer les doutes et les confusions.
1.4. Quelle est la différence entre un rel canonical et une redirection 301 ?
La principale différence réside dans l’impact sur la navigation de l’utilisateur.
Les redirections 301 affectent directement l’expérience utilisateur, car celui-ci est redirigé vers une URL différente de celle de départ.
Le canonique, en revanche, est une directive qui n’affecte que le robot d’exploration des moteurs de recherche, car l’utilisateur n’est pas redirigé et ne perçoit donc pas son existence.
Du point de vue du référencement, le rel canonical et la redirection 301 sont des directives qui indiquent aux moteurs de recherche la version préférée d’une page Web, ou plutôt celle qui doit être indexée afin de limiter les analyses multiples.
Maintenant que vous savez ce qu’est une URL canonique et son importance en SEO, parlons des moments idéaux pour son utilisation et de son implémentation sur un site Web. C’est ce que nous verrons dans le deuxième chapitre.
Chapitre 2 : Balise canonical – Dans quel contexte l’utiliser et comment l’implémenter sur un site Web ?
Ce deuxième chapitre aura pour but :
- De décortiquer les circonstances dans lesquelles l’URL canonique doit être utilisée ;
- Et de montrer les techniques pour implémenter facilement et correctement les URL canoniques sur un site Web.
2.1. Dans quel contexte utiliser une URL canonique ?
Les occasions dans lesquelles les balises canoniques doivent être utilisées sont nombreuses.
Voici quelques-unes indispensables :
2.1.1. Lorsque vous devez auto-référencer une page
Même si vous n’avez qu’une seule version d’une page, il est recommandé de la spécifier comme sa propre URL canonique. Ce dernier est connu sous le nom d’URL canonique auto-référentielle.
En fait, le webmaster de Google John Mueller a confirmé que les URL canoniques auto-référencées pourraient aider votre page à bien fonctionner dans les résultats de recherche.
<< Je recommande ce type de normalisation d’auto-référence, car elle nous indique la page que vous souhaitez indexer ou l’URL à utiliser lors de l’indexation. >>
Il est vrai que cela se fait automatiquement sur la plupart des CMS, mais il est prudent de savoir le faire manuellement. Cela garantit la redirection de tous les jus de lien vers l’URL, quelles que soient les modifications du programme.
2.1.2. Lorsque vous syndiquez votre contenu
Il arrive parfois que certains publient des copies exactes de leur contenu sur d’autres sites Web. On appelle cela : Syndication de contenu.
Si vous syndiquez un contenu sur des sites Web tiers, il est important de spécifier la version originale avec une balise canonique inter-domaine.
Cette dernière vous permet de publier vos contenus sur d’autres domaines sans aucun problème de duplication.
En fait, Google peut toujours choisir d’afficher le contenu syndiqué dans les résultats de recherche, mais cette balise canonique inter-domaine aidera à identifier le lien d’origine et à réduire le risque que le contenu syndiqué surclasse l’original.
Conseil : Vous pouvez demander aux sites qui utilisent votre contenu syndiqué d’insérer la balise Meta noindex. Cela empêchera les moteurs de recherche d’indexer le contenu syndiqué présent sur leur site.
2.1.3. Lorsque vous exécutez un test A / B sur vos pages Web
Les tests A / B exécutent un examen en créant plusieurs versions d’une page afin de voir comment les utilisateurs interagissent avec chacune de ces pages.
Chaque page a ses propres variations. Parmi ces dernières, nous avons de légers changements dans les couleurs de divers boutons ou d’autres changements importants comme le contenu de la page.
Dans de tels cas, Google peut explorer toutes les pages et se retrouver dans la confusion. Pour cela, utilisez l’attribut de lien rel = « canonical » sur toutes vos URL secondaires afin d’indiquer l’URL d’origine.
Cette URL canonique aidera les moteurs de recherche à identifier votre version préférée.
2.1.4. Lorsque vous avez différentes variantes de la même page
Lorsque les pages sont légèrement différentes, on parle de doublons (ou quasi-doublons). J’en avais déjà parlé, mais je reviens là-dessus dans un autre contexte.
Ceci est courant sur les sites Web de commerce en ligne. Disons que vous vendez des ceintures Gucci et avez une ceinture rouge disponible en deux tailles différentes : 34 et 36.
Lors de la sélection des différentes tailles, l’URL change. Cependant, le contenu reste pratiquement le même.
Voici à quoi ressembleront les URL :
Ceinture rouge Gucci : exemple.com/belts/gucci/red/
Ceinture rouge Gucci taille 34 : exemple.com/ceinture/gucci/rouge-34/
Ceinture rouge Gucci taille 36 : exemple.com/ceinture/gucci/rouge-36/
Le contenu est semblable dans les trois URL. Il est conseillé de définir une URL canonique (pointant vers example.com/belts/gucci/red/) pour les deux autres URL avec le même contenu.
En fait, la normalisation des URL est une pratique de référencement courante pour les sites Web de commerce électronique, car elle aide les moteurs de recherche à indexer les pages principales.
2.1.5. Lorsque deux contenus différents ont la même intention de recherche
Laissez-moi vous aider à comprendre cela avec un exemple.
On suppose que vous avez sur votre blog un article qui parle de : Meilleures pratiques SEO en 2015.
Ensuite, un autre sur le même sujet qui parle de : Meilleures pratiques SEO en 2020.
Même si les deux contenus sont totalement uniques, votre souhait serait toujours de voir vos utilisateurs consulter la version mise à jour.
Dans un tel scénario, vous pouvez utiliser une balise canonique sur l’ancien article de blog (de 2015) qui redirigera les bots vers le nouveau (de 2020).
2.1.6. Lorsque vous avez des pages de bureau et mobiles séparées
Lorsque vous créez des pages différentes pour mobile et ordinateur avec le même contenu, n’oubliez pas d’utiliser les URL canoniques et les URL alternatives (une seconde URL).
Elles aident à transmettre la relation entre ces pages aux moteurs de recherche. Une URL alternative permet à Googlebot de trouver l’emplacement des pages mobiles de votre site Web.
Vous savez maintenant quand utiliser une balise rel canonical. Voyons maintenant comment l’implémenter de manière correcte sur votre site Web !
2.2. Balise rel canonical : Comment l’implémenter correctement sur votre site Web ?
Il existe cinq façons de spécifier des URL canoniques, appelées signaux de canonisation.
2.2.1. HTML rel = balise « canonique »
C’est le moyen le plus évident et le plus simple de spécifier une URL canonique. Ajoutez-le simplement à la section <head> de la page choisie :
<head>
</head>
2.2.2. En-tête HTTP
Dans certains documents, à l’image des fichiers PDF, il n’y a aucune possibilité de paramétrer le rel canonical dans l’en-tête de page, puisqu’il n’y a pas de section <head>. Dans ces cas, vous devez utiliser l’en-tête HTTP pour placer le fichier canonique.
2.2.3. Plan de site (sitemap en anglais)
Les URL canoniques peuvent être intégrées dans le sitemap.
Cependant, les pages non canoniques ne doivent pas être répertoriées sur le plan de site, car les moteurs de recherche considèrent toutes les pages incluses dans ce plan de site comme des suggestions canoniques.
2.2.4. La redirection 301
Comme vous le savez déjà, l’utilisation de la redirection 301 (ou redirection permanente) est un excellent moyen de détourner le trafic d’une URL avec un contenu dupliqué ou similaire vers une URL canonique.
2.2.5. Configuration avec Yoast SEO
Avec ce Plugin WordPress, vous avez la possibilité de retoucher l’URL canonique de plusieurs pages.
Notez que le plugin Yoast SEO a l’habitude de configurer automatiquement les balises canoniques auto-référencées.
Maintenant que vous connaissez les circonstances idéales de l’utilisation des liens canoniques et comment les définir sur votre site, vous devez mettre en place certaines bonnes pratiques et éviter formellement certaines erreurs. C’est ce qu’on verra dans le chapitre qui suit.
Chapitre 3 : URL canonical : Bonnes pratiques et erreurs courantes
Dans ce chapitre, il sera question :
- Des meilleures pratiques de canonisation d’URL ;
- Et des mauvaises pratiques de canonisation d’URL.
3.1. Quelles sont les meilleures pratiques pour la canonisation de l’URL ?
L’URL canonique est un élément très puissant dans la boîte à outils d’un webmaster.
Il est essentiel de respecter les meilleures pratiques ci-dessous lorsque vous travaillez avec des URL canoniques afin d’éviter les problèmes d’indexation.
Voici huit points importants à prendre en compte lors de la canonisation d’une URL.
3.1.1. Utilisation d’URL absolues
Vous ne devez laisser aucune place à la confusion quant aux pages que les robots des moteurs de recherche doivent indexer.
Il est conseillé d’utiliser l’URL absolue (URL complète) qui inclut :
- Le protocole ;
- Le domaine ;
- Et le sous-domaine.
En fait, John Mueller de Google affirme la même chose :
Ça devrait ressembler à ça :
Et non ça :
En effet, certains serveurs Web sont par défaut mal configurés, ce qui peut rendre chaque page de votre site Web accessible à travers tous les domaines et sous-domaines.
Ce phénomène provoque une énorme quantité de contenu dupliqué, que vous devez éviter à tout prix.
Cependant, le fait d’avoir des URL absolues en tant qu’URL canoniques empêche ce type de problème de contenu dupliqué.
3.1.2. Placement du rel canonical dans la section <head>
Comme démontré plus haut déjà, je précise à nouveau que l’URL canonique doit toujours être placée dans la section <head> de votre page. Il s’agit de l’une des meilleures pratiques de canonisation.
Si l’URL canonique n’est pas placée dans la section <head>, les moteurs de recherche ne pourront pas la trouver et la traiter.
3.1.3. Référencez uniquement les pages indexables
L’URL canonique doit toujours référencer une page indexable. J’insiste sur ce point, car les moteurs de recherche peuvent être confus lorsque l’URL canonique fait référence à une page qui est redirigée 301.
3.1.4. Incluez uniquement la version préférée dans le plan de site XML
Je reviens sur ce terme, car il fait partie des pratiques de canonisation les plus importantes.
Toutes les pages que vous incluez dans votre plan de site XML sont considérées comme canoniques. En fonction de la similitude du contenu, Google décide si les pages sont dupliquées ou non.
Par conséquent, si vous avez plusieurs URL pour une page, vous ne devez spécifier que l’URL préférée de cette page dans le plan du site.
3.1.5. Utilisation d’une balise canonique unique par page
Il ne doit toujours y avoir qu’une seule URL canonique sur chaque page. Si plus d’une URL canonique est définie, les moteurs de recherche peuvent ne pas se retrouver.
Google a déclaré qu’il choisirait simplement l’une des URL canoniques et ignorerait les autres lorsqu’il rencontrait plusieurs URL canoniques sur une page.
Bien que nous ne sachions pas comment Bing et Yahoo gèrent plusieurs URL canoniques par page, il est recommandé d’utiliser une seule URL canonique par page.
3.1.6. Utilisation de la bonne version du domaine (HTTPS vs HTTP)
Dans le cas où vous êtes passé à SSL, vous devez vous assurer de ne pas déclarer d’URL non SSL (par exemple HTTP) comme balise canonique. Sinon, cela pourrait semer la confusion et provoquer des situations inattendues.
Ainsi, si vous êtes sur un domaine sécurisé, vous devez vous assurer d’utiliser la prochaine version de l’URL :
Au lieu de:
Si vous mélangez https et http, cela prête à confusion.
3.1.7. Utilisation d’URL en minuscules
Google considère les URLs comme sensibles à la casse. C’est-à-dire qu’il traite les URL majuscules et minuscules différemment.
Pour éviter toute confusion, vous devez vous en tenir à une seule version. Cependant, l’URL en minuscules est recommandée, car plusieurs personnes ont généralement tendance à créer un lien vers cette version plus traditionnelle.
3.1.8. Utilisation de balises canoniques auto-référencées
J’avais déjà parlé de cela dans la section qui parle de contexte d’utilisation d’URL canonique, mais j’appuie à nouveau car il fait partie des pratiques indispensables de canonisation.
Bien que les balises canoniques auto-référencées ne soient pas obligatoires, leur utilisation est recommandée.
Par exemple, si l’URL était :
Ainsi, une URL canonique auto-référencée serait :
À présent, passons aux erreurs courantes qui sont pratiquement l’inverse des bonnes pratiques de canonisations.
3.2. Erreurs courantes ou mauvaises pratiques à éviter lors de l’utilisation de balises canoniques
Il est possible que vous commettiez certaines erreurs lorsque vous commencez avec les balises canoniques.
Au début, elles peuvent sembler mineures, mais le risque pour la chute de votre référencement est énorme.
Pour cela, j’ai établi ici une liste d’erreurs qui se produisent couramment lors de l’utilisation des balises canoniques.
On commence !
3.2.1. Ne pas comprendre que les balises canoniques existent dans un seul but
Une grande partie des problèmes rencontrés par les débutants surviennent lorsqu’ils oublient un détail important : La stratégie ne sert qu’à éviter le contenu dupliqué et rien de plus !
Dans cet esprit, évitez d’utiliser la balise canonique à des fins autres que le dépannage du contenu dupliqué, car les chances de faire face à de nouveaux problèmes sont très élevées.
3.2.2. Appliquer rel = canonical aux mauvais emplacements
Pour que la technique fonctionne, “rel = canonical” doit être placé dans la section <head>. Sinon, si le code est entré dans la section <body>, par exemple, les moteurs de recherche ignorent simplement la référence.
En plus du non-fonctionnement de la technique, cela peut compromettre la structure HTML de la page.
3.2.3. URL canonisées bloquées dans le fichier robots.txt
Lorsque les URLs canonisées sont bloquées dans le fichier robots.txt, le robot du moteur de recherche ne les explorera pas. Ainsi, les balises canoniques présentes sur ces pages ne seront pas visibles pour le bot du moteur de recherche.
Ce type d’erreur peut nuire à votre référencement, car le jus de lien de ces pages ne sera pas transmis à la page canonique.
Pas conséquent, ne bloquez pas vos pages canonisées dans le fichier robots.txt.
3.2.4. Balise Noindex présente sur les pages canonisées
Ne mélangez jamais ‘noindex’ avec rel = « canonical », car ce sont deux ordres totalement différents.
En mettant une balise noindex sur vos pages canonisées, vous empêchez Google de les indexer. C’est une mauvaise pratique lors de l’utilisation des balises canoniques.
Nous savons que la canonisation est mise en œuvre lorsqu’une page spécifique parmi plusieurs est classée dans le SERP.
Par conséquent, il est recommandé de ne pas utiliser à la fois les balises noindex et canoniques.
3.2.5. Canonisation de toutes les pages de la série paginée à la première page
La pagination décompose votre page principale en un ensemble de pages. De nombreux sites Web de commerce électronique mettent en œuvre la pagination sur leurs pages de catégorie. Voici un exemple :
Une erreur courante que font les professionnels du référencement est qu’ils canonisent toutes les pages (page2, page3, page4, etc.) sur la page principale (page 1). Les pages 2, 3 et 4 ne sont pas identiques avec la page 1, donc le “rel = canonical” dans ce cas est incorrect.
Il est également recommandé d’utiliser les balises « rel = next » et « rel = prev » pour vos pages paginées. Cela permettra aux moteurs de recherche de comprendre facilement le bon ordre des pages.
3.2.6. Avoir de nombreuses balises rel = canonical
On rencontre ce problème majeur lorsque les pages incluent plusieurs liens rel = canonical vers différentes URL. Cela se produit généralement lorsque les plugins SEO insèrent un lien rel = canonical par défaut.
Auparavant, Google avait déclaré qu’en cas de déclarations multiples de la balise canonique, tous les indices rel = canonical seront ignorés.
Cependant, dans un tweet récent de John Mueller (webmaster de Google), il a déclaré le contraire.
3.2.7. Les balises canoniques pointent vers des pages 4XX ou 5XX
Cette erreur se produit lorsqu’une balise canonique redirige vers une page de codes d’état 4XX ou 5XX (page non valide).
Parfois, il peut arriver que certaines pages de votre site Web soient supprimées pour diverses raisons. Dans ce cas, assurez-vous de supprimer les balises canoniques sur toutes les pages qui renvoient à ces pages 4XX ou 5XX.
En fait, les moteurs de recherche n’indexent pas les pages erronées (4XX ou 5XX) car, elles sont inaccessibles. Ils ignorent donc toute balise canonique pointant vers ces pages et finissent par indexer la mauvaise version (non canonique) de celles-ci.
La meilleure façon de résoudre ce problème est de remplacer toutes les mauvaises URL canoniques (4XX et 5XX) par des URL valides.
3.2.8. Pages dupliquées sans indication de la version canonique
Lorsqu’une ou plusieurs pages dupliquées ou semblables n’ont pas de version canonique, les moteurs de recherche choisissent l’URL convenable et l’affichent dans les résultats de recherche.
De cette façon, ça peut ne pas être la page que vous souhaitez indexer.
3.2.9. URL non canonique dans hreflang
Ce problème se produit lorsque la balise hreflang de la page contient des URL non canoniques. Si cette balise est implémentée sur votre site Web, assurez-vous d’ajouter l’URL canonique correcte dans le code hreflang.
Sinon, les moteurs de recherche ne sauront pas quelles pages prendre en compte pour le classement. Par conséquent, si vous rencontrez des URL non canoniques dans hreflang, veuillez les remplacer immédiatement par les URL canoniques appropriées.
3.2.10. L’indication des URLs canonique en chaîne
On parle de cette erreur lorsqu’une ou plusieurs pages spécifient une URL canonique qui est également la version principale d’une autre page.
Cela provoque une « chaîne canonique » où la page A définit la page B (comme principale), et la page B définit la page C (comme principale).
Ces chaînes canoniques confondent et induisent en erreur les moteurs de recherche, ce qui pourrait les amener à mal interpréter ou à ignorer la principale page canonique.
Pour résoudre ce problème, il suffit de remplacer l’URL canonique de la page A qui spécifie la page B par une URL directe vers la page C.
3.2.11. Boucle d’URL Canonique
Cette erreur apparaît lorsque l’URL A défini la page B comme version canonique, mais que la page B refuse et redirige vers l’URL A.
3.2.12. L’URL Open Graph ne correspond pas à la norme canonique
Il s’agit de la non-concordance entre l’URL canonique spécifiée et l’URL Open Graph sur une ou plusieurs pages. Pour résoudre ce problème, l’URL Open Graph doit être remplacée sur les pages concernées par le canonique.
De plus, assurez-vous que les deux URL soient :
- Identiques ;
- Absolues ;
- Et utilisent le protocole http: // ou https: //.
3.2.13. Problèmes HTTP et HTTPS
J’insiste sur cette erreur parce qu’elle est très courante. Souvent, lorsque certains propriétaires de site passent de HTTP à HTTPS, ils pensent rarement à la correction des balises canoniques.
Bien que votre site Web soit désormais sécurisé (HTTPS), la balise canonique indique à Google que la version HTTP reste toujours la préférée. Et avoir une version HTTP d’une page, puis spécifier la version HTTPS comme canonique est illogique.
3.2.14. Les pages non canoniques génèrent du trafic naturel
Une autre erreur majeure est lorsqu’une ou plusieurs pages qui ne sont pas canonisées montent dans les résultats de recherche et bénéficient de trafic naturel (ce qui est anormal).
Cet incident peut être causé par :
- Une mauvaise configuration des balises canoniques ;
- Ignorance de la page canonisée par le moteur de recherche.
3.2.15. Des URL non canoniques dans le plan du site
J’en avais déjà parlé dans les meilleures pratiques, mais il s’agit de l’inverse ici. Google recommande d’exclure les URL non canoniques du plan du site (sitemap en anglais), car cela peut induire en erreur les moteurs de recherche quant aux pages à indexer et à classer.
Pour cela, assurez-vous que la version canonique de la page soit la seule incluse dans le plan du site. Cela garantira le classement de cette page dans les SERPs de Google.
Maintenant que vous avez conscience de ce qui est bon et de ce qui est mauvais dans l’utilisation des balises canoniques, vous devez passer à la vérification sur votre site Web pour voir si vous avez déjà commis l’une des erreurs énumérées ci-dessus. Ceci sera discuté dans le prochain chapitre.
Chapitre 4 : Vérification des balises canoniques et les limites qu’elles affichent
Comme convenu, voici les deux points que je vais toucher dans ce chapitre :
- Contrôler vos URLs canoniques manuellement et automatiquement ;
- Deux limites qu’affiche la balise rel canonical.
4.1. Comment auditer les balises et problèmes canoniques sur un site Web ?
Commençons par la vérification manuelle !
4.1.1. Contrôles manuels
Si vous avez un petit site Web, vous pouvez vérifier manuellement la conformité des balises canoniques sur vos pages. Pour le faire, suivez les étapes suivantes :
- Allez sur la page sur laquelle vous voulez effectuer le contrôle ;
- Je prends cette page de Twaino comme exemple ;
- Appuyez sur Ctrl + U afin que le code source de la page s’affiche ;
- Rechercher « canonical » (Ctrl + F pour afficher la barre de recherche) ;
- Vous trouverez le code de balise canonique dans la section <head> ;
- Enfin, assurez-vous que la balise canonique est correctement implémentée.
Passons maintenant à la vérification automatique qui est plus facile et rapide.
4.1.2. Utilisation des outils
La vérification manuelle peut devenir fastidieuse si vous avez un grand nombre de pages sur votre site Web. Pour cela, vous pouvez utiliser divers outils d’exploration pour vérifier l’implémentation des balises canoniques.
Ahrefs possède son propre outil d’audit de site qui vous donne toutes les informations qu’il faut sur les balises canoniques de votre site Web.
Vous pouvez également utiliser Screaming Frog pour auditer les balises canoniques.
Il est beaucoup plus détaillé et ingénieux. Ouvrez simplement le logiciel Screaming Frog Spider et assurez-vous de cocher « canoniques » dans les paramètres d’exploration. Une fois l’exploration terminée, vous verrez afficher tous les détails sous les onglets Canonicals.
Je ne peux pas finir sans parler de l’outil d’inspection d’URL de Google Search Console.
C’est une excellente plateforme pour l’audition des URLs canoniques sur un site Web.
Bien que les balises canoniques présentent d’énormes avantages, elles sont également limitées sur certains points. C’est ce qu’on va voir dans la section suivante.
4.2. Quelles sont les limites de l’URL canonique ?
Bien que les URL canoniques soient d’excellents éléments, elles présentent également certaines limites.
4.2.1. Consolidation partielle de l’autorité de lien
Prenons un exemple : La page A contient des backlinks vraiment qualitatifs et fait référence à la page B comme canonique. Sachez qu’il y a de fortes chances que les moteurs de recherche accordent plus de crédit à la page B au détriment de la page A.
Normalement, chaque lien transmet une certaine autorité, appelée autorité de lien. L’autorité de lien qui est transmise à la page A via les puissants backlinks n’est que partiellement transmise à la page B.
Je précise partiellement parce qu’il s’agit d’un point flou sur lequel les moteurs de recherche n’ont pas été très clairs. Il n’y a aucune recherche montrant qu’une URL canonique transmet toutes les autorités de lien.
Nous savons tous que le but d’une URL canonique est de communiquer aux moteurs de recherche les pages à considerer et les pages à moins considérer.
Par conséquent, ma position sur ce sujet est la suivante : Une URL canonique ne transmet pas entièrement l’autorité de lien. Si vous souhaitez transmettre autant d’autorité de lien que possible, je vous conseille d’utiliser une redirection 301.
4.2.2. Les URL canoniques n’empêchent pas les problèmes d’optimisation de l’exploration
Le rôle principal des URLs canoniques est la résolution des problèmes liés aux contenus dupliqués. Elles indiquent aux moteurs de recherche les pages à considérer, et non les pages à explorer. C’est une distinction importante à faire.
En effet, on parle des problèmes d’optimisation de l’exploration lorsque les moteurs de recherche n’explorent pas les pages utiles et importantes. Nombreuses sont les raisons qui peuvent les amener à ne pas explorer les pages principales.
Ils peuvent :
- Être pris dans des boucles de redirection infinies ;
- Passer plus de temps à explorer les pages indésirables ;
- Etc.
C’est un gaspillage, d’autant plus que les moteurs de recherche ont un soi-disant « budget d’exploration » (le temps alloué pour l’exploration d’un site Web) pour chaque site Web. Le fichier robots.txt peut être utilisé pour éviter les problèmes d’optimisation de l’exploration.
Chapitre 5 : FAQ sur la balise canonical
5.1. Une mauvaise utilisation de la balise canonical peut nuire au référencement de mon site Web ?
Bien sûr que OUI ! Les erreurs lors de la configuration de cette balise peuvent avoir des problèmes voire même majeurs sur le référencement de votre site par les moteurs de recherche.
5.2. Étant débutant, quel est le moyen le plus facile d’implémentation d’une balise canonical sur un site Web ?
Comme moyen plus simple, vous avez deux possibilités :
- La première option est la configuration de la balise avec le plugin Yoast SEO, si vous êtes un utilisateur de WordPress. Ce plugin fonctionne sur une base automatique.
- La deuxième option consiste à faire appel à une agence SEO de qualité qui se chargera de tout faire à votre place afin d’obtenir le changement que vous espérez.
5.3. Quel est la cause des problèmes canoniques liés au référencement ?
Les problèmes canoniques se produisent le plus souvent lorsqu’un site Web a plus d’une URL qui affiche un contenu similaire ou identique.
Ils sont souvent le résultat de l’absence de redirections appropriées, bien qu’ils puissent également être causés par des paramètres de recherche sur les sites de commerce électronique et par la syndication ou la publication de contenu sur plusieurs sites.
5.4. Pourquoi les problèmes canoniques sont-ils une menace pour le référencement d’un site Web ?
Il y a plusieurs raisons :
Premièrement, Google ne souhaite pas inclure de contenu en double dans son index. Ainsi, lorsqu’il découvre des pages en double, il sélectionne une version canonique (par défaut) de cette page et exclut toutes les autres versions de la page de ses résultats de recherche. Cela peut poser problème si Google sélectionne une URL qui n’est pas l’URL que vous préférez indexer.
Voici une superbe vidéo de John Mueller de Google expliquant comment le moteur de recherche sélectionne une URL canonique lorsque plusieurs URL sur un site affichent le même contenu ou un contenu similaire :
Deuxièmement, si votre contenu est accessible via plusieurs URL, d’autres sites peuvent créer des liens vers des URL différentes lorsqu’ils citent le contenu de votre site. Cela diversifie votre valeur de lien sur plusieurs pages, la diluant.
En résumé
Pour finir, gardez simplement à l’esprit que les balises canoniques ne sont pas une directive, mais un signal aux moteurs de recherche.
Leur utilisation sur votre site est la meilleure manière d’indiquer à Google ou d’autres moteurs de recherches votre version préférée parmi un ensemble de pages presque identiques.
Vous savez maintenant tout sur une URL canonique. Tirez donc parti de sa puissance afin d’aider vos pages à bien performer dans les résultats de recherche.
À bientôt !