Le Duplicate Content (ou en français contenu dupliqué) est un véritable poison pour les sites. En effet, les moteurs de recherche filtrent leurs résultats de façon à éliminer les pages dîtes « doublons » (qui contiennent un contenu identique ou fortement similaire), afin de n’en garder qu’une seule dans leurs résultats. Cependant, malgré des efforts acharnés pour éviter le Duplicate Content, cela peut souvent se produire par accident, inadvertance ou ignorance des nombreux pièges du Net… Alors comment s’en prémunir ? Voilà la question à laquelle répondra 360 WEBMARKETING.

Vous êtes un(e) rédacteur (rédactrice) sérieux(se), un(e) expert(e) SEO émérite et n’avez nullement l’intention de fournir du contenu « faible », du contenu sans valeur ajoutée, du contenu dupliqué à vos clients ou à votre entreprise. En effet, vous avez à cœur les articles originaux et bien écrits. Toujours est-il que parfois, votre site souffre de Duplicate Content, malgré tous vos efforts…

Du Duplicate Content partout… mais où ?

Le Duplicate Content est l’une des problématiques les plus compliquées et négligées qui peuvent affecter la capacité de votre site à se hisser en haut des recherches Google ! Et là où le bât blesse, c’est qu’il n’y a pas de contrôle dans Google Search Console qui puisse orienter le rédacteur SEO. D’ailleurs, même les outils de contrôle de duplicata les plus avancés, sont incapables de donner des résultats optimums.

Pour remédier à ce problème – et afin de rendre le travail des experts SEO toujours plus efficace – voici où peuvent se nicher les contenus dupliqués à votre insu.

Les URL, HTTP et HTTPS

Une des façons les plus rapides pour vérifier si votre site a deux versions live indexés est d’essayer de visiter votre site en utilisant à la fois le protocole HTTP et HTTPS. Si deux versions de votre site subsistent, pensez à demander au développeur de régler dare-dare le problème !

Assurez-vous également que votre site ne possède pas à la fois une version « www » et une version sans « www ». Ce problème est très facile à résoudre : mettez en œuvre des redirections 301 et précisez votre domaine dans Google Search Console.

Contenu dupliqué

 

Les voleurs de contenu

C’est un fait, nombreux sont les sites qui ne manquent pas de scrupule et qui volent le travail des autres rédacteurs. Pour leur compliqué la tâche, l’idéal serait d’utiliser des URL absolues (https://www.360-webmarketing.fr/SEO) à la place des URL relatives (/SEO). L’utilisation d’URL relatives, laisse supposer (Google) que votre lien pointe vers une page qui est sur le même navigateur que le vôtre, de quoi déstabiliser Google… ce qui n’est jamais bon !

Pour remédier à ce problème, demander à votre développeur d’encoder à nouveau tout votre site (oui, oui !) et enfin, afin de savoir si vous avez été « volé », utilisez des outils tels que « Siteliner » ou « Copyscape ». On n’est jamais à l’abri d’un plagiat !

Les sous-domaines ou les domaines abandonnés !

Vous avez échangé votre sous-domaine par un sous-répertoire ? À moins que vous ayez créé un site entièrement nouveau tout en abandonnant l’ancien ? Dans les deux cas, votre ancien contenu abandonné pourrait être quelque part dans la matrice ! Là encore, le mieux serait de rediriger (301) votre ancien sous-domaine (ou votre ancien domaine tout entier) vers votre nouveau site.

L’environnement « secret » de votre site

Vous êtes en pleine préparation ou en pleine refonte de votre site ? Faites attention aux robots de Google (Crawlers) ! En effet, le moteur de recherche explore et indexe constamment le web, y compris ce qui n’est pas encore mis en ligne alors pensez à « bloquer » les Crawlers !

Contenu dupliqué

« L’intrusion » de Google peut avoir un grand nombre de répercussions négatives :

  • brouiller vos résultats de recherche en créant la confusion chez les utilisateurs.
  • Mettre à mal les termes de confidentialité et de sécurité du site.

Alors que faire ? Appliquer un tag noindex et robots.txt. Mais attention, une fois votre site en ligne, pensez à supprimer ces commandes de blocage.

Les paramètres générés dynamiquement

Les paramètres générés dynamiquement le sont bien souvent par une installation de navigation à facettes qui peut découler de l’architecture de votre site. Ainsi au lieu d’avoir un URL absolu « clean » (https://www.360-webmarketing.fr/SEO), on se retrouve avec un URL pollué (https://www.360-webmarketing.fr/SEO%9in).

Ces chaînes d’URL inutilement longues, « invitent » Google à les explorer vainement ! Ainsi, le moteur de recherche se met à créer et à indexer des combinaisons d’URL sans fin, qu’aucun utilisateur n’a demandée.

Pour éviter ce genre de contenu dupliqué et inutile, pensez à demander à votre développeur de bien verrouiller ses codes !

Les sous-répertoires Mirrored (en miroir ou en échos)

Votre entreprise existe dans deux ou plusieurs zones géographiques ? Alors faites attention à ne pas mettre en place une page d’atterrissage principale qui redirige les utilisateurs/les clients/les prospects vers le sous-répertoire approprié.

Bien que cela puisse paraître logique, cela entraine bien des confusions et cela se gâte si jamais les deux sous-répertoires sont en miroirs (mêmes produits, mêmes contenus).

Pour faire face à ce problème, le mieux s’est de se rendre à Google Search Console et de configurer le ciblage géographique !

Le contenu syndiqué

Le contenu syndiqué est certes un excellent moyen de se faire connaître. Cependant, il est important de définir des lignes directrices pour ceux qui veulent publier votre contenu. L’idéal est donc de demander à l’éditeur de le préciser sur la page de l’article pour indiquer aux moteurs de recherche que votre site est la source originale du contenu.

Cependant, cela n’empêchera pas – d’un point de vue référencement et positionnement – que ce soit (dans certains cas) les sites qui reprennent le contenu syndiqué qui se positionnent devant la source originale.

Le contenu similaire

Similaire mais pas identique, diriez-vous ! Cependant, la définition de Google de « duplicate Content » inclut la notion « sensiblement similaire » ! Voilà de quoi rendre la tâche encore plus compliquée !

Ainsi, la règle de Google veut que : bien que deux contenus puissent avoir une syntaxe totalement différente, s’ils véhiculent les mêmes informations, il n’y a pas de véritable raison pour qu’ils subsistent tous les deux.

Il faut donc penser à donner du corps et de la plus-value à tous vos articles, et ceci paragraphe par paragraphe !

RSS

Le Duplicate Content est un véritable frein à l’ascension de votre site dans les recherches Google. Alors ne négligez surtout pas ces 8 étapes qu’il faudra combiner à du contenu toujours plus original, toujours plus intéressant, toujours plus dynamique !