COMMENT DESINDEXER DES PAGES WEB DE GOOGLE ?

COMMENT DESINDEXER DES PAGES WEB DE GOOGLE ?

désindexer des pages web de Google

Comment désindexer des pages web de Google ?
Pourquoi désindexer des pages web de Google ? Autant de réponses qui vous seront apportées via ce tuto



Pourquoi désindexer des pages web de Google ?
Robots.txt: Pour empêcher Googlebot de crawler vos pages
Noindex : Interdisez l’indexation d’une de vos pages par googlebot
Comment désindexer un site WordPress ?
Balise canonical : un seul contenu,plusieurs URLs
Google Search Console: Pour supprimer des pages/urls
Comment créer un sitemap de désindexation ?




Pourquoi faut-il parfois désindexer des pages web de Google ?

  • Certaines pages de votre site sont indexées alors que c’est une erreur
  • Il y a un risque de “duplicate content” et vous craignez un déclassement de votre site par Google
  • Quelques pages dont le contenu pose des questions d’ordre juridique devraient être supprimées le plus rapidement possible
  • Sur votre site, plusieurs pages ne sont jamais consultées – recyclez-les ou retirez-les
  • Création d’un sous-domaine identique au site principal et donc risque de contenu dupliqué

Différence entre noindex et disallow ? La balise meta noindex empêche l’indexation d’une page dans l’index (base de données) de Google. La commande disallow est utile si vous ne souhaitez pas que Google crawle une page et par extension ne l’indexe pas non plus …

Qu’appelle-t-on une page indexée par Google ?

Il s’agit d’ une URL crawlée par googlebot et ajoutée à son index. Une fois ces 2 opérations réalisées, votre page pourra être restituée en réponse aux requêtes posées par les internautes sur Google.




Robots.txt

Si vos pages ne sont pas encore indexées par Google, commencez par le fichier “robots.txt”

Attention le fichier robots.txt ne gère pas l’indexation de vos URLs mais le “crawl”. En d’autres termes, si la page est déjà indexée, le robots.txt n’y changera rien

  • Disallow: /?search=
  • Disallow: /page/contact

Comment vérifier la présence d’un fichier “robots.txt” sur votre site ?

Tapez le nom de domaine de votre site suivi de /robots.txt. Exemple : https://www.yourbso.com/robots.txt

Quelles commandes utiliser dans un fichier robots.txt ?

  • User-agent : à utiliser pour désigner à quels crawlers s’adressent les commandes du fichier
  • Allow : sert à “autoriser” le crawl sur une ou plusieurs pages, mais aussi un sous-domaine, etc.
  • Disallow : exerce l’inverse de la commande Allow

Agence webmarketing Belgique

Yourbso est une marque de prestations digitales. La marque travaille exactement comme une agence de webmarketing mais à un coût moins élevé. Yourbso est constitué entre autre d’un webmarketer freelance qui se tient à votre disposition pour vous aider à optimiser la suppression de vos contenus. Ceci afin d’améliorer votre référencement naturel

Agence webmarketing à Lille Yourbso




Désindexer des pages web de Google grâce à la balise meta “noindex”

Dans quel cas utiliser une balise “noindex” sur vos pages ?

Est utile si vous voulez contrôler l’accès à votre site et ce page par page. Un des moyens d’empêcher une page de votre site web de s’afficher dans les résultats de recherche de Google (SERP) est d’utiliser la balise meta “noindex“. La prochaine fois que Googlebot viendra explorer votre page, il repérera la balise “noindex” (ou l’en-tête noindex dans la requête HTTP) et votre page sera exclue de la SERP.

  • Vous craignez un risque de duplicate content
  • Une de vos pages est dans une langue autre que celle du site
  • Le contenu de votre page est pauvre

Comment ajouter une balise meta noindex ?

Dans la partie <head> de votre page, ajoutez : <meta name=”robots” content=”noindex,nofollow”> — Dans cet exemple non seulement Google n’indexera pas la page mais en plus il ne suivra pas les liens qui y sont inclus

Traduction : <meta name=”robots” content=”notranslate”> — donne une indication à Google de ne pas proposer de traduction automatique

Image : <meta name=”robots” content=”noimageindex” /> — ne pas indexer les images

Googlebot : <meta name=”googlebot” content=”nofollow” /> — demande au spider de Google de ne pas suivre les liens d’une page

Utilisateurs de WordPress: Comment Désindexer des pages web de Google ?

N’ayant pas accès à la partie <head> de vos pages, le plus simple est d’utiliser le plugin Yoast.

  • Installez le plugin Yoast SEO
  • Allez sur la page de votre site à désindexer
  • Accédez en bas de page à la partie YOAST de configuration de votre page
  • Cliquez sur Avancé
  • Répondez NON à la question “Autoriser les moteurs de recherche à afficher le contenu Article dans les résultats de recherche ?”
Désindexer une page web avec Yoast pour WordPress

Bon à savoir pour désindexer des pages web de Google

Notez qu’il faudra un certain temps avant qu’une page déjà indexée disparaisse des résultats de recherche de Google. Le moteur de recherche devra réindexer la page pour trouver la balise meta “noindex.

Meta noindex vs robots.txt

Attention à ne pas bloquer une commande “noindex” avec un fichier “Robots.txt“. Pourquoi ? Parce que si vous utilisez la commande “Disallow” du fichier Robots.txt, Googlebot ne pourra pas détecter la balise noindex. La page à désindexer s’affichera quand même dans la SERP, si par exemple des liens internes ou externes pointent vers elle.




Comment désindexer un site WordPress complet ?

  • En plaçant une balise meta “noindex” dans la partie header.php du noyau des fichiers de WordPress. Attention que ce genre de modifications nécessite que vous soyez un développeur averti !
<?php if (is_search()) { ?><meta name="robots" content="noindex, nofollow" /><?php } ?>

Autres façons de désindexer un site WordPress complet

  • En utilisant un plugin comme Head, Footer and Post injections, afin de modifier les parties <head> et <footer>
  • Les réglages de WordPress permettent également de “Demander aux moteurs de recherche de ne pas indexer ce site”. Rendez-vous sur le “dashboard” de l’admin WordPress > Réglage > Lecture > Cochez la case “Visibilité par les moteurs de recherche”
  • Via Yoast, allez sur Réglages SEO > Types de publication > Afficher les Articles dans les résultats de recherche ? NON


Balise canonical

A quoi sert une balise canonical ?

Une balise canonical est utile pour déclarer une seule URL dont le contenu doit être pris en compte par Google. Par exemple, si plusieurs pages de votre site offrent le même contenu ou des contenus très similaires, vous avez intérêt à déclarer une seule URL en canonical. Pourquoi ? Parce que si vous n’indiquez pas à Google une seule URL dont il devra tenir compte, il interprètera les pages similaires comme du “Duplicate Content”. Cela pourrait impacter défavorablement la qualité de votre SEO.

Comment ajouter une balise canonical ?

<head>
<link rel= “canonical” href= “URL-de-la-page-canonique » />
</head>

Ajouter une balise canonical sur un site WordPress

  • Implémentez le plugin Yoast SEO
  • Allez sur la page dont le contenu doit être déclaré unique
  • En bas de la page, dans la partie YOAST
  • Cliquez sur Avancé
  • Ajoutez l’URL de la page à déclarer en canonical

Balise canonical WordPress




Désindexer des pages web de Google avec la Search Console

  • Sur l’outil Google Search Console, allez dans Index Suppression
  • Choisissez entre suppressions temporaires, contenu obsolète ou filtrage safesearch
  • Nouvelle demande
  • Google finit par désindexer les “erreurs 404”, mais mieux vaut utiliser un “HTTP 410”. La désindexation d’un HTTP 404 peut prendre beaucoup de temps

Les redirections 301 sont utiles pour rediriger une page obsolète vers laquelle un lien externe de bonne qualité pointait

Bon à savoir

Supprimer du contenu via Google Search Console peut s’avérer un peu casse-tête. Si vous avez besoin d’aide pour optimiser la suppression de vos contenus via la search console, n’hésitez pas à prendre contact avec Yourbso.

Désindexer des pages de Google : littérature Google

Vous avez le contrôle des pages à désindexer de Google

Si vous n’avez pas le contrôle des pages à désindexer de Google




Sitemap de désindexation

Grâce à ce sitemap :

  • Créez un sitemap incluant les pages à désindexer, contenant elles-mêmes la balise meta “noindex”
  • Soumettez ce sitemap à Google Search Console via Index Sitemaps
  • Google viendra assez rapidement crawler toutes ces URLs
  • Il constatera qu’elles doivent être désindexées
  • Au fur et à mesure qu’il viendra les crawler, il les désindexera
  • En bonus, vous pourrez consulter sur la Search Console, combien d’URL de ce sitemap sont encore présentes dans l’index.

Bon à savoir

Dès que toutes les URL sont désindexées, vous pouvez supprimer ce sitemap.

Sources pour désindexer des pages web de Google:

En résumé

Dans quel cas utiliser une balise “noindex” sur vos pages ?

Vous craignez un risque de duplicate content
Une de vos pages est dans une langue autre que celle du site
Le contenu de votre page est pauvre

Comment ajouter une balise meta noindex ?

Dans la partie “head” de votre page, ajoutez : “meta name=”robots” content=”noindex,nofollow”
Sur WordPress, utilisez le plugin Yoast > allez sur l’article à désindexer > tout en bas (partie configuration Yoast) > cliquez sur Avancé > Répondez NON à la question “Autoriser les moteurs de recherche à afficher le contenu Article dans les résultats de recherche ?”

A quoi sert une balise canonical ?

Une balise canonical est utile pour déclarer une seule URL dont le contenu doit être pris en compte par Google. Par exemple, si plusieurs pages de votre site offrent le même contenu ou des contenus très similaires, vous avez intérêt à déclarer une seule URL en canonical. Ceci afin d’éviter d’impacter défavorablement la qualité de votre SEO pour des raisons de duplicate content

Comment déclarer une balise canonical ?

“head” “link rel= “canonical” href= “URL-de-la-page-canonique”

Comment déclarer une balise canonical avec WordPress?

Implémentez le plugin Yoast SEO
Allez sur la page dont le contenu doit être déclaré unique
En bas de la page, dans la partie YOAST
Cliquez sur Avancé
Ajoutez l’URL de la page à déclarer en canonical

Différence entre noindex et disallow ?

La balise meta noindex empêche l’indexation d’une page dans l’index (base de données) de Google. La commande disallow est utile si vous ne souhaitez pas que Google crawle vos pages

Agence webmarketing à Lille

Les prestations digitales de Yourbso sont également disponibles à Lille et partout dans les Hauts-de-France

Consultant seo – référencement naturel de votre site internet

LinkedIn
Formations Yourbso
Désindexer des pages web de Google

LinkeIn Professionnel

Avoir un compte sur LinkedIn correctement optimisé va booster votre visibilité sur Google. En plus votre notoriété s’en verra grandie. N’attendez plus pour réseauter sur LinkedIn. Générer du trafic sur votre site via une stratégie de social selling. Mettez en avant vos mots-clés les plus stratégiques.

Expert absolu Linkedin

Formations Yourbso

Découvrez toutes les formations organisées par Yourbso. Google Analytics, Search Console, SEO, Google My Business, rédaction web, WordPress, etc

Référencement local

  • Plus de visibilité sur Google
  • Plus de trafic qualifié sur votre site internet
  • Plus de nouveaux clients dans votre établissement