Le 21 octobre Google a terminé le déploiement d’une nouvelle mise à jour de son algorithme anti-spam SpamBrain. Quels sont les effets de cette mise à jour ? Quels les types de sites et techniques qui sont dans le viseur de Google ?

Je vous propose de parcourir des exemples de sites pénalisés, leurs techniques et impact de la dernière mise à jour.

Que sait-on officiellement du SpamBrain ?

  1. SpamBrain est un système automatisé de prévention du spam de Google basé sur l’IA lancé en 2018.
  2. SpamBrain fonctionne en continu pour détecter en permanence le spam sur les pages de résultats de recherche de Google.
  3. SpamBrain a eu plusieurs mises à jour : en novembre 2021, en été 2021 et voilà en octobre 2022.
  4. La mise à jour a commencé le 19 octobre et a été complètement déployé 48 plus tard le 21 octobre. Toutes les langues et tous les pays.
  5. SpamBrain visent les sites et les pages utilisant des techniques trompeuses qui sont explicitement présenté dans la liste officielle : https://developers.google.com/search/docs/essentials/spam-policies

Mise à jour de Google SpamBrain d’octobre 2022

Contrairement aux Core Updates, dont l’analyse est souvent bien complexe, les investigations autour les mise à jour de l’algorithme anti-spam sont considérablement plus clairs. On a une liste officielle de techniques à proscrire, les dates du déploiement et les sites qui ont perdu en visibilité (grâce aux outils comme Sistrix).

Le Spam Update est un ajustement et renforcement de l’algorithme anti-spam existant qui doit s’adapter aux tendances de techniques utilisées sur le web.

L’analyse des perdants après le Spam Update permet de comprendre mieux où Google serre plus les vis et on va essayer de le voir dans cet article.

Je vais flouter tous les noms de sites, si certains vous intéressent, n’hésitez pas à envoyer un petit message sur Twitter.

tl;dr

  1. Ce que Google Helpful Update du septembre 2022 n’a pas fait, a été fait par le Spam Update. Moins subtil, SpamBrain est un gros coup de balai sur les sites qu’on n’aimerait jamais voir dans la recherche.
  2. Avec la nouvelle version de SpamBrain, Google a encore plus serré les vis vis-à-vis du contenu dupliqué, traduit de manière automatique, non-approprié.
  3. Le plus d’impact sur les sites jeunes dont croissance vertigineuse est visiblement un red flag. Les anciens et gros pour l’instant tiennent le coup.
  4. Sur tous les cas observés le SpamBrain fonctionne comme un filtre qui s’applique par-dessus des sites et pages. Les pages impactées restent indexées (se retrouvent avec la commande site:), juste le filtre anti-spam les empêche d’être affichées dans la zone visible des résultats de recherche.
  5. A côté d’une perte importante de visibilité, les sites impactés par le SpamBrain se voient ralentir fortement d’acquisition de nouveaux mots-clés positionnés voire bloquer complètement (malgré l’apparition de nouveaux contenus, ceux-ci ne remontent plus dans Google).
  6. SpamBrain peut avoir des effets négatifs collatéraux sur les bonnes pages si le nombre de pages spam est très élevé.
  7. En cas de soupçons sur l’absence de classements de telle ou telle page, n’hésitez pas à jeter un œil sur l’évolution des classements à partir du 21 octobre 2022 sur Sistrix, Semrush, Ahrefs, Search Console.

Sommaire:

  1. Sites & contenu pour adultes.
  2. Nouveaux sites de streaming.
  3. Sites automatiques scrapeurs de People Also Ask.
  4. Sites traduits : automatiquement et mal.
  5. Scrapeurs PAA + traduction.
  6. Annuaires simples basés sur le scraping d’autres sources.

1. Sites & contenu pour adultes

Parmi les sites les plus touchés par le Spam Update, on trouve traditionnellement des sites à contenu pour adultes, notamment des nouveaux lancés en 2022. Après une hausse constante, à partir du 20 octobre la visibilité SEO devient proche du zéro.

Exemples d’impact #1 : jeunes sites à 100% contenu adulte :

Exemple d’impact #2 : Sites ayant du contenu adulte :

Pour qu’un site soit pénalisé pour du contenu adulte, il ne doit pas nécessairement y être consacré à 100%.

Voici un exemple d’un site e-commerce lancé en 2013 spécialisé en vente de papiers peint, posters, stickets etc.

Quelque part au milieu de l’année 2022 le site se dote d’un nouveau design, mais surtout d’un volume de pages de produits conséquent ayant à côté des photos produits tout à fait neutres les en-têtes et tags adultes générés automatiquement.

Cela a permis au site de remonter très vite dans classements sur plein de requêtes adultes. Le Spam Update y a mis fin. Il y a eu des effets collatéraux sur des pages neutres, dont beaucoup ont été également déclassés.

2. Nouveaux sites de streaming

Le streaming est un autre secteur où le spam est omniprésent. De nouveaux, beaucoup de jeunes sites de 2021-2022 sont abattus par la mise à jour.

Exemple d’impact :

Sites-scrapeurs de People Also Ask

Dès leur apparition, les fameux blocs de questions-réponses « Autres questions posées » sont devenus une source inépuisable d’idées de contenus.

Beaucoup à travers tous les marchés s’est sont servis pour monter des sites automatisés – entièrement basés sur les questions et réponses extraites depuis les blocs People Also Ask.

Si le Helpful Update d’il y a un mois, n’a touché que les sites anglophones, la mise à jour anti-spam a rattrapé les autres partout dans le monde.

Voici quelques perdants en France.

Exemple d’impact #1 :

Confirmé également par le rapport de changement de positions de Semrush : depuis le 21 octobre le site ne fait que perdre les mots-clés positionnés. L’acquisition de nouveaux mots-clés est bloquée :

Impact sur d’autres sites du même type :

Est-ce que tous les sites automatiques de type « People Also Ask » ont été pénalisés?

Non, loin de là, les plus gros résistent bel et bien.

Site gagnant FR #1 :

Site gagnant FR #2 :

Est-ce qu’avec la nouvelle version du SpamBrain de Google, les sites basés sur les résultats de People Also Ask n’ont plus de chances de se positionner?

Non, voici un exemple d’un site qui vient de se créer (en octobre 2022) un répertoire avec les pages automatiques PAA et qui se porte bien en acquérant chaque jour de nouveaux mots-clés et points de visibilité.

Sur l’exemple d’autres sites, il est fort probable que ce ne soit qu’une question de temps :

4. Sites traduits : automatiquement et mal

Un autre type de contenu considéré par Google comme spam est le contenu traduit automatiquement.

Là, je ferai une réserve: le contenu traduit et le contenu mal traduit n’est pas la même chose. Dans le cas de l’update en cours, ce qui a été pénalisé c’est le contenu vraiment mal traduit.

Pour donner l’idée de ce que c’est du contenu mal traduit, ça ressemble à ça :

Exemple d’impact #1:

L’exemple ci-dessous c’est un site qui traduit et publie automatiquement les pages sur Stackoverflow.com – un des portails de questions-réponses les plus populaires au monde dans le domaine du développement et programmation:

Des fois il peut être compliqué de comprendre si le contenu a été traduit ou généré automatiquement, mais quant aux sites parlant du développement et de la programmation, les exemples de code sont des empreintes très univoques :

Exemple d’impact #2:

Un autre site traduisait et publié les contenu depuis GeeksforGeeks – un site populaire liée à la programmation :

La mention de la source et l’explication qu’il s’agit d’un contenu traduit ne l’ont pas sauvé.

5. Scrapeurs PAA + traduction

Une autre exemple de site combinant les 2 techniques précédentes : une génération automatique des pages avec le contenu des blocs People Also Ask en anglais avec une traduction en français.

Exemple d’impact :

Aucun nouveau mot-clé acquis depuis le déploiement de la mise à jour, le site ne continue que de perdre des mots-clés positionnés :

6. Annuaires simples basés sur le scraping d’autres sources

Exemple d’impact #1:

Ce site monté sur un domaine d’une ancienne boutique e-commerce, il s’agit (ou plutôt il s’agissait) d’un annuaire des entreprises composés de contenus des fiches Google Maps et textes extraits depuis les pages rattachées.

Globalement affichant ce que proposent déjà Google Maps, le site est très vite monté en classements, et probablement a eu un red flag. Résultat – filtre anti-spam.

Impact sur un autre site du même type :

Est-ce que SpamBrain pénalise dorénavant tous les annuaires basés sur les résultats de Google Maps ?

Non, on trouve encore suffisamment d’exemples de survivants :

Exemple d’impact #2 : Annuaire d’acteurs

Un autre exemple est un une agrégateur d’agences artistiques constituée principalement de fiches d’acteurs.

Chaque fiche est composée à son tour des listes de précédents tournages d’un acteur qui sont extraites depuis leurs fiches sur les sites officielles d’agences. Des fois avec des photos. Ainsi, de nouveau on est sur les problématiques de site à contenu dupliqué à grand échelle.

L’âge du site est probablement la raison principale pour laquelle l’impact de la mise à jour reste limité (tout en restant important).

C’est tout pour aujourd’hui, si vous avez des questions, échangeons-en en commentaires ci-dessous ou sur Twitter 🙂

Auteur/Autrice

Show CommentsClose Comments

2 Comments

  • Avatar
    Emmanuel
    Posted 04/11/2022 at 16:56

    Merci Alexis, top. Pourquoi masquer les sites étudiés dans ton article ?

  • Avatar
    Jean
    Posted 08/11/2022 at 15:32

    Tres bon étude! merci

    Dans l’exemple des sites scrapés avec des contenus de fiches de Google Maps, est-ce ils publient des fiches entières (via HTML embed) ô juste des informations qu’on trouve dans la fiche?

Leave a comment