Blog Etudes

Étude : Que valent les différents outils de recherche de mots-clés SEO?

Alexis Rylko

Alexis Rylko

Consultant SEO & Directeur technique SEO chez iProspect France

Benchmark Outils de recherche de mot-clés: Ahrefs, Searchmetrics, Semrush et Sistrix

Nous sommes nombreux à les utiliser tous les jours. Ces outils sont devenus nos véritables assistants quotidiens qui facilitent, accélèrent notre travail, donnent une vision plus claire sur notre état de visibilité SEO et celui de nos concurrents.

Mais à quel point les données fournies sont exhaustives, pertinentes, précises ?

Est-ce que tous les outils sont aussi performants pour différentes types de de démarches SEO qu’on peut avoir?

Et finalement, si vous ne les utilisez pas encore, sur quel outil ça vaut le coup investir pour qu’il réponde au mieux à vos besoins?

Pourquoi pas faire une étude qui répondrait à ces questions?

Dans le cadre de cette étude 4 outils sont mis en lice (oui, il en existe bien d’autres, mais je m’arrête sur ces quatre-là):

Comme tous ces outils suivent une tendance globale des dernières années de devenir de vrais couteaux-suisses SEO (en proposant d’analyser les backlinks, faire tourner des crawls, mettre en place le monitoring de changements etc.) je vais analyser uniquement leurs aptitudes de recherche de mots-clés et plus précisément en France.

Disclamer:

  • Toutes les données ont été collectées entre le 14 et le 31 décembre 2020 et peuvent varier par rapport au jour où vous lisez cette étude.
  • Les résultats sont obtenus sur mon échantillon de sites, de pages et de mots-clés. Même si j’ai essayé de respecter la diversité, les résultats obtenus sur un autre dataset peuvent être différents.

N’importe quelle comparaison qu’on fasse, elle se base toujours sur des critères, un ou plusieurs.

J’ai sélectionné de mon côté les critères que je trouvais importants dans la recherche de mots-clés et je vous propose un agenda suivant:

Agenda

  1. Suggestions de mots-clés:
    1. Pour un domaine.
    2. Pour une page.
    3. Pour un univers.
  2. Justesse des formes de mots-clés.
  3. Fraîcheur de mots-clés.
  4. Diversité de mots-clés.
  5. Conclusions et tableau de comparaison.

Suggestions de mots-clés

Quand il est question d’avoir des idées de mots-clés, en fonction du résultat attendu, il existe 3 approches les plus courantes:

  1. Partir sur un nom de domaine.
  2. Partir sur une page particulière.
  3. Partir sur des mots-clés pertinents au secteur d’activité.

1/7. Proposition de mots-clés pour un domaine

Entrer le nom de domaine d’un concurrent et accéder aux mots-clés sur lesquels celui-ci est visible sur Google est une des options les plus sollicitées par les SEOs.

Elle montre son utilité particulière pour identifier de nouveaux clusters de mots-clés qu’on ne couvre peut être pas aujourd’hui, par exemple:

  • facettes intéressantes sur un site e-commerce
  • sections éditoriales sur un blog ou site média
  • idées de contenus qui performent bien chez les concurrents etc.

Méthodologie:

Pour analyser les outils sur cet aspect, j’ai pris un échantillon de 100 sites (=domaine) de manière aléatoire, juste en s’assurant qu’il y ait assez de diversité : des sites petits comme grands, de tous types (ecommerce, médias, blogs), de secteurs variés, autorisés par Google Adwords ou pas trop.

Voyons d’abord sur quelle part de nos 100 sites un outil sort gagnant avec le meilleur résultat en terme du nombre de mots-clés proposés.

Ensuite analysons comment les outils performent pour les petits et grands sites, pour cela splittons notre liste de domaines en 2 parties:

  1. trions tous les domaines par volume de mots-clés proposés,
  2. prenons les 30 premiers (les plus grands) et les 30 derniers (les plus petits) et refaisons le même exercice:
  • Dans 36% des cas Sistrix a proposé le plus de mots-clés et c’est de loin le meilleur résultat.
  • Ahrefs, Searchmetrics et Ahrefs montrent des performances très similaires (meilleurs volumes de mots-clés proposés pour 20-22% des domaines sur 100).
  • Globalement, tous les outils s’en sortent bien sur cette tâche, il n’y a pas d’outsiders marqués.

Jetons maintenant un œil sur les valeurs absolues – volumes cumulés de mots-clés proposés pour notre sélection de 100 domaines:

  • Semrush et Sistrix sont des leaders en terme du nombre de mots-clés proposés.
  • Ils sont suivis par Searchmetrics et Ahrefs qui proposent de ~6% de mots-clés en moins.

En comparant les résultats de fin décembre avec mes premières ébauches faites en septembre, je remarque que Ahrefs propose aujourd’hui moins de mots-clés que 3 mois avant. Il semble qu’il s’agit d’une campagne de nettoyage de la base de mots-clés de leur côté.

Le défaut des chiffres cumulés absolus est qu’ils peuvent facilement être influencés par de très gros acteurs.

Essayons de niveler cet aspect de taille du site et voyons en % de combien de mots-clés en plus propose chacun de nos outils par rapport aux autres.

Pour cela je vais comparer le volume de mots-clés proposé par chacun des outils avec la moyenne proposée par les 3 autres.

Je vais l’appliquer pour tous les domaines et prendre la médiane pour ignorer les valeurs aberrantes:

Résultats:

  • Sistrix, Ahrefs et Semrush proposent un nombre de mots-clés par domaine équivalent (avec un petit plus pour Sistrix et Ahrefs).
  • Searchmetrics propose de -14% de mots-clés en moins par rapport à la moyenne des 3 concurrents. Les résultats sont encore plus faibles (-22%) pour les sites de petite et moyenne taille.

Quelques exemples de volumes de mots-clés proposés par domaine : pour une 20ne de premiers (les plus grands) et une 20ne des derniers (les plus petits) sites:

2/7. Proposition de mots-clés pour une page particulière

Si une vision au niveau du nom de domaine est utile pour identifier des opportunités de nouveaux contenus à créer, très souvent on peut avoir besoin d’une vision plus fine, celle par page.

Par exemple, nous avons une page ‘robes de soirée’ et nous souhaitons voir sur quels mots-clés est visible la même page de Kiabi, ASOS, Zalando ou La Redoute.

On pourra utiliser ensuite ces informations pour enrichir la sémantique de notre page: le balisage, les textes, les intitulés des produits dans l’objectif de couvrir plus de requêtes d’internautes.

Voyons ce que nous proposent les outils pour une sélection de 50 pages, de nouveau tous types, tous secteurs et toutes tailles confondus:

On constate que les résultats sont bien différents par rapport aux recommandations au niveau des noms de domaine:

  • Dans 22 cas sur 50 c’est Searchmetrics qui propose le meilleur volume de mots-clés pour des pages spécifiques.
  • Sistrix et Semrush montrent les résultats les plus faibles (6/50 et 7/50).

Ces résultats sont en corrélation avec le volume de mots-clés absolu cumulé pour l’ensemble des 50 pages:

Sistrix a trouvé presque 2 fois moins de mots-clés que Searchmetrics.

La même tendance se poursuit aussi sur les % relatifs (là où on ignore l’importance des pages):

Et un tableau de comparaison par page spécifique (cliquez ici pour ouvrir dans un nouvel onglet le tableau complet):

Pour conclure:

  • Sur les 3 critères analysés Searchmetrics a proposé le plus de mots-clés en laissant bien derrière les autres concurrents.
  • Ahrefs s’en sort plutôt bien aussi sur cette tâche.
  • Sistrix et Semrush proposent le moins de suggestions par page.
  • Ahrefs et Searchmetrics semblent être aussi les outils les plus adaptés pour proposer des mots-clés pour les pages d’Amazon:
PageSearchmetricsAhrefsSemrushSistrix
https://www.amazon.fr/piscine-gonflable/s?k=piscine+gonflable3120015
https://www.amazon.fr/telephone-portable-cher-forfait/s?k=telephone+portable+pas+cher+sans+forfait 9484014
https://www.amazon.fr/aspirateur-balai-sans-fil/b?ie=UTF8&node=3575230031335217175161
https://www.amazon.fr/drone/s?k=drone56564815
https://www.amazon.fr/coque-iphone/s?k=coque+iphone169646430
Sous-total:685441287235

3/7. Proposition d’idées de requêtes pour un mot-clé

Et finalement le 3ème cas de figure : suggestions de mots-clés dérivés pour un mot-clé central.

Dans chaque secteur d’activité nous avons les termes qui le décrivent au mieux, par exemple: immobilier, recette, livre, météo, actualités etc.

J’ai sélectionné 50 termes génériques appartenant à des secteurs d’activité très variés: des produits bébé aux thématiques adultes.

Voyons ce que nous proposent les outils de nouveau du point de vue du volume absolu de mots-clés:

Et la tendance relative par rapport à la moyenne proposée par les autres concurrents:

Les 2 critères montrent les mêmes tendances:

  1. Semrush écrase ses concurrents à la fois sur le volume absolu (x2 par rapport à Sistrix, le compétiteur le plus proche) et relatif d’idées de mots-clés.
  2. Searchmetrics montre des résultats très faibles et apparemment ce n’est pas le bon outil à utiliser pour cette tâche.

Le tableau de comparaison du volumes d’idées de mots-clés proposées pour un mot-clé central:

4/7. Justesse des formes de mots-clés

Une large base de mots-clés c’est bien, mais ce n’est pas le seul facteur que nous devons prendre en compte.

Comparons 2 petites listes de top mots-clés proposés pour le site de Cdiscount.com par 2 outils. Laquelle serait plus utile pour vous?

Ça nous emmène vers un autre aspect important – la propreté de la base : est-ce que les listes de mots-clés que nous allons exporter sont propres et on ne devra pas passer 2 jours à faire du nettoyage?

Méthodologie

Pour valider les formes de mots-clés suggérés on ne peut pas utiliser un simple dictionnaire. Juste parce qu’on n’y trouvera que des noms communs, mais jamais les noms de marques et d’enseignes (Fnac, Nike), les noms de produits (p.ex. iPad), mais aussi toute une variété de possibilités de mots que l’internaute peut utiliser dans ses requêtes.

Par contre, on peut utiliser un dictionnaire plus large et performant – celui de Google et notamment Google Autocomplete aussi connu sous le nom de Google Suggests.

Je vais prendre 10 pages issus de 10 sites différents et exporter 1 000 premiers mots-clés proposer par nos 4 outils. Ensuite pour chaque mot-clé je vais faire une requête vers Google Autocomplete et le comparer avec le 1er mot-clé proposé dans les suggestions:

Voici l’exemple du fonctionnement de cette méthode pour un échantillon de mots-clés. A gauche les mots-clés proposés par un outil, à droite – la forme validée par Google Autocomplete pour chaque mot-clé:

Les résultats obtenus sont les suivants:

  • Ahrefs propose la base de mots-clés la plus propre avec 84% de mots-clés corrects.
  • Sistrix et Semrush propose des bases également plutôt propres avec ~80%.
  • La base de Searchmetrics a montré les résultats les plus faibles avec seulement 60,1% de mots-clés propres. C’est à dire en analysant un export de Searchmetrics il vous faudra supprimer 2 mots-clés sur 5.

5/7. Diversité/Similarité des mots-clés proposés

En parcourant les suggestions de mots-clés, je cherche surtout d’avoir de nouvelles idées. En donc ici, on touche à un autre aspect important – celui de la diversité ou similitude des mots-clés proposés.

Prenons par exemple de nouveau 2 listes de top mots-clés proposées par 2 outils pour la page https://www.lefigaro.fr/actualite-france.

Si on oublie pour le moment la justesse des formes de mots-clés, mais on se focalise plus sur leur diversité, quelle liste vous serait plus utile ?

Je propose de l’analyser cet aspect sur 2 critères:

  • Similarité de mots-clés proposés.
  • Nombre de termes uniques présents dans les listes de mots-clés.

Similarité de mots-clés proposés

Méthodologie

  • Prenons un échantillon de pages provenant des sites différents et exportons tous les mots-clés proposés par chacun des outils.
  • Vectorisons tous les mots-clés et calculons la similarité entre chaque vecteur en déterminant le cosinus de l’angle entre eux.
  • A l’issue de l’opération précédente on obtiendra une matrice de similarité dans laquelle chaque mot-clé sera comparé avec tous les autres (0 signifie qu’il s’agit des mots-clés indépendants, 1 – mots-clés très similaires). Les valeurs intermédiaires nous permettront d’évaluer le degré de similarité.
  • A la fin prenons la moyenne des cosinus, ce sera notre degré de similarité.
Exemple d’une matrice de similarité (chaque ligne et chaque colonne correspondent aux mots-clés)

Résultats:

Outils par similarité cosinus moyenne des mot-clés fournis pour un échantillon de pages. Plus la valeur et petite, plus les mots-clés proposés sont variés.

Sur ce critère:

  • Sistrix propose les mots-clés plus variés que les autres outils. Il est suivi de Semrush.

Nombre de termes uniques dans les listes de mots-clés

Passons au deuxième critère. L’idée derrière est très simple – à la recherche de nouvelles idées de mots-clés je cherche à découvrir plus de termes variés qui peuvent refléter les requêtes des internautes.

Nombre moyen de termes uniques dans les listes de mot-clés proposés pour des pages.

Et quelques exemples pour les pages réelles:

6/7. Fraîcheur des mots-clés proposés

Un autre aspect important c’est la fraîcheur de la base de mots-clés.

Voyons comment les outils arrivent à s’adapter à l’actualité et tenir à jour leurs bases de données.

Pour cela, trouvons des entités qui ont apparu il n’y a pas longtemps. Et en 2021 nous avons eu “la chance” d’en avoir!

“Covid-19”

Toute l’année 2020 s’est déroulée sous l’empreinte de la pandémie.

Mais si le terme “coronavirus” était déjà bien connu, sa nouvelle souche ne s’est dotée de l’appellation officielle que le 11 février 2020 quand l’OMS l’a officiellement baptisée “Covid-19”:

  1. Semrush et Ahrefs ont été les premiers à inclure (automne 2020) les expressions liées à la Covid-19 dans leurs bases de données et se démarquent aussi au niveau de leur volume.
  2. Sistrix ne connaît pas encore le terme “covid-19” ni en correspondance exacte ni large.
  3. Searchmetrics ignore le terme “covid-19” en correspondance exacte, mais propose ses déclinaisons (depuis décembre 2020).

“Reconfinement”

Un autre terme que nous avons appris tous en 2020 c’est le “confinement”. Aussi bien que “coronavirus”, ce terme existait bel et bien auparavant, par contre “reconfinement” c’est quelque chose de nouveau.

Selon Google Trends, il n’y a eu aucun intérêt pour le reconfinement depuis 2004. L’expression commence à surgir début mai 2020 pour atteindre son point culminant dans la semaine du 25-31 octobre 2020:

  1. Semrush et Ahrefs ont bien appris la nouvelle expression.
  2. Semrush propose la palette la plus large des suggestions.
  3. Sistrix et Searchmetrics ignorent le terme “reconfinement”.

Films: “Le Jeu de la Dame”

Laissons à coté la pandémie, il y a eu quand-même d’autres choses en 2020, par exemples les sorties de nouveaux films. Diffusée le 23 octobre, “Le Jeu de la Dame” a fait un bon carton et est devenue en un mois la mini-série la plus regardée dans l’histoire de la plateforme Netflix.

Jetons un oeil sur nos outils:

  • Semrush et Ahrefs ont capté la toute récente tendance.
  • Semrush propose la palette la plus riche de mots-clés.
  • Searchmetrics et Sistrix ne connaissent pas encore la série.

Films: “Snyder Cut de la Justice League”

Il n’est pas encore sortie, mais tout au long de l’année 2020 on en a discuté, regardait les bandes d’annonces, entendu parler des scandales.

La Justice League retravaillée connue sous le nom de Snyder Cut a fait et fera certainement encore des buzz.

  • Semrush, Sistrix et Ahrefs ont bien adopté la nouvelle expression.
  • Searchmetrics éprouve par contre des difficultés.

“Playstation 5”

Quand les gamers et les geeks parlent de l’année 2020, celle-ci est indissociable la sortie attendue de la console PS5. Les premières recherches autour de la nouvelle consolent ont commencer à apparaître à partir de fin 2019, voyons comment nos outils ont pu les capter et couvrir:

Expressions avec “2020” et “2021”

Quand l’internaute cherche les résultats d’actualité, frais, les requêtes sont souvent accompagnées du numéro de l’année, par exemple:

  • meilleures frigos 2020
  • vacances scolaires 2021
  • soldes d’hiver 2021
  • Semrush et Sistrix assument bien cette tendance.
  • Ahrefs et Searchmetrics éprouvent des difficultés.

7/7. Conclusions

L’objectif de cette étude était d’essayer de comparer les 4 outils dans leurs capacités de recherche de mots-clés sur des facteurs objectifs, tels que suggestion de mots-clés par domaine, par page ou par mot-clé, leur fraîcheur et diversité.

Suite aux résultats obtenus j’ai ajouté des notes de 1 à 5 où 5 est la meilleure note et mis tout dans ce tableau récapitulatif:

Pour conclure, il y a au moins une catégorie où chacun des outils mis en lice est meilleur:

  • Searchmetrics – dans la proposition d’idées de mots-clés par page,
  • Semrush – dans la suggestion de requêtes dérivées à partir d’un mot-clé générique .
  • Ahrefs, même s’il ne propose pas les volumes les plus important, a des bases de mots-clés les plus propres ce qui économiser bien du temps lors du traitement.
  • Sistrix est le plus fort dans la proposition de mots-clés pour un domaine et propose également les mots-clés les plus variés.
  • Semrush et Ahrefs arrivent à capter au mieux les dernières tendances.

Le choix de l’outil c’est toujours une question de vos habitudes de travail et vos besoin. J’espère que cette étude vous aidera à faire de bons choix 😉

Alexis Rylko

Article de :

Alexis Rylko

Consultant SEO depuis 2009 & Directeur technique SEO chez iProspect France, formateur SEO, conférencier, éditeur de sites & développeur d’outils SEO.
🏆 Jeune personnalité Search de l'année 2022 (SEMY Awards)
🏆 Prix de la "Meilleure campagne SEO 2023" (SEMY Awards).

1 réflexion au sujet de « Étude : Que valent les différents outils de recherche de mots-clés SEO? »

  1. bravo très intéressant.
    Par contre pour partager ton étude tu devrais, supprimer google+ et ajouter linkedin 🙂

    Répondre

Laisser un commentaire