Aujourd’hui, dans le domaine du référencement naturel, pour rédiger du contenu du qualité, il est nécessaire de passer par une étape préalable : la constitution d’un corpus sémantique qui permettra de rédiger un contenu optimisé et pertinent pour les moteurs de recherche. En France, on est en pointe sur le sujet du thème du Page Rank Thématique et il n’est pas facile de trouver des méthodes efficaces pour générer un corpus de mots pour la rédaction d’un contenu. Je vous propose donc 5 méthodes et outils gratuits pour créer votre corpus thématique.
1. Les outils Google
L’utilisation des outils historiques de recherche de mots-clés tel que l’outil de planification de mots-clés Adwords et les suggestions Google restent une excellente base pour créer votre corpus sémantique.
Pour l’outil de planification des mots clés, il est indispensable de vous constituer vous même votre corpus en supprimant les mots-clés hors champs et en ajoutant de nouvelles associations d’idée. Idéalement, vous devez faire plusieurs analyse avec plusieurs mots clés de votre thématique et ainsi collecter toutes les idées de mots-clés possible pour avoir une vision la plus large possible.
Normalement, pour l’outil de suggestion des mots-clés, vous aurez moins de travail de sélection, à moins que vous utilisiez un outil comme Ubersuggest pour vous donner toutes les associations de lettre pour les mots que vous avez saisie pour votre requête. L’outil de suggestion de mots clés de Google Adwords (et Ubersuggest) reste très centré sur l’utilisation d’une expression-clé. Il faudra donc également tester plusieurs expressions de votre thématique pour collecter le maximum d’expressions-clés.
A partir de ces deux outils Google, vous allez pouvoir créer un fichier Excel reprenant l’ensemble des mots de votre thématique. Il conviendra donc de les regrouper comme vous le feriez pour une campagne Adwords, sans trop entrer dans les détails. A la différence d’une campagne Adwords, vous devez ajouter des mots dans plusieurs groupes car ils sont sémantiquement proches et devront apparaître sur la même page. En effet, même si votre page page de « chemise », il faudra utiliser les mots tels que « cravate », « veste », « mode », « coupe »…
A noter que j’ai trouvé un article très intéressant sur le le blog d’Aurélien Berrut un façon très visuel d’analyser les relations entre les mots clés provenant de l’outil de suggestion des mots-clés, grâce aux tables de fusions Google Drive.
2. Les méta-mots
La méthode des méta-mots a été mis en ligne par Christian Méline. Le principe est de générer une liste de lexies (liste de mots) à partir d’une analyse profonde de ce que Google reconnait comme signature sémantique dans les pages qu’il fait remonter sur chaque requête. Ensuite, on définit les mots les plus important à utilisant à partir d’un calcul de pondération TF-IDF. A priori, Christian a développé un tool qui permet de récupérer tout ça via un clic (pour ceux intéressé).
3. Le cocon sémantique
Le cocon sémantique est au départ un concept de silo orienté sur la demande (les besoins des internautes) développé par Laurent Bourrelly. Et pour ceux qui ont déjà pratiqué cette technique, la tête du corpus sémantique apparaître en regardant de manière globale les différentes pages de l’arborescence.
Pour les autres, voici un lien vers le cocon sémantique de Laurent concernant le SEO.
4. Answer the public
Dans la même veine que le cocon sémantique, vous pouvez utiliser le site Answerthepublic.com qui vous donne les questions que se posent les internautes sur un mot-clé.
Voici l’exemple sur la moto
5. 1.fr
C’est un outil récent qui est très efficace pour améliorer la pertinence de vos contenus grâce à l’utilisation de son champ sémantique.
Pour faire court, l’outil va scrapper les contenus qui se positionnent pour vous indiquer les mots et expressions à utiliser en complément de votre mot-clé afin de rendre votre texte pertinent aux yeux des moteurs de recherche. Seuls les requêtes avec un volume de reverche supérieur à 1000 (?) sont présentes mais c’est déjà pas mal !
1.fr est gratuit pour le moment. A utiliser de toute urgences !
6. S’inspirer de la concurrence
On n’y pense jamais assez mais vos concurrents sont de très bonnes sources d’inspiration. Je parle bien entendu des concurrents dans les SERPS.
Ma technique était empirique. Elle consistait à naviguer et à lire/scanner les pages qui se positionnaient sur l’expression cible et à relever les mots « croustillants » de la page, ceux qui donnent de la valeur au contenu. Les vidéos explicatives sont également une bonne source d’inspiration car elles sont faites (normalement) par des experts et utilisent donc le jargon.
Voici un exemple sur la page Jaguar de Wikipédia, sur le chapeau uniquement :
- mammifère carnivore
- Felidae
- félin
- tigre, lion, lépoard
- tacheté
- forêt tropicale
- prédateur solitaire
- chasseur / chasse à l’affût
- proies
- espèce menacée
7. Le livre pour enfant
C’est ma dernière et nouvelle technique. Je lis quasiment tous les soirs une histoire à mon plus grand fils. On aime tous les deux ce moment. Et j’ai pu remarquer que certains livres pour enfants cherchent à enrichir le vocabulaire de nos bambins. Et un jour, après la troisième lecture de Mini-loup et les pirates (si vous avez des enfants, vous savez ce que c’est de relire interminablement les mêmes histoires), j’ai eu un flash : sous mon nez se trouvait le corpus sémantique de la piraterie (flibustier, corsaire, trésor, coffre, carte, crâne, île…) et celui des bateaux qui est adjacent (tribord, mâte de misaine, chaloupe, flots, vague, nœud, voile, barre…). Peut être n’était-il pas complet (je ne maîtrise la sémantique de la piraterie) mais ce livre offre un bon point de départ pour, par exemple, une recherche des mots-clés.
Il existe également des livres d’autocollants expliquant un thème particulier (moto, astronaute, voiture, train…). Ce sont également de bons supports.
Mon fils est encore jeune et je pense que certains livres sont plus propices que d’autres pour extraire un corpus de qualité.
Cette méthode personnelle provient d’un constat simple : l’indice de fréquence relative des mots-clés utilisé par Google est calculé, entre-autres, à partir de tous les livres qu’il a numérisé… Eh oui ! on parle bien de papier !
8. Le dictionnaire analogique (merci à François)
Dans la même veine, on peut également s’inspirer du dictionnaire analogique. A partir d’un mot, on va trouver facilement les termes qui lui sont associés. Vous avez un exemple de dictionnaire analogique ici. Je ne sais pas s’il est disponible en entier en ligne mais c’est un bon début.
9. La méthode automatique (script php fourni) (merci à Cédric)
Le script php se trouve sur Github et provient du forum gratuit script-seo. Je ne l’ai pas encore testé mais, a priori, il doit fonctionner. On peut réaliser un corpus à partir d’une recherche Google ou d’un ensemble de sites.
Si vous avez d’autres techniques pour créer votre corpus sémantique, n’hésitez pas à les partager en commentaires !
Très intéressant. J’avais entendu parler de answerthepublic.com mais je ne l’avais jamais utilisé.
Pour compléter, il y a un sujet très intéressant sur Scripts SEO dans lequel @Christophebe propose un script pour générer automatiquement un corpus sémantique –> http://scripts-seo.com/topic-4900-generation-d-un-corpus-semantique-page-1.html. A tester également.
Marrant l’histoire du soir. Dans le même genre quoique moins rigolo, le dictionnaire analogique… Une véritable mine.
@Cédric : oui mais il faut avoir un compte pour accéder au script…
@François : je l’ajoute à l’article mais le dictionnaire des analogies reste moins sympa à lire qu’une histoire pour enfant ^^
Pour accéder au topic sur le forum, il suffit de s’inscrire et de se présenter. C’est tout :)
Sinon voici le lien pour accéder directement au projet sur Github : https://github.com/christophebe/generate-corpus
Oui je suis amplement d’accord avec toi. Je trouve que ton article très sympa grâce à ce « climax » en lien avec ces histoires du soir (je pratique aussi ^^) ! Et l’idée de faire un récap’ des méthodes et excellente ! Merci :-)
Merci à Cédric pour la mention. Ce module est encore un peu expérimental. Je vai l’améliorer d’ici l’été et y ajouter une interface web pour les non dev.
Merci pour la citation…
Les meta-mots ne reposent toutefois pas du tout sur les TITLE, mais sur une analyse profonde de ce que Google reconnait comme signature sémantique dans les pages qu’il fait remonter sur chaque requête.
On est à des kms des cooccurrences and co, tant dans les effets sur le positionnement que sur l’analyse.
Bonjour Christian
C’est ce que j’avais cru lire mais j’ai du passé à côté des autres éléments. J’ai mis à jour l’article.
Ca me paraissait aussi trop simpliste de se base uniquement sur la balise TITLE…
Je reconnais deux sources très récentes là, 1.fr et answerthepublic.com qui méritent le détour, J’ai eu le plaisir d’essayer 1.fr il y a un bon moment, puis l’outil était en mode « maintenance », et voilà qu’aujourd’hui je l’ai retrouvé et l’ai re-testé, et ça marche nickel… Comme toujours il faut analyser plusieurs données pour vraiment tirer profit de la puissance des outils. Sinon, merci pour cette liste, et merci à Cedric pour le lien direct vers le script github. Vous êtes super!!!
A ceux qui ont du temps, lire le conte « un gâteau cent fois bon ».
Pour les pressés: tu prends les 100 meilleurs ingrédients et le résultat est immangeable.