Sémantique & SEO : Petit précis de sémantique à l’usage des honnêtes gens


Parce qu’il est grand temps de remettre les pendules à l’heure et d’appeler un chat un chat, il va bien falloir qu’on vous dise qu’en terme de SEO la vérité est ailleurs … Pourquoi cette introduction digne d’une Keynote Apple ? Parce qu’on va parler sémantique les mecs, et que la sémantique, comme tout ce qui se termine en « ique » : ça fait mal au crâne. Alors à toi qui vient d’enchainer une semaine de boulot des plus hardcore, à toi qui lutte contre un état grippal, tu peux d’ores et déjà abandonner la lecture de ce billet (et l’épingler dans tes favoris au cas où …). Aux courageux qui comptent poursuivre leur lecture, découvrez le pourquoi du comment votre stratégie SEO doit être basée sur une analyse sémantique plutôt que sur des mots clés (terme devenu bien trop vulgaire à mon gout) …

La sémantique, c’est quoi ?

Reprenons depuis la base si tu le veux bien, la sémantique est une des branches de la linguistique qui étudie le sens des mots (ou des morphèmes) qui composent un contenu (le signifié). L’analyse sémantique d’un texte (ou dans notre cas, d’une page web ou d’un site) permet donc d’étudier en profondeur la signification des mots et de leur interaction, dans leur contexte global. Prenons un exemple qui va mettre tout le monde d’accord : le mot « serveur » va revêtir des significations différentes en fonction du contexte sémantique dans lequel il va être employé : il peut être "un employé de la restauration", ou alors désigner "un matériel informatique", tout dépend donc du champ sémantique auquel il sera associé. Maintenant qu'on sait ce qu'est la sémantique, revenons un peu en arrière, pour comprendre ce que (bigre) elle peut venir faire dans le SEO ?

SEO & sémantique : au commencement …

L’ingéniosité de notre ami Google, c’est bien d’avoir réussi au fil des années à combiner plusieurs algorithmes existants, à les remodeler pour faire prendre une belle petite mayonnaise qui permet de répondre de plus en plus finement à une requête donnée. Pour comprendre comment la sémantique est venue s’incruster dans le travail du référenceur, il faut remonter à 2003 lorsque l’algorithme de HILLTOP vient introduire le concept de pertinence thématique dans l’algo de Google. Parce que tu comprends bien que ce concept de « pertinence thématique » induit forcément l’analyse du sens du contenu … (tu comprends pas ? Relis la définition de sémantique plus haut). Parcourons ces algos fondateurs … (au pire, tu pourras briller en société !).

  • L’algorithme de HILLTOP : Avec la fin des Google Dance mensuelles (kikou les darons du SEO), l’algorithme de Hilltop bouleverse la manière dont est calculée la popularité des pages basée sur le Page Rank. La popularité d’une page est maintenant définie en fonction d’une thématique, et du nombre de liens en provenance de site experts (dans la même thématique) qu’elle reçoit. La thématique (et donc la sémantique) vient alors imprégner le SEO. 
  • LSI (Latent semantic indexation) ou indexation sémantique latente : formule mathématique qui permet d’analyser les relations entre un document et un corpus sémantique. Le corpus sémantique étant l’ensemble des termes utilisés autour d’un même concept par un groupe de pages web (ou de documents).
  • Le cosinus de Salton (Gerry pour les intimes) : Bien plus vieille que Google, cette formule mathématique permet d’établir un classement de documents dans un espace vectoriel défini et puis de les comparer entre eux afin d’identifier ceux qui sont le plus proche sémantiquement d'une requête. (Tiens, tiens, ça te rappelle rien ?) On parle alors de fouille sémantique, « Text mining ».

cosinus de salton

  • TF-IDF : dans la même démarche que le cosinus de Salton, cette méthode de pondération des mots clés vulgarisée par les frères Peyronnet, vise à accorder une pertinence lexical à un document relativement à un ensemble de documents partageant des similarités lexicales. Cette mesure statistique évalue l'importance d'un terme contenu dans un document, relativement à une collection ou un corpus.

C’est sur la base de ces principes sémantiques qu’a pu évoluer le ranking des pages dans notre moteur de recherche préféré : du PageRank ; on passera au PageRank thématique pour arriver au RankBrain … Comprends bien par-là que dans la volonté d’affiner les résultats proposés à l’internaute suite à une requête précise, l’algorithme s’efforce d’avoir une compréhension de plus en plus fine des contenus proposés, de plus en plus « humanisée ».

Quand la sémantique est au SEO ce que ….

Tu m’excuseras, j’ai eu la flemme de trouver la métaphore qui claque, je te propose, si tu trouves de commenter ce billet. Cordialement.

Pour la sphère SEO, il est devenu essentiel de maitriser les grands concepts de sémantique lorsqu’il s’agira de penser, élaborer et structurer une stratégie de contenus. Sans pour le moment sombrer dans le cœur du poulet parce que tu n’y es pas encore préparé, je te propose dans un premier temps de parcourir les notions importantes :

  • Champs sémantique et champs lexical : same same ? (but different) prenons un exemple, ce sera plus parlant … Les termes rose, bleu ou mate appartiennent au champ lexical de la couleur, alors même que le champ sémantique du mot « rose » comprend à la fois le signifié de la fleur et de la couleur. Tu saisis la nuance ?
  • Principe de Cooccurrences : Alors qu'il y a quelques années, chaque contenu SEO était optimisé sur une expression clés, aujourd'hui ce n'est plus suffisant. Le contexte sémantique devra également être ajouté au contenu en 2nd plan (on vous parlera d'expressions secondaire, de 2e plan). Capitch ? Tu as donc compris le principe de cooccurrences. Il s’agit d’ajouter dans le contenu des termes habituellement associés au mot-clé principal. : « légende », « symbolique », « magique » ou « animal légendaire » sont ainsi des cooccurrences de « licorne » (notez qu’on ne se limite pas ici aux synonymes, mais bien au contexte, à l'univers sémantique). La cooccurrence permet donc d’optimiser le score sémantique d’une page en imprégnant le contenu du sens recherché par les visiteurs.
  • Cocon sémantique : rendons à César ce qui est à César, le concept de cocon sémantique a été théorisé par Laurent Bourelly, (auto-proclamé SEO Rockstar, qu’on ne vous présentera plus). Ce concept est difficilement vulgarisable et il va m’être difficile de vous le résumer en quelques mots. Retenez simplement que pour « pousser » une LP sur une requête donnée, il s’agira de définir une stratégie de contenus connexes, répartis sur des pages complémentaires qui viendront étoffer le contexte sémantique de la page cible à l’aide d’un maillage interne élaboré.
  • Meta mots, lexie et empreinte sémantique : Accroche-toi bien à ton string pour ce concept parce que là, tu vas voir qu’on arrive à quelque chose de crucial. Les meta-mots sont composés de plusieurs lexies pour former une empreinte qui déterminera si oui ou non votre page est pertinente pour ranker sur une requête précise. Le metamot est donc une liste de mots (lexie) avec chacun une "note" d'attirance ou d'importance. On a donc : 1 objectif de positionnement (requête cible) = 1 meta-mot composé de plusieurs lexies pour représenter l’empreinte la plus pertinente. Capitch ? 

Vous me voyez venir, l’habitude nous pousse par formation (ou déformation) à parler de mots clés, de liste de mots clés, mais on devrait plutôt parler d’expressions clés ou de requête cible comme de l’expression définissant le mieux votre page pour un internaute qui la recherche sur un moteur de recherche sans connaitre auparavant votre page … Pour chacune de ces requêtes cible, on définira le metamot qui sera composé de plusieurs lexie. 

Voici un exemple imagé du très grand Mossieur Méline qui a tout de suite éclairé ma lanterne et qui m’a semblé coller à la revanche des sites (ton agence SEO préférée).

meta mots et lexie

Luc pose une question à Yoda, Yoda lui répond : “Attendre pour savoir tu dois”

Quelques jours après, Luc repose sa question à Yoda : Yoda lui répond : “Attendre pour savoir tu dois”

Un mois passe et Luc retente sa chance : Yoda lui répond encore : “Attendre pour savoir tu dois”

Après plusieurs autres tentatives, Luc obtient enfin sa réponse et Yoda de lui dire : “Ce que tu observes n’existe que si le temps existe”.

C'est le système de cooccurrences qui va définir le terme de positionnement et son univers sémantique “Attendre pour savoir tu dois” (car cela a beaucoup été répété).

Les champs lexicaux suivants devront être ajoutés au contenu : “Le savoir prend du temps pour être acquis”.

Les metamots : “Ce que tu observes n’existe que si le temps existe”. Pourquoi ? Parce que c’est cette réponse qui est importante.

COGITUM …

(Ça y est, tu peux prendre ton doliprane …)

Maintenant que t’es chaud bouillant et que tu peux briller en société avec quelques concepts clés de sémantique appliquée au SEO, tu vas pouvoir te préparer psychologiquement à sortir de la théorie pour passer aux choses sérieuses. Dans le prochain opus dédié à la sémantique, je t’expliquerai plus précisément comment mettre en application l’analyse sémantique de ton site et élaborer et/ou optimiser une stratégie de contenu à l’aide de cocons sémantiques. T'as hâte hein ? Allez, dis le que t'as hâte …  

Étiquettes :

<

ou contactez-nous au