Référencer son site en chine – Baidu et ses complexités (1/2)


Le marché chinois

Plus d’ 1 demi-milliard d’internautes … ça donne le vertige mais c’est LE chiffre à retenir à propos du marché chinois. Ajoutez à ça un taux de croissance à plus de 7% (Le Monde.fr) et l’augmentation du pouvoir d’achat des chinois et vous comprendrez pourquoi de nombreuses entreprises ont décidé de partir à la conquête d’un nouveau marché en pleine expansion. Si certaines ont opté pour un déménagement dans l'empire du milieu, d’autres ont choisi de tout simplement s’y implanter de manière numérique, afin de toucher cette cible via internet. Seulement voilà, il y a un hic… Google étant mis au placard en Chine car il refuse de se prêter au jeu de la censure imposé par le gouvernement, c’est majoritairement sur Baidu, sans oublier Qihoo360 (devenu so puis Haosouet Sogou, qu’il faut se diriger et c’est là que la tache se complique.

Google contre la censure de baidu

 

En chine, la concurrence entre ces différents moteurs de recherche est très forte et de ce fait, chacun tente de tirer son épingle du jeu en redoublant d’efforts, de services à gogo et d’innovations. Sogou a par exemple intégré les messages Wechat à son moteur tandis que 360.cn laisse les internautes décider du positionnement des sites.

part de marché des moteurs de recherche Chine

Intéressons-nous au moteur de recherche pour le moment majoritaire en chine : Baidu. Le référencement sur Baidu reste obscur mais c’est bien ce qui attend les référenceurs de France et de Navarre ! Sur certains points, on pourrait assimiler l’algorithme de Baidu à celui de Google il y a quelques années de ça. Voici les principaux conseils Onsite (les critères Offsite feront l’objet d’un second article) pour un référencement sur le 1er moteur de recherche en Chine.

Entrons dans les méandres de Baidu

 

Les incontournables pour référencer un site en Chine

On ne trouve que peu d’entreprises capables de vous référencer sous Baidu, parce que la démarche est différente de celle que nous connaissons avec Google et il est surtout difficile de s’y imposer. Observons précisément les critères qui vous permettront de vous démarquer dans les SERP de Baidu.

 

Acheter un nom de domaine chinois …

La première chose à faire pour un bon référencement sur Baidu, c’est d’avoir un nom de domaine avec une extension en .cn ou à la rigueur .com.cn. Baidu a en effet une préférence pour les .com mais surtout pour les .cn. Certains pourront crier au chauvinisme ou à l’esprit nationaliste, NON Baidu est un moteur de recherche pour les chinois qui référence en priorité les sites chinois tout simplement.

Important : les baidu spiders sont plutôt paresseuses et donc Baidu ne crawl pas spontanément les sites en https, c’est pourquoi beaucoup de sites en https:// ne sont tout simplement pas indexés par Baidu. Comment faire indexer un site en https par Baidu ?

>> Recourir à une astuce : utiliser le « robots.txt » et ses modalités « user-agent » pour déterminer les visiteurs. Mettre un Allow: sur Baiduspider vers la version http, mais placer une redirection 301 pour rediriger l’utilisateur sur la version https.

 

Le célèbre hébergeur OVH propose une page dédiée aux Noms de domaine en .cn 

 

… et héberger votre site en Chine.

Votre site internet doit transpirer le Made in China par tous ses « ports » ! L’hébergement n’y échappe donc pas puisque Baidu a mis en place un système de malus pour les sites hébergés en dehors du territoire. Je vous le rappelle : Baidu est chinois, créé pour les chinois et donc indexe les sites chinois en priorité.

La Licence ICP (abréviation pour fournisseur de contenu Internet) est également requise pour l’exécution d’e-commerce en Chine. Sans cette licence, votre site e-commerce sera fermé par le gouvernement chinois.

Pour un hébergement en Chine : Il existe deux principaux fournisseurs de services de télécommunications en Chine : China Telecom et China Netcom. Vous pouvez également héberger vous-mêmes votre site Web ou faire appel à une entreprise d’hébergement Web, telle que HiChina. Il est préférable d’utiliser des serveurs multi-lignes.

 

Optimisation SEO Onsite

La différence de Baidu

LA grande différence de Baidu avec son homologue américain est qu’il emploie des personnes qui viennent auditer votre site dès sa première inscription sur le moteur puis 1 fois par an. Il ne faut donc surtout pas vous louper lors de ce premier audit ! Soignez votre design et votre arborescence, corrigez les éventuelles erreurs, éliminez les bugs et enrichissez votre site en contenu avant de le soumettre sur Baidu. A cette étape, les 5 premières pages de votre site sont déterminantes pour votre positionnement.

Pour soumettre votre site à la plate-forme de Baidu 

A savoir : depuis 2011, c'est Bing qui gère les recherches de Baidu pour les mots clés en langue anglaise sur le moteur chinois. Cet accord avait accru la présence de Bing dans un pays fort de 632 millions* d'internautes permettant ainsi au moteur de Microsoft de prendre un avantage sur son rival Google, qui refuse de se soumettre à la censure gouvernementale chinoise.

Pour faire simple, si vous êtes positionné dans le top 3 sur Bing pour votre site anglophone et dans le  top 3 pour votre site Chinois simplifié, vous serez bien plus visible sur le marché chinois.

*Source : AFP – 21/07/2014

 

Aspects techniques

Optimiser votre site pour les smartphones

Techniquement, la première chose à laquelle vous devez penser, c’est que 80% des internautes chinois (source : journaldunet.com) surfent via leur mobile. Ils sont passés directement de l’ère de l’ordinateur à celle du smartphone. Il faut donc que votre site soit accessible et optimisé pour tous types de smartphones et tablettes : optez pour un site en responsive design

Les urls

Baidu attache de l’importance à une structure d’Url aussi simple que possible. Baidu favorisera les domaines écrits en pinyin (système officiel de retranscription des caractères chinois en latin) à ceux écrits en anglais. Exemple : Baidu en chinois = 百度, en pinyin = bǎi dù.

Vos url doivent être :

  • Courtes et rédigées intégralement en Pinyin
  • Uniques et sans paramètres
  • Baidu attache plus d’importance aux URL absolues

Les liens doivent être intégrés en Blank car les chinois sont habitués à avoir un nouvel onglet qui s’ouvre lorsqu’ils cliquent sur un lien. Comme notre ami Google, ils trouvent que c’est une manière plus « naturelle » de naviguer, comme si chaque lien ouvrait réellement une toute autre page web.

 

HTML, Flash et JS

Les spiders Baidu ne savent pas lire le Flash ou même le JavaScript, il vaut donc mieux préférer des pages en full HTML. Sur un site Chinois, vous ne pourrez pas utiliser ISO-8885-1. Les deux plates-formes de codage à utiliser sont :

o   UTF-8,

o   GB2312

Des deux, l’encodage UTF-8 serait considéré comme meilleur, car il fonctionne avec toutes les langues du monde. Minimisez également les frames et iframes car les spiders de Baidu peuvent tout simplement en ignorer le contenu.

 

Les modules de paiement

Si vous envisagez de conquérir la Chine avec un e-commerce, 3 méthodes de paiement prédominent en Chine. Le paiement direct par carte de crédit, (les internautes doivent d’abord ouvrir le serveur en ligne de leur banque). La solution de paiement Alipay occupe la moitié du marché. Le troisième et le préféré des chinois, est le paiement en cash à la livraison qu’ils trouvent tout simplement plus secure.

 

Le Contenu Edito

Définissez clairement votre positionnement et vos mots clés

Enfin une étape similaire à celle du géant américain. En effet, l’analyse des requêtes des internautes reste une étape primordiale afin de déterminer le positionnement des pages d’un site. Seuls les outils d’analyse et de recherche sont différents.

A la manière de Google, Baidu a conçu plusieurs outils pour vous aider à définir vos mots clés :

Favorisez les termes de longue traine car sur les mots clés génériques et intéressants en terme de business, Baidu propose jusqu’à 11 résultats publicitaires puis viendront ses propres sites (Baike, Tieba, …) et enfin les sites qui répondent naturellement à la requête.

Vous l’avez compris, Baidu fait un peu ce qu’il veut dans les SERP : La preuve, il a propulsé son encyclopédie Baike qui occupe les 1ères positions sur tous les mots clés.

Vos URLs, meta et titres éditoriaux (H1, H2, H3, etc.) devront comporter ces mots-clés de positionnement. Quant à votre contenu textuel, il ne faut pas le négliger car la densité de mots-clés est encore un facteur essentiel pour Baidu, le champ lexical l’est moins.

 

Les balises title et méta

Retournons quelques années en arrière avec Google… Au temps où il suffisait de répéter les mots-clés vous permettait de vous positionner de manière simple et surtout efficace. Avec Baidu, si vous souhaitez vous positionner sur un mot-clé, ne cherchez pas plus loin : répétez-le dans la balise title et la meta-description. La balise meta Keywords semble être encore d’actualité, donc complétez-la. Par contre, comme pour Google, certains référenceurs prédisent qu’elle sera bientôt abandonnée. Les méta title doivent par contre être rédigés en chinois et ne pas dépasser 33 caractères chinois.

 

Contenu : la quantité plutôt que la qualité

Baidu préfère les sites énormes avec de très nombreuses pages. Les forums ayant énormément de pages présentent donc un Trustrank Baidu élevé. Cela correspond à ce que recherchent les chinois lorsqu’ils ont besoin d’une information. Tous les moteurs de recherche aiment la quantité, mais Google indexe un site par sa thématique, Baidu… un peu moins. Logique car les portails d’informations chinois traitent de tout et n’importe quoi, il est donc difficile de les trier par catégorie.

 

La fréquence de mise à jour

Les moteurs Google & Bing aiment les mises à jour fréquentes, mais Baidu, lui, il les adore encore plus. Les robots Baidu remettent leur base de données à jour chaque semaine, en fonction de l’importance des pages et de leur date, et accorderont des « bonus » aux pages nouvellement indexées. Le moteur de recherche s’est en effet adapté à la population chinoise qui préfère le contenu récent. Les forums et blogs parlant de sujets de la vie quotidienne sont donc bien positionnés car souvent mis à jour.

 

L’importance de la Homepage

Baidu tient énormément compte de la page d’accueil d’un site, qui doit être rédigée exclusivement en chinois. Le chinois doit être présent partout sur votre site si vous espérez obtenir un positionnement à moyen-long terme sur Baidu. Par contre, vous pouvez oublier Google Traduction et autre reverso car une traduction en chinois approximatif ne suffira pas. Il faut en effet une traduction irréprochable en mandarin.

Selon Bill Hunt, spécialiste en marketing sur les moteurs de recherche, afin de faciliter le travail des robots Baidu qui veulent analyser un maximum de contenu, en un minimum de temps, le contenu le plus important doit se trouver en haut de page. Plus on descend dans la page, moins le contenu est important.

Baidu accorderait moins d’importance aux pages profondes d’un site. Une page d’accueil aura plus de poids face à une page annexe. Ce système permettrait de donner la priorité aux sites chinois dont la page d’accueil est très, très … très longue. C’est d’ailleurs pour cela aussi que les pages d’accueil des sites chinois sont en général ultra chargées. Exemple : ¼ de la Homepage de Sohu 

Homepage site chinois

 

Duplicate Content vous avez dit ?

Le duplicate externe

Les moteurs chinois se sont adaptés aux lois Chinoises : on ne pénalise pas la contrefaçon, en référencement c’est pareil, le contenu dupliqué n’est pas pénalisé comme sur Google. Ainsi chaque définition de Baike est copiée et recopiée des milliers de fois par les autres sites qui traiteront du même sujet (sans utiliser de guillemets bien évidemment).

Sur Baidu, le copier-coller en masse est devenu légion. Il n’y a apparemment aucune règle de duplicate content. Tous les sites pompent les news des sites populaires tels que Xinhua, Sohu ou Baike sans aucune reformulation.

Attention, nous n’avançons pas qu’il FAUT copier-coller vos contenus et générer du duplicate interne, c’est juste une info à garder dans un coin de votre esprit. Il est courant de voir des contenus similaires entre différents sites chinois, et attendez-vous donc à voir vos contenus se dupliquer ailleurs que sur votre site.

Le duplicate interne

Baidu a récemment incité les webmasters à mettre en place des balises Canonical pour empêcher le Duplicate Content interne, mais rien ne garantit que le moteur de recherche la prendra en compte et la respectera. La recommandation de Baidu est donc :

  • d’utiliser la canonical dans les pages qui sont 100% similaires, ainsi l’effet induit sera plus intéressant.
  • de vous assurer que les pages sur lesquelles vous placez des canonical sont réellement intégralement similaires. Si Baidu découvre qu’il y a ne serait-ce qu’une légère différence, il pourra ignorer toutes les canonical placées sur votre site

Attention, la prise en compte de la canonical par Baidu est encore plutôt faible.

 

Les Rich Snippets

Baidu ne prenant pas en compte les micro data schema.org ou Data-vocabulary.org, ils ont mis en place un système de données enrichies payantes : Baidu Shantou. Le principe est simple : plutôt que de placer du code HTML dans le code source, avec Baidu, il suffit de payer pour avoir des résultats de recherche enrichis : de la même manière, on peut afficher les prix d’un produit, les événements à venir, etc. dans les SERP.

En attendant (impatiemment) la suite de cet article, souhaitons bon voyage à Sylvain Garin qui part très bientôt en Chine afin de développer la Revanche des Sites dans l'empire du milieu … 一路順風 (Yīlù shùnfēng).

 

<

Référencer son site en chine – Baidu et ses complexités (1/2)


Le marché chinois

Plus d’ 1 demi-milliard d’internautes … ça donne le vertige mais c’est LE chiffre à retenir à propos du marché chinois. Ajoutez à ça un taux de croissance à plus de 7% (Le Monde.fr) et l’augmentation du pouvoir d’achat des chinois et vous comprendrez pourquoi de nombreuses entreprises ont décidé de partir à la conquête d’un nouveau marché en pleine expansion. Si certaines ont opté pour un déménagement au pays du soleil levant, d’autres ont choisi de tout simplement s’y implanter de manière numérique, afin de toucher cette cible via internet. Seulement voilà, il y a un hic… Google étant mis au placard en Chine car il refuse de se prêter au jeu de la censure imposé par le gouvernement, c’est majoritairement sur Baidu, sans oublier Qihoo360 (devenu so puis Haosouet Sogou, qu’il faut se diriger et c’est là que la tache se complique.

Google contre la censure de baidu

 

En chine, la concurrence entre ces différents moteurs de recherche est très forte et de ce fait, chacun tente de tirer son épingle du jeu en redoublant d’efforts, de services à gogo et d’innovations. Sogou a par exemple intégré les messages Wechat à son moteur tandis que 360.cn laisse les internautes décider du positionnement des sites.

part de marché des moteurs de recherche Chine

Intéressons-nous au moteur de recherche pour le moment majoritaire en chine : Baidu. Le référencement sur Baidu reste obscur mais c’est bien ce qui attend les référenceurs de France et de Navarre ! Sur certains points, on pourrait assimiler l’algorithme de Baidu à celui de Google il y a quelques années de ça. Voici les principaux conseils Onsite (les critères Offsite feront l’objet d’un second article) pour un référencement sur le 1er moteur de recherche en Chine.

Entrons dans les méandres de Baidu

 

Les incontournables pour référencer un site en Chine

On ne trouve que peu d’entreprises capables de vous référencer sous Baidu, parce que la démarche est différente de celle que nous connaissons avec Google et il est surtout difficile de s’y imposer. Observons précisément les critères qui vous permettront de vous démarquer dans les SERP de Baidu.

 

Acheter un nom de domaine chinois …

La première chose à faire pour un bon référencement sur Baidu, c’est d’avoir un nom de domaine avec une extension en .cn ou à la rigueur .com.cn. Baidu a en effet une préférence pour les .com mais surtout pour les .cn. Certains pourront crier au chauvinisme ou à l’esprit nationaliste, NON Baidu est un moteur de recherche pour les chinois qui référence en priorité les sites chinois tout simplement.

Important : les baidu spiders sont plutôt paresseuses et donc Baidu ne crawl pas spontanément les sites en https, c’est pourquoi beaucoup de sites en https:// ne sont tout simplement pas indexés par Baidu. Comment faire indexer un site en https par Baidu ?

 

>> Recourir à une astuce : utiliser le « robots.txt » et ses modalités « user-agent » pour déterminer les visiteurs. Mettre un Allow: sur Baiduspider vers la version http, mais placer une redirection 301 pour rediriger l’utilisateur sur la version https.

 

Le célèbre hébergeur OVH propose une page dédiée aux Noms de domaine en .cn : https://www.ovh.com/fr/domaines/dotcn.xml

 

… et héberger votre site en Chine.

Votre site internet doit transpirer le Made in China par tous ses « ports » ! L’hébergement n’y échappe donc pas puisque Baidu a mis en place un système de malus pour les sites hébergés en dehors du territoire. Je vous le rappelle : Baidu est chinois, créé pour les chinois et donc indexe les sites chinois en priorité.

La Licence ICP (abréviation pour fournisseur de contenu Internet) est également requise pour l’exécution d’e-commerce en Chine. Sans cette licence, votre site e-commerce sera fermé par le gouvernement chinois.

Pour un hébergement en Chine : Il existe deux principaux fournisseurs de services de télécommunications en Chine : China Telecom et China Netcom. Vous pouvez également héberger vous-mêmes votre site Web ou faire appel à une entreprise d’hébergement Web, telle que HiChina. Il est préférable d’utiliser des serveurs multi-lignes.

 

Optimisation SEO Onsite

 

La différence de Baidu

LA grande différence de Baidu avec son homologue américain est qu’il emploie des personnes qui viennent auditer votre site dès sa première inscription sur le moteur puis 1 fois par an. Il ne faut donc surtout pas vous louper lors de ce premier audit ! Soignez votre design et votre arborescence, corrigez les éventuelles erreurs, éliminez les bugs et enrichissez votre site en contenu avant de le soumettre sur Baidu. A cette étape, les 5 premières pages de votre site sont déterminantes pour votre positionnement.

Pour soumettre votre site à la plate-forme de Baidu 

A savoir : depuis 2011, c'est Bing qui gère les recherches de Baidu pour les mots clés en langue anglaise sur le moteur chinois. Cet accord avait accru la présence de Bing dans un pays fort de 632 millions* d'internautes permettant ainsi au moteur de Microsoft de prendre un avantage sur son rival Google, qui refuse de se soumettre à la censure gouvernementale chinoise.

Pour faire simple, si vous êtes positionné dans le top 3 sur Bing pour votre site anglophone et dans le  top 3 pour votre site Chinois simplifié, vous serez bien plus visible sur le marché chinois.

 

*Source : AFP – 21/07/2014

 

Aspects techniques

Optimiser votre site pour les smartphones

Techniquement, la première chose à laquelle vous devez penser, c’est que 80% des internautes chinois (source : journaldunet.com) surfent via leur mobile. Ils sont passés directement de l’ère de l’ordinateur à celle du smartphone. Il faut donc que votre site soit accessible et optimisé pour tous types de smartphones et tablettes : optez pour un site en responsive design

Les urls

Baidu attache de l’importance à une structure d’Url aussi simple que possible. Baidu favorisera les domaines écrits en pinyin (système officiel de retranscription des caractères chinois en latin) à ceux écrits en anglais. Exemple : Baidu en chinois = 百度, en pinyin = bǎi dù.

Vos url doivent être :

  • Courtes et rédigées intégralement en Pinyin
  • Uniques et sans paramètres
  • Baidu attache plus d’importance aux URL absolues

 

Les liens doivent être intégrés en Blank car les chinois sont habitués à avoir un nouvel onglet qui s’ouvre lorsqu’ils cliquent sur un lien. Comme notre ami Google, ils trouvent que c’est une manière plus « naturelle » de naviguer, comme si chaque lien ouvrait réellement une toute autre page web.

 

HTML, Flash et JS

Les spiders Baidu ne savent pas lire le Flash ou même le JavaScript, il vaut donc mieux préférer des pages en full HTML. Sur un site Chinois, vous ne pourrez pas utiliser ISO-8885-1. Les deux plates-formes de codage à utiliser sont :

o   UTF-8,

o   GB2312

Des deux, l’encodage UTF-8 serait considéré comme meilleur, car il fonctionne avec toutes les langues du monde. Minimisez également les frames et iframes car les spiders de Baidu peuvent tout simplement en ignorer le contenu.

 

Les modules de paiement

Si vous envisagez de conquérir la Chine avec un e-commerce, 3 méthodes de paiement prédominent en Chine. Le paiement direct par carte de crédit, (les internautes doivent d’abord ouvrir le serveur en ligne de leur banque). La solution de paiement Alipay occupe la moitié du marché. Le troisième et le préféré des chinois, est le paiement en cash à la livraison qu’ils trouvent tout simplement plus secure.

 

Le Contenu Edito

Définissez clairement votre positionnement et vos mots clés

Enfin une étape similaire à celle du géant américain. En effet, l’analyse des requêtes des internautes reste une étape primordiale afin de déterminer le positionnement des pages d’un site. Seuls les outils d’analyse et de recherche sont différents.

A la manière de Google, Baidu a conçu plusieurs outils pour vous aider à définir vos mots clés :

Favorisez les termes de longue traine car sur les mots clés génériques et intéressants en terme de business, Baidu propose jusqu’à 11 résultats publicitaires puis viendront ses propres sites (Baike, Tieba, …) et enfin les sites qui répondent naturellement à la requête.

Vous l’avez compris, Baidu fait un peu ce qu’il veut dans les SERP : La preuve, il a propulsé son encyclopédie Baike qui occupe les 1ères positions sur tous les mots clés.

Vos URLs, meta et titres éditoriaux (H1, H2, H3, etc.) devront comporter ces mots-clés de positionnement. Quant à votre contenu textuel, il ne faut pas le négliger car la densité de mots-clés est encore un facteur essentiel pour Baidu, le champ lexical l’est moins.

 

Les balises title et méta

Retournons quelques années en arrière avec Google… Au temps où il suffisait de répéter les mots-clés vous permettait de vous positionner de manière simple et surtout efficace. Avec Baidu, si vous souhaitez vous positionner sur un mot-clé, ne cherchez pas plus loin : répétez-le dans la balise title et la meta-description. La balise meta Keywords semble être encore d’actualité, donc complétez-la. Par contre, comme pour Google, certains référenceurs prédisent qu’elle sera bientôt abandonnée. Les méta title doivent par contre être rédigés en chinois et ne pas dépasser 33 caractères chinois.

 

Contenu : la quantité plutôt que la qualité

Baidu préfère les sites énormes avec de très nombreuses pages. Les forums ayant énormément de pages présentent donc un Trustrank Baidu élevé. Cela correspond à ce que recherchent les chinois lorsqu’ils ont besoin d’une information. Tous les moteurs de recherche aiment la quantité, mais Google indexe un site par sa thématique, Baidu… un peu moins. Logique car les portails d’informations chinois traitent de tout et n’importe quoi, il est donc difficile de les trier par catégorie.

 

La fréquence de mise à jour

Les moteurs Google & Bing aiment les mises à jour fréquentes, mais Baidu, lui, il les adore encore plus. Les robots Baidu remettent leur base de données à jour chaque semaine, en fonction de l’importance des pages et de leur date, et accorderont des « bonus » aux pages nouvellement indexées. Le moteur de recherche s’est en effet adapté à la population chinoise qui préfère le contenu récent. Les forums et blogs parlant de sujets de la vie quotidienne sont donc bien positionnés car souvent mis à jour.

 

L’importance de la Homepage

Baidu tient énormément compte de la page d’accueil d’un site, qui doit être rédigée exclusivement en chinois. Le chinois doit être présent partout sur votre site si vous espérez obtenir un positionnement à moyen-long terme sur Baidu. Par contre, vous pouvez oublier Google Traduction et autre reverso car une traduction en chinois approximatif ne suffira pas. Il faut en effet une traduction irréprochable en mandarin.

Selon Bill Hunt, spécialiste en marketing sur les moteurs de recherche, afin de faciliter le travail des robots Baidu qui veulent analyser un maximum de contenu, en un minimum de temps, le contenu le plus important doit se trouver en haut de page. Plus on descend dans la page, moins le contenu est important.

Baidu accorderait moins d’importance aux pages profondes d’un site. Une page d’accueil aura plus de poids face à une page annexe. Ce système permettrait de donner la priorité aux sites chinois dont la page d’accueil est très, très … très longue. C’est d’ailleurs pour cela aussi que les pages d’accueil des sites chinois sont en général ultra chargées. Exemple : ¼ de la Homepage de Sohu 

Homepage site chinois

 

Duplicate Content vous avez dit ?

Le duplicate externe

Les moteurs chinois se sont adaptés aux lois Chinoises : on ne pénalise pas la contrefaçon, en référencement c’est pareil, le contenu dupliqué n’est pas pénalisé comme sur Google. Ainsi chaque définition de Baike est copiée et recopiée des milliers de fois par les autres sites qui traiteront du même sujet (sans utiliser de guillemets bien évidemment).

Sur Baidu, le copier-coller en masse est devenu légion. Il n’y a apparemment aucune règle de duplicate content. Tous les sites pompent les news des sites populaires tels que Xinhua, Sohu ou Baike sans aucune reformulation.

Attention, nous n’avançons pas qu’il FAUT copier-coller vos contenus et générer du duplicate interne, c’est juste une info à garder dans un coin de votre esprit. Il est courant de voir des contenus similaires entre différents sites chinois, et attendez-vous donc à voir vos contenus se dupliquer ailleurs que sur votre site.

Le duplicate interne

Baidu a récemment incité les webmasters à mettre en place des balises Canonical pour empêcher le Duplicate Content interne, mais rien ne garantit que le moteur de recherche la prendra en compte et la respectera. La recommandation de Baidu est donc :

  • d’utiliser la canonical dans les pages qui sont 100% similaires, ainsi l’effet induit sera plus intéressant.
  • de vous assurer que les pages sur lesquelles vous placez des canonical sont réellement intégralement similaires. Si Baidu découvre qu’il y a ne serait-ce qu’une légère différence, il pourra ignorer toutes les canonical placées sur votre site

Attention, la prise en compte de la canonical par Baidu est encore plutôt faible.

 

Les Rich Snippets

Baidu ne prenant pas en compte les micro data shema.org ou Data-vocabulary.org, ils ont mis en place un système de données enrichies payantes : Baidu Shantou. Le principe est simple : plutôt que de placer du code HTML dans le code source, avec Baidu, il suffit de payer pour avoir des résultats de recherche enrichis : de la même manière, on peut afficher les prix d’un produit, les événements à venir, etc. dans les SERP.

En attendant (impatiemment) la suite de cet article, souhaitons bon voyage à Sylvain Garin qui part très bientôt en Chine afin de développer la revanche des sites au pays du soleil levant … 一路順風 (Yīlù shùnfēng).

 

<

Référencer son site en chine – Baidu et ses complexités (1/2)


Le marché chinois

Plus d’ 1 demi-milliard d’internautes … ça donne le vertige mais c’est LE chiffre à retenir à propos du marché chinois. Ajoutez à ça un taux de croissance à plus de 7% (Le Monde.fr) et l’augmentation du pouvoir d’achat des chinois et vous comprendrez pourquoi de nombreuses entreprises ont décidé de partir à la conquête d’un nouveau marché en pleine expansion. Si certaines ont opté pour un déménagement au pays du soleil levant, d’autres ont choisi de tout simplement s’y implanter de manière numérique, afin de toucher cette cible via internet. Seulement voilà, il y a un hic… Google étant mis au placard en Chine car il refuse de se prêter au jeu de la censure imposé par le gouvernement, c’est majoritairement sur Baidu, sans oublier Qihoo360 (devenu so puis Haosouet Sogou, qu’il faut se diriger et c’est là que la tache se complique.

Google contre la censure de baidu

 

En chine, la concurrence entre ces différents moteurs de recherche est très forte et de ce fait, chacun tente de tirer son épingle du jeu en redoublant d’efforts, de services à gogo et d’innovations. Sogou a par exemple intégré les messages Wechat à son moteur tandis que 360.cn laisse les internautes décider du positionnement des sites.

part de marché des moteurs de recherche Chine

Intéressons-nous au moteur de recherche pour le moment majoritaire en chine : Baidu. Le référencement sur Baidu reste obscur mais c’est bien ce qui attend les référenceurs de France et de Navarre ! Sur certains points, on pourrait assimiler l’algorithme de Baidu à celui de Google il y a quelques années de ça. Voici les principaux conseils Onsite (les critères Offsite feront l’objet d’un second article) pour un référencement sur le 1er moteur de recherche en Chine.

Entrons dans les méandres de Baidu

 

Les incontournables pour référencer un site en Chine

On ne trouve que peu d’entreprises capables de vous référencer sous Baidu, parce que la démarche est différente de celle que nous connaissons avec Google et il est surtout difficile de s’y imposer. Observons précisément les critères qui vous permettront de vous démarquer dans les SERP de Baidu.

 

Acheter un nom de domaine chinois …

La première chose à faire pour un bon référencement sur Baidu, c’est d’avoir un nom de domaine avec une extension en .cn ou à la rigueur .com.cn. Baidu a en effet une préférence pour les .com mais surtout pour les .cn. Certains pourront crier au chauvinisme ou à l’esprit nationaliste, NON Baidu est un moteur de recherche pour les chinois qui référence en priorité les sites chinois tout simplement.

Important : les baidu spiders sont plutôt paresseuses et donc Baidu ne crawl pas spontanément les sites en https, c’est pourquoi beaucoup de sites en https:// ne sont tout simplement pas indexés par Baidu. Comment faire indexer un site en https par Baidu ?

 

>> Recourir à une astuce : utiliser le « robots.txt » et ses modalités « user-agent » pour déterminer les visiteurs. Mettre un Allow: sur Baiduspider vers la version http, mais placer une redirection 301 pour rediriger l’utilisateur sur la version https.

 

Le célèbre hébergeur OVH propose une page dédiée aux Noms de domaine en .cn : https://www.ovh.com/fr/domaines/dotcn.xml

 

… et héberger votre site en Chine.

Votre site internet doit transpirer le Made in China par tous ses « ports » ! L’hébergement n’y échappe donc pas puisque Baidu a mis en place un système de malus pour les sites hébergés en dehors du territoire. Je vous le rappelle : Baidu est chinois, créé pour les chinois et donc indexe les sites chinois en priorité.

La Licence ICP (abréviation pour fournisseur de contenu Internet) est également requise pour l’exécution d’e-commerce en Chine. Sans cette licence, votre site e-commerce sera fermé par le gouvernement chinois.

Pour un hébergement en Chine : Il existe deux principaux fournisseurs de services de télécommunications en Chine : China Telecom et China Netcom. Vous pouvez également héberger vous-mêmes votre site Web ou faire appel à une entreprise d’hébergement Web, telle que HiChina. Il est préférable d’utiliser des serveurs multi-lignes.

 

Optimisation SEO Onsite

 

La différence de Baidu

LA grande différence de Baidu avec son homologue américain est qu’il emploie des personnes qui viennent auditer votre site dès sa première inscription sur le moteur puis 1 fois par an. Il ne faut donc surtout pas vous louper lors de ce premier audit ! Soignez votre design et votre arborescence, corrigez les éventuelles erreurs, éliminez les bugs et enrichissez votre site en contenu avant de le soumettre sur Baidu. A cette étape, les 5 premières pages de votre site sont déterminantes pour votre positionnement.

Pour soumettre votre site à la plate-forme de Baidu 

A savoir : depuis 2011, c'est Bing qui gère les recherches de Baidu pour les mots clés en langue anglaise sur le moteur chinois. Cet accord avait accru la présence de Bing dans un pays fort de 632 millions* d'internautes permettant ainsi au moteur de Microsoft de prendre un avantage sur son rival Google, qui refuse de se soumettre à la censure gouvernementale chinoise.

Pour faire simple, si vous êtes positionné dans le top 3 sur Bing pour votre site anglophone et dans le  top 3 pour votre site Chinois simplifié, vous serez bien plus visible sur le marché chinois.

 

*Source : AFP – 21/07/2014

 

Aspects techniques

Optimiser votre site pour les smartphones

Techniquement, la première chose à laquelle vous devez penser, c’est que 80% des internautes chinois (source : journaldunet.com) surfent via leur mobile. Ils sont passés directement de l’ère de l’ordinateur à celle du smartphone. Il faut donc que votre site soit accessible et optimisé pour tous types de smartphones et tablettes : optez pour un site en responsive design

Les urls

Baidu attache de l’importance à une structure d’Url aussi simple que possible. Baidu favorisera les domaines écrits en pinyin (système officiel de retranscription des caractères chinois en latin) à ceux écrits en anglais. Exemple : Baidu en chinois = 百度, en pinyin = bǎi dù.

Vos url doivent être :

  • Courtes et rédigées intégralement en Pinyin
  • Uniques et sans paramètres
  • Baidu attache plus d’importance aux URL absolues

 

Les liens doivent être intégrés en Blank car les chinois sont habitués à avoir un nouvel onglet qui s’ouvre lorsqu’ils cliquent sur un lien. Comme notre ami Google, ils trouvent que c’est une manière plus « naturelle » de naviguer, comme si chaque lien ouvrait réellement une toute autre page web.

 

HTML, Flash et JS

Les spiders Baidu ne savent pas lire le Flash ou même le JavaScript, il vaut donc mieux préférer des pages en full HTML. Sur un site Chinois, vous ne pourrez pas utiliser ISO-8885-1. Les deux plates-formes de codage à utiliser sont :

o   UTF-8,

o   GB2312

Des deux, l’encodage UTF-8 serait considéré comme meilleur, car il fonctionne avec toutes les langues du monde. Minimisez également les frames et iframes car les spiders de Baidu peuvent tout simplement en ignorer le contenu.

 

Les modules de paiement

Si vous envisagez de conquérir la Chine avec un e-commerce, 3 méthodes de paiement prédominent en Chine. Le paiement direct par carte de crédit, (les internautes doivent d’abord ouvrir le serveur en ligne de leur banque). La solution de paiement Alipay occupe la moitié du marché. Le troisième et le préféré des chinois, est le paiement en cash à la livraison qu’ils trouvent tout simplement plus secure.

 

Le Contenu Edito

Définissez clairement votre positionnement et vos mots clés

Enfin une étape similaire à celle du géant américain. En effet, l’analyse des requêtes des internautes reste une étape primordiale afin de déterminer le positionnement des pages d’un site. Seuls les outils d’analyse et de recherche sont différents.

A la manière de Google, Baidu a conçu plusieurs outils pour vous aider à définir vos mots clés :

Favorisez les termes de longue traine car sur les mots clés génériques et intéressants en terme de business, Baidu propose jusqu’à 11 résultats publicitaires puis viendront ses propres sites (Baike, Tieba, …) et enfin les sites qui répondent naturellement à la requête.

Vous l’avez compris, Baidu fait un peu ce qu’il veut dans les SERP : La preuve, il a propulsé son encyclopédie Baike qui occupe les 1ères positions sur tous les mots clés.

Vos URLs, meta et titres éditoriaux (H1, H2, H3, etc.) devront comporter ces mots-clés de positionnement. Quant à votre contenu textuel, il ne faut pas le négliger car la densité de mots-clés est encore un facteur essentiel pour Baidu, le champ lexical l’est moins.

 

Les balises title et méta

Retournons quelques années en arrière avec Google… Au temps où il suffisait de répéter les mots-clés vous permettait de vous positionner de manière simple et surtout efficace. Avec Baidu, si vous souhaitez vous positionner sur un mot-clé, ne cherchez pas plus loin : répétez-le dans la balise title et la meta-description. La balise meta Keywords semble être encore d’actualité, donc complétez-la. Par contre, comme pour Google, certains référenceurs prédisent qu’elle sera bientôt abandonnée. Les méta title doivent par contre être rédigés en chinois et ne pas dépasser 33 caractères chinois.

 

Contenu : la quantité plutôt que la qualité

Baidu préfère les sites énormes avec de très nombreuses pages. Les forums ayant énormément de pages présentent donc un Trustrank Baidu élevé. Cela correspond à ce que recherchent les chinois lorsqu’ils ont besoin d’une information. Tous les moteurs de recherche aiment la quantité, mais Google indexe un site par sa thématique, Baidu… un peu moins. Logique car les portails d’informations chinois traitent de tout et n’importe quoi, il est donc difficile de les trier par catégorie.

 

La fréquence de mise à jour

Les moteurs Google & Bing aiment les mises à jour fréquentes, mais Baidu, lui, il les adore encore plus. Les robots Baidu remettent leur base de données à jour chaque semaine, en fonction de l’importance des pages et de leur date, et accorderont des « bonus » aux pages nouvellement indexées. Le moteur de recherche s’est en effet adapté à la population chinoise qui préfère le contenu récent. Les forums et blogs parlant de sujets de la vie quotidienne sont donc bien positionnés car souvent mis à jour.

 

L’importance de la Homepage

Baidu tient énormément compte de la page d’accueil d’un site, qui doit être rédigée exclusivement en chinois. Le chinois doit être présent partout sur votre site si vous espérez obtenir un positionnement à moyen-long terme sur Baidu. Par contre, vous pouvez oublier Google Traduction et autre reverso car une traduction en chinois approximatif ne suffira pas. Il faut en effet une traduction irréprochable en mandarin.

Selon Bill Hunt, spécialiste en marketing sur les moteurs de recherche, afin de faciliter le travail des robots Baidu qui veulent analyser un maximum de contenu, en un minimum de temps, le contenu le plus important doit se trouver en haut de page. Plus on descend dans la page, moins le contenu est important.

Baidu accorderait moins d’importance aux pages profondes d’un site. Une page d’accueil aura plus de poids face à une page annexe. Ce système permettrait de donner la priorité aux sites chinois dont la page d’accueil est très, très … très longue. C’est d’ailleurs pour cela aussi que les pages d’accueil des sites chinois sont en général ultra chargées. Exemple : ¼ de la Homepage de Sohu 

Homepage site chinois

 

Duplicate Content vous avez dit ?

Le duplicate externe

Les moteurs chinois se sont adaptés aux lois Chinoises : on ne pénalise pas la contrefaçon, en référencement c’est pareil, le contenu dupliqué n’est pas pénalisé comme sur Google. Ainsi chaque définition de Baike est copiée et recopiée des milliers de fois par les autres sites qui traiteront du même sujet (sans utiliser de guillemets bien évidemment).

Sur Baidu, le copier-coller en masse est devenu légion. Il n’y a apparemment aucune règle de duplicate content. Tous les sites pompent les news des sites populaires tels que Xinhua, Sohu ou Baike sans aucune reformulation.

Attention, nous n’avançons pas qu’il FAUT copier-coller vos contenus et générer du duplicate interne, c’est juste une info à garder dans un coin de votre esprit. Il est courant de voir des contenus similaires entre différents sites chinois, et attendez-vous donc à voir vos contenus se dupliquer ailleurs que sur votre site.

Le duplicate interne

Baidu a récemment incité les webmasters à mettre en place des balises Canonical pour empêcher le Duplicate Content interne, mais rien ne garantit que le moteur de recherche la prendra en compte et la respectera. La recommandation de Baidu est donc :

  • d’utiliser la canonical dans les pages qui sont 100% similaires, ainsi l’effet induit sera plus intéressant.
  • de vous assurer que les pages sur lesquelles vous placez des canonical sont réellement intégralement similaires. Si Baidu découvre qu’il y a ne serait-ce qu’une légère différence, il pourra ignorer toutes les canonical placées sur votre site

Attention, la prise en compte de la canonical par Baidu est encore plutôt faible.

 

Les Rich Snippets

Baidu ne prenant pas en compte les micro data shema.org ou Data-vocabulary.org, ils ont mis en place un système de données enrichies payantes : Baidu Shantou. Le principe est simple : plutôt que de placer du code HTML dans le code source, avec Baidu, il suffit de payer pour avoir des résultats de recherche enrichis : de la même manière, on peut afficher les prix d’un produit, les événements à venir, etc. dans les SERP.

En attendant (impatiemment) la suite de cet article, souhaitons bon voyage à Sylvain Garin qui part très bientôt en Chine afin de développer la revanche des sites au pays du soleil levant … 一路順風 (Yīlù shùnfēng).

 

<

ou contactez-nous au