01.40.09.13.31
Actualités SEO

Netlinking & algorithme Google : Ce qu’il faut retenir pour sa stratégie de linking

Publié le 24 juin 2024 par Bruno Linn

La fuite de la documentation Content API Warehouse de Google du 30 mai 2024 a suscité de nombreuses discussions enflammés au sein des cercles des référenceurs SEO.

En effet, cette documentation contient des informations sur plus de 2 500 modules et plus de 14 000 attributs utilisés dans l’algorithme Google, mais pas sur leur importance relative ou relationnelle donc aucune information sur leur degré d’impact dans le classement du moteur de recherche.

Il convient donc de prendre ces éléments avec prudence, mais il est utile de les considérer comme des éléments potentiels que Google utilise comme facteur influençant les positions, plutôt que comme des facteurs de classement établis dans votre stratégie de référencement SEO.

Google ignore les liens provenant de sources non pertinentes.

La pertinence des sources a toujours été un enjeu majeur dans le netlinking entre sites, mais elle est difficile à définir précisément. Les documents divulgués indiquent que Google applique une dévalorisation appelée “AnchorMismatchDemotion” dans le module “CompressedQualitySignals”.

Cette dévalorisation semble concerner les liens dont la pertinence entre la page source et la page cible ou entre la page source et le domaine cible ne correspond pas. Cette inadéquation, principalement basée sur la pertinence, est également soutenue par la présence d’un attribut “topicEmbeddingsVersionedData” dans le même module. Les intégrations de sujets, couramment utilisées en traitement du langage naturel (NLP), aident à comprendre la signification sémantique des sujets dans un document.

Un autre attribut, “webrefEntities”, référencé dans le module “PerDocData”, indique les entités associées à un document. Bien que les détails exacts sur la mesure de la pertinence par Google ne soient pas entièrement clairs, il est presque certain que “AnchorMismatchDemotion” implique d’ignorer les liens provenant de sources non pertinentes. Reste à bien comprendre comment Google détermine la pertinence ou non d’une source. Le sujet, les termes clés de l’article, le profil du domaine et des liens entrant et sortant vers celui-ci participent à cette classification.

Prépondérance des liens géolocalisés

Les liens provenant de sources locales (du même pays) sont plus valorisés que ceux provenant d’autres pays. Le module “AnchorsAnchorSource” fournit des informations sur les données que Google stocke sur la page source des liens et la pertinence locale augmente la valeur SEO de ces liens.

Le document contient un attribut nommé “localCountryCodes”, qui enregistre les pays pour lesquels une page est locale et sa pertinence.

Il est primordial donc de prioriser l’acquisition de liens provenant de sites pertinents au niveau local. Google accorde probablement plus d’importance à ces liens car ils sont plus susceptibles d’augmenter la notoriété de la marque, de générer des ventes et de fournir des recommandations plus précises.

Toutefois, les liens provenant d’autres pays ne sont pas nécessairement nuisibles. Ils sont simplement moins puissant en termes de force SEO selon le marché local.

Le PageRank est un élément déterminant de la force SEO du Domain référent

La documentation divulguée révèle que Google dispose d’un score « d’autorité du site », bien qu’il ait souvent affirmé ne pas utiliser ce type de mesure comparable à l’autorité de domaine (DA) de Moz ou à l’évaluation de domaine (DR) d’Ahrefs.

En 2020, John Mueller déclarait explicitement que Google n’utilise pas l’autorité de domaine pour l’exploration, l’indexation ou le classement de recherche. Cependant, plus tard la même année, il a fait allusion à une mesure à l’échelle du site, mentionnant certaines métriques au niveau du site et de la page référente.

Les documents divulgués montrent clairement un score appelé “SiteAuthority”.

Nous ne savons pas si ce score est comparable aux DA ou DR. Les scores DA et DR sont basés sur la qualité et la quantité des liens. Il est probable que le “SiteAuthority” de Google ne soit pas uniquement basé sur les liens, mais plutôt sur une combinaison de scores de qualité au niveau de la page, incluant des données de clics et d’autres signaux comme NavBoost. Cela suggère que le “SiteAuthority” est plus proche du concept de PageRank.

Le “SiteAuthority” apparaît dans le module “CompressedQualitySignals”, ce qui indique qu’il ne se limite pas à un simple score basé sur les liens. Cette approche renforce l’idée que, malgré des noms similaires, le “SiteAuthority” de Google diffère significativement des DA et DR de Moz et Ahrefs.

L’importance de la « fraicheur » des liens entrants

Les liens provenant de pages plus récentes semblent être plus précieux que ceux provenant de contenus plus anciens. La documentation divulguée mentionne un attribut “sourceType” en relation avec les ancres (liens), où la qualité de la page source d’un lien est corrélée avec le niveau d’indexation de la page.

Particulièrement, le contenu nouvellement publié (“freshdocs”) est traité comme un cas spécial et est considéré équivalent à des liens de « haute qualité ». Cela indique que le type de source d’un lien peut être utilisé comme indicateur d’importance, ce qui suggère une pondération de la puissance des liens en fonction de leur fraîcheur.

Cependant, il est important de noter qu’un lien peut être considéré comme de « haute qualité » même s’il ne provient pas d’une page récente. Les liens des pages récentes sont simplement considérés comme étant de même qualité élevée.

Cette découverte souligne l’importance d’obtenir régulièrement des liens, justifiant pourquoi les experts en référencement recommandent une allocation constante de ressources à la création de liens. Il s’agit d’une activité continue et permanente pour maintenir et améliorer le classement et la pertinence du contenu.

La documentation divulguée suggère que la confiance accordée par Google à la page d’accueil d’un site influe sur la valeur des liens provenant de ce site. Dans le module “AnchorsAnchorSource”, un attribut nommé “homePageInfo” spécifie que la page source est la page d’accueil d’un site Web, avec une valeur “not_homepage” attribuée aux autres pages. Cela implique que Google pourrait utiliser une mesure de la “confiance” de la page d’accueil dans ses algorithmes.

Bien que les détails de cette mesure de confiance restent flous, il est plausible que les pages internes héritent de la fiabilité de la page d’accueil. Cela signifie que la confiance accordée à la page d’accueil pourrait influencer la pondération des liens, rendant les liens provenant de sites entièrement fiables plus précieux que ceux provenant de sites non fiables.

En résumé, bien que nous ne sachions pas exactement comment Google évalue la fiabilité des pages, il est probable que la confiance de la page d’accueil se propage aux pages internes, augmentant ainsi la valeur des liens provenant de sites considérés comme fiables.

Avantages des liens en provenance des sites d’actualités

La documentation divulguée révèle que Google stocke des informations supplémentaires sur les liens identifiés comme provenant de sites « d’actualité et de haute qualité ».

Cela implique que les liens provenant de sites d’information tels que le New York Times, The Guardian ou la BBC pourraient avoir plus de valeur que ceux provenant d’autres types de sites. Ces sites d’information sont généralement considérés comme parmi les plus fiables et ont historiquement eu un PageRank de barre d’outils élevé (9 ou 10).

Ce constat souligne l’importance des relations publiques numériques pour obtenir des liens à partir de publications d’actualités. Exploiter cette stratégie est clairement un axe de développement de votre visibilité SEO.

L’importance des liens provenant des sites de semences (seed site)

Les liens provenant de sites de semence, ou pointant vers eux, sont probablement parmi les plus précieux que vous puissiez obtenir.

La documentation divulguée par Google suggère que le PageRank traditionnel a été remplacé par le PageRank-NearestSeeds, défini comme la valeur de PageRank de production à utiliser.

En SEO (Search Engine Optimization), un “site de semence” (également appelé “seed site” en anglais) fait référence à un site web qui est considéré comme une source de haute autorité et de confiance dans un domaine particulier. Ces sites sont souvent utilisés par les moteurs de recherche pour évaluer et mesurer la pertinence et la qualité des autres sites web.

Exemples de Sites de Semence

  • Académiques : Les sites des universités et des institutions de recherche.
  • Gouvernementaux : Les sites officiels des gouvernements.
  • Médias Établis : Les grands sites d’actualités comme le New York Times, Le Monde, la BBC, etc.
  • Organisations Non-Gouvernementales : Les sites des ONG reconnues.

Selon Bill Slawski, les sites de semences doivent être fiables, couvrir un large éventail de domaines d’intérêt public et être bien connectés à d’autres sites. Ils doivent également avoir de nombreux liens sortants utiles, agissant comme des « hubs » sur le Web.

Dans le cadre du brevet PageRank, les scores de classement sont attribués aux pages en fonction de leur distance par rapport à ces ensembles de semences et d’autres caractéristiques de ces pages. Cela signifie que les liens provenant de sites de semences ou pointant vers eux sont particulièrement précieux en raison de leur rôle central dans la structure de l’algorithme de Google.

Ainsi, pour maximiser la valeur des liens, il est stratégique de viser des liens provenant de sites de semence reconnus, car ils bénéficient d’un classement élevé basé sur leur connectivité et leur fiabilité.

La toxicité des liens et le linking Spam

Google utilise probablement des « sources fiables » pour déterminer si un lien est du spam ou non. Le module “IndexingDocjoinerAnchorSpamInfo” fait référence à ces sources fiables, ce qui suggère que Google évalue la probabilité qu’un lien soit du spam en fonction du nombre de liens provenant de sources fiables pointant vers une page.

Ainsi, les liens provenant de sources fiables peuvent potentiellement diluer l’effet des liens spammés, en renforçant la crédibilité de la page cible. En d’autres termes, un lien provenant d’une source jugée fiable par Google pourrait compenser ou neutraliser l’impact négatif des liens de mauvaise qualité ou spammés. Cela souligne l’importance de sécuriser des liens de haute qualité provenant de sources dignes de confiance pour maintenir et améliorer la réputation et le classement d’une page.

Google identifie les liens SEO négatifs et les ignore en mesurant la vitesse de création des liens.

La documentation offre un aperçu des méthodes utilisées par Google pour détecter ces attaques, en tenant compte de plusieurs attributs :

– Le délai pendant lequel les liens spammés ont été détectés.
– Le taux quotidien moyen de spam découvert.
– Le moment où un pic de spam a commencé.

Ces facteurs sont vraisemblablement utilisés pour identifier les liens visant à manipuler les systèmes de classement de Google, avec une référence spécifique aux « pics de spam d’ancrage ». Ce mécanisme permet de détecter des volumes importants de liens suspects, souvent associés aux attaques SEO négatives.

D’autres facteurs peuvent également être pris en compte pour déterminer comment les liens détectés lors d’un pic sont ignorés.

En définitive, la vitesse et le volume de création de liens spammés jouent un rôle clé dans la détection des attaques SEO négatives par Google.

Google semble avoir la capacité d’appliquer des pénalités ou des ajustements pour le spam de liens, soit en ignorant certains liens individuellement, soit en ignorant tous les liens pointant vers une page.

Cela signifie que, lorsque des signaux de spam sont détectés, Google peut décider de traiter tous les liens vers une page ou seulement certains d’entre eux de manière spécifique. En cas de spam de liens excessif, il est possible que Google choisisse d’ignorer tous les liens, même ceux généralement considérés comme de haute qualité.

Bien que nous ne puissions pas en être certains, cela suggère que lorsque des liens spammés sont détectés, ils ne sont pas les seuls à être potentiellement ignorés. Cette approche pourrait effectivement annuler l’impact de tous les liens pointant vers une page, ce qui est une possibilité à considérer sérieusement.

Pour résumé, des pénalités ou des ajustements basés sur les liens peuvent s’appliquer de manière sélective ou globale, impactant ainsi l’efficacité des liens pointant vers une page en fonction des signaux de spam détectés.

Le mois dernier, John Mueller de Google a de nouveau déclaré que les liens toxiques sont un concept inventé, affirmant : « La notion de liens toxiques est inventée par les outils SEO pour que vous les payiez régulièrement. »

Cependant, la documentation divulguée révèle une référence aux « BadBackLinks ».

Ces informations suggèrent qu’une page peut être pénalisée pour avoir de « mauvais » backlinks. Bien que la forme précise de cette pénalité ne soit pas claire, ni sa proximité avec les scores de liens toxiques fournis par les outils de référencement, il existe des preuves indiquant qu’il y a au moins une mesure booléenne (valeurs vraies ou fausses) pour déterminer si une page contient de mauvais liens pointant vers elle.

En définitive, bien que Google puisse minimiser l’importance des liens toxiques, la documentation indique clairement qu’il existe des mécanismes pour identifier et pénaliser les pages contenant de mauvais backlinks.

Quid des termes utilisés comme Ancres ?

Les référenceurs exploitent depuis longtemps le texte d’ancrage des liens pour fournir des signaux contextuels sur la page cible. La documentation Search Central de Google confirme que « ce texte indique aux gens et à Google quelque chose sur la page vers laquelle vous créez un lien ». Cependant, les documents divulgués récemment indiquent que ce n’est pas seulement le texte d’ancrage qui est utilisé pour comprendre le contexte d’un lien. Le contenu entourant le lien est également pris en compte.

La documentation fait référence à des termes comme “context2”, “fullLeftContext” et “fullRightContext”, qui correspondent aux termes proches du lien.

Cela suggère que le texte environnant un lien joue également un rôle dans la détermination de sa pertinence. D’une part, cela pourrait simplement servir à lever des ambiguïtés, mais d’autre part, cela pourrait aussi contribuer à la pondération du lien.

Ces informations renforcent le consensus général selon lequel les liens provenant d’un contenu pertinent ont beaucoup plus de poids que ceux provenant d’un contenu non pertinent. Le contexte entourant un lien, en plus du texte d’ancrage, est donc crucial pour évaluer la pertinence et la valeur d’un lien.

Quels sont les principaux enseignements et points à retenir pour le Netlinking ?

Les liens sont-ils toujours importants ?

Absolument. La documentation divulguée suggère fortement que les liens restent des signaux de classement cruciaux. Cependant, il ne s’agit pas simplement de n’importe quels liens, mais des liens que Google récompense ou n’ignore pas. Ces liens ont plus de chances d’influencer positivement la visibilité organique et les classements.

Pertinence des liens

Google semble ignorer les liens qui ne proviennent pas de pages pertinentes. Par conséquent, la pertinence devient une mesure prioritaire de succès pour tout bon Netlinking

La valorisation des liens par Google

Nous avons désormais une meilleure compréhension de la manière dont Google valorise les liens et des éléments qui pourraient être plus fortement pondérés. Les liens provenant de sources de haute qualité et pertinentes sont plus valorisés que les autres.

L’avis d’AEP digital

En conclusion, malgré les déclaration officielles de Google, les grandes métriques de linking des outils SEO sont bien les éléments clés utilisés par Google comme indicateurs du netlinking dans son algorithme de positions des Serps. La pertinence et la qualité des liens sont essentielles pour influencer positivement les classements de positions. Les référenceurs doivent continuer à se concentrer sur l’obtention de liens pertinents et de haute qualité pour maximiser leur impact sur la visibilité organique.

Parlons ensemble de vos projets et de votre activité

Vous souhaitez développer la visibilité de votre activité sur le net ?

AEP Digital, met ses experts et son expérience à votre disposition pour booster vos objectifs

Rencontrons-nous pour en discuter.

Discutons de vos projets

Améliorez vos connaissances en webmarketing Digital

Stratégie et techniques d’acquisition en SEA, SEO et sur les réseaux sociaux. Reussissez vos synergies cross canal. AEP Digital vous propose des conseils pour réussir votre stratégie webmarketing

Les Actualités SEO par AEP/Digital