En juin 2025, Google a supprimé plus de 3 milliards d'entités de son Knowledge Graph en une seule semaine. 6,26% de la base — effacé. C'est deux fois plus que tout ce qui avait été ajouté l'année précédente. Volatilisé du jour au lendemain.
Ce n'était pas un bug. C'était un nettoyage chirurgical. Google a décidé de passer d'un modèle d'accumulation à un modèle de précision. Moins d'entités, mais mieux définies. Moins de bruit, plus de signal. La raison ? Les AI Overviews, AI Mode et Gemini ont besoin d'une base de faits fiable, pas d'un dépotoir sémantique.
Et votre marque dans tout ça ?
Si vous faites partie des entités que Google connaît, comprend et associe à des faits vérifiés — vous êtes protégé. Si vous n'êtes qu'une "chaîne de caractères" (String) sans ancrage dans le Knowledge Graph — vous êtes un fantôme. L'IA ne recommandera jamais un fantôme.
En 2026, le Knowledge Graph de Google contient plus de 1 600 milliards de faits sur 54 milliards d'entités. L'IA ne cherche plus des pages. Elle cherche des nœuds de connaissance — des entités connectées, désambiguïsées, corroborées par des sources multiples.
Voici comment devenir un de ces nœuds. Pas demain. Maintenant.
Source : Search Engine Land — "Google's great clarity cleanup: 3 shifts redefining the Knowledge Graph and its AI future" (Août 2025). Jason Barnard / Kalicube tracking data depuis 2015.
Avant de construire quoi que ce soit, il faut mesurer l'étendue du désastre. Et le test est d'une brutalité limpide.
Ouvrez ChatGPT. Ouvrez Gemini. Ouvrez Perplexity. Tapez : "Qui est [Votre Marque] ?" ou "Qui est [Votre Nom] ?".
Trois scénarios :
C'est la troisième réponse qui devrait vous terrifier.
Pour les moteurs de réponse génératifs, une recommandation est un transfert de confiance. L'IA ne transfère pas sa confiance à une entité inconnue. Vous pouvez avoir le meilleur contenu du marché — si l'algorithme ne sait pas qui l'a produit, il citera celui qu'il connaît. Et ce sera votre concurrent.
Utilisez Ahrefs Brand Radar.
Un éditeur SaaS B2B de 60 personnes lance Brand Radar. Sur 100 prompts pertinents ("meilleur outil gestion projet PME", "logiciel ERP industrie"), il apparaît 0 fois. Son concurrent direct, deux fois plus petit mais présent sur Wikidata, Crunchbase et cité dans trois articles de presse spécialisée, capte 38% du Share of Model.
Le problème n'est pas le contenu. Le problème, c'est l'identité. L'IA ne sait pas que l'éditeur existe.
Résultat : Pas un seul article n'a été réécrit. Seule l'architecture d'entité a été déployée. 12 semaines plus tard, le Share of Model passe de 0% à 19%.
Builder une entité, ce n'est pas "ajouter du Schema". C'est construire un faisceau de preuves convergentes que les machines peuvent vérifier de manière autonome. L'IA est paranoïaque. Elle ne vous croit pas sur parole. Il faut que plusieurs sources indépendantes confirment la même chose.
Selon les données de Kalicube, qui traque le Knowledge Graph de Google depuis 2015 avec plus de 71 millions de marques indexées, Google utilise plus de 40 000 sources différentes pour corroborer les informations sur les entités. Votre site web n'est qu'une de ces sources.
Voici les 4 piliers, par ordre de priorité.
Organization ou Person (votre déclaration d'existence)C'est la fondation technique. Sur votre page d'accueil (pour une marque) ou votre page auteur (pour une personne), le balisage doit être exhaustif, pas cosmétique.
Les propriétés que 90% des sites oublient :
sameAs : La propriété reine. Elle dit à Google : "Ce profil LinkedIn = Ce compte Twitter = Ce site web = Cette fiche Wikidata = La même entité." Sans sameAs, l'IA voit 5 profils séparés au lieu d'un seul individu. Selon Schema App, c'est le pont qui permet à Google de "connecter les points" entre votre site et votre identité officielle.knowsAbout : Déclarez explicitement vos domaines d'expertise. Ne laissez pas l'IA deviner.disambiguatingDescription : Si votre nom est générique ("Agence Conseil"), cette propriété dit à l'IA exactement qui vous êtes et qui vous n'êtes pas.@id : L'identifiant unique interne qui permet de référencer votre entité à travers tout votre site. Selon Momentic, c'est la clé pour créer un graphe sémantique cohérent entre vos pages.Wikidata est la base de données structurées qui alimente directement le Knowledge Graph de Google, les réponses de ChatGPT, et les Knowledge Panels. C'est le plus grand consommateur de données structurées au monde, et Google est son client principal.
Chaque élément dans Wikidata est un "Item" identifié par un numéro Q unique, relié par des "Properties" (numéros P) à d'autres items ou valeurs. Cette toile de faits interconnectés est exactement ce que les LLM ingèrent pour construire leur compréhension du monde.
La bonne nouvelle : les critères d'éligibilité de Wikidata sont moins stricts que ceux de Wikipedia. Vous n'avez pas besoin d'un article encyclopédique complet. Une fiche avec vos propriétés de base (nom, type d'organisation, date de fondation, site web, identifiants sociaux) suffit pour entrer dans le radar des machines.
L'action critique : Une fois votre fiche Wikidata créée, ajoutez son URL dans votre balisage Organization via la propriété sameAs. C'est la boucle de rétroaction qui ferme le circuit entre votre site et le Knowledge Graph.
L'IA fonctionne par consensus. Si vous êtes le seul à dire que vous existez, c'est suspect. Il faut que d'autres le confirment.
Les sources qui comptent : Crunchbase (entreprises tech), LinkedIn Company Page vérifiée, annuaires professionnels sectoriels, articles de presse spécialisée, Google Scholar (publications académiques), fiches d'associations professionnelles.
Selon une étude reprise par Search Engine Land, il existe une corrélation de 0,664 entre les mentions de marque sur le web et la visibilité dans les AI Overviews de Google. Chaque mention externe est un vote de confirmation qui renforce votre nœud dans le Knowledge Graph.
Le Knowledge Panel est la preuve visible que Google vous reconnaît comme entité. Il n'apparaît pas sur demande — il se déclenche automatiquement quand Google a suffisamment de données fiables convergentes.
L'action tactique : Utilisez l'outil gratuit Knowledge Graph API Explorer de Kalicube pour vérifier si votre marque possède déjà un "Machine ID" (KGID) dans le Knowledge Graph. Si oui, revendiquez votre Knowledge Panel via Google. Si Google corrige sa fiche, Gemini corrigera ses réponses. C'est un effet domino.
"DataFlow", éditeur de logiciel de 40 personnes à Bordeaux. Invisible pour toutes les IA.
Organization complet avec sameAs (LinkedIn, Crunchbase, Wikidata), knowsAbout ("Business Intelligence", "Data Visualization", "ETL"), et disambiguatingDescription.sameAs réciproque.Résultat : ChatGPT répond désormais correctement à "Qui est DataFlow ?" et les recommande pour les requêtes "outil BI PME". Le trafic de marque (Brand Search) augmente de 28%.
C'est le poison lent de l'Entity Building. Votre marque porte un nom générique ou un homonyme existe dans un autre pays, un autre secteur, ou a fermé boutique après un scandale.
Lors du nettoyage de juin 2025, Google a réduit de 15,27% le nombre d'entités étiquetées "thing" — les entités mal définies, ambiguës, sans typage précis. Le signal est clair : Google veut des entités unityped (un seul type clair, sans ambiguïté). La proportion d'entités à type unique est passée de 23,9% à 28,7% après la purge.
Si l'IA confond votre marque avec un homonyme, vous héritez de ses problèmes. C'est une hallucination par confusion d'entité. Et elle vous détruit silencieusement.
disambiguatingDescription (Schema.org) : Sur votre page d'accueil, ajoutez une description qui dit exactement qui vous êtes et qui vous n'êtes pas. Code : "disambiguatingDescription": "DataFlow est un éditeur de logiciel BI fondé en 2019 à Bordeaux, distinct de DataFlow Inc. (USA) fermé en 2023."P1889 (different from) : Sur votre fiche Wikidata, utilisez la propriété P1889 pour lier formellement votre entité à l'homonyme problématique. C'est un signal de séparation que les LLM ingèrent directement.alternateName (Schema.org) : Listez toutes les variantes de votre nom de marque pour couvrir les variations orthographiques que l'IA pourrait rencontrer.Utilisez Ahrefs Web Explorer.
"Cabinet Martin & Associés" à Lyon est confondu par Gemini avec un "Cabinet Martin" à Lille, radié du barreau en 2024.
disambiguatingDescription. La fiche Wikidata utilise P1889 (different from). Le site publie une page "À propos" ultra-dense qui ancre l'identité unique.Une entité isolée est une entité faible. La puissance d'un nœud dans le Knowledge Graph se mesure à ses connexions. Plus vous êtes connecté à des concepts adjacents pertinents, plus l'IA vous considère comme une source complète et légitime.
Selon Search Engine Land, la stratégie "entity-first" consiste à construire un mini Knowledge Graph interne où chaque page (nœud) renforce votre autorité topique globale. Les entités gagnent en force grâce au contexte : liens internes, références sameAs, et relations Schema (Product → Category → Brand).
L'action corrective : Pour chaque Entity Gap, créez une page dédiée balisée avec les propriétés Schema appropriées et reliée à vos pages principales par maillage interne. Utilisez la propriété about dans le Schema de chaque page pour pointer vers l'entité Wikidata correspondante.
Ce n'est pas du marketing de contenu. C'est de la topologie sémantique. Vous construisez les routes qui connectent votre entité aux concepts adjacents dans le cerveau de la machine.
Un site spécialisé "Voyage au Japon" couvre Tokyo, Kyoto, Osaka. L'analyse des AI Overviews montre que l'IA connecte systématiquement "Voyage Japon" à "JR Pass" (le pass ferroviaire). Or, le site n'a aucune page dédiée au JR Pass.
/japon/jr-pass, balisé Article avec about: {"@type": "Product", "name": "Japan Rail Pass"} et maillé depuis toutes les pages existantes.En 2026, les personnes sont des entités aussi puissantes que les marques. Selon les données d'Ahrefs Brand Radar, l'IA cite souvent des individus — surtout dans les domaines YMYL (santé, finance, droit) où l'expertise personnelle est le premier critère de sélection de l'algorithme.
Les signaux d'autorité E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) sont devenus le filtre principal. Selon MRS Digital, les entités avec des signaux E-E-A-T forts sont priorisées dans les résultats IA, les AI Overviews, et les résultats Knowledge-driven. Sans ces signaux, même une entité parfaitement balisée ne sera pas recommandée.
/auteur/prenom-nom) : C'est le hub de votre entité personnelle. Balisage ProfilePage avec :
sameAs : LinkedIn, Twitter/X, Google Scholar, publications externes, fiche Wikidata personnelle.knowsAbout : Domaines d'expertise déclarés explicitement.hasCredential : Diplômes, certifications, accréditations.worksFor : Votre organisation, reliée à son propre balisage Organization.sameAs → LinkedIn Vérifié → Être Humain Réel. Si l'IA peut suivre cette chaîne sans interruption, votre "Trust Score" est maximal.L'action tactique avec Ahrefs : Configurez un projet Brand Radar non pas pour votre entreprise, mais pour votre expert principal ou votre CEO. Analysez sa visibilité personnelle dans les réponses IA. Comparez-le aux leaders d'opinion concurrents.
Deux consultants SEO publient un article sur les Core Web Vitals 2026. Contenu de qualité équivalente.
Person. Pas de profil externe lié.sameAs vers LinkedIn (12 000 abonnés), ses publications sur Search Engine Land, et sa fiche Wikidata.Quand Perplexity reçoit la question "Comment optimiser les Core Web Vitals ?", l'IA a un filtre de sécurité : elle ne citera que le Consultant B.
Pas parce que son texte est meilleur. Parce que l'entité "Auteur" est vérifiable. Le Consultant A n'entre même pas dans le pool de candidats.
Les métriques classiques (trafic, positions) ne capturent pas l'impact de l'Entity Building. Le volume de recherche organique traditionnel est prévu de chuter de 25% d'ici 2026 et de 50% d'ici 2028 selon les projections citées par plusieurs analyses de marché. Vous avez besoin de nouveaux indicateurs.
Résultat : Le coût d'acquisition client (CAC) baisse de 15% car l'IA fait le travail d'éducation avant que le prospect n'arrive sur le site. Le contenu n'a pas changé d'un mot. L'architecture d'entité a tout changé.
En juin 2025, Google n'a pas supprimé 3 milliards d'entités par accident. Il a envoyé un message : l'ère de l'accumulation est terminée, l'ère de la clarté commence.
Le Schema vous rend lisible. L'Entity Building vous rend mémorable.
En 2026, l'IA ne classe plus des pages. Elle connecte des nœuds de confiance. Quand elle "comprend" qui vous êtes — votre identité, vos expertises, vos connexions vérifiées — elle arrête de vous évaluer article par article. Elle commence à vous faire confiance par défaut. Et cette confiance, une fois acquise, se propage à chaque nouveau contenu que vous publiez, sans effort supplémentaire. C'est l'effet composé de l'identité. Et c'est le seul avantage compétitif que l'IA ne pourra jamais commoditiser.
Nous accompagnons les équipes d'ingénierie dans le déploiement de systèmes IA en production.