
Où ChatGPT, Gemini et Perplexity trouvent leurs sources
Wikipedia pèse 47,9 % des citations du top 10 de ChatGPT, Reddit 46,7 % de celles de Perplexity. Le plan d’action pour entrer dans les sources de chaque moteur.
L’essentiel en quatre points :
- Chaque moteur IA a son propre écosystème de sources : parmi le top 10 des domaines qu’ils citent le plus, Wikipedia concentre 47,9 % des citations de ChatGPT et Reddit 46,7 % de celles de Perplexity, selon l’étude Profound.
- Ces hiérarchies sont volatiles : la part des réponses ChatGPT citant Reddit est passée d’environ 60 % à environ 10 % en six semaines, d’après Semrush.
- Les moteurs ne se recoupent presque pas : seuls 11 % des domaines cités par ChatGPT le sont aussi par Perplexity (benchmark Averi corroboré par Whitehat SEO). Travailler un seul écosystème ne suffit donc jamais.
- Il existe des tactiques mesurées : citer des sources, ajouter des statistiques et des citations peut augmenter la visibilité jusqu’à 40 %, selon l’étude GEO de Princeton.
Pourquoi les sources décident de votre visibilité
Quand un prospect pose une question à ChatGPT, Gemini ou Perplexity, le moteur compose sa réponse à partir des sources qu’il lit : comparatifs, forums, encyclopédies, sites de marque. Si ces sources ne parlent pas de vous, vous n’existez pas dans ses réponses, quelle que soit la qualité de votre offre.
Une précision de vocabulaire d’abord : la mention (votre marque est nommée dans la réponse) n’est pas la citation (votre site est listé comme source), et notre article sur la visibilité IA détaille la différence. Ici, on s’intéresse à l’amont : les documents que chaque moteur consulte avant de répondre.
Chaque moteur expose plus ou moins ses sources. D’après l’étude Profound relayée par Ecommerce Nation, Perplexity affiche des citations visibles dans 98,6 % de ses réponses, contre 2,5 % pour ChatGPT, qui répond souvent de mémoire. Mais visibles ou non, la matière première est la même : ce que le web dit de vous, aux endroits précis où le moteur lit.
L’écosystème de chaque moteur
Il n’existe pas un « web des IA » unique : chaque moteur a construit sa propre hiérarchie de sources. Les études à grande échelle (Profound, des centaines de millions de citations entre août 2024 et juin 2025 ; Yext, 6,8 millions de citations) dessinent trois profils : encyclopédique pour ChatGPT, communautaire pour Perplexity, sites de marque pour Gemini.
ChatGPT : Wikipedia d’abord, un mix très volatil
Parmi le top 10 des domaines les plus cités par ChatGPT, Wikipedia concentre à elle seule 47,9 % des citations, selon Profound. Et le reste du mix bouge brutalement : l’étude Semrush de novembre 2025, qui a suivi 230 000 prompts et plus de 100 millions de citations pendant 13 semaines, a vu la part des réponses ChatGPT citant Reddit s’effondrer d’environ 60 % début août 2025 à environ 10 % mi-septembre.
Ce que ça implique pour vous : ChatGPT privilégie les référentiels établis et factuels. Une présence dans les pages encyclopédiques, les études et la presse reconnue de votre secteur pèse plus qu’un blog optimisé. Et rien n’est acquis : OpenAI peut re-pondérer ses sources en quelques semaines, ce qui fragilise toute stratégie mono-source.
Perplexity : Reddit, annuaires et comparatifs
Perplexity est le moteur le plus communautaire : Reddit concentre 46,7 % de ses citations parmi son top 10 de domaines, toujours selon Profound. L’étude Yext d’octobre 2025 ajoute que Perplexity favorise les annuaires de niche, là où les autres moteurs regardent ailleurs.
Ce que ça implique pour vous : c’est le moteur où les discussions authentiques et les listes sectorielles comptent le plus. Figurer dans les fils de discussion de votre secteur, les annuaires spécialisés et les comparatifs indépendants augmente directement vos chances d’apparaître dans ses réponses.
Gemini : votre site et l’écosystème Google
La même étude Yext montre que Gemini tire la majorité de ses citations des sites des marques elles-mêmes, quand ChatGPT s’appuie d’abord sur des sites tiers. Le moteur de Google fait davantage confiance à ce que vous publiez vous-même, adossé à son propre index du web.
Ce que ça implique pour vous : pour Gemini, le premier levier est chez vous. Des pages qui répondent précisément aux questions de vos prospects et une FAQ solide sont vos meilleurs points d’entrée ; une présence soignée dans l’écosystème Google (fiche d’établissement, YouTube) complète le tout.
Comment entrer dans les sources, écosystème par écosystème
Ces trois écosystèmes ne se recoupent presque pas : seuls 11 % des domaines cités par ChatGPT le sont aussi par Perplexity, d’après le benchmark Averi corroboré par Whitehat SEO sur 118 000 réponses (nous détaillons ces divergences ici). Travailler un seul écosystème vous rend visible sur un moteur et laisse les deux autres à vos concurrents.
L’optimisation pour les moteurs génératifs n’est pas de la magie : elle a été mesurée. L’étude GEO de Princeton (Aggarwal et al., KDD 2024), sur un benchmark de 10 000 requêtes, montre que citer des sources et ajouter des statistiques et des citations peut augmenter la visibilité d’un site jusqu’à 40 % dans les réponses des moteurs IA.
Votre propre site : le levier Gemini
Transformez vos pages en réponses. Une page par question que vos prospects posent réellement, une réponse directe dès le premier paragraphe, des chiffres attribués à leur source, des citations attribuées : ce sont les tactiques que l’étude de Princeton mesure comme les plus efficaces. Pour Gemini, qui cite d’abord les sites de marque, c’est l’investissement au meilleur rendement.
Les annuaires, avis et comparatifs : le levier ChatGPT et Perplexity
Identifiez les comparatifs et annuaires que les moteurs citent déjà sur vos questions, puis faites-y exister votre marque : fiche complète et à jour, avis clients sollicités, présence dans les classements sectoriels. Chaque liste où vous manquez est une réponse où un concurrent parle à votre place.
Les forums et l’UGC : puissants mais volatils
Reddit et les forums alimentent massivement Perplexity, et ChatGPT par intermittence. Participez là où vos clients discutent déjà, avec des réponses utiles et transparentes sur qui vous êtes : l’astroturfing se repère et les communautés le sanctionnent. La chute de Reddit dans ChatGPT (de 60 % à 10 % en six semaines selon Semrush) rappelle qu’aucun canal UGC n’est un acquis.
La presse sectorielle : le levier de fond
Un article dans un média reconnu de votre secteur nourrit les trois moteurs à la fois : il est lu par la recherche web dès aujourd’hui et peut entrer dans la mémoire des modèles aux prochains entraînements. C’est le levier le plus lent, et le plus durable.
Une mise en garde honnête pour finir : aucune de ces tactiques ne garantit une mention. Les effets se comptent en semaines ou en mois, et les moteurs re-pondèrent leurs sources sans préavis. La seule approche robuste : mesurer, agir, puis re-mesurer.
Et en français ?
Toutes les grandes études citées ici sont anglophones : prompts en anglais, sources majoritairement américaines. La hiérarchie exacte des sources varie pourtant selon la langue et le secteur. Les annuaires français, les comparatifs spécialisés et la presse professionnelle francophone n’ont pas le même poids dans les réponses en français que leurs équivalents américains en anglais.
La seule façon de savoir où les moteurs s’informent sur vos questions, dans votre langue, est de le mesurer. L’audit gratuit de Pythie pose 10 questions de votre secteur, en français, à ChatGPT, Gemini et Perplexity, et vous montre les sources exactes que chaque moteur a utilisées, URL par URL, en une minute et sans compte. Vous savez alors quel annuaire, quel comparatif ou quel forum travailler en premier.
Questions fréquentes
Faut-il publier un fichier llms.txt ?
Rien d’urgent. Selon l’étude Ahrefs de juin 2026 sur 137 210 domaines équipés d’Ahrefs Web Analytics, 28 % publient un llms.txt, mais 97 % de ces fichiers n’ont reçu aucune requête en mai 2026. Publiez-le si le coût est nul, n’en attendez rien de mesurable.
Une page Wikipedia est-elle indispensable ?
Non, mais elle pèse lourd sur ChatGPT : Wikipedia concentre 47,9 % de ses citations parmi le top 10 des domaines, selon Profound. Une page ne se décrète pas, les critères de notoriété sont stricts. Si vous n’y êtes pas éligible, les comparatifs, les annuaires et la presse sectorielle restent des leviers réels sur les trois moteurs.
Les moteurs IA lisent-ils les avis clients ?
Oui, indirectement : les plateformes d’avis et les comparatifs font partie des sites tiers sur lesquels ChatGPT s’appuie et des annuaires de niche que Perplexity favorise, d’après l’étude Yext. Des avis récents, détaillés et authentiques augmentent vos chances d’y être repris. L’audit gratuit vous montre quelles plateformes vos moteurs citent réellement.