Branding et GenAI : pourquoi et comment se faire aimer des LLM ?
GRAND FORMAT TheMediaLeader.tech. À quoi ressemble une bouteille de ketchup ? Pour Dall-E 2, la réponse est simple : « It has to be Heinz » ! La campagne imaginée par l’agence Rethink Canada mi-2022, alors que le générateur text-to-image d’Open AI n’était encore qu’en bêta-test, a marqué les esprits par son caractère pionnier.
Elle a aussi offert une nouvelle preuve éclatante de l’importance d’enrichir son capital de marque et de faire en sorte que ses éléments distinctifs, son design, sa charte graphique ou sa typographie, soient bien référencés… Aussi bien dans l’esprit des consommateurs que dans les sets de données d’entraînement des outils d’IA générative !
De quoi se questionner : être référencé par les LLM (large language models) deviendra-t-il un enjeu de plus en plus important à l’avenir, au même titre que cela l’est aujourd’hui pour les moteurs de recherche ?
Cette question a peut-être traversé l’esprit des stratèges et des créatifs d’une agence qui travaillaient récemment sur une nouvelle campagne pour vanter les mérites d’une marque d’aspirateur : au moment d’utiliser la GenAI pour générer les images du story-board, impossible de faire apparaître autre chose qu’un Dyson…
Lutter contre les biais des modèles d’IA générative
Une anecdote qui illustre plus que jamais le besoin de travailler sur des modèles entraînés en interne, comme le rappelle David Raichman, directeur créatif exécutif d’Ogilvy Paris et Global AI Creative Lead d’Ogilvy EMEA : « L’enjeu est de dépasser les deux grandes faiblesses des modèles : la normalisation de l’esthétique et la propriété intellectuelle au sens large. Une marque a un univers. En interne, les équipes doivent travailler sur un branding commun. Il faut encoder les guidelines de la marque dans le modèle pour que les textes, les visuels et demain les vidéos correspondent à cet univers. Et pour cela, le mieux est d’être détenteur de la donnée qui sert à entraîner le modèle. »
Il est rejoint par Alexandre Crazover, CEO de l’agence Datawords, spécialiste du marketing multiculturel : « Le risque de l’IA générative, c’est la simplification et la reproduction de biais. Que Dyson soit la seule représentation d’un aspirateur, et que ce ne soient que des femmes qui l’utilisent sur les contenus générés par l’IA. On accompagne nos clients dans le développement d’outils qui répondront à ces enjeux d’inclusion et de respect de l’image de marque, et cela, sur des marchés qui ont tous leurs spécificités culturelles. Sans cela, les investissements massifs réalisés dans l’IA seront toujours déficitaires, puisque tous les responsables auront peur d’essuyer un bad buzz. »
Travailler sur des modèles entraînés en interne est aussi nécessaire pour éviter d’exposer des données sensibles, qui n’ont pas vocation à entraîner les modèles accessibles au grand public. Tout le monde en convient.
Mais justement, y a-t-il un intérêt à rendre accessible son capital de marque au grand public ? Du point de vue marketing, un challenger pourrait, en effet vouloir contester aux Heinz et Dyson de sa catégorie ce leadership auprès des LLM…
Les marques iconiques avantagées…
« Les love brands ont toujours inspiré les créateurs. Avec l’arrivée de l’IA générative, certains s’amusent à imaginer de nouveaux produits Nike, Apple, Lacoste ou Louis Vuitton, des collaborations avec McDonald’s ou Coca-Cola, ou encore des concept-stores fictifs. Mais ils ont déjà une idée précise en tête et vont s’emparer de marques souvent iconiques, qui vont l’être de plus en plus puisque ces nouvelles créations vont à nouveau enrichir les modèles », concède David Raichman, pour qui ces contenus UGC peuvent être complémentaires des créations réalisées par les marques et leurs agences.
Mais l’expert doute que le grand public ne s’empare du capital de marques qui ne sont pas iconiques, « sans que celles-ci s’infiltrent d’abord dans la pop-culture, ou la “GenAI culture” qui se développe, via une campagne imaginée en interne ou par une agence. »
Le jeu n’en vaudrait donc pas la chandelle pour David Raichman. Si faire apparaître sa marque dans les résultats des moteurs de recherche augmentés par les modèles d’IA conversationnelles comme ChatGPT est un sujet, ce n’est pas encore le cas pour les modèles text-to-image, dont l’adoption par le grand public est encore insuffisante selon lui.
Toutefois, que penser du développement de modèles multimodaux ? Ne rendent-ils pas de plus en plus poreuse cette frontière ? Google vient d’annoncer ce 14 mai que son AI Overview, nouveau nom de SGE, pour Search Generative Experience, serait accessible à un milliard d’internautes d’ici à la fin de l’année… Gemini, le modèle de Mountain View, tout comme GPT4 et les autres LLM multimodaux, est ainsi capable de répondre en générant du texte, mais aussi du son et des images.
Que se passera-t-il quand on demandera demain à Google d’imaginer une nouvelle déco pour son salon ? Ou que demain, comme le promettaient Snap et Meta l’an passé, les applications de messagerie instantanée intégreront massivement la GenAI et que leurs utilisateurs pourront générer des visuels à la volée, en remplacement de ce gif ou mème qui résume parfaitement votre pensée mais que vous n’arrivez pas à retrouver ?
Dans ces conditions, comment éviter qu’une marque considérée comme la référence par les LLM soit systématiquement mise en avant ?
…du moins, pour l’instant
« Les entreprises qui développent ces LLM pourraient-elles développer des offres permettant aux marques de faire apparaître en priorité leurs produits ?», s’interroge Mathieu Crucq, Directeur général de l’agence Brainsonic, qui a un avis assez tranché sur l’ensemble des sujets que nous venons d’aborder.
« Le sujet est intéressant, mais personne n’a encore la réponse… Les modèles deviennent de plus en plus puissants, mais va-t-on atteindre un palier, ce qui laisserait quelques années pour créer des services à partir de ces modèles, un peu comme les utilisateurs de WordPress qui ont développé de nombreux plug-ins ? Où GPT5 va-t-il rendre tout cela caduc, puis GPT6, et etc ? Rien n’est fixé, et les marques pourront difficilement agir sur les résultats des modèles, sauf à faire un coup de com’ comme Heetch et BETC l’ont fait auprès de Midjourney avec la campagne “Greetings from la Banlieue” », explique-t-il, convaincu qu’à terme, la pluralité des LLM et des services développés à partir de ces derniers permettra d’offrir plus de diversité dans les résultats générés.
Il illustre son propos en revenant sur la notion de biais : « Qu’est-ce que désigne véritablement l’absence de biais, sachant que chaque pays et chaque culture ont leurs propres biais ? En rédigeant un prompt, un Français n’attendra pas le même résultat qu’un Chinois, car il est lui-même influencé par ses propres biais… Les modèles ne font que représenter une majorité statistique qui est liée au data set qui a permis de les entraîner. L’évolution des représentations sera liée à l’action des développeurs qui vont alors pondérer les résultats pour introduire plus de diversité, ou utiliser des sets de données différents. »
Ainsi, Heinz est l’archétype d’une bouteille de ketchup pour les LLM anglo-saxons ou ceux développés par Mistral AI en France, car la marque est leader sur ces marchés. Au contraire, un LLM indien représentera peut-être le packaging de Maggi, tandis qu’un LLM japonais serait partagé entre celui de Kagome et celui de Kikkoman…
Reste que sur tous ces marchés, les challengers auront de plus en plus l’occasion d’exister pour les LLM à en croire Mathieu Crucq, qui revient sur l’utilisation des modèles entraînés à destination de l’interne : « La GenAI se développe au sein des entreprises. L’utilisation d’un GPT interne est une première étape, mais demain, on verra apparaître de véritables BLM, pour Brand Language Models, une expression utilisée par Adobe. Il s’agit de nourrir l’IA avec l’ensemble des assets de la marque afin qu’elle puisse produire de nouveaux contenus en respectant son identité. L’enjeu sera d’ailleurs de réussir à faire évoluer le modèle à chaque changement de plateforme de marque… Reste un sujet principal : la valeur n’est pas liée au modèle, mais au data set. Les marques qui arrivent à structurer la donnée seront avantagées à l’avenir.»
Des marques qui pourront plus facilement développer un “BLM” pour produire et diffuser du contenu, et ainsi nourrir les LLM sur lesquels reposent les outils grand public. Mais les leaders du marché, qui appartiennent souvent à de grands groupes, sont-ils les mieux placés pour centraliser et structurer une donnée souvent bien plus éparpillée que chez les petites marques ?
Les nouveaux enjeux de l’AI Search Optimization
Ainsi, qu’il s’agisse d’influencer les réponses des modèles utilisés dès maintenant par les moteurs de recherche, ou de préparer un avenir plus ou moins proche où les modèles multimodaux alimenteront toute une batterie de nouveaux services en ligne, émerge de plus en plus pour les marques le besoin de faire de l’AISO (AI Search Optimization) en complément de la SEO classique.
C’est ce qu’indique Vincent Druguet, CEO de VML (Groupe WPP), le nouvel ensemble né de la fusion entre Wunderman Thompson et VMLY&R : « Nous avons de nombreux clients qui s’alarment de ne pas pouvoir maîtriser les informations données par ChatGPT et consort. Et nous n’avons pas vraiment la main dessus, car on ne sait pas encore totalement comment sont entraînés les modèles. Leurs résultats diffèrent souvent : il suffit de consulter des sites comme trackaianswers.com, qui répertorie les réponses des différents LLM à une même requête.»
De quoi donner des sueurs froides aux experts du référencement, qui avaient déjà fort à faire avec la multiplication des moteurs de recherche. Les enjeux de la “recherche en ligne générative” sont multiples, pour reprendre le terme utilisé ce 14 mai par Sundai Pichai lors de la présentation par Google des résultats de son intégration de Gemini, son modèle de GenAI, à son moteur de recherche. Une nécessité pour l’entreprise, qui voit son leadership sur le search de plus en plus menacé. Ces dernières années, les comportements de recherche se sont en effet diversifiés, et on ne cesse de rappeler que les nouvelles générations utilisent parfois plus Instagram ou TikTok pour trouver les réponses à leurs questions en ligne. À cela s’ajoutent Amazon et tous les sites e-commerce, et désormais donc, les LLM…
« Des outils comme Perplexity.ai sont de véritables Google Killer ! Nous allons donc regarder avec attention le déploiement d’AI Overview aux Etats-Unis et essayer de comprendre ce que sera l’AISO. Les conséquences pour les éditeurs et les annonceurs seront importantes, puisqu’on peut s’attendre à une baisse de 22% du trafic sur les sites, les internautes se contentant souvent des résumés affichés par le moteur de recherche. Mais c’est aussi un changement de paradigme pour Google, qui doit repenser l’ensemble de son business model ! », affirme Vincent Druguet.
Calculer sa “share of model”, un indispensable ?
En attendant que Google ne résolve son dilemme de l’innovateur, les spécialistes du SEO s’affairent donc pour anticiper le futur de leur discipline. « Il a fallu des années pour que l’on comprenne l’algorithme de Google grâce au reverse engineering. Avec les LLM, le problème est bien plus complexe, et les modèles ne cessent d’évoluer… », prévient Benjamin Pipat, Chief Solutions Officer de Jellyfish, qui a mis en place un Share of Model Engineering Program il y a quelques mois afin de se préparer à la nouvelle ère du search promise par les LLM.
L’initiative doit répondre entre autres à des questions comme : quelles sont les marques qui ressortent lorsqu’on réalise une demande générique à un modèle, et comment les résultats apparaissent lorsque le LLM est intégré à un outil de search, notamment par rapport aux résultats sponsorisés.
« Cela concerne Google, mais aussi Bing, Amazon ou encore Apple, alors qu’il va devenir de plus en plus naturel d’exprimer un besoin auprès de Siri ou de Rufus, l’assistant d’Amazon. Aujourd’hui, notre approche ne concerne que les modèles text-to-text, et consiste à réaliser une multitude de demandes comme : quelles sont les marques référentes sur telle ou telle catégorie ? Puis, sur la catégorie running par exemple, quelles sont les différences entre Hoka ou Nike ? Si Hoka se distingue systématiquement comme étant plus confortable que Nike, on va conseiller à Nike de produire plus de contenus intégrant cet argument afin de mieux ressortir dans les résultats organiques, ou même de revoir leur R&D ! », détaille Benjamin Pipat, qui cite l’intérêt de la plateforme Pencil, autre entité de The Brandtech Group, pour générer des contenus à partir de ces insights.
Jellyfish fait également évoluer des outils comme J+ Search, qui permettent de monitorer les performances SEO de ses clients, afin d’intégrer cette dimension “générative” et d’être ainsi susceptible d’identifier comment les LLM s’approprient les contenus réalisés par les marques pour les incorporer à leurs résultats.
Mais l’expert de Jellyfish rappelle que les LLM se nourrissent également des avis clients et des commentaires publiés sur des plateformes comme Reddit pour générer leurs réponses, qui seront propres à chaque modèle : « Les réponses de Rufus chez Amazon seront très orientées par les données transactionnelles grâce auxquelles il est entrainé, mais aussi les informations des fiches produits ou des avis… »
Ainsi, il est encore trop tôt pour que les marques et leurs agences puissent mettre en place de vraies stratégies permettant d’influencer les résultats des différents LLM. Elles peuvent au mieux calculer leur part de voix auprès de ces derniers. D’où la notion de “share of model “ introduite par Jellyfish. Une notion qui fait sens auprès des annonceurs selon Benjamin Pipat : « Il va falloir être de plus en plus agile pour faire face à la diversité des modèles, mais c’est la première fois de ma carrière que je vois des professionnels du marketing et du branding qui comprennent aussi rapidement les nouveaux enjeux du référencement ! »
À lire aussi
Ligue 1 : Google sommé de bloquer les sites pirates par la justice française
À la demande de DAZN, diffuseur officiel de la Ligue 1, le tribunal judiciaire de Paris a ordonné à Google de bloquer l’accès à plusieurs sites de streaming diffusant illégalement les matchs de la compétition. Une décision saluée comme « un tournant dans la lutte contre le piratage » par la plateforme britannique.
À lire plus tard
Vous devez être inscrit pour ajouter cet article à votre liste de lecture
S'inscrire Déjà inscrit ? Connectez-vous