Avec l’IA sémantique, le contextuel veut convaincre
Les solutions contextuelles utilisant l’IA sémantique se pressent pour proposer au marché une alternative aux cookies tiers. Face aux ID, une troisième voie qui entend bien faire sa place.
Qwarry annonce le lancement d’une nouvelle solution d’analyse 100% sémantique, Weborama se positionne sur l’IA générative et Seedtag qui continue d’entraîner ses modèles pour une meilleure compréhension sémantique du contenu… dans une année de dépréciation du cookie, le monde de la publicité contextuelle espère bien gagner davantage de parts de marché, déjà 30 à 40% des budgets en open web selon nos informations. Si la technique, qui vise à diffuser des publicités choisies en fonction du contexte dans lequel le contenu publicitaire est inséré, est connue, elle doit prouver son efficacité. Pour cela, encore devoir utiliser les ficelles du métier, pour être correctement valorisée.
Pour essayer de cibler l’audience derrière le contenu, la startup normande Quarry, créée en 2019, travaille depuis un an et demi sur un pixel, Reveal, un cookie cookieless désormais accessible, pour permettre aux annonceurs d’analyser le positionnement sémantique d’un contenu (pour cibler les emplacements les plus pertinents, ndlr). Mais aussi de rendre les techniques sémantiques davantage visibles, en activant les segments identifiés par Qwarry via les DSP ou SSP choisies par les annonceurs. S’il faut le rappeler : monitorer les performances en temps réel de leurs campagnes.
Une réponse dans un monde dataless
« On est aujourd’hui dans un monde dataless, où on ne peut cibler véritablement que 50% de l’audience », nous explique Geoffrey Berthon, cofondateur de Qwarry. L’objectif : « aller chercher un inventaire tout aussi performant ». Sa solution, à l’image de celle de Seedtag, va analyser le contenu des pages web « pour en extraire la substantifique moelle ». Comprendre : aussi bien de quoi on parle que le sentiment dégagé par l’article. « Si Coca-Cola met des bannières autour des stades de foot, c’est bien que la marque pense que c’est la bonne audience ». Reste à le vérifier : son pixel Reveal compte le nombre d’impressions des campagnes et enregistre quel contenu a été touché par la campagne. L’objectif : le retargeting.
Si la campagne fonctionne correctement sur certains environnements, qu’elle intéresse le cœur de cible de la marque, elle va être poussée sur des environnements similaires. Ça vous rappelle quelque chose ? Le contextuel, lui aussi, veut être user centric. « Avec le pixel et l’analyse d’une première campagne, l’annonceur peut recréer un segment contextuel qui lui est propre sur les mêmes centres d’intérêt mais sur une audience qu’on ne connaît pas encore ».
Qwarry, qui a développé 400 segments, s’appuie également sur des données d’âge et de genre, issues de données individuelles et anonymisées, de la mesure d’Audience Internet Global de Médiamétrie //NetRatings. Une solution naturelle pour la startup, aujourd’hui rentable, qui y travaille depuis sa création. Mais déjà mis en place chez la concurrence, quelque peu différemment, sans le retargeting. « Grâce à un pixel sur le site de l’annonceur, on va identifier un profil », s’enthousiame Margarita Zlatkova, Head of data & programmatic au sein de l’adtech française Weborama, créée en 1998 et d’abord spécialisée dans la gestion de la data.
Déshabiller le texte
« Avec notre base de données, on va ensuite rechercher des profils similaires. Côté éditeurs, on va les aider à créer des assets data qu’ils vont utiliser ». La société veut tenter de répondre aux objectifs de l’ensemble de la chaîne de valeur : là aussi, création de segments sur mesure. « On travaille en audience planning plutôt qu’en média planning », explique Margarita Zlatkova, qui dispose de 350 segments en cookies tiers, 350 segments en contextuel et 250 millions d’URL en stock grâce à des partenariats avec 366, Leboncoin ou France Télévisions. « Notre base de données cookies se basait déjà sur le contenu, notre devise depuis le début : dis-moi ce que tu lis, je te dirai qui tu es ».
En 2020, Weborama commence à créer des cookies à partir d’analyses textuelles. « Maintenant on analyse des URL et on crée des segments ». Avec l’arrivée du traitement automatique du langage naturel (natural language processing, NLP) et la création d’une équipe de linguistes, « la solution peut désormais comprendre que le PSG signifie Paris Saint Germain ». Comme Seedtag, Weborama déshabille le texte pour travailler sur la sémantique pure. « On garde le texte brut et on enlève tout le reste ». Puis un score d’affinité est appliqué aux pages, pour y adresser les bonnes campagnes.
« Il faut d’abord segmenter : le nombre de phrases, la ponctuation, où se situent les apostrophes… », abonde Habenn Bereket, directeur général de Seedtag France depuis 2 mois, après 8 ans chez Ogury. La société prône la tokenisation : « trouver l’élément le plus petit, le mot. On va enlever tous les mots redondants ou de connexion, puis dé-prioriser certains et peser le poids de chacun. Enfin, pour comprendre la tonalité dans un objectif de brand safety, chacun des mots est représenté dans sa forme canonique (verbe à l’infinitif, nom au masculin singulier…), c’est la lemmatisation ». Seedtag revendique ainsi analyser des « dizaines de milliers » d’articles chaque jour.
De la performance
« On assume que ce soit moins précis, sur une base utilisateur que l’on connait pas. Mais on vient valoriser un inventaire éditeur qui a perdu de la valeur dans ce monde cookieless », poursuit Geoffrey Berthon. Si le contextuel peut s’exprimer à partir de mots clés, de rubriques, de supports, le NLP boosté par IA veut s’imposer. Il permet de déterminer une meilleure relation entre les mots : « la différence entre le sport et le management d’équipe, la définition du mot énergie, qui peut signifier beaucoup de choses », ajoute Margarita Zlatkova. Mais aussi d’identifier le sujet principal et les sujets secondaires dans le texte. Chez Weborama, on en est sûr : on peut faire de la performance avec du contextuel. « La majorité de nos campagnes contextuelles performent au mieux, des clients comme Cofidis ont basculé sur du contextuel 100%. Les campagnes intègrent déjà 40% à 70% de contextuel : on n’observe pas de pertes de performance par rapport aux cookies ». La recette ? Une solution open web via le programmatique, « qui permet de toucher la totalité des inventaires ».
« Il y a encore beaucoup de pédagogie à faire sur le marché », estime Habenn Bereket. « On entend beaucoup de buzz words en ce moment : NLP, sémantique, contextuel… certains s’appuient sur ces modèles mais ne font qu’extraire des mots clés, ce n’est pas suffisant ». Comme ses concurrents, l’espagnol va créer des segments de ciblage affinitaires, à disposition des annonceurs. Mais aussi analyser les stratégies de marque, l’association à des valeurs… pour investir des emplacements identifiés comme concurrentiels. « On travaille pas de manière exclusive avec un éditeur ». La société, qui diffuse ses propres formats display et vidéo, a également investi le champ de l’IA générative, « pour s’adapter au contenu de l’article sur lequel on diffuse », ajoute Habenn Bereket.
La promesse : une seule création qui offre de multiples itérations d’annonces, qui s’adaptent mieux à l’endroit où elles se trouvent en ligne. De la DCO, accessible via une DSP ou en gré-à-gré avec les équipes commerciales. L’IA générative profite également à Weborama, qui l’utilise pour fournir une liste d’URL de pages web, en proximité sémantique avec des phrases générées par l’IA, à partir du brief fourni. Des URL déjà scorées parmi les 250 millions disponibles dans sa base de données. Parmi les alternatives au cookie, le contextuel creuse son sillon aux côtés des ID, avec un défaut pour certains, s’il se veut efficace, d’être encore trop probabiliste.
À lire aussi
L'impératif d'une publicité digitale « privacy first » - par Habenn Bereket (Seedtag)
TRIBUNE. À l'heure où les consommateurs deviennent de plus en plus conscients de la valeur de leurs données personnelles et où les régulations sur la protection des données se multiplient, la publicité digitale doit impérativement évoluer vers un modèle « privacy first ».
À lire plus tard
Vous devez être inscrit pour ajouter cet article à votre liste de lecture
S'inscrire Déjà inscrit ? Connectez-vous