Moshi, le modèle d’IA qui parle a été dévoilé
Le laboratoire parisien d’IA Kyutai a présenté, Moshi, une intelligence artificielle (IA) vocale réagissant en temps réel. La voix elle-même est celle d’une artiste, Alice. Elle a enregistré des heures de sa voix, sur différentes intonations, selon différentes émotions pour qu’au final, Moshi s’avère capable de parler en chantant, en murmurant, et quantité d’autres inflexions, explique Sciences & Avenir.
Moshi moshi sans Internet
L’autre point clef du projet et d’éviter à l’utilisateur d’être relié aux serveurs cloud d’un prestataire (comme avec OpenAI ou Google). Moshi peut fonctionner sur un ordinateur portable non connecté à internet. A terme, Kyutai ambitionne de faire la même chose sur smartphone, grâce à des méthodes de compression qui réduisent la place occupée en mémoire et garantissent une faible latence dans les échanges. Là encore, le laboratoire a développé sa propre technologie de compression audio.
Le laboratoire Kyutai est une fondation, lancée en novembre 2023 à Station F, dont trois des mécènes et co-fondateurs sont Xavier Niel d’Iliad, Rodolphe Saadé et Eric Schmidt (ancien de Google). Le groupe iliad et le groupe CMA CGM avaient chacun contribué à hauteur de 100 millions d’euros au financement du laboratoire de recherche qui est composé de 9 chercheurs. Kuitai est un laboratoire à but non-lucratif entièrement dédié à la recherche ouverte en intelligence artificielle (AI).
À lire aussi
100%Media week : Rodolphe Saadé (CMA Média), Nathalie Sonnac, Sibyle Veil (Radio France)
Retrouvez la revue de presse des médias et de la publicité. Un podcast de 10 minutes, disponible les vendredis dès 6h, sur toutes les plateformes d’écoute. Un épisode spécial enregistré à Marseille à l'occasion des Rencontres Internationales des Médias à Marseille.
À lire plus tard
Vous devez être inscrit pour ajouter cet article à votre liste de lecture
S'inscrire Déjà inscrit ? Connectez-vous