À gauche : le supercalculateur Jean Zay (Crédits : Cyril FRESILLON / IDRIS / CNRS Photothèque) - À droite : deux enfants jouant avec la "Fabrique à histoires Lunii (Crédits : Lunii)
Tout d’abord, Jean Zay. Ce supercalculateur de GENCI convergé avec l’intelligence artificielle figure parmi les plus puissants d’Europe. L’IDRIS – CNRS opère et héberge cet outil de pointe d’une capacité de 126 PFlops. Au service de la science, académique et industrielle, Jean Zay voit ses ressources utilisées gratuitement par les chercheurs dans le cadre de la recherche ouverte. Cela implique pour eux de produire une publication accessible dans le prolongement des travaux qu’ils ont menés. Afin de répondre aux besoins des chercheurs, l’infrastructure de recherche GENCI procède à un processus d’attribution d’« heures de calcul ». Cette démarche, qui bénéficie du label ISO 9001, permet aussi bien à des grands groupes, qu’à des laboratoires académiques, à des startups et des PME de pouvoir utiliser ces ressources technologiques pour faire de la recherche et produire un savoir utile à tous.
C’est dans ce contexte que l’entreprise Lunii a rencontré Jean Zay. Créée en 2016, Lunii est une entreprise française. Elle compte aujourd’hui près de 80 salariés. Beaucoup de parents la connaissent grâce à la « Fabrique à histoires » offerte à leurs enfants. L’ambition de Lunii, c’est « de placer l’imagination au cœur du développement de l’enfant ». Avec les « Farfadets de Fondujardin », le nouveau livre audio interactif produit par l’entreprise, nos bambins peuvent désormais choisir le prénom de leur personnage. Et cela sans limitation. Les possibilités envisagées dans un avenir proche pour favoriser le caractère immersif et les interactions de l’enfant avec l’histoire iront bien au-delà du seul choix du prénom.
Pour parvenir à ce résultat de manière cohérente, crédible, Lunii a eu recours, dans le cadre de l’aide apportée au titre de la recherche ouverte, aux ressources de Jean Zay. Lunii a ainsi pu entraîner des modèles de synthèse vocale neuronale, destinés à générer une parole synthétisée la plus fidèle possible.
Comment ça marche ?
Ce dispositif repose sur des « réseaux de neurones », un programme informatique inspiré du fonctionnement du cerveau humain, qui en simule les principes d’apprentissage.
Cette technologie vise à ce que la machine puisse « apprendre à faire quelque chose » par entraînement. Elle est le cœur de ce qui est aujourd’hui dénommé “Intelligence Artificielle”, ou IA. En l’occurrence, on utilise des données narratives, c’est-à-dire une voix pour les enfants déjà enregistrée.
On va alors demander au réseau de neurones de lire un texte. Il va produire de l’audio avant de le comparer avec la version enregistrée par un acteur ou une actrice. Le réseau de neurones va alors se mettre à jour, pour une réduction progressive des erreurs et un rapprochement optimal avec la version cible enregistrée par une actrice ou un acteur.
Grandes étapes de l'entraînement d'un réseau de neurones (Droits Lunii, in Médium)
Car, il faut le souligner, les comédiens et comédiennes ont enregistré toute l’histoire. Ils n’auraient pas pu enregistrer cependant une infinité de prénoms. Le travail de l’IA permet de choisir tout phonème pour cet objet, le prénom de son doudou, de son chat, etc. Le caractère ici vertueux de l’utilisation de l’intelligence artificielle se traduit dans l’importance accordée aux acteurs, aux doubleurs, aux professionnels de la voix. Loin de supprimer leur emploi, leur intervention est indispensable. Pour Samuel Delalez et Lunii, cette technologie a vocation ici à « être un vecteur créatif, de nature à démultiplier les possibles, et non un vecteur de remplacement des artistes ».
Comment avoir une utilisation positive voire éthique de l’IA ?
Lunii travaille avec son équipe éditoriale interne pour développer et promouvoir une éthique de l’intelligence artificielle et créer par exemple une charte visant à définir leur vision de son utilisation au sein de l’entreprise. Mais plus encore, Lunii ambitionne de prendre en compte cette dimension dans le développement de ses produits. L’entreprise participe en ce sens au projet Exovoices, en partenariat avec l’Ircam (Institut de Recherche et de Coordination Acoustique / Musique) et le LSCP ("Laboratoire de Sciences Cognitives et Psycholinguistiques"), comportant plusieurs axes parmi lesquels :
- Développer des modèles permettant comprendre contenu du texte pour le prononcer de la bonne manière en fonction du contexte, du sens et de la gamme émotionnelle contenue dans le texte. Les protocoles d’évaluations existants ne sont pas adaptés à rendre compte du caractère monotone et expressif d’une voix de synthèse, et EXOVOICES se propose de contribuer à définir la notion d’expressivité́ en élaborant un protocole expérimental permettant d’évaluer cette notion sur des voix naturelles et synthétiques
- Évaluer l’impact cognitif utilisation synthèse vocale sur l’attention des enfants lorsqu’ils écoutent des histoires
Pour l’avenir, Lunii souhaiterait réutiliser Jean Zay pour permettre d’améliorer le modèle existant et créer de nouveaux personnages…
Pour en savoir plus :
https://arxiv.org/pdf/2304.08209