Aller au contenu

Spécial AUDIO + IA: Faire parler les morts (Steve Jobs pour commencer) et rendre les vilains immortels .

Christian Beltrami
5 min
Spécial AUDIO + IA: Faire parler les morts (Steve Jobs pour commencer) et rendre les vilains immortels .
J'étais abasourdi. Je dirais que c'est le bon mot. Pour moi, c'est le plus grand moment (👇🏻) de stupéfaction que j'ai eu en matière d'IA. - Shaan Puri

Il y a de ces moments, excitants, mais qui font un peu peur en même temps, où l’on réalise que le monde va devenir encore plus étrange…

Une entreprise qui crée des voix par IA, play.ht, vient de lancer un podcast entièrement réalisé par intelligence artificielle. Les épisodes sont rendus à l'aide de voix IA, et le contenu est généré par des modèles linguistiques. Le premier épisode est une conversation entre Joe Rogan et… Steve Jobs.

L'IA a été "entraînée" sur les biographies de Jobs et tous les enregistrements de lui trouvés en ligne afin de le ramener à la vie de manière réaliste. Le résultat est une entrevue de 25 minutes qui va dans tous les sens, mais impressionnante.

Voici un court extrait:

audio-thumbnail
Podcast.AI • EPISODE 1 Joe Rogan interviews Steve Jobs
0:00
/0:49

(et l'entrevue complète)

Ce que je trouve hilarant, c'est que ce sont les auditeurs qui votent pour les entrevues futures. Et regardez-moi ça:

Ceci semble présager un futur dans lequel nos divertissements seront imaginés à partir de zéro par intelligence artificielle, en fonction de ce qu’elle pense que nous aimons. On peut imaginer les risques de dérapages algorithmiques...

Ce qui rend possible ce genre de "délire créatif" c'est que les récentes percées en Deep Learning ont permis de reproduire de nombreuses subtilités de la parole humaine, comme les pauses et la respiration aux bons endroits. Ces voix peuvent changer de style ou d'émotion. Dans de courts clips audio, certaines sont devenues indiscernables des humains.

Il est également désormais possible de cloner n'importe quelle voix. Et pour s'en convaincre, rien de tel que de tester ce clonage dans un univers où les fans sont impitoyables. Comme l'univers Star Wars par exemple.

La série Obi-Wan Kenobi a mandaté la boîte Respeecher afin de faire "sonner" Darth Vader comme le méchant interprété par James Earl Jones d'il y 45 ans, maintenant que sa voix a vieilli et qu'il a pris sa retraite (il a 91 ans). Lorsqu'on a présenté son clonage à l'acteur, celui-ci a accepté d'utiliser ses enregistrements vocaux d'archives pour maintenir Vader en vie et en bonne santé même de manière artificielle.

Les fans ont adoré le retour terrifiant de Vador, louant sa présence glaciale. La famille de Jones a confié à Wood qu'elle était ravie du résultat de tout ce travail, un hommage à l'acteur qui honore ses nombreuses années passées à donner de la voix au tyran galactique.

Mais monsieur Jones avait déjà fait sa carrière alors que pour les jeunes comédiens ces nouvelles technologies sont plus inquiétantes.

Car ces nouvelles startups de voix IA embauchent généralement des acteurs pour fournir des heures de contenu audio qui peuvent ensuite être transformées en un service vocal on demand. Les représentants des talents (SAG-AFTRA, Equity, etc.) affirment qu'ils reçoivent des contrats pour des travaux d'IA qui donnent aux entreprises IA le droit d'utiliser de manière irrévocable et perpétuelle la ressemblance ou la voix d'un acteur. Les jeunes acteurs, en particulier, pourraient être tentés par le cachet à l'avance pour regretter les implications à long terme.

À Hollywood, comme dans l'ensemble de l'économie, les superstars s'en sortiront - tous les autres devront rester sur leurs gardes.

Une enquête menée cette année par Equity, le syndicat britannique des artistes, a révélé que 65 % des membres pensaient que l'IA représentait une menace pour les possibilités d'emploi dans le secteur, ce chiffre passant à 93% pour les artistes audio.

Nous pensions que l'intelligence artificielle viendrait d'abord pour les comptables. Il semblait raisonnable de supposer que l'IA transformerait ou même éliminerait les emplois dans les secteurs de la comptabilité et de l'assurance, tandis que les travaux associés aux traits humains tels que la créativité seraient relativement épargnés.  Mais cette théorie semble s'effriter de jour en jour.

Actors worry that AI is taking centre stage, Sarah O’Connor, Financial Times, August 30 2022 [https://on.ft.com/3TJcIDt]

Avec l'omniprésence des haut-parleurs intelligents, et l'essor des agents de service à la clientèle automatisés ainsi que des assistants numériques intégrés dans les voitures et les appareils intelligents, les marques peuvent être amenées à produire plus d'une centaine d'heures de contenu audio par mois.

Alors l'offre d'audio IA se multiplie:

VocaliD, par exemple, propose une gamme de voix selon des styles très précis, comme Sheli, pétillante, optimiste et énergique...

WellSaid Labs décrit ce que les clients peuvent attendre de ses huit nouveaux acteurs vocaux numériques. Tobin est "énergique et perspicace". Paige est "posée et expressive." Ava est "polie, sûre d'elle et professionnelle".

Sonantic, une société d'IA qui vient d'être rachetée par Spotify, crée des voix qui peuvent rire, crier ou pleurer.

Mais si la menace bien réelle pour les artistes, certaines opportunités émergent. Avec de bons accords contractuels, il pourrait être très utile pour les acteurs d'avoir une source de revenus passifs provenant de la version IA d'eux-mêmes. Surtout qu'avec l'IA leurs voix peuvent être adaptées rapidement à différents publics et régions.

Certaines entreprises spécialisées dans l'IA vocale peuvent manipuler l'accent ou changer la langue d'une même voix de différentes manières. Cela ouvre la possibilité d'adapter les publicités sur les plateformes de streaming en fonction de la personne qui écoute, en changeant non seulement les caractéristiques de la voix mais aussi les mots prononcés.

AI voice actors sound more human than ever—and they’re ready to hire, Karen Hao, MIT Technology Review

La meilleure façon de conclure est de laisser le mot de la fin à fake Steve Jobs... Et en tant que création IA, je crois qu'il tente de nous passer un message.

audio-thumbnail
Le mot de la fin par Steve Jobs.
0:00
/0:38

Well said... 😅

À bientôt. 👋🏻