Nous l’avions prévu, des médias entièrement générés par l’IA devaient bien finir par arriver un jour, mais avec la vidéo-démo publiée à la fin de 2023, leur éclosion pourrait être plus proche qu’on ne le pense. En effet, Channel1.ai propose d’offrir aux utilisateurs “une façon plus personnelle de regarder les informations” grâce à un réseau mondial d’actualités alimenté par l’IA générative, dont le lancement est prévu pour 2024.
Traduction : ce ne sont pas des humains qui parlent à l’écran.
La vidéo d’introduction montre comment l’IA sera bientôt utilisée dans le domaine de l’information :
Lorsqu’Emmanuel Methivier, Business Program Director et Axway Catalyst, a partagé cette vidéo avec moi, j’ai été stupéfaite. En tant qu’ancienne journaliste et présentatrice de journaux télévisés, j’avais plus de questions que de réponses.
Non, personnellement, je ne pense pas que les présentateurs artificiels remplaceront demain entièrement les journalistes. Mais il y a encore beaucoup de choses à analyser et, comme le souligne Emmanuel, ces technologies vont indubitablement changer notre façon de travailler. Nous vous invitons à poursuivre votre lecture pour découvrir quelques-unes de nos réflexions dans un format d’interview libre.
La qualité de production de l’IA devient excellente
Emmanuel : Comme vous pouvez le constater, le premier élément marquant est la qualité de la réalisation. Les synchronisations labiales ont encore progressé, les transitions sont parfaitement exécutées, et le seul aspect artificiel qui subsiste dans cette interface, ce sont les postures un peu répétitives, notamment au niveau des mains.
Lydia : Ou, comme l’a dit un journaliste d’ARS Technica, “ces présentateurs de journaux télévisés générés par l’IA me font flipper“.
Bien sûr, il y a quelques bizarreries, mais les voix sont remarquablement fluides, les visages sympathiques et accueillants, et je suis stupéfaite par la qualité de l’image.
Si l’on considère que peu de gens regardent aujourd’hui encore vraiment la télévision – préferant faire défiler les news sur leur téléphone tout en mettant le dîner sur la table et en écoutant d’une oreille – ces présentateurs pourraient être peu remarquables si vous n’y prêtez pas attention.
Franchement, c’est terrifiant. Channel 1 a peut-être les meilleures intentions du monde, mais à une époque où la désinformation est déjà omniprésente et où les “deepfakes” sont une réalité, je n’ose imaginer les dégâts que pourraient causer de vraies “fake news“.
Les présentateurs de journaux télévisés seront-ils au chômage ?
Lydia : Pardonnez mon discours, mais la question la plus immédiate qui m’est venue à l’esprit est la suivante : “d’où viennent les sources originelles ?”
On croit souvent à tort que les présentateurs de journaux télévisés sont des guignols, des personnes qui s’assoient sur une chaise, se maquillent et lisent un téléprompteur. Si c’était le cas, pourquoi ne pas utiliser des présentateurs générés par l’IA ? Cela coûterait probablement beaucoup moins cher que des stars humaines !
Mais la réalité est que le présentateur du journal télévisé est la clef de voûte de l’émission. Il dirige le contenu, il écrit probablement une bonne partie des scripts, et il mène des interviews en direct avec les sujets et les journalistes.
Lorsque je présentais le journal télévisé du soir à Casper, dans l’État du Wyoming, j’arrivais des heures plus tôt pour rédiger et ordonner le journal télévisé, décider des sujets à traiter et à promouvoir… Les jours où je faisais également un reportage, je menais des recherches préalables (comme, par exemple, demander des archives municipales et passer au crible des piles de documents), je passais des coups de fil, j’attrapais une caméra et je partais dans une camionnette pour faire un reportage, tourner et éditer un sujet pour le journal du soir.
Le fait est que tout cela nécessite deux choses :
- des personnes réelles qui peuvent parler à d’autres humains, et
- des personnes et des caméras sur place, là où est l’action.
Les journalistes vont-ils perdre leur emploi ? Ils pourraient être licenciés en raison de la poursuite des fusions-acquisitions et du déclin général du journalisme, mais je doute que l’IA en soit encore là.
Emmanuel : N’oublions pas que le sourcing des informations a été, lui aussi, largement disrupté, uberisé par le digital, par la prolifération des smartphones et des caméras de vidéo-surveillance dont les images sont déjà bien plus utilisées que les vidéos des reporter de guerre par exemple. Le côté « sale boulot » des Robert Capa, Henri Cartier-Bresson et Jean-Pax Mefret sont aujourd’hui remplacés par des iPhones d’acteurs locaux, des quidam, dont les images inondent les réseaux sociaux!
La traduction assistée par l’IA fait tomber les barrières
Emmanuel : Une deuxième observation que l’on peut faire en regardant cette démo est la grande disruption des langues. Regardez ce clip, l’interview d’un Français constatant les dégâts causés par une tempête sur sa propriété, traduite directement en anglais, en utilisant sa voix et en ajustant légèrement la vidéo pour synchroniser ses lèvres.
Ceux qui me connaissent savent que je suis plutôt germanophone qu’anglophone (après ma langue maternelle, le français). Mais grâce à un outil appelé HeyGen, j’ai pu m’enregistrer en train de parler en français, puis générer une traduction en anglais. Lydia aussi s’est prêtée à l’exercice avec quelques anciens clips de son travail de journaliste aux U.S.
Lydia : C’est effrayant de voir à quel point c’est bien fait – surtout avec la synchronisation labiale ! Si je ne connaissais pas ta voix réelle (la nouvelle vidéo te donne un peu une voix à la Arnold Schwarzenegger australien !), je ne saurais probablement pas que ce n’est pas réel au premier coup d’œil.
Plus sérieusement, l’élément de traduction synchronisée m’a semblé être la plus grande avancée dans toute cette démo.
La pratique actuelle consistant à ajouter une voix off monotone d’un interprète nous fait vraiment sortir de l’action, pour ainsi dire, d’un clip vidéo. L’idée de pouvoir utiliser la vraie voix d’une personne pour transmettre sa propre histoire et ses émotions à n’importe quel public est vraiment convaincante.
Et en même temps, je repense au journaliste polyglotte Philip Crowther, dont la vidéo est devenue virale il y a quelque temps, quand il a présenté un reportage en direct dans six langues différentes. Ce n’était pas un simple tour de passe-passe : il parlait ces langues et en comprenait les cultures.
Charlemagne disait qu’avoir une autre langue, c’est posséder une seconde âme ; est-ce le cas pour ChatGPT ?
Emmanuel : La tour de Babel est sur le point de tomber, redonnant à l’humanité un pouvoir démiurgique que rien ne peut plus arrêter. Nous pouvons commencer à penser aux créations génétiques et à la symbiose homme-machine, qui a également fait un grand pas en avant en dépassant l’informatique neuromorphique pour proposer l’intégration du tissu cérébral humain directement dans l’ordinateur (découvrez le papier ici : Brain organoid reservoir computing for artificial intelligence).
Pour en revenir à notre propre cercle d’influence, chez Axway, il va falloir repenser les outils et les interfaces d’intégration, mes amis.
J’ai partagé quelques idées à ce sujet dans notre guide de prédictions Looking Forward 2024 : à l’aube des années 2020, beaucoup ont compris que nous devions passer d’une vision d’API techniques à des produits digitaux orientés vers les entreprises. L’année à venir nous obligera à réévaluer ces produits et leur marketing pour les adapter aux nouveaux consommateurs de services : les génératifs de l’IA !
Téléchargez dès aujourd’hui ces 8 prédictions importantes sur l’intégration numérique pour 2024.
Un journalisme généré par l’IA auquel on peut se fier ?
Emmanuel : Troisième constat : nous ne savons plus vraiment distinguer la vérité.
Certes, il s’agit là d’une question philosophique qui remonte à la nuit des temps, et la falsification historique peut même être observée sur les façades des temples égyptiens (effaçant les hiéroglyphes pour réécrire l’histoire), à travers les fameuses photos trafiquées de Staline, ou les vidéos des couveuses koweïtiennes.
Mais la grande promesse de la pluralité médiatique d’Internet, qui était censée apporter une réponse à ces mensonges centralisés de la Pravda, semble aujourd’hui dissoute non seulement par la concentration des sources d’information (dominée par les GAFAM), mais aussi par le fait que la machine à fabriquer « la vérité » a pris une nouvelle dimension, une nouvelle étape, avec ces nouveaux outils d’IA générative qui peuvent créer une image totalement irréelle et l’accompagner d’un témoignage oral tout aussi fictif.
Vidéo : Poutine confronte son “double” IA
Lydia : Et même avec des acteurs bien intentionnés, que perd-on d’autre ? L’IA pourrait devenir très douée pour analyser les documents judiciaires afin de résumer les accusations criminelles, mais peut-on imaginer un courriel généré par l’IA demandant à un investisseur frauduleux d’enregistrer lui-même son entretien ? Qui posera les questions difficiles ?
Toutes les séquences du bulletin d’information généré par l’IA que nous avons regardé ci-dessus ont été tirées d’autres sources d’information où de vrais journalistes et vidéastes étaient sur le terrain pour faire le “sale boulot”.
Les cultes de la personnalité dans les médias ont été critiqués à juste titre, mais si nous ne savons même pas qui fait le reportage, comment pouvons-nous faire confiance à l’information ?
On a beaucoup dit sur le fait que l’IA ne vaut que ce que valent les données qui la forment. Il y a près de dix ans, Cathy O’Neil nous avertissait que certains algorithmes de big data sont de plus en plus utilisés de manière à renforcer les inégalités préexistantes, créant ainsi un « cocktail toxique pour la démocratie ».
La Harvard Business Review souligne l’urgence de remédier aux préjugés humains qui s’introduisent dans les systèmes d’intelligence artificielle avec des résultats néfastes.
Si l’on ajoute à cela le déclin bien documenté des informations locales, tout média d’information généré par l’IA – même s’il dispose de rédacteurs humains pour vérifier le contenu – devra être particulièrement prudent et sélectif en ce qui concerne ses sources d’information.
Emmanuel : La méfiance à l’égard de l’information et donc de la vérité remettra en cause les fondements des démocraties libérales et pourrait conduire à une transformation radicale de la société. La souveraineté des Etats dans ces domaines semble de plus en plus urgente, mais c’est un autre débat…
Il s’agit là de sujets relativement lourds, et nous ne pourrons certainement pas résoudre toutes ces questions en un seul billet de blog, mais nous nous réjouissons de poursuivre la discussion. Une chose est claire cependant : la révolution de l’IA a des applications très réelles et immédiates dans le monde des API et de l’intégration, comme Emmanuel l’a souligné tout au long de l’année écoulée. Chez Axway, nous serons là pour conseiller et soutenir les entreprises dans leur recherche d’un juste équilibre en matière d’API.
Téléchargez notre guide de prévisions, Looking Forward 2024, pour obtenir des avis d’experts sur les questions les plus pressantes auxquelles les responsables informatiques et les chefs d’entreprise seront confrontés dans l’année à venir.