La seule raison pour laquelle je'n’utilisera jamais de générateurs de texte-vidéo à base d’IA

  • Les générateurs de vidéos à base d’IA évoluent de manière impressionnante, mais l’effet « uncanny valley » persiste.
  • Les progrès de la technologie de l’IA promettent des vidéos plus réalistes, mais l’impression de décalage et de déstabilisation persiste.
  • Les générateurs d’IA les plus récents visent la perfection hyper-polie, mais risquent d’avoir l’air sans vie et stérile.

J’ai essayé plusieurs générateurs de texte-vidéo par IA, et bien que la technologie soit indéniablement impressionnante, il y a toujours quelque chose qui cloche dans les résultats finaux. Il m’a fallu un certain temps pour mettre le doigt sur le problème, mais j’ai fini par comprendre que tout se résumait à une seule chose : l’effet de la vallée étrange (uncanny valley).

Bien que j’utilise certains outils d’IA pour les effets visuels de mes projets vidéo, je ne peux pas me résoudre à utiliser l’IA pour générer des séquences vidéo parce qu’elles ont l’air trop.troublantes.

Le plus gros problème des générateurs de texte-vidéo à base d’IA

La génération de vidéos par l’IA a fait d’énormes progrès en peu de temps grâce aux avancées dans le domaine de l’apprentissage profond. Si vous étiez en ligne en 2023 lorsque la génération de vidéos par l’IA a explosé, vous vous souviendrez peut-être de ce clip de Will Smith mangeant des spaghettis qui a fait le tour du web. Bien que ce type de technologie ait été révolutionnaire à l’époque, on ne peut nier qu’elle semble peu naturelle et déstabilisante.

Voir aussi :  Plus de personnes peuvent désormais regarder des clips vidéo sur Spotify

En 2024, ces outils vidéo d’IA générative deviennent plus perfectionnés, créant des images plus fluides et des mouvements plus réalistes. Regardez la différence entre les vidéos créées avec Runway Gen-2 en 2023 et celles qu’OpenAI a dévoilées en 2024 pour présenter Sora AI. Sora n’est pas encore disponible pour un usage public, mais c’est la qualité que l’on nous promet :

Malgré cette amélioration, je ne suis toujours pas convaincu. D’une part, Sora n’est pas encore disponible à l’utilisation, donc nous devons encore utiliser des générateurs moins raffinés qui produiront les mêmes résultats effrayants que la vidéo de spaghettis de Will Smith.

Regardez cette vidéo que j’ai créée avec PixVerse en utilisant l’invite « Une personne marchant dans un parc par une journée ensoleillée, souriant et saluant la caméra. Des oiseaux volent au-dessus de sa tête et les arbres se balancent doucement sous l’effet de la brise. »

Les deux premières secondes semblent correctes, jusqu’à ce que les doigts, les cheveux et le visage de la personne commencent à fondre dans l’air ! Même lorsque des générateurs plus avancés comme Sora arriveront et nous donneront des vidéos plus précises et plus belles, il y a toujours quelque chose de troublant dans les humains et les paysages générés par l’IA.

Voir aussi :  Pourquoi je'l'iPhone 16 Pro au lieu de l'iPhone 16 Pro Max

Alors que les anciens modèles produisent généralement des vidéos avec des indications claires sur l’IA, comme ces visuels de style claymation, les améliorations apportées par les nouveaux générateurs semblent presque trop parfaites. Lorsque je regarde ces clips de Sora, j’ai l’impression que la tentative d’affiner les résultats se dirige vers un territoire hyper-poli, où l’apparence est si parfaite qu’elle finit par donner l’impression d’être stérile et sans vie.

Contre nature, troublant, stérile et sans vie. C’est exactement ce qu’est l’effet de la vallée de l’étrange – semblable à l’homme, mais pas tout à fait humain.

Quelle que soit la qualité de ces générateurs, l’effet « uncanny valley » persistera toujours. À moins de rechercher une esthétique abstraite aussi surréaliste que ce que l’on voit dans les rêves, je ne me fierai pas à un générateur de texte-vidéo IA pour aucun de mes projets vidéo.

Cliquez pour évaluer cet article !
[Total: Moyenne : ]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *