Midjourney v5 vs. DALL-E 2 : Quelle IA est la meilleure pour générer des mains ?

Les générateurs d’art de l’IA ne cessent d’impressionner, nous permettant de créer à peu près tout ce que nous pouvons imaginer. Cependant, la technologie semble s’être heurtée à un mur lorsqu’il s’agit de générer des mains réalistes.

Nous examinons ici deux des principales applications d’art génératif et les opposons l’une à l’autre – ou main à main – pour voir laquelle génère les meilleures mains, Midjourney v5 ou Dall-E 2. L’une ou l’autre de ces applications maîtrise-t-elle les mains ? Nous allons le découvrir !

Le problème de l’IA avec les mains

Depuis que l’art généré par l’IA s’est répandu sur Internet, la qualité des mains dessinées par l’IA a fait l’objet de critiques. Malgré des mises à jour récentes, comme le montrent nos comparaisons côte à côte, les résultats ne sont pas satisfaisants.

Les deux concurrents ont amélioré leurs capacités et la qualité de leurs résultats à chaque itération. La dernière mise à jour, la version 5 de Midjourney, a montré des progrès impressionnants. Cependant, le problème des mains dessinées par l’IA reste entier et ne peut être ignoré.

Comparaison 1 : Utilisation des invites « Main » et « Mains »

Nos comparaisons vont contenir exactement les mêmes invites pour Dall-E 2 et Midjourney v5. Nous allons concevoir les invites pour qu’elles soient spécifiques aux mains au lieu de simplement créer des personnes pour voir à quoi ressemblent les mains. Nous ne donnons à chaque application qu’une seule chance (jet) pour chaque invite.

Main

Commençons par l’invite la plus basique et la plus pertinente : « main ».

Midjourney v5 :

Dall-E 2 :

Nous ne sommes pas bien partis !

Midjourney a pris le parti inhabituel d’associer une main à des situations plutôt créatives. Au lieu de se concentrer sur une seule main, nous voyons un magicien, des gants, un squelette et une minuscule figurine. Il manque également un doigt à l’image des gants.

Dall-E 2 adopte l’approche inverse et nous offre une seule main sur un fond uni. Mais curieusement, il y a des postures étranges, notamment avec les pouces, qui ne semblent ni naturelles ni confortables. Chaque main est également coupée sur l’un des côtés des images.

Qui gagne cette manche ? Nous donnerons la palme à Dall-E 2 pour la précision générale.

Les mains

Mettons l’invite au pluriel, « mains », et voyons ce que les IA vont proposer.

Voyage à mi-parcours v5 :

Dall-E 2 :

La tentative de Midjourney de créer des « mains » est plus réussie cette fois-ci. Mais les quatre images sont en noir et blanc, et il manque quelques doigts. En y regardant de plus près, on peut aussi voir que certains des doigts ont une forme étrange ou se transforment les uns dans les autres.

Voir aussi :  Comment créer du texte en gras dans Photoshop : 4 façons

Dall-E 2 continue de présenter des mains sur un fond uni. Il n’y a pas de doigts manquants, mais les mains sont recadrées dans la troisième image et les autres versions semblent maladroites dans leur composition et manquent totalement de créativité.

Disons que cette comparaison est un match nul. Dall-E 2 l’emporterait pour la précision si c’était le seul facteur, mais Midjourney parvient à créer de belles images dans ses rendus en noir et blanc, même si les quatre versions ne sont pas très réalistes.

Vous pouvez toujours utiliser Photoshop pour corriger les illustrations de Midjouney, y compris les mains.

Comparaison 2 : Gestes de la main

Comparons quelques gestes de la main qui sont presque universellement reconnus.

Doigts croisés

Tout d’abord, essayons « doigts croisés ».

Voyage à mi-parcours v5 :

Dall-E 2 :

On peut dire sans risque de se tromper que Midjourney a complètement raté cette invite. Il nous manque des doigts et aucune des versions n’a l’air naturelle.

Chapeau encore une fois à Dall-E 2 pour le nombre de doigts, mais c’est la seule bonne nouvelle. Chaque version donne l’impression que les doigts prennent leurs propres poses de yoga dans un jeu de Twister.

Il n’y a pas de gagnant dans cette comparaison.

Le pouce en l’air

Ensuite, c’est le « pouce en l’air » qui l’emporte.

Midjourney v5 :

Dall-E 2 :

Midjourney respecte le nombre de doigts tout en traitant chaque invite de manière créative. Remarquez l’introduction d’un style illustratif ?

Dall-E 2 obtient également des points pour la précision, sans essayer de faire bouger les choses en ajoutant quelque chose de créatif à chaque résultat.

Il n’y a pas de gagnant clair ici.

Comparaison 3 : Les mains avec les objets

Nous allons maintenant augmenter la complexité en demandant aux mains d’interagir avec des objets.

Main tenant une boule de cristal

Commençons par un objet aléatoire, en utilisant l’invite « main tenant une boule de cristal ».

Voyage à mi-parcours v5 :

Dall-E 2 :

En augmentant la complexité, Midjourney commence à briller. Hormis quelques rendus peu naturels, les mains et les boules de cristal sont magnifiques. Midjourney prend même le temps de créer des reflets dans le verre qui ajoutent certainement à la créativité générale.

Voir aussi :  9 étapes essentielles pour lancer un nouveau blog : Liste de contrôle pour le lancement d'un blog

Mais pour la première fois, nous voyons qu’il manque un chiffre à Dall-E 2 dans au moins une des mains, la quatrième ayant l’air tout simplement bizarre. Les boules de cristal ne sont pas non plus aussi impressionnantes que celles de Midjourney.

Midjourney remporte sa première victoire.

Main tenant de l’eau

Essayons quelque chose d’encore plus complexe avec l’invite « main tenant l’eau ».

Voyage à mi-parcours v5 :

Dall-E 2 :

Midjourney n’a réussi à obtenir qu’une seule image avec le bon nombre de chiffres. Bien que le rendu soit magnifique, nous commençons une fois de plus à voir des fissures dans le département de la crédibilité.

Dall-E 2 a également du mal à obtenir des mains naturelles, mais fait un bien meilleur travail. Il change également la couleur de l’arrière-plan pour plus de variété.

Ce tour est attribué à Dall-E 2.

Comparaison 4 : Mains de travail

Pour cette comparaison, nous allons créer des messages-guides dans lesquels les mains sont impliquées dans des activités.

Les mains qui moulent l’argile

Voyons comment les modèles d’IA se débrouillent avec les « mains qui moulent l’argile ».

Voyage à mi-parcours v5 :

Dall-E 2 :

Midjourney a manqué un doigt sur deux images mais tout le reste semble parfait.

Les images de Dall-E 2 sont confuses et encombrées, ce qui oblige à ajouter les mains d’une autre personne dans la moitié des versions.

L’avantage va à Midjourney.

Mains pressant la pâte

Essayons une activité similaire, « les mains qui pressent la pâte ».

Voyage à mi-parcours v5 :

Dall-E 2 :

Les images de Midjourney sont globalement excellentes. Mais une fois de plus, la moitié d’entre elles ont des chiffres manquants. Mais on ne peut pas reprocher aux images leur style artistique.

Les versions de Dall-E 2 manquent également de doigts dans la moitié des rendus et en ajoutent même un à la dernière main de l’ensemble.

On peut dire que c’est un match nul.

Si vous souhaitez essayer ces comparaisons par vous-même, nous vous montrons comment utiliser Midjourney pour créer de l’art IA.

Que nous apprennent les résultats ?

Il est amusant de faire des comparaisons et de déterminer un grand gagnant. Bien que Dall-E 2 ait créé plus souvent des mains avec le bon nombre de doigts, c’est Midjourney qui a créé les images les plus artistiques et les plus attrayantes.

Voir aussi :  Comment soumettre des nouvelles aux concours Reedsy Prompts (et ce qui se passe quand vous le faites)

Mais les deux applications ont leur place sur le marché pour les artistes qui réutilisent les images de Dall-E 2 et de Midjourney pour leur travail. Elles sont toutes deux capables de créer des mains qui peuvent être utilisées comme découpes ou dans des composites à des fins artistiques, éditoriales et commerciales. Ce n’est qu’une question de préférence personnelle.

L’IA finira par vaincre les mains

Les applications d’art génératif comme Dall-E 2 et Midjourney ont beaucoup progressé dans leur capacité à créer des œuvres d’art réalistes et fantastiques. Elles ont encore du mal à générer des mains, mais étant donné l’accélération de la technologie générative, on ne peut que s’attendre à des améliorations dans un avenir proche.

S’abonner à notre lettre d’information

Pourquoi Midjourney est-il meilleur que dalle2 ?

Tout dépend de ce que vous recherchez. Si vous souhaitez créer un contenu visuel très spécifique et réaliste qui intègre des concepts abstraits, DALL-E 2 est la meilleure solution. En revanche, si vous recherchez une plate-forme polyvalente capable de générer rapidement et efficacement une grande variété d’éléments graphiques, Midjourney est fait pour vous.

Midjourney est-il meilleur que dalle2 ?

Il est difficile de dire si Midjourney ou DALL-E 2 est meilleur, car les deux sont des modèles hautement qualifiés qui peuvent produire des résultats impressionnants dans le domaine de l’art et du design. Midjourney est accessible via Discord, tandis que DALL-E 2 n’est disponible que via le site web d’OpenAI.

Comment DALL-E se compare-t-il à Midjourney ?

L’un des principaux avantages de DALL-E par rapport à Midjourney et à d’autres plateformes de génération d’images alimentées par l’IA est sa capacité à produire des images extrêmement imaginatives et complexes. Repoussant les limites de ce qui est possible avec les images générées par l’IA, DALL-E est capable de produire des images qui vont au-delà de ce qui est faisable dans le monde réel.

Quelle est la qualité de Midjourney V5 ?

Des améliorations incroyables de la qualité de l’image – avec une augmentation considérable de la résolution et de la plage dynamique (multipliée par deux) ! Pour l’instant, il n’y a pas d’upscaler pour la V5 et elle hérite de la même résolution que la V4 upscalée, ce qui rend toutes les images plus nettes et plus claires. Si vous cliquez sur « upscale », vous obtiendrez instantanément cette seule image.

Cliquez pour évaluer cet article !
[Total: Moyenne : ]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *