Google'Le nouveau générateur d’IA de Google vous permet d’utiliser des références visuelles lorsque vous le pouvez'pas trouver les mots
Les générateurs d’images d’IA nous enchantent (et nous hantent) depuis quelques années, grâce à OpenAI, Imagen, Adobe Firefly, DALL-E-3, et bien d’autres. Au fur et à mesure que la technologie progresse, nous avons de plus en plus d’options pour affiner nos résultats. Aujourd’hui, Google Labs a lancé Whisk, un outil qui vous permet de télécharger des images pour vous guider au lieu de textes.
Whisk de Google Labs génère des images à partir d’autres images
Si vous habitez aux États-Unis, vous aurez désormais accès à Whisk de Google Labs, une « expérience d’IA générative », d’après blog de Google. Avec Whisk, au lieu de s’appuyer uniquement sur des textes descriptifs, vous pouvez ajouter des images comme références. La plateforme vous demandera trois caractéristiques clés : le sujet, la scène et le style. L’outil va ensuite mélanger, ou « fouetter », ces ingrédients et générer l’image parfaite pour vous.
Whisk utilise Imagen 3, le dernier modèle de génération d’images de Google.
Google n’a pas complètement supprimé les messages-guides dans Whisk. Vous avez toujours la possibilité d’écrire des invites de génération pour chacune des trois catégories, ou d’ajouter une note générale. Vous pouvez également affiner une image après avoir vu la première tentative de Whisk. Par exemple, imaginons que vous génériez une carte de vacances de style vintage représentant un chat couché dans la neige. En voyant la génération, vous pourriez avoir envie d’ajouter des flocons de neige en guise de touche finale.
Chaque fois que vous ajoutez ou générez une image dans l’une des trois catégories de Whisk, la plateforme se charge d’en créer une description écrite détaillée. Ainsi, si vous souhaitez compléter ou modifier une image existante, il vous suffit de personnaliser le texte.
Enfin, si vous êtes en panne d’inspiration, vous pouvez randomiser vos composants visuels en sélectionnant une icône de dé. Pour les générations plus complexes, vous pouvez également ajouter plus d’un sujet, d’une scène ou d’une référence de style.
Lorsque vous êtes satisfait de votre chef-d’œuvre, vous pouvez l’enregistrer sur la plateforme ou le télécharger pour y accéder localement.
Le fouet en vaut-il la peine ?
Avec toutes les options avancées de génération d’images par IA qui existent pour améliorer vos photos ou produire des œuvres d’art « originales », le nouvel outil de Google peut sembler être un gadget. Mais la façon dont Whisk exploite les références visuelles dans sa génération d’images est unique, et je peux comprendre qu’elle soit utile dans des scénarios créatifs et professionnels.
Imaginons que vous travailliez sur un dossier de présentation et que vous ayez besoin d’images similaires à une référence que vous possédez déjà. Au lieu d’essayer d’inverser cette référence avec des mots, vous pouvez simplement télécharger le fichier, accompagné d’une brève description de la manière dont vous souhaitez que votre nouvelle image soit différente.
Pour différencier Whisk des autres logiciels d’image IA existants, Google a établi que la plateforme est destinée à l’exploration, et non à la finesse. Alors que d’autres produits peuvent être plus adaptés à des modifications précises, Whisk est plus adapté au brainstorming :
« Nous l’avons conçu pour une exploration visuelle rapide, et non pour des modifications parfaites au pixel près. Il s’agit d’explorer des idées de manière nouvelle et créative, en vous permettant de travailler sur des dizaines d’options et de télécharger celles que vous aimez. »
Soyons honnêtes : il est parfois difficile de trouver les mots. Croyez-moi, je me retrouve constamment à me raccrocher à des pailles invisibles pour tenter de trouver le bon descripteur. Pour moi, cela donne à Whisk un sérieux potentiel, pour toutes les fois où il est plus facile de dire « Je veux une image qui ressemble à celle-ci ».
Comment utiliser l’image d’IA générative de Google ?
Générer une image : Générer une nouvelle image à partir d’un texte, à l’aide de Google AI.
- Dans le panneau de droite, entrez une invite de texte décrivant l’image que vous souhaitez.
- Cliquez sur Générer.
- Vous pouvez choisir jusqu’à 8 images.
- Cliquez sur Générer plus pour obtenir d’autres options.
- Cliquez sur Sélectionner lorsque vous'êtes satisfait de l’image.
Comment s’appelle le générateur d’images AI de Google ?
Imagen on Vertex AI met à la disposition des développeurs d’applications les capacités de pointe de Google en matière d’IA génératrice d’images. Avec Imagen on Vertex AI, les développeurs d’applications peuvent créer des produits d’IA de nouvelle génération qui transforment l’imagination de l’utilisateur en actifs visuels de haute qualité grâce à la génération d’IA, en quelques secondes.
Puis-je utiliser Google AI gratuitement ?
* L’utilisation de Google AI Studio est gratuite dans toutes les régions disponibles. Voir la FAQ sur la facturation pour plus de détails. ** Les limites tarifaires spécifiées ne sont pas garanties et la capacité réelle peut varier. Demandez une augmentation de la limite tarifaire maximale (pour le niveau payant uniquement).
Google dispose-t-il d’un générateur de vidéos d’IA ?
Le générateur de vidéos d’IA de Google est lancé en avant-première privée. Voici qui peut y accéder. Veo, le concurrent de Sora de Google, peut désormais être utilisé pour créer des ressources d’entreprise, et les résultats sont impressionnants.