Brèves technos

Nouvelle version de DALL·E

par Laurent Gloaguen,

6 avril 2022.

“Un astronaute sur un cheval.” © OpenAI.

OpenAI a dévoilé une nouvelle version de DALL·E, une version de GPT-3 qui est formée pour générer des images à partir de descriptions textuelles. Rappelons que GPT-3 (Generative Pre-trained Transformer 3) est un modèle de langage autorégressif qui utilise l’apprentissage profond pour produire des textes qui semblent avoir un auteur humain. DALL·E, basé sur GPT-3, est formé quant à lui pour générer des images à partir de phrases descriptives. Vous pouvez lui demander de vous dessiner un mouton ou des choses plus compliquées qui ne font pas nécessairement partie du monde réel, comme “une illustration de bébé radis avec un tutu qui promène un chien”.

“Un lapin détective assis sur un banc public, lisant un journal dans un décor victorien.” © OpenAI, via Sam Altman.

DALL·E 2 est une version à plus haute résolution et à plus faible latence du système original. Elle comprend également de nouvelles fonctionnalités, comme l’édition d’une image existante. Les utilisateurs peuvent partir d’une photo, sélectionner une zone et demander au modèle de la modifier. Vous pouvez, par exemple, masquer un tableau sur le mur d’un salon et le remplacer par un autre, ou ajouter un meuble dans une pièce. Comme pour les travaux précédents d’OpenAI, l’outil n’est pas directement mis à la disposition du public. Mais les chercheurs peuvent s’inscrire en ligne pour avoir un aperçu du système, et OpenAI espère le rendre disponible ultérieurement pour une utilisation dans des applications tierces. Vous pourrez trouver de nombreuses créations de DALL·E 2, souvent très amusantes, ici.

⇨ YouTube, “DALL·E 2 Explained”

⇨ The Verge, Adi Robertson, “OpenAI’s DALL-E AI image generator can now edit pictures, too.”

2022-04-06

Nouvelle version de DALL·E

Abonnez-vous à notre infolettre