Microsoft annoncé le déploiement de DALL-E 3, le dernier modèle texte-image du laboratoire d’IA OpenAI, pour tous les utilisateurs de Bing.
Le système d’IA le plus avancé est désormais disponible gratuitement dans Bing Chat et Bing Image Creator.
DALL-E 3 s’appuie sur les modèles DALL-E précédents, générant des images à partir d’invites textuelles que Microsoft décrit comme plus réalistes et plus créatives.
Microsoft déclare que le nouveau système apporte « des améliorations qui améliorent la qualité générale et le détail des images, ainsi qu’une plus grande précision pour les mains, les visages et les textes humains ».
Caractéristiques de performance de DALL-E 3
DALL-E 3 est un réseau neuronal avancé qui peut générer des images réalistes et variées à partir de descriptions textuelles.
Il présente des performances améliorées par rapport aux versions précédentes dans trois domaines clés :
- Comprendre les messages-guides: DALL-E 3 interprète les invites avec plus de précision et de fiabilité. Pour obtenir les meilleurs résultats, il faut créer des messages-guides détaillés afin d’affiner le produit final.
- Cohérence logique: Les images produites par DALL-E 3 s’alignent étroitement sur le message, faisant preuve d’un photoréalisme et d’une cohérence accrus.
- Qualité artistique: DALL-E 3 peut générer des images stylistiques et créatives qui s’adaptent aux préférences artistiques des utilisateurs.
Mesures de sécurité pour les médias générés par l’IA
Depuis le lancement de Bing Image Creator, plus d’un milliard d’images d’IA ont été créées à l’aide de cet outil.
Les utilisateurs ont tiré parti de cette technologie pour créer des illustrations, du contenu pour les médias sociaux, des fonds d’écran et bien d’autres choses encore.
L’intégration de DALL-E 3 vise à renforcer encore son utilité. Toutefois, l’amélioration du réalisme du générateur d’art par l’IA renforce les préoccupations éthiques concernant les « deepfakes ».
Microsoft a mis en place des mesures pour garantir la sécurité, notamment le tatouage numérique de toutes les images et des filtres de modération du contenu.
Filigrane numérique
Toutes les images générées par Bing Image Creator comportent un filigrane numérique invisible conforme à la spécification C2PA.
Ce filigrane fournit des informations sur l’heure et la date de création de l’image et vérifie sa provenance générée par l’IA.
Modération du contenu
Un système de modération du contenu empêche la production d’images nuisibles ou inappropriées.
Il respecte les conditions d’utilisation et les directives communautaires de Bing et exclut les images présentant de la nudité, de la violence, des propos haineux ou des activités illégales.
Perspectives d’avenir
L’utilisation de Bing Image Creator reste gratuite et accessible via Bing Chat ou à l’adresse bing.com/create.
Microsoft encourage les utilisateurs à fournir des invites textuelles détaillées pour obtenir les résultats les plus précis de DALL-E 3.
Image en vedette : T. Schneider/Shutterstock