La Taverne Des Aventuriers
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.


L'antre des passionnés de Livres dont VOUS êtes le Héros
 
AccueilPortailS'enregistrerConnexion
-40%
Le deal à ne pas rater :
-40% Nike Crater Impact SE
68.97 € 114.99 €
Voir le deal

 

 Les dessins des intelligences artificielles

Aller en bas 
3 participants
AuteurMessage
cdang
Maître d'armes
Maître d'armes
cdang


Masculin
Nombre de messages : 4826
Localisation : Le Havre (Seine-Maritime, France)
Profession : Ingénieur en génie des matériaux et génie mécanique
Loisirs : Jdr, musique, cinéma, aïkido, iaïdo
Date d'inscription : 13/11/2013

Les dessins des intelligences artificielles Empty
MessageSujet: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyJeu 25 Aoû 2022 - 17:59

On commence à voir traîner des intelligences artificielles qui font des dessins sur commande assez bluffants. Je n'ai jamais essayé mais j'ai chopé ça ici à propos de Midjourney (sur Discord) :
Pyth a écrit:
En 2 mots, le principe :

Coté modèle économique, tout compte Discord possède une période de test gratuite de 25 inputs; ce que j'appelle input faute de mieux, c'est tout ordre donné à l'IA quel qu'il soit, que ce soit la phrase de départ comme tout "affinage" ultérieur de l'image. Du coup, la période de gratuité file vite, très vite même, puisqu'en 2 heures et quelques j'avais épuisé mes 25 essais, répartis entre 2 images seulement, les deux de mon post précédent. Pour poursuivre au delà de cette limite, ce sera payant, et ce sous forme d'un abonnement mensuel: soit 10€/mois pour 200 inputs/mois, soit 30€/mois pour autant d'inputs/mois que l'on veut. Ça douille assez vite donc, du coup, autant ne pas trop gâcher ses essais gratuits.

Le processus de création se déroule sinon entre 2 logiciels, Discord qui permet de fournir ses instructions à l'IA via un bot, et l'appli Midjourney qui sert à visualiser et stocker les résultats loin du flood des canaux Discord.
Tout commence sur Discord donc, où on se rend sur l'un des canaux #newbie [numéro] et dans lequel on va envoyer sa première instruction au bot servant d'interface avec l'IA. Comme des milliers de personnes font pareil simultanément, le nombre de posts/seconde défilant dans ces canaux les floode totalement, aussi il sera plus facile de découvrir les résultats de ses tests sur l'application web de Midjourney (tant qu'à faire, utilisez-la depuis un pc plutôt que depuis le smartphone, histoire de profiter d'un écran de taille décente).

La toute première étape de chaque nouvelle création commence par une ou plusieurs phrases en anglais fournie au bot dans le canal discord, et qui servira à produire les premières images. Pour ça, commencez par taper dans le canal

/imagine

puis votre phrase, par exemple Arkham by night, very dark, photorealistic, an old creepy church on top of an hill with a torchlit procession climbing the hill through the old paved streets ou encore  photorealistic. An old harbour on the coast of massachussetts, foggy morning, with a high cliff on background. There is an old house in the mist on the top of the cliff.

Plus vous fournissez de détails, plus les premiers résultats seront ciblés, et comme dans les étapes ultérieures il ne sera pas permis de modifier ce premier texte, autant être généreux avec les informations, j'ai vu par exemple passer des instructions de rendu (Unreal 5 effect, van Gogh style, lego style, Sin City black and white etc), de luminosité (very dark, dawn sunrise, moon light coming through windows on left side etc), de précision (photorealistic, light blur around face...), d'atmosphère (creepy, eery, colored...), de thème (cyberpunk, steampunk, apocalyptic, medieval...) enfin bref, je ne vais pas tout faire car littéralement tout semble possible, d'autant qu'on peut encore compliquer le process en y ajoutant des instructions pré-codées comme par exemple demander à l'IA de partir d'une image précise dont on lui fournira l'url, spécifier une valeur chiffrée précise à tel ou tel paramètre et ainsi de suite (se référer au manuel d'utilisation).

Une fois qu'on est ok avec ses instructions rédigées, on presse Entrée et c'est parti, l'IA va générer une mosaïque de 4 images à partir de cette phrase, pour par exemple - je reprend mon église de nuit à Arkham - proposer ceci, à la fois dans le canal Discord (chiant à retrouver tellement ça floode, donc) et dans l'appli Midjourney (mieux):

Les dessins des intelligences artificielles Grid_0

Ce premier essai est littéralement une esquisse: on y trouve déjà les teintes générales ou le positionnement d'objets clés mais rien n'est détaillé ni vraiment travaillé: A ce stade, on en est encore à affiner la composition, en somme. Pour aller plus loin, on va donc utiliser le panneau de boutons accompagnant ce premier rendu:

Les dessins des intelligences artificielles Aci0Lrt

On a alors 3 choix:
- Recommencer de zéro, autrement dit rentrer à nouveau la phrase d'instructions d'origine pour voir si l'IA ne va pas nous sortir quelque chose de mieux,
- Demander 4 nouvelles Variations cette fois créées à partir d'une des 4 images précédemment générées,
- Demander de détailler (Upscale) l'une des 4 images précédemment générées.

Les 2 dernières options sont ce que représentent ces 8 boutons: Les images étant numérotées de 1 à 4 (de gauche à droite puis de haut en bas), le bouton U1 par exemple, permet de demander un Upscale (un agrandissement, une amélioration) de l'image en haut à gauche donc, alors que le bouton V1 permet, lui, d'obtenir 4 nouvelles Variations, générées à partir de l'image en haut à gauche.

Retour à mon église, pour laquelle j'ai demandé 4 nouvelles version de l'image en haut à droite, en appuyant sur V2 donc, ce qui m'a donné ça:

Les dessins des intelligences artificielles Grid_0

A nouveau, l'image 2 me plait, je lui demande donc une version améliorée (Upscale) en appuyant cette fois sur U2 et paf, ça me sort ça, le rendu final ou pas loin:

Spoiler:

Et ça, en 3 étapes, donc. Bon en fait en nettement plus car le temps que je comprenne j'ai gaspillé pas mal d'essais mais en théorie, 3 instructions et on a déjà ça. Sachant qu'on peut alors récupérer l'url de cette image, puis créer une nouvelle phrase forçant l'IA à partir de cette image comme base, pour rajouter de nouvelles instructions affinant encore la chose pour des résultats totalement dingues:

Spoiler:

Il y a déjà un livre constitué entièrement d'illustrations faites par Midjourney :
https://www.kickstarter.com/projects/riotminds/art-of-the-order-of-the-tormented-souls

zandhar aime ce message

Revenir en haut Aller en bas
cdang
Maître d'armes
Maître d'armes
cdang


Masculin
Nombre de messages : 4826
Localisation : Le Havre (Seine-Maritime, France)
Profession : Ingénieur en génie des matériaux et génie mécanique
Loisirs : Jdr, musique, cinéma, aïkido, iaïdo
Date d'inscription : 13/11/2013

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyJeu 25 Aoû 2022 - 18:03

Il y a d'autre IA comme Stable Diffusion, Disco Diffusion et Dall-E.

Fabien_Lyraud a écrit:

Tu t'enthousiasmais pour Midjourney, et voilà que sort Stable Diffusion qui est encore plus bluffant.
Voilà des exemple de qu'ils font avec :
https://twitter.com/hashtag/stablediffusion?src=hashtag_click&f=live
Pyth a écrit:
- Stable Diffusion et Disco Diffusion l'emportent tous deux sur le plan du coût, vu qu'ils sont je crois gratuits. Vient ensuite Midjourney qui calcule son coût en fonction de l'utilisation GPU ou qui propose un forfait "buffet à volonté" et enfin Dall-E, le plus onéreux des 4 avec ses prix fixes peu importe ce qu'on en fait;

- Du point de vue de la facilité d'utilisation, c'est Midjourney en mode payant qui l'emporte de très loin avec une appli exceptionnellement bien foutue. Vient ensuite Dall-E, lui aussi très simple mais presque trop épuré pour le coup. Disco DIffusion est en comparaison 1 purge absolue, puisqu'il faut apprendre à coder pour l'occasion. Rien de bien méchant pour qui connait un minimum (il me semble que c'est du Python) d'autant que tout est expliqué dans un wiki bien dense mais quand même, on est loin du "cliquez sur le bouton et pouf"; Stable diffusion et son fonctionnement sur Discord serait quasi à la hauteur de l'interface de Midjourney, l'application en moins toutefois.

- Du point de vue du rendu final, c'est encore Midjourney payant qui gagne en proposant du 2000 X 2000px, la plus grande résolution des 4 softs. Et qui dit plus grande résolution dit aussi plus de détails.

Donc en tenant compte de tout ça, j'aurais quand même tendance à placer Midjourney devant les autres MAIS n'ayant pas essayé ses concurrents, je suis peut-être totalement à coté de la plaque. Faut tester, une fois de plus.
Revenir en haut Aller en bas
linflas
Architecte du Forum
Architecte du Forum
linflas


Masculin
Vierge Tigre
Nombre de messages : 2524
Age : 48
Localisation : Lille, France
Profession : IT crowd
Date d'inscription : 14/05/2008

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyVen 26 Aoû 2022 - 17:49

Ah ! Midjourney. On y arrive...
Voici un petit patchwork tiré du groupe Facebook de Fighting Fantasy. Un mec a généré cela avec "black and white, russ nicholson style, john blanche style, etc..."
Les dessins des intelligences artificielles Midjou10

Autant vous dire que c'est la fin des haricots pour les petits dessinateurs oldschool de JDR et LDVELH...

Dagonides et Théo Letna aiment ce message

Revenir en haut Aller en bas
http://linflas-art.deviantart.com
Loi-Kymar
Guerrier
Guerrier
Loi-Kymar


Masculin
Nombre de messages : 116
Localisation : en cure de désintoxication à la forteresse d'Ikaya (Royaumes de Kalte)
Loisirs : cinéma, jeu vidéo, écriture
Date d'inscription : 03/04/2020

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyVen 26 Aoû 2022 - 18:39

DALL-E (je me demande s'il n'a pas été renommé Craiyon), pour avoir testé son rendu, ça progresse, mais ce n'est pas encore super au point...

EDIT : Honte sur moi ! Ce que j'ai testé, c'est l'implémentation open-source DALL-E Mini, renommée Craiyon à la demande de l'éditeur de DALL-E...
Revenir en haut Aller en bas
cdang
Maître d'armes
Maître d'armes
cdang


Masculin
Nombre de messages : 4826
Localisation : Le Havre (Seine-Maritime, France)
Profession : Ingénieur en génie des matériaux et génie mécanique
Loisirs : Jdr, musique, cinéma, aïkido, iaïdo
Date d'inscription : 13/11/2013

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyLun 29 Aoû 2022 - 13:07

Le remplacement des humains par les machines, notamment dans ce domaine, est loin de me réjouir. Je ne suis néanmoins pas totalement pessimiste pour les raisons suivantes :
  • pour des œuvres amatrices et à petit budget, ça peut être une solution intéressante par rapport aux banques de données d'images libres ou à faible prix ;
  • les œuvres générées ne sont a priori pas utilisables pour des produits commerciaux ; et il faudra voir ce que donnera l'évolution du droit pour de telles œuvres (je vois bien un truc genre la notion d'œuvre collective en droit français, où au final c'est l'éditeur, ici du logiciel, qui a le droit d'auteur) ; donc bon, pour de gros produits pro, ça limite l'intérêt ;
  • on ne voit pas ce qui est nécessaire pour générer de telles œuvres mais je soupçonne qu'il faille des machines plutôt gourmandes ; s'il faut un data center complet pour illustrer un bouquin, la réalité économique (pénurie de semi-conducteurs et d'énergie) et environnementale (c'est pas les Verts qui sont radicaux, c'est le climat) pourrait bien maintenir l'intérêt des pinceaux ;
  • les IA sont alimentées par des œuvres humaines, ce qui condamne a priori toute évolution de style, donc ça ne sera intéressant que pour faire des trucs « à la manière de ».

Voici tout de même un (projet d') ouvrage de JdR illustré par Midjourney :
https://drive.google.com/file/d/18qOLDK6GifFGljetTI0NLho8RIFmVtnl/view

Je cite un autre message :
Macbesse a écrit:

Pour l'avoir un peu testé, j'ai repéré tout de suite que c'était de l'image générée de manière procédurale. Les formes étirées, les mélanges d'objets, les artefacts un peu étranges... on est ici sur une image brute de décoffrage de Midjourney. Quand on n'y prend pas garde, elles se ressemblent toutes et c'est un peu lassant pour le regardeur.

J'ai illustré un scénario du recueil des 40 ans avec cette IA parce que je n'avais pas d'illustrateur dessus, le Falkenstein, et je n'ai pas super envie de recommencer. Le résultat est meilleur que ce que je vois sur cette couverture, mais Khelren et moi avons passé quelques heures pour les rendre potables, retirer les artefacts, corriger les visages et les roues. Et au final, comme on est honnête, on n'a même pas eu la satisfaction de les signer en dépit du boulot abattu.
Revenir en haut Aller en bas
cdang
Maître d'armes
Maître d'armes
cdang


Masculin
Nombre de messages : 4826
Localisation : Le Havre (Seine-Maritime, France)
Profession : Ingénieur en génie des matériaux et génie mécanique
Loisirs : Jdr, musique, cinéma, aïkido, iaïdo
Date d'inscription : 13/11/2013

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyMar 6 Sep 2022 - 15:39

Il existe aussi ArtBreeder.

Concernant Stable Diffusion, c'est manifestement un module Python que l'on peut installer et pour lequel on peut récupérer le résultat de l'entraînement de l'IA (les « poids »).

Sinon, un article très intéressant toujours tiré du forume voisin :

Altay, lundi 5 septembre 2022, 23h40 a écrit:
De quoi parle-t-on ?

Les dessins des intelligences artificielles Imagen-1024x493

La génération automatique d'images ou synthèse d'image consiste à créer des… images, sans intervention humaine ou avec une intervention minimale. La plupart du temps, les images produites sont numériques.

C'est un domaine qui existe de façon formelle depuis les années 1980. Ses premiers usages étaient notamment la synthèse de textures, par exemple pour l'eau ou les nuages. Typiquement, un pionnier du domaine est Ken Perlin qui travaillait sur le film Tron en 1982.

Initialement, le procédé de génération est purement algorithmique : on créé une image en suivant une suite de règles permettant d'obtenir le style recherché.

Pourquoi on en parle maintenant ?

Parce que l'utilisation de l'apprentissage automatique (machine learning) a permis des avancées notables en synthèse d'image. Jusqu'au milieu des années 2000, les outils permettant de générer des images étaient très spécialisés et conceptuellement complexes. Par exemple, un synthétiseur allait se concentrer seulement sur la synthèse des visages, ce qui nécessitait de l'expertise de la part des équipes de développement pour concevoir un algorithme capable de simuler une peau réaliste, des yeux, une structure faciale plausible, une pilosité cohérente, etc.

L'utilisation de réseaux de neurones profonds et de grandes bases de données d'images a permis de se passer de cette expertise, en permettant à la machine d'automatiquement trouver « comment » générer une image plausible pour l'œil humain. Les premiers succès grand public sont http://thispersondoesnotexist.com, puis Dall-E de OpenAI. Jusqu'à 2020, ces outils étaient encore de niche et utilisés soit dans le monde universitaire pour la recherche, soit par quelques grosses entreprises (typiquement, les GAFAM mais aussi Adobe, des studios de VFX et d'autres).

Comment fonctionne la génération d'images ?

On entre ici dans des détails un peu techniques. La génération d'image moderne se base sur des modèles génératifs, c'est-à-dire des modèles statistiques (généralement des réseaux de neurones artificiels) qui apprennent à reproduire des grandes quantité d'images. Le principe est toujours le même : on cherche les paramètres d'un modèle (~ les poids des synapses d'un réseau de neurones artificiels) qui permettent de minimiser une certaine fonction (la « fonction de coût ») que l'on peut calculer sur les exemples d'un jeu de données, par exemple provenant du web.

Il y a grosso modo trois approches :
  1. les auto-encodeurs : un double réseau de neurones : un Encodeur et un Décodeur. L'Encodeur transforme une image en texte (on suppose que l'on a une caption [NdlR : légende] en plus de l'image du web). Le Décodeur reconstruit l'image à partir du texte. En production, on garde seulement le Décodeur.
  2. les réseaux de neurones adversaires (VQGAN+CLIP) : on optimise alternativement deux réseaux de neurones : le Générateur et le Discriminateur. Le Générateur produit une image à partir d'un texte. Le Discriminateur apprend à distinguer les images fausses (du Générateur) des images réelles (qui viennent du web). Le Générateur apprend à tromper le Discriminateur. Plus le Discriminateur est bon, plus le Générateur doit produire des images qui ressemblent aux véritables images. Il suffit ensuite de donner un nouveau texte au Générateur pour produire l'image que l'on veut.
  3. les modèles de diffusion (DALL-E 2, Imagen, Midjourney, StableDiffusion) : compliqué à résumer. En bref, on dégrade volontairement une image du web en lui ajoutant du bruit aléatoire. Le Diffuseur apprend à inverser cette transformation. En production, on part d'une image constituée à 100% de bruit aléatoire et on applique plusieurs fois le Diffuseur, jusqu'à obtenir une image. Il faut utiliser des astuces pour pouvoir exploiter le texte.


Historiquement, l'approche 1 est connue depuis les années 70 mais n'a jamais vraiment rencontré le succès (pour des raisons mathématiques que je me garde d'évoquer ici). L'approche 2 était considérée comme la plus prometteuse depuis son introduction en 2014 mais a été récemment enfoncée par les succès de l'approche 3 en 2021/2022.

Est-ce que l'IA est créative ?

C'est la question qui revient le plus souvent. Elle fait débat parmi les spécialistes mais à mon avis la réponse est non pour trois raisons.
  1. Notre compréhension actuelle des réseaux de neurones pour la génération d'images est que l'on est en mesure de faire de l'interpolation sur la variété des images. Autrement dit, le modèle peut, dans des conditions favorables, créer de nouvelles images en mélanger des concepts mais pas d'en inventer de nouveaux. En corollaire, nos outils de synthèse excellent dans l'imitation.
  2. Le modèle reste un outil, au même titre qu'un appareil photo, et n'a aucune « intention ». La personne qui créé (qui imagine le prompt, c'est-à-dire le texte utilisé pour générer l'image) reste humaine.
  3. Il est préférable de ne pas anthropomorphiser les modèles obtenus par machine learning. In fine, il s'agit d'une fonction mathématique (certes compliquée) mais comparable en aucun point avec une personne.


La raison 1 permet d'ailleurs assez bien de comprendre que la principale limitation de ces outils de synthèse d'image n'est pas vraiment la partie technique, mais bien le corpus d'apprentissage. Un modèle ne créera jamais de visages de personnes noires s'il n'y en a aucune dans le jeu de données, ni un dessin de chat si vous n'utilisez que des photos DSLR 4k comme exemples. La curation [NdlR : mise à jour] de ce jeu de données est une problématique centrale pour les systèmes en production.

Est-ce que cela pose des problèmes éthiques ?

Il y a des tas de problèmes qui ont été largement discutés dans la presse : deep fakes, propagande, usurpation d'identité, etc. La façon dont ces problèmes sont traités à l'heure actuelle est assez mauvaise : les entreprises qui proposent ces services bloquent certains prompts ou analysent les images a posteriori pour rejeter celles qui ne respectent pas leur conditions d'utilisation.

C'est légal tout ça ?

Section à prendre avec un grain de sel puisque je ne suis ni avocat, ni juriste, ni magistrat.

Tout dépend de quoi on parle.

Pour générer des images de qualité quel que soit le prompt proposé, il faut avoir entraîné son modèle de synthèse d'images sur de très, très grands jeux de données (plusieurs centaines de millions d'images, voire plusieurs milliards). En général, il s'agit d'images (et de légendes) récupérées sur le web : DeviantArt, Reddit, Wikipédia, Flickr, etc. En théorie, seules les images sous licence permettant leur réutilisation le sont, néanmoins il est sûr et certain que de nombreuses images dans ces jeux de données ne respectent pas la licence (par exemple parce qu'elles sont été repostées par un tiers). Il y a aussi la question de savoir si les personnes photographiées auraient accepté de donner leur consentement à un tel usage de leur image.

Concernant les images générées en elles-mêmes, la législation est floue et varie grandement selon les pays. Les entreprises US semblent considérer que les images produites par leurs systèmes sont leur propriété. OpenAI accorde néanmoins une licence aux « artistes » (c'est-à-dire les personnes qui utilisent Dall-E 2) pour l'usage des images, y compris commercial. C'est également le cas de Midjourney. La question est épineuse pour un système open source comme Stable Diffusion, que n'importe qui (sous réserve d'avoir un bon PC) peut faire tourner sur sa machine. A priori, le consensus semble tout de même que les images générées sont au pire des œuvres dérivées suffisamment différentes pour être considérées comme nouvelles. Le droit d'auteur irait donc à la personne qui utilise le système.

Dagonides aime ce message

Revenir en haut Aller en bas
cdang
Maître d'armes
Maître d'armes
cdang


Masculin
Nombre de messages : 4826
Localisation : Le Havre (Seine-Maritime, France)
Profession : Ingénieur en génie des matériaux et génie mécanique
Loisirs : Jdr, musique, cinéma, aïkido, iaïdo
Date d'inscription : 13/11/2013

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyMer 7 Sep 2022 - 11:06

Un manuel d'utilisation pour Dall-E :

https://dallery.gallery/the-dalle-2-prompt-book/
Revenir en haut Aller en bas
cdang
Maître d'armes
Maître d'armes
cdang


Masculin
Nombre de messages : 4826
Localisation : Le Havre (Seine-Maritime, France)
Profession : Ingénieur en génie des matériaux et génie mécanique
Loisirs : Jdr, musique, cinéma, aïkido, iaïdo
Date d'inscription : 13/11/2013

Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles EmptyJeu 8 Sep 2022 - 13:33

Il existe aussi ArtFlow :

https://artflow.ai/

et un manuel pour Midjourney :

https://github.com/willwulfken/MidJourney-Styles-and-Keywords-Reference
Revenir en haut Aller en bas
Contenu sponsorisé





Les dessins des intelligences artificielles Empty
MessageSujet: Re: Les dessins des intelligences artificielles   Les dessins des intelligences artificielles Empty

Revenir en haut Aller en bas
 
Les dessins des intelligences artificielles
Revenir en haut 
Page 1 sur 1
 Sujets similaires
-
» Dessins
» dessins
» Dessins AVH
» Les dessins de VS (en couleurs)
» Petits dessins

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
La Taverne Des Aventuriers :: La Vie à l'Extérieur de la Taverne :: Le Coin des Artistes-
Sauter vers:  
Créer un forum | © phpBB | Forum gratuit d'entraide | Signaler un abus | Forum gratuit