Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Pour développer idées, projets de jeux, univers, règles et scénarios
Avatar de l’utilisateur
cdang
Dieu d'après le panthéon
Messages : 4638
Inscription : jeu. avr. 30, 2015 10:23 am
Localisation : Le Havre (Choisy-le-Roi, Saint-Étienne, La Rochelle)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par cdang »

John Wick a écrit : Art by the inestimable Aaron Acevedo (via Midjourney)

En un sens, on rejoint-là la notion de droit d'auteur pour un texte : puisque la création de l'image passe par une succession de phrases, quelque part, l'humain qui a fait générer l'image (Aaron Acevedo) est le propriétaire de la liste des phrases qu'il a fournies. Même si on considère que c'est un programme informatique, puisque que manifestement le code est protégé par le droit d'auteur à partir du moment où il résulte d'un processus créatif original.
--
Vous êtes mort
Archiduc Fifi
Zelateur
Messages : 73
Inscription : mer. févr. 26, 2020 9:14 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Archiduc Fifi »

Bonjour,

Je poste ce message car ce sujet m'intéresse grandement. J'ai découvert Midjourney il y a 3 semaines, et je peux dire que cela a complétement bousculé ma vie. Je ne plaisante pas.

Ces logiciels sont vraiment impressionnants. Néanmoins, pour ceux qui les testeraient et seraient déçus du résultat, il faut bien se dire que les bons résultats n'apparaîssent pas immédiatement.

Déjà, il faut savoir que mettre une simple phrase n'est pas suffisant pour obtenir un résultat acceptable. Pour avoir un résultat impressionnant, comme celui du type qui a proposé son image dans un concours d'art, il ne faut pas hésiter à ajouter des dizaines et des dizaines de paramètres. Au final, lorsqu'on cherche à faire une image complexe, il arrive qu'on se retrouve à écrire des phrases de plusieurs dizaines de lignes.

Il y a aussi une notion de "training". C'est à dire qu'il y a des sujets sur lesquels le logiciel ne sera pas formé, et sur lequel il aura beaucoup de mal. J'ai le problème actuellement : j'essaie de produire des images d'illustrations de décors pour Würm. J'ai remarqué que Midjourney avait beaucoup de mal à comprendre ce qu'était la steppe eurasiatique. Lorsque je demande une image de steppe sous la neige, il fait n'importe quoi.
Pour pallier à ce problème, je dois l'alimenter en photos de stepes sous la neige. Je dois trouver des paramètres  qui permettront de lui faire produire ce que je veux : par exemple, puisqu'il confond la steppe avec des champs dans la campagne (ajoutant des barrières d'arbres malvenues), je dois lui ajouter des paramètres lui demandant de produire un paysage vide, un paysage globalement plat mais au sol légèrement inégal, --no trees, des fois je lui ajoute même la demande "snow desert". A côté de ça, je l'alimente à chaque demande avec une bonne dizaine d'images de steppes sous la neige. Enfin, au lieu d'effectuer cette demande une ou deux fois, avec un mauvais résultat qui ressemble à un paysage de campagne française, je lui effectue la même demande des dizaines et des dizaines de fois. Ce n'est qu'au bout d'une longue répétition qu'il commence à comprendre ce que j'attend de lui.

Ce logiciel me passionne réellement et m'aide déjà ENORMEMENT pour le JDR. J'ai déjà un bon batch de décors préhistoriques pour mes parties, et j'ai même pu lui demander de produire des peintures rupestres dans le style de la grotte Chauvet mais représentant ... Emmanuel macron, le bonhomme étant clairement reconnaissable tout en ressemblant à une vraie peinture rupestre (bon ça c'était pour l'amusement, j'ai fait pareil avec Jean Marie Le Pen et Jean Luc Mélanchon se battant, chacun sous la forme du super-héros Hulk).

Ca pose la question des "deepfake" car si là je produit des caricatures, il est aussi possible de produire de vraies fausses-photo tout à fait réalistes. C'est très facile avec les hommes politiques, que Midjourney connaît très bien. Sur Midjourney on peut voir en temps réel les images générées par les autres utilisateurs, pendant plusieurs jours j'ai vu un type générer en boucle des images du président turc Erdogan dans un harem entouré de femmes en bikini, les images étant tout à fait réalistes.

Une autre dérive : actuellement sur Instagram il y a plein de nouveaux comptes d'artistes peintres qui se créent. Mais en regardant les commentaires, on constate que ces "artistes" utilisent en fait Midjourney. Ils se considèrent artistes car ils font la même démarche que moi pour produire une image, et pour eux c'est de l'art ... Ils expliquent que "ouh lala, trouver un bon prompt pour produire cette image a été tellement dur, ça m'a demandé 2 jours de travail". Perso je ne suis pas en accord avec cette vision, à aucun moment je ne fais de l'art.
Dernière modification par Archiduc Fifi le mer. sept. 07, 2022 9:55 am, modifié 1 fois.
Avatar de l’utilisateur
Altay
Ascendant
Messages : 1518
Inscription : sam. mai 07, 2016 12:04 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Altay »

Archiduc Fifi a écrit : mer. sept. 07, 2022 9:46 am Déjà, il faut savoir que mettre une simple phrase n'est pas suffisant pour obtenir un résultat acceptable. Pour avoir un résultat impressionnant, comme celui du type qui a proposé son image dans un concours d'art, il ne faut pas hésiter à ajouter des dizaines et des dizaines de paramètres. Au final, lorsqu'on cherche à faire une image complexe, il arrive qu'on se retrouve à écrire des phrases de plusieurs dizaines de lignes.

Tout à fait ! C'est un point dont j'aurais dû plus parler : les prompts doivent ressembler à ceux du jeu de données initial. Comme ce sont des images scrapées sur le web, il y a des astuces pour obtenir certains effets, par exemple ajouter la mention "trending on Artstation" voire les paramètres de l'appareil photo comme on peut les avoir sur Flickr.

Un petit ebook à ce sujet (pour Dall-E2, pas testé avec d'autres) : https://dallery.gallery/the-dalle-2-prompt-book/

Le principe fondamental est de décrire l'image comme elle le serait dans un monde où elle existe déjà. Par exemple éviter "Extrait du film Ghibli Totoro mais la petite fille est remplacée par Stallone" mais plutôt "Capture d'écran du film Mon Voisin Totoro (1988) avec Sylvester Stallone. Stallone et Totoro attendent sous la pluie."
Archiduc Fifi
Zelateur
Messages : 73
Inscription : mer. févr. 26, 2020 9:14 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Archiduc Fifi »

Altay a écrit : mer. sept. 07, 2022 9:53 am
Archiduc Fifi a écrit : mer. sept. 07, 2022 9:46 am Déjà, il faut savoir que mettre une simple phrase n'est pas suffisant pour obtenir un résultat acceptable. Pour avoir un résultat impressionnant, comme celui du type qui a proposé son image dans un concours d'art, il ne faut pas hésiter à ajouter des dizaines et des dizaines de paramètres. Au final, lorsqu'on cherche à faire une image complexe, il arrive qu'on se retrouve à écrire des phrases de plusieurs dizaines de lignes.

Tout à fait ! C'est un point dont j'aurais dû plus parler : les prompts doivent ressembler à ceux du jeu de données initial. Comme ce sont des images scrapées sur le web, il y a des astuces pour obtenir certains effets, par exemple ajouter la mention "trending on Artstation" voire les paramètres de l'appareil photo comme on peut les avoir sur Flickr.

Un petit ebook à ce sujet (pour Dall-E2, pas testé avec d'autres) : https://dallery.gallery/the-dalle-2-prompt-book/

Le principe fondamental est de décrire l'image comme elle le serait dans un monde où elle existe déjà. Par exemple éviter "Extrait du film Ghibli Totoro mais la petite fille est remplacée par Stallone" mais plutôt "Capture d'écran du film Mon Voisin Totoro (1988) avec Sylvester Stallone. Stallone et Totoro attendent sous la pluie."
Pour les choses existantes, sur Midjourney on a aussi parfois plus de succès en décrivant les choses indirectement, sans les nommer (par exemple, créer une image d'Astérix sans citer Astérix)
Mais c'est au cas par cas, j'ai voulu poster un exemple mais je me rend compte qu'il ne fonctionne pas ^^ J'avais pourtant vu des gens produire des images de Calvin et Hobbes sans les nommer, simplement en décrivant trèèès longuement l'image voulue.
Avatar de l’utilisateur
Pyth
Ascendant
Messages : 1601
Inscription : ven. mars 23, 2018 9:12 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Pyth »

Archiduc Fifi a écrit : mer. sept. 07, 2022 9:46 am Une autre dérive : actuellement sur Instagram il y a plein de nouveaux comptes d'artistes peintres qui se créent. Mais en regardant les commentaires, on constate que ces "artistes" utilisent en fait Midjourney. Ils se considèrent artistes car ils font la même démarche que moi pour produire une image, et pour eux c'est de l'art ... Ils expliquent que "ouh lala, trouver un bon prompt pour produire cette image a été tellement dur, ça m'a demandé 2 jours de travail". Perso je ne suis pas en accord avec cette vision, à aucun moment je ne fais de l'art.
Pas que sur Instagram. Dans ma ville une galerie exposait tout l'été une 30aine d’œuvres clairement générées par IA (mais pas présentées explicitement comme tel, c'était juste "de l'art numérique"), côte à côte d'ailleurs avec une autre technique exigeant elle aussi un talent fou, de l'acrylic pouring (technique consistant à verser successivement différentes teintes d'un mélange acrylique-huile de silicone sur une toile pour former des résultats aléatoires). Je pense que le galeriste n'était pas dans la combine ou du moins, pas assez renseigné, et je ne sais pas s'ils en ont beaucoup vendu mais bref, quelqu'un avait donc tenté le coup et je doute qu'il s'agisse d'un cas isolé.
 
All things are true. God's an Astronaut. Oz is Over the Rainbow, and Midian is where the monsters live.
Avatar de l’utilisateur
Nolendur
Dieu matters
Messages : 4900
Inscription : mar. mai 20, 2008 3:51 pm
Localisation : Bordeaux
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Nolendur »

Je fais des essais sur Dall-e pour le fun.
On peut faire de chouettes aides de jeu pour Cthulhu :)

J'ai tapé "page of the Voynich Manuscript with cthulian entities" et j'ai obtenu ça :

Spoiler:
Image
Spoiler:
Image

Ce qui est cool, c'est qu'en tentant d'interpréter les dessins ça peut même donner de l'inspiration pour des monstres ou des intrigues.
Petits jeux et bricolages : jeux perso et aides de jeu.
_____
The presence of those seeking the truth is infinitely to be preferred to the presence of those who think they’ve found it.
-- Terry Pratchett
Croyez ceux qui cherchent la vérité, doutez de ceux qui la trouvent.
-- André Gide
Avatar de l’utilisateur
Fabulo
Dieu d'après le panthéon
Messages : 2391
Inscription : mar. juin 09, 2015 12:19 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Fabulo »

Pour créer des portraits par synthèse via IA, il existe une application en ligne (https://artflow.ai/)
Je m'en sers pour créer des portraits de personnages.

Pour voir ce que ça peut donner (avant-dernier post) :
viewtopic.php?t=30264
Spoiler:
Exemple : "Sarkozy Hollande"

Image


Exemple : "Brad Pitt Mister Bean"
Image

EDIT : il y a également une option Landscape @Archiduc Fifi ça peut t'intéresser (steppes)
Spoiler:
Exemple de Landscape "storm sea cthulhu"
Image

Exemple de Landscape "monster in the mist"
Image
Archiduc Fifi
Zelateur
Messages : 73
Inscription : mer. févr. 26, 2020 9:14 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Archiduc Fifi »

Pour les intéressés : Altay a posté un lien présentant un guide des paramètres à utiliser sur Dall-E

Voici la même, mais pour Midjourney : https://github.com/willwulfken/MidJourn ... -Reference
 
Avatar de l’utilisateur
Luven
Prêtre
Messages : 333
Inscription : dim. juil. 23, 2017 3:46 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Luven »

Archiduc Fifi a écrit : mer. sept. 07, 2022 9:46 am Une autre dérive : actuellement sur Instagram il y a plein de nouveaux comptes d'artistes peintres qui se créent. Mais en regardant les commentaires, on constate que ces "artistes" utilisent en fait Midjourney. Ils se considèrent artistes car ils font la même démarche que moi pour produire une image, et pour eux c'est de l'art ... Ils expliquent que "ouh lala, trouver un bon prompt pour produire cette image a été tellement dur, ça m'a demandé 2 jours de travail". Perso je ne suis pas en accord avec cette vision, à aucun moment je ne fais de l'art.

Avec mes collegues j'ai deja avancé l'idée qu'il va falloir ré-écrire nos annonces d'emploi pour demander des portfolios sans images générés par IA afin de s'assurer des talents des candidats...


Sinon sur le sujet :

1) Une note de blog que j'ai vu passée (en anglais) considère que générer une oeuvre via IA ne fait pas de vous un artiste puisque vous n'avez pas a resoudre un probleme artistique pour ce faire, mais de resoudre un probleme de communication (trouver les bons mots pour communiquer sa demande a l'IA). Ceux qui génèrent de l'art via IA se rapprochent de la figure du client, pas de celle de l'artiste.

Spoiler:
Prompt engineering, the key challenge most AI Artists face, is not an artistic problem, it’s a language problem. You are not learning to create an artistic expression by manipulating prompts, you are learning how to more effectively communicate with a model to get some desired output. This is the exact role of a client in the above example of the professional artistic process, only put in terms of AI image generation.

https://jakerice.substack.com/p/are-you ... re-you-the

2) D'apres cette autre note de blog (longue mais bien documenté, en anglais), le sens du mot "art" est completement perdue si on considère que ce que fait l'IA est de l'art. Le mot "art" serait confondu avec simplement le sentiment de beauté esthetique : "art" = ce que l'on trouve beau. Pour lui (en s'appuyant sur des écrits d'artistes et de critiques d'arts du 20e siecle, notamment via des parrallèles avec la reproduction des oeuvres permise par les machines a l'époque) cette définition est un appauvrissement du mot. L'art n'est seulement un sens esthetique, c'est un accès a l'esprit de l'artiste et l'art est le produit du processus, de l'esprit et de la vision de l'artiste.
 
Spoiler:
[...] The 20th-century art critic John Berger wrote in his seminal work Landscapes that:
The function of the work of art is to lead us from the work to the process of creation which it contains. . . By looking at it, we are, in effect, looking through an artist’s eyes, entering into a concretized instance of their gaze. We are looking at a looking. And from within an artist’s looking, we learn about the capacities of our kind and the possibilities of our future. . .

https://erikhoel.substack.com/p/ai-art-isnt-art

3) Un dernier petit parallèle que j'ai vu passer et qui m'a fait rire : on a créé des machines pour briser le mur du son mais on continu de regarder des humains sprinter sur 100m. Dans le futur on considèrera certainement l'art humain et l'art IA comme deux champs de développement indépendant.


4) Enfin en ce qui me concerne en tant qu'artiste professionel (3D, pas 2D mais mon heure viendra aussi), je deplore la situation. Je ne vois pas comment confier notre cerveau a des machines peut bien se terminer, mais je pense aussi qu'on ne peut absolument rien y faire. La boite de pandore est ouverte et plus rien ne sera jamais comme avant. Je m'attends a ce que le nombre d'artistes pouvant vivre de leur métier chute drastiquement dans les années a venir a mesure que l'on nous remplace par des machines. Et me reconvertir en "surveillant" d'IA a verifier que les machines suivent bien le brief de la boite ne m'interesse absolument pas.
Je pense cependant qu'en tant qu'outil le potentiel est incroyable et donc je m'y pencherais comme tout les autres. Puisqu'on replace des cerveaux et des mains par des machines cela veut aussi dire que j'en profiterais aussi pour mes projets personnels pour lesquels on peut faire chaque année un peu plus ambitieux meme seul dans son coin. Je pense que puisque le nombre d'artistes travailleurs va chuter pour ce qui est de la plupart des productions artistiques (jeu video, illustration, developpement visuel etc...) seule developper une expression forte et independante nous permettra de continuer a en vivre.
 
Dernière modification par Luven le ven. sept. 09, 2022 7:27 pm, modifié 1 fois.
Je poste parfois depuis un clavier qwerty sans accents, desole !
Avatar de l’utilisateur
jbbourgoin
Dieu d'après le panthéon
Messages : 2088
Inscription : mer. juin 18, 2014 2:35 pm
Localisation : Brest
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par jbbourgoin »

Se pose effectivement à nouveau la question de la définition de l'art.

On a la "vieille" origine antique du mot, le terme latin ars traduisant la tekhnè grecque et désignant une pratique, un métier, un procédé... Et l'usage de telles IA n'est en rien incompatible avec cette définition simple puisqu'il s'agit bien d'outils que l'on doit apprendre à maîtriser par l'usage d'un langage pour obtenir le résultat désiré. La poésie n'est-elle pas un art ? On parle aussi d'art de la programmation parfois (y compris en son sens esthétique quand on trouve un code beau et élégant). Ici nous sommes donc du côté de l'œuvre.

Mais un Kant va chambouler un peu tout ça et orienter la question du côté du jugement de goût, déplaçant l'interrogation de l'œuvre à sa contemplation esthétique et ouvrir par là l'ère romantique dont nous sommes toujours tributaires et dont les formes les plus conceptuelles et abstraites de l'art contemporain en sont un aboutissement radical. Si l'art est affaire de "réception", je ne vois pas comment une œuvre produite par MidJourney ne peut pas avoir sa place au côté de l'urinoir de Duchamp (pour reprendre un exemple célèbre).

Notre perception contemporaine et courante de l'art hérite de ces deux approches, on y voit quelque chose qui nous procure un "sentiment esthétique" et qui requiert une maîtrise technique, une habileté, un travail, un talent. Mais manifestement ces applications cochent les deux cases.

La seule chose qui me ferait dire que de telles œuvres n'en sont pas ce sera de dire : "au nom de la protection du travail des artistes tels que nous les imaginons et nous les représentons compte tenu du fait que ces outils n'existaient pas par le passé, nous stipulons que les créations produites par des IA ne sont pas des œuvres, et que les créateurs utilisant ces outils ne sont pas artistes".

Je crois sincèrement que dire que ces œuvres ne produisent pas de l'art et que les personnes qui travaillent avec ne sont pas des artistes est arbitraire.

Pour autant ces outils posent effectivement plein de problèmes éthiques (question du statut des artistes, création mettant en scène des célébrités dans des situations dommageables, problème des droits etc.), mais c'est une autre question.
Avatar de l’utilisateur
Altay
Ascendant
Messages : 1518
Inscription : sam. mai 07, 2016 12:04 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Altay »

Luven a écrit : jeu. sept. 08, 2022 1:05 am D'apres cette autre note de blog (longue mais bien documenté, en anglais), le sens du mot "art" est completement perdue si on considère que ce que fait l'IA est de l'art. Le mot "art" serait confondu avec simplement le sentiment de beauté esthetique : "art" = ce que l'on trouve beau. Pour lui (en s'appuyant sur des écrits d'artistes et de critiques d'arts du 20e siecle, notamment via des parrallèles avec la reproduction des oeuvres permise par les machines a l'époque) cette définition est un appauvrissement du mot. L'art n'est seulement un sens esthetique, c'est un accès a l'esprit de l'artiste et l'art est le produit du processus, de l'esprit et de la vision de l'artiste.

C'est discutable. On retrouvait ces mêmes inquiétudes lors du développement de la photographie. https://twitter.com/fchollet/status/1565748632267419648

Luven a écrit : jeu. sept. 08, 2022 1:05 am Je ne vois pas comment confier notre cerveau a des machines peut bien se terminer, mais je pense aussi qu'on ne peut absolument rien y faire.
Luven a écrit : jeu. sept. 08, 2022 1:05 am Puisqu'on replace des cerveaux et des mains par des machines

En grande majorité, on ne remplace pas des cerveaux, on les assiste pour les décharger de certaines tâches répétitives. Ça peut sembler être du pinaillage mais toutes les applications en entreprise de l'IA auxquelles j'ai pu être confrontés visent à faire de l'aide à la décision, jamais à automatiser des chaînes entières de production. Peut-être que ça arrivera un jour mais c'est une inquiétude un peu prématurée. En revanche ce qui est vrai c'est que ces aides visent à accroître la productivité et donc à diminuer la main d'œuvre humaine nécessaire…
Avatar de l’utilisateur
Pyth
Ascendant
Messages : 1601
Inscription : ven. mars 23, 2018 9:12 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Pyth »

Perso j'aurais plutôt tendance à être d'accord avec la logique du "client" proposée dans le premier blog que @Luven avait linké, car déjà qu'ici le principe de génération de l’œuvre ne requiert quasi aucun savoir faire (si ce n'est celui de savoir écrire en anglais et éventuellement, de savoir lire et comprendre une notice d'utilisation, sachant que c'est optionnel), en plus l'utilisateur n'a pas moyen d'avoir un contrôle total sur sa création.
Là par exemple, je peux avoir en tête une vision extrêmement précise de l’œuvre que j'aimerais générer, ce n'est pas pour autant que je l'obtiendrai via l'utilisation d'IA, en fait il sera même extrêmement improbable que je parvienne à produire un résultat final identique à ma vision de départ. En ce sens l'utilisateur se retrouve bien dans la position du client fournissant ses directives à l'artiste auprès de qui il a passé commande, et non dans celle de l'artiste lui-même.

Et c'est d'autant plus vrai que l'utilisation du service est effectivement payante.
All things are true. God's an Astronaut. Oz is Over the Rainbow, and Midian is where the monsters live.
BenjaminP
Dieu d'après le panthéon
Messages : 1702
Inscription : sam. mars 02, 2019 1:33 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par BenjaminP »

C'est très bien, ce fil, grand merci à @Altay, @Yusei et nos autres expert résidents de nous raconter tout ça.

*
jbbourgoin a écrit : jeu. sept. 08, 2022 9:19 am Si l'art est affaire de "réception", je ne vois pas comment une œuvre produite par MidJourney ne peut pas avoir sa place au côté de l'urinoir de Duchamp (pour reprendre un exemple célèbre).

C'est rigolo que tu prennes cet exemple parce que, pour moi, c'est précisément ce à quoi l'IA actuelle ne peut prétendre. L'art de Duchamp c'est un art de l'intentionnalité, c'est de l'art parce que je dis que c'est de l'art. L'IA ne dit rien et, en particulier, l'IA ne juge pas. Elle ne considère pas Picasso au-dessus de Poulbot. Elle ne porte aucun regard sur sa propre production. Or, il me semble vraiment difficile de dissocier la notion d'art de la notion de jugement.
Enjeu Solo, l'émulateur de MJ qu'il est beau ! Pour toutes vos parties sans MJ, Enjeu Solo contient les oracles qu'il vous faut. Dynamisez la narration, adaptez-la au rythme du récit, tenez compte des enjeux et surprenez tout le monde, vous le premier.
Avatar de l’utilisateur
Nolendur
Dieu matters
Messages : 4900
Inscription : mar. mai 20, 2008 3:51 pm
Localisation : Bordeaux
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Nolendur »

Pyth a écrit : jeu. sept. 08, 2022 9:51 am Perso j'aurais plutôt tendance à être d'accord avec la logique du "client" proposée dans le premier blog que @Luven avait linké, car déjà qu'ici le principe de génération de l’œuvre ne requiert quasi aucun savoir faire (si ce n'est celui de savoir écrire en anglais et éventuellement, de savoir lire et comprendre une notice d'utilisation, sachant que c'est optionnel), en plus l'utilisateur n'a pas moyen d'avoir un contrôle total sur sa création.
Là par exemple, je peux avoir en tête une vision extrêmement précise de l’œuvre que j'aimerais générer, ce n'est pas pour autant que je l'obtiendrai via l'utilisation d'IA, en fait il sera même extrêmement improbable que je parvienne à produire un résultat final identique à ma vision de départ. En ce sens l'utilisateur se retrouve bien dans la position du client fournissant ses directives à l'artiste auprès de qui il a passé commande, et non dans celle de l'artiste lui-même.

Et c'est d'autant plus vrai que l'utilisation du service est effectivement payante.

Je suis partiellement d'accord avec toi, mais il faut aussi prendre en compte les fonctionnalités d'affinage misent à disposition du client.
Dans Dall-e par exemple, tu peux effacer une partie de l'image produite puis demander a l'AI de la re-générer en utilisant d'autres critères ou des critères affinés. C'est assez basic pour le moment, mais je ne doute pas que dans les mois/années à venir, de véritables outils de pilotage/correction de l'AI par l'utilisateur soient fournis. Ce qui créera non seulement des résultats plus conformes au attentes du client, mais selon
l'investissement du client dans la phase d'affinage, lui donnera un certain sentiment d'être l'auteur du résultat (un peu comme il existe actuellement des "artistes graphiques" qui travaillent par assemblage/transformation de matériel graphique existant).
Petits jeux et bricolages : jeux perso et aides de jeu.
_____
The presence of those seeking the truth is infinitely to be preferred to the presence of those who think they’ve found it.
-- Terry Pratchett
Croyez ceux qui cherchent la vérité, doutez de ceux qui la trouvent.
-- André Gide
Yusei
Dieu en cavale
Messages : 9699
Inscription : jeu. janv. 30, 2014 9:47 am
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Yusei »

Pyth a écrit : jeu. sept. 08, 2022 9:51 am Et c'est d'autant plus vrai que l'utilisation du service est effectivement payante.
Je ne sais pas si tu fais référence à un service particulier ou en général, mais Stable Diffusion est disponible gratuitement et peut être utilisé par n'importe qui. Il y a un coût lié au fait qu'il faut une bonne carte graphique (ou acheter des heures de calcul dans le cloud), mais c'est une barrière qui tombera avec l'évolution du matériel. J'ai utilisé une carte (Tesla V100) qui coûte entre 3000 et 10000$ selon le modèle (elle n'est pas à moi !), c'est cher, mais 1) pas plus que le prix qu'un photographe peut mettre dans son matériel, 2) ça va baisser (au moins quand la vague des cryptomonnaies laissera baisser les prix des GPU).

Pour moi, si on raisonne à moyen terme, on peut se dire que l'utilisation des IA "artistes" est gratuite. J'irais même plus loin et je dirais que ça va être de plus en plus facile d'obtenir exactement ce qu'on veut. En imaginant la fusion de différentes technologies qui existent déjà, je me vois très bien gribouiller un paysage approximatif, mettre des bonshommes bâton, obtenir une belle illustration, et demander des modifications pour avoir vraiment ce que je veux.
Répondre