Génération d'images est un module basé sur un réseau neuronal, conçu pour créer des images à partir d'une description textuelle (prompt).
Le principal paramètre requis pour la génération d'images est le prompt. Il s'agit d'une requête, d'une instruction ou d'une tâche textuelle qu'un utilisateur envoie au réseau neuronal.
Règles pour créer un prompt
Un ou deux mots simples suffisent pour générer une image. Dans ce cas, l'image sera générée, et le résultat peut même être satisfaisant, mais le réseau neuronal complétera tous les détails automatiquement.
Par exemple, si vous entrez "chat", une image de chat sera générée, mais de quel type de chat s'agira-t-il ? Blanc ou roux ? À la maison ou au jardin ? S'agira-t-il d'une photo ou d'une illustration ?
Par conséquent, pour créer une image détaillée, il est préférable de respecter une certaine structure et d'utiliser des descriptions précises et détaillées.
Un prompt efficace se compose généralement des éléments suivants :
- type/style d'image
- sujet
- apparence
- pose ou action
- environnement
- éclairage
- détails techniques
Type/Style d'image. Précisez exactement ce que vous souhaitez recevoir comme résultat de la génération : une photographie, une illustration, une peinture à l'huile, un dessin, une bande dessinée, dans le style anime, cyberpunk, etc.
Photo
Dessin
Objet/Sujet. Choisissez le personnage principal qui sera au centre de la composition, par exemple un chien, un chanteur, un médecin, une voiture, un château, une rivière, etc. Indiquez également, si nécessaire, le genre du sujet : homme ou femme, fille ou garçon (femme médecin, joueuse fille).
Musicien
Femme médecin
Apparence. Il s'agit de l'apparence de l'objet précédemment spécifié. Par exemple, pour une personne, vous pouvez préciser ses vêtements, la couleur de ses cheveux, son type de visage, ses émotions, son âge, ce qu'elle tient, etc. Plus la description est détaillée, plus le réseau neuronal tentera de reproduire fidèlement l'objet sélectionné.
Note. Les réseaux neuronaux ont des difficultés à comprendre les descriptions abstraites et vagues, il est préférable d'utiliser des détails visuels précis.
Brune en robe
Brune en robe rouge et lunettes de soleil
Pose ou action. Décrivez ce que fait le sujet : assis, courant, dansant, par exemple. Évitez également les concepts abstraits comme penser, rêver ou réfléchir, car le réseau neuronal ne pourra pas les représenter sans ambiguïté.
Homme marche dans le parc
Homme court dans le parc
Environnement. Décrivez l'emplacement de l'objet et les objets qui l'entourent. Il est préférable de décrire l'environnement plus en détail. Par exemple, pas simplement "forêt", mais "une forêt d'automne claire et feuillue", afin de créer une image plus précise et vivante.
Parc
Parc d'automne avec des feuilles rouges et jaunes tout autour
Éclairage. La lumière crée l'ambiance. Précisez le type d'éclairage (artificiel, naturel), la couleur (rouge, bleu), la direction (d'en haut, d'en bas), etc. Par exemple : éclairage cinématographique, douce lumière de coucher de soleil, clair de lune froid, etc.
Lumière jaune à l'intérieur d'une porte
Lumière bleue à l'intérieur d'une porte
Détails techniques. À la fin, vous pouvez préciser certains paramètres de l'appareil photo, son emplacement, les conditions et le type de prise de vue, ainsi que les outils utilisés pour créer l'image.
Corgi. Photo prise avec un objectif fisheye
Corgi. Photo avec un bokeh
En conclusion, rassemblons tout ce que nous avons appris en une seule image et voyons ce que cela donne.
Résultat
Astuces
Langue du prompt. Le réseau neuronal comprend différentes langues, mais il a été entraîné en anglais et en chinois. Vous pouvez donc essayer de rédiger la requête dans ces langues pour un résultat plus précis.
Utilisez des synonymes pour renforcer une ambiance particulière, par exemple : sombre, lugubre, inquiétant, effrayant – pour créer l'atmosphère d'un film d'horreur.
Descriptions précises. Utilisez des descriptions courtes et claires, en minimisant les concepts abstraits que le réseau neuronal ne peut pas interpréter sans ambiguïté.
Négations. Essayez d'éviter d'utiliser des mots comme "pas", "sans", "sauf", etc. – il est préférable de remplacer ces expressions par des synonymes appropriés. Par exemple, au lieu de "sans cheveux", écrivez "chauve".
Limitez le nombre d'objets. N'en abusez pas. Plus il y a d'objets, plus le réseau neuronal risque de les rendre moins bien.
Ponctuation. Le réseau neuronal peut interpréter les virgules supplémentaires comme une augmentation du nombre d'objets, même s'il s'agit d'adjectifs se référant au même objet. Par conséquent, lorsque vous ajoutez plusieurs définitions, il est préférable de ne pas utiliser de virgules entre elles.
Générations multiples. Si le prompt est correct, mais que le résultat de la génération n'est pas satisfaisant, ne vous inquiétez pas. Vous pouvez modifier la valeur de Nombre aléatoire et réessayer, ou générer plusieurs variantes simultanément (en augmentant le paramètre Résultats).
Texte. Le réseau neuronal peut ajouter du texte simple à une image. Pour un résultat optimal, saisissez le texte en majuscules.
Vous pouvez enregistrer un prompt, ainsi que ses paramètres de génération, en tant que preset. Cliquez sur
pour ouvrir une boîte de dialogue contenant tous les presets disponibles et enregistrer vos propres paramètres.
