Règles et conseils pour les prompts de génération d'images dans AliveColors

Règles et conseils pour les prompts de génération d'images

Génération d'images est un module basé sur un réseau neuronal, conçu pour créer des images à partir d'une description textuelle (prompt).

Le principal paramètre requis pour la génération d'images est le prompt. Il s'agit d'une requête, d'une instruction ou d'une tâche textuelle qu'un utilisateur envoie au réseau neuronal.

Règles pour créer un prompt

Un ou deux mots simples suffisent pour générer une image. Dans ce cas, l'image sera générée, et le résultat peut même être satisfaisant, mais le réseau neuronal complétera tous les détails automatiquement.

Par exemple, si vous entrez "chat", une image de chat sera générée, mais de quel type de chat s'agira-t-il ? Blanc ou roux ? À la maison ou au jardin ? S'agira-t-il d'une photo ou d'une illustration ?

Par conséquent, pour créer une image détaillée, il est préférable de respecter une certaine structure et d'utiliser des descriptions précises et détaillées.

Un prompt efficace se compose généralement des éléments suivants :

- type/style d'image
- sujet
- apparence
- pose ou action
- environnement
- éclairage
- détails techniques

Type/Style d'image. Précisez exactement ce que vous souhaitez recevoir comme résultat de la génération : une photographie, une illustration, une peinture à l'huile, un dessin, une bande dessinée, dans le style anime, cyberpunk, etc.

Photo

Dessin

Objet/Sujet. Choisissez le personnage principal qui sera au centre de la composition, par exemple un chien, un chanteur, un médecin, une voiture, un château, une rivière, etc. Indiquez également, si nécessaire, le genre du sujet : homme ou femme, fille ou garçon (femme médecin, joueuse fille).

Musicien

Femme médecin

Apparence. Il s'agit de l'apparence de l'objet précédemment spécifié. Par exemple, pour une personne, vous pouvez préciser ses vêtements, la couleur de ses cheveux, son type de visage, ses émotions, son âge, ce qu'elle tient, etc. Plus la description est détaillée, plus le réseau neuronal tentera de reproduire fidèlement l'objet sélectionné.

Note. Les réseaux neuronaux ont des difficultés à comprendre les descriptions abstraites et vagues, il est préférable d'utiliser des détails visuels précis.

Brune en robe

Brune en robe rouge et lunettes de soleil

Pose ou action. Décrivez ce que fait le sujet : assis, courant, dansant, par exemple. Évitez également les concepts abstraits comme penser, rêver ou réfléchir, car le réseau neuronal ne pourra pas les représenter sans ambiguïté.

Homme marche dans le parc

Homme court dans le parc

Environnement. Décrivez l'emplacement de l'objet et les objets qui l'entourent. Il est préférable de décrire l'environnement plus en détail. Par exemple, pas simplement "forêt", mais "une forêt d'automne claire et feuillue", afin de créer une image plus précise et vivante.

Parc

Parc d'automne avec des feuilles rouges et jaunes tout autour

Éclairage. La lumière crée l'ambiance. Précisez le type d'éclairage (artificiel, naturel), la couleur (rouge, bleu), la direction (d'en haut, d'en bas), etc. Par exemple : éclairage cinématographique, douce lumière de coucher de soleil, clair de lune froid, etc.

Lumière jaune à l'intérieur d'une porte

Lumière bleue à l'intérieur d'une porte

Détails techniques. À la fin, vous pouvez préciser certains paramètres de l'appareil photo, son emplacement, les conditions et le type de prise de vue, ainsi que les outils utilisés pour créer l'image.

Corgi. Photo prise avec un objectif fisheye

Corgi. Photo avec un bokeh

En conclusion, rassemblons tout ce que nous avons appris en une seule image et voyons ce que cela donne.

Prompt : Image réaliste d'une jeune étudiante devant un vieux bâtiment à colonnes. Cheveux longs blonds, pose classique, le corps légèrement tourné vers la gauche, regard droit dans l'objectif. Chemise blanche immaculée à la texture détaillée, ornée d'un nœud papillon rouge. Silhouette élancée, yeux marrons mi-clos, visage parsemé de taches de rousseur, lèvres entrouvertes. Journée d'été ensoleillée. Profondeur de champ cinématographique (f/1.4), objectif 85 mm vintage avec grain argentique.

Résultat

Astuces

Langue du prompt. Le réseau neuronal comprend différentes langues, mais il a été entraîné en anglais et en chinois. Vous pouvez donc essayer de rédiger la requête dans ces langues pour un résultat plus précis.

Utilisez des synonymes pour renforcer une ambiance particulière, par exemple : sombre, lugubre, inquiétant, effrayant – pour créer l'atmosphère d'un film d'horreur.

Descriptions précises. Utilisez des descriptions courtes et claires, en minimisant les concepts abstraits que le réseau neuronal ne peut pas interpréter sans ambiguïté.

Négations. Essayez d'éviter d'utiliser des mots comme "pas", "sans", "sauf", etc. – il est préférable de remplacer ces expressions par des synonymes appropriés. Par exemple, au lieu de "sans cheveux", écrivez "chauve".

Limitez le nombre d'objets. N'en abusez pas. Plus il y a d'objets, plus le réseau neuronal risque de les rendre moins bien.

Ponctuation. Le réseau neuronal peut interpréter les virgules supplémentaires comme une augmentation du nombre d'objets, même s'il s'agit d'adjectifs se référant au même objet. Par conséquent, lorsque vous ajoutez plusieurs définitions, il est préférable de ne pas utiliser de virgules entre elles.

Générations multiples. Si le prompt est correct, mais que le résultat de la génération n'est pas satisfaisant, ne vous inquiétez pas. Vous pouvez modifier la valeur de Nombre aléatoire et réessayer, ou générer plusieurs variantes simultanément (en augmentant le paramètre Résultats).

Texte. Le réseau neuronal peut ajouter du texte simple à une image. Pour un résultat optimal, saisissez le texte en majuscules.

Vous pouvez enregistrer un prompt, ainsi que ses paramètres de génération, en tant que preset. Cliquez sur pour ouvrir une boîte de dialogue contenant tous les presets disponibles et enregistrer vos propres paramètres.