Генерация изображения - модуль на основе нейронной сети, предназначенный для создания изображений по текстовому описанию.
Основной параметр, который необходим при генерации изображения - это промпт.
Промпт - это текстовый запрос, инструкция или задание, которое пользователь отправляет нейросети для выполнения поставленной в нем задачи.
Правила составления промпта.
Для генерации изображения достаточно одного-двух простых слов. В этом случае картинка будет сгенерирована и результат может быть даже удовлетворительным, но все детали изображения нейросеть додумает сама.
Например, если ввести слово "кот", то будет сгенерировано изображение кота, но какой это будет кот - белый или рыжий, фотография или иллюстрация, дома или в саду?
Поэтому для создания детально проработанного изображения лучше придерживаться определенной структуры и использовать точные и подробные описания.
Эффективный запрос обычно состоит из следующих элементов:
- тип изображения/стиль
- объект
- внешний вид
- поза или действие
- окружение
- освещение
- технические детали
Тип/Стиль изображения. Указать, что именно хотим получить в результате генерации: фотографию, иллюстрацию, картину маслом, рисунок, комикс, в стиле аниме, киберпанка и т.д.
Фотография
Рисунок
Объект/Субъект. Выбрать главное действующее лицо, которое будет в центре композиции, например, пес, певица, доктор, автомобиль, замок, река и т.п. Также при необходимости стоит указать пол субъекта: мужчина или женщина, девочка или мальчик (женщина-врач, девочка-геймер).
Музыкант
Врач
Внешний вид. Это то, как будет выглядеть указанный ранее объект. Например, для человека можно указать во что он одет, цвет волос, тип лица, эмоции, возраст, что держит в руках и т.п. Чем подробнее описание, тем точнее нейросеть попытается воспроизвести выбранный объект.
Примечание. Нейросеть плохо понимает расплывчатые абстрактные описания, лучше использовать конкретные визуальные детали.
Фотография брюнетки в платье
Фотография брюнетки в красном платье и очках
Поза или действие. Описать, что делает объект, например, сидит, бежит, танцует. Здесь тоже следует избегать абстрактных понятий, таких как думает, мечтает, размышляет, потому что нейросеть не сможет это однозначно отобразить.
Мужчина идет по парку
Мужчина бежит по парку
Окружение. Описать место, где находится объект и предметы вокруг него. Окружение лучше тоже описывать более подробно, например, не просто "лес", а "светлый лиственный осенний лес", чтобы получить более точную и яркую картинку.
Парк
Осенний парк с красными и желтыми листьями вокруг
Освещение. Свет задает атмосферу. Указать тип освещения (искусственное, естественное), цвет (красное, синее), направление (сверху, снизу) и т.п. Например, кинематографичное освещение, мягкий закатный свет, холодный лунный свет и т.д.
Из двери падает жёлтый свет
Из двери падает синий свет
Технические детали. В конце можно указать какие-то параметры фотокамеры, ее расположение, условия и тип съемки, инструменты, которыми создавалось изображение.
Корги. Фото с эффектом "рыбий глаз"
Корги. Фото с эффектом "боке"
В заключение, объединим все, что узнали в один большой промпт и посмотрим, что получится!
Результат
Полезные советы (лайфхаки).
Язык запроса. Нейросеть понимает русский язык, но (скорей всего) обучалась на английском, поэтому можно попробовать написать промпт на нем, чтобы получить более точный результат.
Использовать синонимы, чтобы усилить какое-то настроение, например, темный, мрачный, жуткий, пугающий - для нагнетания атмосферы фильма ужасов.
Точные описания. Использовать короткие ясные описания, минимизировать абстрактные понятия, которые нейросеть не сможет однозначно интерпретировать.
Отрицания. Постараться не использовать слова "не", "без", "кроме" и т.п. - лучше заменить подобные словосочетания на подходящие синонимы. Например, вместо "без волос" написать "лысый".
Ограничить число объектов. Не стоит увлекаться. Чем больше объектов, тем выше шанс, что нейросеть отрисует хуже каждый из них.
Знаки препинания. Дополнительные запятые могут восприниматься нейросетью как увеличение числа объектов, даже если это прилагательные, относящиеся к одному объекту. Поэтому при добавлении нескольких определений запятые между ними лучше не использовать.
Несколько генераций. Если промпт составлен правильно, но результат генерации не устраивает, не стоит расстраиваться. Можно изменить стартовое число и попробовать еще раз или сразу генерировать по несколько вариантов.
Текст. Некоторые нейросети умеют добавлять на картинку несложные тексты по запросу. Для лучшего результата следует вводить надпись большими (прописными) буквами.
Промпт вместе с настройками генерации может быть сохранен как предустановка. При нажатии кнопки
появится диалоговое окно, которое содержит все доступные предустановки, а также позволит сохранить свой набор настроек.