0
Правила составления промптов при генерации изображений
Видеоуроки

Генерация изображения - модуль на основе нейронной сети, предназначенный для создания изображений по текстовому описанию.

Основной параметр, который необходим при генерации изображения - это промпт.

Промпт - это текстовый запрос, инструкция или задание, которое пользователь отправляет нейросети для выполнения поставленной в нем задачи.

Промпт

 

Правила составления промпта.

Для генерации изображения достаточно одного-двух простых слов. В этом случае картинка будет сгенерирована и результат может быть даже удовлетворительным, но все детали изображения нейросеть додумает сама.

Например, если ввести слово "кот", то будет сгенерировано изображение кота, но какой это будет кот - белый или рыжий, фотография или иллюстрация, дома или в саду?

Поэтому для создания детально проработанного изображения лучше придерживаться определенной структуры и использовать точные и подробные описания.

Эффективный запрос обычно состоит из следующих элементов:

    - тип изображения/стиль
    - объект
    - внешний вид
    - поза или действие
    - окружение
    - освещение
    - технические детали

 

    Тип/Стиль изображения. Указать, что именно хотим получить в результате генерации: фотографию, иллюстрацию, картину маслом, рисунок, комикс, в стиле аниме, киберпанка и т.д.

    Фотография Фотография
    Рисунок Рисунок

    Объект/Субъект. Выбрать главное действующее лицо, которое будет в центре композиции, например, пес, певица, доктор, автомобиль, замок, река и т.п. Также при необходимости стоит указать пол субъекта: мужчина или женщина, девочка или мальчик (женщина-врач, девочка-геймер).

    Музыкант Музыкант
    Врач Врач

    Внешний вид. Это то, как будет выглядеть указанный ранее объект. Например, для человека можно указать во что он одет, цвет волос, тип лица, эмоции, возраст, что держит в руках и т.п. Чем подробнее описание, тем точнее нейросеть попытается воспроизвести выбранный объект.

      Примечание. Нейросеть плохо понимает расплывчатые абстрактные описания, лучше использовать конкретные визуальные детали.

    Фотография брюнетки в платье Фотография брюнетки в платье
    Фотография брюнетки в красном платье и очках Фотография брюнетки в красном платье и очках

    Поза или действие. Описать, что делает объект, например, сидит, бежит, танцует. Здесь тоже следует избегать абстрактных понятий, таких как думает, мечтает, размышляет, потому что нейросеть не сможет это однозначно отобразить.

    Мужчина идет по парку Мужчина идет по парку
    Мужчина бежит по парку Мужчина бежит по парку

    Окружение. Описать место, где находится объект и предметы вокруг него. Окружение лучше тоже описывать более подробно, например, не просто "лес", а "светлый лиственный осенний лес", чтобы получить более точную и яркую картинку.

    Парк Парк
    Осенний парк с красными и желтыми листьями вокруг Осенний парк
    с красными и желтыми листьями вокруг

    Освещение. Свет задает атмосферу. Указать тип освещения (искусственное, естественное), цвет (красное, синее), направление (сверху, снизу) и т.п. Например, кинематографичное освещение, мягкий закатный свет, холодный лунный свет и т.д.

    Жёлтый свет Из двери падает жёлтый свет
    Синий свет Из двери падает синий свет

    Технические детали. В конце можно указать какие-то параметры фотокамеры, ее расположение, условия и тип съемки, инструменты, которыми создавалось изображение.

    Фото с эффектом "рыбий глаз" Корги. Фото с эффектом "рыбий глаз"
    Фото с эффектом "боке" Корги. Фото с эффектом "боке"

 

В заключение, объединим все, что узнали в один большой промпт и посмотрим, что получится!

Промпт: Реалистичная фотография молодой студентки на фоне старинного здания с колоннами, длинные светлые волосы, классическая поза с лёгким разворотом корпуса влево и взглядом прямо в камеру, белоснежная рубашка с детализированной текстурой ткани и красным бантом на шее, стройная фигура, полуприкрытые карие глаза, яркие веснушки на лице, приоткрытые губы, солнечный летний день, кинематографическая глубина резкости f/1.4, винтажный объектив 85 мм с зернистостью плёнки

Результат Результат

 

Полезные советы (лайфхаки).

    Язык запроса. Нейросеть понимает русский язык, но (скорей всего) обучалась на английском, поэтому можно попробовать написать промпт на нем, чтобы получить более точный результат.

    Использовать синонимы, чтобы усилить какое-то настроение, например, темный, мрачный, жуткий, пугающий - для нагнетания атмосферы фильма ужасов.

    Точные описания. Использовать короткие ясные описания, минимизировать абстрактные понятия, которые нейросеть не сможет однозначно интерпретировать.

    Отрицания. Постараться не использовать слова "не", "без", "кроме" и т.п. - лучше заменить подобные словосочетания на подходящие синонимы. Например, вместо "без волос" написать "лысый".

    Ограничить число объектов. Не стоит увлекаться. Чем больше объектов, тем выше шанс, что нейросеть отрисует хуже каждый из них.

    Знаки препинания. Дополнительные запятые могут восприниматься нейросетью как увеличение числа объектов, даже если это прилагательные, относящиеся к одному объекту. Поэтому при добавлении нескольких определений запятые между ними лучше не использовать.

    Несколько генераций. Если промпт составлен правильно, но результат генерации не устраивает, не стоит расстраиваться. Можно изменить стартовое число и попробовать еще раз или сразу генерировать по несколько вариантов.

    Текст. Некоторые нейросети умеют добавлять на картинку несложные тексты по запросу. Для лучшего результата следует вводить надпись большими (прописными) буквами.

 

Промпт вместе с настройками генерации может быть сохранен как предустановка. При нажатии кнопки появится диалоговое окно, которое содержит все доступные предустановки, а также позволит сохранить свой набор настроек.

Заявка на AliveColors

Запросить информацию

Заполните форму, и наш специалист свяжется с вами в течение рабочего дня

Нажимая кнопку, вы соглашаетесь с политикой конфиденциальности