Одна из частых проблем в промптах — сцена задумана масштабной, а результат получается «сломанный»: персонажи путаются местами, действия смешиваются, композиция разваливается. Особенно это заметно, когда в кадре 3+ героя.
Чтобы нейросеть точнее поняла задачу, сложную сцену важно описывать не как поток идей, а как структуру.
Что помогает получить понятный результат:
-
Начинайте с общего плана сцены
Сначала задайте базу: где происходит действие, сколько персонажей в кадре, какая атмосфера, ракурс и тип сцены.
Например: оживлённая улица будущего, 4 персонажа в кадре, вечер, кинематографичный свет, средний план. -
Разделяйте персонажей по ролям
Не перечисляйте всех подряд в одной строке. Лучше описывать каждого отдельно:
слева — женщина в красном плаще, смотрит вперёд; в центре — мужчина в деловом костюме, держит зонт; справа — подросток с рюкзаком, бежит через улицу. -
Фиксируйте положение в пространстве
Ключевые слова: слева, справа, на переднем плане, на заднем плане, в центре, позади, рядом, напротив.
Это особенно важно, если персонажи взаимодействуют друг с другом. -
Описывайте действия по одному
Если в одном предложении герой и идёт, и смеётся, и машет рукой, и держит сумку, модель может «собрать» это неточно. Лучше:
мужчина стоит у витрины и смотрит в телефон. Женщина рядом улыбается и указывает на витрину. -
Указывайте связи между героями
Если есть взаимодействие, проговаривайте его явно:
девочка держит мать за руку,
официант подаёт кофе мужчине за столом,
два героя смотрят друг на друга. -
Сначала композиция, потом детали
Частая ошибка — сразу уходить в одежду, текстуры и стиль, не задав сцену. Правильный порядок:
1. окружение
2. количество персонажей
3. расположение
4. действия
5. внешний вид
6. стиль изображения
Рабочая формула промпта 🧩
Локация + количество персонажей + расположение в кадре + действие каждого + взаимодействие + визуальный стиль.
Пример:
Крыша небоскрёба ночью, 3 персонажа в кадре. В центре на переднем плане девушка в чёрном плаще стоит спиной к зрителю. Слева мужчина в очках держит планшет и смотрит на неё. Справа подросток в худи сидит на краю крыши и смотрит на город. Неоновый свет, дождь, cinematic, high detail.
Что ухудшает результат:
- слишком длинные перечисления
- отсутствие позиций персонажей
- несколько действий у одного героя сразу
- противоречия вроде крупный план и одновременно толпа на фоне
- попытка уместить 6–8 полноценных героев в один кадр 😅
Главный принцип:
Если сцену легко представить человеку, её проще собрать и модели. Пишите так, будто расставляете актёров на площадке, а не просто набрасываете идеи.
Если хотите лучше разбираться в промптах, инструментах и сценариях работы с нейросетями, загляните в подборку каналов про ИИ 👀