Можно ли задать композицию текстом, без ControlNet?

Автор Lyphros, Апр. 19, 2025, 10:09

« назад - далее »
Например: «герой на переднем плане, замок вдали» — как лучше формулировать?
  •  

ну для такой простой абстрактной композиции ControlNet не нужен - его модели нужны, если вы хотите повторить какую - то конкретную композицию с конкретного изображения. вам просто достаточно указать главный объект и второстепенный объект на фоне.

Если вы четко хотите выделить героя на переднем плане, то используется тег in the foreground. но это не обязательно , поскольку главный объект подразумевается видимым на главном плане. для заднего фона можно задать in the background, in the distance, far away in the background, far away on the horizon

так что получаются такие варианты
A hero in the foreground, a castle in the distance
Hero in the foreground, distant castle
A hero standing, castle far away in the background

по сути работа с композицией упирается в возможности модели следовать запросу: sd1.5 примерно понимает 3-4 объекта и парочку характеристик к каждому из них, после чего начинает плыть. здесь оптимальная длина запроса до 75 токенов , так что нужно уложиться в описании нужного формата изображения , объекта , его характеристика и действий, второстепенных объектов и фона, характеристик по стилю и атмосфере. sdxl модели поддерживают примерно вдвое больше токенов в запросе, ну и соответственно обрабатывают запросы генерируют изображения дольше. flux модели как раз любит длинные четкие запросы, поскольку поддерживают не менее 30 характеристик - более чем достаточно чтобы четко задать нужную композицию и характеристики каждого элемента. правда и генерируют эти модели почти в 10 раз дольше
  •