Вопросы и ответы по подготовке датасета

Автор Master_Yoda, Апр. 29, 2025, 19:53

« назад - далее »
  • Вопрос: "Подскажите пожалуйста по составлению корректного датасета для обучения лоры на человека. Сейчас обучил по 30 фотографиям, в основном это селфи с мобильного телефона – работает отлично, но только с токеном a closeup selfie of a.... Я так понимаю, что нужна большая вариабельность по различным характеристикам:

    дневной свет / пасмурный / вечерний / искусственный;

    селфи / широкоугольный / поясной / 75 мм;

    эмоции: спокойное / лёгкая улыбка / радость / веселье;

    ракурс: в камеру / полупрофиль / три четверти / вверх / вниз.

    Какие ещё аспекты нужно обязательно добавить, чтобы собрать оптимальную комбинацию для обучения?"
    Ответ: Да, это прям хорошая заготовка. Добавь ещё:

    съёмки с разным фокусным расстоянием, если есть;

    вариант с аксессуарами (очки, шапки), но не перебарщивай;

    несколько разных фонов (нейтральный, интерьер, улица);

    разные степени яркости экспозиции;

    немного "бракованных" кадров — это повышает обобщающую способность, особенно на слабых сетках;

    и главное — названия файлов и теги надо продумать, или хотя бы в prompt.txt их потом вбить.
  • Вопрос: "Ребят, а кто чем тренит лоры для Флакс? Я вот наткнулся на эту схему:
    https://www.runcomfy.com/comfyui-workflows/comfyui-flux-lora-training-detailed-guides
    4 часа тренил модельку андроида, ну да не на идеальных референсах, но в итоге он туда дорисовывает какие-то цветочки хз зачем...
    В целом-то работает, но не пойму, может я что-то не то в настройках задал? Или может есть более интуитивные инструменты обучения?"
    Ответ: Обучение Лоры и интуитивные инструменты — вещи несовместимые 😁 Всё через боль и страдания. Там главное: хороший датасет, фильтрация, стабильные веса и нормальный lora_rank. Если в датасете был цветок — он появится. Если не было — может прилететь от base-модели. Глянь, что у тебя в фоне на фото. Ну и на всякий случай — не забывай маски или белый фон в preproc.
  • Вопрос: "А не просветите ли меня — можно ли обучать ЛОРУ на 8-гиговой карте, но не RTX, а GTX?"
    Ответ: Можно, если без SDXL. Лучше всего ставить rank не выше 32, а lr_scheduler — constant. Убедись, что модель поддерживает ускорение CUDA (Pascal и выше).
    У меня знакомый обучал на GTX 1060, но batch_size = 1 и только 512px.
    Для SD 1.5 пойдёт, для чего-то серьёзнее — очень туго. Лучше всё-таки арендовать мощную карту или найти машину с RTX.
  • Вопрос: "Может знаете — можно ли в датасет помещать фото разных возрастов с явным указанием возраста в описании, и надеяться получить при генерации соответствующее возрасту изображение?"
    Ответ: Надеяться — можно и даже нужно 😁 По логике это так и должно работать, но я не делал такого.
    Если хочешь точный контроль — либо отдельно тренируй под возрастные группы, либо в prompt'е указывай возраст, чтобы LoRA знала, к чему привязаться.
    Главное — не мешай младенцев и стариков в один датасет без дополнительных тегов. Будет каша.
  • Вопрос: "Привет! я опять со странными вопросами новичка :)
    Скажи, а ты не сталкивался с таким методом обучения LoRA на парных изображениях?
    То есть есть базовое изображение и есть стилизованное, и я хочу, чтобы LoRA научилась делать стилизацию по принципу "было/стало".
    Это вообще возможно в LoRA или нужен другой подход?"
    Ответ: Нет, одной Лорой ты так не сделаешь. Это слишком наивно. LoRA не учит связи "до/после", она запоминает общий средний стиль.
    Если хочешь такое — тебе нужна либо Style Transfer схема, либо тренировка через ControlNet или Dreambooth.
    Лора не понимает парность — она не знает, что одно фото "до", а другое "после". У неё нет сопоставления.
  •  

  • Вопрос: "Привет! Я пробую собрать датасет для лица — у меня есть 24 фотки, крупные портреты, без фона, почти все на однотонной стене.
    Лора вроде работает, но когда пытаюсь закинуть её в генерацию — в дальнем плане лицо "уходит", черты стираются.
    Это баг или мне просто не хватает вариативности?"
    Ответ: Это не баг, это фича. LoRA плохо держит консистентность в уменьшении размера.
    Надо в датасет включать разные расстояния — не только впритык, но и с метра хотя бы.
    И фон всё-таки лучше менять — однотонный стенд плохо обобщается. Можно даже имитацию уличных условий сделать.
    Или, как вариант, дообучить LoRA на доп. паке с уменьшенным фейсом.
  • Вопрос: "А есть ли смысл в создании LoRA на сразу 2-х персонажей? Например, хочу сделать лору, которая знает визуальные образы героя и героини, и могу в prompt менять токен типа <hero1> и <hero2>.
    Или лучше делать две отдельных?"
    Ответ: Это реально, но... танцы с бубном. Надо:

    делать чёткие токены-разделители (типа как ты написал);

    тренить на разных поддиректориях;

    ставить rank минимум 64, лучше 128;

    и желательно, чтобы у них не было общих образов, иначе смешает.

    У меня была такая Лора с "девушкой в пальто" и "парнем в худи" — работала, но очень нестабильно. Лучше — две лоры и потом склеивать промптами.
  • Вопрос: "Привет народ! Кто обучал Лоры с большим количеством аксессуаров?
    Я пробовал сделать Лору на девушку с очками, но на генерации очки рисуются криво или исчезают.
    Явно не хватает чего-то, но не пойму — это баг модели или я сам облажался?"
    Ответ: У тебя скорее всего недостаток стабильности в датасете. Очки — это tricky штука.
    Надо:

    чтобы на каждом фото очки были отчётливо видны;

    чтобы они не сливались с фоном (прозрачные очки — зло);

    чтобы ракурсы были разные: в профиль, чуть сбоку, слегка сверху и т.д.

    Если на части фоток очков нет — LoRA будет "колебаться", показывать их через раз.
  • Вопрос: "Ребят, всем привет. А есть смысл использовать LoRA, если в датасете всего 10–12 фото?
    Или это совсем ни о чём? У меня просто портреты человека в одной локации, разной эмоции, но фон одинаковый."
    Ответ: Есть смысл, если локация и свет стабильные, и если ты не ждёшь от неё суперобобщения.
    Главное:

    держи lora_alpha пониже (2–4);

    rank можно оставить в районе 32;

    и не меняй resolution. Делай 512x512 или 768x768, без апскейла.

    Для узких задач — работает отлично. У меня даже с 8 фотками лора нормально накидывала. Но вот "универсальность" — забудь.
  • Вопрос: "Приветствую, не подскажите, при создании датасета — как быть с экспозицией?
    У меня фотки одного человека: часть на солнце, часть в комнате при лампе, одна при контровом свете.
    Это ок, или надо приводить к одному виду?"
    Ответ: Всё правильно делаешь!
    Разнообразие экспозиции = больше обобщаемость.
    Главное — не перегибай.

    Не включай кадры, где лицо совсем чёрное или пересвеченное.

    Делай так, чтобы глаза и основные черты были видны.

    И если используешь jpg — не переужимай. Лучше png.

    У меня были случаи, когда на дневных Лора шила норм, а при контровом свете — провал. Пришлось доучивать.
  •  

  • Вопрос: "Коллеги, привет. У меня такой вот кейс. Собрал датасет с 40 фото одного человека, всё лицо, ракурсы разные, но есть 5–6 фоток, где эмоции сильно гримасные (типа удивление, оскал, закрытые глаза).
    Стоит ли их включать или лучше удалить? Лора должна ведь и эмоции уметь, да?"
    Ответ: Если эмоции важны — включай.
    Но смотри, чтоб таких фото было не больше 10–15% от всего датасета.
    Гримасы сильно влияют на loss при обучении, и если их много — модель может "поплыть".

    Плюс: сделай 2 версии датасета — одну с нейтральными эмоциями, одну смешанную.
    Тогда можно будет сравнивать генерации и понять, как оно влияет. Я так делал — работает хорошо.
  • Вопрос: "Народ, LoRA учится на .jpg или лучше png в датасет класть?
    Имеет ли смысл тянуть разрешение до 1024х1024? Карта у меня 4070, но VRAM всего 8 гигов."
    Ответ: Лучше png или .webp с минимальной компрессией.
    Jpeg нормально ест, но если его сильно сжали, появляются артефакты, и LoRA это запоминает.
    1024 – это ок, если лора на SDXL.
    Если ты на 1.5, то лучше 512, и всё будет стабильно, без перегрузов.

    И да — не забывай аугментацию, хотя бы лёгкий поворот или кроп.
  • Вопрос: "Подскажите, можно ли использовать фото в шапке/капюшоне, если хочу обучить LoRA на персонажа с таким видом?
    Или всё-таки лучше сделать без головных уборов, а потом дорисовывать через промпт?"
    Ответ: Если цель — чтобы Лора знала именно "в шапке", то конечно клади.
    Только следи, чтобы:

    не было перемешки с безшапочными, если не хочешь, чтобы оно путалось;

    шапка/капюшон была чётко различима на всех фотках;

    и желательно тег в имени файла добавить, типа hat_001.png.

    Если хочешь и так, и так — делай два датасета, или разбей на группы и напиши разные токены.
  • Вопрос: "Ребят, у меня такой затык: при обучении лоры на комфи, в половине случаев output получается "пластиковый".
    Лицо как будто пластиковое, губы как будто резиновые.
    Это плохо подобранный датасет или я что-то в параметрах не так задаю?"
    Ответ: 90% — это недостаток текстуры в исходниках.
    Часто юзают фотки с телефонов, где лицо замылено фильтрами.
    Что делать:

    Используй изображения с натуральной кожей, пусть даже с шумами;

    Обрабатывай через face enhancer до обучения (типа RestoreFormer);

    И — не перебарщивай с sharpen после обучения, это тоже может дать "резину".
  • Вопрос: "Я тренировал LoRA на персонаже комикса. Проблема — в генерации он в одной позе, при том что в датасете есть и профиль, и ракурс, и сзади.
    Может он просто запомнил основной ракурс? Или лора тупо переобучилась?"
    Ответ: Да, это типичная overfitting LoRA.
    Если в датасете есть повторяющийся кадр или композиция, модель залипает.
    Советы:

    shuffle датасет, и не ставь epoch > 10;

    сделай аугментации (flip, rotation, crop);

    проверь не совпадают ли названия файлов, иногда баг ловится из-за нумерации 001.png, 002.png и т.д.
  •  

  • Вопрос: "Привет! Вопрос такой — если я в датасет добавлю изображения персонажа на фоне огня или спецэффектов, это не будет мешать?
    Или лучше на однотонке? Мне нужно, чтобы в генерации он иногда появлялся 'на фоне огня', но не всегда."
    Ответ: Если "не всегда" — лучше не надо, или добавляй, но очень точечно — не больше 1–2 таких кадров.
    LoRA сжирает фон как часть образа, и потом тяжело отучить.

    Если хочется флекса —:

    делай LoRA только на персонажа (чисто силуэт, поза, одежда);

    а фон через prompt или controlnet добавляй.

    Я как-то делала Лору на перса с молниями — потом молнии прилипали даже в спальне 😅
  • Вопрос: "Коллеги, кто делает LoRA на SDXL — подскажите, какое разрешение оптимальное для датасета?
    И можно ли миксовать, скажем, 768 и 1024? Или всё должно быть ровно?"
    Ответ: Лучше не мешать.

    Если тренишь на 1024 — тогда все изображения должны быть подогнаны под это.

    Если вкинешь 768, SDXL начнёт тупить, особенно в деталях.

    Для лица, кстати, часто даже лучше 768x768. Меньше VRAM, и выход стабильнее.

    Я обычно upscale через Topaz или Supir, потом прогоняю auto crop.
  • Вопрос: "Собираюсь делать LoRA для мультяшного персонажа (типа Adventure Time стиль).
    Есть набор PNG-шек с прозрачным фоном, 256x256, нарисованные вручную. Подойдёт или надо их как-то подгонять?"
    Ответ: Прозрачный фон — в топку. Обязательно на белом или сером фоне сохраняй.

    PNG норм, но 256 маловато. Растяни до 512х512, но через хороший resample (Lanczos или Supir), а не тупо через Paint.

    Ещё момент: мультяшки лучше обучать без текстур, но с разными позами — они быстро начинают "залипать" в одной эмоции.
  • Вопрос: "А если у меня персонаж нарисован в разных стилях (где-то акварель, где-то лайн, где-то в пиксель-арте) — стоит ли это всё мешать в один датасет, или лучше разделить и сделать несколько LoRA под каждый стиль?"
    Ответ: Разделяй, однозначно.
    LoRA плохо "чувствует" стили, если их мешать — начинает лезть каша.

    Сначала делай акварельную версию,

    Потом — пиксельную и так далее.
    Каждую — как отдельную Лору. Потом можно их смешивать через lora1:0.5, lora2:0.5, но это уже в генерации.
  • Вопрос: "Такой вопрос: если я хочу обучить LoRA по кадрам из фильма — нужно ли вытаскивать только резкие кадры, или можно миксовать с динамичными, размытыми сценами?"
    Ответ: Если ты хочешь, чтобы персонаж был узнаваемый и "чистый", то:

    размытые кадры — в топку;

    любые "кадры в движении" с motion blur — портят восприятие Лорой;

    фокус на крупных планах с освещением, где видно глаза, рот и общие черты.

    Потом уже можешь использовать inpainting или motion frame generator, чтобы подстроить под динамику.
  •  

  • Вопрос: "Ребят, а кто как размечает датасет, когда обучает LoRA на конкретного человека?
    Указываете ли вы что-то в названии файла? Или вообще не паритесь и просто складываете в папку и всё?"
    Ответ: Можно не париться — Comfy и так схавывает. Но лучше всё-таки привязать имя токена к названию файлов.
    Пример: claire_001.png, claire_002.png и потом claire юзается как trigger token.
    Или в prompt.txt прописать: Claire face portrait photo.
    Главное — один и тот же триггер везде, без разнобоя.
    Ну и желательно, чтобы в файлах не было кириллицы или пробелов.
  • Вопрос: "Подскажите, а имеет ли значение формат изображений при обучении LoRA?
    То есть, если одни будут PNG, другие — JPEG или WebP — это ок? Или надо приводить к одному виду?"
    Ответ: Лучше всё-таки привести.

    PNG — лучший выбор, особенно если изображения сохранялись без потерь;

    WebP — норм, если качество 95–100;

    JPEG — под вопросом. Если сильно сжатый — Лора будет видеть артефакты и учиться на них.

    Сам всегда перед обучением прогоняю через скрипт, который делает convert -> PNG, и тогда спокойно.
  • Вопрос: "А как быть, если часть изображений в датасете — скриншоты (например, с Telegram или YouTube)?
    Они хуже качеством, с наложенным текстом. Можно ли их оставить, или надо вычищать?"
    Ответ: Вычищай.
    Текст на изображении — зло для LoRA, особенно на лице или на фоне.
    Даже если он не в фокусе — Лора его "чувствует", и потом может пытаться дорисовать.
    Если уж очень надо — обрезай или делай кроп, чтобы текст вылезал за пределы.
  • Вопрос: "Скажите, кто-то обучал Лору, где персонаж постоянно в шапке с ушами?
    У меня персонаж из игры, и у него образ почти всегда с этой шапкой. Но иногда хочется, чтобы и без неё генерился — стоит ли её включать в датасет?"
    Ответ: Если иногда — тогда нет, лучше исключи.
    LoRA не понимает "время от времени" — она если увидела 10 фоток с ушами, будет лепить всегда.
    Можешь попробовать:

    обучить две лоры, одна с шапкой, одна без;

    или обучить одну, но добавить ControlNet маску, чтобы потом управлять генерацией — где с шапкой, где без.
  • Вопрос: "Я заморочился на персонажа из комикса, сделал лору по 40 кадрам, но всё равно на выходе линии 'плывут', а лицо разное.
    Вроде всё по инструкции, но выходит не то. Может резкость изображений влияет?"
    Ответ: Влияет, и ещё как.

    Если контур размытый, или lineart не стабилен — LoRA начинает "додумывать" детали;

    Если хочешь чистые линии — используй Canny или Lineart Preprocessor перед обучением;

    Ну и фильтруй датасет — чёткие изображения на однотонном фоне без мусора.

    Ещё совет: иногда помогает сделать только 1 эпоху, но с большим количеством шагов — для мультяшек так работает лучше.
  •  

  • Вопрос: "Всем привет! Скажите, при создании датасета для лоры на SDXL, стоит ли заранее нормализовать изображения под 1024x1024, или можно скармливать всё подряд, а внутри Comfy оно само подгонится?
    Или это критично для качества результата?"
    Ответ: Лучше нормализовать заранее.

    SDXL любит 1024x1024 или около того;

    Смешивание 768, 800, 900 и т.д. приводит к тому, что при генерации будет плясать фокус — иногда лицо будет резким, иногда смазанным.
    Прогони всё через upscale или через ноду автокропа в ComfyUI.
    Тогда и лосс ровнее будет падать, и результат стабильнее.
  • Вопрос: "Коллеги, подскажите, если в датасете есть несколько кадров, где персонаж в разных цветах одежды — это норм, или лучше всё в одной гамме оставлять?
    Хочу, чтобы потом на генерации можно было разную одежду получать."
    Ответ: Всё правильно делаешь — разноцветная одежда — это плюс.
    Главное:

    Не перегибай — пусть цвета будут естественные (белый, чёрный, синий, красный), а не кислотные;

    Следи, чтобы основная часть датасета оставалась с одинаковыми чертами лица — одежда меняется, а лицо должно оставаться стабильным.

    Потом в промпте можно управлять цветом через стандартные токены (red jacket, blue dress).
  • Вопрос: "Народ, объясните по-быстрому: если в датасете на 30 фото есть 3–4 фотки с дефектами типа пересвета или микроблюра — это прям смерть для обучения, или терпимо? Удалять их или оставить?"
    Ответ: Зависит от того, насколько ты хочешь стабильности.

    Если хочешь "идеальную Лору" — лучше удалить.

    Если хочешь, чтобы Лора обобщала и не боялась косяков — оставь парочку, но не больше 10% от датасета.

    Только проверь, чтобы на дефектных фото всё равно были видны глаза, нос, рот — иначе она будет учить шум вместо черт.
  • Вопрос: "А кто-то пробовал обучать Лору на картинках, где есть лёгкий фильтр типа ретро-эффекта или блики?
    Не будет ли это сбивать генерацию потом?"
    Ответ: Фильтры в лоре = грязь в будущем.
    Особенно всякие "блики", "старение" и "пыль" — Лора запоминает их как часть основного паттерна.
    Лучше:

    Либо убрать фильтры до тренировки (деконволюция или ручная чистка);

    Либо собрать отдельную Лору на стиле и потом миксовать её с основной через prompt.

    В общем, нет — чистые исходники — залог чистого результата.
  • Вопрос: "Если хочу, чтобы Лора умела работать и в цвете, и в ч/б — как лучше собрать датасет? Мешать цветные и черно-белые фото или лучше всё цветное, а потом ч/б делать через prompt?"
    Ответ: Делай всё цветное.
    LoRA не знает понятия "чёрно-белое" как отдельного состояния.
    Потом при генерации просто добавляй black and white photo в промпт — и всё.
    Если замешаешь цветные и ч/б — будет мешанина: однажды даст тебе сепию, другой раз — зелёные лица 😁

    Проверено лично на датасетах для Flux'а и Dora — цвет рулит.
  •  

  • Вопрос: "Ребят, если хочу сделать лору на 'пару', типа парень + девушка вместе на одном кадре — стоит ли фоткать их отдельно и потом собирать, или можно сразу использовать фотки вдвоём?
    Хочу, чтобы потом вместе генерились."
    Ответ: Если хочешь, чтобы они всегда были вместе — фоткай вместе.
    Но запомни:

    Близкое положение (объятия, рука в руке) лучше фиксирует связь;

    Нельзя мешать кадры "он один" / "она одна" в один датасет — запутаешь лору;

    Лучше завести токен типа <couple> и тренить только на таких фотках.

    Делила на пары — очень хорошо работает потом в генерации.
  • Вопрос: "Кто подскажет — если в датасете половина фото при дневном свете, половина ночью или в помещении при тусклом свете — это плохо для обучения лоры?
    Нужно ли приводить все к единому освещению?"
    Ответ: Наоборот, это хорошо.
    Разнообразие света = лучшее обобщение.
    Главное:

    Убедись, что детали лица хорошо читаются везде;

    И чтобы не было кадров, где лицо полностью в тени или блики на лбу.

    Я всегда стараюсь 70/30 делать: 70% дневных кадров, 30% вечерних.
  • Вопрос: "Кто-то пробовал собирать датасет с уже сжатых картинок (скачанное из Telegram, например)?
    Там ведь пережатие дикое. Имеет ли смысл или это мусор для лоры?"
    Ответ: Telegram-фотки — зло для обучения лоры.
    Особенно если пережаты до 800px и там все лица мылом.
    Смысла мало. Что можно сделать:

    Попробовать прогнать через ремастеринг типа RealESRGAN или Topaz;

    Или не использовать такие изображения совсем.

    На личном опыте — Лора начинает потом рисовать пластиковые лица без деталей.
  • Вопрос: "Всем привет! Подскажите, кто в курсе — если хочу, чтобы LoRA понимала персонажа в разных костюмах (например, в шлеме, броне, плаще) — достаточно просто накидать таких картинок?
    Или надо что-то особенное делать в разметке?"
    Ответ: Можно просто накидать, но лучше разделять через теги.
    Пример:

    <hero> in armor

    <hero> wearing cloak

    <hero> with helmet

    Тогда в генерации ты сможешь управлять образом через prompt.
    Без тегов Лора иногда начинает мешать элементы, типа пол-плаща, пол-шлема одновременно 😅
  • Вопрос: "Коллеги, скажите — а есть какие-то требования к позам персонажей в датасете?
    Типа только фронтальные или можно профиль, 3/4, вид сверху? Хочу собрать лору на ролевого персонажа."
    Ответ: Чем больше разных ракурсов — тем лучше.

    Прямой взгляд в камеру;

    Полупрофиль;

    Профиль;

    Лёгкий вид сверху/снизу.

    Главное: не переборщи с экзотикой. Ракурсы должны быть естественные.
    Если сделаешь только фронтальные — потом при генерации профиль будет "тянуть" под фронт.
  •  

  • Вопрос: "Всем привет. Вопрос: если я хочу обучить лору на одного персонажа, но при этом на части фоток у него длинные волосы, а на части короткие — это нормально или лучше всё унифицировать?"
    Ответ: Для стабильности — лучше выбрать один образ.
    Если намешаешь, модель начнет "подглючивать" — в одной генерации длинные волосы, в другой короткие без команды.
    Совет:

    Сделать два датасета — длинные и короткие;

    Либо тегами разделить типа <hero_longhair>, <hero_shorthair>.

    Тогда можно будет управлять этим в промпте.
  • Вопрос: "Ребят, кто собирал датасеты под мультяшных персонажей — обязательно ли использовать полностью белый фон? Или допустимы простые фоны вроде градиента?"
    Ответ: Белый фон — идеально, потому что ничего лишнего.
    Градиенты допустимы, если они не перетягивают внимание (не яркие, без текстур).
    Самое главное — чтобы силуэт персонажа выделялся чётко.

    И не забывай: мультяшные лоры потом хуже справляются с реальными тенями и текстурами, если в обучении фон был сложный.
  • Вопрос: "Вопрос: если у меня все фотки квадратные, 512x512, а часть из них — вертикальные портреты, но в квадрат вписаны с рамкой, это плохо для обучения? Или нормально?"
    Ответ: Лучше без рамок.
    Лора воспринимает рамки как часть изображения. Потом на выходе могут появиться "белые полосы" сбоку.
    Что делать:

    Кропни вручную лицо по центру без пустых полей;

    Или заливай рамки тем же цветом, что и фон.

    Чем меньше лишних "шумов" в кадре — тем чище выход.
  • Вопрос: "Подскажите, насколько критично наличие мелких надписей/логотипов на одежде в датасете? Есть пару классных кадров, но на футболке фирма написана."
    Ответ: Надписи — опасная штука.

    LoRA "видит" их как часть стиля;

    Потом в генерации может появляться мусорный текст.

    Лучше:

    Ретушировать надписи;

    Или обрезать кадр так, чтобы логотипа не было.

    Особенно плохо влияют яркие и контрастные надписи.
  • Вопрос: "Всем привет! Кто сталкивался: если персонаж в некоторых фотках улыбается, в некоторых — нейтральный, стоит ли их мешать в одном датасете или делать акцент на одном выражении лица?"
    Ответ: Можно мешать!
    Главное правило — баланс.

    70–80% нейтральных фото;

    20–30% улыбающихся.

    Тогда Лора научится, что "по дефолту" лицо спокойное, но по промпту можно получить улыбку.
  • Вопрос: "Коллеги, у кого опыт — можно ли обучить лору только на лицах без тела? То есть, чтобы при генерации потом сам промпт уже дорисовывал всё остальное."
    Ответ: Можно.
    Есть даже специальная практика обучения "head-only LoRA".

    Делай кадры, где только голова и шея, без рук и плеч;

    В генерации обязательно использовать уточнения (upper body, full body и т.д.), иначе может вылезти обрубок 😁
  • Вопрос: "А если у меня есть фотки с разной яркостью и контрастом (одни затемнённые, другие яркие) — стоит ли их нормализовать перед обучением? Или оставить как есть для разнообразия?"
    Ответ: Лучше оставить как есть, но:

    убери кадры, где детали лица теряются полностью;

    слишком затемнённые или пересвеченные кадры — минус в обучении.

    Я обычно пропускаю датасет через лёгкий автокорректор уровней — чисто чтобы тени не убивали всё.
  • Вопрос: "Подскажите, кто делал LoRA на старые фотографии (черно-белые, потёртые)? Нужно ли чистить их в фотошопе, убирать трещины и пятна, или оставить как есть?"
    Ответ: Чистить обязательно!
    Иначе Лора научится рисовать артефакты — трещины, царапины, пятна.

    Что делать:

    Лёгкая реставрация перед обучением (можно через автоматические скрипты типа Topaz AI, или ручками в фотошопе);

    Сохранить исходный свет и черты лица, но без грязи.
  • Вопрос: "Если я собрал датасет, где половина изображений в стиле 3D-рендера (Blender), а половина в стиле рисованной графики — это норм? Или надо тренить отдельно?"
    Ответ: Надо отдельно.
    3D и рисованная стилистика — разные особенности.
    Лучше собрать:

    одну Лору на 3D-шную стилизацию;

    вторую — на рисованную.

    Потом в генерации можно будет их миксить вручную.
  • Вопрос: "Привет всем. А можно ли сделать LoRA на персонажа по гифкам или коротким видео? Там много похожих кадров, не будет ли переобучения?"
    Ответ: Можно, но есть нюансы:

    Выбирай разные кадры, а не все подряд;

    Убирай дубли и почти идентичные кадры, иначе будет overfit.

    Я обычно из гифки беру 5–10 кадров максимум на весь датасет.

    И да, не забудь про нормальное разрешение — с гифок часто качество ужас.
  •  

  • Вопрос: "Привет! Кто сталкивался: если в датасете есть фото с разной глубиной резкости (где-то всё в фокусе, где-то только лицо, фон размыт), это мешает обучению Лоры или помогает?"
    Ответ: Это даже помогает!

    Разная глубина резкости учит модель работать в разных условиях;

    Только старайся, чтобы главное — лицо было в фокусе.

    Если фон в расфокусе — ок.
    Если лицо — мыло — выкидывай такое фото сразу.
  • Вопрос: "У меня вопрос — можно ли тренить Лору, где один и тот же персонаж в разных формах (например, обычный человек и тот же человек в образе вампира)?"
    Ответ: Можно, но:

    Делай разные токены: <normal_hero> и <vampire_hero>;

    Не мешай фото без тегов, иначе перемешаются черты.

    Я делал лору с "обычным рыцарем" и "проклятым рыцарем" — токены спасли проект.
  • Вопрос: "Коллеги, а если в датасете есть фотки, где половина лица в тени — стоит ли их оставить или убрать? Свет падает так, что видно только одну сторону лица."
    Ответ: Смотря сколько их.

    Пара штук — можно оставить для разнообразия;

    Много — лучше убрать.

    Идеально, когда основная черта лица читается, даже если освещение сложное.
    В темноте вообще лучше не тренить.
  • Вопрос: "Подскажите, если хочу сделать LoRA чисто для профиля (вид сбоку) — нужно ли включать обычные фронтальные фото тоже?"
    Ответ: Если цель — строго профиль, то фронтальные фото не нужны.
    В идеале:

    Все кадры — в полупрофиль или полный профиль;

    Фон — нейтральный;

    Детализация лица максимальная.

    Тогда при генерации LoRA не будет "пытаться повернуть голову обратно".
  • Вопрос: "Ребят, кто-то обучал Лору на персонаже в очках и без?
    В датасете часть фото без очков, часть с. Не будет ли потом на генерации очки появляться через раз?"
    Ответ: Будут.
    Лора, увидев очки на половине фото, начнёт "гадать" при генерации.
    Лучший способ:

    Два датасета: hero_with_glasses и hero_without_glasses;

    Или разные триггеры в промпте.

    Тогда сможешь контролировать появление очков.
  • Вопрос: "Всем привет! А кто-нибудь пробовал делать датасет, где персонаж на части фото с разной выраженностью мимики?
    Хочу чтобы Лора потом могла варьировать выражение лица — стоит так делать?"
    Ответ: Это отличный подход.
    Важно только:

    Стараться держать больше нейтральных лиц в датасете (штук 20–30);

    И добавить 5–10 фото с выраженной мимикой: улыбка, удивление, злость.

    Тогда Лора сможет потом правильно "отыгрывать" эмоции через промпт.
  • Вопрос: "Кто обучал Лору, где у персонажа есть на фото разные аксессуары типа шляпы, серьги, колье — как это потом влияет? Не налепит ли Лора случайно украшения там, где их быть не должно?"
    Ответ: Если аксессуаров много и хаотично — будет лепить их где попало.
    Чтобы контролировать:

    Делать разные токены (with_earrings, without_accessories);

    Или в датасете отделить кадры с аксессуарами в отдельные папки.

    Чем чище датасет — тем меньше сюрпризов на выходе.
  • Вопрос: "Коллеги, вопрос: если хочу обучить Лору на изображениях персонажа в различных освещениях — от яркого полуденного до лампы ночью — это увеличит её универсальность или запутает?"
    Ответ: Увеличит!
    Разные типы света помогают Лоре адаптироваться к условиям промпта.
    Только правило:

    Лицо должно быть видно всегда;

    Избегать экстремальных пересветов и полного чёрного провала.

    Я всегда делаю несколько серий: день, вечер, лампа, пасмурный день.
  • Вопрос: "Если на фото персонажа иногда видны руки (жесты) — стоит ли включать такие фото в датасет?
    Хочу, чтобы Лора потом не ломала кисти."
    Ответ: Стоит, обязательно.
    Фото с руками помогают Лоре понимать пропорции тела.
    Только:

    Кисти должны быть отчётливо видны;

    Без перекрученных пальцев и артефактов.

    И не переборщи: 20–30% датасета с руками — за глаза.
  •  

  • Вопрос: "Привет всем! Такой вопрос: если у персонажа на фото частично закрыто лицо волосами или капюшоном, стоит ли такие кадры оставлять для обучения LoRA?"
    Ответ: Осторожно с этим.

    Пара таких фото в датасете окей — учит гибкости;

    Но если половина лиц прикрыта — Лора начнёт генерировать тени, пятна или искажения.

    Лучше аккуратно балансировать: 90% открытых лиц, 10% — частично закрытых.
  • Вопрос: "Есть датасет с персонажем в движении (бег, прыжки).
    Стоит ли включать такие фото? Или лучше брать только статичные кадры?"
    Ответ: Включать можно, но осторожно:

    Только если основные черты лица чётко читаются;

    Без экстремальных размытиев.

    Бег и прыжки полезны для общей динамики поз, но Лора иногда потом начинает кривить руки и ноги, если в обучении было много размытых кадров.
  • Вопрос: "Ребят, кто обучал LoRA на кадрах с анимационных фильмов или мультфильмов?
    Надо ли что-то специальное учитывать в датасете, кроме разрешения?"
    Ответ: Да, есть нюансы:

    Анимационные кадры часто переэкспонированы или зашумлены — фильтруй аккуратно;

    Делай упор на чёткие силуэты;

    И следи за чистотой фона, чтобы Лора не тащила цветовые шумы на лица.

    Если сцены разные по стилю (разные аниматоры) — лучше разбить на несколько мини-датасетов.
  • Вопрос: "Собираю датасет для LoRA: у персонажа в половине случаев разные выражения лица — смех, злость, грусть.
    Может это запутать модель? Или стоит постараться оставить нейтральные выражения?"
    Ответ: Лёгкие эмоции — хорошо.
    Но:

    Лучше, чтобы основа датасета — нейтральные лица (спокойная мимика);

    Эмоции — добавлять до 20–25% от общего числа кадров.

    Иначе модель может начать лепить непредсказуемые выражения даже без запроса в промпте.
  • Вопрос: "Скажите, если в датасете часть изображений горизонтальные, а часть вертикальные, нужно ли их приводить к единому формату (всё квадратное, например)? Или это не критично?"
    Ответ: Лучше привести к единому формату.

    Квадрат 512x512 или 768x768 — универсальный формат;

    Горизонтали/вертикали иногда портят восприятие композиции при генерации.

    Сам всегда перед обучением прогоняю через скрипт автокропа и ресайза.
  • Вопрос: "Может кто сталкивался — если в датасете иногда меняется яркость кожи (например, на улице бледнее, в помещении теплее) — это плохо для обучения лоры? Или наоборот даёт устойчивость?"
    Ответ: Наоборот, это хорошо.

    Разная освещенность помогает Лоре не залипать в одном цветовом профиле;

    Но! Следи, чтобы не было пересвеченных кадров или провалов в тенях.

    В генерации потом проще будет управлять сценой через промпт.
  • Вопрос: "Если часть фото в датасете — с улыбкой в зубы, а часть — без улыбки, это не будет мешать потом при генерации нейтральных лиц?"
    Ответ: Не критично, если:

    Улыбающиеся фото — не больше 20–30% датасета;

    Основная масса — спокойные лица.

    И тогда можно будет через промпт явно вызывать эмоцию (smiling, serious face).
  • Вопрос: "Делал LoRA на основе фотографий, где у модели на части фото была борода, на части — без бороды.
    В итоге в генерациях иногда получалась странная 'полу-борода'. Как избежать такого?"
    Ответ: Надо было:

    Делать разные токены (with_beard, without_beard);

    Или в датасете строго разделить фото с бородой и без.

    Лора запоминает даже малейшие отличия, и если не подсказать явно — мешает черты.
  • Вопрос: "Хочу собрать датасет на персонажа в зимней одежде (шапка, шарф).
    Стоит ли миксовать зимние и летние образы в одном наборе? Или лучше отдельно тренировать?"
    Ответ: Отдельно.

    Зима — один датасет;

    Лето — второй.

    Иначе начнётся каша: в генерации можешь получить персонажа в шапке летом или в майке на фоне снега.

    Лучше потом миксовать через промпты, если надо.
  •  


  • Вопрос: "Скажите, пожалуйста, если часть фоток персонажа сделана со вспышкой, а часть при естественном свете — стоит их смешивать в одном датасете или нет? Будет ли это плохо влиять на обучение?"
    Ответ: Смешивать можно.
    Вспышка = другое освещение, и это только увеличит обобщаемость модели.
    Главное — следить, чтобы:

    На фото со вспышкой не было жёстких теней, убивающих лицо;

    И чтобы все основные черты были отчётливо видны.
  • Вопрос: "Можно ли использовать фото, где персонаж в солнечных очках, для обучения обычной LoRA? Или это будет мешать генерации нормальных лиц?"
    Ответ: Лучше избегать.
    Фото в тёмных очках:

    Убивают видимость глаз;

    Потом Лора рисует странные пустые глазницы 😁

    Если хочешь, чтобы персонаж носил очки по желанию — тренируй отдельную Лору на образ с очками.
  • Вопрос: "Всем доброго дня! Как поступить: если лицо персонажа на фото покрыто лёгкой сеткой тени от листьев/решётки?
    Это норм или надо такие фото удалить?"
    Ответ: Лёгкие тени окей, но:

    Если сетка слишком чёткая, Лора потом начнёт "штамповать" такие сетки на всём.
    Совет: если сомневаешься — лучше убрать.

    И обязательно убирать фото, где лицо полностью пересекается тенями.
  • Вопрос: "Кто обучал LoRA на фото, где фон размытый (эффект боке)?
    Стоит ли включать такие кадры, или только с чётким фоном?"
    Ответ: Боке — это прекрасно для LoRA.

    Лицо выделяется;

    Фон не лезет в композицию.
    Главное — чтобы лицо оставалось в фокусе.

    Самые идеальные датасеты — это портреты с хорошим боке.
  • Вопрос: "Если есть фото, где лицо персонажа с небольшой долей поворота (например, взгляд в сторону) — стоит их включать в датасет, или только прямой взгляд?"
    Ответ: Включать обязательно.

    Разные углы взгляда помогают Лоре понимать трёхмерность объекта.
    Иначе потом будет рисовать всё время прямой взгляд без динамики.
  • Вопрос: "Кто пробовал — если есть фотки с лёгкими цифровыми шумами (особенно вечерние съёмки), стоит ли их чистить перед обучением? Или можно оставить?"
    Ответ: Лучше чистить.

    Шум учится вместе с изображением;

    Потом Лора будет давать на лице зернистость даже при хорошем свете.

    Прогон через Denoise типа Topaz или через Photoshop Camera Raw помогает.
  • Вопрос: "Привет! Скажите, можно ли комбинировать фото из реальной жизни и 3D-рендеры в одном датасете для одной LoRA? Например, реальные лица + лица из Daz3D?"
    Ответ: Нежелательно.
    Реальные фото и 3D — разные по стилю:

    Разные текстуры кожи;

    Разная детализация теней.

    Лучше либо учить отдельно, либо всё реальное в один датасет, всё 3D — в другой.
  • Вопрос: "А если я хочу, чтобы Лора потом хорошо рисовала персонажа на разных фонах (город, парк, интерьер) — нужно ли специально в датасет добавлять разные задники?"
    Ответ: Да, фон влияет.

    Набери хотя бы 5–6 разных фоновых окружений;

    Но не перегибай — основной акцент всё равно должен быть на персонаже.

    Потом в генерации легче будет через промпты регулировать (background: cityscape, background: park).
  • Вопрос: "Если хочу сделать Лору на старые ч/б фото, стоит ли перед обучением колоризовать их через нейросеть? Или лучше учить как есть в ч/б варианте?"
    Ответ: Лучше учить как есть.

    Колоризация добавит искусственные артефакты;

    В ч/б Лора будет крепче запоминать формы и светотени, а не цвета.

    Потом в генерации легко переключиться на black and white photo через промпт.
  • Вопрос: "Планирую сделать Лору персонажа с необычными глазами (например, кошачий зрачок, светящиеся глаза).
    Нужно ли акцентировать внимание в датасете именно на этих чертах?"
    Ответ: Да, обязательно.

    Чем больше фото с акцентом на глаза, тем лучше закрепится паттерн.

    Желательно 50–70% датасета посвятить кадрам, где глаза чётко видно.

    И в промпте потом обязательно прописывать cat-like eyes или glowing eyes.
  •  

  • Вопрос: "Ребят, а стоит ли в датасет для LoRA включать фото, где персонаж в очках отражается в зеркале?
    Там же дублируется лицо."
    Ответ: С зеркалами лучше аккуратно.

    Если отражение чёткое и лицо читается — оставлять можно.

    Если отражение смазано, раздвоено или сильно искажено — лучше выкинуть.
    Иначе Лора потом начнёт "лепить двойные лица".
  • Вопрос: "Всем привет! Вопрос: если в кадре есть сильный градиентный свет (например, лицо наполовину освещено холодным светом, наполовину тёплым), это нормально для обучения LoRA?"
    Ответ: В целом нормально, если:

    Лицо всё равно хорошо видно;

    Контраст не убивает черты.

    Но если на половине лица резкая синяя полоса — лучше убрать.
  • Вопрос: "Можно ли собирать датасет из фотографий одного человека, но в разных возрастах — например, 18 лет, 30 лет, 50 лет? Или лучше для каждого возраста делать отдельную Лору?"
    Ответ: Лучше разделить по возрастам.
    Лора запоминает образ целиком — если намешаешь, будут странные лица: молодое тело со старыми глазами.

    Делай отдельные LoRA на 18 лет, 30 лет и так далее — будет стабильнее.
  • Вопрос: "А если у меня есть персонаж в разных стилях рисовки (например, аниме и более реалистичная стилизация) — стоит ли это смешивать в одном датасете?"
    Ответ: Не стоит.

    Разные стили — разная текстура, разные пропорции.
    Лучше собрать отдельные датасеты по стилям и обучить отдельные LoRA.

    Потом можно миксовать их при генерации.
  • Вопрос: "Кто-то пробовал использовать сканы бумажных фото для обучения LoRA? Есть старые альбомы, хочу попробовать. Но боюсь, что качество не подойдёт."
    Ответ: Можно, но:

    Сканы должны быть чистыми и отретушированными (без пятен, царапин);

    Лучше заранее прогнать через реставраторы типа Topaz или ручную чистку.

    Иначе артефакты пойдут в генерацию.
  • Вопрос: "Планирую собрать датасет для LoRA персонажа с нестандартными цветами кожи (например, синий, зелёный).
    Нужно ли делать баланс с нормальными оттенками, или только фэнтезийные?"
    Ответ: Если цель — чётко фэнтези, тогда весь датасет должен быть в одном цветовом стиле.
    Иначе модель будет путать палитры.

    Лучше 100% зелёные или синие оттенки кожи для такого персонажа.
  • Вопрос: "А кто обучал LoRA, где часть датасета была в формате скриншотов из видео?
    Есть ли нюансы с таким материалом?"
    Ответ: Скриншоты окей, если:

    Кадры выбраны вручную, без размытия движения;

    Разрешение нормальное, а не 480p пиксельное месиво.

    И обязательно чистить шум и компрессию.
  • Вопрос: "Всем привет! А имеет ли смысл добавлять в датасет кадры, где персонаж не смотрит в камеру, а в сторону, вниз, вверх?"
    Ответ: Обязательно!

    Иначе потом в генерации всё время будет прямой взгляд.

    Разнообразие поз и направлений взгляда очень важно для живости картинки.
  • Вопрос: "Скажите, а имеет ли смысл добавлять кадры в движении, если планирую обучать LoRA на персонажа в динамике (например, танцы, спорт)?"
    Ответ: Да, если:

    Лицо чётко видно;

    Нет сильного смаза.

    Тогда при генерации позы будут выглядеть более естественно, а не как деревянные марионетки.
  •  

  • Вопрос: "Привет! Хочу сделать LoRA на персонажа, где в части фото он в наушниках. Будет ли это мешать? Наушники не всегда большие, но иногда прям в кадре."
    Ответ: Будет мешать, если:

    В половине фото уши закрыты, а в другой — открыты.
    Потом Лора может дорисовать "ошибочные" формы уха или прилепить наушники, даже если ты не просишь.

    Лучше:

    Или весь датасет с наушниками,

    Или вообще без них.
    Либо два датасета + разные токены.
  • Вопрос: "Ребят, если у меня в датасете есть немного фото с фоном из интерьера (мебель, лампы), а остальные — на нейтральном фоне, это ок? Или интерьер лучше убрать?"
    Ответ: Если этих интерьеров немного — норм.
    Но следи, чтобы фон не перетягивал внимание на себя.

    Иногда LoRA потом начинает дорисовывать кресла или полки.
    Лучше чистый, неяркий фон, особенно если фокус на лице.
  • Вопрос: "Собираю датасет с персонажем в движении, есть кадры с выраженными жестами — пальцы в разные стороны, рука на груди и т.п.
    Такие фото оставлять или лучше урезать?"
    Ответ: Оставлять!

    Чем больше жестов, тем естественнее руки будут потом.
    Но важно:

    Жесты должны быть понятные, без перекрутов и смаза.

    Желательно 20–30% от датасета.

    Иначе будет "расплывающаяся" анатомия.
  • Вопрос: "Если персонаж в разных кадрах улыбается, а в некоторых — с закрытым ртом, стоит ли делать разные токены или это и так нормально сработает?"
    Ответ: Обычно норм.
    Но если ты хочешь управляемость (чтобы явно включать/выключать улыбку) —

    Делай разные теги: <smile>, <neutral_face>.

    Тогда в генерации будет больше контроля.
    Без этого — Лора просто усреднит мимику.
  • Вопрос: "Есть серия фото, где персонаж в очках с прозрачными стёклами. На части фото бликует линза. Это критично? Или можно оставить?"
    Ответ: Прозрачные очки — отдельная головная боль 😅

    Если бликует сильно — лучше убрать такие кадры.

    Если линза чистая и видно глаза — можно оставить.

    Но помни: даже пара "плохих" бликов может испортить всю генерацию.
  • Вопрос: "Всем привет! А если в датасете есть фото с глубокой тенью под носом (например, лицо сверху вниз освещено), это сильно испортит обучение?"
    Ответ: Зависит от количества.

    1–2 фото — ок.

    10+ — модель может начать рисовать "грязь" под носом.

    В идеале — освещение ровное, либо мягкий контровой свет.
    Глубокие тени — лучше выкидывать.
  • Вопрос: "Есть серия фото, где персонаж слегка прищурен (не эмоция, просто свет яркий). Будет ли это сбивать Лору или норм?"
    Ответ: Это норм.

    Прищур — естественная вещь, помогает вариативности взгляда.
    Только смотри, чтобы глаза всё равно читались.

    Если глаза совсем закрыты — лучше убрать.
  • Вопрос: "Хочу сделать LoRA на персонажа, у которого часто виден язычок (например, при приоткрытом рте, в улыбке).
    Надо ли специально фокусироваться на таких фото или этого будет достаточно в 2–3 кадрах?"
    Ответ: Если хочешь управлять языком — делай:

    Не меньше 5–7 фото, где язык явно виден.

    И токен типа <tongue_out>.

    Без этого он будет появляться рандомно и неуправляемо.
  • Вопрос: "Можно ли в датасете использовать фото с разной дистанцией съёмки — где-то лицо крупно, где-то почти по пояс? Или всё надо приводить к одному масштабу?"
    Ответ: Наоборот — отлично!

    Такая вариативность даёт больше контроля в генерации.
    Главное:

    Не перегибай — если 90% будет "по пояс", лицо начнёт размываться.
    Лучше: 70% крупный план, 30% средний.
  •  

  • Вопрос: "Коллеги, а кто пробовал тренировать LoRA, где на части фото персонаж слегка приподнимает бровь? Это норм? Или такие мимические вариации надо вычищать?"
    Ответ: Наоборот, такие детали обогащают датасет.
    Приподнятая бровь, лёгкий наклон головы, мимика — всё это даёт Лоре живость.
    Главное:

    Чтобы глаза были симметричны;

    И чтобы кадры с "особенностями" не превышали 20–25% датасета.
  • Вопрос: "Можно ли добавлять фото, где персонаж в полутьме (например, на фоне огня или заката), если лицо при этом не очень хорошо видно?"
    Ответ: Только если лицо всё равно читается.

    Эффекты типа пламени/заката могут быть полезны для художественного LoRA;

    Но если лицо "утонуло в тени" — лучше не рисковать.

    Есть риск, что Лора потом начнёт "гореть" или затемнять морду 😄
  • Вопрос: "Привет! Кто пробовал использовать для LoRA фото, где персонаж частично повёрнут спиной (вид на затылок, волосы и т.д.) — это имеет смысл?"
    Ответ: Да, но таких фото должно быть мало — 2–3 штуки максимум.
    Они нужны, если хочешь управляемость типа back view.
    Но без токена — Лора может начать лепить затылок спереди 😬
  • Вопрос: "А если на некоторых фото персонаж прикасается рукой к лицу (например, подбородок или щека), это критично? Или нормальный элемент для датасета?"
    Ответ: Нормально, если:

    Рука не перекрывает лицо полностью;

    Пальцы чёткие, а не смазанные.
    Такие кадры придают выразительность, и Лора учится понимать анатомию в контакте.
  • Вопрос: "Есть идея: сделать LoRA, где персонаж на всех фото с микрофоном. Цель — получить потом сцены 'поёт на сцене'. Нужно ли, чтобы микрофон был в каждом кадре, или достаточно половины?"
    Ответ: Если хочешь, чтобы микрофон был всегда — тогда почти на всех кадрах он должен быть.
    Лучше даже:

    80% с микрофоном;

    20% — нет, для баланса.
    И не забудь токен типа <with_mic>, чтобы потом можно было переключаться.
  • Вопрос: "Можно ли использовать фото с телефона, если они уже прошли автоматическую постобработку (резкость, насыщенность)? Или лучше искать 'сырой' материал?"
    Ответ: Лучше сырой.

    Постобработка часто добавляет контуры, которые неестественны;

    Особенно опасен автошарп, он "ломает" черты лица.
    Прогон через denoise и лёгкий blur поможет, но лучше искать оригиналы.
  • Вопрос: "А кто пробовал обучать LoRA, где персонаж в кадре с домашним животным? Хочу, чтобы потом появлялся кот на плече. Нужно ли включать таких фото?"
    Ответ: Да, если кот — важный элемент.

    Должен всегда сидеть в одном месте (например, на плече);

    Не должно быть "половина фото с котом, половина без" — иначе будет мешать.
    Делай отдельный токен <cat_on_shoulder> и будет счастье 😺
  • Вопрос: "Есть несколько фото, где персонаж ест/пьёт. Рот открыт, поза необычная. Это мешает или может быть полезно?"
    Ответ: Это зависит от цели.

    Для стандартной LoRA на портрет — выкидывай;

    Если хочешь контекстную генерацию, где персонаж ест/пьёт — оставь и введи токен (<eating>, <drinking>).
    Но главное — не включай такие фото "впопыхах", они должны быть чёткие и стабильные.
  • Вопрос: "Можно ли обучать LoRA по кадрам, где персонаж в очках на фоне зеркала, и видно 'два лица'? Или это точно в корзину?"
    Ответ: 95% — в корзину.

    Если отражение чёткое — ещё можно подумать;

    Но Лора может научиться дублировать глаза или рот.
    Лучше не рисковать — такие кадры идут в 'исключения с фильтром'.
  • Вопрос: "Хочу сделать LoRA, где персонаж часто наклоняет голову вбок. Нужно ли делать 90% таких наклонённых кадров или хватит пары для паттерна?"
    Ответ: Если ты хочешь, чтобы это была "фишка персонажа" —

    Да, 60–70% наклонённых кадров.

    Остальные — обычные, чтобы не было переобучения.
    Это работает как узнаваемый жест или привычка — Лора это уловит.
  •