Глоссарий Терминов Stable Diffusion

Автор admin, Апр. 26, 2025, 14:09

« назад - далее »
A

After Detailer — расширение, которое "спасает" лица на сгенерированных изображениях. Как пластический хирург, но дешевле и без боли. 
Примеры: "Запустил After Detailer на портрете, и глаза перестали смотреть в разные стороны", "Благодаря After Detailer зубы персонажа больше не выглядят как у акулы-мутанта".





Automatic1111 — популярный интерфейс для SD, созданный таинственным разработчиком. Как швейцарский нож для генерации – много функций, но в инструкции не разберешься. 
Примеры: "Установил Automatic1111 и затерялся в настройках на неделю", "В Automatic1111 есть функции, о которых даже разработчик, возможно, не помнит".





Aspect Ratio — соотношение сторон изображения. Как формат фотографии: квадрат, альбомный или портретный — от этого зависит композиция. 
Примеры: "Для портретов лучше использовать aspect ratio 2:3", "SD хуже работает с экстремальными aspect ratio, такими как 1:4".





B

Batch size — количество изображений, генерируемых за один запуск. Как испечь несколько печенек вместо одной, но духовка может взорваться. 
Примеры: "Установил Batch size = 4 и моя 3060 запросила последнее желание", "С Batch size = 1 генерация медленная, но хотя бы компьютер не пытается взлететь".





Batch count — количество партий изображений для генерации. Для тех, кому мало одной порции боли. 
Примеры: "Запустил Batch count = 10 перед сном и проснулся от звука вентиляторов", "Установил Batch count = 5, а потом забыл о генерации и ушел на работу".





Blur — эффект размытия, часто нежелательный в генерации. То, что случается, когда нейросеть не уверена, что рисовать, и просто "замазывает" проблему. 
Примеры: "Получил размытый фон вместо детализированного леса", "В Negative Prompt всегда пишу 'blurry', но SD притворяется, что не видит этого слова".





Checkpoint — сохраненное состояние обученной модели, файл весом в несколько гигабайт. Коллекционеры чекпойнтов быстро узнают, что такое "нет места на диске". 
Примеры: "Скачал новый чекпойнт для фотореализма, но забыл название и теперь у меня папка 'test123'", "Собрал 50 чекпойнтов, а использую всегда один и тот же".





CFG Scale — параметр, контролирующий, насколько точно SD следует промпту. Как поводок для собаки: слишком слабый — убежит, слишком тугой — задушит креативность. 
Примеры: "При CFG = 2 получил красивую картинку, никак не связанную с промптом", "CFG = 15 выдал точно то, что просил, но выглядит как плакат из 80-х".





C

ComfyUI — интерфейс с нодовой системой для SD. Похож на схему метро, нарисованную сумасшедшим ученым. Новички плачут, профи не могут остановиться добавлять ноды. 
Примеры: "Собрал в ComfyUI схему из 50 нод для генерации одного портрета", "Мой граф в ComfyUI настолько сложный, что я делаю скриншоты на случай сбоя".





Canny — алгоритм обнаружения краев, используемый в ControlNet. Превращает изображения в набор линий, как если бы их рисовал напуганный человек с карандашом. 
Примеры: "Пропустил фото через Canny и получил контуры, похожие на кардиограмму", "ControlNet с Canny отлично работает, если вам нравится эстетика чертежей".





CUDA — технология от NVIDIA для параллельных вычислений на GPU. Магическое слово, которое либо решает все проблемы, либо становится источником новых. 
Примеры: "Обновил CUDA драйверы и SD заработал в 2 раза быстрее", "Получил 'CUDA out of memory' и начал гуглить, сколько стоит почка для покупки RTX 4090".





ControlNet — расширение для контроля генерации с помощью дополнительных изображений. Как детальный чертеж для строителей, которые всё равно сделают по-своему. 
Примеры: "Использовал ControlNet с OpenPose, чтобы персонаж наконец перестал выглядеть как осьминог", "ControlNet с depth map помог создать правильную перспективу, хотя руки всё равно странные".





CodeFormer — модель для улучшения лиц на изображениях. Как цифровой визажист — улучшает черты, но с настраиваемой степенью вмешательства. 
Примеры: "CodeFormer с параметром 0.8 улучшает лица, сохраняя индивидуальность", "В отличие от GFPGAN, CodeFormer позволяет настраивать баланс между деталями и идеализацией".
  •  

C

Context — окружение и условия, влияющие на интерпретацию промпта. Как обстановка, влияющая на восприятие шутки. 
Примеры: "Слово 'apple' в разном context может означать фрукт или технологическую компанию", "SD иногда теряет context длинных описаний, фокусируясь на отдельных словах".





Clip Skip — параметр, определяющий, сколько последних слоев CLIP модели пропустить. Как сокращение пути для художника, иногда дающее интересные результаты. 
Примеры: "Для аниме-моделей часто рекомендуют clip skip = 2", "Увеличение clip skip делает промпт менее буквальным".





D

Depth Map — карта, показывающая расстояние от камеры до объектов в сцене. Как рельефная карта для слепых, только для нейросети. 
Примеры: "Сгенерировал depth map, чтобы ControlNet не разместил стол на потолке", "Depth map помогает создать реалистичное пространство, где объекты не парят в воздухе".





DreamBooth — метод обучения модели на конкретных объектах или лицах. Как научить нейросеть узнавать вашу собаку, пока она не начнет её видеть во всём. 
Примеры: "Обучил DreamBooth на фото моего кота, теперь он появляется даже в пейзажах", "DreamBooth требует много VRAM и терпения, но потом можно генерировать себя в любой ситуации".





Dynamic Prompts — расширение для автоматической генерации вариаций промптов. Как игра в "испорченный телефон", только с изображениями. 
Примеры: "Настроил Dynamic Prompts и получил 50 вариаций одного портрета с разными прическами", "В Dynamic Prompts использую синтаксис {красный|синий|зеленый} для быстрого перебора цветов".





DDIM (Denoising Diffusion Implicit Models) — сэмплер для Stable Diffusion. Как шеф-повар, который готовит медленно, но результат стоит ожидания. 
Примеры: "DDIM дает стабильные результаты при высоких шагах сэмплирования", "Использую DDIM, когда нужна предсказуемость, а не скорость генерации".





DPM++ 2M Karras — продвинутый сэмплер для SD. Звучит как название космического корабля, а работает как хороший бариста — быстро и качественно. 
Примеры: "DPM++ 2M Karras дает отличные результаты даже при 20 шагах", "Перешел на DPM++ 2M Karras и забыл о проблемах с детализацией".





Denoising — процесс удаления шума при генерации изображения. Как реставрация старой картины, постепенно открывающая оригинал. 
Примеры: "Denoising проходит через заданное количество шагов, постепенно проявляя изображение", "Высокий denoising strength в img2img может полностью изменить исходное изображение".





Denoising strength — параметр, определяющий степень изменения исходного изображения. Как сила растворителя — чем выше, тем больше стирается оригинал. 
Примеры: "При denoising strength = 0.3 сохраняется композиция оригинала", "Для полного изменения стиля используйте denoising strength выше 0.7".





Dataset — набор данных для обучения модели. Как учебник для студента — качество образования зависит от качества материала. 
Примеры: "Собрал dataset из 100 фотографий своего кота для обучения LoRA", "Качество и разнообразие dataset напрямую влияют на результаты обучения".





DiffusionBee — упрощенный интерфейс для SD, ориентированный на Mac. Как отвертка для забивания гвоздей — не идеально, но если другого нет, то сойдёт. 
Примеры: "DiffusionBee позволяет запускать SD на Mac без сложных настроек", "DiffusionBee работает даже на Apple Silicon без дополнительных драйверов".





E

Embedding — векторное представление концепций в модели. Как обучить попугая новому слову, только для AI. 
Примеры: "Создал embedding для стиля 'киберпанк-барокко' на основе 10 изображений", "Textual Inversion генерирует embedding-файлы весом всего в несколько килобайт".





Euler — простой сэмплер для SD. Как велосипед среди спорткаров — простой, надёжный, но без изысков. 
Примеры: "Euler работает быстрее других сэмплеров, но детализация хромает", "Для быстрых тестов использую Euler с 15–20 шагами".





Euler a — улучшенная версия сэмплера Euler. Как велосипед, но с мотором — быстрый и достаточно хороший для большинства задач. 
Примеры: "Euler a даёт отличный баланс между скоростью и качеством", "Большинство моих генераций делаю на Euler a с 30 шагами".
  •  

E

Extensions — дополнительные модули для расширения функционала интерфейсов SD. Как плагины для браузера: начинаешь с одного, заканчиваешь с пятьюдесятью. 
Примеры: "Установил расширение для апскейлинга и теперь генерирую изображения 4K", "Мой WebUI еле запускается из-за количества установленных extensions".





ESRGAN — технология для увеличения разрешения изображений. Как микроскоп, который не только увеличивает, но и додумывает детали. 
Примеры: "Увеличил портрет с помощью ESRGAN и обнаружил детали, которых не было в оригинале", "4x-UltraSharp использует ESRGAN для создания детализированных текстур".





F

Face Restoration — технология улучшения лиц на изображениях. Как макияж для нейросетевых лиц, который иногда делает только хуже. 
Примеры: "Включил Face Restoration и лицо стало похоже на восковую фигуру", "CodeFormer при значении 0.8 делает лица более реалистичными, не превращая их в куклы".





Finetune — процесс дообучения модели на новых данных. Как учить старую собаку новым трюкам, требует терпения и GPU. 
Примеры: "Сделал finetune модели на аниме-стиль и теперь все мои генерации выглядят как кадры из мультфильма", "Процесс finetune на персональном датасете занял 8 часов на RTX 3090".





Forge — альтернативный интерфейс для SD. Как новый ресторан в городе — многообещающий, но ещё не все о нём знают. 
Примеры: "Forge предлагает более современный UI, чем Automatic1111", "Перешел на Forge из-за лучшей поддержки SDXL".





Face Swap — техника замены лица на изображении. Как маска на карнавале, только цифровая и более реалистичная. 
Примеры: "С помощью face swap поместил свое лицо на персонажа фэнтези", "Хороший face swap должен учитывать освещение и ракурс для естественного результата".





G

Guidance Scale — то же, что и CFG Scale. Сила, с которой текстовое описание направляет генерацию. Как гравитация: слишком слабая — улетит, слишком сильная — сплющит креативность. 
Примеры: "При guidance scale = 10 изображение точно соответствует промпту, но выглядит неестественно", "Для художественных работ предпочитаю guidance scale в районе 7".





GPU (Graphics Processing Unit) — видеокарта, основной рабочий инструмент для SD. Как сердце системы, только горячее и дороже. 
Примеры: "RTX 3060 с 12 ГБ VRAM позволяет генерировать изображения до 1024x1024", "Купил RTX 4090 специально для SD и теперь ем доширак до конца месяца".





Google Colab — облачный сервис для запуска Jupyter Notebook с доступом к GPU. Как общественный транспорт: бесплатно, но с ограничениями и иногда приходится стоять в очереди. 
Примеры: "Запускаю SD в Google Colab, когда жена работает на домашнем компьютере", "После 6 часов работы в Google Colab бесплатная GPU внезапно исчезла".





GFPGAN — модель для улучшения лиц, альтернатива CodeFormer. Как пластический хирург — делает лица более привлекательными, но иногда слишком стандартизированными. 
Примеры: "GFPGAN исправил асимметрию глаз, но лицо стало слишком гладким", "Эта модель особенно хороша для исправления сильно искажённых лиц".





H

HiRes Fix — техника генерации изображений высокого разрешения. Как двухэтапное блюдо: сначала основа, потом детализация. 
Примеры: "HiRes Fix позволяет получить чёткое изображение 2048x2048 без искажений", "Сначала генерирую в 512x512, затем применяю HiRes Fix до 1024x1024 для сохранения композиции".





Hypernetwork — метод настройки стиля в SD, предшественник LoRA. Как модный аксессуар для нейросети, который уже не так популярен, но всё ещё работает. 
Примеры: "Hypernetwork занимает больше места, чем LoRA, но даёт похожий результат", "Старые модели часто используют hypernetwork вместо более современных подходов".





Hires upscale — функция увеличения разрешения изображения после генерации. Как увеличительное стекло, которое не только увеличивает, но и дорисовывает детали. 
Примеры: "Применил hires upscale и превратил размытую картинку в произведение искусства", "При hires upscale с Denoising = 0.4 сохраняется основная композиция, но добавляются детали".
  •  

H

Hugging Face — платформа для обмена моделями машинного обучения, включая SD. Как GitHub для нейросетей — центральный репозиторий, где все делятся игрушками. 
Примеры: "Скачал модель с Hugging Face, специализирующуюся на пейзажах", "Hugging Face предоставляет API для интеграции моделей в свои проекты".





HSV (Hue/Saturation/Value) — цветовая модель, альтернатива RGB. Как палитра художника, позволяющая работать с оттенком, насыщенностью и яркостью отдельно. 
Примеры: "Изменение HSV параметров при обработке датасета улучшило результаты", "Модели часто лучше работают с определёнными диапазонами HSV".





I

Inpainting — техника замены части изображения. Как корректор для картинок — закрашивает ошибки и рисует заново. 
Примеры: "Использовал inpainting, чтобы заменить неудачно сгенерированную руку", "С помощью inpainting изменил прическу персонажа, не трогая остальное изображение".





Img2img — преобразование одного изображения в другое с помощью SD. Как переодевание для картинок: та же поза, но новая одежда. 
Примеры: "Через img2img превратил фотографию города в акварельную иллюстрацию", "Использую img2img с Denoising = 0.75, чтобы сохранить композицию, но изменить стиль".





InvokeAI — альтернативный интерфейс для SD. Как взрослый, ответственный брат Automatic1111 — меньше шума, больше стабильности. 
Примеры: "InvokeAI лучше работает на Mac с чипами Apple Silicon", "В InvokeAI более интуитивный интерфейс для новичков".





J

JPEG Artifacts — искажения в изображении из-за сжатия JPEG. Нейросеть их не любит так же, как вы не любите спойлеры. 
Примеры: "В negative prompt всегда добавляю 'jpeg artifacts', чтобы избежать блочных артефактов", "JPEG artifacts часто проявляются в виде странных квадратных паттернов на однотонных участках".





JSON — формат данных для хранения настроек и параметров. Как универсальный язык инструкций — простой и понятный для компьютеров и людей. 
Примеры: "Настройки WebUI хранятся в JSON файле", "Можно экспортировать параметры генерации в JSON для повторения результата".





K

Kohya_ss — набор инструментов для тренировки моделей SD. Как профессиональная кухня для обычного повара — много инструментов, много возможностей опозориться. 
Примеры: "Обучил свою LoRA с помощью Kohya_ss за 6 часов", "Интерфейс Kohya_ss требует времени на освоение, но даёт тонкий контроль над процессом обучения".





L

LoRA (Low-Rank Adaptation) — метод обучения небольших модулей, изменяющих стиль или добавляющих объекты. Как специи для еды: маленькие, но радикально меняют вкус. 
Примеры: "Подключил LoRA 'Киберпанк' с весом 0.8 и получил неоновый городской пейзаж", "Собрал коллекцию из 200 LoRA, но регулярно использую только 5".





LineArt — режим ControlNet для контроля по линейным рисункам. Как раскраска для взрослых: вы рисуете контуры, AI закрашивает. 
Примеры: "Нарисовал простой скетч, LineArt превратил его в детализированную иллюстрацию", "ControlNet с LineArt идеален для превращения набросков в готовые концепт-арты".





Lowvram — режим экономии видеопамяти в SD. Как диета для вашей видеокарты, позволяет работать даже на скромном оборудовании. 
Примеры: "Включил lowvram и смог запустить SD на старой GTX 1060 с 6 ГБ", "В режиме lowvram генерация медленнее, но хотя бы не вылетает с ошибкой CUDA".





Learning Rate — параметр, контролирующий скорость обучения модели. Как педаль газа: слишком быстро — разобьёшься, слишком медленно — никуда не приедешь. 
Примеры: "Оптимальный learning rate для обучения LoRA обычно составляет 1e-4", "Слишком высокий learning rate приводит к нестабильному обучению и плохим результатам".





Lexica — база данных промптов и сгенерированных изображений. Как поваренная книга с рецептами и фотографиями готовых блюд. 
Примеры: "На Lexica нашёл идеальный промпт для стиля киберпанк", "Lexica помогает понять, как формулировать промпты для желаемого результата".
  •  

M

Mask — чёрно-белая карта, определяющая, где модель должна что-то менять, а где оставить как есть. Цифровой скотч для нейросетевого ремонта. 
Примеры: "В inpaint загрузил mask — теперь только волосы меняются.", "С помощью mask можно заменить фон, не трогая лицо."





Masking — техника выделения областей изображения для селективной обработки. Как хирургическое вмешательство: воздействует только на нужную часть, оставляя остальное нетронутым. 
Примеры: "Создал маску вокруг лица для детализации только этой области", "С помощью masking можно заменить фон, не трогая основной объект".





Medvram — промежуточный режим оптимизации видеопамяти. Золотая середина между скоростью и потреблением ресурсов. 
Примеры: "Medvram позволяет работать с изображениями 1024x1024 на 8 ГБ VRAM", "В режиме medvram теряешь немного в скорости, но выигрываешь в стабильности".





Midjourney — конкурирующий с SD сервис для генерации изображений. Как iPhone в мире Android — закрытый, дорогой, но с отполированным результатом. 
Примеры: "Midjourney даёт более художественные результаты, но с меньшим контролем", "В отличие от SD, в Midjourney нельзя использовать собственные модели".





N

Negative Prompt — список запрещённых приёмов для нейросети. Цифровой эквивалент фразы "Чтобы я этого не видел!". 
Примеры: "Добавил 'mutated hands' в негативный промпт — пальцев стало меньше, но появились копыта", "Negative prompt: blurry — получил кристальную чёткость и артефакты в 4K".





Node-based — интерфейс, где всё собирается из кубиков, как Lego для параноиков. Визуальное оправдание для любителей усложнять простое. 
Примеры: "Потратил 3 часа на нодовый пайплайн для генерации котика", "Мой граф в ComfyUI напоминает схему квантового компьютера".





NSFW (Not Safe For Work) — это особый режим в мире Stable Diffusion, когда ваша нейросеть вдруг решает, что пора бы заняться "взрослым" творчеством. 
Пример: "Скачал NSFW-модель с CivitAI, отключил фильтр — теперь SD рисует такое, что даже браузер краснеет."





O

OpenPose — препроцессор ControlNet, который определяет позу человека на фото. Цифровой балетмейстер. 
Примеры: "С OpenPose персонаж наконец перестал стоять на голове.", "Использовал OpenPose — позы стали как в манге."





Outpainting — генерация продолжения за пределами холста. Нейросетевая версия "А что там за краем карты?". 
Примеры: "Дорисовал замку ещё три башни через outpaint", "После аутпейнтинга пейзаж обрёл новые горизонты и пару летающих коров".





Overfitting — когда модель запоминает датасет вместо обучения. Как студент, зубрящий билеты, но не понимающий предмета. 
Примеры: "Моя LoRA генерирует только мои селфи в шапке-ушанке", "Оверфиттинг превратил модель в фанатика одного стиля".





P

Post-processing — финальная полировка изображения. Макияж для нейрогенерации: может спасти или испортить. 
Примеры: "После постобработки в Photoshop руки стали пятипалыми", "Upscale + ретушь превратили пиксели в шедевр".





Prompt — текстовое описание желаемой картинки. Главный инструмент управления фантазией нейросети. 
Примеры: "Сформулировал prompt: 'cat in a spacesuit' — получил кота-космонавта.", "От prompt зависит, будет ли у персонажа три глаза или ни одного."





Preprocessor — модуль ControlNet, который превращает картинку в карты (контуры, depth и т.д.) для дальнейшей генерации. 
Примеры: "Выбрал preprocessor Canny — получил только линии.", "Preprocessor OpenPose нужен для работы с позами."





Q

Quality Tags — слова в prompt, обещающие сверхкачество: "ultra-detailed", "8k". Молитва перфекциониста. 
Примеры: "Добавил quality tags — картинка стала детальнее, но артефактов больше.", "'High quality' иногда работает, иногда просто игнорируется."
  •  

R

Real-ESRGAN — модель для апскейла, превращающая мыло в детали. Археолог пикселей, выкапывающий из шума потерянные детали. 
Примеры: "Real-ESRGAN оживил фото 1998 года, как будто снято вчера", "После апскейла увидел, что на старом фото в углу стоит динозавр".





Refiner — дополнительная модель для доработки результата (особенно в SDXL). Как второй художник, который подчищает за первым. 
Примеры: "SDXL Refiner убрал артефакты с лица.", "Refiner помогает довести портрет до ума."





S

Safetensors — формат файлов, где модели не шпионят за вами. Цифровой контейнер для параноиков. 
Примеры: "Конвертирую все чекпойнты в safetensors — мало ли что там в .ckpt зашито", "Безопасно, как шкаф с документами в банке, но для нейросетей".





Sampler — алгоритм, по которому модель "дорисовывает" изображение. Вариантов много, эффект — как у разных сортов кофе. 
Примеры: "Сменил sampler с DDIM на DPM++ — детализация выросла.", "Sampler Euler a даёт мягкие переходы, а DPM++ — резкие детали."





Seed — число, определяющее случайность генерации. Ваш "код повторяемости". 
Примеры: "Поставил seed 12345 — теперь могу повторить результат.", "С разным seed даже один prompt даёт разные картинки."





Steps — количество шагов генерации. Чем больше, тем детальнее, но дольше. Как варить борщ: можно и 10 минут, но вкуснее за час. 
Примеры: "Увеличил steps до 50 — картинка стала чётче.", "Мало steps — всё размыто, много — GPU задыхается."





Style Transfer — перенос стиля между изображениями. Художественный вирус, заражающий контент. 
Примеры: "Перенёс стиль Ван Гога на фото своей кошки", "После стиль-трансфера пицца выглядит как картина эпохи Возрождения".





T

Textual Inversion — обучение модели через ключевые слова. Обучение попугая новым фразам в масштабе нейросети. 
Примеры: "Создал текстовую инверсию для своего стиля 'пьяный акварель'", "Теперь по слову 'ВасяStyle' генерирует мои психоделические кошмары."





Tiled VAE — расширение для генерации больших изображений по частям. Как сшивать одеяло из лоскутков. 
Примеры: "Tiled VAE помогает делать постеры 4K без крашей.", "С Tiled VAE больше не боюсь лимита VRAM."





U

Upscale — увеличение разрешения с дорисовкой деталей. Как подслушивание нейросетью мыслей изображения. 
Примеры: "Апскейл 4x сделал из пиксельного человечка детализированного монстра", "После апскейлинга на фото проявилась тень несуществующего дерева."





V

VAE (Variational Autoencoder) — компонент модели, отвечающий за "воображение". Переводчик между миром латентных векторов и пикселей. 
Примеры: "Сменил VAE — цвета стали сочнее, но лица — страшнее", "Как будто поменял очки нейросети на новые линзы."





W

Wildcards — подстановочные символы в промптах. Лотерея, где вместо чисел — варианты описаний. 
Примеры: "Прописал 'color' в промпте и получил радугу случайностей", "Генерация с wildcards — как готовить суп из случайных ингредиентов."





X

XFormers — библиотека для ускорения работы моделей. Допинг для видеокарты: работает быстрее, но иногда с побочками. 
Примеры: "Включил XFormers — генерация ускорилась вдвое", "Без XFormers моя 1060 плавится, как мороженое на солнце."
  •