Ошибки fp16/bf16 в LoRA-тренинге — отладка градиентов

Автор Mikhail_89, Апр. 20, 2025, 08:58

« назад - далее »
Trainer падает при mixed precision (bf16) — как отладить stepwise overflow?
  •