у меня 32 видеопамяти, а вот потоками пока не разобрался, за...

у меня 32 видеопамяти, а вот потоками пока не разобрался, завтра протестирую


Оригинал в Telegram · @GipsoCartoon

та да, заметил это))
но тут гемма 4 31б тоже думает как не в себя при обычном привет)


Оригинал в Telegram · @GipsoCartoon

Нынче почти все модели умеют в MoE и не сильно падают в скорости, если часть экспертов выгружается в обычную рам. Так что небольшое превышение размера модели над vram не особо страшно.


Оригинал в Telegram · @Valera0007