Google представила DiffusionGemma

ruzeynalov · 12.Июнь.2026 11:57:05

Зацените новость

https://ai.google.dev/gemma/docs/diffusiongemma

ruzeynalov · 12.Июнь.2026 11:58:23

Operating as a 26B total Mixture of Experts (MoE) model that activates only 3.8B parameters during inference, DiffusionGemma fits comfortably within 18GB VRAM limits of high-end dedicated consumer GPUs when quantized.

Оригинал в Telegram · @ruzeynalov

ruzeynalov · 16.Июнь.2026 04:02:35

Operating as a 26B total Mixture of Experts (MoE) model that activates only 3.8B parameters during inference, DiffusionGemma fits comfortably within 18GB VRAM limits of high-end dedicated consumer GPUs when quantized.

Оригинал в Telegram · @ruzeynalov

ruzeynalov · 16.Июнь.2026 04:03:05

В 4 раза быстрее чем обычная Gemma 4, при небольшой потери качества

Оригинал в Telegram · @ruzeynalov

freemars · 16.Июнь.2026 04:03:35

В 4? Мне кажется раз в 10
Сегодня в новостях смотрел что выдает 700 токенов/с на 5090

Оригинал в Telegram · @FreeMars

deniom3 · 16.Июнь.2026 04:04:05

Ну мое мтп это технологии сейчас самый топ среди локалок. Я вон так квен 3.6 35б мое запустил на 4070. Но там тогда все упирается в проц и скорость озу

Оригинал в Telegram · @deniom3