Гайд по запуску Hermes Desktop на Windows с локальными моделями

Если кто-то найдет способ запуска десктопа-вин с локальными приложениями или моделями, сделайте гайд. Хотя в топике там и не советуют пока ставить, но все равно интересно.


Оригинал в Telegram · @DepartmentX

Локальные модели очень медленно работают ((. Прям очень. У меня hermes стоял локально и субагенты использовали локальные модели для перевода с английского, качество норм в целом (но у меня целая команда с проверками), но сильно-сильно дольше. Правда у меня нет видео-памяти. И основная модель у координатора был облачный deep seek


Оригинал в Telegram · @GalaErsh

Ну на процессоре локалки гонять задача для очень неприхотливых людей


Оригинал в Telegram · @deniom3

Токенов 40 минималка нужна для работы агента


Оригинал в Telegram · @deniom3

Сам запустил агента


Оригинал в Telegram · @DepartmentX

меньше чем на сто я не согласен)))
И то это будут тормоза.


Оригинал в Telegram · @DepartmentX

Нвидия анонсировала чип который терабайтные модели может тянуть. Значит попроще модели сможет быстро молотить


Оригинал в Telegram · @RDirect

А цену объявили?) и память где брать на это?)


Оригинал в Telegram · @deniom3

Самого агента десктоп запустил, причем ничего не делал, просто удалил а потом решил последний раз проверить и сам агент заработал, все настройки есть, приложение обычное как у всех, все из конфига видно. Сама оллама с локальной моделью подключилась, НО ее нет в самих настройках и модель не выбирается. Сейчас нет времени, позже найду где прописать в кастом, наверняка найдется вариант или через Лмстудию или через опенроутер.


Оригинал в Telegram · @DepartmentX

Нвидиа сейчас бабло будет рубить и там платы по 10к долларов. Они единственные производители. Наша участь прошлое поколение


Оригинал в Telegram · @DepartmentX

Цены нет. А вообще вопрос неверно ставится. Работать захочешь не так раскорячишься. Чем дальше тем больше локальные модели становятся актуальнее. Тут вон последние два месяца волна “ой, мой антропик меня заблокировал. ой, с меня требуют смс на опенай а симки нет” А что будет через год?


Оригинал в Telegram · @RDirect

Смог подключить второй номер к ватсапу, чтобы hermes мог писать разным номерам и общаться за меня. Но проблема в том, что он не понимает что все в ватсапе - это чужие люди, и отчет о выполнении нужно писать мне в телеграм. Он все сообщения и логи начинает выводить в ватсап последнему собеседнику. Как это можно исправить?


Оригинал в Telegram · @zhxnrs

Нормальная модель весит больше 100 Гб. Нужно две-три платы. Если даже по 10 то это 30к зелени. И это будет уровень самых дешевых китайских облачных вариантов. Короче все упирается в бабло и железо.


Оригинал в Telegram · @DepartmentX

Не ну это понятно, я уже писал что надо в локал уходить. Но решение не в железе а в софте


Оригинал в Telegram · @deniom3

Вон гемму выкатили 12б


Оригинал в Telegram · @deniom3

По тестам как прошлая 26б а влезает уже на игровую видяху со свистом


Оригинал в Telegram · @deniom3

два года назад ллама вышла, сейчас уже устарела, её обгоняют модели в раза меньше


Оригинал в Telegram · @RDirect

Если человеку нужен уровень Антропик то о каких Геммах можно говорить. Это совсем другой уровень


Оригинал в Telegram · @DepartmentX

Тут главный вопрос а нужен ли ему антропик на самом деле?)


Оригинал в Telegram · @deniom3

Ну а если вопрос будет стоять жестко, что нет у тебя антропика или есть но настолько ненадежно что рассчитывать на постоянную работу просто нельзя. то будешь искать все варианты, назовем это избитой фразой “есть слона по кусочкам” Это антропик может слона съесть и не заметить, а если его нет, то придется разбивать на мелки задачи и шпарить на простых моделях


Оригинал в Telegram · @RDirect