Настройка fallback-провайдеров в Hermes при лимитах

Народ, привет. Можно ли в гермесе настроить fallback при окончании лимитов на основном провайдере? Сейчас не перескакивает, хотя написано Tried in order when the primary fails (rate-limit, 5xx, connection errors).

model:
default: gpt-5.5
provider: openai-codex
base_url: https://chatgpt.com/backend-api/codex
providers: {}
fallback_providers:

  • provider: anthropic
    model: claude-opus-4-8
    credential_pool_strategies: {}

Оригинал в Telegram · @Pasha_from_Russia

через omnirouter


Оригинал в Telegram · @Rinat_FF

Ну если уже лимиты и бот не работает, то нужно через терминал зайти на сервер и через hermes auth добавить провайдера, потом командой model переключить. Как бот запустится там прям его попросил сделать fallback, он сам и прикрутит тебе


Оригинал в Telegram · @MaxK1lla

Сообщение удалено в Telegram.

как на гермес перешёл, убрал вообще омник, не нужен он оказался, да ещё и когда сидел на гпт отказывался нормально лимиты показывать, а вот сам гермес спокойно показывал в любой момент вообще, да и сейчас прикрутил показ лимитов в подписке opencode go


Оригинал в Telegram · @MaxK1lla

А как ты с ним работаешь через opencode go? Он мне сказал что это невозможно


Оригинал в Telegram · @boyok_b

MaxK1lla
как на гермес перешёл, убрал вообще омник, не нужен он оказался, да ещё и когда сидел на гпт отказы…
а для OpenClaw есть такое же?


Оригинал в Telegram · @vlad_okan

спокойно он работает у него он из коробки встроен есть как провайдер


Оригинал в Telegram · @deniom3

Ну как это невозможно … в списке прям есть провайдер opencode go. Когда в терминале вводишь hermes auth и нажимаешь 1 для добавления, там в списке есть opencode go, там даёшь название подписке и вводишь апи. Ну а дальше можно вообще сделать ещё отображение лимитов. Тут как раз уже агент может помочь с этим. Мой решил тем, что запросил куки с залогиненной страницы. Так что все мои 4 аккаунта opencode показываются по лимитам. Вот на скрине видно как приходит инфа. Поэтому опенроутер нафиг не нужен. Да и с гпт вообще ещё проще, агент напрямую мог спросить про лимиты, там да же никакие куки не нужны были.


Оригинал в Telegram · @MaxK1lla

спроси у агента, может ли он показать тебе лимиты твоей подписки, ну и дальше разгоняй с ним беседу) по сути все у него можно узнать)


Оригинал в Telegram · @MaxK1lla

знаем как они работают, напишет 50 скриптов, запушит все ключи на гит, и в конце напишет rm —rf /


Оригинал в Telegram · @vlad_okan

Будь умнее пиши сам sudo rm —rf / и выкидывай комп в окно


Оригинал в Telegram · @deniom3

Надо действовать на опережение!


Оригинал в Telegram · @deniom3

Блин, интересно было бы вас послушать касательно применения Гермеса в вашей жизни.

Вы в своей профессии применяете?

А то 4 подписки ГО, кажется что вы параллельно на 3 IT работах пашете


Оригинал в Telegram · @xqzmesir

да на самом деле ничего особенного не делаю, больше изучаю, я достаточно недавно в нейронки пришёл, поэтому никаких проектов не сделал пока, хоть и понимаю как что делать грамотно и правильно)

Но если честно, не понимаю в чём удивление, дай мне 10 аккаунтов я и их прожру с удовольствием, потому что идеи, различных вариантов применения, тестов - хоть отбавляй. Да и там же много разных моделей, да, если сидеть на deppseek v4 flash, то мне кажется и 1 за глаза, а если ты что-то с кодом делаешь, кастомизируешь гермес, что-то добавляешь, скилы какие-то придумываешь, то дипсик для этого просто не подойдёт, ты быстрее от нервов вздёрнешься).
Вот недели полторы использовал kimi 2.7 code, в целом - неплохо, но как буд-то прям быстро тупеть начинает при наборе контекста, все-таки 262тысячи маловато сейчас уже… Ну и проблемы с дисциплиной, пометки в памяти все есть, но может в любой момент нахрен просто тебя послать с ним и сделать все по другому. Сейчас тестирую glm 5.2, а там уж извините и лимитов на нее куда меньше.

Кстати вот недавно делал 2 больших обновления для гермеса, месяц не обновлялся ну и доделок моих там достаточно много. Поэтому такие обновления достаточо проблематичны, если хочешь обновиться и не снести все к херам свое. Так вот во первых я сделал скилл для больших изменений в коде, там кастом из 3 скилов, если в кратце, то все четко делается по планам и созданием prd файла на выходе. Так вот с кими 2.7 создал все это дело и потом закинул на аудит клоду, он то же у меня на сервере, видит все папки, в курсе про гермес и т.д. Он смотрит план, обновляет его и дальше я ещё раз кидаю кими. Все эти движухи по сути в телеге происходят у меня. И по итогу они вдвоем делают оптимальный вариант. И выполняет все китайская модель. Кими неплохо сделала подобную задачу, прям можно сказать без ошибок, какие-то мелкие недочёты были, но это фигня. Вот сегодня ещё одну такую задачу делаю, но ток с glm 5.2. Вообще конечно glm пока очень да же нравится, я не супер много с ним сидел, но пока вообще нареканий нет.


Оригинал в Telegram · @MaxK1lla

Я кстати только сейчас выяснил что подписка OpenCode GO стоит 2-4$ на plati market.

Потому я и удивился когда увидел 4 аккаунта у тебя. Думал что 200$ бачей крутится в Гермесе у тебя:grin::grin:

Кстати о ГО подписке: тоже буду ее брать, как полет идет с ней?

Хватает ли лимитов, есть ли фалбеки от моделей когда они прерываются и не отвечают. Быстро ли кончаются 5 часовые модели.

Мои кейсы если что:

  • штук 4-7 запросов Гермесу в день. Не так часто им пользуюсь
  • чуть кодинга в области анализа данных, тоже редко.

Оригинал в Telegram · @xqzmesir

Получается ты 4 раза hermes auth провел добавив все 4 аккаунта и теперь они у тебя крутятся по мере истечения лимита да?


Оригинал в Telegram · @xqzmesir

GLM 5.2 хорош, да. Хвалят его куда не захожу.

За подробный ответ спасибо!


Оригинал в Telegram · @xqzmesir

Да, хватит, причем по твоему кейсу видимо и на те где самые маленькие лимиты 5ч


Оригинал в Telegram · @goodandready

Там можно выбрать вариант ротации аккаунтов, если будет несколько


Оригинал в Telegram · @goodandready