Настройка fallback-провайдеров в Hermes при лимитах

pasha_from_russia · 26.Июнь.2026 11:27:43

Народ, привет. Можно ли в гермесе настроить fallback при окончании лимитов на основном провайдере? Сейчас не перескакивает, хотя написано Tried in order when the primary fails (rate-limit, 5xx, connection errors).

model:
default: gpt-5.5
provider: openai-codex
base_url: https://chatgpt.com/backend-api/codex
providers: {}
fallback_providers:

provider: anthropic
model: claude-opus-4-8
credential_pool_strategies: {}

Оригинал в Telegram · @Pasha_from_Russia

rinat_ff · 26.Июнь.2026 12:18:06

через omnirouter

Оригинал в Telegram · @Rinat_FF

maxk1lla · 26.Июнь.2026 15:37:18

Ну если уже лимиты и бот не работает, то нужно через терминал зайти на сервер и через hermes auth добавить провайдера, потом командой model переключить. Как бот запустится там прям его попросил сделать fallback, он сам и прикрутит тебе

Оригинал в Telegram · @MaxK1lla

maxk1lla · 26.Июнь.2026 15:39:27

Сообщение удалено в Telegram.

maxk1lla · 26.Июнь.2026 15:40:09

как на гермес перешёл, убрал вообще омник, не нужен он оказался, да ещё и когда сидел на гпт отказывался нормально лимиты показывать, а вот сам гермес спокойно показывал в любой момент вообще, да и сейчас прикрутил показ лимитов в подписке opencode go

Оригинал в Telegram · @MaxK1lla

boyok_b · 26.Июнь.2026 16:31:45

А как ты с ним работаешь через opencode go? Он мне сказал что это невозможно

Оригинал в Telegram · @boyok_b

vlad_okan · 26.Июнь.2026 16:33:15

MaxK1lla
как на гермес перешёл, убрал вообще омник, не нужен он оказался, да ещё и когда сидел на гпт отказы…
а для OpenClaw есть такое же?

Оригинал в Telegram · @vlad_okan

deniom3 · 26.Июнь.2026 17:18:46

спокойно он работает у него он из коробки встроен есть как провайдер

Оригинал в Telegram · @deniom3

maxk1lla · 26.Июнь.2026 17:57:26

Ну как это невозможно … в списке прям есть провайдер opencode go. Когда в терминале вводишь hermes auth и нажимаешь 1 для добавления, там в списке есть opencode go, там даёшь название подписке и вводишь апи. Ну а дальше можно вообще сделать ещё отображение лимитов. Тут как раз уже агент может помочь с этим. Мой решил тем, что запросил куки с залогиненной страницы. Так что все мои 4 аккаунта opencode показываются по лимитам. Вот на скрине видно как приходит инфа. Поэтому опенроутер нафиг не нужен. Да и с гпт вообще ещё проще, агент напрямую мог спросить про лимиты, там да же никакие куки не нужны были.

Оригинал в Telegram · @MaxK1lla

maxk1lla · 26.Июнь.2026 17:59:13

спроси у агента, может ли он показать тебе лимиты твоей подписки, ну и дальше разгоняй с ним беседу) по сути все у него можно узнать)

Оригинал в Telegram · @MaxK1lla

vlad_okan · 26.Июнь.2026 18:01:57

знаем как они работают, напишет 50 скриптов, запушит все ключи на гит, и в конце напишет rm —rf /

Оригинал в Telegram · @vlad_okan

deniom3 · 26.Июнь.2026 18:12:49

Будь умнее пиши сам sudo rm —rf / и выкидывай комп в окно

Оригинал в Telegram · @deniom3

deniom3 · 26.Июнь.2026 18:13:55

Надо действовать на опережение!

Оригинал в Telegram · @deniom3

xqzmesir · 26.Июнь.2026 18:16:40

Блин, интересно было бы вас послушать касательно применения Гермеса в вашей жизни.

Вы в своей профессии применяете?

А то 4 подписки ГО, кажется что вы параллельно на 3 IT работах пашете

Оригинал в Telegram · @xqzmesir

maxk1lla · 26.Июнь.2026 19:11:14

да на самом деле ничего особенного не делаю, больше изучаю, я достаточно недавно в нейронки пришёл, поэтому никаких проектов не сделал пока, хоть и понимаю как что делать грамотно и правильно)

Но если честно, не понимаю в чём удивление, дай мне 10 аккаунтов я и их прожру с удовольствием, потому что идеи, различных вариантов применения, тестов - хоть отбавляй. Да и там же много разных моделей, да, если сидеть на deppseek v4 flash, то мне кажется и 1 за глаза, а если ты что-то с кодом делаешь, кастомизируешь гермес, что-то добавляешь, скилы какие-то придумываешь, то дипсик для этого просто не подойдёт, ты быстрее от нервов вздёрнешься).
Вот недели полторы использовал kimi 2.7 code, в целом - неплохо, но как буд-то прям быстро тупеть начинает при наборе контекста, все-таки 262тысячи маловато сейчас уже… Ну и проблемы с дисциплиной, пометки в памяти все есть, но может в любой момент нахрен просто тебя послать с ним и сделать все по другому. Сейчас тестирую glm 5.2, а там уж извините и лимитов на нее куда меньше.

Кстати вот недавно делал 2 больших обновления для гермеса, месяц не обновлялся ну и доделок моих там достаточно много. Поэтому такие обновления достаточо проблематичны, если хочешь обновиться и не снести все к херам свое. Так вот во первых я сделал скилл для больших изменений в коде, там кастом из 3 скилов, если в кратце, то все четко делается по планам и созданием prd файла на выходе. Так вот с кими 2.7 создал все это дело и потом закинул на аудит клоду, он то же у меня на сервере, видит все папки, в курсе про гермес и т.д. Он смотрит план, обновляет его и дальше я ещё раз кидаю кими. Все эти движухи по сути в телеге происходят у меня. И по итогу они вдвоем делают оптимальный вариант. И выполняет все китайская модель. Кими неплохо сделала подобную задачу, прям можно сказать без ошибок, какие-то мелкие недочёты были, но это фигня. Вот сегодня ещё одну такую задачу делаю, но ток с glm 5.2. Вообще конечно glm пока очень да же нравится, я не супер много с ним сидел, но пока вообще нареканий нет.

Оригинал в Telegram · @MaxK1lla