Проблемы с OpenClaw после обновления: лимиты и контекст

Мне все же интересно продолжить джпт 5.5 использовать, но было бы круто приделать для бытовых нужд китайскую модель какую-нибудь


Оригинал в Telegram · @Channel_Bot

То есть это как-то нужно сделать внутри Гермес распределение


Оригинал в Telegram · @Channel_Bot

Логирование какое-то предусмотрено? Поработал денек, запросы положились в базу, к каждому расход по токенам приписался.


Оригинал в Telegram · @RDirect

да, минимум стоит писать модель, роут, input/output токены, цену, latency и статус. потом по этим логам сразу видно, где роутер ошибается и что жрет бюджет


Оригинал в Telegram · @olegenginere

Да, конечно)


Оригинал в Telegram · @goodandready

Ну вот щас и проектирую как туда запихнуть ллм что бы она оценивала все что было за день и давала рекомендации + оценивалась каждая модель в плане срабатывания для конкретной задачи и повышался/понижался ее приоритет в цепочке моделей в рамках категории


Оригинал в Telegram · @goodandready

спасибо за подсказку на opencode, купил сейчас и поставил его

работает вроде хорошо

использую glm 5.2 она по тестам хорошо себя показала

Ну тут ворос на сколько хватит там самый лешовый дипсик

В целом для повседневных задач его хватает

лешовый ?

Посмотри в сторону минимакс у него лимиты на м3 такие же как у дипсик про

Но кажется он поумней будет

я просто с китайцами почти опыта не имею, так что не знаю как себя поведут они

но как понимаю это все примерно одно и тоже и скопировано с моделек клауд и джпт

Воспринимай их как американские модели на 1-2 поколения назад

условно дипсик 4 сопоставим с гпт 5.4

Грубо и с оговорками но так

Принцип достаточности всегда должен работать. Кому-то и Кими и Минимакса заглаза достаточно.
Китайцы на голову ниже по качеству чем Топы Гугла ГПТ и Клод . Не надо выдумывать. Небо и земля. НО все зависит от сценария работы.