Мне все же интересно продолжить джпт 5.5 использовать, но было бы круто приделать для бытовых нужд китайскую модель какую-нибудь
Логирование какое-то предусмотрено? Поработал денек, запросы положились в базу, к каждому расход по токенам приписался.
да, минимум стоит писать модель, роут, input/output токены, цену, latency и статус. потом по этим логам сразу видно, где роутер ошибается и что жрет бюджет
Ну вот щас и проектирую как туда запихнуть ллм что бы она оценивала все что было за день и давала рекомендации + оценивалась каждая модель в плане срабатывания для конкретной задачи и повышался/понижался ее приоритет в цепочке моделей в рамках категории
спасибо за подсказку на opencode, купил сейчас и поставил его
работает вроде хорошо
использую glm 5.2 она по тестам хорошо себя показала
Ну тут ворос на сколько хватит там самый лешовый дипсик
В целом для повседневных задач его хватает
лешовый ?
Посмотри в сторону минимакс у него лимиты на м3 такие же как у дипсик про
Но кажется он поумней будет
я просто с китайцами почти опыта не имею, так что не знаю как себя поведут они
но как понимаю это все примерно одно и тоже и скопировано с моделек клауд и джпт
Воспринимай их как американские модели на 1-2 поколения назад
условно дипсик 4 сопоставим с гпт 5.4
Грубо и с оговорками но так
Принцип достаточности всегда должен работать. Кому-то и Кими и Минимакса заглаза достаточно.
Китайцы на голову ниже по качеству чем Топы Гугла ГПТ и Клод . Не надо выдумывать. Небо и земля. НО все зависит от сценария работы.