Уже привык что 5ч лимитов хватает на час полноценной работы
Когда было 8-10 акков за копейки, это было как-то незаметно, а теперь печально
ты не пробовал использовать разделение ? код пишет одна, а отвечает на базу другая
не знаю как лучше это настроить даже, чтобы на базу отвечала нормальная моделька, но не дорогая
Все рвутся выйти на биржу и продать свои акции, - надо надувать свою выручку, чтобы выскочить из пузыря на максимуме…
я бы сделал роутер: кодинг на сильную, а вопросы к базе через дешевую с нормальным RAG и коротким контекстом
из бюджетных я бы смотрел на gpt-4.1-mini / qwen flash / deepseek-chat. для базы важнее ретривер и лимит контекста
А возможно разделять запросы на одну подписку ? Запросы отправлять на одновременно на модель полегче и по тяжелее в зависимости от роутинга
Для тех кому надо прям вот вынь да полож топы из топов ну что же подписки за 100\200 и страдания с атифродом ваши друзья
Ну китайци еще, я бы в сторону минимакс посмотрел они щас хорошо покрутили свои лимиты
Спасибо что хотя бы есть подписки за 290 руб, с умеренными лимитами. Свои начинания я делал с пополнения баланса deepseek, за неделю 2к прожег)
У минимакса я вот дожигаю сейчас недельные лимиты 1.2Б токенов в неделю лимит
Да, уже какое-то время пилю себе такую систему)
На входе ряд критериев для определения сложности запроса и выбор категории модели (разбиты на несколько категорий) и самой модели, потом кейвмен, потом уже обработка)
Уже пару недель пользуюсь - правлю логику и т.п)
Сижу проектирую как туда функцию с судьей на ллм простенькой запихнуть что бы оценивал точность срабатывания логики и распределения)
Мысль о таком варианте распределения очень логична и должна быть где-то реализована на гитхабе
Но самому делать тоже круто
Ну, я уже много времени в это вложил)
Сегодня с ИИ разбирали принцип принцип работы новой модели от палантир, у которой в описании есть что-то похожее
Сообщение удалено в Telegram.