А вот те кто используют openclaw при наличии подписки Клода за 100$. Есть те кто перешел просто на Клод код с агентами? Просто начал слышать что там тоже самое как в опенкло, но стабильнее
В теории можно юзать клода с телегой) но на самом деле сильно не парит) и я ща ушел вообще на гпт, ибо разок в клоде забанили
embedding кто-то использует в openclaw? Если да, то подскажите на каких настройках это сделали и стало ли лучше?
там есть встроенная ток установить ее скорей всего надо, либо любую дешевую по апи использовать можно
Спасибо. Да там есть какая-то и она после последнего обновления начала ругаться что нужно платный апи подключить либо локальную модель поставить и я вот задумался спросить у вас))
Я в hermes agent для openviking подбирал, остановился на bge-m3 как на одном из лучших вариантов для русского языка в мултиязычных моделях.
и у неё можно задействовать все три парадигмы: dense, sparse, ColBERT. но, кроме dense обычно другие не особо нужны нам.
совет: безболезненно, практически без потерь качества можно квантированую гонять. хороший выигрыш в ресурсе
Если есть возможность, опишите более простым языком не для программиста пожалуйста (я скормил сообщение ГПТ, но не до конца все равно понял что предлагаете
смысл в том, что кроме dense для любительских проектов, остальные два режима по сути не нужны и при использовании квантованой модели они по факту остаются, но их точность деградирует непропорционально. а по dense потеря не столь существенна даже при использовании модели в два раза легче. то есть вместо гигабайтной модели вполне остётся робастным на 600Мб в Q8, а то и Q6_K на 500 Мб. ниже в принципе уже не стоит - разрыв выигрыш/деградация.
ну это если прям вот решение именно bge-m3 использовать почему-то, хотя если есть возможность на gpu грузить, то на мой взгляд лучше qwen3-0,6B. Вот, какие на самом деле требования у тз этого товарища, кроме как озвученных что хороша в мультиязычность и в том числе для русского, может там и совсем другие модели достаточны, например multilingual-e5-base на 270MB, или даже узкоспециализированные, хз, совет исходил из текущей инфы. хозяин-барин. теперь вроде я всё понятно объяснил для gpt ![]()
да поставьте LM Studio в режим сервера headless, там есть штатная эмбеддинга nomic, и машину не мучает и работает быстро. задача юза не ясна, все варианты на столе
кстати, вот здесь ограниченные по лимитам, но бесплатные интересные модельки. мои агенты ими пользуются иногда.
генерация изображений, небольшие видео:
https://agnes-ai.com/