На твоём сервере я бы смотрел именно на: • Ollama + nomic-embed-text или • Ollama/llama.c.

На твоём сервере я бы смотрел именно на:

• Ollama + nomic-embed-text
или
• Ollama/llama.cpp + BGE-M3, если удастся комфортно по скорости

Мне такое предложил, может кто пробовал


Оригинал в Telegram · @dr0p_usdt