Moteur

rag-agent

Moteur RAG hybride local-first

rag-agent est un service Go monoprocessus qui ingère vos documents, les indexe avec une récupération hybride BM25 et vectorielle, et génère des réponses fiables en utilisant des endpoints LLM locaux ou auto-hébergés.

  • Récupération hybride BM25 + vectorielle avec fusion réglable (bm25_k, vector_k, top_k)
  • Endpoint /retrieve pour des extraits de preuves auditables et exploitables
  • Endpoint /search pour des réponses LLM ancrées dans les documents
  • Ingestion Markdown et HTML avec découpage structuré
  • Ollama, LM Studio et tout endpoint LLM compatible OpenAI
  • Évaluation intégrée — Recall@k et MRR sur des jeux dorés
  • API file-tree 9P optionnelle pour les workflows Unix scriptables
  • Moteurs lexicaux modulaires : Bleve, Tantivy ou BM25 en mémoire
1,000Recall@8
0,875MRR

Recall@8 1,000 · MRR 0,875 sur le jeu de référence public (baseline BM25 seul, reproductible avec les fixtures eval/).

  • Base de connaissances juridiques interne pour les politiques et contrats
  • Assistant wiki d'entreprise contrôlé pour la documentation technique
  • Couche de récupération on-prem intégrée dans un produit existant
  • Équipes juridiques et conformité en France/UE ne pouvant pas utiliser les IA cloud
  • Équipes plateforme et backend ayant besoin d'un sidecar RAG local
  • Intégrateurs système livrant des projets d'IA souveraine

Pilote

2–4 semaines · un corpus

Démarrer un pilote