Moteur

rag-agent

Moteur RAG hybride local-first

rag-agent est un service Go monoprocessus qui ingère vos documents, les indexe avec une récupération hybride BM25 et vectorielle, et génère des réponses fiables en utilisant des endpoints LLM locaux ou auto-hébergés.

Démarrer un pilote Tarifs

Fonctionnalités

Récupération hybride BM25 + vectorielle avec fusion réglable (bm25_k, vector_k, top_k)
Endpoint /retrieve pour des extraits de preuves auditables et exploitables
Endpoint /search pour des réponses LLM ancrées dans les documents
Ingestion Markdown et HTML avec découpage structuré
Ollama, LM Studio et tout endpoint LLM compatible OpenAI
Évaluation intégrée — Recall@k et MRR sur des jeux dorés
API file-tree 9P optionnelle pour les workflows Unix scriptables
Moteurs lexicaux modulaires : Bleve, Tantivy ou BM25 en mémoire

Benchmark

1,000Recall@8

0,875MRR

Recall@8 1,000 · MRR 0,875 sur le jeu de référence public (baseline BM25 seul, reproductible avec les fixtures eval/).

Cas d'usage

Base de connaissances juridiques interne pour les politiques et contrats
Assistant wiki d'entreprise contrôlé pour la documentation technique
Couche de récupération on-prem intégrée dans un produit existant

Pour qui

Équipes juridiques et conformité en France/UE ne pouvant pas utiliser les IA cloud
Équipes plateforme et backend ayant besoin d'un sidecar RAG local
Intégrateurs système livrant des projets d'IA souveraine

Pilote

2–4 semaines · un corpus

Démarrer un pilote