Orchestration
rag-router
Orchestration multi-étagère pour rag-agent
rag-router décide où chercher. Il route les questions des utilisateurs vers le bon rag-agent, découvre la santé des agents, et proxifie /search avec le streaming SSE — pour que vos utilisateurs interagissent avec un seul endpoint intelligent.
Fonctionnalités
- Classifieur basé sur des règles : chevauchement de mots-clés, correspondance de titres, classes d'intention
- Modes de routage : single, cascade (retry sur no_results), clarify
- Service de découverte d'agents (ADS) — polling de santé, catalogue statique, actualisation à l'exécution
- Proxy SSE vers /search de rag-agent avec réglage par agent (top_k, min_score)
- Serveur MCP pour Cursor IDE : rag_search, rag_list_books, rag_route_preview
- Configuration unique router.yaml, CLI routerctl pour déboguer les décisions de routage
Architecture
Client (Cursor MCP / HTTP / CLI)
│
▼
┌─────────────────┐
│ rag-router │ :8090
│ route + proxy │
└────────┬────────┘
│ classifies intent
┌──────┴──────┐──────────────┐
▼ ▼ ▼
rag-agent rag-agent rag-agent
:8081 :8082 :8083
legal wiki security Relation avec rag-agent
rag-agent gère l'ingestion, l'indexation, la récupération et la génération. rag-router ajoute l'intelligence de routage par-dessus — sans Bleve, sans f4kvs, sans logique d'ingestion. Déployez un rag-agent par domaine (juridique, wiki, sécurité), pointez rag-router sur chacun, et laissez les utilisateurs poser leurs questions sans savoir quelle étagère répond.
Pilote Multi-étagère
Tarif selon périmètre