Orchestration

rag-router

Orchestration multi-étagère pour rag-agent

rag-router décide où chercher. Il route les questions des utilisateurs vers le bon rag-agent, découvre la santé des agents, et proxifie /search avec le streaming SSE — pour que vos utilisateurs interagissent avec un seul endpoint intelligent.

  • Classifieur basé sur des règles : chevauchement de mots-clés, correspondance de titres, classes d'intention
  • Modes de routage : single, cascade (retry sur no_results), clarify
  • Service de découverte d'agents (ADS) — polling de santé, catalogue statique, actualisation à l'exécution
  • Proxy SSE vers /search de rag-agent avec réglage par agent (top_k, min_score)
  • Serveur MCP pour Cursor IDE : rag_search, rag_list_books, rag_route_preview
  • Configuration unique router.yaml, CLI routerctl pour déboguer les décisions de routage
  Client (Cursor MCP / HTTP / CLI)
              │
              ▼
    ┌─────────────────┐
    │   rag-router    │  :8090
    │  route + proxy  │
    └────────┬────────┘
             │  classifies intent
      ┌──────┴──────┐──────────────┐
      ▼             ▼              ▼
 rag-agent      rag-agent      rag-agent
  :8081           :8082          :8083
  legal           wiki          security
rag-router reçoit la question, classifie l'intention et proxifie vers le rag-agent correspondant.

rag-agent gère l'ingestion, l'indexation, la récupération et la génération. rag-router ajoute l'intelligence de routage par-dessus — sans Bleve, sans f4kvs, sans logique d'ingestion. Déployez un rag-agent par domaine (juridique, wiki, sécurité), pointez rag-router sur chacun, et laissez les utilisateurs poser leurs questions sans savoir quelle étagère répond.

Pilote Multi-étagère

Tarif selon périmètre

Nous contacter