Funktion

Jede KI-Anfrage intelligent routen

Steuern Sie automatisch, wie Anfragen über Modelle, Provider und Umgebungen fließen.

Mit Outgate Routern definieren Sie Fallback-Logik, balancieren Traffic und wählen dynamisch das beste Modell pro Anfrage.

Ein Eintrittspunkt. Volle Kontrolle.

Jede Anfrage kommt durch ein einziges Gateway und wird nach Ihrer Logik geroutet:

  • Fallback bei Provider-Ausfällen
  • Traffic über Modelle aufteilen
  • Dynamisch das beste Modell pro Anfrage wählen
  • Keine Client-Änderungen nötig
ClientClaude Code, Open WebUI, Codex, API
Smart RouterKI-gestützte Auswahl
A
Anthropic Claude Opus 4.6IQ 53 · Speed 56.9 · $5/$25
A
Anthropic Claude Sonnet 4.6IQ 52 · Speed 63.2 · $3/$15
O
OpenAI GPT 5.4IQ 57 · Speed 82.0 · $2.5/$15
L
Ollama GLM 5IQ 50 · Speed 75.9 · $1/$3.2
ClientClaude Code, Open WebUI, Codex, API
Smart RouterKI-gestützte Auswahl
A
Anthropic Claude Opus 4.6IQ 53 · Speed 56.9 · $5/$25
A
Anthropic Claude Sonnet 4.6IQ 52 · Speed 63.2 · $3/$15
O
OpenAI GPT 5.4IQ 57 · Speed 82.0 · $2.5/$15
L
Ollama GLM 5IQ 50 · Speed 75.9 · $1/$3.2
Anhand von Scoring-Kriterien pro Modell bewertet der Router jede Anfrage in Echtzeit und leitet sie an den besten Treffer weiter. Kosten sparen, leistungsstarke Modelle nur einsetzen, wenn sie wirklich benötigt werden, und bei sensiblen Prompts zum sichersten Modell routen.

Failover-Routing

Immer ein Backup

Definieren Sie eine Prioritätenliste von Providern. Fällt einer aus, übernimmt der nächste automatisch.

  • Sequenzielles Fallback über Provider
  • Schnelle Retries mit konfigurierbaren Timeouts
  • Modell-Overrides pro Fallback

Erst das Beste. Im Bedarfsfall ausweichen.

Weighted-Routing

Traffic-Verteilung steuern

Verteilen Sie Anfragen gewichtet über Provider oder Modelle.

  • A/B-Tests von Modellen in Produktion
  • Neue Provider schrittweise ausrollen
  • Kosten gegen Performance abwägen

Bestimmen Sie, wohin Traffic fließt.

Smart-RoutingPro

Lassen Sie das System entscheiden

Outgate bewertet jede Anfrage und wählt das beste Modell automatisch.

  • Auswahl nach Qualität, Geschwindigkeit und Kosten
  • Pro Anfrage anpassen, nicht pro Konfiguration
  • Respektiert Ihre Präferenzen und Vorgaben

Jede Anfrage ans bestmögliche Modell.

Eine Entscheidung pro Anfrage

Für jede Anfrage:

  1. 01Verfügbare Modelle bewerten
  2. 02Nach Qualität, Geschwindigkeit und Kosten scoren
  3. 03Den besten Match wählen
  4. 04Anfrage weiterleiten

Optional

  • Unsichere Anfragen blockieren
  • Unnötige Tools entfernen
  • Guardrails inline anwenden

Ein Router, viele Provider

Routen Sie über:

  • OpenAI
  • Anthropic
  • Selbst gehostete Modelle (Ollama, vLLM)
  • Custom-APIs

Alles hinter einem einzigen Endpoint.

ClientClaude Code, Open WebUI, Codex, API
Smart RouterMehrschichtiges Routing
Failover Afailover
Failover Bfailover
B
Bedrock Claude Opus 4.6EU Stockholm
B
Bedrock Claude Opus 4.6EU Frankfurt
B
Bedrock gpt-oss-120bEU Frankfurt
B
Bedrock gpt-oss-120bEU Stockholm
ClientClaude Code, Open WebUI, Codex, API
Smart RouterMehrschichtiges Routing
Failover Afailover
B
Bedrock Claude Opus 4.6EU Stockholm
B
Bedrock Claude Opus 4.6EU Frankfurt
Failover Bfailover
B
Bedrock gpt-oss-120bEU Frankfurt
B
Bedrock gpt-oss-120bEU Stockholm
Erstellen Sie zusammengesetztes Routing, indem Sie Router verketten. Jede Schicht arbeitet unabhängig: Smart-Auswahl, Failover oder Gewichtung, in beliebiger Kombination.

Intelligenter routen. Schneller ausliefern.

Steuern Sie, wie jede Anfrage durch Ihren KI-Stack fließt.

Häufige Fragen

Anfragen wandern im Failover-Modus automatisch zum nächsten konfigurierten Upstream.
Heute nutzt jeder Router eine einzelne Strategie. Kombinieren ist als Erweiterung geplant.
Kein nennenswerter Overhead. Routing geschieht inline im Gateway.
Ja. Jeder Upstream kann ein konkretes Modell-Override definieren.
Es bewertet Kandidaten anhand von Qualität, Geschwindigkeit und Kosten — und Ihren konfigurierten Präferenzen.