Rogue Iteration Studio
Zurück zu Insights
agentsarchitectureproduction
20. Dezember 2023

Ein Production-Blueprint für einen agentischen Workflow

Nehmen Sie einen Workflow und liefern Sie ihn als zuverlässigen Service. Hier ist die minimale Architektur, die in Production tatsächlich funktioniert.

Das Ziel

Nehmen Sie einen Workflow und liefern Sie ihn als zuverlässigen Service.

Keine Demo. Kein Prototyp. Ein Production-System, das unbeaufsichtigt läuft, Fehler elegant behandelt und von Ihrem Team gewartet werden kann.

Minimale Architektur

Sie brauchen fünf Komponenten. Nicht mehr, nicht weniger.

1. Orchestrator

Das Gehirn, das den Workflow koordiniert.

  • **Steps** — definierte Sequenz oder DAG von Operationen
  • **Retries** — automatisches Retry mit Backoff für transiente Fehler
  • **Timeouts** — lang laufende Steps killen, bevor sie teuer werden
  • **Budgets** — Token-Ausgaben pro Ausführung begrenzen
  • **State** — Fortschritt für Wiederaufnahme und Debugging tracken
  • 2. Tools

    Die Hände, die mit der Welt interagieren.

  • **Typisiert** — Input- und Output-Schemas sind explizit
  • **Validiert** — schlechte Argumente werden vor der Ausführung abgelehnt
  • **Berechtigt** — Tools deklarieren, was sie tun dürfen
  • **Observable** — jeder Aufruf wird mit Timing und Ergebnissen geloggt
  • 3. State

    Das Gedächtnis, das den Fortschritt trackt.

  • **Inputs** — was diese Ausführung gestartet hat
  • **Zwischenergebnisse** — Ergebnisse von jedem Step
  • **Tool-Ergebnisse** — was jeder Tool-Aufruf zurückgegeben hat
  • **Trace-Metadaten** — Timing, Tokens, Model-Versionen
  • 4. Safety Rails

    Die Guardrails, die Katastrophen verhindern.

  • **Tool-Allowlist** — der Agent kann nur zugelassene Tools aufrufen
  • **Riskante Aktionen blockieren** — manche Operationen brauchen menschliche Genehmigung
  • **Secrets redaktieren** — niemals API-Keys oder PII loggen
  • **Budget-Enforcement** — stoppen, bevor zu viel ausgegeben wird
  • 5. Eval-Harness

    Die Tests, die beweisen, dass es funktioniert.

  • **30–100 Szenarien** — repräsentative Fälle aus echter Nutzung
  • **Automatisiertes Scoring** — Pass/Fail-Kriterien für jedes Szenario
  • **Regressions-Gate** — neue Änderungen dürfen bestehendes Verhalten nicht brechen
  • **CI-Integration** — Evals laufen bei jedem PR
  • Die langweiligen Teile, die wichtig sind

    Agents scheitern. Es geht nicht darum, alle Fehler zu verhindern—es geht darum, sich elegant zu erholen.

    Parsing und Validation

    Model-Outputs sind Strings. Parsen Sie sie sofort. Validieren Sie gegen Ihr Schema. Lehnen Sie Müll ab, bevor er sich ausbreitet.

    Deterministische Fallbacks

    Wenn das Modell scheitert, was passiert? Definieren Sie es explizit. Geben Sie einen sicheren Default zurück, reihen Sie für menschliche Review ein, oder scheitern Sie mit einem klaren Fehler.

    Idempotente Tools

    Tools sollten sicher wiederholbar sein. Wenn ein Tool zweimal mit dem gleichen Input aufgerufen wird, sollte das Ergebnis das gleiche sein (oder zumindest nicht katastrophal).

    Klare Fehler

    Wenn etwas scheitert, sollte die Fehlermeldung sagen, was gescheitert ist, warum, und was zu tun ist. Keine Stack-Traces in User-facing Errors.

    Der Weg nach vorn

    Wenn Sie einen Workflow end-to-end geliefert haben wollen—mit Evals und Safety Rails—genau dafür ist mein Agent Build Angebot.

    Gespräch vereinbaren, um Ihren Workflow zu besprechen.

    Möchten Sie dieses Thema besprechen?

    Ich spreche gerne darüber, wie diese Ideen auf Ihre spezifische Situation anwendbar sind.

    20-min Gespräch buchen