Use-Case Cookbook¶
Konkrete End-to-End-Anleitungen für die häufigsten Use-Cases.
🟢 EASY · NDA-Klassifizierung¶
Problem: Sales bekommt täglich 5-10 NDAs, manuelle Sichtung dauert pro Stück 15-30 Min., Risiko-Klauseln werden übersehen.
Lösung: OWUI Custom-Modell + n8n Webhook
Schritt 1: NDA-Policy als KB¶
Workspace → Knowledge → Create new
Name: NDA-Policy
Description: Standard-Klauseln + Roter-Flag-Beispiele
Lade hoch:
- nda-template-standard.pdf (eure Standard-NDA)
- red-flag-clauses.md (Klauseln die GREEN/YELLOW/RED machen)
- historical-cases.md (50 anonymisierte Vergangenheits-Cases)
Schritt 2: Custom-Modell¶
Workspace → Models → Create new:
Base Model: claude-sonnet-4.6
Name: NDA-Klassifizierer
Description: Klassifiziert NDA-Klauseln nach GREEN/YELLOW/RED
System Prompt: |
Du bist Legal-Counsel-Assistent. Klassifiziere jede NDA-Klausel:
- GREEN: Standard, keine Änderung nötig
- YELLOW: Counsel-Review empfohlen
- RED: Full Legal Review zwingend
Output als JSON: {clause_id, classification, reason, suggested_redline}
Knowledge: NDA-Policy
Capabilities: file_upload, citations
Schritt 3: n8n-Workflow¶
[Webhook Trigger] (Sharepoint-Upload-Event)
↓
[HTTP Request] PDF → Text via http://litellm:4000/v1/chat/completions
model: gpt-5 (Vision für PDF)
prompt: "Extrahiere alle Klauseln als nummerierte Liste"
↓
[Loop pro Klausel]
↓
[HTTP Request] Klassifizierung via OWUI Custom-Modell
↓
[Filter] classification = "RED"
↓
[Slack] @sales-legal-team: "RED-Klausel in NDA $filename"
↓
[Asana] Create Task mit assignee=Counsel
Schritt 4: Test + Production¶
- 5 echte NDAs einfügen, Antworten prüfen
- Iteration: System-Prompt verfeinern bis 4/5 stimmen
- Activate → läuft 24/7
ROI: 8h/Woche Sales-Zeit gespart, Risk-Detection 100% statt vorher 60%.
🟡 MEDIUM · Mahnwesen-Automatisierung¶
Problem: Buchhaltung mahnt manuell, oft erst nach 60+ Tagen, Cashflow leidet.
Lösung: Trino + n8n + Documenso + KI-Tonalitäts-Auswahl
Architektur¶
Datev/SAP → Airbyte → MinIO bronze/ → Trino-Catalog
↓
[n8n Cron Mo 8 Uhr]
↓
[Trino Query: offene >30 Tage]
↓
[Per Rechnung: KI-Tonalitäts-Wahl]
↓
[Documenso PDF gen]
↓
[E-Mail / Postversand]
↓
[WORM-Archiv 10 Jahre]
KI-Tonalitäts-Custom-Modell¶
Name: Mahn-Coach
System Prompt: |
Wähle Mahnstufe (1/2/3) und Tonalität basierend auf:
- Verzugstage
- Kunde-History (Stammkunde / Neukunde / Stammverzögerer)
- Beziehung (laufender Vertrag / Einmal-Geschäft)
Stufe 1 (1-30 Tage): freundliche Erinnerung, Du-Form bei Kleinunternehmen
Stufe 2 (30-60 Tage): formell, Sie-Form, Frist 14 Tage
Stufe 3 (60+ Tage): final + Verzugszinsen + Inkasso-Drohung
Output: {stufe, tonalitaet, brief_text, frist_in_tagen}
Knowledge: Kundenhistorie + AGB + Buchungs-Vorgeschichte
Real-World-Result¶
- Mittelständler 100 Rechnungen/Monat
- Vorher: ~30% offen >60 Tage
- Nachher: <10% offen >60 Tage
- Cashflow +12% in 3 Monaten
🔴 ADVANCED · Eingangs-Rechnungs-Verarbeitung¶
Problem: Buchhalter verbringt 60% der Zeit mit Rechnungs-Tippfehlern.
Lösung: Mail-Trigger + Vision-LLM + Trino-Validierung + Bedingte Auto-Buchung
n8n Workflow¶
[IMAP Trigger] [email protected]
↓
[Filter] hasAttachment AND mimeType=application/pdf
↓
[Vision-LLM] gpt-5 mit Prompt:
"Extrahiere als JSON: {lieferant, datum, rechnungsnr, positionen, brutto, ust, iban}"
↓
[Trino Query] SELECT * FROM erp.kreditoren WHERE name LIKE :lieferant
↓
[Trino Query] SELECT 1 FROM erp.rechnungen WHERE rechnungsnr=:rechnungsnr (Doppel-Check)
↓
[Math] verify positionen.sum + ust = brutto
↓
[Switch]
├─ Auto-Path: brutto < 500 AND alle Checks OK
│ ↓ Trino INSERT INTO erp.buchungen
│ ↓ Slack #buchhaltung "Auto-gebucht: $lieferant $brutto€"
│ ↓ MinIO upload (10y WORM)
└─ Review-Path: alles andere
↓ Dify-App "Rechnungs-Review" mit pre-filled Form
↓ Buchhalter checkt + bestätigt
↓ Trino INSERT
Sicherheit & Compliance¶
- Per-Lieferant Rate-Limit (max 5 Rechnungen/Tag automatisch)
- Vier-Augen-Prinzip ab 5.000€
- Alle Originale 10 Jahre WORM (HGB §239)
- Audit-Trail in Langfuse (welche Rechnung wurde von welchem Modell wie klassifiziert)
Result: 80% durchläuft autonom, Buchhalter-Workload halbiert.
Best Practices¶
Knowledge-Base-Hygiene¶
- ID-Schema verwenden (
CID-001,KID-002,PID-M2-S-003) - Frontmatter mit Version/Stand/Owner
- Monatliches Review aller KBs (welche Files veraltet?)
Modell-Auswahl¶
| Aufgabe | Modell |
|---|---|
| Vertraulich + schnell | llama-3.3-70b-local |
| Komplexes Reasoning | claude-opus-4.6 |
| Strukturiertes JSON | gpt-5-mini |
| Bilder | claude-sonnet-4.6 ODER gemini-2.5-pro |
| Audio | faster-whisper |
| Embeddings | bge-m3 (lokal, multilingual) |
Kosten-Optimierung¶
- Standard-Anfragen → openrouter/auto (Auto-Routing)
- Recurring Cron-Jobs → lokales Modell (kostenlos)
- Customer-Facing → Sonnet 4.6 (Best Quality/€)
- Batch-Verarbeitung → Haiku 4.5 (10× schneller)
Monitoring¶
- Langfuse-Dashboard wöchentlich prüfen
- Top-10 teuerste Anfragen → System-Prompt optimieren
- Slow-Responses → Modell-Switch oder Caching