Zum Inhalt springen

KI-Blog: News, Analysen und Praxiswissen

KI-News, Praxistipps und Einblicke direkt aus der Community.

167 Artikel
10 Kategorien
339 Themen
Prompt Caching ist kein Rabatt. Es ist die Bedingung, unter der Agent-Loops überhaupt rechnen.

Prompt Caching ist kein Rabatt. Es ist die Bedingung, unter der Agent-Loops überhaupt rechnen.

Die 90-Prozent-Ersparnis bei Prompt Caching ist eine Single-Call-Metrik. Die wahre ökonomische Wirkung liegt in Agent-Loops, wo Caching die quadratisch wachsenden Token-Kosten in eine lineare Kurve verwandelt.

Daniel Sonnet
6 Min. Lesezeit
Das Hook-Paradox: KI ist im YouTube-Workflow stark, wo niemand zusieht

Das Hook-Paradox: KI ist im YouTube-Workflow stark, wo niemand zusieht

55% aller YouTube-Videos verlieren ihre Zuschauer in den ersten 60 Sekunden, zeigt eine Retention-Rabbit-Analyse von über 10.000 Videos. Genau dort versagt KI am deutlichsten, und genau dort entscheidet YouTube über Reichweite und Monetarisierung.

Daniel Sonnet
5 Min. Lesezeit
Wer in Deutschland KI beschafft, erbt drei Regulierungsregimes gleichzeitig

Wer in Deutschland KI beschafft, erbt drei Regulierungsregimes gleichzeitig

Seit 2. August 2025 macht der EU AI Act den deutschen Integrator zum AI-System-Provider, und verschiebt damit still die Compliance-Last vom US-Modellanbieter auf den Käufer. Warum die übliche USA/EU/China-Erzählung im Einkauf irreführt und welche Klauseln vor Vertragsunterschrift fehlen.

Daniel Sonnet
6 Min. Lesezeit
Dein Wearable misst alles und entscheidet nichts. Daran ändert auch der KI-Coach am Handgelenk wenig.

Dein Wearable misst alles und entscheidet nichts. Daran ändert auch der KI-Coach am Handgelenk wenig.

Eine Harvard-Studie aus Oktober 2024 fand: Apple Watch erkennt Tiefschlaf nur in 50,5 Prozent der Fälle. Trotzdem rollen Samsung und Apple 2026 KI-Coaches auf der Watch aus. Warum aus Korrelationsdaten kein medizinischer Coach wird, sondern nur ein besserer Chatbot.

Daniel Sonnet
6 Min. Lesezeit
Property-Reihenfolge kostet 27 Prozentpunkte Accuracy. Schema-Design ist keine Nebensache.

Property-Reihenfolge kostet 27 Prozentpunkte Accuracy. Schema-Design ist keine Nebensache.

Allein die Reihenfolge der Properties in einem JSON-Schema senkt GPT-3.5-Turbos Accuracy auf GSM8K von 76,60 auf 49,25 Prozent. Constrained Decoding garantiert valide Syntax. Den Rest verbockt das Schema selbst.

Daniel Sonnet
6 Min. Lesezeit
Autoren benutzen KI als Schreibmaschine. Sie sollte Lektor sein.

Autoren benutzen KI als Schreibmaschine. Sie sollte Lektor sein.

Bei einem 80.000-Wort-Roman fällt jedes große Sprachmodell auf der Mittelposition unter 56 Prozent Trefferquote. Wer KI Prosa schreiben lässt, hat den falschen Job vergeben, die richtige Rolle ist eine andere.

Daniel Sonnet
6 Min. Lesezeit
KI in der Verwaltung löst nicht das Effizienzproblem, sie löscht das Ermessen

KI in der Verwaltung löst nicht das Effizienzproblem, sie löscht das Ermessen

Anfang 2025 waren laut IW Köln nur 196 von 575 OZG-Leistungen flächendeckend digital. Die Debatte dreht sich um Tempo, das Kernproblem ist juristisch: KI verschiebt Ermessen in eine Black Box, die § 35a VwVfG eigentlich ausschließt.

Daniel Sonnet
6 Min. Lesezeit
Gemini 3.1 Pro: Stark in Benchmarks, schwach in der Mitte

Gemini 3.1 Pro: Stark in Benchmarks, schwach in der Mitte

Gemini 3.1 Pro erreicht 90,99 Prozent in MMLU-Pro und 80,6 Prozent in SWE-bench Verified. Bei langen Dokumenten verliert das Modell aber 20 bis 50 Prozent Retrieval-Genauigkeit. Was das für die Modellwahl 2026 heißt.

Daniel Sonnet
6 Min. Lesezeit
Function-Calling-Benchmarks messen Genauigkeit. Nicht Zuverlässigkeit.

Function-Calling-Benchmarks messen Genauigkeit. Nicht Zuverlässigkeit.

Auf dem Berkeley Function Calling Leaderboard v4 stagnieren die Top-Modelle bei rund 70 Prozent. OpenAIs Structured Outputs liefern dagegen 100 Prozent Schema-Compliance. Das Delta ist kein Modellproblem, sondern eine Architekturentscheidung.

Daniel Sonnet
6 Min. Lesezeit
Big Tech und Pentagon: Die rote Linie wurde 2024 still überschritten

Big Tech und Pentagon: Die rote Linie wurde 2024 still überschritten

OpenAI hat im Januar 2024 'military and warfare' aus seiner Usage Policy gestrichen. Anthropic-Claude läuft seit November 2024 auf AWS Secret Region (IL6). Wer KI-Militärkooperation als kommende Frage diskutiert, hat die letzten 18 Monate nicht gelesen.

Daniel Sonnet
6 Min. Lesezeit
Perplexity lässt drei KI-Modelle abstimmen. Das schlägt jeden Einzelanbieter.

Perplexity lässt drei KI-Modelle abstimmen. Das schlägt jeden Einzelanbieter.

Seit dem 6. Februar 2026 beantwortet Perplexitys Model Council Anfragen mit Claude, GPT und Gemini parallel. Eine ACL-Studie aus 2025 zeigt: Voting schlägt das beste Einzelmodell auf Reasoning um 13,2 Prozentpunkte. Wer 'welches Modell?' fragt, hat die falsche Frage gewählt.

Daniel Sonnet
5 Min. Lesezeit
MCP ist die neue Angriffsfläche. Die meisten Unternehmen haben sie noch nicht gesichert.

MCP ist die neue Angriffsfläche. Die meisten Unternehmen haben sie noch nicht gesichert.

Invariant Labs hat im April 2025 den offiziellen WhatsApp-MCP-Server über eine indirekte Prompt Injection kompromittiert. Asana folgte im Juni 2025 mit einem Cross-Tenant-Datenleck. Der Trend ist klar, die Verteidigung ist es nicht.

Benjamin Eckstein
6 Min. Lesezeit
Aftershoot hat 89 Millionen Bearbeitungsstunden gespart. Aber nicht für dich.

Aftershoot hat 89 Millionen Bearbeitungsstunden gespart. Aber nicht für dich.

Der Aftershoot Snapshot Report 2025 nennt eine Zahl, die der Fotografenbranche unangenehm sein sollte: 473 Stunden eingesparte Bearbeitungszeit pro aktivem Nutzer. KI hat den Markt nicht demokratisiert. Sie hat ihn bimodal gespalten.

Daniel Sonnet
4 Min. Lesezeit
Übersetzer sterben nicht aus. Die Mittelschicht stirbt.

Übersetzer sterben nicht aus. Die Mittelschicht stirbt.

Der globale Sprachdienstleistungsmarkt schrumpfte 2023 um 3 Prozent, während Maschinen-Post-Editing fast die Hälfte der Aufträge übernahm. Wer noch von 'Übersetzer oder kein Übersetzer' redet, hat nicht verstanden, was gerade passiert.

Daniel Sonnet
7 Min. Lesezeit
KI in der Cybersecurity: Warum Angreifer 18 Monate Vorsprung haben, und was das für KMU heißt

KI in der Cybersecurity: Warum Angreifer 18 Monate Vorsprung haben, und was das für KMU heißt

KI-Phishing trifft mit 54 Prozent Click-Through-Rate. Verteidiger brauchen Tooling, Budget und NIS2-Compliance. Dieses asymmetrische Zeitfenster ist der gefährlichste Moment für KMU seit Jahren.

Daniel Sonnet
7 Min. Lesezeit
Adobe Firefly Agenten: Wo der Engpass kreativer KI wirklich liegt

Adobe Firefly Agenten: Wo der Engpass kreativer KI wirklich liegt

Forrester misst 70 bis 80 Prozent Zeitersparnis bei Asset-Varianten und einen Drei-Jahres-ROI von bis zu 577 Prozent. Der Wert kreativer KI liegt nicht mehr im Bild, sondern in der Pipeline drumherum, und genau die verlieren Agenturen jetzt.

Daniel Sonnet
6 Min. Lesezeit
GitHub Agent HQ: Warum Copilot fremde Agents in VS Code lässt, und damit den Modell-Krieg aufgibt

GitHub Agent HQ: Warum Copilot fremde Agents in VS Code lässt, und damit den Modell-Krieg aufgibt

Mit Agent HQ lässt GitHub Claude, Codex, Cognition und Cursor direkt in VS Code laufen. Das ist kein Feature-Update, sondern das Eingeständnis, dass der einzige verteidigungsfähige Layer nicht das Modell ist, sondern der Orchestrator.

Benjamin Eckstein
6 Min. Lesezeit
Suno und Udio bedrohen keine Künstler, sie löschen den Mittelstand der Musikindustrie
Business ki-musiksunoudio

Suno und Udio bedrohen keine Künstler, sie löschen den Mittelstand der Musikindustrie

Die Debatte 'ist das noch Kunst?' verschleiert den eigentlichen Umbruch. KI-Musik trifft nicht Billie Eilish, sondern Library-Komponisten, Werbeproduzenten und Stock-Audio. Und die Major-Klagen schützen Trainingsdaten-Monopole, nicht Kreative.

Daniel Sonnet
7 Min. Lesezeit