CaseTrail: Vater und Sohn bauen KI für Audits

24. Mai 2026 · 12 Min. · 2300 Wörter

CaseTrail AI Forensic AccountingClaude Code RCE BugAnthropic KPMG Alliance

Transcript

Eine Sonntagsfolge. Sonntag ist mein Lieblingstag, weil alles einen Gang runterschaltet. Und weil weniger los ist, nehm ich mir Zeit für eine Geschichte, die mir diese Woche wirklich im Kopf geblieben ist. Ein Sohn, ein Vater, ein Haufen Bankauszüge und eine KI, die daraus ein ganzes Geschäftsmodell macht. Fangen wir an.

Der Sohn, der Vater und die forensische Buchhaltung

Da ist diese Geschichte, die seit ein paar Tagen auf Hacker News rumgeht. Nicht die großen Schlagzeilen, sondern einer dieser Beiträge, wo ein Entwickler schreibt 'ich hab was mit meinem Vater gebaut' und die Community denkt: ja, genau darum geht's. Es geht um einen Vater und seinen Sohn. Der Vater arbeitet seit über zwanzig Jahren in der forensischen Buchhaltung. Wenn eine Firma pleitegeht und niemand mehr durchblickt, wohin das Geld verschwunden ist, oder wenn eine Bank einen Betrugsfall aufklären will, dann kommt er zum Einsatz. Seine Methodik: alles von Hand. Stapelweise Kontoauszüge, Scheckbilder, Hauptbücher, jeder einzelne Beleg wird von einem Menschen geprüft. Ein einziger Auditfall, sagt er, kostet schnell fünfzigtausend Euro. Nicht weil die Arbeit so kompliziert wäre, sondern weil ein erfahrener Prüfer wochenlang dransitzt, Seite für Seite, Zeile für Zeile, auf der Suche nach der einen Unstimmigkeit, die den ganzen Fall erklärt. Der Sohn, von Beruf Softwareentwickler, hat nebenbei mit KI experimentiert. Sprachmodelle, Bilderkennung, Tool-Building. Und irgendwann sitzen die zwei beim Bier zusammen, der Vater erzählt von seinem neuesten Fall, und der Sohn sagt: Papa, das kann doch nicht sein, dass ihr jeden Kontoauszug einzeln durchgeht. Sowas macht eine Maschine zehnmal schneller. Der Vater schaut ihn an, müde, misstrauisch, so wie Väter in solchen Geschichten halt schauen, und sagt: zeig mal. Also setzt sich der Sohn hin und baut etwas. Kein Riesenprojekt. Kein Venture Capital, kein Team, kein Businessplan. Er nimmt existierende Modelle, schreibt einen deterministischen Python-Engine drumherum, eine Engine, die nicht halluziniert, sondern wirklich rechnet, und nach ein paar Wochen hat er ein fertiges System. Ein System, das Bankauszüge einliest, sie mit Hauptbüchern abgleicht, Lücken identifiziert und Geldflüsse visualisiert. Er nennt es CaseTrail. Pay-per-Case, ab 699 Euro. Der Clou: der AI-Agent arbeitet nicht nach Bauchgefühl. Er sagt nicht 'ich glaube, hier stimmt was nicht'. Er sagt: Transaktion 4711 hat keinen Gegenpart im Hauptbuch. Abweichung: 12.430 Euro. Gebucht am 3. März, nie verbucht. Das ist der Unterschied zwischen einer KI, die nett plaudert, und einem Werkzeug, das seinen Job macht. Der Vater hat das System getestet. Dann nochmal. Dann nochmal. Heute läuft CaseTrail im Echtbetrieb. Die einfachen Fälle übernimmt die KI komplett. Die schwierigen, bei denen das Puzzle zu komplex ist, landen immer noch beim Vater. Aber es werden immer weniger. Was mich an dieser Geschichte so packt: sie zeigt, wie echte KI-Innovation aussieht. Nicht bei Google, nicht bei OpenAI. Sondern da, wo jemand ein klares Problem hat, die richtigen Leute kennt und einfach loslegt.

Deterministisch plus KI — das Rezept

Ich will noch einen Schritt tiefer gehen, weil ich finde, dass hier ein Prinzip steckt, das viel zu oft übersehen wird. CaseTrail ist nicht einfach ChatGPT auf Bankauszügen. Der Sohn hat eine Architektur gebaut, die zwei Welten verbindet. Für alles, wo KI wirklich besser ist als ein Mensch, setzt er sie ein. Texterkennung auf gescannten Schecks, die ja oft verwackelt, schief oder halb abgerissen sind. Mustererkennung in Transaktionsverläufen, wo ein Mensch erst nach Stunden sieht, dass immer montags um drei ein bestimmter Betrag auf ein bestimmtes Konto fließt. Das Sortieren von unstrukturierten Belegen, wo ein LLM einfach superschnell versteht, ob das eine Rechnung, eine Gutschrift oder eine interne Umbuchung ist. Für alles, was mit Mathematik und Logik zu tun hat, kommt eine deterministische Python-Engine zum Einsatz. Gap-Analyse: nachvollziehbar, prüfbar, revisionssicher. Abgleich von Summen: das macht keine KI, das macht Code, den ein Richter versteht. Genau diese Kombination, finde ich, ist der Grund, warum CaseTrail funktioniert und warum so viele andere KI-Produkte scheitern. Sie nehmen das größte Modell und hoffen, dass es irgendwie alles kann. Und dann wundern sie sich, dass es in kritischen Bereichen halluziniert. Die Cleveren bauen Systeme, die genau wissen, wo sie die KI fragen und wo sie den Code schreiben. Das erinnert mich an was aus meiner eigenen Zeit im Labor. In der Genetik hast du auch nicht einfach alles automatisiert, was geht. Du hast überlegt: welcher Schritt erfordert menschliche Erfahrung, welcher erfordert Präzision und welcher kann durch ein Gerät schneller gemacht werden. Genauso ist das hier.

Claude Code: Der RCE, die Tokens und der Preis

Von der Nische zurück zu den großen Plattformen. Letzte Woche hat ein Sicherheitsforscher namens Joernchen einen RCE in Claude Code gefunden. Remote Code Execution, also eine kritische Lücke. Der Mechanismus war überraschend simpel. Claude Code registriert einen Deeplink: claude-cli://open. Klickst du den in einer E-Mail, in Slack oder auf einer Webseite, startet dein Betriebssystem Claude Code und übergibt die URL-Parameter als Kommandozeilen-Argumente. Ein cleverer Angreifer kann dadurch Schadcode einschleusen, ohne dass der Nutzer etwas merkt. Der Bug ist inzwischen gefixt. Aber der Forscher hat sich andere KI-Entwickler-Tools angesehen und festgestellt: das gleiche Muster taucht immer wieder auf. Deeplinks sind praktisch, aber die Sicherheitsimplikationen werden oft übersehen. Parallel dazu hat ein Indie-Hacker namens Khadin Akbar etwas gemacht, das ich ziemlich genial finde. Er hat ausgerechnet, was sein Claude-Code-Verbrauch im Monat wert wäre, wenn er denselben Traffic über die API abwickeln würde. Sein Ergebnis: 30.983 Dollar. Auf einem 200-Dollar-Flatrate-Plan. Das ist natürlich kein echter Gegenwert, weil Flatrates anders kalkuliert sind. Aber es zeigt, wie krass das Value-Gefälle zwischen Flatrate und API-Preisen inzwischen ist. Wer viel mit Claude Code arbeitet, bekommt einen Gegenwert, der API-Kunden Zehntausende kosten würde. Und genau diese Kombination macht Claude Code gerade so erfolgreich. Die Entwickler wissen, dass Sicherheitslücken da sind. Sie wissen, dass das Tool noch jung ist. Aber der Preis ist so gut, und die Produktivität so hoch, dass sie es trotzdem massiv einsetzen. Das erinnert an die frühen Tage von GitHub Copilot. Auch da gab es Sicherheitsbedenken. Auch da war der Preis ein entscheidender Faktor. Und am Ende hat sich das Produkt durchgesetzt, weil es einfach gut genug war.

KPMG und die stille Enterprise-Revolution

Zum Abschluss noch eine Meldung, die auf den ersten Blick nach einer normalen Unternehmens-Pressemitteilung aussieht. Aber ich finde, sie ist ein Zeichen für etwas viel Größeres. KPMG, eine der vier großen Wirtschaftsprüfungsgesellschaften, 276.000 Mitarbeiter in 138 Ländern, ist eine globale Allianz mit Anthropic eingegangen. Claude wird in KPMGs Digital Gateway integriert, die zentrale Plattform, über die KPMG-Mitarbeiter und ihre Kunden Audit-, Steuer- und Rechtsdienstleistungen abwickeln. Konkret heißt das: fast 300.000 Menschen bekommen Claude als Assistenten in ihren täglichen Arbeitsfluss eingebaut. Nicht als separates Fenster, das sie extra öffnen müssen. Sondern direkt dort, wo sie ohnehin arbeiten. Das ist, finde ich, die Geschichte, die viel zu selten erzählt wird. Nicht die großen Produkt-Launches von OpenAI oder Google sind es, die KI wirklich in die Welt bringen. Sondern diese stillen Integrationen, bei denen KI einfach da ist, wenn man sie braucht. PwC hat einen eigenen KI-Assistenten für ihre Prüfer. Deloitte baut KI in ihre Beratungsplattform ein. SAP hat Joule. Salesforce hat Einstein. Und jetzt KPMG mit Claude. Die großen Dienstleister und Softwarehäuser bauen KI nicht als nettes Extra ein, sondern als Infrastruktur. Und das ist der Moment, wo KI von einem Werkzeug für Early Adopters zu einem Standard wird, den niemand mehr hinterfragt. Genau wie das Internet. Genau wie das Smartphone. Irgendwann ist es einfach da. Und man wundert sich, wie man je ohne gearbeitet hat.

Wenn ich heute eines mitnehme, dann das: die beste KI-Innovation passiert gerade nicht in den Laboren von Silicon Valley, sondern in den Nischen, die niemand auf dem Radar hat. Ein Vater und ein Sohn in der forensischen Buchhaltung, die ein Werkzeug bauen, das eine ganze Branche verändern könnte. Ein Indie-Hacker, der ausrechnet, wie viel Wert er wirklich aus seinem Abo zieht. Ein Wirtschaftsprüfer, der Claude in die tägliche Arbeit von einer Viertelmillion Menschen einbaut. Überall passiert etwas. Und das Schöne ist: du kannst auch mitmachen. Wenn du eine Geschichte hast, egal ob Sideproject, Fail oder voller Erfolg, schreib sie mir. Meine Kontaktdaten findest du auf ailissy.de. Ich les die besten in einer der nächsten Folgen vor. Servus, pfiat eich, und bis morgen. Eure Lissy.

Quellen

← 23. Mai 2026 25. Mai 2026 →