Hast du heute schon was erlebt, das vor einem Jahr noch Science-Fiction gewesen wäre? Bei Anthropic passiert genau das gerade im Alltag. Ingenieure liefern achtmal mehr Code ab als 2024, und über achtzig Prozent davon kommt von Claude. Nicht als Spielerei, sondern in der täglichen Produktion. Und das ist nur eine von mehreren Nachrichten heute, die zeigen wie schnell sich das Tempo gerade ändert. Ich bin Lissy und das sind die wichtigsten KI-Nachrichten der letzten 24 Stunden.
Anthropic hat gestern einen bemerkenswerten Report vom Anthropic Institute veröffentlicht. Titel: When AI Builds Itself. Es geht um rekursive Selbstverbesserung. Also die Idee, dass KI Systeme irgendwann ihre eigenen Nachfolger designen und bauen. Aber der Report ist keine Zukunftsmusik, sondern zeigt mit harten Zahlen, wie weit wir schon sind.
Hier die Daten, die mich wirklich umgehauen haben. Anthropic Ingenieure liefern heute achtmal mehr Code pro Quartal als zwischen 2021 und 2025. Mehr als achtzig Prozent des Codes, der bei Anthropic gemerged wird, stammt inzwischen von Claude. Klar, das ist kein reiner Produktivitätsgewinn, ein Teil ist Review Arbeit. Aber die Richtung ist eindeutig.
Noch krasser. Die Zeitspanne, die Claude autonom arbeiten kann, verdoppelt sich etwa alle vier Monate. Im März 2024 schaffte Claude Opus 3 Aufgaben, die ein Mensch in vier Minuten erledigt. Ein Jahr später schaffte Sonnet 3.7 schon anderthalb Stunden. Noch ein Jahr später. Opus 4.6 bewältigt Zwölf-Stunden Aufgaben. Wenn der Trend hält, sind Tage lange Tasks noch dieses Jahr möglich.
Und das zieht sich durch alle Bereiche. Der SWE Benchmark, der misst ob ein Modell echte Software Bugs fixen kann, ist in zwei Jahren von niedrigen einstelligen Prozenten auf Sättigung gegangen. Auch bei Forschungsexperimenten. Claude optimiert heute Trainingscode 52 mal schneller als vor einem Jahr. Ein menschlicher Forscher braucht vier bis acht Stunden, um eine vierfache Beschleunigung zu erreichen. Claude macht 52 fache in derselben Zeit.
Was mir besonders gut gefällt: Der Report teilt auch mit, wo es noch hakt. Claude kann super implementieren, testen und optimieren. Aber Forschungstalent, also die Frage welches Problem überhaupt wichtig ist, das liegt noch beim Menschen. Aktuell schlägt Claude den Menschen bei der Frage nach dem nächsten Schritt in 64 Prozent der Fälle. Vor sechs Monaten waren es 51 Prozent. Die Lücke schließt sich rasant.
Für mich ist das der spannendste Report seit langem, weil er nicht spekuliert, sondern zeigt was heute schon passiert. Und zwar mit internen Daten von Anthropic, nicht mit geschönten Benchmarks.
Von der Zukunftsforschung zu einer ziemlich konkreten Gegenwartsgeschichte. Der Sicherheitsforscher Buchodi hat die Companion App von Metas Smart Glasses untersucht, Version 273 für Android, und etwas Beunruhigendes gefunden.
Die App enthält eine vollständige, funktionsfähige Gesichtserkennungs Pipeline. Drei Modelle liegen auf dem Gerät. SCRFD zur Gesichtserkennung, KPSAligner zum Ausrichten und ein 96 Megabyte großes SFace Modell, das aus jedem Gesicht einen 2048 dimensionalen biologischen Fingerabdruck macht. Dazu eine lokale Datenbank, ein Cosinus Ähnlichkeits Index und ein vollständig verdrahtetes Benachrichtigungssystem, das dir sagen kann: Person erkannt.
Buchodi hat die Pipeline tatsächlich zum Laufen gebracht. Er hat ein Testfoto genommen, das Modell die Person identifizieren lassen und eine Android Notification bekommen mit der Meldung Person Recognized. Der Haken: Auf einem normalen Konto ist die Funktion nicht aktiviert. Die UI taucht nicht auf, und der Bildschirm, auf den die Notification verlinkt, fehlt in der Build.
Also. Meta hat die komplette Infrastruktur für Gesichtserkennung auf dem Gerät, aber den Schalter nicht umgelegt. Noch nicht. Die Frage ist nicht ob Meta es technisch kann, sondern wann und ob sie es aktivieren. Und ob sie dann fragen, bevor sie es tun.
So eine Entdeckung zeigt, warum es wichtig ist, dass Leute genau hinschauen. Nicht weil Meta böse ist, sondern weil Technologie dieser Art nicht erst dann diskutiert werden sollte, wenn sie live ist. Die Pipeline ist da, sie funktioniert und sie wartet nur darauf aktiviert zu werden.
Wechseln wir zu einem Thema, das technisch klingt, aber handfeste Auswirkungen hat. Ein Forschungsteam um Ali Kayyam hat auf arXiv eine systematische Studie zu den Query, Key und Value Projektionen in Transformatoren veröffentlicht. Klingt abstrakt, ist aber extrem praktisch.
Die zentrale Frage: Brauchen wir wirklich drei separate Projektionen? Oder kann man sie teilen? Die Antwort ist überraschend klar. Wenn man Key und Value zusammenlegt, also Q gleich K gleich V mit geteiltem Key Value, spart man fünfzig Prozent des KV Cache. Bei nur 3,1 Prozent Verlust in der Modellqualität. Und das Beste. Das Kombinieren mit existierenden Techniken wie Grouped Query Attention funktioniert. Q-K=V plus GQA 4 ergibt 87,5 Prozent Cache Einsparung. Plus Multi Query Attention sogar 96,9 Prozent. Das ist fast der gesamte Cache weg.
Warum funktioniert das? Die Autoren zeigen, dass Keys und Values in ähnlichen Repräsentationsräumen liegen. Der Attention Mechanismus arbeitet sowieso in einem Low Rank Bereich. Die Natur macht das Teilen möglich, ohne dass die Qualität leidet.
Praktisch heißt das: On Device Inference wird deutlich günstiger. Wenn du 97 Prozent weniger Cache brauchst, dann läuft ein Transformer auf einem Smartphone oder einer normalen Grafikkarte, wo vorher eine teure Rechenzentrums GPU nötig war. Und das ohne spezielle Quantisierung. Das ist reine Architektur Optimierung.
Interessanter Kontext: Gestern hatten wir KVarN, das KV Cache quantisiert. Heute zeigt dieses Paper, dass man schon auf Architekturebene schlanker bauen kann. Zwei komplementäre Ansätze, die zusammen die Kosten für die Ausführung von Modellen massiv senken werden. Für alle, die lokal oder günstig arbeiten wollen, ist das eine richtig gute Nachricht.
Zum Abschluss eine Geschichte, die zeigt wie KI im echten Engineering Alltag aussieht. Colin Howe, Head of Engineering bei Ashby, hat einen Blogpost geschrieben, der mit einer ziemlich mutigen Grafik startet. Seit August 2025 stammt mehr als die Hälfte des neuen Produktionscodes von KI Systemen. Und die Customer Issues bleiben stabil. Kein Qualitätsverlust, keine Regression in der Geschwindigkeit, keine langsamere Einarbeitung neuer Leute.
Ashby ist kein Spielzeug. Die Firma hat über 100.000 wöchentliche Nutzer und Millionen von Bewerbungen pro Woche. Und sie haben nicht einfach Cursor laufen lassen und gehofft dass es gut geht. Sie haben ihre Prozesse angepasst. Eigene Code Review Tools für Randfälle. Ein trainiertes Modell, das Kundenanfragen automatisch an das richtige Team weiterleitet. Und Claude Code, das eingehende Bugs analysiert und Berichte schreibt, bevor ein Mensch überhaupt hinschaut.
Howes These: Die Kosten für Code Produktion gehen gegen Null. Der Wert eines Engineers liegt nicht mehr im Syntax Tippen, sondern im Urteilsvermögen. Wer versteht, was der Kunde wirklich braucht, wird wichtiger, nicht unwichtiger. Und ein chaotischer Codebestand verlangsamt nicht nur Kollegen, sondern verschlechtert auch jede AI generierte Codezeile, die ihn berührt. Codequalität war schon immer wichtig, aber jetzt hat sie einen Hebel.
Was mich daran überzeugt: Die Ehrlichkeit. Ashby teilt nicht nur die Erfolge, sondern auch die Fallstricke. Es ist leicht, fünf Agents parallel arbeiten zu lassen und sich super produktiv zu fühlen, während man den falschen Bug fixen lässt. Die Hürde ist nicht die Geschwindigkeit der KI, sondern die Klarheit der eigenen Entscheidungen.
Vier Nachrichten, die zusammen ein klares Bild ergeben. KI wird produktiver, alltäglicher und billiger zugleich. Anthropic zeigt dass die Selbstverbesserung schon läuft. Meta dass die Sensoren scharf sind. Die Forschung dass die Hardware günstiger wird. Und Ashby dass echte Firmen das alles schon einsetzen. Was bleibt für heute bei mir hängen? Die Diskussion verschiebt sich von Können wir das? zu Wollen wir das, und wenn ja wie? Und das ist eigentlich eine gute Entwicklung. Denn solange wir uns diese Fragen stellen, sind wir nicht passiv. Falls du dich fragst, wie du selbst von diesen Entwicklungen profitieren kannst: Fang klein an. Probier Claude Code oder Codex für eine konkrete Aufgabe aus. Lies den Anthropic Report, er ist frei verfügbar. Und schau bei deinem nächsten Projekt bewusst hin, wo KI dir Arbeit abnimmt und wo dein Urteil gefragt ist. Das war's für heute. Vielen Dank dass du zugehört hast. Wenn dir die Folge gefallen hat, freue ich mich über eine Bewertung oder eine Nachricht. Pfiat euch und bis morgen, eure Lissy.