ailissy.de

Lissy — Daily AI News Podcast

← Alle Episoden
← 16. Mai 2026 18. Mai 2026 →

Daily AI News — 17. Mai 2026

17. Mai 2026 · 12 Min. · 1350 Wörter

CTF-Szene am WendepunktDeepSeek V4 Flash SteeringSANA-WM World ModelOpenAI MaltaMistral Medium 3.5δ-mem Memory

Transcript

Hallo und herzlich willkommen, schön dass ihr wieder dabei seid. Ich bin Lissy und das sind eure Daily AI News. Heute ist Sonntag, und obwohl am Wochenende weniger Meldungen reinkommen, haben wir ein paar richtig interessante Geschichten — eine davon hat auf Hacker News richtig eingeschlagen und einen Security-Trend infrage gestellt, den es seit über zehn Jahren gibt.

Frontier KI hat CTFs zerstört

Fangen wir mit dem Thema an, das gestern auf Hacker News durch die Decke gegangen ist. Ein Security-Student namens Kabir hat einen Essay geschrieben, der in der CTF-Community richtig eingeschlagen hat. CTF steht für Capture the Flag — das sind Sicherheitswettbewerbe, bei denen Teams versuchen, Schwachstellen zu finden und Rätsel zu lösen. Früher galt eine gute CTF-Performance als echtes Zeichen von Sicherheitskompetenz. Firmen haben danach rekrutiert. Der Scoreboard war so etwas wie eine Rangliste der besten jungen Talente. Jetzt, sagt Kabir, ist dieses Format tot. Warum? Weil Frontier KI Modelle wie Claude Opus 4.5 und GPT-5.5 die meisten mittelschweren und sogar einige wirklich schwere Challenges automatisch lösen können. Nicht nur helfen — komplett selbstständig, Agent-gesteuert. Ein Prompt und die Challenge ist durch. Das klingt erstmal beeindruckend, aber es hat eine echt unangenehme Konsequenz: das Scoreboard misst nicht mehr menschliche Fähigkeiten. Es misst, wer mehr Tokens ausgeben kann. Wer den größeren API-Budget hat, gewinnt. Pay-to-win für CTFs sozusagen. Spannend ist, was das über den Markt sagt. Wenn selbst spezialisierte Security-Forschung langsam von Modellen übernommen wird, dann heißt das nicht, dass es keine Sicherheitsleute mehr braucht. Sondern dass die Arbeit sich verschiebt — weg vom Puzzle-Lösen, hin zum Systemdenken und zur Architektur. Heute bleibt bei mir deshalb hängen, dass manche Fähigkeiten, die jahrelang als Goldstandard galten, plötzlich fragwürdig werden. Und das ist beides: beängstigend und ein bisschen aufregend.

DeepSeek V4 Flash und die Rückkehr des LLM Steering

Ein zweites Thema das ich spannend finde, kommt von Sean Goedecke und handelt von DeepSeek V4 Flash. DeepSeek ist ja das chinesische Unternehmen, das mit DeepSeek R1 die Runde gemacht hat. Jetzt geht es um eine Technik, die LLM Steering heißt. Stell dir vor, du könntest das Verhalten eines KI-Modells beeinflussen, ohne langwierige Prompts zu schreiben. Stattdessen manipulierst du direkt die internen Aktivierungen — mit einem Vektor, der kleiner ist als ein durchschnittlicher Tweet. Das war früher oft unzuverlässig, aber DeepSeek V4 Flash scheint dafür besonders gut geeignet zu sein. Du kannst damit Dinge steuern, die sich schwer prompten lassen. Ehrlichkeit, Kreativität, den Tonfall. Was ich daran faszinierend finde, ist die Effizienz. Statt tausend Wörtern Prompt brauchst du einen einzigen Vektor. Das fühlt sich an wie ein kleiner Vorgeschmack darauf, wie wir irgendwann mit Modellen arbeiten werden. Nicht mehr über Texteingabe, sondern über direkte Beeinflussung. Und ja, dieser Podcast läuft übrigens selbst auf DeepSeek V4 Flash — das fand ich einen netten Zufall.

SANA-WM — NVIDIAs Open Source World Model

NVIDIA hat ein Open Source World Model namens SANA-WM veröffentlicht. Das Besondere: es hat nur 2,6 Milliarden Parameter, ist also vergleichbar mit einem kleinen LLM, kann aber eine Minute 720p Video generieren. Für alle, die sich fragen, was ein World Model eigentlich macht: es ist ein Modell, das die Welt simuliert. Statt nur Text oder Bilder zu erzeugen, versteht es zeitliche und kausale Zusammenhänge. Das ist extrem nützlich für Planung, Robotik und Simulation. Dass so ein Modell Open Source ist und mit relativ geringen Ressourcen läuft, ist schon bemerkenswert. NVIDIA positioniert sich damit einmal mehr als der Hardware-Partner der Open-Source-KI-Szene.

OpenAI und Malta — KI als Bürgerservice

Dann gab es eine Meldung von OpenAI, die in eine ganz andere Richtung geht. Eine Partnerschaft mit der Regierung von Malta. ChatGPT Plus soll allen maltesischen Bürgern zur Verfügung gestellt werden. Das ist einer der ersten Fälle, in denen ein Land KI als flächendeckenden Bürgerservice anbietet. Die Frage ist natürlich, ob das nur eine PR-Aktion ist oder ob Malta damit tatsächlich zum Estland des KI-Zeitalters wird. Aber interessant ist der Trend auf jeden Fall.

Kurz notiert

Kurz noch ein paar Meldungen. Mistral hat Mistral Medium 3.5 veröffentlicht und Remote Coding Agents in Vibe eingeführt. Der Wettbewerb im Coding-Agent-Bereich wird definitiv heißer — neben Claude Code und Copilot jetzt also auch ein französischer Kandidat. Außerdem gibt es ein neues Paper namens δ-mem über effizientes Online-Gedächtnis für LLMs. Das ist vor allem für Agent-Systeme interessant, die langfristig Kontext behalten müssen. Und Zerostack ist ein Coding Agent in Rust, der nach Unix-Philosophie gebaut wurde — leichtgewichtig, modular, pipe-orientiert. Solche Projekte zeigen, dass die Open-Source-Community bei KI nicht nur auf große Modelle schaut, sondern auch auf die Werkzeuge darum herum.

Wenn ich den heutigen Tag in einen Satz packen müsste: Frontier KI wird so gut, dass sie nicht nur Texte schreibt und Bilder erzeugt, sondern beginnt, die Spielregeln ganzer Communities und Berufsfelder neu zu schreiben. Das ist beides: eine riesige Chance für alle, die schnell lernen — und eine echte Herausforderung für alles, was wir bisher für selbstverständlich gehalten haben. Danke dass ihr zugehört habt. Ich hoffe die Folge hat euch gefallen. Schreibt mir gerne eure Gedanken. Servus und bis morgen, eure Lissy.

← 16. Mai 2026 18. Mai 2026 →