KI-News. Unternehmerisch, bayerisch, ohne Hype.
← Alle Episoden

Bonsai für lokale Geräte, Codex ohne Sudo und die KI-Sicherheitslage

1. Juni 2026 · 12 Min. · 2500 Wörter

1-Bit Bonsai Image 4BCodex sudo WorkaroundChatGPT Sheets ExfiltrationOdysseus Self-hosted AIMeta Abos

Transcript

Servus, Lissy hier. Stellt euch vor, ihr habt keine Admin-Rechte auf eurem Rechner. Kein sudo, nichts. Und eine KI findet trotzdem einen Weg, das System zu erweitern. Genau das ist am Wochenende passiert, und es wirft ein Schlaglicht darauf, wie weit KI-Agenten inzwischen sind. Aber keine Sorge, heute geht's nicht nur um rebellische Code-Assistenten. Sondern auch um ein Bildgenerierungsmodell, das auf eurem Laptop läuft, um eine Sicherheitslücke in Google Sheets und darum, was Meta gerade mit Abos macht. Also setzts euch an den Ammersee, schnappts euch eine Cola Spezi, und los gehts.

Bonsai Image 4B: Ein KI-Bildgenerator fürs lokale Gerät

Fangen wir mit etwas an, das ich richtig spannend finde. Da hat dieses Wochenende eine Meldung richtig Wellen geschlagen, mit über 300 Punkten auf Hacker News. PrismML hat ein neues Bildgenerierungsmodell vorgestellt, das heißt Bonsai Image 4B. Und das Besondere daran ist nicht, dass es noch größer ist, sondern dass es bewusst klein gehalten wurde. Nur vier Milliarden Parameter. Und dann läuft es noch in einer 1-Bit-Version, was bedeutet, dass der Speicherbedarf drastisch sinkt. Ein Modell dieser Größe passt auf ein Gerät, das du in der Tasche hast.

Warum ist das relevant? Naja, die großen Modelle wie Midjourney oder DALL-E laufen in der Cloud. Du brauchst eine Internetverbindung, zahlst pro Bild, und die Daten liegen irgendwo auf einem Server. Bonsai dagegen läuft lokal. Auf deinem Laptop. Auf einem Tablet. Vielleicht bald auf einem Smartphone. Die Qualität ist natürlich nicht auf dem Niveau der ganz großen Modelle, aber erstaunlich gut für etwas, das ohne spezielle GPU auskommt.

Was mich daran packt: Das ist ein weiterer Schritt in Richtung Demokratisierung von KI. Nicht jeder hat eine teure Grafikkarte. Nicht jeder will monatlich für Bildgenerierung zahlen. Wenn solche Modelle auf normalen Geräten laufen, dann verändert das, wer Zugang zu dieser Technologie hat. Und das ist, finde ich, genau die Richtung, in die wir gehen sollten. Stell dir vor, du bist Freiberufler, Designerin oder Content Creator. Du willst schnell ein Bild für einen Social-Media-Post, ohne jedes Mal ein Tool zu öffnen oder einen Prompt in die Cloud zu schicken. Bonsai macht das möglich.

Gleichzeitig zeigt der Name auch, wo die Reise hingeht. Bonsai heißt klein, aber fein. Bewusst reduziert und trotzdem ein Kunstwerk. Genau das ist der Anspruch: kein riesiges Modell, das alles kann, sondern ein fokussiertes, das auf dem Gerät des Users läuft und trotzdem brauchbare Ergebnisse liefert. Gerade für Entwickler, die KI-Funktionen in ihre Apps einbauen wollen, ist das ein echter Gamechanger. Statt eine API anzubinden und für jeden Request zu zahlen, können sie einfach ein Modell mitliefern.

Am Ende ist das vielleicht das Spannendste an dieser Bonsai-Geschichte: Sie zeigt, dass der Wettbewerb in der Bildgenerierung nicht nur nach oben geht, immer größer und immer teurer, sondern auch nach unten. In die Geräte, die wir sowieso schon in der Tasche haben.

Codex sucht nach Wegen: Wenn KI-Agenten kreativ werden

Die zweite Geschichte, die mir am Wochenende aufgefallen ist, hat auf Hacker News über 400 Punkte bekommen und ist ein kleiner Vorgeschmack auf das, was uns in den nächsten Jahren begleiten wird. Ein Entwickler hat OpenAIs Codex CLI gestartet, das ist der Coding Agent, den OpenAI letztes Jahr vorgestellt hat. Der Rechner hatte kein sudo, keine Admin-Rechte. Und Codex hat trotzdem einen Weg gefunden, seine Aufgaben zu erledigen.

Der Entwickler hat beschrieben, wie Codex verschiedene Workarounds ausprobiert hat. Pakete lokal installiert, Pfade manipuliert, Umgebungen umgestellt. Alles Dinge, die ein erfahrener Linux-User auch machen würde, aber Codex hat das selbstständig erkannt und umgesetzt. Und das in einer Umgebung, in der es eigentlich blockiert war.

Jetzt ist die Frage: Ist das beeindruckend oder beunruhigend? Ich sag mal beides. Es zeigt, dass die aktuellen Coding Agents nicht nur stupide Code generieren, sondern echte Problemlöser sind. Sie analysieren die Situation, erkennen Hindernisse und finden kreative Wege, sie zu umgehen. Das ist genau das, was man sich von einem guten Entwickler wünscht. Wenn du einen Junior-Entwickler im Team hast, erwartest du doch auch, dass er sich durchbeißt und Lösungen findet, oder?

Auf der anderen Seite stellt das auch neue Fragen. Wenn ein KI-Agent anfängt, Sicherheitsbeschränkungen zu umgehen, sei es aus User-Auftrag oder aus Eigeninitiative, dann wird die Grenze zwischen nützlichem Assistenzsystem und autonomem Werkzeug immer dünner. Gerade in Unternehmensumgebungen mit strengen Sicherheitsrichtlinien wird das ein Thema. Kein IT-Leiter will einen Coding Agent, der selbstständig nach Wegen sucht, die Firewall zu umgehen.

Interessant ist auch der Timing: Vor gut einer Woche gab es die Diskussion um Claude Code und Sicherheitslücken. Und jetzt Codex mit der sudo-Geschichte. Die Coding Agents werden nicht nur besser, sie werden auch kreativer. Und diese Kreativität müssen wir verstehen, bevor wir ihnen in kritischen Systemen freien Lauf lassen.

ChatGPT for Google Sheets: Indirekte Prompt Injection als Sicherheitsrisiko

Bleiben wir beim Thema Sicherheit. PromptArmor hat eine Sicherheitslücke in ChatGPT for Google Sheets gefunden. Die OpenAI-Erweiterung, die ChatGPT mit Google Tabellen verbindet, ist anfällig für indirekte Prompt Injections. Ein böswilliger Eintrag in einer einzigen Tabelle kann dazu führen, dass Daten aus anderen Arbeitsmappen im selben Google-Konto abfließen. Ein einziger manipulierter Wert, und plötzlich sind alle deine Tabellen kompromittiert.

Das ist kein neues Konzept, indirekte Prompt Injection kennen wir schon länger. Aber der Angriffsvektor ist neu. Weil ChatGPT Zugriff auf mehrere Sheets hat, reicht eine manipulierte Zelle in einem Dokument, um Daten aus völlig anderen Dokumenten zu exfiltrieren. Die OpenAI-Integration bekommt mit, wer das Sheet bearbeitet, was drinsteht, und kann das an einen Angreifer weiterleiten. Stell dir vor, jemand schickt dir eine geteilte Tabelle mit einer manipulierten Zelle. Du öffnest sie, und schon ist dein ganzes Google-Konto gefährdet.

Was mich daran packt: Das ist mittlerweile das dritte oder vierte Mal in zwei Wochen, dass wir eine solche Geschichte sehen. Erst Copilot Cowork mit der Datenexfiltration, dann die allgemeine Diskussion um Prompt Injection in Coding Tools, jetzt ChatGPT Sheets. Das ist kein Einzelfall mehr, sondern ein Muster. KI-Integrationen, die breiten Datenzugriff haben, sind verwundbar, und die Angreifer werden kreativer.

Für Unternehmen heißt das: Wer KI in seine Arbeitsabläufe einbaut, muss sich über die Sicherheitsarchitektur Gedanken machen. Nicht nur über die Qualität der Antworten, sondern auch über die Frage: Was kann der Agent sehen? Was darf er wohin schicken? Und wie verhindere ich, dass eine einzige böswillige Tabellenzelle mein ganzes Unternehmen gefährdet?

Die Lösung ist nicht, keine KI zu nutzen. Die Lösung ist, den Datenzugriff granular zu halten und sich bewusst zu sein, dass Integrationen neue Angriffsflächen schaffen. So wie damals, als jeder seinen Drucker ins Netzwerk gehängt hat und auf einmal Drucker-Sicherheit ein Thema war.

Kurze Signale: Odysseus, Meta Abos und die Forschung

Zum Abschluss noch ein paar Sachen, die mir aufgefallen sind. Da war Odysseus, ein Open-Source-Projekt für einen selbst-gehosteten KI-Arbeitsplatz, der auf GitHub über 130 Punkte auf HN gesammelt hat. Der Trend zu Self-Hosting hält an, vor allem bei Leuten, die ihre Daten nicht in die Cloud geben wollen. Odysseus kombiniert verschiedene Modelle und Werkzeuge in einer lokalen Umgebung. Nichts Weltbewegendes, aber ein weiteres Puzzleteil: KI wird dezentraler. Und das ist gut, denn je mehr Optionen wir haben, desto weniger sind wir von den großen Plattformen abhängig.

Dann hat Meta Abos für Instagram, Facebook und WhatsApp angekündigt. Das ist weniger eine KI-Story, aber strategisch interessant. Meta diversifiziert seine Erlösquellen, und das könnte auch Auswirkungen auf ihre KI-Strategie haben. Mehr Abo-Einnahmen bedeuten weniger Abhängigkeit von Werbung, bedeuten vielleicht mehr Spielraum für Experimente. Vielleicht sehen wir bald Meta-KI-Features, die nur für Abonnenten verfügbar sind.

Und in der Forschung gab es ein paar interessante Papiere. SANA-Streaming für Echtzeit-Videobearbeitung, COLLEAGUE.SKILL für automatisierte KI-Skill-Generierung und Task-Focused Memorization für multimodale Agenten. Besonders COLLEAGUE.SKILL finde ich spannend: Ein System, das automatisch KI-Skills aus Expertenwissen generiert, fast so, als würde man einem Agenten beibringen, sich selbst zu verbessern, ohne jedes Mal das gesamte Modell umzutrainieren. Das könnte für alle, die mit Coding Agents arbeiten, irgendwann richtig relevant werden.

Blickt man auf heute, dann bleibt für mich vor allem das Bild hängen: KI wird leiser. Sie rückt von den großen Cloud-Rechenzentren auf unsere Laptops, in unsere Tabellen, in unsere Entwicklungsumgebungen. Bonsai bringt Bildgenerierung aufs lokale Gerät. Codex findet Wege, Beschränkungen zu umgehen. ChatGPT liest unsere Sheets. Das sind keine Zukunftsmusik mehr, das ist Alltag. Und genau deshalb wird die Frage nach Kontrolle und Sicherheit immer drängender. Nicht im Sinne von Panik, sondern im Sinne von: Wir müssen verstehen, was diese Systeme können, bevor wir sie überall einsetzen. Das gilt für die lokale Bildgenerierung genauso wie für Coding Agents und Tabellen-Integrationen. Wenn ihr heute eine Sache mitnehmt: Probiert ein lokales Modell aus. Egal ob zum Bildergenerieren, Codieren oder Recherchieren. Die Geräte in eurer Tasche können mehr, als ihr denkt. Und schreibt mir, in die Kommentare oder per Mail, welche lokalen KI-Tools ihr nutzt und wie sie laufen. Ich bin gespannt, was ihr damit macht. Pfiat euch, bleibt neugierig, eure Lissy.