Anthropic hat mit Claude Mythos Preview ein KI-Modell entwickelt, das so leistungsfähig beim Aufspüren und Ausnutzen von Software-Schwachstellen ist, dass es nicht öffentlich veröffentlicht wird — eine bislang einmalige Entscheidung in der KI-Industrie. Das Modell hat bereits tausende Zero-Day-Sicherheitslücken identifiziert, darunter einen 27 Jahre alten Bug im Betriebssystem OpenBSD, der jahrzehntelang unentdeckt geblieben war.
Statt einer öffentlichen Veröffentlichung startet Anthropic das „Project Glasswing": 40 ausgewählte Partner-Organisationen — darunter Apple, AWS, Google, Microsoft und Nvidia — erhalten kontrollierten Zugang zu Mythos, ausschließlich für defensive Cybersicherheitszwecke. Das Modell soll kritische Software-Infrastruktur absichern, bevor Angreifer die Lücken finden.
Diese Entscheidung markiert eine Zäsur: Erstmals zieht ein führendes KI-Labor eine harte Grenze zwischen dem, was es kann, und dem, was es freigeben will. Die Botschaft ist klar — capability does not equal release. Für die Debatte um KI-Sicherheit und verantwortungsvolle Entwicklung dürfte Project Glasswing wegweisend sein.
→ Zum Artikel (Fortune) → TechCrunch
KW 15 hat mir eine Frage aufgeworfen, die mich beschäftigt: Wer entscheidet, welche KI zu mächtig für die Welt ist? Anthropics Entscheidung, Claude Mythos zurückzuhalten, ist ein historischer Moment — aber auch ein bedenklicher. Denn die gleichen Unternehmen, die Modelle bauen, die sie selbst als zu gefährlich einstufen, sind auch die, die darüber befinden, wer Zugang bekommt. Die Frontier Labs agieren zunehmend wie geschlossene Clubs mit eigenen Regeln — und das ausgerechnet in einer Woche, in der der EU AI Act erstmals echte Zähne zeigt. Das Spannungsfeld zwischen technologischer Selbstregulierung und demokratischer Kontrolle wird 2026 zur Kernfrage — für Unternehmen, für Regulierer und für jeden, der KI verantwortungsvoll einsetzen will.