Mit dem KI-Tool "Claude Code"
Cyberangriffe: Orchestriert oder automatisiert KI?
Frage, inwieweit nun wirklich von einer ersten KI-gesteuerten Cyberattacke gesprochen werden kann
Von Dr. Martin Krämer, CISO-Advisor bei KnowBe4
Mitte September 2026 entdeckten die Sicherheitsverantwortlichen von Anthropic einen Vorfall, der sich nach eingehender Untersuchung als ein Cyberangriff herausstellte. Mit dem KI-Tool "Claude Code" hatten die Angreifer ihre Attacken auf verschiedene Ziele orchestriert und teilweise sogar automatisiert. Attackiert wurden Technologieunternehmen, Finanzinstitute, Chemieunternehmen und Behörden.
Als Teil der Aufklärung veröffentlichte das KI-Unternehmen einen Report indem es genauer darauf einging, wie die bösartigen Akteure vorgingen. Sie nutzten sowohl die Techniken des Jailbreakings als auch des Social Engineerings, um die eingebauten Schutzvorkehrungen des KI-Tools zu umgehen. Dafür zerlegten sie ihre Angriffsoperationen in kleine, scheinbar harmlose Aufgaben, die das Tool ausführen sollte. Die Social Engineering-Komponente bestand darin, dass sie dem Tool vorspielten, sie wären ein Mitarbeiter einer legitimen Cybersicherheitsfirma und die Antworten auf ihre Fragen würden für defensive Tests verwendet werden. Im weiteren Verlauf der gestarteten Angriffe soll das gejailbreakte Tool dann 80 Prozent der Tätigkeiten übernommen haben.
Soweit nun der Vorfall, dessen Report natürlich für viel Aufsehen gesorgt, aber auch viel Widerspruch aus der Security-Community erhalten hat. Zunächst aber sollten wir festhalten, dass bereits seit einigen Jahren über die Ausnutzung von öffentlich zugänglichen KI-Tools innerhalb der Community diskutiert wird. Gleichzeitig wirft der kritische Blick auf die Dokumentation bei Anthropic jedoch auch die Frage auf, inwieweit nun wirklich von einer ersten KI-gesteuerten Cyberattacke gesprochen werden kann. Kritiker werfen den Forschern vor, den Vorfall zu überzeichnen, dass wesentliche Informationen wie IOCs fehlen oder aber wohl deutlich mehr menschliche Aktivität und Kontrolle stattgefunden haben muss.
Ganz generell aber lässt sich für die Security-Community festhalten, dass mehr und mehr Attacken mit der Unterstützung von KI-Tools zumindest zum Teil automatisiert werden können. Erkenntnisse wie die der Sicherheitsforscher lassen außerdem darauf schließen, dass diese Angriffe über reines Phishing hinausgehen. KI-Agenten lassen sich für Teilaufgaben wie der Zusammenstellung von öffentlich zugänglichen Informationen, Reconnaissance, der Analyse von Schwachstellen oder aber einer Bewertung von technischen Sicherheitsmaßnahmen nutzen. All dies erfordert sicherlich noch die Human Intervention, also das menschliche Eingreifen wie korrigieren, nachrecherchieren. Eine komplette Automation eines Cyberangriffs, die selbständig und auch noch erfolgreich von einem kompromittierten oder aber dafür programmierten KI-Agenten durchgeführt wird, ist nach Einschätzung vieler Experten noch immer Zukunftsmusik. (KnowBe4: ra)
eingetragen: 25.11.25
KnowBe4: Kontakt und Steckbrief
Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.