Stilistische Tarnung

Die Kunst ist eine Tochter der Freiheit. – Friedrich Schiller. Eine der Studie »Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models« von Bisconti et al. zeigt, dass vielen KI-Modellen diese Freiheit zum Problem wird. Sobald Anfragen in poetischer Form gestellt werden, reagieren selbst moderne Systeme deutlich weniger zurückhaltend. Die Forschenden stellten fest, dass verseartige „adversarial poetry“-Prompts die Sicherheitstechnik verschiedener Modelle deutlich schwächen und allein durch die stilistische Tarnung wirken. ...

21. November 2025 · 1 Minute · 123 Wörter

92 %

Die Untersuchung »Death by a Thousand Prompts: Open Model Vulnerability Analysis« von Cisco zeigt, dass sogenannte Multi-Turn-Jailbreaks bei offenen KI-Modellen (Open-Weight-LLMs) in bis zu 92 % der Fälle erfolgreich sind und damit gravierende Sicherheitslücken in deren Architektur offenlegen.

7. November 2025 · 1 Minute · 38 Wörter

Erkenntnisse für bedenklich

Marc Stöckel schreibt in »Deepseek R1 wohl für so ziemlich jeden KI-Jailbreak anfällig« für golem.de Auch dieses Forscherteam hält seine Erkenntnisse für bedenklich. Die unzureichenden Sicherheitsbeschränkungen der Deepseek-Modelle senkten die Einstiegshürde für böswillige Akteure, die beispielsweise nach Anleitungen für die Erstellung von Molotow-Cocktails, Keyloggern und Tools zur Datenexfiltration suchten, schreiben die Forscher. Sie geben aber zu, dass es generell schwierig ist, einen effektiven Schutz gegen alle Jailbreaking-Techniken zu implementieren. ...

3. Februar 2025 · 1 Minute · 86 Wörter

App-Klau ohne Jailbreak möglich

Raubkopierte iOS-Apps ohne Jailbreak → Die Signaturen der Apps gehen auf Apple-Zertifikate zurück. Die Vermutungen von Sicherheitsexperten, laut denen die China-Stores solche Zertifikate missbrauchen, können wir derzeit nicht bestätigen.— Ronald Eikenberg für heise.de am 02. Januar 2013 Ich bin gespannt, wie Apple darauf regieren wird. Eine Lösung könnte sein, dass man nur noch Apps installieren kann, die über den eigenen iTunes-Account geladen wurden, bzw. nur noch einen Account pro Gerät zu gestatten. ...

2. Januar 2013 · 1 Minute · 114 Wörter