Stilistische Tarnung

Die Kunst ist eine Tochter der Freiheit. – Friedrich Schiller. Eine der Studie »Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models« von Bisconti et al. zeigt, dass vielen KI-Modellen diese Freiheit zum Problem wird. Sobald Anfragen in poetischer Form gestellt werden, reagieren selbst moderne Systeme deutlich weniger zurückhaltend. Die Forschenden stellten fest, dass verseartige „adversarial poetry“-Prompts die Sicherheitstechnik verschiedener Modelle deutlich schwächen und allein durch die stilistische Tarnung wirken. ...

21. November 2025 · 1 Minute · 123 Wörter

statistisch am wahrscheinlichsten

Dieter Petereit schreibt in »OpenAI o3 und o4-mini: Warum längeres Nachdenken die KI wirklich smart macht« für t3n.de Erstmals können diese Modelle agentenhaft agieren. Sie nutzen und kombinieren eigenständig alle verfügbaren Werkzeuge innerhalb von ChatGPT – von der Websuche über die Datenanalyse mit Python bis hin zur Bildanalyse und sogar Bilderzeugung. Sie entscheiden selbst, wann und wie sie diese Tools einsetzen, um komplexe, vielschichtige Probleme zu lösen. Dazu benötigen sie mehr Bedenkzeit. ...

20. April 2025 · 1 Minute · 189 Wörter