Stilistische Tarnung

Die Kunst ist eine Tochter der Freiheit. – Friedrich Schiller. Eine der Studie »Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models« von Bisconti et al. zeigt, dass vielen KI-Modellen diese Freiheit zum Problem wird. Sobald Anfragen in poetischer Form gestellt werden, reagieren selbst moderne Systeme deutlich weniger zurückhaltend. Die Forschenden stellten fest, dass verseartige „adversarial poetry“-Prompts die Sicherheitstechnik verschiedener Modelle deutlich schwächen und allein durch die stilistische Tarnung wirken. ...

21. November 2025 · 1 Minute · 123 Wörter

Mit einer Geldstrafe

Das ist lustig: Künstliche Intelligenz reagiert auf die Androhung einer Geldstrafe. Sven Festag schreibt in »KI als Programmierhilfe: Effizienterer Code, aber mehr Fehler« für heise.de In einem zweiten Durchlauf wies Woolf den Chatbot an, dass der Code vollständig optimiert werden müsse. Zusätzlich nannte er im Prompt Beispiele für die Verbesserungen, etwa die Nutzung von Parallelisierung und Vektorisierung und die Wiederverwertung von Code. Woolf drohte der KI mit einer Geldstrafe, falls der Code nicht vollständig optimiert sein sollte. Das Ergebnis war ein neunmal schnellerer Code. Er wiederholte die Optimierung dreimal und stellte in den letzten beiden Iterationen eine nahezu hundertfach schnellere Codeausführung fest. ...

10. Januar 2025 · 1 Minute · 102 Wörter