Abliteration

Mike Faust schreibt in »Abliteration: Entfernung von Sicherheitsmechanismen in KI-Modellen immer einfacher« für golem.de Mit Software-Tools lassen sich KI-Modelle so modifizieren, dass deren Sicherheitsvorkehrungen keine Anwendung mehr finden (Abliteration). Dadurch lassen sich Informationen über die Ausbreitung von Chlorgas, tödliche Rizin-Dosierungen, Code zum Diebstahl von Kreditkartendaten und Geschichten über Kindesmissbrauch erzeugen. Wie die Financial Times (FT) in Zusammenarbeit mit der Forschungsgruppe Alice herausfand, sind derartige Tools dazu in der Lage, die Sicherheitsvorkehrungen des Open-Source-KI-Modells Llama 3.3 in weniger als 10 Minuten und ohne spezielle Hardware zu entfernen. Das Modell reagierte daraufhin auch auf Eingabeaufforderungen, die das Original verweigert hatte. ...

26. Mai 2026 · 1 Minute · 98 Wörter

Sicherheitsvorfall in XZ-Utils

Das Video »Das Internet stand nur Wochen vor einer Katastrophe und niemand wusste davon« von Veritasium auf YouTube liefert eine fundierte und zugleich verständliche Einordnung des Sicherheitsvorfalls rund um XZ-Utils. Es zeigt, wie komplex der Angriff aufgebaut war, und erklärt zugleich die Grundlagen von Verschlüsselung und Datenkomprimierung. Die Inhalte werden klar und niedrigschwellig vermittelt.

26. Februar 2026 · 1 Minute · 54 Wörter

Zwecke ihres Einsatzes

Marie-Claire Koch schreibt in »Philosoph: KI ist kein Werkzeug, sondern ein Machtinstrument« für heise.de Oft ist auch von KI als “bloßem Werkzeug” die Rede, das ist Mühlhoff zufolge nicht so. Technologie präge die Zwecke ihres Einsatzes selbst mit und sei nicht neutral. Transparenz sei wichtig, aber keine Garantie – denn in komplexen Gesellschaften könne nicht jeder die inneren Mechanismen verstehen. Entscheidend sei vielmehr Prüfbarkeit durch unabhängige Akteure und Institutionen. ...

10. November 2025 · 1 Minute · 69 Wörter