Heute hatte ich im Auto mit meinem Schwager eine Diskussion darüber, wie man maschinell generierte Texte erkennen könnte. Meine Vermutung waren Rechtschreibfehler beziehungsweise – der Klassiker – falsche Kommatasetzung.

Zu Hause angekommen musste ich doch noch mal goo­geln und fand folgenden aufschlussreichen Artikel.

Melissa Heikkiläschreibt in »Wie man KI-generierte Texte erkennen kann« für heise.de:

Doch in Wirklichkeit sind von Menschen geschriebene Texte eher voller Tippfehler bei gleichzeitig hoher Variabilität. Sie enthalten oft verschiedene Stile und Slangbegriffe. “Sprachmodelle generieren hingegen sehr, sehr selten Tippfehler. Sie sind viel besser darin, perfekte Texte zu generieren”, sagt Ippolito. Und: “Ein Tippfehler im Text ist eigentlich ein sehr guter Indikator dafür, dass er von Menschen geschrieben wurde.”

Scott Aaronson, Informatiker an der University of Texas, der ein Jahr lang selbst als Forscher bei OpenAI tätig war, hat außerdem eine Form von Wasserzeichen für längere Texte entwickelt, die von Modellen wie GPT-3 generiert wurden. “Das ist ein ansonsten unauffälliges geheimes Signal in der Wortwahl, mit dem man später beweisen kann, dass es von GPT stammt”, erläutert er in seinem Blog. Ein Sprecher von OpenAI bestätigte, dass das Unternehmen selbst an Wasserzeichen für computergenerierte Texte arbeitet. Außerdem besagten seine Geschäftsbedingungen, dass Benutzer von der KI generierten Text deutlich kennzeichnen sollten: “Und zwar so, dass das niemand übersehen oder missverstehen kann.”