More data to train

Interessanter Fakt: Whisper von OpenAI wurde nur entwickelt, weil das Unternehmen bereits alle brauchbaren Texte im Internet kopiert, analysiert und zur Schulung ihres LLM genutzt hat. Mit Whisper konnten sie die Audiospuren von YouTube-Videos transkribieren und ebenfalls für ihre Schulung nutzen. indiatimes.com schreibt in »How tech giants cut corners to harvest data for AI« The artificial intelligence lab had exhausted every reservoir of reputable English-language text on the internet as it developed its latest AI system. It needed more data to train the next version of its technology – lots more. ...

12. Mai 2024 · 1 Minute · 111 Wörter

Nicht einfach reparieren

Ich habe etwas Neues gelernt! Obwohl es beinahe offensichtlich ist, war es mir nicht klar. Aktuell können wir fehlerhafte Large Language Models nicht einfach reparieren, wenn sie Fehler machen oder falsche Informationen verbreiten. Das liegt daran, dass LLMs mithilfe neuronaler Netze kreiert werden. Neuronale Netze lernen eigenständig und erstellen mathematische Wahrscheinlichkeiten, indem sie bestimmte Dinge wiederholt mit kleinen Abweichungen berechnen. Wenn man also etwas im LLM ändern möchte, müsste man unzählige dieser Wahrscheinlichkeiten anpassen. Dieser Prozess ist so aufwendig, dass es einfacher ist, ein neues LLM zu erstellen. Deshalb werden GPTs auch in größeren Versionssprüngen veröffentlicht. ...

2. Mai 2024 · 1 Minute · 120 Wörter

Weiterhin gefragt

David Gutensohn schreibt in »ChatGPT: Welche Jobs ChatGPT bereits ersetzt« für zeit.de Überraschend ist, dass sogar in manchen Branchen die Zahl der Anfragen zunehmen, in denen man einen negativen Effekt durch ChatGPT erwartet hätte. Beispielsweise im Kundenservice, der automatisiert werden könnte. Dort steigt die Zahl die Stellenausschreibungen an. Ähnlich wie in Jobs in der Videoproduktion, im Grafikdesign und sogar der Fotografie. Diese Tätigkeiten bleiben trotz ChatGPT weiterhin gefragt. ...

26. April 2024 · 1 Minute · 94 Wörter

Dark Visitors

Dark Visitors widmet sich der Auflistung aller Web-Crawler. Sie dienen zur Erstellung von AI-Anwendungen. Mit einer robot.txt-Datei weist der Dienst sie an, die eigene Seite zu ignorieren. Ein praktisches Plugin steht Wordpress-Nutzern zur Verfügung. Nutzer anderer Systeme müssen die Automatisierung selbst vornehmen.

21. April 2024 · 1 Minute · 42 Wörter

Herausforderungen und Belohnungen

»Open Source In The Age Of LLMs« ist ein anregender Artikel, der die Reise und Erkenntnisse des Mozilla.ai-Teams im Bereich der offenen Zusammenarbeit rund um große Sprachmodelle (LLMs) darstellt. Der Autor Vicki Boykis diskutiert die Herausforderungen und Belohnungen der Beteiligung an Open-Source-Projekten und teilt wichtige Lehren, die er in diesem Prozess gelernt hat. Darüber hinaus illustriert er, wie die Kultur im Open-Source-Bereich ein inspirierendes Umfeld für kontinuierliches Lernen und Entwicklung schafft. ...

16. April 2024 · 1 Minute · 71 Wörter