Die Studie »Learning while Sleeping: Integrating Sleep-Inspired Consolidation with Human Feedback Learning« von Imene Tarakli und Alessandro Di Nuovo von der Sheffield Hallam University wurde auf der IEEE International Conference on Development and Learning (ICDL) 2024 veröffentlicht. Sie untersucht, wie Maschinenlernprozesse besser werden können, wenn man sie an Mechanismen orientiert, die im menschlichen Gehirn beim Schlafen stattfinden. Die Autorinnen und Autoren schlagen ein neues Lernmodell vor, das sie INFORM nennen. Zuerst lernt ein System Verhaltensweisen aus menschlichem Feedback. Danach verarbeitet es diese Erfahrungen wiederholt im „Offline-Modus“, ähnlich wie das Gehirn im Schlaf Erinnerungen festigt. In ihren Experimenten zeigte INFORM, dass daraus robustere und besser verallgemeinerbare Strategien entstehen als bei herkömmlichem Lernen nur aus unmittelbarem Feedback. Die Ergebnisse deuten darauf hin, dass dieser Ansatz helfen kann, lernende Agenten widerstandsfähiger gegen Veränderungen in ihrer Umgebung zu machen. 
Widerstandsfähiger gegen Veränderungen
Schon ein bisschen Staub drauf. Der Beitrag ist älter als ein Jahr. Vielleicht hat sich seitdem etwas geändert.
Möchtest du mir antworten?
Schick mir eine Nachricht per E-Mail und lass uns ein Dialog beginnen. Du kannst mir auch per RSS oder Mastodon folgen.