Kanäle
Jetzt personalisiertes
Audiomagazin abonnieren
Log-in registrieren
forum verwendet Cookies und andere Analysewerkzeuge um den Dienst bereitzustellen und um dein Website-Erlebnis zu verbessern.

handverlesenswert

Kluge Köpfe filtern für dich relevante Beiträge aus dem Netz.
Entdecke handverlesene Artikel, Videos und Audios zu deinen Themen.

Du befindest dich im Kanal:

Fundstücke

Tiere, Menschen, KI - Gefangen in endlosen Belohnungsschleifen?

Ole Wintermann
Zum Kurator'innen-Profil
Ole WintermannFreitag, 19.11.2021

Experimente mit Tieren, Versuchsanordnungen mit menschlicher Beteiligung und Erfahrungen beim Training von Künstlicher Intelligenz, die Aufgaben selbsttätig erledigen soll, lassen (ließen) eine seltsame Parallele zwischen diesen drei Entitäten offenbar werden, so der Long Read bei The Conversation: Alle drei Entitäten sind anfällig dafür, Aufgaben bis hin zur Selbstaufgabe für positive Erlebnisse auf dem Wege zur Aufgabenerfüllung aus dem Blick zu verlieren. Anders ausgedrückt: Zu prokrastinieren, um auf diesem Wege kurzfristige Belohnungen und das angenehme Gefühl der Belohnung zu erhalten, ist für alle drei Entitäten mehr wert, als eine Aufgabe zu erfüllen.

Diese Erkenntnis ist bedeutsam, wenn es darum geht, KI zu programmieren und unter Anleitung lernen zu lassen oder Menschen in zielgerichteter Arbeit zu unterstützen. Die Autoren schildern ein bekanntes Rattenexperiment aus den 1950er Jahren. Im Zuge des Experiments wurden den Ratten Elektroden in das Gehirn eingepflanzt, die einen Stimulus auslösten, wenn die Ratten einen bestimmten Hebel betätigten. Zu beobachten war eine extreme Fixierung der Ratten auf die wiederholte Betätigung des Hebels. Diese Fixierung ließ sie in weiteren Experimenten sogar “vergessen”, Nahrung zu sich zu nehmen. Im Jahre 2016 sollte eine selbstlernende KI “motiviert” werden, eine Aufgabe dadurch zu erfüllen, dass sie auf dem Weg zur Erfüllung der Aufgabe “Belohnungen” erhielt. In der Folge war die KI aber in einer Endlosschleife der beständigen Belohnung gefangen und “vergaß” die eigentliche Aufgabe. Nunmehr stehen Informatiker vor dem Problem der adäquaten Gestaltung einer Belohnung im Prozess des angeleiteten Lernens von KI.

Menschenverachtende Versuche durch Neurowissenschaftler hatten im Laufe des vergangenen Jahrhunderts dann dieselben Handlungsmotive bei Menschen erkennen lassen. Nicht umsonst beschäftigt sich u.a. Aldous Huxley´s Schöne Neue Welt mit genau diesem Wirkungszusammenhang. In einer verachtenswerten Weise fragten sich einige Wissenschaftler (in der Realität), ob es damit technisch nicht auch möglich sein sollte, die Menschen bezüglich ihrer Neigungen umzuprogrammieren.

“Once you have tapped into the source of all reward, all other rewarding tasks — even the things required for survival — fall away as uninteresting and unnecessary, even to the point of death.”

Die Autoren des Beitrags leiten diese Frage über auf eine philosophische Ebene, wenn sie bezüglich des Sinns des Lebens und des Arbeitens fragen:

“If you accrue reward directly – without having to bother with any of the work of completing the actual track – then why not just loop indefinitely?”

Sind Roboter und KI nicht am Ende der menschlichen Entwicklung dafür da, uns alle Arbeit abzunehmen, damit wir uns den kurzfristige Stimuli in einer Endlosschleife widmen können?

Der Text ist hinterlegt mit etlichen historischen Beispielen, die hier aus Platzgründen nicht alle wiedergegeben werden können. Die Lektüre des Long Reads ist daher absolut empfehlenswert, auch um sich der Abgründe dieser “Forschung” gewahr zu werden.

Tiere, Menschen, KI - Gefangen in endlosen Belohnungsschleifen?

Möchtest du kommentieren? Dann werde jetzt kostenlos Mitglied!

Bleib immer informiert! Hier gibt's den Kanal Fundstücke als Newsletter.

Abonnieren

Deine Hörempfehlungen
direkt aufs Handy!

Einfach die Hörempfehlungen unserer Kurator'innen als Feed in deinem Podcatcher abonnieren. Fertig ist das Ohrenglück!

Öffne deinen Podcast Feed in AntennaPod:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Apple Podcasts:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Downcast:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Instacast:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Apple Podcasts:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Podgrasp:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Bitte kopiere die URL und füge sie in deine
Podcast- oder RSS-APP ein.

Wenn du fertig bist,
kannst du das Fenster schließen.

Link wurde in die Zwischenablage kopiert.

Öffne deinen Podcast Feed in gpodder.net:

Wenn alles geklappt hat,
kannst du das Fenster schließen.

Öffne deinen Podcast Feed in Pocket Casts:

Wenn alles geklappt hat,
kannst du das Fenster schließen.