Die Spielzeit ist vorbei

Anfang letzten Jahres erreichte ein Computer im Spiel Go eine Weltklasseleistung – Jahre bevor die meisten Menschen glaubten, dass eine solche Leistung möglich wäre.



Das ist beeindruckend, aber unsere Ambitionen sollten höher gesteckt werden. Die Informatik könnte dazu beitragen, das bereitzustellen, was die Welt dringend benötigt: Werkzeuge, die uns alle in die Lage versetzen, über das hinauszugehen, wozu wir dachten, dass wir fähig wären. Reinforcement Learning – ein integraler Bestandteil des Go-Erfolgs – kann diesen Prozess beschleunigen (siehe 10 Breakthrough Technologies: Reinforcement Learning ).

Reinforcement Learning ist eine Möglichkeit, einen Computer durch Erfahrung lernen zu lassen, eine Reihe von Entscheidungen zu treffen, die zu positiven Ergebnissen führen – selbst ohne vorheriges Wissen darüber, wie sich seine Aktionen auf seine unmittelbare Umgebung auswirken. Ein softwarebasierter Tutor würde beispielsweise seine Aktivitäten als Reaktion darauf ändern, wie Schüler nach der Verwendung in Tests abschneiden.





Emma Brunskill

Wenn wir hoffen, mithilfe von Reinforcement Learning künstliche Lehrmittel zu erstellen, benötigen wir datenintelligente Algorithmen. Wir könnten Daten aus Online-Bildungssystemen sammeln und sie verwenden, um dem Agenten zu helfen, die Effektivität verschiedener Lehransätze einzuschätzen. Wenn sich ein Schüler anmeldet, sollte ihm das System ein Problem vorschlagen, das er lösen muss? Oder wäre es besser, mit einem Erklärvideo zu beginnen? Die Daten können ihm bei der Entscheidung helfen.

Aber in einigen Fällen gibt es nicht genug Daten oder nicht die richtige Art von Daten, was es schwierig macht, Systeme zu entwickeln, die gute Entscheidungen treffen. Es wäre schön, wenn wir ein System schaffen könnten, das gar nicht so viele Daten benötigt. Und genau daran arbeitet meine Gruppe – wir entwickeln Reinforcement-Learning-Algorithmen und statistische Techniken, damit Computer gute Vorschläge entwickeln können, während sie weniger Daten verwenden. Wir haben noch viel zu tun, aber wir schließen die Lücke zwischen Theorie und Praxis.



Schließlich sollten wir nicht alles den Computern überlassen. Das sogenannte Human-in-the-Loop-Reinforcement-Learning kann den Prozess beschleunigen, indem es Algorithmen ermöglicht, über ihre eigene begrenzte Leistung nachzudenken und Menschen um Hilfe zu bitten, wenn sie beispielsweise die Menge möglicher Entscheidungen erweitern müssen. Meine Gruppe und unsere Mitarbeiter an der University of Washington testen jetzt Algorithmen für ein Nachhilfesystem, das erkennen kann, ob der aktuelle Lehrplan nicht allen Schülern ermöglicht, gut zu lernen, und dann die Leute auffordert, dem System neue Hinweise hinzuzufügen. Solche Mensch-Computer-Kollaborationen könnten Schülern helfen, mit Ansätzen zu lernen, die wir uns noch nicht vorstellen können. Diese Vision des verstärkenden Lernens hat künstlich intelligente Agenten, die neu definieren, wie herausragende menschliche Leistung aussieht – und es uns allen ermöglichen, sie zu erreichen.

Emma Brunskill ist Assistenzprofessorin für Informatik an der Stanford University .

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen