Ein intelligenteres Web

Tim Berners-Lee muss sich wie in einer Zeitschleife fühlen. In den frühen 1990er Jahren verbrachte er ein frustrierendes Jahr damit, die Menschen dazu zu bringen, die Kraft und Schönheit seiner Idee für ein als Internet-Hypertext-System bekanntes System zu begreifen, dem er den betörenden Namen World Wide Web gab. Aber da das Web noch nicht existierte, konnten sich die meisten Leute die Auswirkungen dessen, worüber er sprach, nicht vorstellen. Berners-Lee beharrte und mit Hilfe der wenigen Menschen, die seine Vision teilten, wurde seine Erfindung zum am schnellsten wachsenden Medienverteilungssystem der Geschichte.

Ein Jahrzehnt später kämpft Berners-Lee mit demselben Problem – nur dieses Mal versucht er, seinen Traum von einem Semantic Web zu artikulieren. Die Idee ist, ein Web zu weben, das nicht nur Dokumente miteinander verknüpft, sondern auch die Bedeutung der Informationen in diesen Dokumenten erkennt – eine Aufgabe, die Menschen normalerweise recht gut erledigen können, aber für Computer eine große Herausforderung ist, die nicht sagen können, ob Kopf bezeichnet den Anführer einer Organisation oder das Ding auf einem Körper. Das Semantic Web sind eigentlich Daten, die maschinell verarbeitet werden können, sagt Berners-Lee, Direktor des MIT-basierten World Wide Web Consortium. Darum geht es in der Aufregung.

Die Zukunft des Fernsehens

Diese Geschichte war Teil unserer November-Ausgabe 2001



  • Siehe den Rest der Ausgabe
  • Abonnieren

Das World Wide Web von heute ist im Wesentlichen ein Veröffentlichungsmedium – ein Ort zum Speichern und Teilen von Bildern und Text. Das Hinzufügen von Semantik wird die Natur des Webs radikal verändern – von einem Ort, an dem Informationen lediglich angezeigt werden, hin zu einem Ort, an dem sie interpretiert, ausgetauscht und verarbeitet werden. Semantikfähige Suchagenten werden in der Lage sein, maschinenlesbare Daten aus unterschiedlichen Quellen zu sammeln, zu verarbeiten und auf neue Fakten zu schließen. Programme, die nicht aufeinander abgestimmt sind, teilen sich zuvor nicht mischbare Daten. Mit anderen Worten, das ultimative Ziel des Semantic Web besteht darin, den Benutzern eine nahezu Allwissenheit über die riesigen Ressourcen des Internets zu ermöglichen und die Millionen existierender Datenbankinseln in eine einzige gigantische Datenbank Pangaea zu verwandeln.

Um das Semantic Web mit dem heutigen Web zu vergleichen, bietet Berners-Lee – eine intensive Person, die in geringer Lautstärke spricht – das folgende Szenario an: Stellen Sie sich vor, Sie melden sich online für eine Konferenz an.

Auf der Konferenz-Website sind Uhrzeit, Datum und Ort der Veranstaltung sowie Informationen über den nächstgelegenen Flughafen und ein Hotel, das den Teilnehmern einen Rabatt bietet, aufgeführt. Beim heutigen Web müssen Sie zuerst überprüfen, ob Ihr Zeitplan klar ist, und wenn dies der Fall ist, müssen Sie Uhrzeit und Datum ausschneiden und in Ihr Kalenderprogramm einfügen. Dann müssen Sie Flug- und Hotelarrangements treffen, indem Sie entweder die Reservierungsschalter anrufen oder deren Websites besuchen.

Man kann auf keinen Fall einfach sagen, ich will zu dieser Veranstaltung“, erklärt Berners-Lee, weil die Semantik, welches Bit das Datum und welches Bit die Uhrzeit ist, verloren gegangen ist. Aber im Semantic Web, behauptet er, werden diese Bits beschriftet; Die Software auf Ihrem Computer erkennt diese Etiketten und bucht automatisch Ihren Flug zur Konferenz und reserviert ein Hotelzimmer mit einem Klick.

Das Semantic Web wird auch ein reichhaltigeres, anpassbareres Web sein. Stellen Sie sich vor, Sie fahren mit dem Mauszeiger über den Namen des Hotels und erfahren, dass 15 Prozent der Leute, die über seine Qualität abgestimmt haben, sagen, dass es ausgezeichnet ist. Wenn Sie wissen, dass es sich bei dem Hotel um eine Müllhalde handelt, können Sie Ihren Browser anweisen, diesen Personen eine Vertrauensstufe von Null zuzuweisen. (Die Umfrageinformationen werden auf einem Anmerkungsserver eines Drittanbieters gespeichert, auf den Ihr Webbrowser automatisch zugreift.) Indem Sie Personen, die Ihrem Geschmack und Ihren Interessen entsprechen, ein hohes Maß an Vertrauen zuweisen, und die Personen, die dies nicht tun, durch Bozo-Filterung filtern, wird das Web wird anfangen, mehr wie Ihr Web auszusehen.

Es ist ein enormes Unterfangen. Der erste Schritt besteht darin, Standards festzulegen, die es Benutzern ermöglichen, Webinhalten explizite beschreibende Tags oder Metadaten hinzuzufügen. Als nächstes kommt die Entwicklung von Methoden, die es verschiedenen Programmen ermöglichen, Metadaten von verschiedenen Websites zu verknüpfen und gemeinsam zu nutzen. Danach können Benutzer mit der Erstellung zusätzlicher Funktionen beginnen, z. B. Anwendungen, die zusätzliche Fakten aus den erhaltenen ableiten. Dadurch wird die Suche genauer und gründlicher, die Dateneingabe vereinfacht und der Wahrheitsgehalt der Informationen lässt sich leichter überprüfen. Das ist zumindest das Ziel.

Viele meinen, es geht nicht. Auch wenn es in den Forschungslabors heiß hergeht, wird das von Berners-Lee vorgestellte Semantic Web durch soziale und technische Herausforderungen behindert, von denen einige Kritiker sagen, dass sie möglicherweise nie gelöst werden können. Aber das hält das World Wide Web Consortium und andere Organisationen nicht davon ab, es zu versuchen. Die US-amerikanische Defense Advanced Research Projects Agency (DARPA) und Wirtschaftsunternehmen wie Network Inference in Manchester, England, entwickeln bereits Tools zum Aufbau der Semantic Web-Infrastruktur sowie Anwendungen zu deren Nutzung. Und laut Berners-Lee werden wir, da immer mehr Menschen beginnen zu verstehen, wie das Semantic Web es immer raffinierteren Agenten ermöglichen wird, Dinge in ihrem Namen zu tun, bald einige Schimmer sehen, was auf uns zukommen könnte.

Das Semantic Web entwirren

In seinem überfüllten Büro im dritten Stock des Labors für Informatik des MIT scheint sich der Forscher Eric Miller von den hämmernden und knirschenden Geräuschen schwerer Geräte auf der Baustelle nebenan nicht zu stören. Als Leiter des Semantic-Web-Projekts ist der freundliche und tatkräftige Miller zu begeistert von seinem neuen Job, um es zu bemerken. Ich bin der glücklichste Mensch der Welt, sagt er. Ich werde für das bezahlt, was ich kostenlos tun würde.

Berners-Lee hat Miller beauftragt, die Semantic Web Activity des Konsortiums zu leiten, da Miller an webbasierten Wissensmanagementprojekten beteiligt ist und die Konzepte hinter dem Semantic Web begeistert artikuliert. Neben einem Whiteboard, das mit Metadaten-Diagrammen in Aktion bedeckt ist, erklärt Miller, dass die grundlegende Idee des Semantic Web darin besteht, das Internet für die Menschen nützlicher zu machen, indem die im gesamten Web schwebenden Informationen leichter von Computern manipuliert werden können.

Heute hingegen sind die meisten Inhalte für den menschlichen Konsum formatiert. Wenn Sie beispielsweise online einen Nachrichtenartikel lesen, können Sie leicht Schlagzeile, Verfasserzeile, Datumsleiste, Bildnachweis usw. auswählen. Aber wenn diese Dinge nicht explizit gekennzeichnet sind, hat ein Computer keine Ahnung, was sie sind. Es sieht einfach eine Menge Text. Im Semantic Web wird eine Nachricht mit Labels versehen, die ihre verschiedenen Teile beschreiben, was es einer Suchmaschine unter anderem leicht macht, Artikel zu finden, die von Jimmy Carter geschrieben wurden und nicht Geschichten, die über ihn geschrieben wurden.

Das ist heute nicht möglich, zumindest nicht im globalen Maßstab. Die zum Erstellen von Webseiten verwendeten Formatierungs-Tags sind Teil der Hypertext Markup Language (HTML) und beschreiben nur, wie die Informationen einer Webseite aussehen (fett, klein, groß, unterstrichen usw.). Das Semantic Web würde über Kosmetik hinausgehen, indem es Tags einfügt, die auch beschreiben, was die Informationen sind: Tags würden Text kennzeichnen, um beispielsweise Betreff, Autor, Adresse, Preis oder Versandkosten zu bezeichnen. Diese beschreibenden Tags sind die Metadaten – die Daten zu den Daten. Metadaten sind kein neues Konzept und auch kein auf das Internet beschränktes Konzept. Der Zettelkatalog einer Bibliothek – mit seinen Aufzeichnungen, die den Titel, den Autor, das Thema, das Jahr und den Standort in den Regalen eines Buches beschreiben – sind Metadaten.

Das Web machte es trivial einfach, Dokumente zwischen zuvor inkompatiblen Computern auszutauschen (einige der heutigen Webbenutzer erinnern sich vielleicht an die Kopfschmerzen der 1980er Jahre, als Computer verschiedener Hersteller elektronische Inseln waren). Das Semantic Web geht noch einen Schritt weiter und ermöglicht es Computern, bestimmte Informationen aus Dokumenten heraus auszutauschen.

Jenseits von Metadaten

Ohne Metadaten gibt es kein Semantic Web, aber Metadaten allein reichen nicht aus. Die Metadaten in Webseiten müssen mit speziellen Dokumenten verknüpft werden, die Metadatenbegriffe und die Beziehungen zwischen den Begriffen definieren. Diese Gruppen gemeinsamer Konzepte und ihre Verbindungen werden Ontologien genannt.

Angenommen, Sie haben eine Webseite erstellt, auf der die Mitglieder einer Fakultät aufgelistet sind. Sie würden die Namen der verschiedenen Mitglieder mit Metadaten-Begriffen wie Lehrstuhl, außerordentlicher Professor, Professor usw. versehen. Dann würden Sie die Seite mit einer Ontologie verlinken – eine, die Sie selbst erstellt haben oder die bereits von jemand anderem erstellt wurde –, die Ausbildungsberufe und deren Beziehung zueinander definiert. Eine geeignete Ontologie würde in diesem Fall einen Lehrstuhl als Person definieren, nicht als etwas, auf dem man sitzt, und es würde anzeigen, dass ein Lehrstuhl die höchste Position in einer Abteilung ist.

was zieht Kohlendioxid an

Durch die Definition der Beziehungen zwischen Begriffen können Ontologien dann von Anwendungen verwendet werden, um auf neue Fakten zu schließen. Angenommen, Sie haben eine Webseite erstellt, die Schulkindern etwas über Kondore beibringt, und dem Inhalt Metadaten hinzugefügt. Sie könnten auf eine Ontologie (oder wahrscheinlicher mehrere Ontologien) verlinken, die die verschiedenen Begriffe und ihre Beziehungen definieren: Kalifornischer Kondor ist eine Kondorart aus Kalifornien. Condor ist ein Mitglied der Greifvogelfamilie. Alle Greifvögel sind Fleischfresser. Kalifornien ist ein Bundesstaat in den Vereinigten Staaten. Fleischfresser sind Fleischfresser. Durch die Verwendung von Metadaten und Ontologien könnte eine Suchmaschine oder ein anderer Software-Agent Ihre Kondor-Site basierend auf einer Suchanfrage nach Fleischfressern in den USA finden – selbst wenn Ihre Website keine Fleischfresser oder die USA erwähnt.

Da die Entwicklung von Ontologien ein großes Unterfangen ist, ist es wahrscheinlich, dass Site-Ersteller auf Ontologien von Drittanbietern verlinken. Einige werden kostenlos sein, andere werden verkauft oder lizenziert. Ein Problem, dem man sich stellen muss: Wie bei Wörterbüchern und Atlanten werden sich auch in Ontologien politische und kulturelle Vorurteile einschleichen. Eine von der chinesischen Regierung unterhaltene geographiebasierte Ontologie beispielsweise würde Taiwan wahrscheinlich nicht als Land definieren.

Aber das behindert die Sicht kaum. Während das World Wide Web Consortium weiterhin Standards und Technologien für das Semantic Web entwickelt, tragen Hunderte von Organisationen, Unternehmen und Einzelpersonen zu den Bemühungen bei, indem sie Tools, Sprachen und Ontologien erstellen.

Ein wichtiger Beitrag dazu ist DARPA – die Leute, die für einen Großteil der Technologie hinter dem Internet verantwortlich sind ( sehen Disruptive Technologien von DARPA , TR Oktober 2001 ). Heutzutage trägt DARPA mehrere Dutzend Millionen Dollar zum Semantic-Web-Projekt des Web-Konsortiums bei und hat eine semantische Sprache für das US-Verteidigungsministerium namens DARPA Agent Markup Language entwickelt, die es Benutzern ermöglicht, Metadaten zu Webdokumenten hinzuzufügen und sie mit Ontologien zu verknüpfen. Der Informatikprofessor der University of Maryland, Jim Hendler, der bis August Manager des DARPA-Programms war, hat eng mit Berners-Lee und Miller zusammengearbeitet, um die Übereinstimmung mit den Bemühungen des Konsortiums sicherzustellen. Im vergangenen Dezember kündigte Hendler die Entwicklung einer Sprache an, die die Fähigkeiten der DARPA Agent Markup Language mit einer in Europa entwickelten Ontologiesprache namens OIL (was sowohl für Ontology Inference Layer als auch für Ontology Interchange Language steht) kombiniert.

Ein Entwickler dieser neuen Sprache, der Dozent der University of Manchester, Ian Horrocks, berät auch das World Wide Web Consortium zum Semantic Web. Im Januar war er Mitbegründer einer Firma namens Network Inference, um eine Technologie zu entwickeln, die Ontologien und automatisierte Inferenz verwendet, um bestehenden relationalen Datenbanken und großen Websites Semantic Web-Funktionen zu verleihen. Vor kurzem hat ein auf der Isle of Man ansässiges Datendienstleistungsunternehmen namens PDMS damit begonnen, die Technologie von Network Inference zu verwenden, um Unternehmensdatenbanken um Semantic Web-Funktionen zu erweitern. Dutzende anderer Unternehmen, von Hewlett-Packard bis Nokia, tragen zur Entwicklung des Semantic Web bei.

Zu viel, zu spät?

Miller glaubt, dass der nahtlose Fluss und die Integration von Informationen, die sich aus diesen Bewegungen ergeben, es ermöglichen, Wissen auf eine Weise zu verarbeiten, die Probleme löst, Menschen näher bringt und neue Ideen anregt, die nie zuvor möglich waren. Andere hingegen sind nicht so optimistisch, was das Semantic Web angeht. Es ist ziemlich ehrgeizig, sagt R. V. Guha, der Ende der 1990er Jahre die Entwicklung des Resource Description Framework des Web-Konsortiums leitete. (Dieses Framework ist ein wesentliches Werkzeug für die Beschreibung und den Austausch von Metadaten.) Es wäre schön, wenn es solche Dinge gäbe, sagt er, aber es gibt einige wirklich schwierige Forschungsprobleme, die zuerst gelöst werden müssen.

Ein Problem betrifft die Schlussfolgerung. Die Zeit, die ein Computer benötigt, um aus Daten, Metadaten und Ontologien im Web neue Schlüsse zu ziehen, nimmt rapide zu, wenn einem System Regeln hinzugefügt werden. Inferenz fällt in die gleiche Kategorie wie das klassische Handelsreisende-Problem, die kürzeste Route durch mehrere Städte zu planen. Es ist nicht schwer, die beste aller möglichen Routen zu finden, wenn Sie es mit nur sehr wenigen Standorten zu tun haben. Aber wenn man nur 15 Städte erreicht, gibt es mehr als 43 Milliarden mögliche Routen. Die gleiche Art von Ausreißersituation besteht für Inferenz, in der Brute-Force-Suchen nach Antworten zu zeitraubenden Paradoxien oder Widersprüchen führen können.

Und selbst wenn Berners-Lee und seine Kohorten die technischen Herausforderungen meistern, reicht das nicht, damit das Semantic Web einrastet. Es stellt sich die große Frage, ob die Leute denken, dass die Vorteile den zusätzlichen Aufwand wert sind, ihren Inhalten überhaupt Metadaten hinzuzufügen. Einer der Gründe, warum das Web so unglaublich erfolgreich wurde, war schließlich seine erhabene Einfachheit der Erstellung.

Das Web ist heute die einfachste und primitivste Form von Hypertext, sagt der ehemalige Sun Microsystems Distinguished Engineer Jakob Nielsen, Mitbegründer der Nielsen Norman Group, einer Webdesign-Firma in Fremont, Kalifornien. Und deshalb war es so einfach zu implementieren; deshalb könnte jeder anfangen, seine eigenen Webseiten einzurichten; Deshalb ist das Web so groß. Obwohl sich die meisten Leute mit vereinfachten Bearbeitungen, wie z. Ich zitiere.'

Natürlich kann ein solcher Pessimismus die jüngere Geschichte ignorieren. Vor nicht allzu langer Zeit schien die Vorstellung, dass Millionen von Menschen lernen, HTML-Code zu schreiben, weit hergeholt – doch genau das ist passiert. Dennoch wird die Hürde beim Aufbau eines Semantic Web höher sein. Die Leute können HTML nach Belieben verwenden. Sie verwenden Tabellen zum Beispiel häufig für nicht tabellarische Zwecke und schlagen auf das Untertitel-Tag, nur um Fettdruck anzuwenden. Diese Klugheiten und Abkürzungen haben meist nur kosmetische Folgen. Aber die gleiche Art von Verfälschung – etwa durch die Verwendung von Bibliografie-Tags, um eine DVD-Sammlung aufzulisten – könnte die Metadaten einer Seite unbrauchbar machen.

Auch die Tatsache, dass Metadaten nicht von Anfang an im Web implementiert wurden, könnte die Akzeptanz des Semantic Web erschweren. Ein besonders harter Skeptiker ist Peter Merholz, Mitbegründer von Adaptive Path, einem in San Francisco ansässigen Beratungsunternehmen für Benutzerfreundlichkeit. Dieses Zeug muss von Anfang an eingebacken werden, sagt Merholz, der das Semantic Web als interessantes akademisches Streben mit geringem gesellschaftlichem Bezug bezeichnet. Das Semantic Web erfährt viel Hype, nur weil Tim Berners-Lee, der Erfinder des World Wide Web, so daran interessiert ist, sagt er. Wenn es nur irgendein Trottel an einer Universität in Indiana wäre, würde es niemanden interessieren.

Anfangsfäden

Sogar Berners-Lee räumt ein, dass der Weg zum Semantic Web vielleicht etwas langsamer ist als der zum World Wide Web. In gewisser Weise müssen wir uns nicht zu schnell bewegen, sagt er, weil die Theorieleute es sich ansehen müssen, um sicherzustellen, dass wir nicht zu verrückt sind, und andere Leute müssen die Ideen in der Praxis überprüfen, bevor sie es sind abgeholt und zu oft benutzt.

Als er gebeten wird, in seine Kristallkugel zu blicken, sagt der Evangelist der austauschbaren Daten voraus, dass einige der ersten kommerziellen Anwendungen des Semantic Web darauf abzielen werden, die verschiedenen Informationssysteme zu integrieren, die normalerweise in großen Unternehmen nebeneinander existieren. (Wäre es nicht schön, die Geschäfte in der Kfz-Abteilung oder im Krankenhaus zu erledigen, ohne ein halbes Dutzend weitgehend überflüssiger Formulare ausfüllen zu müssen? Das Semantic Web kann hier helfen.)

Und obwohl sich das Semantic Web noch immer hauptsächlich auf dem Reißbrett befindet, können Sie auf einigen bestehenden Websites Hinweise auf seine Leistungsfähigkeit erkennen. Betrachten Sie die Suchmaschine von Beyond Technologies, die mehrmals täglich Tausende von Nachrichtenseiten durchsucht und damit zu einem Favoriten für Nachrichtenjunkies wird. Darüber hinaus wurden die Softwareagenten so programmiert, dass sie anhand der Font-Tags (der HTML-Labels, die Webbrowsern mitteilen, wie groß oder klein der Text auf dem Bildschirm angezeigt wird) prüfen, ob es sich bei einer bestimmten Seite um eine Nachrichtenmeldung handelt oder nicht. Wenn ein Darüber hinaus-Agent eine Zeichenfolge von sechs bis 18 Wörtern findet, die am oberen Rand einer Seite als große Schrift gekennzeichnet sind, nimmt er an, dass es sich um eine Überschrift handelt, und legt sie in einer Datenbank ab. Da der Agent natürlich nur eine Vermutung anstellt, wählt er manchmal eine Seite aus, bei der es sich doch um keine Nachrichten handelt. Außerdem muss eine zusätzliche Filterung angewendet werden, um Seiten zu entfernen, die keine Artikel enthalten.

Das ist noch weit vom Endziel entfernt – aber ein guter Anfang. Und selbst die Champions des Semantic Web geben nicht vor, genau zu verstehen, wohin solche Schritte führen werden. Denn wer hat Amazon.com oder eBay vorhergesagt, als Berners-Lee im Dezember 1990 den ersten Webserver der Welt einschaltete?

Aber der Punkt ist, dass die Leute mehr Intelligenz vom Web wollen, als sie bekommen – und eine wachsende Zahl von Informatikern teilt Berners-Lees Augenzwinkern und das Gefühl, dass das Semantic Web die Antwort enthält. Es ist toll, sagt der Erfinder des World Wide Web, dass es wieder so eine Basisbegeisterung gibt.

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen