Nokia Phones Gehe zum Kurs für natürliche Sprache

Im Rahmen einer Forschungskooperation mit MIT-Informatikern entwickelt das Nokia Research Center Cambridge in Cambridge, MA, Mobiltelefone, die in englischer Sprache geschriebene Befehle verstehen und darauf reagieren können.

Mit dem MobileStart-System am rechten Telefon können Sie Ihre Mutter daran erinnern, ihre Medikamente einzunehmen. Das Telefon auf der linken Seite zeigt ein neues Kalenderereignis, das von MobileStart in Mamas Telefon erstellt wurde. (Mit freundlicher Genehmigung von Boris Katz und Federico Mora, MIT.)

Robert Iannucci, Leiter der Forschungszentren von Nokia, sagt, das Unternehmen wolle Telefone von einfachen Anrufterminals in Informations-Gateways verwandeln – zum Internet, GPS und Sensoren, MP3s, Desktop-Computern, iPods und anderen Geräten. Und das erfordert ein Umdenken der gesamten Schnittstelle zwischen Mensch und Handheld. Sowohl für Nokia als auch für MIT bedeutet dies die Verwendung von Textinteraktion.



Wie weit kann das menschliche Auge an Land sehen?

Der Mensch kann gut mit der Sprache, sagt Boris Katz , leitender Forscher am Computer Science and Artificial Intelligence Laboratory des MIT, der Hauptgruppe, die mit Nokia zusammenarbeitet. Wir wollen, dass Sprache auf Mobiltelefonen ein erstklassiger Bürger ist, sagt er.

Navigationssysteme in natürlicher Sprache wurden lange versprochen und kurzfristig geliefert. Es ist jedoch nicht länger unrealistisch zu glauben, dass diese Systeme in naher Zukunft in den Händen – und Handys – der Verbraucher sein könnten. Eine Einschränkung: Die komplexen Grundlagen dieser neuen Anwendungen und die Algorithmen, die die Sprache analysieren, müssen vor Mobiltelefonbenutzern verborgen werden – damit sie nicht frustriert durch die Menüschichten navigieren.

Um die Natural Language-Technologie von Nokia zu unterstützen, verwendet Katz vom MIT ein Softwaresystem, das er 1993 entwickelt hat namens Anfang , das menschliche Fragen interpretiert und Antworten mithilfe von Websites wie der Internet Movie Database (IMDB) und Mapquest findet. Auf Basis der Web-Version von Start arbeitet Katz derzeit mit dem Nokia Center an der Entwicklung einer mobilen Version der Software für Mobiltelefone namens MobileStart.

So funktioniert die Webversion von Start: Benutzer geben eine Frage in ein Textfeld ein. Die Software interpretiert die Anfrage, entscheidet, wo die Antwort gesucht wird (in ihrer Datenbank oder auf einer anderen Website) und antwortet mit einer schriftlichen Erklärung, einem Link zu einer Website oder einem Bild.

[ Klicken Sie hier für Beispiele für die Textverarbeitung auf einem Mobiltelefon.]

gruselig ai generierte Bilder

Start extrahiert Antworten, keine Treffer, sagt Katz, weil es interpretiert menschliche Sprache, anstatt nach Schlüsselwörtern wie Google und anderen Suchmaschinen zu suchen.

Das Start-System versteht englische Sätze, indem es sie in eine Reihe von Beziehungen zwischen Objekt, Eigentum und Wert zerlegt. Wenn man beispielsweise eintippt: Was ist die Bevölkerung von Irak?, interpretiert Start die Abfrage: Das Objekt ist Irak, die Eigenschaft ist Bevölkerung und der Wert ist das, was Start sucht.

Das ist einfach; Die Leute neigen jedoch dazu, komplexere Fragen zu stellen, insbesondere wenn sie nach bestimmten Informationen suchen. Wenn eine Person eine Frage stellt wie: Wie viele Menschen leben in der Hauptstadt des drittgrößten Landes Asiens? Start wird es in drei separate Abfragen aufteilen, um eine nach der anderen zu verarbeiten: Was ist das drittgrößte Land Asiens, was ist die Hauptstadt dieses Landes und wie viele Einwohner hat die Hauptstadt? (Start entscheidet anhand eines von Katz entwickelten Algorithmus, wie die Fragen aufgeteilt und die Bewertungen priorisiert werden.)

Die offensichtlichste Änderung, die diese Art der Interaktion für Benutzer mit sich bringen würde, wäre eine Vereinfachung der komplexen Menüstrukturen, die sich entwickelt haben, da Mobiltelefone immer mehr Aufgaben übernehmen. Durch die Verwendung eines Navigationssystems in natürlicher Sprache können Benutzer Funktionen ausführen, ohne durch Menüschichten zu wühlen oder Dutzende von Google-Treffern auf einem winzigen Bildschirm zu durchsuchen. Die mobile Version von Start kann auch Informationen vom GPS-Gerät eines Telefons und dem Web abrufen oder mit Anwendungen auf dem Telefon interagieren und Befehle senden, z. B. ein Adressbuch und einen Kalender.

Wenn der Benutzer beispielsweise verloren geht, fragt er möglicherweise einfach das Telefon: Wo bin ich? – und eine Karte seines aktuellen Standorts würde auf dem Bildschirm erscheinen. Oder sie könnten sogar fragen: Wie komme ich von hier zu Brads Haus? und das Telefon würde diese Adresse in einer Kontaktliste finden, Ihren aktuellen Standort mithilfe von GPS bestimmen, zu Mapquest gehen und Online-Wegbeschreibungen abrufen.

Die Sprachbefehle werden es den Menschen auch ermöglichen, ihre verschiedenen Technologien mit den Geräten anderer zu kommunizieren, wodurch die Notwendigkeit entfällt, eine schwindelerregende Reihe von Textnachrichten, E-Mails und Voicemails an andere zu senden. Zum Beispiel hätte eine Person die Möglichkeit, dem Telefon mitzuteilen, meine Mutter daran zu erinnern, ihre Medikamente morgen um drei zu nehmen, und die Nokia-Anwendung würde einen Wecker stellen die Mütter Telefonkalender, wenn sie ein MobileStart-Telefon besitzt.

Bei komplexeren Aktionen – wie der Interaktion mit anderen Geräten – beginnen natürlich Start und andere natürlichsprachige Navigationssoftwaresysteme zu versagen. Um einige Anwendungen ausführen zu können, die Mobiltelefonbenutzer wünschen, muss MobileStart lernen, wie der Benutzer die Welt sieht, sagt Katz. Wenn zum Beispiel jemand dem Telefon sagt, dass er Joe anrufen soll, aber es mehr als einen Joe im Adressbuch gibt, muss MobileStart laut Katz vergangenes Verhalten verwenden, um zu erkennen, welcher Joe gemeint ist entwickelt werden. Wir möchten sicherstellen, dass das Telefon versteht, was der Benutzer sagt, ohne ihn mit Klärungsfragen zu belasten.

MobileStart sollte auch mit komplizierteren Einstellungsproblemen umgehen können. Wenn beispielsweise ein Benutzer dem Telefon sagt, meine Mutter solle morgen um drei ihre Medikamente einnehmen, muss es herausfinden, wie diese Nachricht am besten übermittelt werden kann. Wenn das Telefon – aus Erfahrung oder einem festgelegten Befehl – ​​weiß, dass beide Personen lieber per SMS kommunizieren, könnte es eine SMS senden.

Darüber hinaus, so Katz, könnte auch eine größere Herausforderung am Horizont auftauchen – eine, die sich von der digitalen, mobilen Kultur unterscheidet: Kurzschrift für SMS. Die webbasierte Version von Start kann derzeit Rechtschreibfehler erkennen und den Benutzer auffordern, Rechtschreibfehler zu korrigieren Ich weiß nicht, wie Sie von Cambridge nach Boston kommen.

Derzeit kennt das Start-System nur Englisch (obwohl es auf die Sprachtools von Google zugreifen kann, um Sätze zu übersetzen). Sein Parsing-System – das verwendet, um eine Abfrage in Objekt, Eigenschaft und Wert zu unterteilen – könnte mit jeder menschlichen Sprache verwendet werden, aber Katz muss ihm für jede neue Sprache ein neues Vokabular und eine neue Syntax beibringen.

Was ermöglicht neuronales Mapping Wissenschaftlern zu sehen?

Nokia versucht, seine Mobilgeräte benutzerfreundlicher zu gestalten und die Schnittstellenprobleme zu reduzieren, die Geräte nicht so praktisch wie möglich machen. Mit diesem Versuch, natürliche Sprachen und Technologien kompatibel zu machen, tritt Nokia in die Web 2.0-Bewegung ein – so wie es kürzlich Google mit seiner Kalenderanwendung [siehe Googles Time Keeper] getan hat.

Idealerweise, so Katz, wird MobileStart mit einer Voice-to-Text-Software kombiniert, um den Umgang mit dem Handy noch einfacher zu machen. Tatsächlich weist Iannucci von Nokia auf eine Ironie hin: Mobiltelefone sind von Natur aus Sprachgeräte, aber sie verwenden keine Stimme als Modalität.

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen