Digitaler Lippenleser

Spracherkennung ist eine lang versprochene Technologie, die endlich zu liefern beginnt. Aber die besten Systeme von heute neigen dazu, zu versagen, wenn sich der Lautsprecher an einer lauten Stelle befindet. Um dieses Problem zu beheben, fügen die Forscher das Lippenlesen hinzu.

Während Menschen sich ständig auf Mundformen verlassen, um Sprache zu interpretieren, ist das Lippenlesen keine einfache Aufgabe für einen Computer. Zum einen kann jede Form mehreren spezifischen Klängen entsprechen. Erschwerend kommt hinzu, dass Mundbewegungen bis zu 120 Millisekunden beginnen, bevor ein Ton geäußert wird. Menschen können andere Hinweise wie Satzkontext und Gesichtsausdrücke verwenden, um diese Schwierigkeiten zu überwinden, aber bis vor kurzem fehlte Computern die Rechenleistung dafür.

Boeings Flug zum Überleben

Diese Geschichte war Teil unserer Ausgabe vom September 2003



du in meinem Geschäft machst das Tiktok-Original nicht
  • Siehe den Rest der Ausgabe
  • Abonnieren

Jetzt modifizieren Gruppen bei Intel, IBM und anderen Institutionen Sprachverarbeitungsprogramme, um jeden Stimmklang mit mehreren möglichen Mundbewegungen zu verknüpfen, damit die Software eine bestmögliche Vermutung über das Gesprochene anstellen kann. Laut Ara Nefian, Senior Researcher bei Intel Research in Santa Clara, CA, konnte die Spracherkennungsgenauigkeit bei Tests in lauten Umgebungen durch das Hinzufügen visueller Informationen von 20 auf 75 Prozent gesteigert werden.

Anfänglich ist dies wahrscheinlich am nützlichsten für Ärzte und andere, die an lauten Orten arbeiten und eine bessere Genauigkeit von der Büro-Diktiersoftware benötigen. Vor diesem Hintergrund baut IBM eine winzige Kamera in das Bügelmikrofon ein, das mit vorhandener Spracherkennungssoftware geliefert wird. Später stellen sich Forscher den Tag vor, an dem auf dem Armaturenbrett Ihres Autos eine Kamera für sprachgesteuerte Bedienelemente auf Ihre Lippen schaut oder Ihr Mobiltelefon aufpasst, was Sie sagen.

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen