Übersetzung im Zeitalter des Terrors

In einem Konferenzraum in Washington, DC, der schallisoliert ist, um das Abhören zu verhindern, beschreiben fünf Linguisten, die für die Regierung arbeiten – unter der Bedingung, dass ihre Namen nicht veröffentlicht werden – die monumentale Aufgabe, vor der sie im Zeitalter des Terrors fremdsprachige Abhörungen analysieren müssen.

Am Tisch sitzen Experten für Arabisch, Russisch, Chinesisch und Italienisch sowie eine Frau, die eine der wenigen Sprecherinnen der Regierung in Dari ist, einer Sprache, die in Afghanistan verwendet wird. Sie sind jung; drei sind in ihren 20ern, die anderen in ihren 30ern und 40ern. Aber sie werden für die nationale Sicherheit der USA immer wichtiger: Sie sind die Übersetzer an vorderster Front, die eine Sprache analysieren, die unordentlich, kompliziert und fragmentiert ist, aber Hinweise auf einen bevorstehenden Terroranschlag geben kann.

Suche über Google hinaus

Diese Geschichte war Teil unserer März-Ausgabe 2004



  • Siehe den Rest der Ausgabe
  • Abonnieren

Analysieren ist hier das entscheidende Wort – nicht nur übersetzen. Während sie über Dokumenten und Audioclips brüten, kämpfen die Fünf zusammen mit Tausenden anderer Regierungs- oder Vertragslinguisten, die ähnliche Arbeiten verrichten, um einzelne Wörter herauszuziehen, Informationsfragmente zu isolieren, Informationen aus den Fragmenten zu weben und im Allgemeinen eine sprachliche Triage auf den Flut von Rohstoffen, die täglich von der CIA, dem FBI, dem Verteidigungsministerium und anderen Quellen gesammelt werden. Eine Sprachwissenschaftlerin erzählt, dass sie in einer dreckigen, nach Benzin stinkenden Dokumentenkiste wühlen musste, die gerade aus einem Flugzeug aus Afghanistan gekommen war. Ein anderer beschreibt die Entschlüsselung einer handschriftlichen Notiz, deren Unterschrift – ein wichtiger Hinweis auf ihren Geheimdienstwert – halb abgerissen wurde. Ein anderer erzählt, dass er auf Russisch ein abgehörtes Handygespräch zwischen zwei Männern auf einem lauten Markt im Freien gehört hat. Ein Mann stotterte; das hätte darauf hindeuten können, dass er nervös war, was die Bedeutung des Gesprächs widerspiegeln könnte oder auch nicht. Es sei, als würde man sich die Teile eines Puzzles ansehen, ohne den Kartondeckel, der zeigt, wie das Bild aussehen soll, sagt die chinesische Sprachwissenschaftlerin. Und vielleicht passen die Teile nicht zusammen. Du musst den Staub abbürsten und sagen, was mache ich als nächstes?

Jenseits dieser physischen und kontextuellen Stolpersteine ​​sehen sich Analysten mit Herausforderungen durch die Sprachen selbst konfrontiert. Al-Qaida-Mitglieder neigen dazu, ein mit kulturellen und historischen Anspielungen gesättigtes Arabisch zu sprechen; das macht es schwierig, religiösen Dialog von Angriffsplänen zu unterscheiden. Und einige Mitglieder der Terrorgruppe sind keine Muttersprachler der Sprache, was bedeutet, dass sie ungewöhnliche Wortwahlen treffen, Wörter anders aussprechen und viele grammatikalische Fehler begehen. Wir haben viel Erfahrung im Umgang mit dem sowjetischen Modell oder dem europäischen Gesprächsmodell, aber nicht so sehr mit Kulturen, in denen eine direkte, einfache Sprache selten ist, sagt Everette Jordan, eine ehemalige Sprachwissenschaftlerin der National Security Agency, die dafür gesorgt hat, dass die fünf Sprachwissenschaftler treffen mit Technologieüberprüfung . Es geht nicht um das Wo, Was, Wie und Wann. Es ist das Warum und das Warum nicht. Das ist das, was uns häufig begegnet.

Sonnenkollektor-Schutzhülle

Die Kosten für eine nicht rechtzeitige Klärung, was die Gegner meinen, sind hoch. Das wurde während der Untersuchungen des Kongresses zu den Geheimdienstfehlern deutlich, die zu den Anschlägen vom 11. September führten. Das vielleicht krasseste Beispiel ist, dass die NSA am 10. September 2001 laut Nachrichtenberichten vom Juni 2002 zwei arabische Nachrichten abgefangen hat, eine, die besagt, dass Morgen null Uhr ist, und eine andere, die besagt, dass das Spiel gleich beginnt. Die Sätze wurden erst am 12. September 2001 übersetzt. Die Enthüllung unterstrich die Tatsache, dass die US-Regierung vor einer ernsthaften Krise hinsichtlich ihrer Fähigkeit steht, Daten in Dutzenden von Fremdsprachen zu speichern, zu analysieren, zu durchsuchen und zu übersetzen.

Es ist eine Krise, die buchstäblich von Stunde zu Stunde schlimmer wird. Der Rückstand an ungeprüftem Material ist so groß, dass er nicht in Seiten, sondern in Kubikmetern gemessen wird. Bedenken Sie, dass NSA-Satelliten alle drei Stunden genug Informationen sammeln, um die Kongressbibliothek zu füllen. Und die NSA ist nur ein Geheimdienst. Irgendwo in diesem riesigen Heuhaufen könnte eine etwa zwei Kilobyte große Nadel sein – die Datenmenge auf einer einzigen maschinengeschriebenen Seite –, in der Terroristen ihre Pläne preisgeben.

Und obwohl es bekanntlich einen Mangel an qualifizierten Übersetzern gibt, die bei der Suche nach dieser Nadel helfen, gibt es auch ein systemisches Problem. Diese Informationsflut wird von einer ausufernden und balkanisierten bundesstaatlichen Geheimdienstbürokratie aufgefangen. Vier Zweige des Militärs, 13 Geheimdienste und das diplomatische Korps des Außenministeriums haben alle ihre eigenen knarrenden Systeme, die über Jahrzehnte aufgebaut wurden. Jede Agentur beherbergt – manche sagen, Horten – ihre eigenen Übersetzer, Analysten und Datenbanken. Tatsächlich wussten Experten schon lange vor dem 11. September, dass die Übersetzungsinfrastruktur der Regierung nicht nur überfordert war; es war veraltet. Aber die Angriffe boten die Motivation, von Grund auf neu zu überdenken, wie Übersetzungen gemacht werden. Wir erleben gerade einen Kulturwandel, sagt der chinesische Linguist. Wir müssen die Werkzeuge für den Job finden.

Ein neuer Schub

Der Ort dieses kulturellen Wandels – und der Verschiebung der Technologiestrategie – sind mehrere Stockwerke eines unscheinbaren Bürogebäudes in der Innenstadt von Washington, nicht weit vom Hauptquartier des FBI. Dies ist der Sitz des National Virtual Translation Center, eines neuen Bundesbüros, das 2001 durch den USA Patriot Act geschaffen, aber erst 2003 finanziert wurde. Sein Budget ist geheim, und im vergangenen Herbst standen die meisten seiner brandneuen Kabinen leer. In einem Raum waren an einer Wand Kartons gestapelt, die einst Dell-Computermonitore enthielten; in einem anderen Raum waren Russisch-, Arabisch- und Swahili-Wörterbücher noch eingeschweißt.

Aber die eintönige Umgebung täuscht über die zentrale Rolle des Zentrums bei der Transformation des Übersetzungs- und Analyseansatzes der US-Regierung hinweg. Es wird als Drehscheibe eines Übersetzungsnetzes fungieren, das allen Bundesnachrichtendiensten dient. In diesem Jahr stellt es vielleicht 300 interne Linguisten ein, aber noch wichtiger: In den nächsten drei bis fünf Jahren wird es Zehntausende von Regierungs-Linguisten und privaten Auftragnehmern über sichere Netzwerkverbindungen verbinden, wie sie bereits vom FBI verwendet werden und die CIA.

Ihre grundlegende Betriebsidee – bürokratische Mauern einreißen und menschliche Übersetzer in den Mittelpunkt des Unternehmens stellen – steht im Gegensatz zu der traditionellen Herangehensweise der Regierung an das Übersetzungsproblem. Seit den späten 1940er Jahren haben die US-Regierung und ihre Forschungsbehörden riesige Summen ausgegeben, um den ultimativen Spionagecomputer zu bauen, der jeden Satz in jeder Sprache, ob gesprochen oder geschrieben, automatisch in anmutiges Englisch übersetzt. Diese Bemühungen haben einige begrenzte Werkzeuge bereitgestellt, aber nicht die umfassendere Vision geliefert. Computer sind einfach nicht sehr effektiv bei der Entschlüsselung von Sprachkomplexitäten, die von Menschen leicht interpretiert werden können.

Das neue Übersetzungszentrum stellt einen bedeutenden Wandel in der Art der Übersetzungstechnologien dar, die die Regierung zu entwickeln versucht. Im Wesentlichen wird der Traum einer universellen maschinellen Übersetzung verdrängt, zugunsten einer neuen Stoßrichtung, bei der eine Vielzahl von Werkzeugen entwickelt werden, die den Menschen nicht ersetzen, sondern ihn unterstützen. Es ist ein Modell dafür, wie die Regierung im 21. Jahrhundert mit Fremdsprachen umgehen wird, sagt William Rivers, stellvertretender Forschungsdirektor des Center for the Advanced Study of Language an der University of Maryland.

Vergessen Sie beispielsweise, sagen Rivers und andere, Software, die gedrucktes Arabisch übersetzen kann: Analysten würden enorm profitieren, wenn Software einfach das Lesen der arabischen Schrift erleichtern könnte, sodass wiederhergestellte Dokumente effizienter verarbeitet werden könnten. Die Regierung hinkt bei der computergestützten Übersetzung erschreckend hinterher, weil sie all dieses Geld in maschinelle Übersetzung investiert hat, sagt Kevin Hendzel, ein ehemaliger russischer Linguist des Weißen Hauses und jetzt Chief Operating Officer bei Aset International Services, einer Übersetzungsagentur in Arlington , VA.

Für manche Altsprachler ist das neue Zentrum die Verwirklichung einer lang gehegten Vision. Seit den 1970er Jahren, als die ersten PCs online verfügbar waren, haben wir uns Gedanken gemacht, wie wir unerfahrene Übersetzer mit Online-Wörterbüchern und Expertenhilfe verbinden können, sagt Glenn Nordin, ein Beamter des Sprachgeheimdienstes des Verteidigungsministeriums. Das [Nationale virtuelle Übersetzungszentrum] ist ein Traum von 20 Jahren wahr geworden.

Wenn es funktioniert, wird das Zentrum neue Technologien zur Übersetzungsunterstützung zusammenführen und sie in großem Umfang effizient einsetzen. Das von den DC-Büros verwaltete Übersetzungs-Web wird auch die Fähigkeiten von Menschen in den USA nutzen: Professoren, Vertragsübersetzer, Regierungs-Linguisten – Neulinge in den Zwanzigern und Rentner gleichermaßen. Ich kann immer noch die Regierung [Linguist] erreichen, die sich nach Pocatello, Idaho, zurückgezogen hat, damit wir diese Fähigkeiten nicht verlieren, sagt Jordan, der neue Direktor des Zentrums. Im Moment ist das unsere einzige Option.

Ein Übersetzungs-Web für die nationale Sicherheit
Das neue nationale virtuelle Übersetzungszentrum zielt darauf ab, fremdsprachliche Informationen schnell zu verarbeiten, indem es ein sicheres Kommunikationsnetzwerk bildet und menschlichen Übersetzern Assistenztechnologien zur Verfügung stellt. In diesem hypothetischen Beispiel werden in Afghanistan erbeutete Dokumente mithilfe von Technologien verarbeitet, die von Scan-Software bis hin zu gemeinsamen Datenbanken mit übersetzten Phrasen reichen.

eins. US-Agenten erbeuten in Kabul, Afghanistan, eine Kiste mit durchnässten Dokumenten und verwenden eine Scan-Software der nächsten Generation, um sie zu digitalisieren. Die digitalisierten Dokumente werden an den Defense Intelligence Agency im Pentagon gesendet.
zwei. Angesichts einer Überlastung vergibt die Defense Intelligence Agency den Job an das National Virtual Translation Center in Washington, DC. Dort verwenden Analysten fortschrittliche Software, um wichtige Namen und Begriffe zu kennzeichnen.
3. Die meisten Dokumente sind frei von unheilvoller Sprache, aber eines enthält das Wort Fermenter. Das Zentrum leitet dieses Dokument an einen in Idaho lebenden arabischen Übersetzer im Ruhestand mit Fachwissen über Biowaffen weiter.
Vier. Der Idaho-Übersetzer führt eine Teilübersetzung mithilfe von Datenbanken durch, die als Translation Memorys bezeichnet werden und gängige Ausdrücke speichern. Er stellt fest, dass das Dokument Arzneimittel behandelt und nicht auf eine Bedrohung hinweist.

Übersetzungs-Toolbox

Eine Suite von Technologien – Tools, die Rohmaterial für diesen Übersetzer in Pocatello digitalisieren, analysieren und verarbeiten können – stehen im Mittelpunkt der Bemühungen des Zentrums. Von Scan-Software, die mehr Sprachen erkennt, über bessere Datenbanken, die die Suche nach übersetzten Phrasen erleichtern, bis hin zu webbasierten Methoden der Zusammenarbeit liegt der technologische Fokus darauf, dem Linguisten an vorderster Front zu helfen.

Der erste Schritt besteht darin, dem Übersetzer seine Arbeit einfach in digitaler Form zur Verfügung zu stellen. Es macht nicht nur die Textmaschine- lesbar , aber Maschinen- lenkbar , sagt Jordan. Wenn Sie etwas im Text hervorheben und an ein Offline-Wörterbuch oder -Glossar senden möchten, muss die Maschine wirklich in der Lage sein, den Text zu greifen und zu verschieben. Dazu müssen gedruckte Dokumente digitalisiert werden, damit sie von einer Textverarbeitungssoftware verarbeitet werden können.

Doch die Basistechnologie – eine Software zur optischen Zeichenerkennung, die gedruckte Zeichen erkennt und sie in einer standardmäßigen digitalen Schriftart wiedergibt – lässt viel zu wünschen übrig. Zum einen wurde es hauptsächlich für das lateinische Alphabet und die wichtigsten europäischen Sprachen entwickelt; zum anderen folgt es sprachspezifischen Regeln und sucht nach bestimmten Symbolen – dem Buchstaben R zum Beispiel –, deren Grenzen und Form es zu erkennen programmiert wurde. Während eine solche Technologie für Arabisch (und Sprachen wie Dari und Pashto, die in Variationen des arabischen Alphabets geschrieben werden) existiert, ist sie nur auf klar gedruckten, nicht verwischten, verschwommenen oder handgeschriebenen Dokumenten zuverlässig.

Diese technologische Lücke verlangsamt das Hinzufügen neuer Sprachen zur Scan-Software und erfordert, dass ein menschlicher Experte neue Regeln schreibt. Vor Ort erschwert es den Übersetzern die Arbeit von Anfang an und zwingt sie oft, ihre Arbeit mit Stift und Papier zu erledigen. Wenn die Technik nicht auf dem neuesten Stand ist, könnten es Sie und Ihr Wörterbuch sein, sagt der italienische Übersetzer.

Die Verbesserung der Situation erfordert einen neuen Ansatz. Eine Forschungsgruppe von BBN, einer Tochtergesellschaft von Verizon mit Sitz in Cambridge, MA, hat eine flexiblere, trainierbare Version der optischen Zeichenerkennung entwickelt. Anstatt beispielsweise nur nach einem R zu suchen, sucht das System nach einer Reihe von Formen, die Rs sein könnten, und sucht nach möglichen Übereinstimmungen in einer Liste von Modellen, die während des Trainings erstellt wurde. Dieser Ansatz ist bei verschwommenem Text effektiver und kann an eine breitere Palette von Sprachen angepasst werden, sagt Prem Natarajan, der technische Leiter des Projekts. Tatsächlich, sagt er, habe das System mit sieben Schriftsystemen – darunter Chinesisch, Japanisch, Arabisch und Thai – eine hohe Genauigkeit. Das Projekt erhält bereits Bundesmittel; sein Endprodukt kann vom neuen Übersetzungszentrum bereitgestellt werden.

Mit der BBN-Technologie könnten Dokumente in mehreren Sprachen an Ort und Stelle gescannt werden – etwa eine Höhle in Afghanistan – und direkt an einen Übersetzer übertragen werden. Aber den Text in digitaler Form zu bekommen, ist nur der Anfang. Ein weiterer Schritt im Technologieunterstützungsplan des virtuellen Übersetzungszentrums besteht darin, Software zu finden und einzusetzen, die nach Schlüsselwörtern oder Phrasen suchen und verdächtige Dokumente für eine genauere Betrachtung kennzeichnen kann. Diese Technologien können sowohl auf digitale Textdateien als auch auf Transkripte von Sprachmitschnitten angewendet werden.

Es ist keine neue Idee. Aber auch hier arbeitet die vorhandene Software meist mit europäischen Sprachen, für die private Geschäftsmärkte seit langem die Motivation für die kommerzielle Entwicklung darstellen. Das Problem ist, dass nicht alle Sprachen Strukturen und Wörter haben, die auf die gleiche Weise gesucht werden können wie beispielsweise Englisch oder Französisch. Arabische Wörter werden zum Beispiel im Allgemeinen ohne Vokale geschrieben und enthalten grammatikalische Elemente wie Markierungen für Pluralformen, die diesen groben Übersetzungsprozess – oft als Gisting bezeichnet – erschweren. Aber ein neues Gisting-Tool hilft bei der groben Terminologiesuche für Materialien in Arabisch. Es heißt Rosette Arabic Language Analyzer – entwickelt von Basis Technology, einem mehrsprachigen Softwareunternehmen mit Sitz in Cambridge, MA – und verbessert die Suche, indem es die Schreibweise arabischer Wörter reguliert und verwirrende grammatikalische Zusätze entfernt. Das Tool erledigt die rohe, sich wiederholende Arbeit und lässt den Menschen mehr Zeit damit, die Informationen tatsächlich zu analysieren.

Nachdem ein Dokument digitalisiert und gistiert wurde, kann sich ein Linguist mit einer weiteren neuen Assistenztechnologie damit auseinandersetzen: Translation Memory. Ein Translation Memory funktioniert ähnlich wie eine Anwendung zur Rechtschreibprüfung; es wählt einen Textabschnitt aus – sei es ein Wortfragment, mehrere Wörter oder ganze Sätze – und gleicht diesen Abschnitt mit zuvor übersetztem Material ab, wodurch Zeit gespart und die Genauigkeit verbessert wird, indem zumindest eine Teilübersetzung bereitgestellt wird. Es ist bereits ein wichtiges Werkzeug in der Medizin- und Rechtsbranche, wo der gleiche Jargon häufig in verschiedenen Sprachen auftaucht.

Jetzt wird die Translation-Memory-Technologie auf die Geheimdienstarbeit angewendet, bei der Dokumente gelesen werden, die alles andere als formatiert sind. Trados aus Sunnyvale, CA – dem größten Hersteller von Translation-Memory-Software – hofft, Analysten maßgeschneiderte Translation Memorys anbieten zu können, die mit zusammengefassten Texten und nicht nur mit vollständigen Übersetzungen arbeiten, sagt Mandy Pet, Vizepräsidentin von Trados. Im vergangenen Jahr gab Trados bekannt, dass es seine Translation-Memory-Software der Sprachenabteilung des FBI zur Verfügung stellt, die eng mit dem neuen Zentrum zusammenarbeiten wird.

Alle diese Tools werden in einem internetbasierten System zusammengeführt, das es dem neuen Zentrum ermöglicht, Projekte schnell an Analysten vor Ort zu senden und diesen weit verstreuten Analysten eine schnellere und genauere Zusammenarbeit an denselben Projekten zu ermöglichen. Die präzise und hochsichere Webarchitektur, die diese Art der Zusammenarbeit ermöglicht, befindet sich noch im Aufbau. Kathleen Egan, die technische Direktorin des Übersetzungszentrums, sagt, dass ein Teil der Herausforderung darin besteht, sicherzustellen, dass einzelne Bundesnachrichtendienste ihre Geheimnisse bewahren – nicht nur vor Hackern und terroristischen Eindringlingen, sondern auch vor anderen Bundesbehörden. Dies erfordert Modifikationen der bestehenden Internet-Collaboration-Software, um die gemeinsame Nutzung einiger Datenbanken zu ermöglichen und gleichzeitig proprietäre Informationen zu schützen.

Zukunftsagenda

Die wichtigste Frage zum neuen Übersetzungszentrum bleibt: Wird es spürbare Auswirkungen auf die Übersetzungskrise des Landes haben? Einige Beobachter sind skeptisch. Robert David Steele, ein ehemaliger CIA-Offizier, der jetzt ein Gadfly der Geheimdienstgemeinschaft ist, drückt es unverblümt aus: Das FBI wird scheitern, weil es ihm an der Denkweise fehlt, Netzwerke, Übersetzer ohne Sicherheitsfreigaben und Ad-hoc-Verträge zu verstehen. Er sagt voraus, dass sich das Zentrum anderen großen Bundesbemühungen anschließen wird, die sich als zweifelhaft erwiesen haben ( sehen DCs digitale Dysfunktion , Seitenleiste ). Währenddessen sehen andere Experten die Zukunft immer noch in der maschinellen Übersetzung – und arbeiten hart, oft mit staatlichen Mitteln, daran, diese Vision zu verwirklichen. Das neue Übersetzungszentrum ist kurzfristig der einzige Weg. Aber sie müssen diese Entscheidung möglicherweise überdenken, wenn die Technologie sie überholt, sagt Jaime Carbonell, Informatiker an der Carnegie Mellon University und wissenschaftlicher Chefberater von Meaningful Machines, einem New Yorker Startup, das maschinelle Übersetzungsprodukte auf der Grundlage fortschrittlicher statistischer Methoden entwickelt.

Unabhängig davon, ob automatisierte Computertools die Helfer der Gartenvielfalt überholen oder nicht, sollte die Rolle des neuen Zentrums entscheidend sein. Und seine Bemühungen könnten sich auszahlen. Die vom Zentrum betreuten Übersetzungsunterstützungstechnologien könnten die Fähigkeit der US-Regierung verbessern, mit Informationen umzugehen, die in nicht-römischen Alphabeten geschrieben sind, wodurch Visaanträge, Passkontrollen an den Grenzen und sogar Steuererklärungen beschleunigt werden. Sie könnten auch Übersetzungen durch Unternehmen billiger und schneller machen. Eine bessere optische Zeichenerkennung bedeutet beispielsweise Kosteneinsparungen für Unternehmen, die Formulare lesen, wie zum Beispiel Bankschecks oder standardisierte Tests. Große Organisationen wie die Weltbank und die Vereinten Nationen haben riesige Bestände an mehrsprachigen Dokumenten, die sie digitalisieren und online stellen möchten.

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen