Suche über Google hinaus

Wenn Mitarbeiter bei Google Zukunftsängste haben, wissen Sie es nicht von einem Besuch in der Firmenzentrale. Seit letztem Herbst, als die Rede von einem Börsengang die Anleger in Speichelfluss trieb, stand die Organisation unter ungewöhnlicher Beobachtung: Einige Beobachter nannten sie das heißeste Unternehmen der Welt, während andere behaupten, dass es sich um ein Unternehmen ohne führungslose Unordnung handelt, mit Konkurrenten, die sich drängen, und Großkunden am Rande des Abgangs. Aber der Google-Komplex in Mountain View, CA, ist äußerlich so unbeschwert wie jeder College-Campus. Die Hauptlobby ist ein Arbeitszimmer in Shagadelic-Kitsch, mit einem kleinen Flügel, einem sich drehenden Partylicht und einer Reihe von neonhellen Lavalampen, die in der gleichen Blau-Rot-Gelb-Blau-Grün-Rot-Sequenz angeordnet sind wie die des Unternehmens Logo. Die Cafeteria pulsiert mit Rockmusik, geschrienen Gesprächen und den Geräuschen von Geeks, die kostenloses Gourmetessen schlürfen. Oben, in den Kabinenfarmen, plaudern Programmierer über Gehwege, die mit Spielzeug, Segway-Transportern und gelegentlichen Hunden übersät sind.

Erst als ich mich mit dem Google Director of Technology Craig Silverstein in einen ruhigen Konferenzraum setze, wird die schwindelerregende Dotcom-Stimmung ernster. Jetzt, da Unternehmen wie Google und die Internet-Werbeagentur Overture bewiesen haben, dass die Anzeige von themenspezifischen bezahlten Anzeigen neben den Ergebnissen auf einer Suchseite ein echter Geldverdiener ist – der zu geschätzten 2 Milliarden US-Dollar an branchenweiten Einnahmen im Jahr 2003 beitrug – investiert ein Haufen Möchtegerns in Suchsoftware, von der sie sagen, dass sie den Benutzern relevantere Ergebnisse liefert als die von Google, und zwar schneller. Ich frage Silverstein, ob Googles berühmter Fokus auf bessere Technologie es vor all der Konkurrenz halten wird. Seine Antwort ist umsichtig.

Es sei sehr einfach, von einer Suchmaschine zu einer besseren zu wechseln, sagt er. Google bezahlt Hunderte von Forschern und Softwareentwicklern, darunter mehr als 60 Doktoranden, um in diesem Technologiekrieg an vorderster Front zu stehen, erklärt Silverstein, der selbst sein Doktoratsstudium in Informatik an der Stanford University verlängert hat. Aber er räumt ein, dass dies keine Garantie für den Sieg ist. Wir hoffen, dass der nächste Durchbruch von Google kommt – aber wer weiß?



Wer weiß, in der Tat? Laut Reston, dem in Virginia ansässigen Forschungsunternehmen comScore, hat Google einen großen Vorsprung vor seinen Konkurrenten beim Marktanteil in den USA und machte 77 Prozent aller Suchanfragen im August 2003 aus (einschließlich der Suchanfragen bei AOL und Yahoo!, die die Google-Suchmaschine nutzten ). Aber in der Suchbranche ist Innovation ein Joker. Im Jahr 1999 hätte man sagen können, dass AltaVista den Suchmarkt so gut wie abgeschlossen hatte, bemerkt Whit Andrews, Research Director beim Technologieberatungsunternehmen Gartner. 1997 war es Inktomi. 1995 war es Yahoo!. In der Suchbranche weiß man nie, wann jemand auf der Straße ist, der Sie wie die Nachrichten von gestern aussehen lässt.

Google ist teilweise anfällig, weil es nur wenige der infrastrukturellen Vorteile bietet, wie beispielsweise AT&Ts einst ausschließlicher Besitz des größten Teils des Telefonnetzes oder Microsofts Kontrolle über PC-Betriebssysteme, die normalerweise dazu beitragen, die Dominanz aufrechtzuerhalten. (Tatsächlich deuteten Presseberichte im Januar darauf hin, dass Yahoo! bald seine Beziehung zu Google aufgeben und sich seiner eigenen Suchtechnologie zuwenden könnte.) Und der Anspruch des Unternehmens auf Ruhm – die Fähigkeit seiner Suchalgorithmen, die relevantesten Ergebnisse auf der Grundlage ihrer Popularität-kann abgestanden sein. Als Google zum ersten Mal auf den Markt kam, hatten sie einige neue Tricks, an die vorher niemand gedacht hatte, sagt Doug Cutting, ein unabhängiger Software-Berater, der einige der Kerntechnologien der Suchmaschine Excite geschrieben und Suchwerkzeuge für Apple Macintosh-Computer entwickelt hat. Aber viele andere Suchmaschinen bieten jetzt faszinierende Alternativen zu den Techniken von Google, glaubt Cutting.

Da gibt es zum Beispiel Teoma, das Ergebnisse nach ihrem Stand bei anerkannten Autoritäten zu einem Thema einordnet, und das australische Startup Mooter, das das Verhalten von Nutzern untersucht, um genau zu erkennen, wonach sie suchen. Und dann ist da noch der Gorilla aus Redmond: Microsoft wendet sich der Suche als einer seiner nächsten großen Geschäftsmöglichkeiten zu. Seine Forscher entwickeln ein neues Betriebssystem, das Google-ähnliche Suchfunktionen in alle Windows-Programme einfügt, sowie eine Software, die das Web nach endgültigen Antworten auf Fragen durchsucht, die Sie im Alltagsenglisch formulieren. Inzwischen hat Yahoo! hat im Januar ein eigenes Forschungslabor gegründet und Cutting selbst baut eine Open-Source-Alternative zu Google. Heutzutage, sagt er, bin ich nicht davon überzeugt, dass [Google] deutlich besser ist.

Welche Technologie auch immer die Websurfer von morgen anspricht, ihr Erbauer wird enormen Einfluss und stattliche Gewinne erzielen. Täglich werden weltweit rund 550 Millionen Suchanfragen eingegeben (245 Millionen davon in den USA). Laut Safa Rashtchy, Analyst bei Piper Jaffray, werden die Einnahmen aus bezahlter Platzierung durch all diese Suchanfragen bis 2007 rund 7 Milliarden US-Dollar erreichen. Umfragen zeigen jedoch, dass fast ein Viertel der Nutzer in den ersten Links, die von einer Suchmaschine zurückgegeben werden, nicht finden, wonach sie suchen. Das liegt zum Teil daran, dass die wertvollen Informationsnadeln, die wir suchen, unter einem Heuhaufen begraben sind, der jeden Tag um etwa 60 Terabyte anwächst. Aus diesem Grund wird der brutale Wettbewerb in der Suchbranche mit Sicherheit anhalten, insbesondere da Suchunternehmen eine Vielzahl fortschrittlicher Technologien wie die Verarbeitung natürlicher Sprache und maschinelles Lernen einführen. In den nächsten fünf bis zehn Jahren, so Rashtchy, könnten wir massive Verbesserungen sehen, die Relevanz und Nutzung um Größenordnungen steigern. Und es ist die Konkurrenz um diese Verbesserungen – viel mehr als der Erfolg oder Misserfolg des gemunkelten Börsengangs von Google, der von vielen in diesem Frühjahr erwartet wird –, der wahrscheinlich bestimmen wird, wie wir in einigen Jahren im Web navigieren werden.

Rang ziehen

Von Natur aus chaotisch und dezentralisiert, schreit das Web nach Tools, die Menschen dabei helfen, Dokumente zu finden, egal wo sie sich befinden. Angenommen, Sie möchten Informationen zu Behandlungen von Skorbut im 18. www.jameslindlibrary.org/trial_records/17th_18th_ Century/lind/lind_kp.html) auf einem Server in der Bibliothek des Royal College of Physicians in Edinburgh, Schottland.

Wenn Sie jedoch Skorbut in ein Suchfeld bei Google oder MSN oder Ask Jeeves eingeben, berühren Sie die eigentliche Datei am Royal College immer noch nicht. Sie durchwühlen lediglich den Index des Web-Suchunternehmens – eine riesige Liste, die von Software-Spidern zusammengestellt wird, die jede Sekunde Tausende von Seiten durchsuchen und Schlüsselwörter, Phrasen, Titel und Untertitel, Links und andere beschreibende Informationen kopieren. Sobald ein Informationsfragment im Index landet, wird es normalerweise komprimiert, einer Gewichtung oder Wichtigkeit zugewiesen und in einer Datenbank zum schnellen Abrufen gespeichert. Die von Ihnen eingegebenen Suchbegriffe werden mit diesem Index verglichen und Links zu Seiten, die einen oder mehrere Ihrer Begriffe enthalten, werden nach Relevanz geordnet angezeigt.

Wie eine Suchmaschine diese Relevanz bestimmt, ist das Geheimnis. Google wurde 1999 vor allem durch PageRank bekannt, einen Algorithmus, der von den Gründern Larry Page und Sergey Brin erfunden wurde und als erster von der massiven Verlinkung von Webseiten profitierte. Jeder Link ist in der Tat eine Stimme des Autors einer Seite für den Inhalt einer anderen. Page und Brin erkannten, dass sie, wenn ihr Index groß genug wäre, die Bedeutung einer Seite einschätzen könnten, indem sie die Anzahl der anderen verlinkten Seiten zählen. Sie berücksichtigten auch andere Faktoren, wie die Relevanz des Textes, der die Links umgibt, und die eigene Popularität der verlinkten Seiten. Aber ihre bahnbrechende Erkenntnis war, dass das Web ein riesiger Popularitätswettbewerb ist – und dass die am häufigsten zitierten Seiten wahrscheinlich die nützlichsten sein werden. Die Technik funktionierte teuflisch gut, und die Webnutzer stimmten mit ihren Klicks ab. Zwischen Juni 2000 und Januar 2004 fiel der ehemalige Platzhirsch AltaVista, der die Ergebnisse weitgehend nach der Häufigkeit der Erwähnung der Suchbegriffe des Benutzers auf einer Seite einordnete, vom achten Platz im gesamten Web-Traffic-Ranking auf den 61 Platz vier nach Daten der Marktforschungsunternehmen Media Metrix und Alexa. Google hat das Web so stark durchdrungen, dass sein Name von der American Dialect Society zum nützlichsten neuen Wort des Jahres 2002 gewählt wurde.

Trotz seiner Vorteile hat PageRank einige Schwächen. So wie frühere Suchmaschinen von Seiten mit Tausenden von Schlüsselwörtern in unsichtbarer Weiß-auf-Weiß-Schrift getäuscht werden konnten, kann ein skrupelloser Site-Besitzer, der möchte, dass seine Webadresse in den Google-Suchergebnissen höher erscheint, problemlos Tausende oder sogar Millionen Junk-Seiten veröffentlichen die Links zu seiner Site enthalten und deren Rang künstlich erhöhen. (Google sagt, dass es Möglichkeiten hat, solchen Angriffen entgegenzuwirken, wird sie aber nicht diskutieren.) Die gleiche Lücke im PageRank ermöglicht Google-Bombing – ein neueres Phänomen, bei dem Blogger einen humorvollen oder politischen Standpunkt vertreten, indem sie so viele Links zu einer bestimmten Website erstellen, dass Es erscheint zuerst, wenn Benutzer einen bestimmten Begriff in das Google-Suchfeld eingeben. Google-Bomber, die gegen den Irak-Krieg protestierten, schafften es zum Beispiel, die Biografie von George W. Bush im Weißen Haus unter kläglichem Scheitern zum ersten Ergebnis zu machen.

Ärgerlicher für einige Kritiker ist jedoch die Besessenheit von PageRank vom Ruhm. Eine legitime Seite, die perfekt zu den Suchbegriffen eines Google-Nutzers passt, kann in den Suchergebnissen untergehen, einfach weil nicht genügend andere Seiten darauf verweisen, bemerkt Daniel Brandt, ein Webentwickler, der eine kritische Website namens Google Watch betreibt. Die Relevanz einer Seite für einen einzelnen Benutzer, argumentieren Brandt und andere Kritiker, hängt möglicherweise nicht nur von ihrer Popularität ab. Nur weil der Rest der Welt denkt, dass dies die Reise-Website Nummer eins ist, heißt das nicht, dass es die Reise-Website Nummer eins für Sie ist, sagt Liesl Capper, Gründerin und CEO des in Sydney ansässigen Emporkömmlings Mooter, die glaubt, dass sie es einfach haben könnte ein besserer Weg.

Hussein Chalayan verwandelt Kleider

Suchergebnisse mit einem Stempel versehen

Geben Sie denselben Suchbegriff in zehn verschiedene Suchmaschinen ein, und Sie erhalten wahrscheinlich zehn widersprüchliche Ergebnisse. Das liegt zum Teil daran, dass die Spider der Suchunternehmen verschiedene Teilmengen des Webs durchsuchen; Aber noch wichtiger ist, dass es die einzigartigen Prinzipien widerspiegelt, die in den Ranking-Algorithmen jedes Unternehmens am Werk sind. So gehen drei Suchmaschinen mit dem Begriff um Briefmarkensammlung .

Frag Jeeves/Teoma Google Mooter
eins. American Philatelic Society Münz- und Briefmarkensammeln (Über.com) Stempel-Link -Philatelie, die beste Site der Briefmarkensammlung in ihrer Kategorie
zwei. Joseph Lufts philatelistische Ressourcen im Web
Joseph Lufts philatelistische Ressourcen im Web
Warragul Philatelic Society (Briefmarkensammlung)
3. Linns.com : Die Website der größten wöchentlichen Briefmarkenzeitung der Welt – Linn’s Stamp News American Philatelic Society Postgeschichte , Briefmarken und Briefmarken zu verkaufen
Vier. Stempel-Link -Philatelie, die beste Site der Briefmarkensammlung in ihrer Kategorie BNAPS Briefmarkensammeln für Kinder Großbritannien Philatelistische Gesellschaft
5. Philatelie.Com Linns.com : Die Website der größten wöchentlichen Briefmarkenzeitung der Welt – Linn’s Stamp News Briefmarkensammeln, Philatelie, Briefmarkenauktion
Die Seite mit dem höchsten Rang hat die höchste Autorität – im Wesentlichen die meisten Links – unter den Communitys von Websites zum Sammeln von Briefmarken. Es wird durch Referenzen von Ressourcenseiten (Linksammlungen von Experten und Enthusiasten – in diesem Fall von Briefmarkensammlern) und Linkpopularitätsmessungen ähnlich denen von Google validiert. Der Zweitplatzierte, Joseph Lufts Philatelic Resources, hat immer weniger qualifizierte Empfehlungen von Experten zu diesem Thema. Google-Beamte werden nicht diskutieren, wie die Google-Engine zu Rankings für bestimmte Websites kommt. Patentdokumente und veröffentlichte Papiere zeigen jedoch, dass Google Seiten danach einordnet, wie oft andere Seiten darauf verweisen. Google berücksichtigt auch Faktoren wie die Relevanz der verweisenden Seiten und den Text, der die Links umgibt. Vermutlich Sammelmarken. about.com ist die meistzitierte Seite zu diesem Thema im Google-Index. Mooter gruppiert die Ergebnisse zunächst zu Clustern oder Themen. Die oben aufgeführten Seiten erscheinen im Philatelie-Cluster, geordnet nach der Häufigkeit der Suchbegriffe und des Clusternamens auf jeder Seite, unter anderem. Mooter erkennt die Absicht des Benutzers, indem es notiert, auf welche Cluster und Seiten geklickt wird, und ordnet die Ergebnisse neu ein, um das offensichtliche Interessenmuster widerzuspiegeln.

Quellen: Ask Jeeves, Google, Mooter. Ergebnisse aktuell: 5. Januar 2004 (Ask Jeeves, Google), 13. Januar 2004 (Mooter).

Ein Starburst an Ideen

Ich esse mit Capper an einem brillanten Frühwintertag in San Francisco zu Mittag. Sie ist in der Stadt, um potenzielle Investoren und Kunden zu besuchen. Menschen, die den Informationsfluss kontrollieren, haben eine subtile, aber durchdringende Macht, sagt sie mir ernst. Jemand muss diese Macht innehaben, und es ist wichtig, dass die Menschen, die dies tun, bewusst versuchen, einen positiven Einfluss zu haben und die Macht dem Einzelnen zurückgeben. Mooter zielt darauf ab, die Websuche einfacher und persönlicher zu gestalten. Capper wuchs in Sambia auf, studierte Psychologie in Südafrika und gründete eine Kette von frühkindlichen Entwicklungszentren, bevor sie 1997 nach Australien auswanderte und sich für die Suchtechnologie als ihren nächsten Erfolg entschied. Sie eröffnete ein Geschäft in der Innenstadt von Sydney und stellte Jondarr Gibb, einen erfahrenen Softwarearchitekten, und John Zakos, einen Doktoranden, der seine Doktorarbeit an der Griffith University über die Anwendung der Theorie neuronaler Netze auf Internetsuchen verfasste, ein.

Die drei haben ihre Ideen zu Psychologie, Software und neuronalen Netzen gemischt, um einen Ranking-Algorithmus zu erstellen, der im Verlauf der Suche vom Benutzer lernt. Bevor Mooter eine lange Liste von Links auf einen Benutzer ausgibt, analysiert Mooter die möglichen Bedeutungen und Verwandlungen der Ausgangs-Keywords und ordnet im Hintergrund die Relevanz der resultierenden Webseiten in breite Kategorien ein, die als Cluster bezeichnet werden. Der Benutzer sieht zuerst einen Sternhaufen von Clusternamen auf dem Bildschirm. Eine Suche nach dem Namen Paul Czanne beispielsweise liefert Cluster wie Kunst, Künstler, Czanne, Frankreich, Galerien , und Berühmte Gemälde . Das ist der psychologische Teil. Wenn Sie eine traditionelle Suche durchführen, erhalten Sie Millionen von Ergebnissen, und Ihr Verstand führt eine konzeptionelle Gruppierung durch, sagt Capper. Aber unser Gehirn ist darauf eingestellt, nur drei bis fünf Arten von Informationen gleichzeitig zu verarbeiten. Wir haben uns entschieden, das nicht außer Kraft zu setzen, sondern damit zu arbeiten.

Dann kommt der Lernteil. Um ein genaueres Verständnis dafür zu entwickeln, wonach der Benutzer wahrscheinlich sucht, merkt sich die Mooter-Engine, welche Cluster und Links angeklickt werden und verwendet diese Informationen, um zukünftige Antworten zu verbessern. Angenommen, ein Benutzer gibt den Begriff Hund ein, klickt auf einen Cluster namens Rassen und verbringt dann viel Zeit damit, sich Websites über Schnoodles (ein beliebter Schnauzer-Pudel-Mix) anzusehen. Wenn der Benutzer auf ein neues Suchergebnis klickt, personalisiert Mooter das Ranking, um dieses offensichtliche Interessenmuster widerzuspiegeln, was beispielsweise dazu führen kann, dass Websites über Hunde plus Rassen plus Schnoodles höher erscheinen. Auf jeder Seite wird eine verfeinerte Ergebnismenge angezeigt; die Engine passt die Rankings weiterhin basierend auf dem Verhalten des Benutzers an.

Die ganze Idee ist, den Leuten mit so wenigen Klicks wie möglich die gewünschten Ergebnisse zu liefern. Zwei Klicks und wir haben schon eine sehr gute Vorstellung davon, wohin die Reise geht, sagt Capper. Als die Beta-Site von Mooter im vergangenen Oktober debütierte, hatte Capper nicht erwartet, dass sie außerhalb Australiens bemerkt würde. Der Verkehr aus der ganzen Welt sei jedoch so stark gewesen, dass das Unternehmen mehr Webserver installieren musste, um den Dienst am Laufen zu halten.

Verbringen Sie viel Zeit damit, mit Insidern der Suchindustrie zu sprechen, und Sie werden feststellen, dass es fast so viele Möglichkeiten gibt, Suchergebnisse zu ordnen wie Seiten im Web. Googles angebliches Übermaß an Popularität war eine der Inspirationen für Teoma (ausgesprochen tay-o-ma), das im Jahr 2000 vom Informatiker Apostolos Gerasoulis und Kollegen an der Rutgers University in New Jersey gegründet wurde. Die Suchsoftware von Teoma unterstützt jetzt Ask Jeeves, die Nummer sechs der Suchseiten. Google schaut sich die Struktur des Webs an, aber diese Methode geht nicht auf die nächste Ebene, sagt Paul Gardi, Senior Vice President für Suche bei Teoma. Auf der lokalen Ebene werden Sie feststellen, dass sich Links um bestimmte Themen oder Themen gruppieren, ähnlich wie bei Gemeinschaften. Zum Beispiel verlinken Seiten zum Thema Heimwerken nicht einfach nach oben auf beliebtere Seiten; sie neigen auch dazu, miteinander zu verlinken und Kreise um bekannte Websites wie Hometime.com, Homeideas.com und BobVila.com zu bilden.

Die Rutgers-Wissenschaftler haben Teoma (Gälisch für Experte) entwickelt, um diese themenspezifischen Gemeinschaften zu finden und ihre Weisheit zu nutzen. Bevor die Teoma-Engine die Ergebnisse für einen bestimmten Satz von Schlüsselwörtern präsentiert, erklärt Gardi, identifiziert sie die zugehörigen Communities und sucht nach den Autoritäten in ihnen, dh den Seiten, auf die die Websites der Community-Mitglieder am häufigsten verweisen. Teoma versucht, die Glaubwürdigkeit dieser Autoritätsseiten zu überprüfen, indem überprüft wird, ob sie auf Ressourcenseiten aufgeführt sind, die von Fachexperten oder Enthusiasten erstellt wurden und die dazu neigen, auf die besten Seiten innerhalb der Community zu verlinken. Anschließend werden die Suchergebnisse danach geordnet, wie oft jede Seite von Normseiten zitiert wird.

IBM und andere Organisationen experimentierten Ende der 1990er Jahre mit ähnlichen autoritätsbasierten Ranking-Systemen, aber Gerasoulis sagt, dass es Stunden dauern könnte, bis sich ihre Ansätze durch alle Seiten da draußen durchkämmten. Die proprietäre Technik von Gerasoulis macht das gleiche in etwa einer Fünftelsekunde. Ask Jeeves hat seinen vorherigen Suchanbieter verlassen und ist 2001 auf die Technologie von Teoma umgestiegen, und sein Abfragevolumen stieg 2002 und 2003 um 30 Prozent pro Jahr.

Tiktok macht mich depressiv

So schwer es auch sein mag zu glauben, wenn man sich ein Dutzend Seiten mit Suchergebnissen ansieht, die heutigen Suchmaschinen ignorieren das meiste, was es im Internet gibt. Software-Spider haben Schwierigkeiten, Inhalte zu indizieren, die hinter Anmeldeformularen geschützt oder in Datenbanken wie Produktkatalogen oder Rechts- und Medizinarchiven gespeichert sind und nur dann in Webseiten zusammengestellt werden, wenn Benutzer sie anfordern. Dieses sogenannte Deep Web kann laut der School of Information Management and Systems der University of California, Berkeley, weltweit bis zu 92 Petabyte (92 Millionen Gigabyte) oder fast das 500-fache des Volumens des Oberflächen-Webs betragen.

Das Mining des Deep Web ist die Mission eines weiteren frischen Gesichts im Suchgeschäft – Dipsie aus Chicago. Google und Teoma indizieren nur etwa 1 Prozent der Dokumente, sagt Jason Wiener, Gründer und Chief Technology Officer von Dipsie. Wiener, ein autodidaktischer Programmierer, der bis zum Dot-Com-Crash eine Webentwicklungsfirma in San Francisco leitete, hat die letzten zwei Jahre damit verbracht, einen flinkeren Crawler zu entwickeln, der an Formularen und Datenbankschnittstellen vorbeikommt. Angenommen, Sie fragen sich über die Serienausstattung eines Mercedes 55SL Cabrios. Auf Cars.com sind etwa sechs Schritte erforderlich, um auf die Seite mit detaillierten Produktinformationen herunterzufahren. Dipsie hat jedoch die gesamte Cars.com-Datenbank im Voraus indiziert, sodass Sie mit einem einzigen Klick auf dieselbe Seite gelangen können. Wir handhaben nichts, was eine Authentifizierung mit Benutzername und Passwort erfordert, aber fast alles andere, sagt Wiener. Er behauptet, dass bis zur öffentlichen Verfügbarkeit der Suchseite von Dipsie in diesem Sommer ihr Index 10 Milliarden Dokumente umfassen wird – das Dreifache der aktuellen Größe des Google-Index.

Während Google immer noch König des Hügels ist, wimmelt es jetzt von Konkurrenten mit ihren eigenen brillanten Ideen. Google weiß das, sagt Gartner-Analyst Andrews. Sie wurden in Stanford geboren und wissen, dass es Studenten in Stanfords Klassen gibt, die sagen: Hey, ich habe eine Idee – was wäre, wenn wir diesen Algorithmus nehmen und ihn mit diesem Algorithmus zusammenfügen?“ Sie müssen entweder einstellen die jungen Türken oder besiegen sie.

Mikrosuche

Aber wenn es ein Softwareunternehmen gibt, das es versteht, junge Türken einzustellen und ihre Ideen in marktbeherrschende Produkte umzusetzen, dann ist es Microsoft. Nennen Sie irgendeine heiße Ecke der Informatik, und das Unternehmen, das Bill aufgebaut hat, wird wahrscheinlich mindestens einen oder zwei der führenden Forscher auf diesem Gebiet beschäftigen: Immerhin beschäftigen die fünf Microsoft Research-Labors weltweit mehr als 600 Forscher. Und wenn Microsoft einen großen Markt wittert, bewegt es sich normalerweise mit voller Kraft, um seinen Anspruch geltend zu machen.

Microsofts Vorstöße in die Informationssuche, die Disziplin, aus der die Suchmaschine hervorgegangen ist, haben nichts mit blauem Himmel zu tun. Das Unternehmen hat bereits 97 Prozent Marktanteil bei PC-Betriebssystemen und 90 Prozent bei Office-Software gewonnen; search ist einer der letzten großen Teile der Computerlandschaft, die Microsoft nicht beherrscht. Und eine Umfrage zu F&E-Projekten des Unternehmens bestätigt, dass verbesserte Suchformen der Schlüssel zu seinem Geschäftswachstum sind. Da die Veröffentlichung der nächsten Windows-Version mit dem Codenamen Longhorn näher rückt – eine Testversion wird noch in diesem Jahr verfügbar sein – beschleunigen Forscher und Produktentwickler ihre Bemühungen, die Websuche zu einem integralen Bestandteil davon zu machen.

Eine der auffälligsten Software in den Werken verspricht Ihnen, Ihre Fragen in einfachem Englisch einzugeben und eine direkte Antwort zu erhalten. Das Unternehmen ist der Ansicht, dass sich Suchnutzer keine Gedanken über die Auswahl der richtigen Schlüsselwörter machen müssen, indem sie sie mit den richtigen booleschen Operatoren ( und, oder, nicht , usw.) und Seite für Seite der Suchergebnisse durchblättern. Stattdessen, sagt Microsoft-Forscher Eric Brill, sollten Suchmaschinen Fragen in natürlicher Sprache verstehen und beantworten.

Nehmen Sie das AskMSR-Programm von Microsoft Research, das Brill und seine Kollegen seit mehr als einem Jahr im internen Netzwerk von Microsoft testen. Im Kern befindet sich ein einfaches Suchfeld, in das Benutzer Fragen eingeben können, z. B. Wer hat Abraham Lincoln getötet? und anstatt eine Liste von Websites zu erhalten, die möglicherweise die gesuchten Informationen enthalten, erhalten Sie eine klare Antwort: John Wilkes Booth. Die Software verlässt sich nicht auf einen fortschrittlichen Algorithmus der künstlichen Intelligenz, sondern auf zwei überraschend einfache Tricks. Erstens verwendet es Sprachregeln, die aus einer großen Datenbank mit Beispielsätzen gelernt wurden, um die Suchphrase so umzuschreiben, dass sie möglichen Antworten ähnelt: zum Beispiel ___ hat Abraham Lincoln getötet oder Abraham Lincoln wurde von ___ getötet. Diese Textzeichenfolgen werden dann als Abfragen in einer Abfolge von standardmäßigen schlüsselwortbasierten Websuchen verwendet. Wenn die Suchen eine genaue Übereinstimmung ergeben, ist das Programm fertig und präsentiert dem Benutzer diese Antwort.

In vielen Fällen findet das Programm jedoch keine exakte Übereinstimmung, sondern nur schräge Variationen der Textzeichenfolgen, wie beispielsweise die Gewalttat von John Wilkes Booth im Ford Theatre, die Lincolns zweite Amtszeit vor ihrem Beginn beendete. Das ist auch in Ordnung. Als zweiten Trick argumentiert AskMSR, dass, wenn Booth häufig im gleichen Satz wie Lincoln auftaucht, eine wichtige Beziehung zwischen ihnen bestehen muss – die es ihm ermöglicht, eine Antwort zu postulieren, auch wenn es nicht zu 100 Prozent zuversichtlich ist ( siehe F: Wie funktioniert die Beantwortung von Fragen? unter ). Wir nutzen die Redundanz des Webs, erklärt Brill. Wenn Sie viele Stellen haben, an denen Sie sich ziemlich sicher sind, die Antwort gefunden zu haben, macht die Redundanz sie sicherer. Mit dem Wachstum des Webs wächst auch seine Redundanz, was AskMSR immer leistungsfähiger macht, so Brill. Obwohl die Pläne für AskMSR noch nicht feststehen, glaubt Brill, dass der Code das Licht der Welt erblicken wird, vielleicht als Teil einer zukünftigen Microsoft-Suchmaschine.

Eine andere Anstrengung von Microsoft Research beschäftigt sich weniger mit der Funktionsweise von Suchmaschinen als vielmehr damit, wie und wann Benutzer Informationen benötigen. Wenn Sie jetzt nach Informationen suchen möchten, stoppen Sie im Grunde alles, was Sie tun, rufen eine separate Anwendung auf, führen die Suche aus und versuchen dann, das Suchergebnis in alles zu integrieren, was Sie zuvor getan haben, sagt die Microsoft Information Retrieval-Expertin Susan Dumais. Wir versuchen, darüber nachzudenken, wie die Suche viel mehr Teil der laufenden Computererfahrung sein kann.

Zu diesem Zweck entwickelt Dumais ein Programm namens Stuff I’ve Seen, das Computerbenutzern einen schnellen und einfachen Zugriff auf alles bietet, was sie auf ihren Computern angesehen haben. Die Schnittstelle zum experimentellen Programm, die die Suchfunktionen in Longhorn beeinflusst, ist ein immer verfügbares Suchfeld in der Windows-Taskleiste. Geben Sie eine Abfrage in das Feld ein und Stuff I've Seen zeigt eine organisierte Liste mit Links zu verwandten E-Mail-Nachrichten, Kalenderterminen, Adressbuchkontakten, Office-Dokumenten oder Webseiten in einem einzigen, einheitlichen Fenster an. Eine neue Funktion von Stuff I’ve Seen namens Implicit Query würde im Hintergrund arbeiten, um Informationen zu dem abzurufen, woran der Benutzer gerade arbeitet. Wenn Sie beispielsweise eine E-Mail-Nachricht lesen, zeigt die implizite Abfrage möglicherweise ein Feld mit Links zu den Titeln und E-Mail-Adressen aller Personen an, die in der Nachricht erwähnt werden, sowie zu allen Ihren vorherigen E-Mails vom Absender. Um die Software noch nützlicher zu machen, arbeitet Dumais daran, dem standardmäßigen Windows-Rechtsklickmenü der Zwei-Tasten-Maus ein Element hinzuzufügen, das die Bezeichnung Find me stuff like this trägt und sowohl persönliche als auch Webdaten nach Informationen zu einem hervorgehobenen . durchsucht Name oder Phrase.

AskMSR, Stuff I've Seen und verwandte Projekte sind alle Teil einer größeren Verschiebung der Technologiestrategie bei Microsoft, die das Unternehmen in die Lage versetzen könnte, Hunderte Millionen Windows-Benutzer auf der ganzen Welt auf seine eigene Suchtechnologie umzustellen, ähnlich wie es ist hat Netscape in den 1990er Jahren den Webbrowser-Markt abgerungen. Der Kern dieser Transformation ist das neue Windows File System oder WinFS – das Herzstück von Longhorn. Unter dem aktuellen Windows-Dateisystem partitioniert jede Softwareanwendung ihren zugewiesenen Speicherplatz in ihre eigene besondere Ordnerhierarchie. Dadurch ist es beispielsweise fast unmöglich, einen Informationsblock wie den Namen des Autors eines Word-Dokuments mit der Adresse oder Telefonnummer derselben Person in Outlook zu verknüpfen. Im Gegensatz dazu hat WinFS im Kern eine relationale Datenbank: einen geordneten Satz von Tabellen, die auf Ihrer Festplatte gespeichert sind und in denen alle Daten auf Ihrem Computer von allen Anwendungen mit einem Standardsatz von Befehlen durchsucht und geändert werden können.

Wenn Longhorn Tools enthält, die auf Stuff I've Seen basieren und ihnen ermöglichen, direkt mit einer Websuchmaschine zu kommunizieren, könnte es das einzige Suchfeld erstellen, von dem Softwarehersteller träumen - das Tor zu allen Informationen, die Sie benötigen, egal ob auf Ihrem PC oder im Netzwerk raus. Whit Andrews von Gartner freut sich beispielsweise auf die neue Software von Microsoft. Her damit! er sagt. Ich sitze hier und schaue auf meine E-Mails. Wenn ich dich suchen möchte, muss ich daran denken, dich zu googeln. Aber was ich wirklich möchte, ist herauszufinden, ob ich in der Vergangenheit mit Ihnen gesprochen habe. Also möchte ich mit der rechten Maustaste klicken und global suchen, meine E-Mail- und Kontaktordner durchsuchen, U.S. Search.com durchsuchen [das den Zugriff auf Informationen verkauft, die in öffentlichen Aufzeichnungen gespeichert sind]. Wer hat diesen Vorteil? Microsoft ist da, und für die Billigprodukte, für die die Verbraucher nicht viel Geld ausgeben werden, sind sie in einer hervorragenden Position.

Q: Wie funktioniert die Beantwortung von Fragen?
A: So

Microsofts AskMSR Software wandelt einfache englische Fragen in formale Suchanfragen um und befragt das Web
für Konsensantworten.

1. Frage Wie viele Eier hat ein Dutzend eines Bäckers?
2. Abfrage umschreiben Es gibt + Eier in einem + Bäcker-Dutzend
Ein Dutzend eines Bäckers hat + Eier
Bäcker + Dutzend + Eier
3. Suchergebnisse sammeln und filtern (Ignorieren Sie beispielsweise Ergebnisse, die keiner Antwort auf eine Frage wie viele ähneln) Ein Dutzend hat normalerweise 12 Eier, also wie viele Eier hat ein Dutzend eines Bäckers?
Das Dutzend Kochbuch des Bäckers
Warum werden 13 Eier als Bäckerdutzend bezeichnet?
13 Eier ergeben ein Dutzend eines Bäckers.
4. Antworten aus dem Text extrahieren
und präsentiere die wahrscheinlichsten Antworten
13 Eier (81 Prozent wahrscheinlich)
12 Eier (7 Prozent wahrscheinlich)

Quelle: Microsoft

gpt 3 Suchmaschine

Inzwischen zurück im Googleplex

Ich frage den Technologiedirektor von Google, Craig Silverstein, ob Microsofts Suchaufbau ihn nachts wach hält. Er räumt ein, dass Microsoft und Google einige der gleichen technischen Gebiete erkunden, behauptet jedoch, dass Google, weil es so viel kleiner ist als Microsoft (1.000 Mitarbeiter gegenüber 55.000), agiler auf seine Ideen reagieren kann. Und trotz seiner insgesamt geringeren Größe hat Google mehr Forscher, die sich hauptsächlich der Suche widmen als Microsoft. Silverstein weist auch darauf hin, dass jeder der mehreren hundert Softwareentwickler bei Google im Rahmen seines Jobs 10 Prozent seiner Zeit mit weit entfernten persönlichen Projekten verbringen muss, die einen kontinuierlichen Fluss kreativer Ideen ermöglichen.

Einige dieser Projekte tauchen in Google Labs (labs.google.com) auf, einem Abschnitt der Google-Website, in dem die Öffentlichkeit suchbezogene Software, die sich noch in der Entwicklung befindet, ausprobieren und kommentieren kann. Google Viewer zum Beispiel animiert Ergebnisse, sodass sie wie Filmabspann auf dem Bildschirm nach oben scrollen. Mit der Sprachsuche können Sie eine Suche per Telefon eingeben, wenn Sie nicht an Ihrem Schreibtisch sind, und die Ergebnisse später online abrufen. Die Google Deskbar installiert ein permanentes Google-Suchfeld in der Windows-Taskleiste; Die Ergebnisse werden in einem kleinen, temporären Fenster angezeigt, sodass Benutzer ihren Webbrowser nicht jedes Mal starten müssen, wenn sie etwas nachschlagen möchten.

Aber keiner der Google Labs-Prototypen stellt eine Innovation in der Größenordnung von Page und Brins ursprünglichem PageRank-Algorithmus dar. Sie sind auch nicht in der gleichen Liga wie Microsofts Bemühen, Windows neu zu erfinden und die darauf laufenden Anwendungen zu integrieren. Silverstein und seine Kollegen werden zwar über die Effizienz der mehr als 10.000 Webserver von Google und die Leidenschaft und Tatkraft der Programmierer von Google sprechen, aber sie werden nicht sagen, wie das Unternehmen den PageRank verbessern will oder welche neuen Technologien Bedrohungen wie Teoma und AskMSR. Am Ende gibt es also wenig äußerlichen Beweis dafür, dass Google die neuen Ideen hat, die es braucht, um seinen Marktanteil zu halten. Laut dem Open-Source-Programmierer Doug Cutting gibt es bei Google viele Leute, die versuchen, monumentale Fortschritte zu erzielen, aber wir haben sie nicht gesehen. Ich denke, wenn sie sie hätten, würden sie es ihnen zeigen.

Eine Sache, über die Silverstein gerne spricht, ist sein langfristiges Ziel für die Suchtechnologie, das seiner Meinung nach noch in den Kinderschuhen steckt. Es ist klar, dass die Antwort [zu suchen] keine Rangliste von Websites ist, sagt er. Niemand erwarte, einen Bibliothekar zu kontaktieren, eine Frage zum Panamakanal zu stellen und als Antwort 50 Buchtitel zu erhalten, argumentiert er. Silverstein ist der Meinung, dass Informationsabrufexperten hohe Ziele verfolgen sollten und eine Software entwickeln sollten, die Benutzern genauso gut auf die spezifischen Ressourcen weist, die sie benötigen, wie ein gut ausgebildeter Nachschlagewerksbibliothekar. Dies erfordert natürlich große Fortschritte in Bereichen wie dem probabilistischen maschinellen Lernen und der Verarbeitung natürlicher Sprache – und Google stellt weiterhin einige der besten neuen Doktoranden in diesen Bereichen ein, darunter vier Absolventen des Stanford-Labors von Daphne Koller, a führender Forscher für maschinelles Lernen ( sehen 10 neue Technologien, die Ihre Welt verändern werden , KINDER Februar 2004 ).

Aber wird all dieses Talent in Werkzeuge umgesetzt, die die Leute verwenden können? Google selbst tauchte scheinbar aus dem Nichts auf und überschattete schnell andere bekannte Suchmaschinen wie AltaVista. Und wenn es eine Botschaft der Priester des Dotcom-Booms gibt, die immer noch wahr ist, dann ist es, dass der Wunsch der Menschen nach schnelleren und effizienteren Möglichkeiten die Markenloyalität jedes Mal übertrumpft. Wenn Konkurrenten wie Ask Jeeves und Emporkömmlinge wie Mooter oder Dipsie auch nur einen Teil ihrer Visionen von besseren Ranking-Algorithmen, einfacheren Schnittstellen und größeren, umfassenderen Indizes verwirklichen, könnten sie Googles Geschäft einen großen Teil davon nehmen. Microsofts umfassende Überarbeitung der Windows-Umgebung verspricht unterdessen, das Suchkonzept für die überwiegende Mehrheit der Computerbenutzer zu ändern.

Die gute Nachricht für Internet-Surfer ist, dass der Wettbewerb Such-Utilities zu einem noch hilfreicheren Teil unseres täglichen Lebens machen wird. Ohne Suchwerkzeuge wären die Reichtümer des Webs genauso unzugänglich wie die Tafeln, Schriftrollen und handkopierten Wälzer des Zeitalters vor Gutenberg. Doch welche Technologien den gewünschten Zugang ermöglichen – und wer davon am meisten profitiert – sind Fragen, die selbst die besten Suchmaschinen nicht beantworten können.

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen