Können automatisierte Redaktionstools dem Rückgang der freiwilligen Mitarbeiter von Wikipedia helfen?

Das Ergebnis sind viele hochwertige Artikel zu einem riesigen Themenspektrum in über 200 Sprachen. Es gibt aber auch Artikel von schlechter Qualität und zweifelhafter Wahrhaftigkeit.

Dies wirft für Besucher der Site eine wichtige Frage auf: Wie zuverlässig ist ein bestimmter Artikel auf Wikipedia?

gasjobs in pa

Heute bekommen wir dank der Arbeit von Xiangju Qin und Pádraig Cunningham vom University College Dublin in Irland eine Antwort. Diese Jungs haben einen Algorithmus entwickelt, der die Qualität von Wikipedia-Seiten basierend auf der Autorität der beteiligten Redakteure und der Langlebigkeit der von ihnen vorgenommenen Bearbeitungen bewertet.



Die Hypothese ist, dass Seiten mit bedeutenden Beiträgen von maßgeblichen Mitwirkenden wahrscheinlich qualitativ hochwertige Seiten sind, sagen sie. Angesichts dieser Informationen sollten Wikipedia-Besucher in der Lage sein, die Qualität jedes Artikels viel genauer zu beurteilen.

Verschiedene Gruppen haben sich in der Vergangenheit mit der Qualität von Wikipedia-Artikeln und deren Messung beschäftigt. Die Neuheit dieser Arbeit liegt in der neuen Kombination bestehender Maßnahmen.

Qin und Cunningham beginnen mit einer Standardmethode, um die Langlebigkeit eines Schnitts zu messen. Die Idee dabei ist, dass eine qualitativ hochwertige Bearbeitung eine zukünftige Überarbeitung mit größerer Wahrscheinlichkeit übersteht. Sie berechneten dies, indem sie die Größe einer Bearbeitung eines bestimmten Autors und die Dauer dieser Bearbeitung nach anderen Revisionen kombinierten.

Vandalismus ist ein häufiges Problem bei Wikipedia. Um dies zu umgehen, ignorieren Qin und Cunningham alle anonymen Beiträge und nehmen außerdem ein durchschnittliches Maß an Qualität vor, das die Auswirkungen böswilliger Änderungen tendenziell verringert.

Als nächstes messen sie die Autorität jedes Redakteurs. Wikipedia ist dafür bekannt, eine relativ kleine Anzahl engagierter Redakteure zu haben, die eine grundlegende Rolle in der Community spielen. Diese Leute helfen, verschiedene redaktionelle Standards aufrechtzuerhalten und dieses Wissen in der Community zu verbreiten.

In dieser Community gehen Qin und Cunningham davon aus, dass eine Verbindung zwischen zwei Redakteuren besteht, wenn beide gemeinsam einen Artikel verfasst haben. Daher sind erfahrenere Redakteure zwangsläufig besser im Netzwerk vernetzt.

Es gibt verschiedene Möglichkeiten, Autorität zu messen. Qin und Cunningham sehen sich an, mit wie vielen anderen Redakteuren ein bestimmter Redakteur verknüpft ist. Sie bewerten den Anteil der kürzesten Pfade im Netzwerk, die einen bestimmten Editor passieren. Und sie verwenden einen iterativen Algorithmus vom Pagerank-Typ, um Autorität zu messen. (Pagerank ist der Google-Algorithmus, bei dem eine Webseite als wichtig angesehen wird, wenn andere wichtige Webseiten darauf verweisen.)

das herz wächst mit distanz

Schließlich kombinieren Qin und Cunningham diese Metriken der Langlebigkeit und Autorität, um ein Maß für die Artikelqualität zu erstellen.

Um die Effektivität ihrer Bewertung zu testen, haben sie mit ihrem Algorithmus die Qualität von über 9.000 Artikeln bewertet, die bereits von Wikipedia-Redakteuren bewertet wurden. Sie sagen, dass die Langlebigkeit eines Edits allein schon ein guter Indikator für die Qualität eines Artikels ist. Die Berücksichtigung der Autorität der Herausgeber verbessert jedoch in der Regel die Bewertung.

Artikel mit bedeutenden Beiträgen von maßgeblichen Mitwirkenden sind wahrscheinlich von hoher Qualität, und qualitativ hochwertige Artikel beinhalten im Allgemeinen mehr Kommunikation und Interaktion zwischen den Mitwirkenden, schlussfolgern sie.

Es gibt natürlich einige Einschränkungen. Eine gängige Art der Bearbeitung, bekannt als Zurücksetzen, ändert einen Artikel in seine vorherige Version, wodurch eine Bearbeitung vollständig entfernt wird. Dies wird häufig verwendet, um Vandalismus zu beseitigen. Derzeit haben wir keine Sonderbehandlung für rückgängig gemachte Bearbeitungen, die keine neuen Inhalte auf einer Seite hinzufügen, geben Qin und Cunningham zu. Es gibt also in Zukunft viel zu tun.

Warum können wir nicht zum Mond zurückkehren?

Der neue Ansatz könnte jedoch ein nützliches Werkzeug im Arsenal eines Wikipedia-Redakteurs sein. Qin und Cunningham schlagen vor, dass es helfen könnte, neue Artikel von relativ guter Qualität zu identifizieren und auch bestehende Artikel zu identifizieren, die von besonders geringer Qualität sind und daher weitere Aufmerksamkeit erfordern.

Angesichts des gut dokumentierten Rückgangs der freiwilligen Mitarbeiter von Wikipedia sind automatisierte Redaktionstools eindeutig von Wert, um die Arbeitsbelastung der verbleibenden Mitarbeiter zu reduzieren. Eine umfassendere Frage ist, wie gut diese Tools werden können und wie sie bei solchen Crowdsourcing-Projekten eingesetzt werden sollten.

Ref: arxiv.org/abs/1206.2517 : Bewertung der Qualität von Wikipedia-Seiten mithilfe von Edit Longevity und Contributor Centrality

verbergen

Tatsächliche Technologien

Kategorie

Unkategorisiert

Technologie

Biotechnologie

Technologierichtlinie

Klimawandel

Mensch Und Technik

Silicon Valley

Computer

Mit News Magazine

Künstliche Intelligenz

Platz

Intelligente Städte

Blockchain

Reportage

Alumni-Profil

Alumni-Verbindung

Mit News Feature

1865

Meine Sicht

77 Mass Avenue

Treffen Sie Den Autor

Profile In Großzügigkeit

Auf Dem Campus Gesehen

Lerne Den Autor Kennen

Alumni-Briefe

Nicht Kategorisiert

77 Massenallee

Rechnen

Tech-Richtlinie

Lernen Sie Den Autor Kennen

Nachrichten

Wahl 2020

Mit Index

Unter Der Kuppel

Feuerwehrschlauch

Unendliche Geschichten

Pandemie-Technologieprojekt

Vom Präsidenten

Titelstory

Fotogallerie

Empfohlen