Neue Einblicke in die Entstehung von Wikipedia-Artikeln

Wenn sich Internetnutzer heute über ein Unternehmen, einen Politiker oder ein anderes Thema informieren wollen, ist Wikipedia häufig ihre erste Anlaufstelle. Wie ein Thema auf Wikipedia dargestellt wird, kann heute beträchtlich zur öffentlichen Meinungsbildung beitragen und so etwa über den Erfolg und Misserfolg von Produkten bestimmen.

Wie aber kommt ein Wikipedia-Artikel zustande? Grundsätzlich kann jeder Nutzer einen Eintrag verfassen oder bearbeiten. In der Praxis werden die meisten Änderungen aber von regelmäßigen Autoren durchgeführt, die sich Wikipedianer nennen. Diese bearbeiten nicht nur den Artikel selbst, sondern tauschen sich auch auf Diskussionsseiten aus. Dort wird beispielsweise diskutiert, ob ein Artikel enzyklopädischen Ansprüchen an einen neutralen Standpunkt genügt – oder ob sie überschwängliches Lob und subjektive Kritik enthalten.

Daher ist es für Unternehmen, Politiker und andere Personen und Institutionen des öffentlichen Lebens ebenso wie für Forscher von großer Bedeutung, zu verstehen, wie ein Artikel zustande kommt. Welche Nutzer nehmen Einfluss auf den Inhalt eines Artikels? Bislang waren diese Diskussionsseiten äußerst schwierig zu analysieren. Wer sie verstehen wollte, musste händisch mehrere Archivseiten mit Hunderten von Beiträgen durchforsten (hier ein Beipiel). Zudem werden die Beiträge dort in einem unstrukturierten Code abgespeichert – sogenanntem Wikitext. Anders als z. B. bei Twitter und Facebook liegen die Daten nicht in einem strukturierten Format vor, sodass automatisierte Sentiment- und Netzwerkanalysen nicht ohne weiteres möglich sind.

Entstehungsnetzwerk aus Wikipedia extrahieren

Dies ändert sich mit GraWiTaS, einer Softwareentwicklung aus dem Graduiertenkolleg Nutzerzentrierte Soziale Medien an der Universität Duisburg-Essen. In einem Artikel, den der Informatiker Benjamin Cabrera im April auf einer Tagung in Valencia vorgestellt hat, wird die Funktionsweise beschrieben: Aus unstrukturierten Archivseiten extrahiert das Programm ein Netzwerk, das man in gängige Netzwerkanalysetools wie Gephi einlesen kann.



In der obigen Abbildung sieht man ein solches Netzwerk (JavaScript muss aktiviert sein). Es wurde aus der Diskussionsseite zum Unternehmen Apple in der englischsprachigen Wikipedia generiert. Die grünen Kreise – auch Knoten genannt – stehen für die Nutzerinnen und Nutzer. Zwischen zwei Knoten ist dann eine Kante, d.h. Linie, eingezeichnet, wenn einer der beiden auf den Diskussionsbeitrag des anderen geantwortet hat. Die Knoten sind umso größer, je häufiger auf ihre Beiträge geantwortet wurde, und umso dunkler, je häufiger sie selbst auf Beiträge anderer geantwortet haben.

Die Grafik ist interaktiv. Sie können heranzoomen, um sich die Netzwerkstrukturen näher anzusehen, die Grafik verschieben, und den Zeiger über die Knoten bewegen, um sich deren Namen anzeigen zu lassen. Deutlich zu sehen: Wenige Personen dominieren die Diskussion. Nicht nur, dass sie viele Beiträge posten; auch wird auf ihre Beiträge häufig geantwortet. Zusammen bilden sie eine Gruppe, die sich in großem Umfang zum Artikel austauscht. Am Rand des Netzwerks sind einzelne Nutzer zu finden, die dagegen kaum im Dialog mit dem Rest der Autoren stehen.

Akteure bei der Erstellung einer Wikipedia-Seite

Dieses Netzwerk kann nun als Grundlage weiterer Analysen dienen: Wer nimmt zentrale Positionen im Netzwerk ein? Warum wird auf die Beiträge bestimmter Personen häufiger geantwortet als auf die Beiträge anderer? Mit den hier gezeigten Methoden können die auf den Seiten dargestellten Institutionen und Personen besser verstehen, wie ihr Wikipedia-Artikel im Lauf der Zeit zustande kommt und wer somit Einfluss auf die öffentliche Meinungsbildung nehmen kann. Gleichzeitig können in der Wissenschaft neue Erkenntnisse zur dieser sich selbst organisierenden Gemeinschaft von Autoren erlangt werden.

Das Programm GraWiTaS werden wir in Kürze der Öffentlichkeit zugänglich machen. Wir werden dann auch diesen Blogbeitrag aktualisieren und einen Link hier einfügen. Dann kann jeder Interessierte die Netzwerke beliebiger Wikipedia-Seiten analysieren.

Björn Ross

Björn Ross

Research Associate bei Universität Duisburg-Essen
Björn ist Doktorand im Graduiertenkolleg User-Centred Social Media an der Universität Duisburg-Essen. Er forscht zu den Themen Social Media Analytics und Information Diffusion. Dafür nutzt er u.a. Netzwerkanalysen und Predictive-Analytics- bzw. Supervised-Learning-Ansätze.
Björn Ross

Letzte Artikel von Björn Ross (Alle anzeigen)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.