Mobile Ansicht
Wechseln Sie für eine bessere
Darstellung auf die mobile Ansicht
Weiterlesen Mobile Ansicht
HOME

#Instarama

Regenbögen sind flüchtig. Niemand weiß, wo es wie viele gibt. Meteorologen können sie nicht erfassen. 300 Millionen Instagram-Nutzer hingegen schon: Sie sehen einen Regenbogen, fotografieren ihn und teilen ihn mit Hashtag #regenbogen.

Text & Konzept: Tin Fischer | Code: David Goldwich

Will man wissen, wo es die meisten Regenbögen gibt, muss man Instagram anzapfen. Das war unser Gedanke. Damit fing alles an. Wir, das sind David und ich. Er Programmierer, ich Journalist.

Wir saßen also letzten Sommer am Küchentisch von Davids WG in Friedrichshain. Draußen war alles andere als Regenbogenwetter. Drinnen schrieb David an der Software, mit der wir hofften, mehr über Regenbögen zu erfahren.

Es funktioniert so: Über die API von Instagram, eine Art Lieferanteneingang eines Sozialen Netzwerks, lädt es Daten öffentlich zugänglicher Fotos mit einem bestimmten Hashtag herunter (später haben wir es dann noch auf geografische Punkte und User erweitert).

Die Bilder selber interessierten uns in der Regel nicht. Wir schauten nur auf Benutzername, Aufnahmezeitpunkt, Geodaten (falls aktiviert), Bildunterschrift, wer es wie kommentiert hat und so weiter. So sah das aus, als wir #regenbogen runterluden:

Datenanalyse ist jedes Mal eine Reise ins Unbekannte. Man hat vielleicht eine vage Idee, wo man Interessantes finden könnte. Aber dann muss man einfach ausprobieren. Gibt es vielleicht in den Alpen, wo das Wetter schnell umschlägt, mehr Regenbögen als im flachen Norden?

Unsere Software machte nur den Download. Für die Analyse nutzten wir eine Reihe von weiteren Programmen, manche kennt jeder (Excel, Google Tables), andere sind wohl eher Informatikern (SQLite-Browser), Geografen (QGIS) oder Linguisten (AntConc) ein Begriff.

Mit der Geografie-Software QGIS übertrugen wir als erstes jene #regenbogen-Fotos mit Geodaten auf eine Karte. Damit nicht einfach dort, wo viele Menschen leben, auch die meisten Fotos sind, dividierten wir die Anzahl durch der Bevölkerung im Landkreis:

Tja. Falsche Fährte. Das Resultat war zwar schön bunt, aber eine Sackgasse. Kein Nord-Süd-Gefälle, keine Tendenz zu den Alpen oder zu Gewässern.

Nächster Versuch. Wir warfen einen Blick in die Bildunterschriften. Die häufigsten Emojis darin sind nicht sonderlich überraschend. Mit dem Linguistik-Programm AntConc erstellten wir noch eine Rangliste der häufigsten Wörter. Leider auch nichts überraschendes: regenbogen, rainbow, regen, sonne, love, rain, bunt, sky etc. Und auch die häufigsten aufeinander folgenden Wörter, die so genannten N-grams, sind nicht weiter spannend: »over the rainbow«, »Am Ende des Regenbogens…«, »Wer den Regenbogen will, muss den Regen in Kauf nehmen«, »Wo ist der Goldschatz / Topf mit Gold?« – Letzteres hätten wir auch gerne gewusst.

Weiterer Versuch. Vielleicht gibt es im Herbst mehr Regenbögen als im Sommer? Das geht mit einer einfachen Datenbankabfrage. Und oha, siehe da:

Wir hatten eine Spur. Mai und August sind womöglich Regenbogenhochsaison.

Aber sind sie das wirklich? Das gefährlichste bei Datenanalyse sind Artefakte: Muster in den Daten, die man für relevant hält, aber zufällig entstanden und damit bedeutungslos sind. Selbst Profis führen diese Fata Morganen immer wieder in die Irre. Geschweige denn uns.

Artefakte entstehen beispielsweise durch Raschen in den Daten, also Material, das man eigentlich nicht im Datensatz haben möchte. Spam zum Beispiel. Oder Hashtags haben unterschiedliche Bedeutungen. Oder kommen (wenn englischsprachig) aus sehr unterschiedlichen Ländern.

Im Falle von #regenbogen haben wir noch ein paar Regenbogen-Kuchen im Datenset. Sie sind aber nicht weiter tragisch, denn sie haben keine saisonalen Ausschläge. Die Kurve hat durch sie einfach ein bisschen Kuchenbodensatz. Ein wenig drückt der Christopher Street Day im Juli die #regenbogen-Zahl noch nach oben. Allerdings mit nur sehr wenigen Daten.

Sicherheitshalber hatte David aber noch ein Programm gebaut, mit dem wir durch tausende Bilder scrollen und jedes anklicken können, das nicht in die Datenbank gehört. So saß er abends auf dem Balkon und beurteilte tausende #regenbogen-Bilder nach ihrem Inhalt. Die Kurve blieb stabil.

So also entstand entstand unsere erste Grafik:

Wir fanden sie lustig. Und dann dachten wir, dass man mit der Methode eigentlich noch mehr untersuchen könnte, als nur Regenbögen. Und so passierte ungefähr das mit uns:

Wir begannen einen Hashtag nach dem anderen runterzuladen und stürzten in die wundersame Welt von Instagram: #sonnenuntergang, #betrunken, #glücklich, #swag, #backpacker, #babybauch, #depression, #foodporn – unzählige sollten es über Monate werden, die wir nachts in unseren Küchen mit unseren MacBooks runterluden und an den Wochenenden analysierten.

Ein erstes Resultat findet ihr in der aktuellen NEON-Ausgabe.


Den kompletten Text »Instagram-Leaks« lest ihr in derAusgabe 06/15 von NEON und auch digital für das Tablet auf iOS und Android. Hier können Einzelhefte des Magazins nachbestellt werden.

Neon-Logo Das könnte Sie auch interessieren

Partner-Tools