data journalism

Analyzing the Research Literature on Data-driven Journalism

Last week, my colleague Robert Gutounig and I attended the Dubrovnik Media Days in Croatia to present a paper on which we have been working on in the past months together with Michael Oppermann: A structured literature review on workflows in data-driven journalism.

Download the Slides (PDF)

(more…)

Julian’s Databyte #3: New Research on Data Journalism. And More.

This is a new issue of Julian’s Databyte, an occasionally published compilation of links, news and reviews from the world of open data, data journalism, internet research and political entertainment.

(more…)

Fellowship am Humboldt Institut für Internet und Gesellschaft in Berlin

[English Version below]

Erfreuliche Nachrichten: Ich gehe für drei Monate im Sommer nach Berlin, um am Alexander von Humboldt Institut für Internet und Gesellschaft (HIIG) zu forschen. In der Zeit werde ich mich insbesondere mit einem Projekt über Arbeitsabläufe im Datenjournalismus beschäftigen. Ich freue mich sehr über die Einladung.

Übrigens suche ich noch ein Zimmer oder eine kleine Wohnung in Berin und vergebe in der Zeit auch mein Zimmer in Wien. Wer mir da weiterhilft bekommt eine original Wiener Sachertorte. Alle Details zur Aktion auf den Seiten, die ich extra dafür eingerichtet habe.
Sacher Torte at Sacher Cafe

[English Version]

Great news: For three months this summer I will be in Berlin to conduct research at the Alexander von Humboldt Institute for Internet and Society (HIIG). I will do a research project that investigates workflows in data journalism. I am really happy about the invitation.

By the way, I am still looking for a room or a small apartment during in Berlin and I will let my room in Vienna during this time. The person who helps me with this gets a delicious Original Sachertorte. Please find all details on the deal on the pages I have created specifally for that purpose.

Netzwerkvisualisierungen bei Onlinemedien [updated]

[Live-Blogging, Disclaimer] Gestern ging im Wiener Hub die vierte Ausgabe von Hacks/Hackers Vienna über die Bühne. Charakteristikum der Veranstaltung ist, dass JournalistInnen (=Hacks) und ProgrammiererInnen (=Hackers) zusammen kommen, um Innovationen im Journalismus zu diskutieren. Ich habe auch vor einiger Zeit dort einmal etwas über Datenjournalismus erzählt.

Die Netzwerke bei derStandard.at

“Es sollte interaktiv, spielerischer und irgendwie ‘2012’ sein”, leitete Florian Gossy ein, um von den Netzwerkvisualisierungen von derStandard.at zu erzählen, die er zusammen mit KollegInnen in den letzten Wochen und Monaten erstellt hatte: InserateGlücksspielTelekom sind die, die bis jetzt existieren. Weitere sind in Planung. Das Feedback der UserInnen und der Leitung von derStandard.at nach der Veröffentlichung war sehr positiv. Die Zugriffe waren höher, ebenso die Verweildauer. Betriebswirtschaflich rechnen tut sich das Projekt allerdings nicht, weil unglaublich viel Arbeit darin steckt. Zu jedem Akteur mussten die Verbindungen händisch definiert werden; es gibt eine Biografie inkl. Events und Verlinkungen zu anderen Artikeln (auch zur Konkurrenz). In Zukunft könnten aus diesen Events auch Timelines exportiert werden. Weil es sich um so sensitive Fälle handelt, wurden die Beschreibungen und Verbindungen jedes Akteurs wird von drei bis vier Personen gecheckt.

Länger haben wir über das Design gesprochen, das noch weiterentwickelt werden soll: Jeder Knoten ist derzeit gleich groß, die Verbindungsdicke und -entfernung kann per Dropdownmenü gesteuert werden. Die Netzwerke sind als Layer angelegt. Später wird man hoffentlich Netzwerke aus verschiedenen Themen übereinander legen können bzw. per Tab durchklicken können. Technisch basieren die Netzwerke auf der Javascript-Library. Bei der Entwicklung arbeiteten derStandard.at mit einer externen Entwicklungsfirma zusammen.

Weitere Politik-Netzwerkvisualisierungen

Im Anschluss an Flos Referat diskutierten wir noch weitere politische Netzwerkgrafiken bei Online-Medien. Unbekannt, da so versteckt, sind die Netzwerke, die Meine Abgeordneten automatisiert für jeden Abgeordneten erstellt. Hier ein Beispiel zu Martin Bartenstein:

Bartenstein-Firmen-Netzwerk

Fin erklärt noch, was er an einem Wochenende im Metalab programmiert hat. Eine (halbfertige) Netzwerkgrafik zu Karl-Heinz Grasser:

KHG-Netzwerk

Als Visualiserung mit wenig Informationsgehalt wird jenes von Le Monde über die MitarbeiterInnen des französischen Präsidenten eingeschätzt. Ein ausklappbares Organigramm würde wohl besser passen:

Hollande-MitarbeiterInnen

Update 12:00 Uhr: Flo Gossy weist auf Twitter noch auf eine weitere Netzwerkvisualisierung von PBS hin, die Video mit interaktiver Netzwerkgrafik kombiniert:


Update Ende

Das Digilab von “Heute”

Den Abschluss von Hacks/Hackers machte Christof Hinterplattner (@quadres), der die Digitalsparte der Gratistageszeitung Heute leitet. Er kündigte an, dass “Heute” gerade dabei ist, ein Labor für digitale Konzepte aufzubauen. Derzeit sind sie gerade auf der Suche nach Personal. Ca. sechs bis zehn Leute sollen im Digilab arbeiten und abseits des Tagesgeschäfts innovative Prototypen und Konzepte entwickeln. Erste Projekte sind noch nicht definiert, es scheint aber, dass es nicht allein um Journalismus gehen soll. Trotzdem klingt es nach einer interessanten Spielwiese.

250.000 EUR Journalismus-Innovations-Wettbewerb & Random Hacks of Kindness

Zu Gast, weil zufällig in Wien, war auch Rina Tsubaki, die in Maastricht für das European Journalism Center das Projekt Emergency Journalism betreut. Das European Journalism Center ist mir bekannt, weil sie das Data Journalism Handbook in Kooperation mit der britischen OKFN so erfolgreich abgewickelt haben. Rina macht uns noch auf zwei Projekte aufmerksam:

  1. Einen gerade laufenden Wettbewerb für Journalismusinnovation, bei dem 250.000 Euro zu gewinnen sind. Dabei handelt es sich um eine finnische Kopie der Knight News Challenge. Jeder kann einreichen. Einzige Voraussetzung ist die Bereitschaft zur Erstumsetzung des Konzepts in Finnland.
  2. Das Projekt Random Hacks of Kindness, bei dem Hacker zu einem Hackathon an einem Wochenende zusammenkommen und humanitäre Organisationen mit Entwicklungen unterstützen. Wieso transferiert man so etwas nicht auch nach Österreich?

Disclaimer: Dieses Post wurde während der Veranstaltung verfasst. Es soll die wichtigsten Punkte zusammenfassen. Obwohl gewissenhaft erstellt, besteht kein Anspruch auf Korrektheit, Vollständigkeit oder wortgetreue Wiedergabe.

Datenjournalismus in Österreich: Der Zug rollt an

Dies ist ein Beitrag zur aktuellen Blogparade von twenty.twenty. Die Veranstaltungsreihe erlebt morgen um 19:00 Uhr im Wiener Hub eine neue Ausgabe zum Thema Geschichten aus dem Datenwald.

Foto: CC State Records NSW

Wie eine Dampflok: Langsam, aber stetig kommt Datenjournalismus in Österreich in Fahrt:

Die Liste ließe sich noch weiter fortführen. Vor einem Jahr gab es kaum eine dieser Entwicklungen hierzulande. Sie wurden ausgelöst durch Projekte, die anderswo – in Redaktionen in Großbritannien, den USA, Frankreich oder Deutschland – passieren. Die Datenjournalismus-Lok fährt dabei im Windschatten der großen Open-Data-Züge: Je mehr Daten aus Regierung und Verwaltung öffentlich werden, desto mehr Recherchematerial haben DatenjournalistInnen. So wie es auch die PSI-Bewegung schon länger als Open Government Data gibt, ist es auch beim Datenjournalismus: Dieser ist keineswegs ein neues Phänomen. Früher hieß es Computer Assisted Reporting. Das Innovative am “neuen” Datenjournalismus (wie wir ihn aktuell insbesondere mit der New York Times und dem Guardian verbinden) ist die Interaktivität.

Damit die Datenjournalismus-Lok in Österreich weiterfahren und beschleunigen kann, müssen Schienen verlegt und Weichen gestellt werden: Natürlich benötigt es mehr, bessere, und sensiblere Daten (jedoch keine personenbezogenen). Wenn die etablierten Medien nicht dem Zug hinterherlaufen wollen, müssen sie in Personal und Technik investieren (auch wenn “das” Datenjournalismus-Geschäftsmodell noch nicht in Sicht ist). Online-Medien brauchen GrafikerInnen, StatistikerInnen und ProgrammiererInnen, die nicht in der IT- oder der Controlling-Abteilung sondern in der Redaktion arbeiten. Der Paradigmenwechsel weg vom Artikeldenken hin zum Prozessjournalismus, der Crowdsourcing und Zusammenarbeit zwischen Medienunternehmen beinhaltet, ist eine weitere zentrale Weichenstellung. Wenn es so weitergeht, bin ich mir sicher, dass ein Unternehmen wie OpenDataCity bald auch in Österreich überleben kann.

Datenjournalismus wird sich in den nächsten Jahren thematisch ausdifferenzieren. Derzeit sind die Teams, die an Datenjournalismus-Projekten arbeiten, Allrounder: Sie bearbeiten Finanzdaten genauso wie Geheimdokumente, Schulstatistiken wie auch Twitter-Konversationen. Das wird sich ändern. So wie jede angehende Journalistin heute Social Media beherrschen muss – egal in welchem Ressort sie arbeitet –, wird sie in wenigen Jahren mit Big Data umgehen müssen. Denn die guten Geschichten im Datenberg kann nur derjenige finden, der nicht nur technisch sondern auch fachlich exzellent ist. Und deshalb braucht es neben der technischen Kompetenz auch die fachliche Ausdifferenzierung: die Datenspezialistin im Wirtschaftsressort oder den Sportstatistiker zum Beispiel. Data Literacy wird keine Schlüsselkompetenz von einzelnen Geeks mehr sein, sie wird zu Basiskompetenz jedes Journalismusanwärters. Die Journalismusausbildung müssen wir dahingehend anpassen.
Hinzu kommt die zunehmende Verfügbarkeit von Open Corporate Data, aber das ist einmal einen gesonderten Blogbeitrag wert.

Welche Zielbahnhöfe die heimischen Datenjournalismus-Loks ansteuern können, das zeigt sich regelmäßig international, etwa bei “The Week in Data” des französischen Portals Owni. Gut, dass hierzulande schon einmal Fahrt aufgenommen wurde.

PS: Der internationale Twitter-Hashtag zu Datenjournalismus, der glücklicherweise noch schön verfolgbar ist, lautet #ddj. Auf dieser Twitter-Liste habe ich einige DatenjournalistInnen gesammelt, die etwas zu sagen haben.

Meilensteine und Charakteristika des Datenjournalismus

Bei der gestrigen Auflage von Collide:Vienna habe ich einen Vortrag zu Meilensteinen und Charakteristika des Datenjournalismus gehalten. Collide ist eine Veranstaltungsreihe in Wien, bei der sich Publizisten und Hacker treffen, um sich über Innovationen im Journalismus auszutauschen. Unter anderem zeige ich, dass Datenjournalismus keineswegs ein neues Phänomen ist. Datenjournalistische Ansätze lassen sich bis zum Beginn des 19. Jahrhunderts zurückverfolgen. Auch als Journalisten bereits Computern verwendeten, aber weder das Internet noch Onlinepublikationen existierten, gab es Datenjournalismus etwa bei Zeitungen.

Hier sind meine Slides, die auch ein Modell über die aktuellen Rahmenbedingungen und den Workflow datenjournalistischer Arbeit.

Neben mir hat auch Robert Harm einen Vortrag zu Werkzeugen im Datenjournalismus gehalten. Dabei ging er insbesondere auf Maps Marker ein, ein unlängst von ihm entwickeltes äußerst mächtiges WordPress-Plugin.

Collide ist inspiriert von der Hacks/Hackers-Bewegung in den USA, die sich nichts Geringeres als einen Reboot des Journalismus zum Ziel gesetzt hat. In Wien soll die Reihe in Zukunft communitygetrieben funktionieren, ähnlich wie die Webmontage. Wer auf dem Laufenden bleiben will und gerne über Innovationen im Journalismus hört und diskutiert, dem sei auch die Collide-Facebook-Gruppe ans Herz gelegt. Derzeit stehen Christopher Clay aka @c3o und insbesondere Markus Hametner aka @fin hinter dem Projekt. Letzterer programmiert auch luminous flux, von dem wir in Zukunft hoffentlich noch einiges hören werden.

Frisch vermählt: Regierungsdaten und Onlinejournalismus

Ein Artikel für dritte Ausgabe des Open Government Digest. Die lektorierte und etwas gekürzte Version lässt sich im PDF des Magazins nachlesen. Die Verlinkungen und Quellenangaben folgen in den nächsten Tagen.

“Ab jetzt wird zurückgerechnet”, sagt die deutsche Wissenschaftlerin und Journalistin Mercedes Bunz und sieht eine neue Möglichkeit heraufdämmern, die Mächtigen zu kontrollieren. “Datenjournalismus” heißt das Wort der Stunde. Vorbei die Zeit als Medien und Zivilgesellschaft der vermeintlichen politischen Unausweichlichkeit wenig entgegenzusetzen hatten. Möglich machen es offene Regierungs- und Verwaltungsdaten und engagierte Onlinepublizisten. Dabei verändern sich auch die Spielregeln für Journalisten.

Ein deutscher Grünpolitiker klagt seine Vorratsdaten (also keine offenen Regierungsdaten, sondern seine eigenen personenbezogene Daten) von der Telekom ein und lässt diese von Zeit Online visualisieren und publizieren: Über ein halbes Jahr hinweg kann das Leben des Politikers in jeder Minute per interaktiver Karte nachvollzogen werden. Die nüchterne Darstellung verbildlicht die Gefahren der Vorratsdatenspeicherung wie kaum eine andere Form des Informationsdesigns.
Die New York Times kombiniert die Arbeitslosenstatistik mit demographischen Daten, und es entstehen bisher ungesehene Graphen, die soziale Ungleichheiten in den USA aufzeigen. Ein schwarzer Jugendlicher ohne Schulabschluss ist durchschnittlich fast doppelt so häufig arbeitslos wie ein weißer.
Die genannten sind nur zwei von einer mittlerweile unüberblickbaren Zahl an Datenjournalismusprojekten, die die Redaktionen der MSNBC, der Los Angeles Times, des Guardian, der BBC und einiger anderer Medien durchführen. Viele der Medien haben eigene Ressorts gegründet, die sich allein der Anatomie und (interaktiven) Verbreitung von Daten widmen.

Was ist neu am Datenjournalismus?

Die Bezeichnung “Datenjournalismus” ist schwammig, meint sie doch, wie Lorenz Matzat feststellt, einerseits eine Recherchemethode von Onlinejournalisten, andererseits eine spezifische mediale Veröffentlichungsform, ein eigenes Genre. Datenjournalismus ist darüber hinaus zugleich ein Mindset: Die wenigsten Datenjournalisten sehen sich als traditionelle Journalisten, sondern bezeichnen sich lieber als Hacker oder Informationsarchitekten.
Bei aller Unbestimmtheit gibt es dennoch einen Definitionsansatz. Der Brite Paul Bradshaw hat ihn herausgearbeitet: Die Daten, auf denen Datenjournalismus fußt, müssen strukturiert sein und von Computern verarbeitet werden können. Die Tabelle ist der Ausgangspunkt der (computerbasierten) Recherche und die Basis für die jegliche weitere Darstellungsform – ob interaktive Visualisierung oder Mutlimedia-Reportage.
Klar ist, dass sich daraus Konsequenzen für die journalistische Praxis ergeben: Der Umgang mit diesem neuen Typ von Quelle muss von so gut wie allen aktiven Journalisten erst erlernt werden – data literacy wird in Zukunft zur Schlüsselqualifikation in Redaktionen avancieren. Darüber hinaus ändert sich das Erzählen: Die stringente Geschichte mit menschlichen Protagonisten sowie Anfang und Ende tritt in den Hintergrund, die Berichterstattung dreht sich um Fakten und Akten.

Prozessjournalismus und Crowdsourcing

Immer öfter kommt es zu Mischformen zwischen Datenjournalismus und diversen anderen neuen Formen des Onlinejournalismus, etwa dem Prozessjournalismus: Bei diesem gipfelt die Berichterstattung nicht in einem fertigen Artikel, vielmehr wird ein Beitrag schnell online gestellt und anschließend erweitert und verbessert. In der Kombination mit Datenjournalismus wird für die Berichterstattung nicht mehr auf statisches Material zurückgegriffen, der Redakteur zieht permanent Daten aus aktualisierten Streams heran.
Oder Datenjournalismus verknüpft mit Crowdsourcing: Sind die Datenmengen für eine Redaktion allein nicht bewältigbar, dann lagert sie diese Aufgabe aus: Die Dateien werden online gestellt, interessierte Internetuser kümmern sich um die Exploration der Datenberge. So geschehen ist dies etwa bei einer der ersten Sternstunden des modernen Datenjournalismus, im Sommer 2009: Damals stellte der britische Zeitung Guardian 170.000 Spesenbelege britischer Abgeordneter online. 20.000 Leute durchforsteten die Belege auf verdächtige Inhalte, innerhalb kürzester Zeit war ein systematischer Missbrauch von Steuergeldern aufgedeckt, der zu Rücktritten und politischen Reformen führte.

Was Datenjournalismus sicher nicht löst, ist das Finanzierungsproblem für unabhängige professionelle Berichterstattung abseits der Nische. Für die penible Kontrolle der Politik, diese in einer Demokratie so lebensnotwendige Aufgabe, liefert auch Datenjournalismus kein Geschäftsmodell. Im Gegenteil: Datenjournalismus ist kostspieliger als viele andere Formen der Berichterstattung. Die Journalisten arbeiten meist in Teams gemeinsam mit Programmierern, Statistikern oder Grafikdesignern. Und derartige Stellen sind teurer als die in Onlineredaktionen so gern beschäftigten “Contentmanager”, die ohne Journalisten-Kollektivvertrag in fordistischer Manier Meldungen vom Agenturfließband ins CMS klopfen.

Auf dem weg zur europäischen Agenda

Das Geld bleibt also weiterhin knapp, ein anderes Hoffnungsfenster tut sich aber durch Datenjournalismus auf: Der Strukturwandel hin zu einer europäischen Öffentlichkeit. Diese scheiterte bislang unter anderem, weil eine gemeinsame Sprache fehlte – auch Englisch funktioniert nur in bestimmten Bildungsschichten flächendeckend. Die Sprache öffentlicher Daten hingegen ist für viele Bereiche universell und wirkt damit einigend. Visualisierungen auf Grundlage von Daten, die von kontinental bis hyperlokal skaliert werden können, bringen Themen in ihren Details und ihrer ganzen Tragweite aufs Tapet. Die Aufgabe des Datenjournalisten dabei: Er analysiert, ordnet ein und stellt einen Bezug für seine Leser her. Wie so etwas abläuft, hat sich zum Beispiel bei der Aufarbeitung der Wikileaks-Depeschen gezeigt: Riesige Datenmengen wurden auf lokale Vorfälle heruntergebrochen, die immense Dimension der Geschichte blieb trotzdem erhalten. Ähnliche Prozesse werden wir in Zukunft öfters erleben, wenn etwa mithilfe von Finanz- oder Umweltdaten über Skandale berichtet wird. Trotz lokalem Fokus behauptet sich das Gesamtbild. Der Weg zur vereinten europäischen Agenda ist dann noch immer weit, der Datenjournalismus jedoch trägt seinen Teil zur Abkürzung bei.