Veröffentlicht am 15-05-2019

Die Kraft der Visualisierung

Ein Bild sagt wirklich tausend Worte.

"Bei der Visualisierung geht es wirklich um externe Erkenntnis, dh darum, wie Ressourcen außerhalb des Geistes verwendet werden können, um die kognitiven Fähigkeiten des Geistes zu steigern." - Stuart Card

Dieser Artikel befasst sich mit der Bedeutung der Visualisierung mit Daten. Die Menge und Komplexität von Informationen, die in der Wissenschaft, im Ingenieurwesen, in der Wirtschaft und im menschlichen Alltag produziert werden, nimmt rasant zu. Gute Visualisierungen stellen nicht nur eine visuelle Interpretation von Daten dar, sondern verbessern auch das Verständnis, die Kommunikation und die Entscheidungsfindung.

Die Bedeutung der Visualisierung ist ein Thema, das fast jedem Datenwissenschaftler in einem Einstiegskurs an der Universität beigebracht wird, das jedoch nur von sehr wenigen Personen beherrscht wird. Es wird oft als offensichtlich oder unwichtig angesehen, da es von Natur aus subjektiv ist. In diesem Artikel möchte ich einige dieser Gedanken zerstreuen und Ihnen zeigen, dass Visualisierung unglaublich wichtig ist, nicht nur im Bereich der Datenwissenschaft, sondern für die Vermittlung jeglicher Form von Informationen.

Ich möchte dem Leser anhand mehrerer Beispiele zeigen, welchen Einfluss eine gut gestaltete Visualisierung auf die Vermittlung einer Idee oder Information haben kann. Darüber hinaus werde ich die Best Practices für die Erstellung effektiver Visualisierungen erläutern und erläutern, wie eigene Visualisierungen entwickelt werden können und welche Ressourcen hierfür zur Verfügung stehen.

Ich hoffe, Sie genießen diese visuelle Reise und lernen dabei etwas.

Was ist Visualisierung?

Das American Heritage Dictionary definiert Visualisierung als:

(1) Die Bildung von geistigen Bildern.

Im Zusammenhang mit der Visualisierung mit Daten muss dieser Definition etwas hinzugefügt werden, damit Folgendes erreicht wird:

Die Bildung mentaler visueller Bilder, um Informationen durch grafische Darstellungen von Daten zu vermitteln.

Wenn Sie eine Karriere in der Datenwissenschaft anstreben, ist dies eine der wichtigsten Fähigkeiten, die Sie beherrschen können, und sie kann auf praktisch jede Disziplin übertragen werden. Stellen wir uns vor, Sie versuchen, Ihren Manager von einer Investition in ein Unternehmen zu überzeugen, und Sie präsentieren ihm eine Tabelle mit Zahlen, um ihm zu erklären, warum dies eine so gute Investitionsmöglichkeit ist. Wie würden Sie reagieren, wenn Sie der Manager wären?

In visueller Form sind Informationen oft viel leichter zu verdauen, insbesondere wenn sie Muster und Strukturen verwenden, die der Mensch intuitiv interpretieren kann. Wenn Sie eine schnelle und einfache Visualisierung wünschen, die nur wenig oder gar keinen Aufwand erfordert, können Sie sich für ein Tortendiagramm oder ein Balkendiagramm entscheiden. In Bezug auf die Entwicklung von Visualisierungen ist dies oft so weit, wie es die meisten Menschen tun, und oft ist es so weit, wie sie es für ihr Fachgebiet nötig haben.

Ein weiterer Faktor, der die Verwendung von Visualisierungen verhindert, ist die Menge der verfügbaren Daten. Woher weiß ich, ob Visualisierung eine geeignete Methode ist, um eine Nachricht zu kommunizieren?

Diese Frage ist schwer zu beantworten. In einer Designstudie wird empfohlen, die Verwendbarkeit von Visualisierungen anhand der Klarheit unserer Aufgabe und der Position der Informationen zu bewerten.

Design Study Methodology: Reflexionen aus den Gräben und Stapeln, Michael Sedlmair, Miriah Meyer und Tamara Munzner. IEEE Trans. Visualisierung und Computergrafik, 2012.

Wenn wir uns in der rechten oberen Ecke dieses Diagramms befinden, wird es möglich, interaktive Visualisierungen zu entwickeln und zu programmieren. Dies ist der Bereich, in den sich Datenwissenschaftler aufgrund des ständig wachsenden Datenumfangs aufgrund der Informationsexplosion begeben.

Informationsexplosion.

Wir leben jetzt in einer datengetriebenen Welt, und es ist wahrscheinlich, dass sie datengetriebener wird. Dies geht aus mehreren Bereichen hervor, z. B. aus wichtigen Fortschritten bei der Entwicklung großer Sensornetzwerke sowie aus Agenten der künstlichen Intelligenz, die mit der Welt interagieren (z. B. selbstfahrende Autos).

In einer Welt, in der Daten überlegen sind, wird die Fähigkeit, klare und aussagekräftige Visualisierungen zu entwickeln, immer notwendiger.

Gute und schlechte Visualisierungen

Menschen haben seit Tausenden von Jahren Visualisierungen erstellt, und obwohl die Zeichnungen von Höhlenmenschen etwas weniger spektakulär sind als die heutigen, ist es dennoch gut zu erkennen, wie mächtig einige der frühen Visualisierungen waren und wie wirkungsvoll sie waren auf der modernen Welt.

Nehmen wir zum Beispiel Leonardo da Vinci, einen italienischen Polymath, der nicht nur als erster unglaubliche Erfindungen wie das Flugzeug, den Hubschrauber und den Panzer erfand, sondern auch unglaublich gut zeichnen konnte. Seine technischen und anatomischen Zeichnungen, wie die folgenden, sind unglaublich realistisch und dennoch einfach zu verstehen.

Das Zeichnen war für Visualisierungen vor Hunderten von Jahren sehr wichtig, als wir noch keinen Computer hatten, der die Dinge für uns zeichnen konnte. Nehmen Sie sich einen Moment Zeit, um Galileos Mondskizzen in verschiedenen Phasen des Mondkalenders zu bewundern.

Es kommt nicht oft vor, dass wir wirklich auf alte Zeichnungen des Mondes starren. Gibt es in der modernen Welt wirklich noch einen Bedarf für diese Art von Visualisierungen? Und wenn ja, können wir es nicht einfach Künstlern, Grafikdesignern und dergleichen überlassen?

Die Antwort lautet natürlich ja. Selbst vor zehn oder fünfzehn Jahren war es unglaublich schwierig, so etwas wie Chemie zu lernen, obwohl es möglich ist, Moleküle in Ihrem Kopf abzubilden, ist es immer noch schwierig, zwischen komplexen wissenschaftlichen Wörtern und Ihrem mentalen Bild dessen, was geschieht, zu übersetzen. Heutzutage kann man auf Youtube ein paar Worte eintippen und sich eine Visualisierung oder einen visuellen Durchgang von praktisch jedem Aspekt der Chemie ansehen. Dieselbe Idee gilt im Wesentlichen für jede abstrakte Idee in der Wissenschaft.

Wir haben uns nun davon überzeugt, dass Visualisierungen für die Vermittlung von Informationen sehr nützlich sind und auch dazu verwendet werden können, komplexe Ideen deutlicher zu erklären.

Was sind einige Beispiele für gute Visualisierungen?

Ich lebe zurzeit in Boston, daher beziehen sich einige der folgenden Visualisierungen auf die Stadt Boston. Dies sind nur einige Visualisierungen, die ich für gut halte, und aufgrund ihrer subjektiven Natur können Sie mir nicht zustimmen.

In Boston haben wir ein unterirdisches U-Bahn-System namens T. Wie bei jedem städtischen U-Bahn-System gibt es eine Reihe verschiedener Linien, die in verschiedene Richtungen verkehren. Einige der Linien dauern aufgrund größerer Entfernungen länger als andere.

Die folgende Visualisierung erfasst nicht nur die Zeit, die bis zu jedem Stopp vom Stadtzentrum in Form konzentrischer Kugeln vergangen ist, sondern folgt auch der korrekten Richtung für jede Linie. Anhand dieses Diagramms lässt sich schnell herausfinden, welche Linie zu nehmen ist, in welche Richtung sie führt und wie lange es dauern wird, bis sie dort ankommt.

Diese zweite Visualisierung zeigt die Bewegung von Individuen, die im letzten Jahrhundert in Massachusetts geboren wurden. Wir sehen, dass 1940 erwartet wurde, dass 82% der in Massachusetts geborenen Menschen in Massachusetts leben. Jetzt sehen wir, dass diese Zahl auf 64% zurückgegangen ist und wir eine vernünftige Vorstellung davon haben, wohin diese Personen migriert sind.

Eine der berühmtesten Visualisierungen, die jemals gemacht wurden, war Joseph Minard, und sie zeigt die Reise Napoleons, als er für seinen russischen Feldzug von 1812 nach Russland marschierte.

Die Abbildung zeigt Napoleons Armee, die die polnisch-russische Grenze verlässt. Ein dickes Band zeigt die Größe seiner Armee an bestimmten geografischen Punkten während ihres Vor- und Rückzugs. Es zeigt sechs Arten von Daten in zwei Dimensionen an: die Anzahl der Napoleon-Truppen; die zurückgelegte Strecke; Temperatur; Breiten-und Längengrad; die Fahrtrichtung; und Lage relativ zu bestimmten Daten, ohne Napoleon zu erwähnen. Minards Interesse lag bei den Mühen und Opfern der Soldaten. Diese Art von Bandgraphen zur Darstellung von Strömungen wurde später als Sankey-Diagramm bezeichnet.

Ein Trend, den Sie vielleicht bei allen obigen Visualisierungen bemerkt haben, ist, dass sie auf relativ einfache Weise mehrere Arten von Daten übermitteln. Dies auf verständliche Weise zu tun, ist keine leichte Aufgabe.

Betrachten wir nun die Umwandlung einer schlechten Visualisierung in eine Visualisierung, die für ihren Zweck besser geeignet ist. Dies ist am einfachsten mit U-Bahn-Karten zu tun, daher werde ich die U-Bahn-Karte von London betrachten und sehen, warum sie geändert wurde und wie sich ihr neues Design gegenüber dem ursprünglichen Design verbessert hat.

Dies war die ursprüngliche Karte der Londoner U-Bahn aus dem Jahr 1927. Wie Sie vielleicht bereits bemerkt haben, besteht das Hauptproblem bei diesem Diagramm darin, dass es aufgrund ihrer unmittelbaren Nähe eine große Gruppe eng beieinander liegender U-Bahn-Stationen gibt. Dies ist darauf zurückzuführen, dass die Karte auf der Grundlage der geografischen Standorte der Stationen gezeichnet wird. Wenn Sie sich jedoch weit außerhalb der Stadt aufhalten, bleibt auf der Karte viel Platz ungenutzt.

1933 entwickelte Harry Beck ein neues Design für die Karte der Londoner U-Bahn. Beck entschied, dass die Fahrgäste in der U-Bahn nicht auf geografische Genauigkeit bedacht waren und am meisten daran interessiert waren, wie sie von einem Bahnhof zum anderen gelangen und wo sie umsteigen sollten. Er ließ sich von Elektroschaltplänen inspirieren und beschloss, jede der Leitungen in einer individuellen Farbe darzustellen und ihre Verbindungen zu anderen Leitungen wie in einem Elektroschaltplan darzustellen. Das Diagramm behält die Richtungsinformationen für die einzelnen Linien bei, die Entfernungsinformationen gehen jedoch verloren, da Beck sie für unnötig hielt.

Als jemand, der früher in London lebte und eine moderne Version dieser Karte benutzte, um sich relativ leicht fortzubewegen, kann ich für ihre Brillanz bürgen.

Wir können eine sehr ähnliche Debatte mit der New Yorker U-Bahn-Karte beobachten. Welche davon findest du besser?

Trotz der Tatsache, dass wir uns mehrere U-Bahn-Karten angesehen haben, gibt es offensichtlich keine eindeutige Lösung, die auf alle Situationen angewendet werden kann. Schließlich kommt es darauf an, welche Daten für das Publikum am relevantesten sind. Harry Beck entschied, dass die Passagiere sich nicht für Entfernungen oder geografische Informationen interessierten, sondern nur wussten, wie sie von Station A zu Station B gelangen und welche Verbindungen sie herstellen mussten. Vielleicht würde diese Idee für New Yorker nicht funktionieren, weil sie mehr Wert auf die Entfernung und den geografischen Standort legen als für Londoner.

Anscombes Quartett

Zahlen können unglaublich irreführend sein, wie Gertrude Anscombe mit dem heute bekannten Anscombe-Quartett gezeigt hat. Das Quartett besteht aus vier Datenmustern mit genau demselben Mittelwert, derselben Varianz, Korrelation und derselben linearen Regressionslinie.

Anscombes Quartett in Tabellenform (Anscombe, 1973).

Aus einer visuellen Darstellung der Ergebnisse geht jedoch klar hervor, dass die Verteilungen der vier Datensätze völlig unterschiedlich sind.

Anscombes Quartett in visueller Form (Anscombe, 1973).

Um diesen Punkt zu verdeutlichen, habe ich sechs eigene Datenplots entwickelt, die alle den gleichen Mittelwert, die gleiche Varianz, die gleiche Korrelation und die gleiche lineare Regressionslinie aufweisen. Wie Sie unten sehen können, sind diese wiederum völlig anders.

Diese Idee, dass Visualisierungen anstelle von quantitativen Metriken verwendet werden können, um die Struktur der Daten klarer und aussagekräftiger zu machen, führt uns auf natürliche Weise in den Bereich irreführender Visualisierungen. So wie Zahlen verwendet werden können, um uns über die Struktur unserer Daten in die Irre zu führen, wie wir es aus Anscombes Quartett gesehen haben, funktioniert es auch umgekehrt. Visualisierungen können geschickt durchgeführt werden, um die zugrunde liegende Struktur in den Daten zu verzerren. Wie wir sehen werden, ist dies ein sehr häufiges Ereignis, insbesondere in diskursträchtigen Bereichen wie Politik und wissenschaftlichen Debatten.

Irreführende Visualisierungen

Es gibt zahlreiche Beispiele für Personen, die Statistiken verwenden, um Personen in die Irre zu führen. In der Tat ist dies eine äußerst verbreitete Taktik in der Politik. Möglicherweise war eines der bekanntesten Beispiele dafür die von Präsident George Bush vorgeschlagene Steuersenkung, bei der eine Erhöhung um 5% vorgenommen wurde, um durch Verzerrung der Achse eines Balkendiagramms eine größere Wirkung zu erzielen.

(Links) Die Visualisierung, die den Zuschauern angezeigt wird, und (rechts) eine weniger täuschende Visualisierung.

Diese täuschende Taktik beinhaltet oft eine Verzerrung der Messachsen, wie im obigen Beispiel. Hier ist ein weiteres Beispiel für Achsenverzerrungen im Zusammenhang mit dem Verlust von Arbeitsplätzen (ironischerweise auch im Zusammenhang mit der US-Politik).

In Wirklichkeit sollte die Handlung so aussehen.

Eine andere Art, wie Menschen durch die Verwendung von Visualisierungen getäuscht werden, ist das Weglassen von Daten.

Ich selbst bin Umweltwissenschaftler, daher bin ich mir nur zu bewusst, für welche Täuschung die Menschen mit sorgfältig ausgearbeiteten Visualisierungen eintreten können. Hier ist ein Paradebeispiel dafür, dass die globale Erwärmung ein Mythos ist (was, um es klarzustellen, nicht der Fall ist und von Umweltwissenschaftlern seit den 1990er Jahren nicht bestritten wurde).

Ein weniger täuschendes Diagramm ist unten gezeigt.

Bisher haben wir nur Visualisierungen besprochen, die aktiv dazu dienen, uns zu täuschen. Wie wäre es, wenn es versehentlich gemacht wird?

Vorsicht vor Regenbogen

Regenbogenfarbkarten sind wahrscheinlich die nervigste Visualisierung, die mir täglich begegnet. Als Umweltwissenschaftler sehe ich das so ziemlich überall. Diese sind nicht nur schlecht zu verwenden, da farbenblinde Menschen (wie ich) Probleme haben können, viele der Farben zu unterscheiden, sondern das Zuweisen einer Farbe zu einem quantitativen Wert ist unsinnig.

Die Regenbogen-Farbkarte ist wahrnehmungsmäßig nicht linear. Wer hat entschieden, dass Blau einen quantitativ niedrigeren Wert darstellt als Gelb oder Rot? Wann und wie plötzlich treten die Übergänge auf?

Regenbogenfarbkarten.

Der beste Weg, dies in Angriff zu nehmen, besteht darin, sich an nur zwei Farben zu halten und eine lineare Farbänderung zur Darstellung quantitativer Werte zu verwenden. In diesem Sinne kann der Plot gefärbt sein, aber die quantitative Natur des Plots wird durch die Helligkeit der Farbe beschrieben, wobei dunklere Bereiche typischerweise höhere Werte anzeigen. Diese Idee ist unten dargestellt.

Dies macht sie im Wesentlichen zu einer Hitzekurve oder einer Choroplethenkarte wie der folgenden.

Rauchige Berge

Ein schönes Beispiel dafür ist für die US-Stimmen nach den Präsidentschaftswahlen 2016 zu sehen.

Farbenblindheit

Es ist immer gut, sich vor Augen zu halten, dass eine angemessene Anzahl von Menschen farbenblind ist, und Farbkombinationen zu vermeiden, die für diese Personen problematisch sein können. Nehmen Sie die folgende Visualisierung als Beispiel.

Katalogbaum

Die in diesem Diagramm verwendeten Farben sind eine schreckliche Kombination für jemanden, der an rot-grüner Farbenblindheit leidet (kann Deuteranopie oder Protanopie sein). Denken Sie am besten daran, zumindest Kombinationen aus Rot und Grün zu verwenden, da diese Art der Farbenblindheit am weitesten verbreitet ist.

Wenn Sie mehr über Farbenblindheit erfahren möchten, gibt es eine elegante Website zur Simulation von Farbenblindheit.

Kantenbündelung

Die Idee hinter der Kantenbündelung besteht im Wesentlichen darin, ein elastisches Band um alle Pfade zu wickeln, die der gleichen Route von einem Knoten zu einem anderen Knoten folgen. Dies wird in Netzwerkdiagrammen verwendet und hat den Vorteil, dass die Visualisierung weniger überladen aussieht und von Natur aus ansprechender ist, wie wir weiter unten sehen können.

Die Nachteile dieser Methode sind, dass Sie nach dem Bündeln nicht den genauen Links oder Pfaden folgen können, was bedeutet, dass unsere Visualisierung nicht die zugrunde liegenden Daten widerspiegelt (wir verlieren einige grafische Integrität).

Übersicht über den Visualisierungsprozess

Nachdem wir uns eine Reihe von Visualisierungen angesehen und den Unterschied zwischen einer guten und einer schlechten Visualisierung erkannt haben, ist es ein guter Zeitpunkt zu diskutieren, was eine gute Visualisierung tatsächlich ausmacht.

Visualisierungsziele

Die Visualisierung verfolgt im Wesentlichen drei Ziele:

  • Datenexploration - finde das Unbekannte
  • Datenanalyse - Hypothesen überprüfen
  • Präsentation - kommunizieren und verbreiten

Das ist im Wesentlichen es. Diese Begriffe sind jedoch ziemlich vage und es ist daher leicht zu verstehen, warum es für Einzelpersonen so schwierig ist, die Kunst der Kommunikation durch Visualisierungen zu beherrschen. Es ist daher nützlich, ein Modell zu haben, das uns hilft, diese Ziele zu erreichen.

Das Fünf-Stufen-Modell

Visualisierung wird oft als das folgende Fünf-Stufen-Modell beschrieben, ein Prozess, der einem ziemlich logischen Verlauf folgt.

Erstens ist es erforderlich, ein bestimmtes Ziel oder eine bestimmte Frage zu isolieren, die Gegenstand der Bewertung sein soll.

Darauf folgt Data Wrangling, das sind 90% dessen, was Data Scientists bei der Arbeit mit Daten tun. Bei diesem Verfahren werden die Daten in ein funktionsfähiges Format gebracht und es wird eine explorative Datenanalyse durchgeführt, um ihren Datensatz zu verstehen. Dies kann verschiedene Möglichkeiten zum Zusammenfassen oder Darstellen der Daten beinhalten.

Die dritte Phase ist die Entwurfsphase, in der eine Geschichte entwickelt wird, die Sie mit den Daten erzählen möchten. Dies hängt eng mit dem von uns definierten Ziel zusammen. Was ist die Botschaft, die wir zu kommunizieren versuchen? Dies hängt wahrscheinlich auch davon ab, wer Ihre Zielgruppe ist und wie objektiv die Analyse ist. Beispielsweise möchte ein politischer Gegner wahrscheinlich eine übertriebene Datenbotschaft senden, damit sein Gegner schlecht aussieht.

Der vierte Schritt beinhaltet die Implementierung der Visualisierung, beispielsweise durch Programmierung interaktiver webbasierter Visualisierungen mit D3. Dies ist der Teil des Prozesses, der eine Codierung beinhaltet, während die Designphase Denken, Zeichnen, Ideenfindung und so weiter beinhaltet.

Die fünfte Phase ist im Wesentlichen eine Überprüfungsphase. Sie sehen sich Ihre Implementierung an und entscheiden, ob sie die Nachricht sendet, die Sie kommunizieren möchten, oder ob Sie die Frage beantworten, die Sie beantworten möchten.

In Wirklichkeit ist dies ein nichtlinearer Prozess, obwohl er oft als einer dargestellt wird. Hier ist eine etwas realistischere Form dieses Modells.

Es scheint einfach, oder? Nun, es gibt tatsächlich viele Möglichkeiten, dies zu vermasseln, und oft ohne es zu merken. Hier sind die drei häufigsten Probleme:

Domänensituation - Haben Sie die Bedürfnisse der Benutzer richtig verstanden? Vielleicht wird das falsche Problem angesprochen. Dies ist ein Problem im Zusammenhang mit der Zielphase.

Daten- / Aufgabenabstraktion - Zeigen Sie ihnen das Richtige? Vielleicht wird die falsche Abstraktion verwendet. Dies ist auch ein Problem im Zusammenhang mit der Zielphase.

Visuelle Kodierung / Interaktion - Funktioniert die Art und Weise, wie Sie die Daten anzeigen? Möglicherweise wird die falsche Sprache oder Kodierung verwendet. Dies ist ein Problem im Zusammenhang mit der Entwurfsphase.

Algorithmus - Bricht Ihr Code? Ist Ihr Code zu langsam? Ist es skalierbar? Dies ist ein Problem in der Implementierungsphase. Möglicherweise wird der falsche Algorithmus verwendet.

Es mag naheliegend sein, die Tatsache anzusprechen, dass Ihr Code kaputt geht. Wie beurteilen Sie jedoch die subjektiveren Probleme, die wir gerade angesprochen haben, wie die Domänensituation oder die verwendete visuelle Codierung? Wir können uns an Bewertungsmetriken orientieren.

Wir können uns auf qualitative und quantitative Kennzahlen verlassen. Qualitative Metriken sind häufig am nützlichsten für Visualisierungen, da Visualisierungen zur Übermittlung von Informationen an Personen entwickelt wurden. Einige Beispiele für zu verwendende Metriken sind:

  • Beobachtungsstudien („Think Aloud“)
  • Experteninterviews (auch bekannt als Design Critiques)
  • Schwerpunktgruppen

Die Idee dieser qualitativen Verfahren ist, dass Einzelpersonen in der Lage sein sollten, die Visualisierung zu sehen und die Botschaft, die Sie vermitteln möchten, zu verstehen, ohne zusätzliche Informationen. Diese Arten von Studien und Metriken werden häufig in Bereichen wie Marketing und Webdesign verwendet, da sie Aufschluss darüber geben, wie Einzelpersonen ihre Ideen oder Designs interpretieren und darauf reagieren.

Faustregeln

Edward Tufte ist ein Pionier auf dem Gebiet der Entwicklung effektiver Visualisierungen und hat mehrere Bücher zu diesem Thema geschrieben (auf die ich am Ende des Artikels verweisen werde).

Hier sind drei seiner Regeln für eine effektive Visualisierung:

  • Grafische Integrität
  • Maximieren Sie das Daten-Tinten-Verhältnis
  • Vermeiden Sie Diagrammmüll

Grafische Integrität

Wir haben dies bereits etwas ausführlicher besprochen, wenn es um irreführende Visualisierungen geht. Im Allgemeinen ist es eine schlechte Praxis und für die Gesellschaft etwas schädlich, zu versuchen, Personen mit Statistiken in die Irre zu führen.

Daten-Tinten-Verhältnis maximieren

Bei dieser Faustregel geht es um Klarheit und Minimalismus. Im Allgemeinen sind 3D-Darstellungen weniger klar und können in einigen Fällen irreführend sein. Untersuchen Sie die Unterschiede zwischen den beiden folgenden Diagrammen und entscheiden Sie, welche Ihrer Meinung nach besser ist.

Vermeiden Sie Chart Junk

Überflüssige visuelle Elemente lenken die Menschen von der übermittelten Botschaft ab.

Interaktive Visualisierungen

Dieses Thema kann unglaublich kompliziert werden, so dass ich die Diskussion für die Entwicklung von Visualisierungen für zukünftige Artikel verlassen werde. Leider können D3-Visualisierungen nicht über Medium ausgeführt werden, sodass Sie die Links besuchen können, um die Visualisierungen in Aktion zu sehen.

Hier sind einige meiner Lieblingsvisualisierungen, die den Lesern Appetit machen.

Orte im Game of Thrones

Ortsnamen, die in der Game of Thrones-Saga besprochen wurden. Quelle

Waffentode in den USA

Waffentode in den Vereinigten Staaten. Quelle

Verkehrssicherheit in Großbritannien

Diese Visualisierung basiert auf deck.gl und es macht unglaublich viel Spaß, damit herumzuspielen - es gibt mehrere andere interaktive Visualisierungen auf dieser Website, die ich zum Auschecken empfehle.

Verkehrssicherheit in der britischen Quelle

Straßen zu den Landeshauptstädten

Diese Visualisierung ist eine interaktive und farbcodierte Karte der USA und aller Straßen, die zu den Hauptstädten der einzelnen Bundesstaaten führen.

Moovellab

Eine ähnliche Visualisierung finden Sie auch auf derselben Website, auf der die Straßen nach Rom dargestellt sind.

Handelsbilanzdefizit der Vereinigten Staaten

Dies ist eine wunderschöne Visualisierung, die das Handelsdefizit der Vereinigten Staaten von 2001 bis 2013 veranschaulicht.

Linked Jazz Network Graph

Diese interaktive Grafik zeigt einige der bekanntesten Namen im Jazz und wie sie andere Künstler beeinflusst haben.

Jazz-Netzwerk-Grafik.

Weitere Visualisierungen finden Sie in der d3-Galerie auf GitHub.

Letzte Kommentare

Für diejenigen unter Ihnen, die mehr Visualisierungen sehen möchten, habe ich nachfolgend mehrere Verweise auf Bücher und Websites, die für Sie von Interesse sein können, wenn Sie Ihre Visualisierungsfähigkeiten ernsthaft entwickeln möchten, sei es in Form von visuellem Denken oder in Form von interaktiven Entwicklungen Visualisierungen mit D3.

Um Sie für das Durchhalten dieses Artikels zu belohnen, finden Sie hier die Visualisierung, die als Gewinner des „Information is Beautiful Award 2018“ ausgewählt wurde. Diese Visualisierung benennt U-Bahn-Stationen in London nach dem Instagram-Hashtag um, der am häufigsten mit diesem Standort verknüpft ist.

#tagsandthecity

Ich verlasse Sie mit einem Link zu einer lustigen Website, die einige faszinierende und lustige Beispiele für schlechte Visualisierungen enthält. Einige der in diesem Artikel verwendeten Visualisierungen stammen von dieser Website.

Danke fürs Lesen!

Weitere Lektüre

Dieser Abschnitt enthält eine Liste nützlicher Ressourcen, die sich auf die Erstellung von Datenvisualisierungen konzentrieren.

Bücher

[1] Visuelles Denken für Design, Colin Ware, Morgan Kaufman (2008)

[2] Interaktive Datenvisualisierung für das Web, Scott Murray, O’Reilly (2017)

[3] Visualisierungsanalyse und -design, Tamara Munzner, CRC Press (2014)

[4] The Functional Art: Eine Einführung in Informationsgrafik und Visualisierung, Alberto Cairo, New Riders (2012)

[5] Design for Information, Isabel Meirelles, Rockport (2013)

Edward Tufte

[1] Die visuelle Darstellung quantitativer Informationen.

[2] Informationen vorstellen.

[3] Visuelle Erklärungen.

D3

D3.js ist eine JavaScript-Bibliothek zum Bearbeiten von Dokumenten basierend auf Daten. Mit D3 können Sie Daten mithilfe von HTML, SVG und CSS zum Leben erwecken.

[1] Offizielle D3-Site [2] Offizielle D3-API-Referenz (Version 4) [3] Offizielle D3-API-Referenz (Version 3.x) [4] D3-Tutorial von Scott Murray (D3-Version 3) [5] Jerome Cukiers D3-Cheat Blatt

Web Entwicklung

[1] WebStorm von JetBrains - Smart JavaScript IDE (kostenlos für Studenten). [2] Eloquent Javascript Book [3] DevDocs, Mozilla Developer Network - Vereinheitlichte Dokumentationen zu den wichtigsten Webtechnologien. [4] Github (Git Repository Hosting Service) - Versionskontrollsystem für die Softwareentwicklung. (kostenlose private Repositories für Studenten)

Tableau

Tableau Software ist ein Tool, mit dem Sie interaktive Datenvisualisierungen erstellen können. (kostenlos für Studenten)

Datenquellen

Data.govCensus.govDataverse NetworkClimate Data SourcesClimate Station RecordsCDC-Daten (Disease Control and Prevention) World Bank CatalogFree SVG MapsUK Office for National StatisticsStateMasterQuandl

Websites und Blogs

Fließende DatenVisuelle KomplexitätGuardian DataBlogDas Fazit

Andere Software-Toolkits

Plot.lyWolfram MathematicaPrefuse (Java)

Siehe auch

Tag 8: Der Kickstart des ScheiternsTeil 2: Edward Curtis und native Stereotype neu mischenPassion Project 13.05.19Künstler werden die neuen Verteilungsmodelle in immersiven Medien erschaffen