16 Daten visualisieren
16.1 Diagramme erstellen
Excels Diagrammtypen erfordern, dass die Daten in einem bestimmten Format vorliegen. Das notwendige Format hängt vom Diagrammtyp ab. Es lassen sich deshalb nicht alle Visualisuerungen aus den gleichen Datenstrukturen erzeugen.
16.1.1 Datenvorbereitung
Die verschiedenen Diagrammtypen erfordern unterschiedliche Datenformate. Deshalb müssen die Daten für die Visualisierung vorbereitet und in eine geeignete Form gebarcht werden.
Alle Werte, die visualisiert werden sollen, müssen einen Bereich bilden. Dieser Bereich kann innerhalb einer Tabelle liegen oder dynamische Felder umfassen.
Excel organisiert die Werte für die Darstellung in Datenreihen. Je nach Visualisierung besteht eine Datenreihe aus einer Überschrift und einer, zwei oder drei Spalten mit Werten.
Es vereinfacht die Arbeit, wenn die Spalten einer Datenreihe möglichst nebeneinander geschrieben werden. Alternativ können die gleichen Teilspalten organisiert werden. Letzteres bietet sich immer dann an, wenn die Werte in die Breitform transponiert werden müssen.
Erlaubt ein Diagramm horizontale oder vertikale Achsbeschriftungen, dann werden diese normalerweise in den Spalten vor den eigentlichen Werte für den Darstellungsbereicht positioniert.
16.1.2 Diagrammerstellung
Um ein Diagramm zu erstellen müssen die vorbereiteten Daten markiert werden. Excel Diagramme können nicht mit dynamischen Feldern umgehen, so dass alle darzustellenden Werte markiert werden müssen.
Ausser den Spaltenüberschriften sollten keine weiteren Daten markiert werden. Dazu gehören auch die Werte, die für die Beschriftung der X-Achse benötigt werden. Abbildung 16.1 zeigt eine solche Markierung.
Oft liegen Daten als Tabellen oder Dynamische Felder vor. Verändert sich die Anzahl der Werte einer solchen Datenstruktur, betrifft diese Änderung nicht den markierten Wertebereich. Liegen neue Werte ausserhalb des markierten Bereichs für ein Diagramm, dann werden diese Werte nicht dargestellt. In solchen Fällen muss der Bereich für die Darstellung nachträglich erweitert werden.
Nachdem wie zu visualisierenden Werte markiert wurden, kann das eigentliche Diagramm eingefügt werden. Dazu muss aus dem Menübalken Einfügen
im Abschnitt Diagramme
(Abbildung 16.2) die gewünschte Darstellung ausgewählt werden.
Die Auswahl erzeugt das gewünschte Diagramm für die markierten Daten auf dem aktuellen Arbeitsblatt.
16.1.3 Diagrammbearbeitung
Sobald ein Diagramm erstellt wurde, kann es über das Menüband Diagrammentwurf
angepasst werden. Dieses Menüband wird nur angezeigt, wenn ein Diagramm ausgewählt wurde.
Für die Datenvisualisierung sind das Untermenü Diagrammelement hinzufügen
und das Kommando Daten auswählen
zentral, weil über sie die Darstellung gesteuert wird.
Daneben wird das Farbschema über das Menü Farben ändern
gesteuert.
Das Untermenu Diagrammelement hinzufügen
erlaubt es, einzelne Diagrammelement zur Visualisierung hinzuzufügen oder zu entfernen. Die möglichen Diagrammelemente hängen vom jeweiligen Diagrammtyp ab.
Das Untermenu Schnelllayout
bietet Vorlagen für die einzelnen Diagrammelemente. Diese Vorlagen dienen oft als Basis für die weitere Verfeinerung mit dem Untermenü Diagrammelement hinzufügen
.
Mit dem Untermenü Farbenändern
können die im Diagramm verwendeten Farben angepasst werden. In diesem Menü finden sich verschiedene Farbpaletten. Diese Farbpaletten werden durch das aktuelle Farbschema der Arbeitsmappe bestimmt.
Im Bereich Diagrammformatvorlagen
kann die allgemeine Darstellung angepasst werden. Diese Einstellungen sollten nur angepasst werden, um ein Diagramm für eine besondere Präsentation vorzubereiten. Normalerweise werden über diesen Bereich keine Änderungen vorgenommen.
Das Kommando Zeile/Spalte tauschen
ist bei guter Vorbereitung der Daten nicht notwendig. Dieses Kommando ändert für eine Visualisierung die Verwendung von Spalten in die Verwendung von Zeilen. Dieses Kommando ist entsprechend nur Notwendig, wenn die Daten zeilenweise anstatt spaltenweise vorbereitet wurden.
Manche Visualisierungen verwenden ein komplexes internes Datenmodell, so dass die mehrfache Anwendung des Kommandos Zeile/Spalte tauschen
nicht zwingend zur ursprünglichen Darstellung führt.
Mit Daten auswählen
werden die Datenreihen und Quellen für Achsbeschriftungen in der Arbeitsmappe festgelegt. Dieses Kommando öffnet den Dialog Datenquelle auswählen
, mit dem die Daten den einzelnen Darstellungselementen zugewiesen werden. Mit diesem Kommando können die Datenreihen korrigiert werden, wenn die automatische Erkennung von Excel nicht das gewünschte Ergebnis erzielt hat.
Das Kommando Daten auswählen
heisst unter MacOS Daten markieren
.
Das Untermenü Diagrammtyp ändern
erlaubt es, den Typ eines Diagramms zu verändern, ohne den Diagrammbereich zu verändern. Weil die verschiedenen Diagrammtyp recht unterschiedliche Anforderungen an die Datenorganisation haben, sollte hier nur Diagrammtypen innerhalb der gleichen Gruppe ausgewählt werden. Beispielsweise könnte so ein Balkendiagramm in ein Säulendiagramm geändert werden.
Das Kommand Diagramm verschieben
erlaubt es, ein Diagramm auf einem eigenen Arbeitsblatt zu platzieren. Dieses Kommando ist nur dann sinnvoll, wenn eine Arbeitsmappe zur Präsentation der Daten verwendet wird.
16.1.4 Dialog Datenquelle auswählen
Über das Kommando Daten markieren
wird der Dialog Datenquelle auswählen
(Abbildung 16.4) geöffnet, über den die Daten den Darstellungselementen zugewiesen werden.
Durch einen Doppelklick auf eine Datenreihe öffnet sich ein zweiter Dialog, um eine Datenreihe zu konfigurieren (Abbildung 16.5). Über diesen Dialog sollten die Datenreihen konfiguriert werden, damit sicher gestellt wird, dass die Datenreihen auf die richtigen Werte verweisen.
Unter MacOS ist die gleiche Funktion etwas anders angeordnet.
Der Dialog besteht aus drei Teilen:
- Der Teil
Bereichdetails
zeigt den Datenbereich des Diagramms an. Der angezeigte Bereich sollte nicht in diesem Teil verändert werden. - Der Teil
Legendeneinträge (Reihen)
weist Spalten mit Werten den Datenreihen des Diagramms zu. In diesem Teil werden die verwendeten Datenbereiche angepasst, die im TeilBereichdetails
zusammengefasst angezeigt werden. - Im Teil
Ausgeblendete und leere Zellen
wird die Behandlung von leeren Zellen und#NA
-Werten festgelegt. In diesem Teil sind nur selten Anpassungen notwendig.
16.1.5 Diagramme formatieren
Die Darstellungselemente von Diagrammen können über den Formatierungsbereich angepasst werden. Über den Formatierungsbereich lassen sich die alle Details eines Diagramms anpassen.
Zur Formatierung der Datenreihen wird der Formatierungsbereich benötigt. Dieser wird unter Windows über das Kommando Auswahl formatieren
geöffnet. Die wichtigsten Formatierungen sind die Datenreihenformatierungen. Je nach Diagrammtyp lassen sich in dieser Rubrik Formatierungen in Abhängigkeit zu den abgebildeten Daten justieren.
Unter MacOS wird der Formatierungsbereich über das Kommando Formatierungsbereich
im Menüband Format
geöffnet.
Nach dem Öffnen des Formatierungsbereichs können die einzelnen Darstellungselemente gezielt formatiert werden. Immer wenn ein Darstellungselement sich auf Datenreihen bezieht, lassen sich zuätzliche Formatierungen unter der Rubrik Reihenoptionen
konfigurieren. Diese Optionen werden unter MacOs und Windows leicht unterschiedlich dargestellt (Abbildung 16.9)
16.1.6 Diagramme exportieren
Um ein Diagramm zum Einbetten in andere Programme bereitzustellen, muss das Diagramm aus Excel exportiert werden. Dazu ein Rechtsklick auf das Diagramm öffnet ein Kontextmenü, in welchem sich der Punkt Als Grafik speichern ...
findet (Abbildung 16.10).
Das Kommando zum Speichern von Diagrammen heisst unter MacOS Als Bild speichern ...
und unter Windows Als Grafik speichern ...
.
Anschliessend erscheint ein Dialog zum Speichern der Diagrammdatei (Abbildung 16.11). Standardmässig bietet dieser Dialog als Dateityp
das Grafikformat PNG
an, was in den meisten Fällen gewählt werden sollte. Alternativ können Diagramme in den Formaten JPEG
, GIF
, PDF
, BMP
und SVG
exportiert werden. Hier sind für die Praxis nur die beiden Formate PDF
und SVG
von Bedeutung.
Das PDF
-Format sollte gewählt werden, wenn eine Grafik einzeln ausgedruckt werden soll.
Das SVG
-Format sollte gewählt werden, wenn das Diagramme grossformtig oder in hoher Qualität auf Web-Seiten veröffentlicht werden soll.
16.2 Diagrammtypen
Alle Excel Diagramme visualisieren Werte vom Datentyp Zahl. Um andere Datentypen zu visualisieren, müssen diese zuerst in Zahlen kodiert werden.
16.2.1 Balkendiagramme
Excel unterscheidet zwischen Balken- oder Säulendiagrammen. Technisch unterscheiden sich die beiden Diagrammtype nur durch die Orientierung der Balken. Im Folgenden werden beide Diagrammtypen als Balkendiagramme bezeichnet.
Für ein Balkendiagramm entspricht jeder Wert einem Balken und der Wert bestimmt dessen Grösse.
Die Anzahl der Werte entspricht der Anzahl der Balken. Daraus folgt, dass ein Balkendiagramm immmer diskrete Daten auf der X- und Zahlenwerte auf der Y-Achse abbildet.
Balkendiagramme können keine Werte zusammenfassen. Deshalb müssen Daten vor der Visualisierung als Balkendiagramm aggregiert werden. Normalerweise erfolgt ein gruppiertes Zählen mit ZÄHLENWENNS()
.
Die Werte können als Zeile oder als Spalte angegeben werden. Wird ein zweiter Vektor mit Textwerten angegeben, dann übernimmt Excel diese Werte als Beschriftung der X-Achse.
Für Balkendiagramme mit zwei oder mehr Gruppen, müssen die Daten in der Breitform vorliegen.
Gruppierte Daten werden farblich voneinander abgehoben. Die Farben können über das Farbschema der Arbeitsmappe über das Kommando Farben ändern
angepasst werden.
Sollen einzelne Kategorien farblich hervorgehoben werden, dann müssen die Werte gruppiert organisiert werden, wobei jeder Wert in einer eigenen Gruppe geführt wird (Abbildung 16.14).
16.2.1.1 Darstellung optimieren
Bei der Darstellung von Balkendiagrammen verwendet Excel immer Standardeinstellungen. Diese nutzen die Fläche des Diagramms nicht unbedingt optimal: Auf der Y-Achse wird immer eine Hauptbeschriftung oberhalb des grössten Wers eingefügt und die Abstände zwischen den Balken sind grösser als die Balken (Abbildung 16.15).
Die Y-Achse kann immer auf den Maximalwert begrenzt werden. Dazu wird die Achsbeschriftung mit der Maus ausgewählt. Anschliessend können in den Achsenoptionen die Grenzen der Y-Achse festgelegt werden. Hier sollte das Maximum auf den grössten dargestellten Wert gesetzt werden (s. Abbildung 16.16).
Für Balkendiagramme sollte das Minimum der Y-Achse immer 0.0
sein.
Die Abstände zwischen den Balken werden über die Formatierung der Balken gesteuert. Dazu muss ein Balken mit der Maus ausgewählt werden. Die einzige Einstellungskategorie für die Datenformatierung sind die Reihenoptionen
, wo sich die beiden Einstellungen Reihenüberlappungen
und Abstandsbreite
finden (s. Abbildung 16.17).
Abbildung 16.18 zeigt die Bedeutung der beiden Optionen.
Die Option Reihenüberlappung
legt die Abstände ziwschen Balken in der gleichen Kategorie fest. Die Abstände werden in Prozent der Überlappung angegeben. 0% bedeutet keine Überlappung ohne Abstand. 100% bedeutet vollständige überlappung und -100% bedeutet einen Abstand einer Balkenbreite.
Die Option Abstandsbreite
legt die Abstände zwischen den Kategorien fest. Die Abstände werden in Prozent der Balkenbreite angegeben.
Die Überlappung und die Balkenbreite wird auch dann berücksichtigt, wenn ein Balken nicht dargestellt wird!
Um farblich voneinander unterschiedene Kategorien mit gleicher Balkenbreite wie in Abbildung 16.14 zu erzeugen, muss die Reihenüberlappung
auf 100%
gesetzt werden. Anschliessend können die Abstände mit der Option Abstandsbreite
kontrolliert werden. Abbildung 16.14 verwendet eine Abstandsbreite
von 10%
.
16.2.2 Spezielle Balkendiagramme
Excel bietet zwei spezielle Formen von Balkendiagrammen: Trichterdiagramme und Wasserfall-Diagramme. Beide Diagramme sind eindimensional.
Trichterdiagramme stellen die Balken horizontal zentriert dar, wobei nur positive Werte zulässig sind. Deshalb haben Excels Trichterdiagramme keine Beschriftung der X-Achse (Abbildung 16.19).
Trichterdiagramme unterscheiden sich von anderen Balkendiagrammen nur in der Anordnung der Balken.
Weil Trichterdiagrammen keine beschriftete X-Achse haben und die Anordnung der Balken schwerer zu dekodieren ist, sollten diese Diagramme nicht verwendet werden.
Wasserfalldiagramme stellen die Balken so dar als Folge dar. Diese Diagramme stellen positive und negative Werte gerichtet nebeneinander. Der Start des von links nach rechts gelesenene nächste Balken beginnt bei dem Wert, an dem der vorherige Balken endete. Bei positiven Werten befindet sich der Endpunkt über dem Startpunkt, bei negativen Werten darunter (Abbildung 16.20).
Wasserfalldiagramme werden zur Visualisierung von Veränderungen über die Zeit verwendet.
Bei Wasserfalldiagrammen kann die Beschriftung der X-Achse über ein zweite Datenspalte mitgegeben werden. Bei Trichterdiagrammen können auf die gleiche Weise die Beschriftungen der Y-Achse angepasst werden. In beiden Fällen müssen die Beschriftungen in der Spalte vor den Werten gespeichert sein.
16.2.3 Histogramm
Ein Histogramm ist eine Visualisierung der Werteverteilung als Balkendiagramm.
Histogramme visualisieren kontinuierliche bzw. metrischskalierte Wertebereiche, indem zwischen dem kleinsten und dem grössten Wert gleichmässige Intervalle gebildet werden und anschliessend die Anzahl der Werte in den Intervallen bestimmt wird.
Für ein Excel-Histogramm müssen die Werte vor der Visualisierung nicht aggregiert werden.
Ein Histogramm wird oft über einen Vektor erstellt. Werden die Daten so vorbereitet, dass unter den Werten keine anderen Daten stehen, dann kann die gesamte Spalte markiert werden, indem auf den Spaltenbuchstaben mit der Maus geklickt wird. Anschliessend kann das Histogramm in die Arbeitmappe eingefügt werden (Abbildung 16.21)
Ein Excel-Histogramm ist immer ein eindimensionales Balkendiagramm. Werden Werte aus mehreren Spalten übergeben, dann fliessen alle Werte in das Histogramm ein.
16.2.3.1 Histogramme optimieren
Im Gegensatz zu Balkendiagrammen wird die Y-Achse von Histogrammen in der Regel nicht angepasst.
Excel versucht die Intervalle für ein Histogramm aus dem vorliegenden Wertebereichen automatisch zu ermitteln. Dazu werden zwischen dem minimalen und maximalen Werten gleichgrosse Intervalle proportional zur Anzahl der Werte gewählt. Das bedeutet, dass Excel grössere Intervalle wählt, wenn weniger Werte vorhanden sind. Das ist nicht immer gewünscht oder die Intervallgrenzen liegen ungeeignet.
Die Intervalle eines Histogramms lassen sich über die Formatierung kontrollieren. Dazu wird mit der Maus ein Balken angeklickt und anschliessend die Datenreihenoptionen ausgewählt.
Die Option Intervalle
steht nach dem Erstellen des Histogramms auf Auto
. Hier stehen die beiden Optionen Invervallbreite
und Anzahl der Intervalle
zur Auswahl.
Mit Intervallbreite
wird der Abstand zwischen zwei Intervallen angegeben (Abbildung 16.23 (a)). Die Intervallgrenzen werden durch den kleinsten und grössten Wert definiert. Wird beispielsweise die Intervallbreite mit 500 angegeben und der kleinste Wert ist 33, dann sind die Intervallgrenzen 33, 533, 1066 usw. Diese Grenzen sind nicht immer intuitiv, besonders wenn Histogramme zum Vergleich von Daten verwendet werden. Mit der Option Unterlaufintervall
kann die erste Intervallgrenze festgelegt werden. Es bietet sich an, das Unterlaufintervall genauso breit zu machen, wie die Intervallbreite.
Mit Anzahl der Intervalle
wird die Anzahl der Balken im Histogramm festgelegt (Abbildung 16.23 (b)). Excel berechent aus diesem Wert einen geeigneten Intervallabstand.
Die beiden Optionen Überlaufintervall
und Unterlaufintervall
ermöglichen es die Ober- bzw. Untergrenze der regulären Intervalle zu definieren. Die beiden Intervalle entsprechen dem ersten bzw. letzen Balken im Histogramm. Diese beiden Intervalle werden für die Intervallbreite nicht berücksichtigt, zählen aber zur Anzahl der Intervalle. Diese Intervalle können verwendet werden, wenn unterhalb der Grenze des Unterlaufintervalls bzw. oberhalb der Grenze des Überlaufintervalls vereinzelt “Ausreisser” mit grösseren Abständen als die Intervallbreite auftreten.
Für die erste Sichtung neuer Daten ist es leichter ein Histogramm über die Anzahl der Intervalle zu definieren. Wird anschliessend auf Intervallbreite
gewechselt, zeigt Excel die verwendete Intervallbreite an. So lassen sich die Intervalle einfach feinjustieren.
16.2.3.2 Histogramme für diskrete Daten
In der Datenreihenformatierung findet sich zusätzlich die Option Nach Kategorie
, die keine weiteren Konfigurationsmöglichkeiten bietet. In diesem Fall akzeptiert Excel einen Vektor mit diskreten und einen mit numerischen Daten. Wird diese Option für die Intervalle gewählt, dann bilden die eindeutigen diskreten Werte Kategorien. Über diese Kategorien summiert Excel den numerischen Vektor, um die Höhe der Balken zu bestimmen. Das Ergebnis ist in den meisten Fällen kein Histogramm im eigentlichen Sinn, weil es eine Summe anstatt einer Anzahl anzeigt.
Wird als numerischer Vektor der Einsvektor (Kapitel 11)verwendet, dann entspricht die Summe der einzelnen Kategorien der Anzahl der Werte in der Kategorie. Ein solcher Einsvektor wird mit der Listing 16.1 erzeugt.
= 1 * (Tabelle1[disktrekeWerte] == Tabelle1[diskreteWerte])
Auf diese Weise lässt sich in Excel ein Histogramm für diskrete Daten erstellen (Abbildung 16.24).
Im Fall von nominalskalierten Werten ist es oft wünschenswert die Balken in der Reihenfolge der Häufigkeiten zu organisieren. Das ist mit der Histogrammvisualisierung von Excel nicht möglich. Für solche Visualisierungen muss auf ein reguläres Balkendiagramm zurückgegriffen werden und die Daten vor der Darstellung entsprechend aufbereitet werden.
16.2.4 Box-Plot
Boxplots oder Kastendiagramme dienen der Visualisierung von Verteilungen. Im Gegensatz zu den festen Intervallen von Histogrammen, mit denen Häufigkeiten bestimmt werden, wird für Boxplots von festen Häufigkeiten ausgegangen. Diese Darstellung erlaubt es, auch sehr unterschiedliche Verteilungen miteinander zu vergleichen.
Weil Boxplots auch für ordinalskalierte Wertebereiche erstellt werden können, sind sie ein flexibles Werkzeug zur Visualisierung von Verteilungen.
Für Boxplots dürfen Werte nicht aggregiert werden.
Werden einem Boxplot aggregierte Werte übergeben, dann bestimmt Excel die Intervallgrenze für die aggregierten Werte und nicht die ursprüngliche Verteilung.
In der Regel wird eine ganze Arbeitsblattspalte ausgewählt, um alle relevanten Werte zu markieren. Anschliessend wird aus der Diagrammkategorie Statistik
der Diagrammtyp Kastendiagramm ausgewählt.
Excel kann gruppierte Bloxplots erstellen. Dazu muss ein zweiter Vektor mit diskreten Werten angegeben werden. Excel gruppiert dann die Werte entlang des zweiten Vektors.
16.2.4.1 Boxplots optimieren
Wie auch bei Balkendiagrammen fügt Excel zusätzliche Werte auf der Y-Achse ein. Diese Werte sind nur für offene Wertebereiche zulässig. Für geschlossene Wertebereiche müssen diese zusätzlichen Werte entfernt werden. Dazu wird die Beschriftung der Y-Achse ausgewählt und in der Datenreihenformatierung unter Optionen angepasst (Abbildung 16.27). Damit die Werte auch tatsächlich übernommen werden, muss die automatische Feststellung des Wertebereichs deaktiviert werden.
Die Breite der Box kann über die Datenformatierung der X-Achse festgelegt werden (Abbildung 16.28). Die Option Abstandsbreite
gibt den Abstand der Box zur nächsten Box als Vielfaches der Boxbreite an. Der Abstand zum Diagrammrand ist die Hälfte des Abstands zur nächsten Box. Aus den Abständen berechnet Excel die Breite der Boxen.
- Ein Wert von
1.0
bedeutet, dass der Abstand genauso breit wie die Box ist. - Ein Wert von
0.5
bedeutet, dass der Abstand halbso breit wie die Box ist. Dadurch wird die Box breiter. - Ein Wert von
2.0
bedeutet, dass der Abstand doppelt so breit wie die Box ist. Dadurch wird die Box schmaler.
Werten mehrere Vektoren gleichzeitig als Boxplot dargestellt, werden die Boxen unmittelbar nebeneinander dargestellt. Diese Abstände können nicht konfiguriert werden (Abbildung 16.29)
16.2.5 Punktdiagramm
Ein Punktdiagramm stellt zwei Vektoren mit kontinuierlichen Daten gegenüber. Ein Vektor wird der X-Achse zugewiesen, der andere der Y-Achse. Entsprechend besteht jede Datenreihe für ein Punktdiagramm immer aus zwei Vektoren.
Werden mehr als zwei Vektoren für ein Punktdiagramm markiert, dann verwendet Excel standardmässig die äusserst linke Spalte immer für die Werte auf der X-Achse. Um dieses Verhalten zu ändern, müssen die Datenreihen unter Daten auswählen
angepasst werden.
Sollen mehrere Gruppen von Wertepaaren in einem Punktdiagramm dargestellt werden, sollten die Gruppen dem Punktdiagramm schrittweise als separate Datenreihen hinzugefügt werden.
16.2.5.1 Ausgleichsgeraden
Ausgleichsgeraden heissen in Excel Trendlinien. Drei Arten von Trendlinien können direkt in ein Punktdiagramm eingebettet werden.
- Linear
- Lineare Prognose
- Gleitender Durchschnitt
Von diesen drei Trendlinienarten ist nur Linear
eine Ausgleichsgerade im eigentlichen Sinn. Die Lineare Prognose
ist identisch mit der Ausgleichsgeraden und unterscheidet sich nur dadurch, dass die X-Achse einen etwas grösseren positiven Wertebereich erhält.
Zusätzlich können die folgenden Ausgleichslinien konfiguriert werden.
- Exponentiell
- Logarithmisch
- Polynomisch
- Potenz
Exponentielle, logarithmische und Potenzierte Ausgleichslinien sind nur für geeignete Wertebereiche (\mathbb{R}^+) zulässig
Die Trendlinie Gleitender Durchschnitt
setzt voraus, dass die Werte auf der X-Achse aufsteigend sortiert sind. Diese Trendlinie wird meist nur dann verwendet, wenn die Werte auf der X-Achse Zeitangaben sind.
Eine Ausgleichsgerade wird über den Menübalken Diagrammentwurf
das Untermenu Diagrammelement hinzufügen
unter Trendlinien
die Option Linear
gewählt.
Eine Ausgleichsgerade kann angepasst werden, indem die Linie angelickt wird und unter Trendlinie formatieren
die Trendlinienoptionen verändert werden. In diesem Dialog können auch die weiteren Ausgleichslinien konfiguriert werden (Abbildung 16.32).
16.2.6 Jitter-Diagramm
Excel stellt für diskrete Werte keine eigene Visualisierung für den Vektorenvergleich bereit. Eine direkte Anwendung des Punktdiagramms führt zum Problem, dass die Punkte für jedes Wertepaar genau übereinander liegen. So lassen sich die Verteilungen in der Visualisierung nicht ablesen. Um ein Jitter-Diagramm zu erzeugen, müssen die Werte vor der Visualisierung leicht angepasst werden, so dass die Punkte nicht exakt übereinander liegen. Für diese Anpassung müssen die Werte beider Vektoren als Zahlen vorliegen (s. Kapitel 13). Weil die Werte diskret sind, kann der Bereich zwischen den Werten genutzt werden. Grundsätzlich steht der Bereich bis 0.5 Abstand vom jeweiligen Wert für das Jittering zur Verfügung. Weil dadurch aber die Punkte nebeneinanderliegender Werte nicht mehr korrekt zugeordnet werden können, sollte zwischen zwei Werten eine Pufferzone vorgesehen werden, in der keine Punkte vorkommen dürfen. Dadurch wird eine visuelle Grenze zwischen den Werten erzeugt.
Bei Jitter-Diagrammen sollten zusätzlich angeführt werden, dass die Punkte von den tatsächlichen Werten abweichen.
Die Pufferzone sollte bei ganzzahligen Werten .4 breit sein, damit eine ausreichend grosse visuelle Grenze wahrgenommen werden kann. Daraus ergibt sich ein Bereich von ±0.3 um den tatsächlichen Wert für den Darstellungsbereich.
Für ein Jitter-Diagramm müssen alle Werte zufällig vom tatsächlichen Wert ein klein wenig verschoben werden. Damit vermieden wird, dass zu viele Werte exakt übereinander dargestellt werden, wird also für jeden Wert in den Daten ein eigener Zufallswert bestimmt. Dieser Wert muss im Intervall zwischen -0.3 und 0.3 liegen (s. Praxis-Box).
Der zweite Parameter ist immer 2
, weil eine X- und eine Y-Achse vorliegt. Anschliessend werden diese Verschiebungen auf die tatsächlichen Werte addiert. Diese neuen Werte bilden die Grundlage für das Diagramm, dass wie oben beschrieben als Punktdiagramm erstellt wird.
Beispiel 16.1 (Pufferwerte addieren) Dieses Beispiel nimmt an, dass die beiden Vektoren an den Adressen A1 und B1 beginnen.
Im ersten Schritt werden die Werte für den Darstellungsbereich um den ursprünglichen Wert erzeugt.
= ZUFALLSMATRIX(zeilen(A1#); 2; -0.3; 0.3)
Im zweiten Schritt werden diese Verschiebungen auf die Werte addisert.
= A1#:B1# + D1#
Das Ergebnis ist ein Bereich, der visualisiert werden kann.
16.2.7 Blasendiagramm
Blasendiagramme sind Punktdiagramme mit drei dargestellten Merkmalen.
Für Blasendiagramme gelten die gleichen Optionen und Konfigurationen, wie für Punktdiagramme.
Weil drei Merkmale kodiert werden, müssen die Daten in drei Spalten vorliegen. Dabei wird die linke Spalte für die X-Achse verwendet. Die mittlere Spalte wird für die Y-Achse verwendet. Die rechte Spalte enthält die Werte für die Grösse der Punkte. Prinzipiell lassen sich die Werte nachträglich noch umorganisieren, oft ist es aber einfacher, die Spalten vorher anzuordnen.
Eine Datenreihe eines Blasendiagramms besteht aus drei Merkmalen.
In Blasendiagrammen lassen sich die Grössenwerte auf zwei Arten abbilden:
- Über den Durchmesser der Kreise.
- Über die Fläche der Kreise.
Wird der Durchmesser gewählt, werden die Kreise für grössere Werte schneller grösser als bei der Einstellung, über die Fläche zu kodieren. Die Kodierung über den Durchmesser ist sinnvoll, wenn nur ein kleiner Wertebereich (3-5) mit dicht zusammenliegenden Werten dargestellt werden muss. In allen anderen Fällen sollte die Kodierung über die Fläche der Kreise erfolgen.
Die Blasengrösse wird konfiguriert, indem zuerst auf einen Kreis mit der Maus geklickt wird und anschliessend unter Datenreihen formatieren unter Reihenoptionen
die Strategie für die Blasengrösse angepasst wird (Abbildung 16.36)
16.2.8 Linien-, Kreis- und Donutdiagramme
Linien-, Kreis- und Donutdiagramme sind in Excel Varianten von Balkendiagrammen: Sie verwenden das gleiche Format für die Datenreihen und werden ansonsten gleich konfiguriert. Wie bei Balkendiagrammen, wird die X-Achse als eine diskrete Datenskalierung behandelt. Die Daten können also nominal- oder ordinalskaliert sein.
Kreis- und Donutdiagramme sind identisch mit Balkendiagrammen, wenn alle Werte positiv sind. Für mehr als drei Werte können die meisten Menschen sich diese Diagramme oft nicht richtig interpretieren. Deshalb sollten Kreis- und Donutdiagramme möglichst nur zur Darstellung (extremer) Mengenverhältinisse verwendet werden. Grundsätzlich ist ein Balkendiagramm einem Kreis- oder Donutdiagramm vorzuziehen. (s. Abbildung 16.37 und Abbildung 16.38)
Excels Liniendiagramme zeichnen für jeden Wert auf der Y-Achse einen Punkt und verbinden die Punkte mit geraden Linien.
Weil die X-Achse immer diskrete Daten abbildet, dürfen Liniendiagramme nicht mit Punktdiagrammen mit interpolierten Linien verwechselt werden.
Excels Liniendiagramme sollten nur für sog. Paralleldiagramme verwendet werden, in denen mehrere diskrete Merkmale mit dem gleichen Wertebereich gegenübergestellt werden. Durch die Linien werden Unterschiede in den Ausprägungsprofilen sichtbar.
Abbildung 16.39 zeigt ein solches Paralleldiagramm. Dieses Beispiel macht die Grenzen dieses Diagrammtyps sichbar, weil Excel sich überlagernde Linien nicht nebeneinander darstellen kann.
Eine Variante von Paralleldiagrammen sind sog. Netzdiagramme (bzw. Spider-Web-Diagramme).
Netzdiagramme ordnen die Kategorien der X-Achse sternförmig an.
In Excel finden sich Netzdiagramme unter der Kategorie Wasserfalldiagramme
. Diese Diagramme werden oft zum Vergleich von Merkmalsprofilen verwendet, z.B. als Ergänzung einer Stärken- und Schwächen-Analyse (SWOT-Analyse)
16.3 Mathematische Funktionen visualisieren
Mathematische Funktionen werden immer über Punktdiagramme oder Punkte mit interpolierten Linien dargestellt.
Excel kann mathematische Funktionen nicht direkt visualisieren. Stattdessen müssen die Funktionen für einen gewünschten Wertebereich berechnet werden. Dazu werden Punkte auf der X-Achse ausgewählt und berechnet. Zwischen diesen Punkten berechnet Excel die Funktion nicht, sondern verbindet diese Punkte nur durch eine Linie. Diese Linie muss keine Gerade sein. Stattdessen versucht Excel eine Kurve so durch einen Punkt zu legen, sodass die Kurve keine Ecke hat. Die Folge dieses Verbinden von Punkten ist, dass je weniger Werte auf der X-Achse ausgewählt werden, desto ungenauer wird die Funktionsdarstellung.
Um eine mathematische Funktion mit Excel zu visualisieren, muss eine Wertetabelle erstellt werden. Diese Tabelle wird in den folgenden Schritten erstellt.
- Die Unter- und Obergrenze des Darstellungsbereichs auf der X-Achse werden festgelegt.
- Aus diesen Intervallgrenzen wird die Differenz gebildet, woraus sich die Länge des Intervalls ergibt.
- Die Anzahl der Punkte in diesem Intervall festgelegt.
- Die Länge des Intervalls wird durch die Anzahl der Punkte geteilt. Daraus ergibt sich der Abstand der Punkte im Intervall.
- Es wird eine Sequenz mit einer Länge der Anzahl der Punkte plus Eins gebiltet. Der Startwert dieser Sequenz ist die Untergrenze des Darstellungsbereichs. Die Schrittweite entspricht dem Abstand der Punkte Abstand der Punkte.
- Die mathematische Funktion wird als Formel in die Spalte rechts neben der Sequenz eingegeben. Die Werte der Sequenz werden als Argumente der mathematischen Funktion verwendet.
Die Sequenz für die Wertetabelle muss die Anzahl der Punkte plus Eins enthalten, damit sowohl die Untergrenze als auch die Obergrenze des Darstellungsbereichs als Argumente verwendet werden.
Sollen mehrere Funktionen über das gleiche Intervall dargestellt werden, dann wird der letzte Schritt für jede zusätzliche Funktion wiederholt werden. Das Intervall der Funktionsargumente bildet immer die erste Wertespalte. Anschliessend wird die gesamte Wertetabelle visualisiert.
Diese Wertetabelle kann als Punktdiagramm dargestellt werden. Dazu wird die gesamte Wertetabelle markiert und als Punkte mit interpolierten Linien visualisiert.