1 Einleitung
2 Entwurfsmethodik
3 Auswertungsmethodik
4
Realisierung
5
Diskussion
Literatur
Für die qualitativ hochwertige Visualisierung von Datensätzen ist die Funktionalität des verwendeten Visualisierungssystems nicht alleine ausschlaggebend: Visualisieren heißt immer auch Entwerfen und ist damit ein kreativer und wissensintensiver Prozeß. In den heutigen Visualisierungssystemen fehlt jedoch dieses graphische Wissen, das eigentlich zu den Visualisierungsverfahren gehört und für deren sinnvollen Einsatz notwendig ist. Schon seit einigen Jahren wird an der Entwicklung intelligenter Assistenten gearbeitet, die Benutzer bei der Auswahl geeigneter Visualisierungsverfahren unterstützen [Mack86b, ZhBu95]. Beschränkten sich diese Assistenten in der Anfangszeit noch darauf, Visualisierungen alleine aufgrund der Datensatzcharakteristika zu bewerten, so wird heute versucht, weitere Faktoren wie die Zielsetzung der Visualisierung [WeLe90, Robe91] und die Fähigkeiten der Betrachter [DoGu94] zu berücksichtigen.Insbesondere die Zielsetzung oder Aufgabenstellung ist von großer Bedeutung: eine Visualisierung kann bezüglich einer Aufgabe (z.B. dem Vergleich von Werten einer Variable) sehr effektiv und bezüglich einer anderen Aufgabe (z.B. dem Erkennen der globalen Verteilung der Variable) uneffektiv sein. Um die Aufgabe in der Bewertung von Visualisierungen zu berücksichtigen, benötigt ein intelligenter Assistent Wissen über die relative Effektivität der Visualisierungsverfahren für die verschiedenen Aufgaben.Das wissensbasierte System VIZARD erfüllt diese Kriterien eines intelligenten Assistenten und unterstützt den Benutzer eines Geo-Informationssystems beim Entwerfen aussagekräftiger Visualisierungen. Es enthält eine Wissensbank mit Regeln für den Entwurf graphischer Darstellungen und für den zielgerichteten Einsatz graphischer Variablen wie Farbe, Textur und Form. Ein besonderer Aspekt dieses Systems ist, daß die Effektivität von Visualisierungen explizit in Form von Fuzzy-Mengen modelliert und in einem Auswertungsschema abgeschätzt wird. Dadurch können die für die Effektivität maßgeblichen Parameter, wie die Aufgabenstellung der Visualisierung, die verfügbaren Ausgabemedien und die speziellen Eigenschaften der Zielgruppe angemessen berücksichtigt werden.
VIZARD implementiert eine Methodik für den automatisierten Visualisierungsentwurf in Geo-Informationssystemen, die die Ausdrucksfähigkeit und Effektivität von Visualisierungen sicherstellt. Ausgangspunkt dieser Methodik ist die Kompositionsalgebra von Mackinlay, die in verschiedenen intelligenten Visualisierungssystemen eingesetzt wurde [Mack86a, RoMa90, Casn91, SeIg94]. Sie unterscheidet sich von Mackinlays Ansatz vor allem durch die gleichzeitige Verarbeitung mehrfacher Entwürfe (in Abb. 1 durch die parallelen Pfeile angedeutet), durch eine zwischengeschaltete Phase der Parameteroptimierung und durch eine explizite, abschließende Phase der Effektivitätsauswertung. Durch das Erzeugen mehrfacher Entwürfe kann der Benutzer zwischen einer ganzen Reihe effektiver Visualisierungen die passendste auswählen.Die Methodik umfaßt insgesamt vier Phasen:

Der Datensatz wird zunächst mit den Ausdrucksregeln aller verfügbaren Visualisierungstechniken verglichen. Jedesmal wenn eine Teilrelation des Datensatzes die Ausdruckskriterien einer Technik erfüllt, wird eine Visualisierung erzeugt. Die so erzeugten Visualisierungen heißen primitiv, da sie jeweils nur genau eine Visualisierungstechnik verwenden. Sie heißen zusätzlich partiell, wenn sie nur einen Teil des Datensatzes ausdrücken, bzw. vollständig, wenn sie den gesamten Datensatz ausdrücken.Abb. 2 zeigt diese Phase des primitiven Visualisierungsentwurfs beispielhaft für die RelationKlima: Bezirk, Monat -> Niederschlag, Temperaturdie aus zwei unabhängigen Variablen Bezirk und Monat und zwei abhängigen Variablen Niederschlag und Temperatur besteht. Hier erfüllt beispielsweise die Teilrelation Bezirk -> Niederschlag sowohl die Ausdruckskriterien der Visualisierungstechnik Choroplethenkarte als auch die der Kreissignaturenkarte.


Abb. 4 zeigt, wie in der Kompositionsphase Teilvisualisierungen von Klima wiederholt zusammengesetzt werden, um vollständige Visualisierungen der Relation zu erhalten.

In der dritten Phase wird jede vollständige Visualisierung traversiert und die offenen Parameter aller enthaltenen primitiven Visualisierungen bestimmt. Zu den Parametern von Visualisierungstechniken zählen vor allem die visuelle Ausgestaltung mit Signaturen und Farben sowie die Datenklassifizierung bei quantitativen Techniken. Unter Verwendung entsprechender Regeln werden die Parameter für jede vollständige Visualisierung optimiert und zugewiesen.
Als abschließende Phase folgt eine Auswertung der Effektivität aller vollständigen Visualisierungen. Dazu werden sie erneut traversiert und die Effektivität der enthaltenen primitiven Visualisierungen sowie die Effektivität der durchgeführten Kompositionen bestimmt. Es stehen Regeln zur Verfügung, die die Effektivität von Visualisierungen bezüglich der verschiedenen Faktoren wie Visualisierungszielsetzung, Medium, Zielgruppe, etc. bewerten. Mit einem Auswertungsschema (ausführlich in Kapitel 3 dargestellt) wird aus diesen partiellen Effektivitätswerten eine Abschätzung über die Gesamteffektivität jeder vollständigen Visualisierung gewonnen. Danach lassen sich die Visualisierungen bezüglich ihrer Effektivität in eine eindeutige Reihenfolge bringen.Betrachtet man die Reihenfolge der vier Phasen dieser Methodik, stellt sich die Frage, warum die Parameterzuweisung und Effektivitätsauswertung primitiver Visualisierungen erst im Anschluß an die Kompositionsphase erfolgt. Eine optimale Zuweisung der Parameter einer Teilvisualisierung kann erst dann erfolgen, wenn bekannt ist, mit welchen Kompositionsoperationen sie in die vollständige Visualisierung aufgenommen wird. Werden z.B. zwei Choroplethen überlagert, muß sichergestellt sein, daß die verwendeten Farbsignaturen auch in der Überlagerung noch erkennbar und eindeutig zuzuordnen sind. Die Effektivitätsauswertung schließlich kann erst nach der Zuweisung der Visualisierungsparameter erfolgen, da die Wahl der Parameter wie Farben, Signaturen und Klassenaufteilungen einen Einfluß auf die Effektivität hat.
Sind die ersten drei Phasen der Entwurfsmethodik abgeschlossen, wurden bereits alle im Entwurfsraum enthaltenen Visualisierungen der Relation erzeugt und ihre Parameter vollständig festgelegt. Als abschließende Phase evaluiert die Effektivitätsauswertung diese Visualisierungen und bringt sie in eine eindeutige Reihenfolge bezüglich ihrer Effektivität. Die effektivste Visualisierung kann anschließend automatisch gerendert werden.
Die Effektivität einer Visualisierung ist ein Maß dafür, wie gut diese ihre Aufgabenstellung erfüllt. Da Aufgabenstellungen jedoch auch komplex und widersprüchlich sein können, ist eine lineare Skala allein zur Modellierung von Effektivität nicht ausreichend. VIZARD setzt deswegen Fuzzy-Mengen [Zade65] als Repräsentationsform für Effektivität ein. Abb. 5 zeigt eine solche Fuzzy-Repräsentation einer "guten" Effektivität. Sie wird nicht durch einen scharfen Wert, sondern durch eine Zugehörigkeitsfunktiondargestellt. Widersprüchlichkeiten in der Effektivitätsbewertung ebenso wie Unsicherheiten lassen sich durch charakteristische Kurvenverläufe ausdrücken.

Um die Fuzzy-Effektivität auch in den Regeln des Visualisierungs-Entwurfssystems einsetzen zu können, wurde eine linguistische Variable "Effektivität" definiert. Sie umfaßt fünf Hauptgrade der Effektivität: terrible, bad, average, good und excellent. Bad und good können durch die Zusätze very oder slightly modifiziert (verstärkt bzw. abgeschwächt) werden. Eine Aussage über die relative Sicherheit bzw. Unsicherheit der Effektivitätsbewertung erreicht man durch die Zusätze certainly und probably:

Abb. 7 zeigt die Wirkung der Modifikatoren: Probably bewirkt eine Dilation, d.h. die Kurve wird gestreckt und die Fuzzy-Menge damit unschärfer. Analog dazu bewirkt certainly eine Konzentration, die Kurve wird gestaucht und die Fuzzy-Menge schärfer.

Besteht die Aufgabenstellung einer Visualisierung aus mehreren "primitiven" Aufgaben mit unterschiedlicher Gewichtung, so können zur Ermittlung einer Gesamteffektivität die Teileffektivitäten bezüglich der verschiedenen Aufgaben entsprechend ihres Gewichtes addiert werden. Die gewichtete Summe der Fuzzy-Effektivitäten Ei ist über die gewichtete Summe ihrer Zugehörigkeitsfunktionendefiniert:

Abb. 8 zeigt ein Beispiel für eine solche gewichtete Summe von Effektivitäten. Durch die Flächennormierungmit konstantem Wert c wird gewährleistet, daß jede Fuzzy-Menge entsprechend ihres Gewichts in die Summe einfließt. Wären die Summanden nicht Flächen- sondern Maximum-normiert, würden nicht nur die Gewichte, sondern auch die unterschiedlichen Flächeninhalte der Zugehörigkeitsfunktionen ihren Anteil an der Summe bestimmen. Die Gewichtung der Summe wäre somit verfälscht.Gilt für die Gewichte , dann ist auch die gewichtete Summe wieder flächennormiert, wie aus der Additionsregel für Integrale folgt.
Zunächst einmal ist die Effektivität verschiedener Visualisierungstechniken stark von der Zielsetzung der Visualisierung abhängig. Betrachtet man z.B. die Aufgaben einer Visualisierung, kann eine Choroplethenkarte desselben Datensatzes einerseits sehr effektiv (für das Erkennen räumlicher Verteilungen) aber auch uneffektiv (für das Ablesen einzelner Werte) sein. Regelwerke und Lehrbücher über Visualisierungsmethodik geben über diese verschiedenen Verwendungsarten der Techniken zumindest qualitative Aussagen [Bert74, Dent96, Imho71, Monm91, Tyne92]Als weitere Faktoren für die Bewertung der Visualisierungseffektivität sind die Charakteristika der Benutzer und der Ausgabemedien zu beachten. Hier läßt sich jedoch festhalten, daß diese Elemente des Visualisierungskontexts innerhalb einer Visualisierungssitzung typischerweise wesentlich weniger variieren werden als die Interpretationsabsichten oder andere Aspekte der Zielsetzung. Dies schlägt sich auch in der Diskussion der Visualisierungseffektivität in Lehrwerken nieder: gewöhnlich wird zunächst von individuellen Unterschieden abstrahiert und die Effektivität für einen "Standard-" Benutzer und das "typische" Ausgabemedium betrachtet. Auf die Berücksichtigung von abweichenden Benutzern, anderen Medien und anderen Umgebungen wird dann in einer gesonderten Diskussion eingegangen.Ein vergleichbares Vorgehen ermöglicht auch in der automatisierten Auswertung von Visualisierungseffektivität, alle entscheidenden Faktoren zu berücksichtigen. Dazu wird, ausgehend von den Interpretationsabsichten und anderen Aspekten der Zielsetzung zunächst eine Standardeffektivität der Visualisierung ermittelt. Dazu stehen Regeln zur Verfügung, die die Visualisierungseffektivität in einen Standardkontext bewerten. Dieser Kontext beschreibt einem Standardbenutzer, ein Standardausgabemedium und eine standardmäßige Softwareumgebung. Beim Standardbenutzer wird man z.B. davon ausgehen, daß er über eine durchschnittliche visuelle Wahrnehmung verfügt. Charakteristika, die von diesem Standardkontext abweichen, sogenannte Ereignisse, werden durch gesonderte Regeln behandelt. Diese Ereignisregeln beschreiben, wie die abweichende Situation die Standardeffektivität der Visualisierung verändert.
Zur Gewinnung quantitativer Effektivitätsmaße wurde eine Reihe von Tests durchgefürt, die die relative Effektivität einiger GIS-Visualisierungsverfahren für verschiedene Aufgaben anhand einer Stichprobe der Zielgruppe messen [Jung97]. Das Grundprinzip der Effektivitätstests lag darin, einer Testperson die gleiche Aufgabe für die verschiedenen Visualisierungsformen unter identischen Bedingungen wiederholt vorzulegen und anschließend zu vergleichen, wie gut die Aufgabe jeweils gelöst werden konnte. Dazu wurde für jede Testaufgabe ein Fehlermaß definiert und der durchschnittliche Fehler pro Aufgabe und Visualisierungsform bestimmt.

Tabelle 1 stellt einige der gefundenen Standardeffektivitäten zusammen. Für das Ablesen und das Finden von Werten hat sich die Balkendiagrammkarte als das beste Verfahren herausgestellt, für das Vergleichen von Werten die Kreissignaturenkarte und für das Erkennen der geographischen Verteilung die Choroplethenkarte. Die getestete Form der bivariaten Choroplethen (Farbton und Farbsättigung bilden jeweils eine Dimension) schnitt für die meisten Aufgaben schlecht ab und war im allgemeinen schwerer verständlich. Nur zum Finden von Werten und zum Erkennen von Verteilungen ist ihr Einsatz sinnvoll. (Getestet wurden jeweils die unklassifizierten Formen dieser Visualisierungsverfahren.)
Standardeffektivität
Am Anfang der Auswertung einer komplexen Visualisierung steht die Ermittlung der Standardeffektivität aller enthaltenen primitiven Visualisierungen. Dazu stehen für jede der primitiven Techniken Regeln zur Verfügung, die die Effektivität bezüglich der verschiedenen Visualisierungsaufgaben aus der Tabelle der Meßergebnisse ablesen und zuweisen. Benutzer können mehrere Aufgaben gleichzeitig anfordern und diese auch gewichten. Zur Ermittlung der Standardeffektivität werden die entsprechenden Teileffektivitäten gewichtet summiert.Auf eine primitive Visualisierung V treffen genau diejenigen Aufgaben Zi zu, die eine oder mehrere abhängige Variablen von V referenzieren. Die Standardeffektivität PEff*(V | Zi) von V bezüglich Zi wird aus der entsprechenden Regel ermittelt und mit dem Gewicht wi von Zi skaliert. Eine Summation für alle zutreffenden Visualisierungsaufgaben ergibt die Standardeffektivität von V:Ereignisse und primitive Effektivität
Ist die Standardeffektivität einer primitiven Visualisierung bestimmt, muß im nächsten Schritt die Erkennung und Behandlung von Ereignissen erfolgen. Als Ereignis werden alle Bedingungen bezeichnet, die sich von den Voraussetzungen der Standardeffektivitätsregeln signifikant unterscheiden. Dazu zählen natürlich in erster Linie die Abweichungen vom Standardkontext.Es können aber auch Korrekturen der Standardeffektivität einer Visualisierungstechnik erforderlich sein, wenn sie die gestellte Aufgabe zwar primär erfüllt, die Semantik des Datensatzes aber nicht optimal repräsentiert. Dies kann zu mißverständlichen Interpretationen führen und sollte deswegen in der primitiven Effektivität berücksichtigt werden.Die folgende Regel behandelt einen solchen Fall. Sie korrigiert die Standardeffektivität der Kreissignaturen nach unten, wenn die dargestellte Variable nicht aus absoluten Zahlenwerten (wie durch die proportional großen Kreissignaturen suggeriert) sondern aus Dichten oder Verhältniszahlen besteht:IF V = Kreissignaturen(U->A) AND A besteht aus Dichten oder VerhältniszahlenTHEN Mod(V | Ek) = slightly less certain (slightly worse)Die in solchen Regeln zugewiesenen Korrekturwerte sind eher heuristischer Natur. Sie drücken eine Tendenz aus, beruhen aber nicht wie die Standardeffektivitäten auf Meßergebnissen. Sie schließen deshalb in der Regel auch eine Modifikation der Sicherheit des Wertes ein (slightly less certain).Treffen für eine primitive Visualisierung m Ereignisse E1, ..., Em zu, werden die Modifikationen Mod(V | Ek) bezüglich dieser Ereignisse sukzessive auf die Standardeffektivität von V angewendet. Es ergibt sich schließlich die Gesamteffektivität PEff(V) der primitiven Visualisierung V:
Die Auswertung der Effektivität einer vollständigen Visualisierung V erfolgt in ähnlichen Stufen wie die primitive Auswertung: zunächst werden die Effektivitäten der in V enthaltenen primitiven Visualisierungen gemäß ihrem Gewicht summiert. Anschließend werden alle zutreffenden Ereignisse ermittelt und die entsprechenden Modifikationen ausgeführt.Struktur-Ereignisse
Auch auf der Ebene der komplexen Visualisierungen können Ereignisse die Gesamteffektivität im positiven oder im negativen Sinn beeinflussen. Für den Standardfall einer idealen komplexen Visualisierung müssen unter anderem folgende Aussagen zutreffen:Visualisierungen sollten möglichst nicht mehrere unterschiedliche Techniken verwenden Visualisierungen sollen nur eine kleine Anzahl von Fenstern haben Animationssequenzen sollten nicht zu kurz sein die Bedeckung von Karten mit Symbolen sollte nicht zu groß sein (Stichwort: Generalisierung) Gesamteffektivität
Treffen die Ereignisse E1 bis Ek zu, ergibt sich insgesamt die folgende Gleichung für die komplexe Effektivität einer vollständigen Visualisierung V:
Arbeitet man mit Fuzzy-Mengen, ist es an bestimmten Stellen notwendig, aus der Fuzzy-Menge einen scharfen Wert abzuleiten. In der Fuzzy-Logik spricht man dabei von Defuzzifizierung. Beim Visualisierungsentwurf sind es im wesentlichen zwei Stellen, an denen aus den Fuzzy-Effektivitäten konkrete, scharfe Aussagen abgeleitet werden müssen. Zum einen ist es notwendig, alle ausdrucksfähigen Visualisierungen gemäß ihrer Effektivität zu ordnen, um den effektivsten Entwurf zu finden und um alternative Entwürfe in der richtigen Reihenfolge zu präsentieren. Zum anderen sollen Benutzer bei Erklärungen nicht mit der Fuzzy-Effektivität konfrontiert werden. Statt dessen sollte sie textuell dargestellt werden.Ordnungskriterien
Als Ordnungskriterium bietet sich zunächst der Schwerpunkt (CoG, center of gravity) der Fuzzy-Menge an. Er entspricht in etwa dem gewichteten Mittel der in die Fuzzy-Menge eingeflossenen Summanden und gibt damit die durchschnittliche Effektivität wieder. Der Schwerpunkt einer Fuzzy-Menge ist wie folgt definiert:Neben der durchschnittlichen Effektivität als Hauptmaß sind noch zwei weitere Eigenschaften der Fuzzy-Effektivität von Bedeutung: Die Definition einer Varianz für Fuzzy-Mengen kann an die statistische Varianz angelehnt werden. Sei CoG(E) der Schwerpunkt einer Fuzzy-Effektivität E, dann ist ihre Varianz definiert als:die Varianz:Ist sie hoch, dann ist die Effektivität relativ unscharf und der Durchschnittswert kann nicht als gesichert angenommen werden. Unscharfe Gesamteffektivitäten entstehen durch einen hohen Anteil unscharfer Teileffektivitäten, durch entsprechende Modifikationen (less certain) oder durch die Addition sehr gegensätzlicher Teileffektivitäten. der Anteil niedriger Effektivitätsgrade:Ist er hoch, dann hat die Visualisierung einen hohen Anteil an ineffektiven Aspekten. Selbst wenn ihre durchschnittliche Effektivität relativ hoch ist, sollte eine Visualisierung mit hohem Anteil niedriger Effektivitätsgrade abgewertet werden. Der Anteil niedriger Effektivitätsgrade läßt sich unter Verwendung einer Schranke s definieren. Er ist der Anteil der Gesamtfläche, der unter s liegt:

