AP 4

graphisch-interakive Visualisierung

Die graphisch–interaktive Visualisierung spielt eine wichtige Rolle bei der Auswertung und Kommunikation von Gensequenzdaten. Weit verbreitete Darstellungsformen sind neben reinen Textdarstellungen, 1D– oder 2D– Graphen, Diagramme sowie verschiedene Formen von Glyphen. Die dreidiemensionale Darstellung der Doppelhelix auf molekulare Ebene lässt sich aus der Sequenz ableiten.

Die Untersuchung sowie der Vergleich verschiedener Sequenzalignments ist von besonderer Bedeutung für die Genomanalyse. Zu diesem Zweck werden verschiedene Darstellungsmöglichkeiten wie Texturen, Pfeildiagramme oder 1D–Linienplots zur Visualisierung und Identifizierung von Strukturen, Ähnlichkeiten und Abweichungen in biologischen Sequenzen zur Verfügung. Zur Auswertung von Genexpressionensdaten werden u.a. Clusteralgorithmen verwendet die eine hierarchische Ordnung oder Partitionierung der Daten ermöglichen, welche sich in tabellarischer Form als sogenannte Heatmaps visualisieren lassen. Mittels Farbkodierungen werden Gruppierungen und Aktivitäten dargestellt. Zusätzliche Informationen, wie z.B. abgeleitete statistische Größen lassen sich durch Höhenskalierungen und Parallele Koordinatenplots (PKP) visualisieren.

Neben der Visualisierung von Expressionsmustern spielt zudem die Darstellung von Spleißvarianten eine wichtige Rolle bei der Genomanalyse. Zur Visualisierung alignierter NGS–Sequenzen durch Gegenüberstellung oder gleichzeitigen Anzeige.

Ferner ist die Nutzung dieser Darstellungen nur im Zusammenspiel mit sehr großen unkomprimierten Sequenzdatensätzen möglich, was den Kreis der möglichen Nutzer auf User mit Zugang zu sehr leistungsstarken Rechnern einschränkt. Für die praktische Verwendung wäre es dagegen interessant, auch eine Client–seitige Visualisierung zu ermöglichen, für deren Nutzung kein Expertenwissen und kein Zugang zu HPC–System notwendig sind. Generell sind zur Extraktion der relevanten Informationen leistungsfähige und benutzerfreundliche Visualisierungs– und Interaktionswerkzeuge erforderlich, welche die menschlichen Kognitionsfähigkeiten in optimaler Weise unterstützen und somit Engpässe in der Auswertung und Nutzung der Daten vermindern.

Bundesministerium für Bildung und Forschung

Förderkennzeichen
01IH11003A;
01.06.2011 - 31.05.2014