AP 3

Spezifikation, Design, Validierung der hochskalierenden Bibliothek

Wissenschaftliche Spitzenleistungen im Bereich der Genom-Analyse sind in immer stärkerem Maße an leistungsfähige Rechentechnik und Algorithmen im HPC-Sektor gekoppelt. Ein Ziel dieses Projektes (AP1 und AP2) ist es, grundlegende und häufig genutzte Algorithmen und Programmfunktionen aus der untersuchten Aufgabenklasse effizient zu parallelisieren und zu implementieren. Um die dabei entwickelten hochskalierenden Algorithmen einer großen Community möglichst unkompliziert verfügbar zu machen, wird in AP3 eine Bibliothek entwickelt, die diese Funktionsaufrufe kapselt. Die Nutzung dieser HPC-­?Bibliothek erleichtert den Wissenschaftlern den Zugriff auf Hochleistungscomputer und effiziente parallele Algorithmen, ohne ausgeprägtes Expertenwissen im Gebiet der Code-Parallelisierung und -Optimierung vorrauszusetzen. Auch die Visualisierungs- und Interaktionswerkzeuge, welche in AP4 entwickelt werden, sollen über eine Schnittstelle auf diese Bibliothek zugreifen können, um z.B. interaktiv und graphisch Analysen steuern zu können. Die Bibliothek wird zum Abschluss des Projekts unter einer Open-Source-Lizenz und mit zugehöriger API-Dokumentation der NGS-Community zur Verfügung gestellt.

Besonderer Wert soll im Zuge der Softwareentwicklung auf die Nachhaltigkeit gelegt werden. Die Nutzbarkeit und Verbreitung der entwickelten Bibliothek wird nicht zuletzt durch strukturiertes Software-Engineering gefördert. Ein wesentlicher Aspekt in diesem Arbeitspaket ist die Integration aller Projektpartner in die Spezifikation und Verifikation der Bibliothek: Durch die enge Kooperation von Partnern aus der Informatik und der Biologie wird die Verwertbarkeit der Software entscheidend gefördert und eine hohe Nachnutzbarkeit gewährleistet. Durch intensive Diskussion der Verbundpartner zu Beginn der Projektbearbeitung können unterschiedliche Anforderungen und Herangehensweisen analysiert und bei der Software-Entwicklung berücksichtigt werden. Das betrifft insbesondere Aspekte wie unterstützte Schnittstellen und Datenformate sowie die Qualität der Assemblierungsverfahren.

Die Integration von Institutionen in das Projekt, deren tägliche Arbeit das Sequenzieren ist, sorgt dafür, dass die Arbeiten unmittelbar genutzt werden. Damit ist eine direkte Rückkopplung der NGS-Community und optimale Dissemination sichergestellt.

Im Zuge der Projektbearbeitung wird in AP1 und AP2 die Einbeziehung von Beschleunigerkarten untersucht. Abhängig davon können auch in diesem Arbeitspaket (Teilaufgabe 3.1) Nachbesserungen notwendig werden.

Bundesministerium für Bildung und Forschung

Förderkennzeichen
01IH11003A;
01.06.2011 - 31.05.2014