Repository: Freie Universität Berlin, Math Department

Annotation und Interpretation von Varianten und Polymorphismen im humanen Genom

Jäger, Marten (2020) Annotation und Interpretation von Varianten und Polymorphismen im humanen Genom. PhD thesis, Freie Universität Berlin.

Full text not available from this repository.

Official URL: http://dx.doi.org/10.17169/refubium-26724

Abstract

Das Gesamtvolumen genomischer Sequenzierungsdaten nimmt, dank der Entwicklung der DNA-Hochdurchsatz-Sequenziertechniken, in den letzten Jahren in unglaublichem Tempo zu. Dies erweitert unser Wissen des humanen Genoms über dessen Aufbau, die Struktur und die räumliche Organisation. Die Erkenntnis um den komplexen Aufbau wird in naher Zukunft in die Interpretation von Variationen auch im klinischen Kontext einfließen müssen, birgt sie doch zahlreiche potentielle Möglichkeiten in der Diagnostik. Whole Genome Sequencing hat schon jetzt den Sprung aus den Forschungslaboren in die angewandte Diagnostik von Krankenhäusern geschafft und erlaubt damit die Einführung der Präzisionsmedizin für alle Patienten. Für eine optimale klinische Interpretation genomischer Varianten ist es wichtig, konsistente und passende Referenzen zu verwenden. Hierzu zählt neben der Auswahl des Referenzgenoms auch die verwendete Datenbank zur Annotierung von funktionalen Einheiten auf der DNA. Diese Arbeit geht auf zwei wichtige Schritte auf dem Weg zum Einsatz des WGS im klinischen Alltag ein. Der erste Schritt beinhaltet, möglichst schnell die gefundenen Varianten zu genomischen Eigenschaften und Featu- res (in Relation zu einer Referenz) zuzuordnen. Dies ist aufgrund der großen Datenmengen ein zunehmendes Problem geworden. Mit Jannovar wird hier eine Softwarebibliothek vorgestellt, welche hervorragend an diese Ansprüche angepasst ist. Die Bibliothek ist schnell, flexibel und kann leicht in Annotationspipelines und eigene Programme integriert werden. Die so annotierten und charakterisierten Veränderungen des Genotyps bilden eine Basis für die weitere Interpretation und Beurteilung durch andere Programme. Die Repräsentation der Genomreferenz entwickelt sich hin zu einem Graphengenom, um die populationsspezifische Variabilität zumindest ansatzweise abzubilden. Diese kann einen enormen Einfluss auf die Interpretation von Varianten haben. Im zweiten Schritt geht es darum, diese populationsspezifische Komplexität zu erläutern. Mit ASDPex wird ein heuristischer Algorithmus vorgestellt, welcher für WGS-Daten eines Individuums das Auftreten von alternativen Haplotypsequenzen vorhersagt. Dafür verwendet es die Verteilung der Allelfrequenzen der individuellen Varianten und gleicht sie mit einer Art Fingerabdruck aus haplotypspezifischen Varianten ab. Das Wissen um die alternativen Sequenzen kann die Verlässlichkeit der klinischen Interpretation weiter verbessern. Zukünftig wird es darum gehen, noch mehr Daten in die Varianteninterpretation zu integrieren, um noch mehr falsch positive/falsch negative Assoziationen zu verhindern und irrelevante Varianten herauszufiltern.

Item Type:Thesis (PhD)
Subjects:Mathematical and Computer Sciences > Computer Science
Divisions:Department of Mathematics and Computer Science > Institute of Computer Science > Algorithmic Bioinformatics Group
ID Code:2853
Deposited By: Anja Kasseckert
Deposited On:05 Sep 2022 13:47
Last Modified:05 Sep 2022 13:47

Repository Staff Only: item control page