edoc-Server des Robert Koch-Instituts

Dissertation

Autor(en): Martin Michael Serenus Lindner
Titel: Computational methods for the identification and quantification of microbial organisms in metagenomes
Gutachter: Bernhard Renard; Tobias Marschall
Betreuer: Bernhard Renard
Hochschule: Freie Universit├Ąt Berlin
Erscheinungsdatum: 01.08.2014
Volltext: pdf (urn:nbn:de:0257-10038768)
Fachgebiet(e): Medizin
Schlagwörter (eng): bioinformatics, metagenomics, taxonomic profiling
Metadatenexport: Um den gesamten Metadatensatz im Endnote- oder Bibtex-Format zu speichern, klicken Sie bitte auf den entsprechenden Link. Endnote   Bibtex  

Abstract (eng):
Metagenomics allows analyzing genomic material taken directly from the environment. In contrast to classical genomics, no purification of single organisms is performed and therefore the extracted genomic material reflects the composition of the original microbial community. The possible applications of metagenomics are manifold and the field has become increasingly popular due to the recent improvements in sequencing technologies. One of the most fundamental challenges in metagenomics is the identification and quantification of organisms in a sample, called taxonomic profiling.

In this work, we present approaches to the following current problems in taxonomic profiling: First, differentiation between closely related organisms in metagenomic samples is still challenging. Second, the identification of novel organisms in metagenomic samples poses problems to current taxonomic profiling methods, especially when there is no suitable reference genome available.

The contribution of this thesis comprises three major projects. First, we introduce the Genome Abundance Similarity Correction (GASiC) algorithm, a method that allows differentiating between and quantifying highly similar microbial organisms in a metagenomic sample. The method first estimates the similarities between the available reference genomes with a simulation approach. Based on the similarities, GASiC corrects the observed abundances of each reference genome using a non-negative lasso approach. In several experiments we showed that the abundance estimates are highly accurate and reduce the error compared to current approaches by 5% to 60%. The approach was also successfully applied to metaproteomics.

In the second project, we developed a statistical framework to fit mixtures of discrete distribution functions to the histograms of sequencing coverage depth after mapping metagenomic reads to reference genomes. We tailored a family of distributions for this particular application and modified the expectation-maximization algorithm to also fit discrete distributions when maximum likelihood estimation of the distribution parameters is not directly possible. The most important application of our framework is the genome validity score that measures how suitable a reference genome is for a particular (metagenomic) dataset.

In the third project, we developed a taxonomic profiling tool, called MicrobeGPS. In contrast to previous approaches, MicrobeGPS identifies and characterizes organisms in a metagenome even if there are no suitable reference genomes available. Distances to existing reference genomes are measured with the genome validity score and allow the user to spot organisms for which the available reference genomes are insufficient. We demonstrated on gold standard and real metagenomic data that our approach is more accurate than other existing methods, provides more meaningful results, and handles complex microbial communities.

Taken together, these three projects enhance the current repertoire of computational methods for taxonomic profiling and enable the simultaneous quantification of highly related organisms and the identification and characterization of unknown organisms in complex metagenomic datasets.
Nutzungsbedingungen
Für Dokumente, die in elektronischer Form auf diesem Dokumentenserver bereitgestellt werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Vor allem gilt, dass die Dokumente zu wissenschaftlichen Zwecken und zum Eigengebrauch zitiert, kopiert, abgespeichert, ausgedruckt und weitergegeben werden dürfen (§53 UhrG), es sei denn, dem einzelnen Dokument sind abweichende und dann allein maßgebliche Nutzungsbedingungen vorangestellt. Jede kommerzielle Nutzung der Dokumente, auch von Teilen und Auszügen, ist ohne vorherige Zustimmung des Urhebers/Autors untersagt.
Terms of use
Documents which are provided on this repository are subject to strict copyright conditions. This applies in particular to the following: the documents made available on this publication server may be cited, copied, saved, printed and passed on for scientific purposes and private use (§53 German Copyright Law), unless the individual document is preceded by deviating and then exclusively applicable terms and conditions of use. Any commercial use of the documents, even in part and excerpts, is prohibited without the prior written consent of the creator.
Zugriffsstatistik: Die Daten für die Zugriffsstatistik der einzelnen Dokumente wurden aus den durch AWSTATS aggregierten Webserver-Logs erstellt. Sie beziehen sich auf den monatlichen Zugriff auf den Volltext sowie auf die Startseite.
 
Bei Formatversionen eines Dokuments, die aus mehreren Dateien bestehen (insbesondere HTML), wird jeweils der monatlich höchste Zugriffswert auf eine der Dateien (Kapitel) des Dokuments angezeigt.
 
Um die detaillierten Zugriffszahlen zu sehen, fahren Sie bitte mit dem Mauszeiger über die einzelnen Balken des Diagramms.
Startseite: 11 ZugriffePDF: 18 ZugriffeStartseite: 8 ZugriffePDF: 16 ZugriffeStartseite: 11 ZugriffePDF: 14 ZugriffeStartseite: 13 ZugriffePDF: 9 ZugriffeStartseite: 16 ZugriffePDF: 28 ZugriffeStartseite: 12 ZugriffePDF: 22 ZugriffeStartseite: 11 ZugriffePDF: 41 ZugriffeStartseite: 16 ZugriffePDF: 19 ZugriffeStartseite: 18 ZugriffePDF: 50 ZugriffeStartseite: 17 ZugriffePDF: 20 ZugriffeStartseite: 22 ZugriffePDF: 33 ZugriffeStartseite: 23 ZugriffePDF: 30 ZugriffeStartseite: 25 ZugriffePDF: 27 ZugriffeStartseite: 26 ZugriffePDF: 32 ZugriffeStartseite: 34 ZugriffePDF: 40 ZugriffeStartseite: 33 ZugriffePDF: 39 ZugriffeStartseite: 22 ZugriffePDF: 18 ZugriffeStartseite: 75 ZugriffePDF: 34 ZugriffeStartseite: 86 ZugriffePDF: 35 ZugriffeStartseite: 15 ZugriffePDF: 24 ZugriffeStartseite: 18 ZugriffePDF: 30 ZugriffeStartseite: 20 ZugriffePDF: 25 ZugriffeStartseite: 22 ZugriffePDF: 24 ZugriffeStartseite: 21 ZugriffePDF: 29 Zugriffe
Jun
15
Jul
15
Aug
15
Sep
15
Oct
15
Nov
15
Dec
15
Jan
16
Feb
16
Mar
16
Apr
16
May
16
Jun
16
Jul
16
Aug
16
Sep
16
Oct
16
Nov
16
Dec
16
Jan
17
Feb
17
Mar
17
Apr
17
May
17

Gesamtzahl der Zugriffe seit Jun/2015:

  • Startseite – 575 (23.96 pro Monat)
  • PDF – 657 (27.38 pro Monat)
  •  
Generiert am 27.06.2017, 12:35:33