Logo of Robert Koch InstituteLogo of Robert Koch Institute
Publication Server of Robert Koch Instituteedoc
de|en
View Item 
  • edoc-Server Home
  • Forschungsdaten
  • Öffentliches Verzeichnis über bewilligte Anträge auf Nutzung von Krebsregisterdaten
  • View Item
  • edoc-Server Home
  • Forschungsdaten
  • Öffentliches Verzeichnis über bewilligte Anträge auf Nutzung von Krebsregisterdaten
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.
All of edoc-ServerCommunity & CollectionTitleAuthorSubjectThis CollectionTitleAuthorSubject
PublishLoginRegisterHelp
StatisticsView Usage Statistics
All of edoc-ServerCommunity & CollectionTitleAuthorSubjectThis CollectionTitleAuthorSubject
PublishLoginRegisterHelp
StatisticsView Usage Statistics
View Item 
  • edoc-Server Home
  • Forschungsdaten
  • Öffentliches Verzeichnis über bewilligte Anträge auf Nutzung von Krebsregisterdaten
  • View Item
  • edoc-Server Home
  • Forschungsdaten
  • Öffentliches Verzeichnis über bewilligte Anträge auf Nutzung von Krebsregisterdaten
  • View Item
2022Studienarbeit DOI: 10.25646/9790
Prüfung der Validität komplexer Analysen mit synthetisierten Krebsregisterdaten
Fraunhofer Institut für Algorithmen und wissenschaftliches Rechnen (SCAI)
Ziel des Forschungsvorhabens ist es, publizierte Analysen der Krebsregisterdaten zum Glioblastom* mit synthetisierten Daten zu replizieren. Zweck des Forschungsvorhabens ist eine mögliche Nutzung von synthetisierten Daten in Situationen, wo eine Weitergabe von Mikrodaten (hier: Krebsregisterdaten) aus datenschutzrechtlichen Erwägungen heraus nicht oder nur unter besonderen Bedingungen erlaubt ist. Synthetisierte Daten könnten Datennutzern zur Verfügung gestellt werden, um Auswertungsskripte vorzubereiten, und darüber eine Auswertung in der datenhaltenden Stelle (z.B. dem ZfKD) zu ermöglichen, ohne Weitergabe der Originaldaten. Dabei wäre für komplexe Analysen eine Voraussetzung, dass die synthetisierten Daten wesentliche statistische Eigenschaften der Originaldaten besitzen, um z.B. eine Vorabprüfung von Modellannahmen zu erlauben. Die Generierung der synthetischen Daten erfolgt mittels eines generativen KI-Verfahrens, dass bereits mit klinischen Daten erfolgreich angewandt wurde: https://www.frontiersin.org/articles/10.3389/fdata.2020.00016/full Dieses Verfahren basiert auf der Theorie Bayes'scher Netze, welche wiederum eine spezielle Klasse probabilistischer graphischer Modelle darstellen. Bayes'sche Netze und unser darauf aufbauendes, Variational Autoencoder Modular Bayesian Network (VAMBN), genanntes Verfahren lernen die den Originaldaten zugrunde liegende multivariate statistische Verteilung. Dabei ist festzuhalten, dass die gelernte Verteilung im allgemeinen nicht repräsentativ für die Gesamtbevölkerung ist, sondern nur für den vorliegenden Datensatz. Durch zufälliges Ziehen aus der gelernten Verteilung werden synthetische Subjekte erzeugt, welche statistisch den originalen Patientendaten ähneln, diesen jedoch nicht genau entsprechen. *Efremov et al., Journal of Cancer Research and Clinical Oncology (2021) 147:3381–3390. doi: 10.1007/s00432-021-03596-5.
Cite
BibTeX
EndNote
RIS
No license information
Details
Terms of Use Imprint Policy Data Privacy Statement Contact

The Robert Koch Institute is a Federal Institute

within the portfolio of the Federal Ministry of Health

© Robert Koch Institute

All rights reserved unless explicitly granted.

 
DOI
10.25646/9790
Permanent URL
https://doi.org/10.25646/9790
HTML
<a href="https://doi.org/10.25646/9790">https://doi.org/10.25646/9790</a>