Machine-Learning-basierte Prädiktion von Überlebens-Outcomes bei Patient:innen mit Lungen- und Kolorektalkarzinomen in späten Therapielinien
| dc.contributor.author | Deutsches Krebsforschungzentrum (DKFZ), Deutsches Konsortium für Translationale Krebsforschung (DKTK) | |
| dc.date.accessioned | 2025-12-23T10:23:39Z | |
| dc.date.available | 2025-12-23T10:23:39Z | |
| dc.date.issued | 2025-12 | none |
| dc.identifier.uri | http://edoc.rki.de/176904/13117 | |
| dc.description.abstract | Da Behandlungsleitlinien oftmals nur Erst- und Zweitlinientherapien abdecken, sollen in diesem Projekt flächendeckende Krebsregisterdaten (des ZfKD) genutzt werden, um die Diversität von Behandlungsstrategien in späten, nicht-leitlinienbasierten Therapielinien zu untersuchen. Dafür werden zwei Entitäten fokussiert: Das nicht-kleinzellige Lungenkarzinom (NSCLC) und das kolorektale Karzinom (KRK). Zur Vorverarbeitung des Datensatzes wird eine bereits bestehende Softwarelösung (aus Eigenentwicklung) zum Datenqualitäts-Assessment und Feature-Engineering verwendet. Mithilfe eines ebenfalls selbst entwickelten und von Expert:innen validierten Algorithmus zur Annotation von Therapielinien wird für jede:n Patient:in eine Sequenz systemischer Therapielinien rekonstruiert. Patient:innen mit ähnlichen demographischen und diagnostischen Merkmalen sowie frühen Therapieverläufen (1st Line, 2nd Line), werden ggf. in der Folge über ein Propensity-Score-basiertes Verfahren gematched. Darauf aufbauend werden im ersten Schritt deskriptive Statistiken über die abgebildete Kohorte (demografische, diagnostische, therapeutische Informationen, Follow-Up, Outcomes) sowie die späten, nicht-leitlinienbasierten Therapielinien berechnet. Zur Identifikation der häufigsten Substanzregime (späte Therapielinien) werden hierarchische Clustering-Methoden hinzugezogen. Darauffolgend werden Verfahren der Time-To-Event-Analyse (z.B. Kaplan-Meier, Cox Proportional Hazards Modell) angewandt, um einerseits den Effekt der gewählten späten Therapielinie auf das Gesamtüberleben (OS) / das progressionsfreie Überleben (PFS) zu berechnen; andererseits sollen für einen Vergleich Methoden des supervidierten maschinellen Lernens (z.B. Random Forest) eingesetzt werden, um OS und PFS zu prädizieren. Gegeben zeitlicher Ressourcen werden die im Rahmen des Projekts eingesetzte Software zur Datenkuration und -augmentierung veröffentlicht, sowie ein Report zur Datenqualität und den späteren Therapielinien erzeugt. Es wird angestrebt die Ergebnisse in einer internationalen, wissenschaftlichen Fachzeitschrift mit Peer-Review zu publizieren. Forschungsziel: - Algorithmische Annotation von späten systemischen Therapielinien (ab der dritten Therapielinie) bei Patient:innen mit NSCLC und KRK. - Exploration und Beschreibung der Varianz von späten, systemischen Therapielinien bei Patient:innen mit NSCLC und KRK. - Effektschätzung des Einflusses der gewählten, späten, nicht-leitlinienbasierten Therapielinien (ab der dritten Therapielinie) auf OS und PFS bei Patient:innen mit NSCLC und KRK anhand inferenzstatistischer Verfahren. - Prädiktion von OS und PFS mithilfe von supervidierten ML-basierten Methoden. | ger |
| dc.language.iso | ger | none |
| dc.publisher | Robert Koch-Institut | |
| dc.subject.ddc | 610 Medizin und Gesundheit | none |
| dc.title | Machine-Learning-basierte Prädiktion von Überlebens-Outcomes bei Patient:innen mit Lungen- und Kolorektalkarzinomen in späten Therapielinien | none |
| dc.type | StudyThesis | |
| dc.identifier.urn | urn:nbn:de:0257-176904/13117-0 | |
| dc.identifier.doi | 10.25646/13561 | |
| local.edoc.type-name | Studienarbeit |
