Bioinformatik und Biostatistik

Um die in SMART-CARE gewonnenen großen Datensätze zu integrieren und prädiktive Modelle für das Risiko eines Tumorrezidives zu entwickeln, sind Computer-gestützte und mathematische Methoden unerlässlich. In der Tumorgenomik werden in der klinischen Praxis bereits Genom/Exom, Transkriptom und Methylom Daten für die Patientenstratifizierung und die personalisierte Behandlung eingesetzt. Es wird erwartet, dass Proteom-, Metabolom- und Sekretom-Daten jedoch eine genauere Information über funktionelle Eigenschaften der Krebszellen liefern und damit durch Kombination mit Methoden des maschinellen Lernens als auch der mathematischen Modellierung Möglichkeiten eröffnen, das Risiko für ein Tumorrezidiv besser vorherzusagen. Für die Primäranalyse von Proteomik- und in geringerem Maße von Metabolomikdaten existieren etablierte Workflows. Die Integration der verschiedenen molekularen Untersuchungen untereinander und eine Verknüpfung mit klinischen Daten stellt jedoch eine große Herausforderung dar. In SMART-CARE adressieren die beteiligten theoretisch arbeitenden Teams Huber, Saez-Rodriguez und Höfer diese anspruchsvolle Aufgabe und verknüpfen in dem geplanten Arbeitsprogramm statistische Analysen (Huber) mit der Datenintegration durch Netzwerkanalysen (Saez-Rodriguez) und die Entwicklung mechanistischer Modelle für die Bestimmung der Aktivität von Signalwegen und Stoffwechselreaktionen (Höfer).

Team Huber

EMBL

Die Huber-Gruppe entwickelt und wendet die statistischen, computergestützten und bioinformatischen Methoden an, die erforderlich sind, um neuartige proteomische und metabolomische Datentypen zu analysieren, sie mit genetischen, transkriptomischen und klinischen Daten zu integrieren und neue Erkenntnisse über die Tumorbiologie, Anfälligkeiten, Resistenzmechanismen und Rückfälle zu gewinnen. Besonderes Augenmerk liegt auf der Entwicklung innovativer Methoden zur Qualitätsbewertung (QA) und Qualitätskontrolle (QC), die den erforderlichen Datenmengen und der Heterogenität gerecht werden und dazu beitragen, die Aufgabe der QA/QC so weit wie möglich zu automatisieren und zu objektivieren - eine zentrale Voraussetzung für den Einsatz von Proteomik und Metabolomik in der klinischen Forschung. Die Gruppe integriert Multi-omics-Daten mit Einzelzellauflösung (insbesondere CITE-Seq) mit massenspektrometrischen Proteom- und Metabolomdaten und räumlich aufgelösten Proteinebenen-Daten aus der Immunhistochemie, um die Heterogenität innerhalb des Tumors und ihre Auswirkungen auf unterschiedliche Arzneimittelreaktionen bei Blutkrebs besser zu verstehen. Zusammen mit den anderen computergestützten und datenwissenschaftlich orientierten Gruppen - Saez-Rodriguez und Höfer - entwickelt die Huber-Gruppe Verfahren und Techniken zur Integration der verschiedenen Modalitäten im Rahmen des SMART-CARE-Projekts.

Team Saez-Rodriguez

Universitätsklinik Heidelberg - Institute for Computational Biomedicine

Unser Team beschäftigt sich mit der Entwicklung neuer Ansätze zur Nutzung von Einzel- und Multi-Omic-Daten. Wir konzentrieren uns hauptsächlich darauf, neue Wege zu finden, um systematisch Vorwissen aus verschiedenen Quellen mit Omic-Daten zu integrieren, um mechanistische Hypothesen zu generieren (siehe Kinact (Wirbel et al, 2018), Omnipath (Türei et al, 2016), COSMOS (Dugourd et al, 2021), ocEAn (TBA)). Kinact ermöglicht die Abschätzung der Kinaseaktivität aus phosphoproteomischen Daten, Omnipath ist eine zentrale Anlaufstelle für Proteininteraktionen und -annotationen, während COSMOS es ermöglicht, mechanistische Verbindungen zwischen phosphoproteomischen und metabolomischen Daten herzustellen. Schließlich kann ocEAn metabolomische Daten mit metabolischen Enzymsignaturen integrieren. Solche Ansätze ermöglichen es uns, kontextabhängige biologische Deregulationen zu finden, die komplexe Krankheiten auslösen, und so neue und genauere Behandlungen zu finden.

Team Höfer

DKFZ Heidelberg - Theoretische Systembiologie B086

Wir entwickeln mechanistische mathematische Modelle von Signaltransduktionsnetzwerken und Stoffwechselwegen in Krebszellen. Dazu integrieren wir Massenspektrometrie-Daten zur Expression von Proteinen – Signalproteinen wie Kinasen und Phosphatasen oder Stoffwechselenzymen – mit Daten zu den Auswirkungen auf Proteinphosphorylierung oder Metabolitkonzentrationen. Damit wollen die Suche nach funktionellen molekularen Signaturen unterstützen, die prognostisch für den Verlauf von Krebserkrankungen und Therapieansätzen sind. Wir arbeiten eng mit anderen Bioinformatikern zusammen, insbesondere mit der Saez-Rodriguez-Gruppe, die strukturelle Netzwerkanalysen durchführt.

Nachwuchsforschgruppe Dr. Junyan Lu

Universitätsklinikum Heidelberg

Dr. Junyan Lu studierte computergestützte Biologie und Medikamentenentwicklung am Shanghai Institute of Material Medica, Chinese Academy of Sciences. Danach arbeitete er in der Gruppe von Wolfgang Huber am EMBL als Postdoc und später als wissenschaftlicher Mitarbeiter, wo er sich auf die Weiterentwicklung der Präzisionsonkologie von Blutkrebs durch die Integration von Multiomics-Daten konzentrierte. Seit Dezember 2021 ist Dr. Junyan Lu als Nachwuchsgruppenleiter am Universitätsklinikum Heidelberg und dem SMART-CARE-Konsortium tätig. Als Mitglied des SMART-CARE-Teams konzentriert sich seine Gruppe auf die Bereitstellung innovativer und robuster computergestützter Lösungen für die Auswertung und Integration von Massenspektrometriedaten, um Biomarker für das Fortschreiten und Wiederauftreten von Krebs zu identifizieren. Als ein in einem klinischen Umfeld eingebettetes Bioinformatik-Team arbeitet die Gruppe von Dr. Lu auch eng mit Ärzten und klinisch tätigen Wissenschaftlern zusammen, um ihre Suchergebnisse in eine bessere Patientenversorgung umzusetzen. Weitere Informationen über die Lu-Gruppe finden Sie unter Github.

YIG Junyan Lu

Yueyang Xie, Qianwu Liao, Caroline Lohoff, Shubham Agrawal, Junyan Lu, Shuo Wang (von links nach rechts)