Wie unterscheiden sich krebskranke von gesunden Zellen? Ein neuer Machine-Learning-Algorithmus kennt die Antwort. Das Programm hat eine charakteristische Gensignatur gefunden.
Um Krebszellen zuverlässig von gesunden Zellen zu unterscheiden, hat das Team um Dr. Altuna Akalin, Leiter der Technologieplattform „Bioinformatik und Omics-Datenwissenschaft“ am Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC), ein Machine-Learning-Programm namens „ikarus“ entwickelt. In den Tumorzellen fand das Programm ein krebsübergreifendes Muster, bestehend aus einer charakteristischen Kombination an Genen. Der Algorithmus entdeckte in dem Muster außerdem Arten von Genen, die man bislang nicht eindeutig mit Krebs in Verbindung gebracht hatte, schreibt die Forschungsgruppe im Fachjournal Genome Biology.
Maschinelles Lernen bedeutet im Grunde, dass ein Algorithmus anhand von Trainingsdaten selbstständig lernt, bestimmte Fragestellungen zu beantworten. Seine Strategie ist dabei, nach Mustern in den Daten zu suchen, die ihm bei der Problemlösung helfen. Nach der Trainingsphase kann das System das Gelernte verallgemeinern und somit unbekannte Daten beurteilen. „Eine große Herausforderung war, geeignete Lerndatensätze zu bekommen, bei denen Fachleute bereits eine präzise Einteilung der Zellen in ‚gesund‘ und ‚krebskrank‘ vorgenommen hatten“, erzählt Jan Dohmen, Erstautor der Studie.
Obendrein sind Datensätze aus Einzelzell-Sequenzierungen häufig verrauscht. Das bedeutet: Die Informationen über die molekularen Eigenschaften der einzelnen Zellen sind nicht ganz genau – weil zum Beispiel in jeder Zelle eine unterschiedliche Anzahl an Genen erkannt wird oder die Proben nicht immer gleich verarbeitet werden. Sie haben unzählige Publikationen durchforstet und etliche Forschungsgruppen kontaktiert, um ausreichend gute Datensätze zu bekommen, berichten Dohmen und sein Kollege sowie Co-Autor Dr. Vedran Franke. Mit Daten von Lungen- und Darmkrebszellen trainierte das Team den Algorithmus schließlich, bevor sie ihn auf Datensätze von weiteren Tumorarten anwendeten.
In der Trainingsphase musste die KI eine Liste charakteristischer Gene finden, anhand derer das Programm die Zellen einteilen konnte: „Wir haben verschiedene Ansätze ausprobiert und verfeinert“, sagt Dohmen. „Ausschlaggebend war, dass ‚ikarus‘ letztlich zwei Listen nutzte: eine für Krebsgene und eine für Gene anderer Zellen“, erklärt Franke.
Nach der Lernperiode konnte der Algorithmus auch bei anderen Krebsarten zuverlässig zwischen gesunden und krebskranken Zellen unterscheiden, etwa in Gewebeproben von Leberkrebs oder Neuroblastomen. Seine Trefferquote lag meist nur wenige Prozent daneben. Das hat auch die Forschungsgruppe überrascht: „Wir haben nicht erwartet, dass eine gemeinsame Signatur existiert, die Tumorzellen von verschiedenen Krebsarten so genau definiert“, sagt Akalin. „Noch können wir allerdings nicht sagen, dass die Methode für alle Krebsarten funktioniert“, fügt Dohmen hinzu. Damit der Algorithmus zuverlässig bei der Krebsdiagnose helfen kann, wollen die Forscher ihn noch an weiteren Tumorarten testen.
Die Klassifizierung „gesund“ versus „krebskrank“ ist dabei längst nicht das Ende des Projekts. In ersten Tests konnte die KI bereits zeigen, dass die Methode auch andere Zelltypen oder bestimmte Subtypen von Tumorzellen unterscheiden kann. „Wir wollen den Ansatz verallgemeinern“, sagt Akalin, „also ihn derart weiterentwickeln, dass er alle möglichen Zelltypen in einer Biopsie unterscheiden kann.“
In der Klinik schauen sich Pathologen Gewebeproben von Tumoren meist nur unter dem Mikroskop an und identifizieren so die unterschiedlichen Zelltypen. Da ist mühsam und kostet viel Zeit. Mit dem neuen Tool könnte dieser Schritt irgendwann vollautomatisch ablaufen. Außerdem könne man aus den Daten zusätzlich etwas über die unmittelbare Umgebung des Tumors ableiten, sagt Akalin. Das wiederum könnte den Ärzten helfen, eine optimale Therapie auszuwählen. Denn oftmals deute die Zusammensetzung des Krebsgewebes und der Mikroumgebung darauf hin, ob eine bestimmte Behandlung oder ein Medikament anschlagen wird oder nicht.
Darüber hinaus hilft die KI möglicherweise, neue Medikamente zu entwickeln: „Wir können mit ‚ikarus‘ Gene identifizieren, die potenzielle Treiber der Krebserkrankung sind“, sagt Akalin. Neuartige Wirkstoffe könnten dann an diesen molekularen Zielstrukturen ansetzen.
Dieser Artikel basiert auf einer Pressemitteilung der Charité Berlin. Die Originalpublikation haben wir euch hier und im Text verlinkt.
Bildquelle: Ty Kent, unsplash