Mit welchen molekularen Grundbausteinen ein Enzym arbeitet, ist oft nicht bekannt. Forscher haben jetzt eine KI entwickelt, die genau das voraussagen kann.
Auch wenn Gene, die Enzyme kodieren, recht leicht als solche erkannt werden können, ist die genaue Funktion des resultierenden Enzyms in den meisten Fällen – bei mehr als 99 Prozent – unbekannt. Denn ihre Arbeit experimentell zu charakterisieren und damit zu erkennen, welche Ausgangsmoleküle ein bestimmtes Enzym konkret in welches Endmolekül umwandelt, ist extrem aufwändig.
Das Forschungsteam um Prof. Martin Lercher von der Arbeitsgruppe Computergestützte Zellbiologie an der Heinrich-Heine-Universität Düsseldorf (HHU) entwickelte zusammen mit Kollegen aus Schweden und Indien eine Methode, die KI-basiert vorhergesagt, ob ein beliebiges Enzym ein bestimmtes Molekül als Ausgangsstoff für die von ihm katalysierte Reaktion verarbeiten kann.
Lercher: „Die Besonderheit unseres ESP-Modells – dies steht für ‚Enzyme-Substrate-Prediction‘ – ist, dass wir nicht auf einzelne, spezielle Enzyme und ihre nahen Verwandten beschränkt sind, wie dies in bisherigen Ansätzen der Fall war. Unser allgemeines Modell kann mit jeder Kombination aus einem beliebigen Enzym und über 1.000 verschiedenen Substraten arbeiten.“KI-basiertes, an der HHU entwickeltes ESP-Modell sagt Verarbeitung von Substraten voraus. Credit: HHU – Paul Schwaderer/stock.adobe.com – petarg.
Doktorand Alexander Kroll, Erstautor der Studie, hat ein Deep-Learning-Modell entwickelt, in dem die Informationen über die Enzyme und die Substrate in mathematischen Strukturen, sogenannten numerischen Vektoren, kodiert wurden. Die Vektoren von rund 18.000 experimentell bekannten Enzym-Substrat-Kombinationen wurden als Trainingsmaterial in das Deep-Learning-Modell gefüttert. Kroll: „Das so von uns trainierte Modell haben wir dann auf einen unabhängigen Testdatensatz angewandt, für den wir die korrekten Antworten schon kannten. In 91 Prozent der Fälle sagte das Modell korrekt voraus, welche Substrate zu welchen Enzymen passen.“
Diese Methode hat erhebliches Anwendungspotenzial. Sowohl in der Arzneimittelforschung als auch in der Biotechnologie ist es von großer Bedeutung zu wissen, welche Stoffe von Enzymen umgesetzt werden können. Lercher: „So können Forschung und Industrie aus einer großen Menge an möglichen Kombinationen diejenigen eingrenzen, die am vielversprechendsten sind, um damit neue Medikamente, Chemikalien oder auch Biokraftstoffe enzymatisch herzustellen.“ Kroll ergänzt: „Hiermit werden auch bessere Modelle möglich, um den Stoffwechsel in Zellen zu simulieren. Darüber kann die Physiologie verschiedener Organismen – von Bakterien bis zum Menschen – verstanden werden.“
Dieser Artikel basiert auf einer Pressemitteilung der Heinrich-Heine-Universität Düsseldorf (HHU). Die Originalpublikation haben wir euch hier und im Text verlinkt.
Bildquelle: Joshua Fuller, Unsplash