Bioinformatikern ist es nun gelungen, ein zuvor unentdecktes Muster der Protein-DNA-Interaktion zu identifizieren. Sie liefern mit der Beschreibung des Bindungsmusters des Proteins CTCF einen Beitrag zur Vertiefung des Verständnisses der Genregulation im menschlichen Organismus.
Die Genregulation ist ein fundamentaler, aber von der Wissenschaft noch längst nicht abschließend verstandener Prozess. Die Genregulation bewirkt, dass die rund 25.000 Gene des Menschen selektiv an- oder abgeschaltet werden können. „Der Grund, warum wir so aussehen, wie wir aussehen, und warum wir so funktionieren, wie wir funktionieren, ist, dass die richtigen Gene im richtigen Gewebe zum richtigen Zeitpunkt an- bzw. abgeschaltet werden“, erklärt Prof. Dr. Ivo Große, Bioinformatiker vom Institut für Informatik der Martin-Luther-Universität Halle-Wittenberg (MLU). Auf molekularer Ebene sind zur Genregulation bestimmte Proteine nötig - die sogenannten Transkriptionsfaktoren - die die DNA an bestimmten Stellen - den sogenannten Transkriptionsfaktorbindungsstellen - binden. Das Protein CTCF ist ein solcher wesentlicher Transkriptionsfaktor. Er spielt u. a. eine fundamentale Rolle bei der Entstehung verschiedener Krebserkrankungen. „Die Aufklärung, an welche Bindungsstellen der Transkriptionsfaktor CTCF in verschiedenen Geweben und zu verschiedenen Zeitpunkten bindet, ist daher von hoher biologischer und medizinischer Relevanz“, erklärt Große. Da die exakte Bestimmung von Bindungsstellen eines gegebenen Transkriptionsfaktors durch Experimente im Labor sehr aufwändig und teuer ist, kommt computerbasierten Vorhersagemethoden eine hohe Bedeutung zu. Das internationale Forscherteam um Ivo Große hat somit nicht nur erkannt, dass die Natur komplexere Bindungsmuster verwendet, als Wissenschaftler weltweit bisher angenommen haben. Ihnen gelang es auch, mit einem neuen Bioinformatikverfahren dieses Bindungsmuster zu erkennen und zu beschreiben.
Während bisherige Verfahren ein vergleichsweise einfaches Modell der Protein-DNA-Bindung verwendeten, wurde in dieser Arbeit nun ein realitätsnäheres Modell, welches statistische Abhängigkeiten zwischen Nukleotiden innerhalb der Bindungsstellen erkennen kann, verwendet. „Wir konnten zeigen, dass dieses Modell die komplexen Bindungsmuster des Transkriptionsfaktors CTCF besser erkennt und sich dadurch die CTCF-Bindungsstellen in verschiedenen Geweben besser bestimmen lassen“, erläutert Ralf Eggeling, Doktorand in der Gruppe von Große und Erstautor des Artikels. Originalpublikation: On the value of intra-motif dependencies of human insulator protein CTCF Ivo Große et al.; PLoS ONE, DOI: 10.1371/journal.pone.0085629; 2014