Wie findet man Betroffene mit seltenen genetische Erkrankungen, wenn ihre Daten auf verschlüsselten Diagnosedatenbanken weltweit abliegen? Ein Forscherteam stellt jetzt eine neue Methode vor.
Ein fünfjähriger Junge in den USA hat eine Mutation in einem Gen namens GPX4, die er mit nur 10 anderen Kindern auf der Welt teilt. Die Krankheit führt zu Anomalien des Skeletts und des zentralen Nervensystems. Wahrscheinlich gibt es noch weitere Kinder mit dieser Krankheit, die in Hunderten von Gesundheits- und Diagnosedatenbanken auf der ganzen Welt erfasst sind, von denen wir aber nichts wissen, weil ihre Privatsphäre aus rechtlichen und kommerziellen Gründen geschützt wird.
Was wäre aber, wenn man die mit der Krankheit verbundenen Datensätze finden und zählen könnte, ohne die Privatsphäre zu verletzen? Forscher des Macquarie University Cyber Security Hub haben eine Technik entwickelt, die genau das ermöglicht. Zu dem Team gehören Dr. Dinusha Vatsalan und Prof. Dali Kaafar von der School of Computing der Universität sowie der Vater des Jungen, der Software-Ingenieur Sanath Kumar Ramesh.
„Ich bin sehr begeistert von dieser Arbeit“, sagt Ramesh, der auch Geschäftsführer der OpenTreatments Foundation in Seattle, Washington, ist. „Das Wissen, wie viele Menschen an einer Krankheit leiden, untermauert die wirtschaftlichen Annahmen. Wenn man bisher davon ausging, dass es 15 Patienten für eine Krankheit gibt, und wir nun aufgrund der Daten von Diagnostikunternehmen wissen, dass es 100 Patienten sind, dann vergrößert sich der Markt enorm.“
„Das hätte erhebliche wirtschaftliche Auswirkungen. Die Bewertung eines Unternehmens, das sich mit der Krankheit befasst, würde steigen. Die Produktkosten würden sinken. Die Art und Weise, wie Versicherungsgesellschaften die medizinischen Kosten abrechnen, würde sich ändern. Diagnostikunternehmen würden [die Krankheit] stärker ins Visier nehmen. Und man kann anfangen, Epidemiologie genauer zu betreiben“, so Ramesh.
„Die Verknüpfung und Zählung von Datensätzen mag einfach erscheinen, aber in Wirklichkeit sind damit viele Probleme verbunden“, sagt Professor Kaafar. Da es sich um eine seltene Krankheit handelt, gebe es erstens keine zentrale Datenbank, und die Datensätze seien über die ganze Welt verstreut. „In diesem Fall in Hunderten von Datenbanken“, sagt er. „Und aus geschäftlicher Sicht sind die Daten kostbar, und die Unternehmen, die sie besitzen, sind nicht unbedingt an einer gemeinsamen Nutzung interessiert.“
Hinzu kommen technische Probleme beim Abgleich von Daten, die auf unterschiedliche Weise erfasst, kodiert und gespeichert werden, und bei der Berücksichtigung von Personen, die in verschiedenen Datenbanken doppelt gezählt werden. Hinzu kommen noch Überlegungen zum Datenschutz. „Wir haben es hier mit sehr, sehr sensiblen Gesundheitsdaten zu tun“, sagt Prof. Kaafar.
Für eine einfache Schätzung der Zahl der Patienten und für epidemiologische Zwecke werden diese personenbezogenen Daten nicht benötigt. Bislang waren sie jedoch erforderlich, um sicherzustellen, dass die Datensätze eindeutig sind und miteinander verknüpft werden können. Dr. Vatsalan und ihre Kollegen verwendeten eine Technik, die als Bloom-Filter-Kodierung mit differenziertem Datenschutz bekannt ist. Sie entwickelten eine Reihe von Algorithmen, die absichtlich so viel Rauschen in die Daten einbringen, dass genaue Details so verwischt werden, dass sie nicht aus einzelnen Datensätzen extrahiert werden können.
Die Genauigkeit des Verfahrens wurde dann anhand von Wählerregistrierungsdaten aus North Carolina bewertet. Die Ergebnisse zeigten, dass die Methode zu einer vernachlässigbaren Fehlerquote führt und ein sehr hohes Maß an Privatsphäre garantiert, selbst bei stark beschädigten Datensätzen. Die Technik übertrifft die bestehenden Methoden deutlich.
Neben der Erkennung und Zählung seltener Krankheiten gibt es viele weitere Anwendungsmöglichkeiten für diese Forschung, z. B. zur Ermittlung des Bekanntheitsgrads eines neuen Produkts im Marketing oder im Bereich der Cybersicherheit zur Verfolgung der Anzahl der einzelnen Aufrufe bestimmter Beiträge in den sozialen Medien.
Aber es ist die Anwendung auf seltene Krankheiten, die den Forschern der Macquarie University am meisten am Herzen liegt. „Für einen Forscher gibt es kein besseres Gefühl, als zu sehen, dass die Technologie, die er entwickelt hat, eine echte Wirkung hat und die Welt zu einem besseren Ort macht“, sagt Prof. Kaafar. „In diesem Fall ist es so real und so wichtig.“
Dieser Artikel basiert auf einer Pressemitteilung der Macquarie University.
Bildquelle: Chase Clark, Unsplash