Interview Dr. Andreas Roos
Algorithmus vom INFORM DataLab verbessert Diagnose und Behandlung neuromuskulärer Erkrankungen
Ein neu entwickeltes Verfahren auf Basis von Künstlicher Intelligenz soll sowohl die Diagnose als auch die Behandlung von neuromuskulären Erkrankungen optimieren. Im Rahmen eines Forschungsprojekts mit der Neuropädiatrie des Universitätsklinikum Essen, dem Leibniz-Institut für Analytische Wissenschaften (ISAS) und dem MVZ Institut für Klinische Genetik in Bonn möchte das INFORM DataLab durch Analysen von Patientendaten mithilfe eines speziellen Algorithmus die Diagnose und Behandlung von neuromuskulären Erkrankungen verbessern.
Im Gespräch mit Dr. Andreas Roos aus der Abteilung für Neuropädiatrie im Universitätsklinikum Essen möchten wir das Projekt und seine Ziele genauer beleuchten.
Hallo Dr. Roos, Sie sind Manager des Projektes. Können Sie für unsere Blog-Leser kurz erläutern, was neuromuskuläre Erkrankungen sind?
Neuromuskuläre Erkrankungen sind Krankheiten, welche die Funktion der Motoneurone, des peripheren Nervensystems und der neuromuskulären Endplatte beeinflussen. Das ist eine Art Schnittstelle zwischen dem peripheren Nervensystem und der Muskulatur. Außerdem fallen darunter Erkrankungen, welche die Muskulatur selbst betreffen oder einschränken. Oftmals äußern sich diese Krankheitsbilder zunächst in der Manifestation einer Muskelschwäche, die dann je nach Krankheitsbild in Muskelschwund übergeht. Dieser Schwund ist aber nicht immer ersichtlich. Manchmal sieht es aus, als hätten die betroffenen Patienten starke Muskeln, obwohl die intakten Muskelzellen durch Fett ersetzt wurden. Erst später im Krankheitsverlauf wird der Muskelschwund deutlich.
Häufig erschweren zusätzlich Muskelkrämpfe und Muskelschmerzen den Patienten das Leben. Neben der Vulnerabilität der Skelettmuskulatur kommen häufig weitere Komplikationen wie Probleme mit dem Herzmuskel hinzu, so dass die Patienten sogenannte Kardiomyopathien entwickeln. Auch die Atemmuskulatur kann eingeschränkt sein, so dass es zu einer respiratorischen Schwäche kommt, die auch zum Tod führen kann. Insgesamt ist die Erkrankungsgruppe klinisch und genetisch sehr heterogen. Wir kennen für die verschiedenen Muskelerkrankungen mittlerweile mehr als 250 beschriebene Gene, die die Erkrankungen auslösen können. Neben genetisch bedingten Formen gibt es auch sogenannte erworbene Formen, die auf Autoimmunprozesse zurückzuführen sind oder nach einer medizinischen Behandlung oder OP auftreten können.
Welche Diagnoseverfahren und Behandlungen stehen aktuell zur Verfügung?
Die Diagnose der Erkrankungen erfolgt aktuell durch eine Kombination aus Klinik, Genetik, Biochemie und Morphologie. Das heißt, dass Neuropädiater oder Neurologen den Patienten untersuchen und eine klinische Verdachtsdiagnose äußern. Basierend auf dieser Diagnose wird entschieden, ob es notwendig ist, eine Muskelbiopsie zu entnehmen, die dann weiter im diagnostischen Prozedere aufgearbeitet wird. Biochemiker oder Neuropathologen führen dann anhand der Biopsien verschiedene Proteindarstellungen durch. Parallel oder danach wird meistens eine Genetik eingeleitet.
Oftmals ist der biochemische Befund schon hinweisgebend. Wenn ein Protein in einer dieser Analysen komplett fehlt, dann ist die Wahrscheinlichkeit hoch, dass dort der genetische Defekt liegt. Darum hat man in der Vergangenheit immer gezielt dieses Gen getestet. Häufig blieben die Erkrankungen dann leider trotzdem ungeklärt. Neuere Technologien testen eine Vielzahl von Genen auf einmal oder analysieren den gesamten kodierenden Bereich der DNA, um Mutationen zu finden, die den Zustand des Patienten erklären.
Die Behandlung beruhte bis vor einigen Jahren auf einer rein symptomatischen Intervention. Das heißt, es wurden Medikamente eingesetzt, die den Muskelschwund verlangsamen sollten. Mehr und mehr kommen Gentherapien bei der Behandlung der neuromuskulären Erkrankungen zur Anwendung.
Im Kontrast zu Volkserkrankungen, wie zum Beispiel Demenz, ist es für die Pharmaindustrie leider weniger attraktiv, für neuromuskuläre Erkrankungen Medikamente auf den Markt zu bringen, weil der Absatz einfach nicht besonders hoch ist. Eine Idee, dieses Problem zu umgehen, ist, die Erkrankungen gemäß den Funktionsstörungen zu gruppieren. Dazu analysieren wir derzeit die 250 bekannten Muskelerkrankungen. So können wir der Pharmaindustrie Bedarfe für neue Medikamente für eine größere Gruppe Menschen weitergeben. Für sie wird es dann attraktiver, hierfür ein neues Medikament zu entwickeln.
Wer ist alles an dem Projekt beteiligt? Können Sie kurz skizzieren, worum es in dem Forschungsprojekt NME GPS geht?
Es handelt sich um ein multidisziplinäres Projekt, was auch die besondere Stärke des Projektes ausmacht. Verschiedene Expertisen aus verschiedenen Fachdisziplinen treffen aufeinander und treten in den Dialog. Wir verfolgen das Ziel, den Patienten dieser vergleichsweise seltenen Erkrankungen eine bessere Versorgung zukommen zu lassen. Zum einen sind Kliniker, die Neuropädiatrie des Universitätsklinikum Essen mit Frau Professorin Ulrike Schara-Schmidt als Konsortialführung, involviert. Andererseits gibt es eine Vielzahl an Kollaborationspartner, die auch Proben und klinische Informationen liefern. Klinischer Partner im Projekt sind Professor Hanns Lochmüller, der in Ottawa seine Professur hält, sowie Rita Hovarth, Professorin für Neurogenetik in Cambridge und Doktor Teresinha Evangelista, Neurologin, Neuropathologin und Koordinatorin des European Reference Networks (ERN) von der Universität in Paris sowie Professor Werner Stenzel von der Charité in Berlin. Hinzukommen einige Institutionen namenhafter Universitäten wie die Neuropädiatrie in Heidelberg oder das Friedrich-Bauer-Institut der Ludwig-Maximilians-Universität in München.
Durch einen stetigen Dialog mit der Pharmaindustrie können die Erkenntnisse, die im Projekt gewonnen werden, direkt kommuniziert werden und somit der Anstoß zur Entwicklung neuer Medikamente gegeben werden.
Außerdem sind Genetiker Teil des Projektes: zum einen das MVZ Institut für Klinische Genetik in Bonn, zum anderen das Institut für Humangenetik des Universitätsklinikums Essen, die ihre große Expertise in der Analyse der Erbsubstanz und der Interpretation von genetischen Varianten einbringen. Für manche der in das Projekt inkludierten Patienten werden die Analysen des Erbguts am Broad Institute (Harvard University) in Boston durchgeführt. Zudem ist das Leibniz-Institut für Analytische Wissenschaften in Dortmund (ISAS) Teil des Projektes: das ISAS führt biochemische (Massenspektrometrie-basierte) Analysen unter Verwendung von bioptischem Material der Patienten durch, um (i) unabhängig von der Verwendung von Antikörpern gezielt Proteine zu untersuchen, für die Gendefekte bereits mit der Ausprägung einer neuromuskulären Erkrankung in Verbindung gebracht wurden und (ii) Pathomechanismen zu identifizieren. Letztere dienen dazu, Ansatzpunkte ür neue therapeutische Interventionskonzepte zu definieren.
Zudem ist der Einsatz von neuen mikroskopischen Verfahren ein wichtiger Bestandteil des Projekts. Dies soll – analog zu den genannten biochemischen Analysen – unabhängig von Antikörpern in der Arbeitsgruppe für CARS-Mikroskopie (geleitet durch Doktor Erik Freier) am ISAS erfolgen. Ein solcher Ansatz ermöglicht es, der Monopolstellung der Antikörperproduzenten entgegenwirken.
Ebenso Teil sind Informatiker, repräsentiert durch das INFORM DataLab, die die gewonnenen Daten letztendlich sinnvoll zusammenführen und auswerten, an dem interdisziplinären Projekt beteiligt.
Dementsprechend ist das übergreifende Projektziel eine antikörperunabhängige Diagnostik, mit der wir zukünftig in der Lage sind, unter Verwendung einer minimalen Menge an Probenmaterial Muster der Proteinregulationen oder Co-Regulation zu identifizieren. So kann man feststellen, welche Proteine in Kombination mit einer bestimmten Information aus der DNA-Analyse zu einem bestimmten Gendefekt führen. Dementsprechend lässt sich in Zukunft direkt das betroffene Gen vorhersagen. Das ist wichtig, um auch die genetischen Befunde, die erhoben werden, besser interpretieren zu können. Vorhersagealgorithmen, wie sie von INFORM DataLab entwickelt werden, helfen den kausativen Gendefekt festzumachen. So können die Patienten schnellstmöglich mit dem Wissen über das verantwortliche Gen in die genetische Beratung gehen. Dementsprechend kann langfristig die „diagnostische Odyssee“, welche die Patienten oftmals durchleiden, verhindert werden. Häufig behandeln wir Patienten, bei denen es zehn, zwölf Jahre dauern kann, bis de Fall gelöst ist.
Im Hinblick auf die Therapien ist – wie bereits angedeutet – die Identifikation von gemeinsamen Pathomechanismen und modifizierenden Faktoren, die als Ansatzpunkt zur Entwicklung neurotherapeutischer Interventionskonzepte dienen können, ein zusätzliches Ziel, um auch die weitere medizinische Versorgung der Patienten zukünftig verbessern zu können.
Welche Vorteile erhoffen Sie sich durch den Einsatz von KI? Welche Intention hatten Sie, neue Technologien für das Projekt zu nutzen?
In dem Projekt möchten wir rund 500 Patienten untersuchen. Das bedeutet, dass wir uns ein komplettes Bild über die kodierenden Regionen von 25.000 Genen von diesen 500 Patienten machen. Dazu kommen die Dokumentation der Proteinsignatur ihrer Skelettmuskulatur und weitere klinische Daten. Wir rechnen mit über 100 Gigabyte Daten jedes einzelnen Patienten, also insgesamt rund 50 Terabyte Datenmaterial. So haben die Algorithmen genug Material, um darin Kombinationen zu finden. Außerdem möchten wir breitere Einblicke in die Gesamtsignatur des Erbguts erhalten, um hier das Zusammenspiel von Veränderungen in zwei verschiedenen Genen ausfindig machen zu können.
Die Informatik macht die ganzen Daten überhaupt verarbeitbar. In unserem Projekt analysieren wir aktuell zwar zunächst „nur“ die Datensätze von 500 Patienten, doch man kann sich leicht ausmalen, welche Datenmengen wir in Zukunft bei Analysen von z.B. 10.000 Patienten untersuchen werden. Da handelt es sich dann per Definition wirklich um Big Data. Hier benötigen wir die Unterstützung von INFORM DataLab in der Verarbeitung, Speicherung, Aufbereitung und Analyse der Daten. Unsere Aufgabe wird es dann sein, die Messwerte zu interpretieren und die erhaltenen Resultate im Sinne der Patienten sinnvoll zu nutzen, wie beispielsweise als Anstoß zu Entwicklung neuer Therapien in Zusammenarbeit mit der Pharmaindustrie.
Inwiefern stellen diese neuen Forschungsmethoden einen Mehrwert für den Patienten und deren Familien dar?
Der Mehrwert ist eine schnellere und verbesserte Diagnose. Diese führt wiederum zu einer schnelleren genetischen Beratung, was einen signifikanten Einfluss auf die Familienplanung haben kann. Nicht nur auf die der Eltern, sondern natürlich auch auf die der Geschwister eines Patienten, da diese ebenfalls Träger der Gendefekte sein könnten. Für die Patienten können sich außerdem schneller umsetzbare, präzise Therapiekonzepte ergeben.
Im Vergleich zu früher werden wir in Monaten erreichen können, wofür wir bisher Jahre gebraucht haben. Jahrelange Diagnoseverfahren bei seltenen Erkrankungsformen bedeuten für die Patienten immer auch einen enormen psychischen Druck. Häufig konnte man den Patienten zwar mitteilen, dass sie erkrankt sind, aber nicht genau woran. Das kommt zum Beispiel vor, wenn das betroffene Gen noch gar nicht bekannt und unter Umständen so selten ist, dass weltweit vielleicht nur drei oder vier Familien damit leben. Und manchmal kann der Gendefekt dem Krankheitsbild gar nicht zugeordnet werden. Bei solchen ungeklärten Fällen gewinnt Data Sharing an Bedeutung: Auf digitalen Plattformen wie RD-Connect können sich Forschergruppen weltweit darüber austauschen, ob sie einen ähnlichen Fall kennen. So lassen sich einige Fälle retrospektiv lösen.
Was waren die größten Herausforderungen in Bezug auf die Datenauswertung in der Forschungsarbeit ohne den Einsatz neuer Technologien wie z.B. Künstliche Intelligenz?
Das größte Problem war bisher, die einzelnen Datensätzen in der Summe sinnvoll zusammenzuführen, zu gruppieren und zu korrelieren. Bis zu einem gewissen Grad ist das Grundlagenforschern oder Genetikern auch möglich. Ein Beispiel: Kann man bereits erkennen, ob in einem bestimmten Gen eine die Krankheit verursachende Veränderung vorliegt, lässt sich überprüfen, ob auch das dazu passende Protein betroffen ist. Darauffolgend kann man weiter in die Tiefe gehen und analysieren, ob der Stoffwechselweg, in dem das Protein eine Rolle spielt, ebenfalls betroffen ist.
Ohne Künstliche Intelligenz kommen wir aber bei der Frage nicht mehr weiter, wie sich die Kombination weiterer Genvarianten, die nicht unbedingt kausativ für die Ausprägung einer Erkrankung sind, auf die Verstärkung dieser Stoffwechselkaskaden auswirkt. Jeder Mensch trägt eine Vielzahl von Mutationen oder Genvarianten in sich, die nicht unbedingt zu einer Erkrankung führen. Aber wenn man diese Varianten in der Summe bei einem Patienten betrachtet, der ohnehin schon eine Grunderkrankung aufweist, kann man deren Auswirkungen besser einschätzen.
Außerdem lässt sich schneller klären, wie sich eine veränderte Proteinzusammensetzung in der Muskulatur auf eine bestimmte Proteinsignatur im Blut der Patienten auswirkt. Bei einer Muskelbiopsie sprechen wir über einen invasiven Eingriff. Bei einer Blutentnahme über einen minimal invasiven Eingriff. Mit Künstlicher Intelligenz versuchen wir zu bestimmen, ob die Regulierung bestimmter Proteine im Blut die Regulierung bestimmter Stoffwechselwege in der Muskulatur beeinflusst. Das heißt, Künstliche Intelligenz könnte helfen, in Zukunft die Notwendigkeit invasiver Muskelbiopsien zu vermindern, indem sie bereits durch die Untersuchung der Blutprobe klärt, welche Proteine im Blut die Muskulatur oder auch die Stoffwechsellage im Muskel verändern.
Wie sehen Sie zukünftig den Einsatz von KI zur Erforschung von Krankheiten und neuen Behandlungs- sowie Diagnoseverfahren?
Ich denke, KI wird neue Horizonte eröffnen, wenn wir sehen, dass bestimmte Kombinationen von fehlregulierten Proteinen und bestimmten genetischen Veränderungen auch bestimmte Therapieformen benötigen. So werden in Zukunft personalisierte Therapien möglicherweise mehr Einzug finden. Derartige Behandlungsformen kennt man bereits beispielsweise bei Hirntumorerkrankungen. Man kann dann verschiedene Medikamente so miteinander kombinieren, dass der Patient den maximalen Therapieerfolg hat. Hier wird KI und die Arbeit vom INFORM DataLab in Kooperation mit den anderen Partnern dazu beitragen, dass wir genauso ein Konzept der personalisierten Medizin in Zukunft auch auf den neuromuskulären Patienten übertragen können. Dennoch wird die Forschung immer in Abhängigkeit von Klinikern oder Genetikern stattfinden, die bestimmte neue Mutationen zu interpretieren wissen.
Warum haben Sie sich für eine Zusammenarbeit mit dem INFORM DataLab entschieden? Wie verlief das Projekt bisher?
Wir haben bei der Auswahl der Partner darauf geachtet, dass es bereits eine ausgewiesene Expertise auf diesem Feld gibt. Der Erfolg eines solchen Projekts hängt davon ab, dass mit den besten Leuten zusammengearbeitet wird. Basierend auf dem Internetauftritt des INFORM DataLab ist klar gewesen, dass sie dort mit großen Datenmengen umgehen können, wobei wir in der ersten Phase des Projekts noch nicht in den Bereich von Big Data vordringen werden. Das Projekt sollte in Hände von Leuten gegeben werden, für die diese Arbeit mit solchen Datenmengen „täglich Brot ist“ und keine Einarbeitungsphase von fünf bis sechs Monaten benötigt wird. Hinzukommt die Neutralität: Informatiker sind bei der Analyse nicht vorbelastet und analysieren unabhängig von Erfahrungswerten.
Vielen Dank für das interessante Interview, Dr. Roos!