Sorry, you need to enable JavaScript to visit this website.
Ziemek_Big Data_Neue_Medikemente

Digitalisierung

Mit Big Data zu besseren Medikamenten

Auf der Suche nach neuen Wirkstoffen nutzt Pfizer auch die Bioinformatik: Molekulare Daten von Patienten erweitern das Wissen über  Krankheiten deutlich und zeigen neue Ansätze für Medikamente auf. Der Bioinformatiker Dr. Daniel Ziemek leitet von Berlin aus das internationale Forschungsteam „Computational Systems Immunology“ von Pfizer. Seine Forschungsdaten erhält er aus der ganzen Welt.

Herr Dr. Ziemek, woran forschen Sie derzeit?

Mit meiner Abteilung „Computational Systems Immunology“ suchen wir unter anderem neue Angriffspunkte für zukünftige Wirkstoffe gegen entzündliche Erkrankungen. Gleichzeitig versuchen wir, bestimmte Patientengruppen zu definieren, die auf einen Wirkstoff besonders gut oder besonders schlecht ansprechen. Idealerweise möchte man das natürlich vorhersagen, bevor ein Patient den Wirkstoff eingenommen hat.

Welche Rolle spielen Big Data und Künstliche Intelligenz bei ihrer Arbeit?

Beides sind Schlagwörter, die im Moment sehr in Mode sind, die man aber mit Vorsicht genießen muss. In unserem Arbeitsgebiet benutzen wir eine Vielzahl von statistischen Analyseverfahren und wenden diese auf große Datenmengen an. Zum Beispiel benutzen wir genetische und andere molekularbiologische Daten von Patienten aus unseren klinischen Studien. Wenn ich mir zwei Menschen von zwei zufällig ausgewählten Orten der Erde nehme, dann gibt es etwa neun Millionen Stellen im genetischen Code, an denen diese sich recht wahrscheinlich unterscheiden werden. Wir haben also schon einmal neun Millionen Datenpunkte pro Person in manchen unserer Analysen. Meistens meint man mit „Big Data“ aber eher die Daten vieler unterschiedlicher Personen. Leider ist es schwierig oder manchmal prinzipiell unmöglich, für ausreichend viele Patienten genetische oder andere molekularbiologische Daten zu erheben.

Warum ist das so?

Das ist zum Teil eine Frage der Kosten. Gleichzeitig gibt es für viele seltene Erkrankungen – zum Glück – gar nicht genügend Patienten, um von „Big Data“ zu sprechen. Anders ist das bei anonymisierten Daten aus Patientenakten beispielsweise von Rheumapatienten. Da kommt man dann schon mal auf viele Tausende von Datensätzen. Und dann setzen wir auch Methoden der künstlichen Intelligenz ein. Ich denke, viele Leute haben schonmal nach bestimmten Personen oder vielleicht Gegenständen in ihrer Fotosammlung gesucht oder vielleicht Sprachassistenten wie Siri, Alexa oder andere Systeme genutzt. Das geht heute ziemlich gut und da gab es wirklich einige methodologische Durchbrüche in den letzten zehn Jahren. Dieselben Methoden sind inzwischen in abgewandelter Form auch im Einsatz, um klinische oder molekularbiologische Daten besser zu modellieren und auszuwerten.

Woher stammen die Daten für Ihre Arbeit?

Das variiert stark. Einerseits können wir auf interne klinische Studien zurückgreifen. Diese sind zwar oft sehr gut kontrolliert und ergeben sehr saubere Datensätze, sind aber auch häufig klein. Wir arbeiten außerdem auch mit vielen Akademikern in der ganzen Welt zusammen, um sowohl relevante molekularbiologische Daten als auch Patientenakten, die den Verlauf einer Krankheit beschreiben, analysieren zu können. Und natürlich gibt es eine ständig wachsende Literatur, die viele relevante Datensätze enthält.

Gibt es diese Daten in Deutschland nicht?

Doch, es gibt natürlich auch in Deutschland Spitzenforscher, die relevante Daten generieren. Aber andere Länder sind uns da einen Schritt voraus. Großbritannien etwa hat vor rund zehn Jahren eine revolutionäre Studie auf den Weg gebracht, die sogenannte UK Biobank. In dieser Studie werden große Teile der Bevölkerung angeschrieben, ob sie einen Fragebogen zu ihrer Gesundheit ausfüllen wollen, sich einmal durchchecken lassen und auch einen Teil ihres genetischen Codes für die Forschung zur Verfügung stellen. Die ersten Daten sind im letzten Jahr freigegeben worden und mehr als 500.000 Menschen haben teilgenommen. Schon jetzt beginnt diese Arbeit – unter strengen, aber gleichzeitig sehr offenen datenrechtlichen Auflagen – Früchte zu tragen. In Deutschland gibt es jetzt mit der Nationalen Kohorte einen ähnlichen Ansatz – aber eben viel später. Ähnlich verhält es sich mit sogenannten „patient registries“: In Schweden zum Beispiel werden alle Krankenhausaufenthalte, Arztbesuche, Apothekenbesuche und anderes unter sehr strengen Auflagen zentral gespeichert. Das ist unglaublich ergiebig, um zu verstehen, welche Kinder vielleicht einmal Rheuma entwickeln werden oder welche Auswirkungen es hat, ein gewisses Medikament über einen längeren Zeitraum einzunehmen. Meines Wissens gibt es nichts Vergleichbares in Deutschland.

Das heißt, wenn Sie an großen Datenmengen forschen wollen, brauchen Sie englische, schwedische oder Daten aus anderen Ländern?

Ja, so ist das. Die Auflagen sind dabei sehr streng – und das ist auch gut so. Um auf das Beispiel Schweden zurückzukommen: Viele der Datensätze dürfen das Land nicht verlassen und nur von schwedischen Akademikern analysiert werden. Im Moment arbeiten wir mit Prof. Lars Klareskog am Karolinska Institut zusammen, um gemeinsame Forschungsfragen zu beantworten. Dabei versuchen wir zu verstehen, welche Patienten gut auf die aktuellen Behandlungsmethoden gegen Rheuma ansprechen und welche nicht. Da sind solche großen und trotzdem ziemlich detaillierten Krankendaten sehr hilfreich – vor allem wenn man diese molekularbiologisch unterfüttern kann.

Inwiefern verkürzen digitale Möglichkeiten die Zeit, bis ein geeigneter Wirkstoffkandidat beziehungsweise Zusammenhänge identifiziert werden können?

Tja. Leider ist die Wirkstoffforschung ein langwieriges Geschäft. Von der ersten Forschung bis zum Einsatz auf breiter Basis vergehen leicht zehn Jahre – wenn es denn überhaupt klappt. Solange gibt es den Zugriff auf diese Art von detaillierten Daten noch nicht. Sicher ist aber, dass man schon jetzt viele Einsichten gewinnen kann, die uns – und damit meine ich nicht nur Pfizer, sondern alle Forscher in den Lebenswissenschaften – tiefe Einblicke in die Entstehung von Krankheiten ermöglichen. Ich bin da optimistisch: Die Auswertung von molekularbiologisch und klinisch charakterisierten Patienten mit unterschiedlichen Diagnosen wird uns helfen, die zu Grunde liegenden Unterschiede und Gemeinsamkeiten der Krankheiten viel besser zu verstehen. Was, wenn nicht das, sollte denn zu besseren Medikamenten führen?

Dr. Daniel Ziemek

Ihr Kommentar

Wollen Sie namentlich in der Diskussion genannt werden?

Schliessen Kreuz Created with Sketch.

Regelmäßige Neuigkeiten aus dem Land der Gesundheit