Sorry, you need to enable JavaScript to visit this website.

Datenspende für die Forschung

Marie Schild hat sich in ihrem Statistik-Studium auf die Themenbereiche Machine Learning und Künstliche Intelligenz spezialisiert und promoviert derzeit über die Vorhersage über Behandlungspfade von Intensivpatienten mittels maschinellem Lernen.

Ab dem Jahr 2023 können Patienten freiwillig Daten aus ihrer elektronischen Patientenakte für die Forschung bereitstellen. So sieht es das Patientendaten-Schutz-Gesetz (PDSG) vor. Welches Potenzial diese und andere Daten für die Erforschung neuer und bestehender Medikamente haben, erläutert Marie Schild, Market Access Innovation Manager bei Pfizer.

Frau Schild,was genau ist eine Datenspende?

Es geht beispielsweise um die Daten, die zukünftig in der elektronischen Patientenakte der Patienten gespeichert sind – Patienten könnten zustimmen, bestimmte Teile dieser persönlichen Daten der Forschung anonymisiert oder pseudonymisiert zur Verfügung zu stellen. Neben Angaben über ihr Alter und Geschlecht etwa Laborbefunde oder Röntgenbilder. Datenspenden gehen aber noch weit darüber hinaus, gemeint sind beispielsweise auch Messwerte von medizinischen Apps oder Wearables. Genauso interessant für die Forschung sind anonymisierte Daten aus Patientenbefragungen, von Krankheitsregistern, Krankenhäusern oder die Abrechnungsdaten von Krankenkassen.

Wo landen diese Datenspenden dann?

All diese Daten müssten an zentraler Stelle miteinander verknüpft und aufbereitet werden. Denn die Werte kommen aus unterschiedlichsten Quellen.

Sie haben nicht die gleiche Informationstiefe oder sind unvollständig – das ist etwa bei Registern oft der Fall. Beim so genannten Data-Cleaning werden dann beispielsweise unübliche Daten herausgefiltert. Oder man ergänzt fehlende Werte durch Schätzungen. Erst dann kann man aus solch einer Datenbasis belastbare Aussagen treffen.

Was kann man an diesen Daten sehen, was man in Klinischen Studien nicht sieht?

Klinische Studien untersuchen bestimmte Fragestellungen mit einem begrenzten Teilnehmerkreis. Mit Machine-Learning könnten wir heute aus Daten sehr viel mehr ablesen, als in solchen Untersuchungen sichtbar wird. Vereinfacht gesagt, zielen klinische Studien darauf ab, eine bestimmte Hypothese zu belegen. Datengetriebene Forschung ist indes induktiv: Machine-Learning kann Tausende Variablen in Bezug setzen und so Zusammenhänge erkennen, die wir bis dahin vielleicht noch nicht gesehen haben. Dazu braucht es jedoch eine umfangreiche Datenbasis von hoher Qualität. Diese Reichweite haben unsere klinischen Studien nicht.

Inwiefern hilft das Ganze dem Patienten?

Einerseits könnten Krankheiten damit früher erkannt werden und den Patienten langwierige Wege zur Diagnose und dem damit verbundenen Leidensdruck erspart werden. Andererseits könnte man Therapien optimieren, zum Beispiel, wenn man durch Daten bestimmte Patientensubgruppen ausmachen kann.

Können Sie das veranschaulichen?

Heute weiß die Krankenkasse beispielsweise nur, dass ein Patient Hämophilie, also die Bluterkrankheit, hat. Sie weiß nicht, wie oft ein Patient Einblutungen hat und wie stark seine Gelenke in ihrer Beweglichkeit eingeschränkt sind. Er kann solche Beobachtungen heute allerdings schon in der App „Hämoassist“ eintragen. Durch die Nutzung solcher Daten könnte man solche Erkrankungen tiefer verstehen und Empfehlungen und Begleitmaßnahmen formulieren. Als forschendes Pharmaunternehmen könnten wir anhand der Analyseergebnisse solcher Daten Rückschlusse darauf ziehen, wer wie auf welches Medikament anspricht und wie verträglich es in bestimmten Patientensubgruppen ist. Dann könnten wir maßgeschneiderte Therapien für diese Subgruppen entwickeln, hinsichtlich ihres Sicherheitsprofils und der Wechselwirkungen.

Und in der Diagnostik?

Hier könnten Predicitive-Analytics-Methoden beispielsweise bei seltenen Erkrankungen sehr wichtig werden. Oft stochern Patienten und ihre Ärzte jahrelang im Nebel herum, um eine passende Diagnose zu treffen. Sie wissen nicht, dass es sich um eine seltene Erkrankung handelt. Die Symptomatik ist zu komplex oder diffus. Mit Daten zur Demographie, Symptomen und der Verlaufsgeschichte von Tausenden Patienten könnten Algorithmen durch Erkennung von Mustern und komplexen Zusammenhängen eine solche Erkrankung schneller identifizieren als ein Mensch. So etwas gibt es heute schon, etwa mit der Diagnoseunterstützungs-App „AdaHealth“.

Aber wie lässt sich gerade dann, wenn die Daten aus unterschiedlichsten Quellen stammen, gewährleisten, dass die Informationen nicht rückverfolgbar sind?

Natürlich brauchen wir klare Vorschriften zum Datenschutz – verbunden mit Transparenz für den Patienten hinsichtlich des Forschungszwecks und einer detaillierten Offenlegung zur Nutzung spezifischer Informationen. Um die Persönlichkeitsrechte zu wahren, könnten die Daten über ein Trust-Center gehen: Dort könnten die Daten aus verschiedensten Quellen gereinigt, verschlüsselt und verknüpft werden. Der strukturierte Datenkorpus könnte dann berechtigten Akteuren – beispielsweise Universitäten und Forschungsinstituten - für Ihre Forschung zur Verfügung gestellt werden.

Kommentare

  1. Wilfried Monka

    Umsonst ist der Tod, und er kost lebe!

    vor 2 Wochen
  2. Anonym

    Denke es hilft nicht nur den Patienten sondern auch den Ärzten Eine sehr gute Sache

    vor 2 Wochen

Ihr Kommentar

Wollen Sie namentlich in der Diskussion genannt werden?

Schliessen Kreuz Created with Sketch.

Regelmäßige Neuigkeiten aus dem Land der Gesundheit