FAIR*es Datenmanagement in der Klinischen Forschergruppe 5002
Autorin: Theresa Bender, CP2
In der KFO5002 fallen viele verschiedene Datentypen aus den unterschiedlichen Teilprojekten und aus verschiedenen Instituten an. Diese reichen von einfachen Tabellen über Sequenzierungsergebnisse bis hin zu strukturierten Patientendaten. Ein Austausch der erhobenen bzw. gemessenen Daten spielt dabei für das Konsortium eine große Rolle. Dafür ist auch die Nachvollziehbarkeit und Reproduzierbarkeit der Daten entscheidend - ein FAIRes (https://doi.org/10.1038/sdata.2016.18) Datenmanagement bietet Dies und noch mehr.
Der Aufbau einer geeigneten Infrastruktur für ein solches Datenmanagement ist die Aufgabe der Medizinischen Informatik in der Leitung von CP2. Als erstes gilt es dabei, die verschiedenen Datenquellen zu identifizieren und an einem Ort FAIR zugänglich zu machen. Datensicherheit und -schutz sind in Anbetracht der zuvor beschriebenen Datentypen besonders zu beachten - das Gleichgewicht zwischen Schutz der Daten und Nutzbarkeit der Daten zu finden ist durchaus eine Herausforderung.
Durch die Integration der Daten, die komplexe Netzwerk-Konzepte zur Folge haben, müssen vor allem Rollen und Rechte für die Nutzung der Daten als Teil der FAIRness mit dem gesamten Konsortium konsentiert werden. Darüber hinaus ist es nicht nur für die Nutzbarkeit der Daten innerhalb des Konsortiums, sondern auch für mögliche Publikationen wichtig, dass entsprechende Metadaten nicht nur erhoben, sondern auch auf geeignete Weise mit den Daten gespeichert werden.
Für die Umsetzung des Datenmanagements setzen wir auf bewährte Methoden und Werkzeuge, die bereits in früheren Projekten erfolgreich zum Einsatz gekommen sind (https://doi.org/10.1055/s-0040-1709158). Aktuell liegt der Fokus auf dem Aufbau eines FAIRDOM/SEEK-Repositoriums (https://fairdomhub.org/). Begleitet von Schulungen unterstützen wir die Mitglieder des Konsortiums in der FAIRen Ablage ihrer Daten. Für erste Übersichtstabellen aus CP1 sowie für den Sequenzierungsworkflow innerhalb von CP2 ist SEEK bereits als erste Anlaufstelle des Konsortiums etabliert. Um die Akzeptanz der Plattform zu steigern, wurde zudem eine erste Version einer Data Policy abgestimmt. Nach guten Erfahrungen im SFB1190 (https://www.sfb1190.de/) soll diese Policy auch in der KFO5002 die Grundregeln zum Teilen der Daten innerhalb und außerhalb des Konsortiums festlegen, auch über SEEK hinaus.
Natürlich ist der Aufbau eines FAIRen Datenmanagements kein Selbstzweck, vielmehr soll die Nutzung der Systeme auch Spaß machen und die Forschungsarbeit erleichtern. Wie sehen jedenfalls mit Freude, dass sowohl die Anzahl der aktiven Nutzer*innen als auch der Zulauf der Daten eine sehr positive Entwicklung nehmen.
*Findable, Accessible, Interoperable, Reusable
Das könnte Sie auch interessieren