Matthias Groeneveld / Pixabay / Pixabay-Lizenz

FAIRe Daten

Wie die FAIR-Prinzipien umgesetzt werden können

Forschungsdaten sollen laut der GO FAIR-Initiative FAIR sein. Das Akronym FAIR steht für Findable (Auffindbar), Accessible (Zugänglich), Interoperable (Interoperabel) und Reusable (Wiederverwendbar).

Paulina Halina Sieminska / CC BY SA 4.0

Graphik: Paulina Halina Sieminska / Bearbeitung: Dr. Ilona Lang / CC BY-SA 4.0


Ziel ist es, dass Forschungsdaten für Menschen und Maschinen optimal aufbereitet und zugänglich sind. Dies impliziert aber nicht, dass jeder Datensatz uneingeschränkt nachnutzbar ist. Vielmehr zielen die FAIR-Prinzipien darauf, im Rahmen des rechtlich und technisch Möglichen, Datenbestände für neue Nutzungsszenarien zu öffnen. Mit der Anwendung der FAIR-Prinzipien soll die Wiederverwendbarkeit von Datenbeständen verbessert werden.

Die FAIR-Prinzipien laut GO FAIR

Auffindbarkeit

F1. (Meta-) Daten erhalten eine global eindeutige und dauerhafte Kennung.

F2. Daten werden mit umfangreichen Metadaten beschrieben (siehe R1).

F3. Metadaten enthalten eindeutig und explizit die Kennung der von ihnen beschriebenen Daten.

F4. (Meta-) Daten werden in einer durchsuchbaren Ressource registriert oder indiziert.

Mehr erfahren

Zugänglichkeit

A1. (Meta-) Daten können anhand ihrer Kennung unter Verwendung eines standardisierten Kommunikationsprotokolls abgerufen werden.

  • A1.1 Das Protokoll ist offen, kostenlos und universell implementierbar.
  • A1.2 Das Protokoll ermöglicht bei Bedarf ein Authentifizierungs- und Autorisierungsverfahren.

A2. Auf Metadaten kann zugegriffen werden, auch wenn die Daten nicht (mehr) verfügbar sind.

Mehr erfahren

Interoperabilität

I1. (Meta-) Daten verwenden eine formale, zugängliche, gemeinsame und allgemein anwendbare Sprache für die Wissensrepräsentation.

I2. (Meta-) Daten verwenden Vokabulare, die den FAIR-Prinzipien folgen.

I3. (Metadaten) enthalten qualifizierte Verweise auf andere (Meta-) Daten.

Mehr erfahren

Wiederverwendbarkeit

R1. (Meta-) Daten werden mit einer Vielzahl genauer und relevanter Attribute ausführlich beschrieben.

  • R1.1. (Meta-) Daten werden mit einer eindeutigen und zugänglichen Datennutzungslizenz veröffentlicht.
  • R1.2. (Meta-) Daten sind mit detaillierten Informationen über die Entstehung versehen.
  • R1.3. (Meta-) Daten entsprechen domänenrelevanten Community-Standards.

Mehr erfahren

Geprägt wurde der Begriff FAIR von der FORCE 11-Community, die auch die Definition der Begriffe (siehe obige Infobox) erarbeitet hat. Die FAIR-Prinzipien wurden von der Europäischen Kommission 2017 in den Förderrichtlinien EU Horizon 2020 aufgenommen und sind bei einem Antrag dieser Förderlinie verpflichtend. Das Motto lautet dabei: „As open as possible, as closed as necessary.“ Auch die NFDI hat sich die „Etablierung eines Forschungsdatenmanagements nach den FAIR-Prinzipien“ auf die Fahne geschrieben.

Warum die Umsetzung der FAIR-Prinzipien vorteilhaft ist

  • Auffindbarkeit von Datensätzen nimmt zu.
  • Sichtbarkeit steigt bei einer leichten Auffindbarkeit und Zugänglichkeit von Datensätzen.
  • Forschung wird effizienter, da doppelte Erhebungen oder Mehrfacharbeit vermieden werden.
  • Forschungsergebnisse werden nachvollziehbarer, wenn die Daten zu einer Publikation mitveröffentlicht werden.
  • Neue Forschungsfragen entstehen, beispielsweise aus den Erkenntnissen einer vorherigen Studie und dem dazugehörigen Datensatz.
  • Zusammenarbeit wird erleichtert – sowohl im Forschungsprojekt als auch weltweit.

Zusammengefasst machen die FAIR-Prinzipien Forschung und Forschungsergebnisse transparenter und effizienter. So steigt z. B. die Qualität der Daten durch Rückmeldungen von Forscherkolleginnen und –kollegen und kostspielige Doppelerhebungen werden bestenfalls vermieden.

In einem Artikel in Nature von Wilkinson u.a. hieß es diesbezüglich auch: „Good data management is not a goal in itself, but rather is the key conduit leading to knowledge discovery and innovation, and to subsequent data and knowledge integration and reuse by the community after the data publication process.“ 

Wie die Umsetzung der FAIR-Prinzipien gelingen kann

Auffindbarkeit

  • Damit ihre Daten auffindbar sind, benötigen sie möglichst umfangreiche Metadaten, wie eine Beschreibung des Autors, des Projekts und der enthaltenen Stichprobe. Diese Metadaten sollten eindeutig mit ihrem Datensatz verknüpft sein. Dies erreichen Sie beispielsweise durch die Nennung des Datei-Namens und Ablageorts, auf den Sie sich beziehen.
  • Des Weiteren brauchen Sie eindeutige und dauerhafte Identifikatoren für Ihre Daten. Persistente Identifikatoren wie DOI oder URN sind anders als gewöhnliche Hyperlinks unveränderlich und gewährleisten damit die langfristige Auffindbar- und Zitierbarkeit.
  • Alle Informationen über Ihren Datensatz sollten an einem Ort abgelegt sein, den andere Forschende und Internet-Crawler durchsuchen können. Auf Ihrem privaten Rechner ist dies zwar für Sie der Fall, nicht aber für andere Personen. Daher bietet es sich bei Daten an, diese in einem Repositorium abzulegen.

Mehr erfahren

Zugänglichkeit

Die Ablage Ihrer Daten in einem Repositorium ist eine gute Wahl, da diese dadurch für andere Forschende leichter auffindbar und zugänglich werden. Insbesondere gewährleisten Repositorien folgende Aspekte:

  • Zugängliche (Meta-) Daten über einen Identifier mit einem standardisierten Kommunikationsprotokoll (z.B. HTTPS).
  • Die Verwendung eines offenen, freien und universell implementierbaren Protokolls.
  • Das Repositorium sollte außerdem eine Authentifizierung und Autorisierung, wenn nötig, erlauben. Dies bieten viele Repositorien beispielsweise dann an, wenn sie sensible Daten nur begrenzt zugänglich machen wollen bzw. dürfen. Die Metadaten bleiben dann in der Regel aber zugänglich, auch wenn die eigentlichen Daten nicht zur Verfügung stehen.

Mehr erfahren

Interoperabilität

  • Daten gelten als interoperabel, wenn sie ausgetauscht, interpretiert und in einer (semi-) automatisierten Weise mit anderen Datensätzen kombiniert werden können.
  • Computersysteme müssen folglich erfassen können, ob die Daten inhaltlich mit anderen Daten vergleichbar sind.
  • Dabei sollen Metadaten verwendet werden, die auf kontrollierten Vokabularen, Klassifikationen, Ontologien oder Thesauren basieren. Dadurch stellen Sie sicher, dass Sie für die Beschreibung Ihrer Daten Begriffe verwenden, auf die sich Ihre wissenschaftliche Community weitestgehend geeinigt hat. Fachbegriffe die schnell wieder veralten oder schon nicht mehr gängig sind, sollten nicht verwendet werden, da sie nicht nachvollziehbar sind.
  • Eine Verknüpfung von Metadaten zu anderen Datensätzen soll über persistente Identifikatoren erfolgen.
  • Die Metadatenschemata und Vokabulare, die man nutzt, sollten ihrerseits den FAIR-Prinzipien genügen, also auffindbar, zugänglich, interoperabel und nachnutzbar sein.

Mehr erfahren

Wiederverwendbarkeit

  • Unverzichtbar für die Wiederverwendbarkeit von Datensätzen sind hochwertige Metadaten, denn dies erleichtert nicht nur den Vergleich mit anderen Datensätzen, sondern auch die Nachnutzung in Folgeprojekten.
  • Forschungsdaten müssen zitierbar sein. Um solche Zitationen langfristig nachvollziehbar zu machen, empfiehlt sich die Vergabe von persistenten Identifikatoren, wie etwa DOI.
  • Forschungsdaten sollten mit einer eindeutigen Lizenz (z.B. eine Creative Commons-Lizenz) versehen sein, sodass die Bedingungen für die Nachnutzung für Menschen und Maschinen transparent sind.

Mehr erfahren

Unterstützung bei der Umsetzung

Bei der Umsetzung der FAIR-Prinzipien treten einige Aspekte doppelt auf. So sind umfangreiche Metadaten für die Auffindbarkeit ebenso unverzichtbar wie für die Wiederverwendbarkeit Ihrer Daten. Deswegen ist der Aufwand für das Erstellen eines eigenen FAIRen Datensatzes insgesamt nicht zu hoch. Wenn Sie ihre Daten einem vertrauenswürdigem, z. B. zertifizierten Repositorium übergeben, kann dieses Repositorium Ihnen dabei helfen, die FAIR-Prinzipien zu erfüllen. Unterstützung erhalten Sie auch von der FDM-Beratungsstelle Ihrer Einrichtung. Zudem bietet auch Open Aire Beratungen zu den FAIR-Prinzipien an.

Die FAIR-Prinzipien und Open Data

FAIRe Daten sind nicht gleichzusetzen mit Open Data. Denn es ist beispielsweise aus wirtschaftlichen und rechtlichen Gründen nicht immer möglich, freien Zugang zu Daten zu gewähren. Einschränkungen des Zugriffs sind mit den FAIR-Prinzipien vereinbar, solange die Bedingungen und Wege zum Zugang ersichtlich sind.