DataCite-Best-Practice-Guide

Ein Leitfaden für mehr Interoperabilität

Um die Auffindbarkeit und Nachnutzung und damit den Mehrwert von Forschungsdaten zu befördern, empfiehlt sich zur Beschreibung der Daten die Verwendung eines verbreiteten Metadatenschemas. Das vom gleichnamigen Konsortium herausgegebene DataCite Metadata Schema hat sich inzwischen als weltweit eingesetztes Modell etabliert.

Jedoch muss festgestellt werden, dass der Konsens über die Verwendung eines einheitlichen Metadatenschemas zur Erfassung von Metainformationen allein nicht ausreicht, um Interoperabilität zu gewährleisten: Fehlende Regeln zur Erfassung von Metadaten führen zu Variabilität und damit zu einer erschwerten, wenn nicht gar unmöglichen automatisierten Verarbeitung der Informationen durch Forschungsdateninfrastrukturen.

Im Rahmen einer Arbeitsgruppe, an der sich Akteure aus den Bereichen Datengenerierung (Forschungsprojekt Verba Alpina), Datenkuratierung (IT-Gruppe Geiesteswissenschaften und Universitätsbibliothek der Ludwig-Maximilians-Universität München) und Datenaggregation (Projekt GeRDI, Leibniz-Rechenzentrum Garching) beteiligten, wurde vor diesem Hintergrund ein Best-Practice-Guide für DataCite entworfen, um durch eine stärkere Normierung der Eingaben die Interoperabilität von (Meta-)Daten zu erhöhen.

Was ist DataCite?

Seit seiner Gründung im Jahr 2009 ist das internationale DataCite-Konsortium maßgeblich daran beteiligt, die Anliegen des Forschungsdatenmanagements in den Wissenschaften voranzubringen. Hierzu zählt insbesondere das DataCite Metadata Schema, das inzwischen in Version 4.3 vorliegt. DataCite ist zudem eine der reichweitenstärksten Institutionen zur Registrierung von Digital Object Identifiern (DOI).

Warum bedarf es einer Best-Practice?

Bei der Evaluierung verschiedener DataCite-Dateien ergab sich der Befund, dass trotz der Verwendung eines einheitlichen Metadatenschemas wenig Standardisierung existierte. Angestrebt wurde daher zum einen eine Art Werkzeugkasten zur Unterstützung von Forschenden bei der Befüllung des DataCite-Formats, zum anderen eine stärkere Normierung der Eingaben, um die Metadatenqualität zu verbessern und damit die Nachnutzung der (Meta-)Daten zu befördern.

Was wird durch den Best-Practice-Guide erreicht?

Mit dem Best-Practice-Guide wird Forschenden eine Handreichung gegeben, die auf einer knappen Seitenzahl einen an die Zielgruppe angepassten niederschwelligen Zugang bietet. Forschende werden dabei unterstützt, ihre Forschungsergebnisse selbstständig mit qualitativ hochwertigen Metadaten auszustatten. Dadurch wird die Qualität der im Repositorium veröffentlichten Daten verbessert und ihre Sichtbarkeit erhöht. Eine spezifische Beschreibung der Daten wiederum erleichtert den Repositoriumsnutzern die Recherche und Relevanzentscheidung.

Welche Eigenschaften zeichnen den Best-Practice-Guide aus?

Der Guide stellt ein klar strukturiertes, konzises Arbeitsinstrument dar, das überdies mit einer Reihe von Beispielen aus der Praxis unterlegt ist. Er schreibt eine striktere Handhabung von optionalen bzw. empfohlenen Feldern/Attributen vor und spezifiziert Konventionen, wenn der DataCite-Standard eine mehrdeutige Eingabe zulässt. Einschränkungen sind auch bei Attributen von optionalen oder mandatorischen Feldern vorgesehen. Konventionen, die momentane Ambiguitäten im Standard umgehen, wurden als Vorschläge an das DataCite-Konsortium übermittelt.

Weiterführende Links