E. Böker / CC BY 4.0

Persistente Identifikatoren

Digitale Objekte dauerhaft zitierbar und nachnutzbar halten

E. Böker /  CC BY 4.0

Was ist ein persistenter Identifikator?

Gutes Forschungsdatenmanagement zeichnet sich unter anderem dadurch aus, dass wissenschaftliche Datensätze für Dritte leicht nachnutzbar sind. Hierbei geht es vor allem um einheitliche Standards und Formate und das Versehen der Datensätze mit genügend Metadaten. Dies allein reicht jedoch nicht aus, denn vor der Nachnutzung muss ein potentieller Interessent die Daten auch finden können.

Ein Persistent Identifier ist definiert als ein dauerhafter (persistenter), digitaler Identifikator, bestehend aus Ziffern und/oder alphanumerischen Zeichen, welcher einem Datensatz (oder einem anderen digitalen Objekt) zugeordnet wird und direkt auf diesen verweist.

Bisher waren wissenschaftliche Datensätze, wenn sie überhaupt für Dritte zugänglich gemacht wurden, zumeist über bestimmte Webadressen (URLs) oder Verlinkungen auf diese Adressen zu erreichen. Aus der Perspektive eines effizienten Forschungsdatenmanagements ist dies aus verschiedenen Gründen problematisch.

URLs verweisen nicht auf einen bestimmten Inhalt, sondern auf einen ‚Ort‘ im Internet. Wird der gewünschte Inhalt, wie bspw. ein wissenschaftlicher Datensatz, an einen anderen Ort verschoben, so wird die URL zur Auffindung desselben nutzlos. Weiterhin ist es häufig der Fall, dass ein Datensatz an mehreren Orten im Internet veröffentlicht wird, so dass sich mehrere URLs auf ihn beziehen, was für eine zuverlässige wissenschaftliche Zitierbarkeit unpraktisch ist. Und nicht zuletzt enthalten URLs häufig semantische Hinweise auf die Domain, auf welcher sie basieren und eignen sich deswegen nicht als neutrale Identifikatoren.

Aus den oben genannten Gründen wurde das Konzept des Persistent Identifier entwickelt, welches sich in der wissenschaftlichen Gemeinschaft in den vergangenen Jahren weithin als Standard für die Identifikation digitaler Objekte durchgesetzt hat.

Übersicht über ausgewählte persistente Identifikatoren

Für Daten und digitale Objekte

Für Daten und digitale Objekte hat sich als Standard der Digital Object Identifier (DOI) herausgebildet. Ein DOI kann ähnlich einer ISBN zur Identifizierung eines Objektes eingesetzt werden. Er besitzt die Funktion, dieses exakt zu lokalisieren, sodass wissenschaftliche Ergebnisse zuverlässig und in standardisierter Form zitiert werden können. Ein weiterer persistenter Identifikator für Daten und digitale Objekte ist der Uniform Resource Name (URN).

Mehr erfahren

Für Personen

Um Personen eindeutig identifizieren zu können, wurde ORCID (Open Researcher Contributor Identification Initiative) entwickelt. Hier bekommt eine Person eine Ziffernkennung zugeordnet, sodass sie auch bei Namens- oder Institutionswechsel zu identifizieren ist. Die ORCID ID wird über eine Selbstregistrierung vergeben. Die Erstellerinnen und Ersteller geben die Informationen in ihrem ORCID-Profil selbst ein.

Mehr erfahren

Für Institutionen

Für die eindeutige Bezeichnung und Schreibweise einer Einrichtung gibt es das Research Organization Registry (ROR ID).

Mehr erfahren

Für Personen und Institutionen

Die Gemeinsame Normdatei (GND) wird durch die Deutsche Nationalbibliothek koordiniert und von vielen wissenschaftlichen Bibliotheken gemeinsam gepflegt, sodass die Angaben kuratiert werden. Zur Verknüpfung zwischen GND und ORCID gibt es erste Verfahren. Unter anderem nutzt Wikipedia Deutschland die GND zur Referenzierung.

Mehr erfahren

Aufbau eines persistenten Identifikators

Häufig verwendete Identifikator-Systeme sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names). Ein DOI-Identifikator könnte beispielsweise so aussehen:

forschungsdaten.info (CC0)

Die Vergabe von DOI oder URN übernehmen die Repositorien als Aufgabe. Forschende sollten lediglich vorrangig darauf achten, dass das Repositorium persistente Identifikatoren nutzt.

Die Deutsche Nationalbibliothek bietet einen kostenlosen URN-Vergabe-Service für wissenschaftliche Datensätze von Wissenschaftlern und Autoren einer deutschen Einrichtung im Namensraum urn:nbn:de. Neben dem URN-Vergabe-Service bietet die Deutsche Nationalbibliothek auch einen URN-Resolving Dienst für Deutschland und die Schweiz an.

Für eine kostenlose DOI-Vergabe können sich deutsche Einrichtungen an die vier deutschen Mitglieder von Data Cite (GESIS, TIB, ZB MED und ZBW) wenden. DOI-Resolving-Dienste sind unter anderem auf den Seiten von CrossRef, Data Cite und der International DOI Foundation aufgelistet.