Formate erhalten
Für die wissenschaftliche Nutzung, Langzeitarchivierung und verlustfreie Konvertierung von Daten…
Wichtige Schritte nachvollziehbar machen
Auf ihrem Weg durch den Datenlebenszyklus, von der Erstellung bis hin zur Datennachnutzung, unterliegen Forschungsdaten verschiedenen Veränderungen. Damit der Werdegang der Daten langfristig nachvollziehbar bleibt, kann ein „Data-Curation-Profile“ angelegt werden. Ein Data-Curation-Profile entsteht während der Verarbeitung der Daten und kann als eine Dokumentation der Geschichte der Daten verstanden werden. Die Dokumentation der Datengeschichte hilft den Überblick zu behalten und unterstützt die Überprüf- und Nachnutzbarkeit, falls die Daten bspw. in Repositorien veröffentlicht werden.
Ein Data-Curation-Profile besteht meist aus den folgenden drei Elementen:
• Eine Beschreibung des Datensatzes und Informationen über dessen Lebenszyklus.
• Informationen über alle relevanten Maßnahmen, die getätigt wurden, um den Datensatz zu managen, zu organisieren, zu teilen, zu verändern und zu erhalten.
• Angaben zu offenen Fragen und ungelösten Problemen hinsichtlich der getroffenen Maßnahmen im Umgang mit den Daten.
Ein entsprechendes Toolkit[1] zur effizienten Erstellung eines eigenen Data-Curation-Profiles kann von der Website der Purdue University heruntergeladen werden. Neben einer Anleitung und weiteren Informationen beinhaltet das Toolkit eine frei verwendbare Vorlage, die unter einer Creative-Commons-Lizenz veröffentlicht wurde. Zur zusätzlichen Arbeitserleichterung gibt es auf dieser Grundlage eine Kurzfassung der Vorlage und Beispielprofile, die einen ersten Einblick in den Aufbau und die Verwendung von Data-Curation-Profilen ermöglichen.
Abhängig von ihrer Funktion im Datenlebenszyklus ist es bisweilen notwendig, Daten in unterschiedliche Dateiformate zu konvertieren. Gründe hierfür liegen bspw. in den Erfordernissen für eine Langzeitarchivierung der Daten, für einen Datenaustausch, für die Zusammenarbeit in einer Forschungsgruppe oder der Aufrechterhaltung der Funktionalität in anderen Softwareumgebungen. Dabei ist zu beachten, dass eine Konvertierung sowohl Verluste je nach Format verursachen kann als auch zu einer inhaltlichen Veränderung der Daten führen kann.
Die Konvertierung der Daten ist dabei an mehreren Stellen im Datenlebenszyklus möglich:
• Phase der Datenerstellung: Wahl der Dateiformate, Hinzufügen von Informationen und Optimierung der Datensätze (Lesbarkeit)
• Bereinigung, Umstrukturierung, Ergänzung und Modifikation der Datensätze
• Anonymisierung personenbezogener und sensibler Daten
1.↑ Carlson, J. (2010). The Data Curation Profiles Toolkit: The Profile Template. Data Curation Profiles Toolkit. Paper 4.