Datenanreicherung mit OpenRefine
OpenRefine ist ein vielseitig einsetzbares Werkzeug zur Aufbereitung von (ungeordneten) Daten, die in Tabellenform vorliegen. Die Open-Source-Software läuft auf einem lokalen Rechner und wird über eine Oberfläche im Webbrowser bedient. Daten können analysiert, sortiert, bereinigt, vereinheitlicht und mit externen Datenquellen angereichert werden (beispielsweise über verschiedene Webschnittstellen wie Wikidata, GND, …).
Nachfolgend einige Hinweise auf weiterführende Informationen und Tutorials, die den möglichen Einsatz in verschiedenen Disziplinen (Geschichte, Sozialwissenschaften, Archivarbeit) aufzeigen:
- Auf der Website von OpenRefine werden einige Einführungsvideos und eine Dokumentation zur Verfügung gestellt.
- histHub bietet eine umfangreiche Blogserie zu OpenRefine.
- Das FDMLab@LABW bietet zwei Selbstlern-Workshops zu OpenRefine für den Archivalltag, die sich aber auch allgemein als Einführung eignen.
- Alexander Goebbels (2022). Open Refine als Tool für HistorikerInnen - Mise en Place in der Tabellen-Küche.
- Data Carpentry-Tutorial für sozialwissenschaftliche Daten, aber auch als allgemeine Einführung geeignet.
- Programming Historian-Tutorial: Cleaning Data with OpenRefine
- Programming Historian-Tutorial: Fetching and Parsing Data from the Web with OpenRefine