BERD@NFDI

Konsortium für die Wirtschafts- und Sozialwissenschaften

Die allgegenwärtige „Datafication“ – sprich eine stetige Generierung von Datenspuren im Internet in einer digital transformierten Gesellschaft und Wirtschaft – stellt auch die Forschung vor große Herausforderungen. Die entstehenden Daten sind charakterisiert durch ein enormes Datenvolumen, Unstrukturiertheit und Heterogenität (z.B. Bilder, Videos, unstrukturierter Text aus Social Media). Um ein umfassendes Gesamtbild wirtschaftlicher und gesellschaftlicher Abläufe zu bekommen, ist deren Analyse unentbehrlich, doch die wenigsten Forschenden und Infrastrukturen in den Wirtschafts- und Sozialwissenschaften sowie angrenzender Bereiche sind hierfür ausreichend gewappnet. Daher benötigen Forschende innovative und nachnutzbare Methoden, insbesondere aus den Gebieten der Künstlichen Intelligenz und des Maschinellen Lernens, um diese Daten so organisieren und strukturieren zu können, dass sie für wissenschaftliche Analysen nutzbar sind.

Vor diesem Hintergrund ist der Kern der BERD-Infrastruktur eine Plattform, welche einen integrierten Zugang zu unstrukturierten Daten und Machine Learning Algorithmen für deren Vorverarbeitung, Aufbereitung, Anreicherung und wissenschaftliche Analyse bietet. Das Serviceportfolio umfasst zudem u.a. Unterstützung beim Harvesten unstrukturierter Daten, Mechanismen der Qualitätssicherung, Normalisierung und Anonymisierung sowie verschiedene Aus- und Weiterbildungsprogramme für Forschende. Damit ist es die Mission von BERD@NFDI, eine zukunftsorientierte und leistungsfähige Forschungsdateninfrastruktur für unstrukturierte Daten zu entwickeln, dauerhaft bereitzustellen und zu betreiben, mit einem klaren Bekenntnis zur Offenheit (z.B. open software, open standards) und Nachvollziehbarkeit (insb. FAIR data principles).