Programmiersprachen Python & R

Die beiden Programmiersprachen R und Python können, insbesondere in Kombination mit R Markdown oder JupyterLab (Jupyter Notebooks), die Datenaufbereitung und -analyse, deren Dokumentation sowie die Reproduzierbarkeit der Ergebnisse unterstützen. Folgend eine Sammlung vor allem von Tutorials, die den Einstieg in R und Python für geisteswissenschaftlich Forschende erleichtern können:

Programmiersprache Python

Python für Historiker*innen

ALTHAGE, Melanie, Martin DRÖGE, Torsten HILTMANN und Philipp SCHNEIDER, 2022. Python für Historiker:innen. Ein anwendungsorientierter und interaktiver Einstieg. Jupyter Book. v1.0. DOI 10.5281/ZENODO.6868043.

Die Einführung vermittelt Grundlagen zur Skriptsprache Python, konkrete Use-Cases für Historiker*innen werden sukzessive ergänzt.

Python für Geisteswissenschaftler*innen

ANDRESEN, Melanie, 2021. Python für Geisteswissenschaftler*innen.

Materialien zum Kurs Python für Geisteswissenschaftler/innen von Melanie Andresen an der Universität Hamburg 2018-2020. Auch zum Selbststudium geeignet. Themen sind Variablen und Datentypen, Reguläre Ausdrücke, Bedingungen, Schleifen, Bibliotheken wie NumPy, spaCy, pandas etc.

Python für Linguist*innen

HAMMOND, Michael, 2020. Python for Linguists. Cambridge: Cambridge University Press.

Speziell für Linguist*innen mit wenig oder gar keiner Programmiererfahrung als Einführung in Python. Die Beispiele beziehen sich auf linguistische Daten zu den Themen Suche, Textmanipulation und Text-Encoding.

Humanities Data Analysis: Case Studies with Python

KARSDORP, Folgert, Mike KESTEMONT und RIDDELL ALLEN, 2021. Humanities Data Analysis: Case Studies with Python. Princeton: Princeton University Press.

Es handelt sich um einen praktischen Leitfaden für die datenintensive Forschung in den Geisteswissenschaften. Ursprünglich 2021 als gedrucktes Buch (Princeton University Press) veröffentlicht, ist es auch als interaktives Jupyter-Buch im Open Access verfügbar. Das Buch behandelt die Datenverarbeitung mit Python: Techniken zum Sammeln, Bereinigen, Darstellen und Transformieren von tabellarischen und textuellen Daten. Themen sind: Netzwerkanalyse, Genretheorie, Autorenzuordnung, Mapping, Stilometrie, Themenmodellierung etc. Das Buch zeichnet sich durch Fallstudien auf der Grundlage verfügbarer Datensätze und Übungen am Ende jedes Kapitels aus.

Python Tutorials for Digital Humanities

MATTINGLY, William. Python Tutorials for Digital Humanities. YouTube.

YouTube-Kanal mit zahlreichen englischsprachigen Videos zu spaCy, pandas, NER, Topic Modeling, Textklassifikation, Machine Learning, Netzwerkanalyse (PyVis), JSON-Dateien mit Python etc.

Introduction to BookNLP

MATTINGLY, William, 2022. Introduction to BookNLP.

Jupyter Book über die Pythonbibliothek BookNLP. BookNLP ist auf längere englischsprachige Dokumente/Bücher ausgerichtet, soll aber in den nächsten Jahren auch für andere Sprachen entwickelt werden.

Programming Historian. Tutorials zu Python

PROGRAMMING HISTORIAN. Tutorials zu Python.

Englischsprachige Tutorials zu den Themen Clustering mit scikit-learn, Jupyter Notebooks, Datenvisualisierung mit bokeh und pandas, N-grams, HTML-Verarbeitung mit Python, Bildklassifikation etc.

Englischsprachige YouTube-Videos zu den Themen: Pandas, Matplotlib und Python im Allgemeinen

SCHAFER, Corey. YouTube-Tutorials.

Englischsprachige YouTube-Videos zu den Themen: Pandas, Matplotlib und Python im Allgemeinen. Aber auch zu Django, Flask, JavaScript, SQL und Git.

Tutorial zum NLTK-Package

SCHUMACHER, Mareike und Michael VAUTH, 2022. Preprocessing mit NLTK. forText.

Tutorial zum NLTK-Package, das hier hauptsächlich für die Textbereinigung verwendet wird.

Hacking the Humanities Tutorials

VIERTHALER, Paul, 2018. Hacking the Humanities Tutorials.

YouTube-Videos, die eine Einführung in Python für die Geisteswissenschaften bieten. Themen sind: Python Basics, Pandas, NLTK, Matplotlib, Stylometrie, Topic Modeling, Webscraping ... Der Kanal bietet auch andere Playlists zu Netzwerkanalyse, Topic Modeling, objektorientierte Programmierung usw. an.

Introduction to Cultural Analytics & Python

WALSH, Melanie, 2021. melaniewalsh/Intro-Cultural-Analytics, Version 1. Introduction to Cultural Analytics & Python.

Melanie Walsh stellt Methoden wie Web Scraping, APIs, Topic Modeling, Named Entity Recognition, Netzwerkanalyse und Mapping vor. Als Beispieldaten werden Songtexte, Kurzgeschichten, Zeitungsartikel, Tweets, Reddit-Posts und Filmdrehbücher verwendet.

Programmiersprache R

Sammlung englisch- und französischsprachiger Ressourcen zu R in den Geistes- und Sozialwissenschaften

FÉDÉRATION DE RECHERCHE COLLÈGE INTERNATIONAL DES SCIENCES TERRITORIALES. Rzine. Rzine.

Sammlung englisch- und französischsprachiger Ressourcen zu R in den Geistes- und Sozialwissenschaften.

Computational Historical Thinking. With Applications in R

MULLEN, Lincoln A., 2018. Computational Historical Thinking. With Applications in R.

Ein Work in Progress-Buch, das zeigt, wie geschichtswissenschaftliche Fragestellungen mit R bearbeitet werden können. Themen sind explorative Datenanalyse, Textanalyse, Netzwerkanalyse und Mapping.

Programming Historian. Tutorials zu R.

PROGRAMMING HISTORIAN. Tutorials zu R.

Englischsprachige Tutorials zu den Themen Netzwerkanalyse, Korrespondenzanalyse, tabellarische Daten, Stilometrie etc.

Text Mining with R: A Tidy Approach

SILGE, Julia und David ROBINSON, 2017. Text Mining with R: A Tidy Approach.

Website zum Buch Text Mining with R! A Tidy Approach, das sich auf der Basis des R-Pakets tidytext dem Textmining nach den Prinzipien von „Tidy Data“ widmet. Das Paket ermöglicht, die Analyse von Texte in Tabellenform, so dass gängige Analyse- und Visualisierungspakete auch auf Texte angewendet werden können. Das Buch enthält viele Codebeispiele, wenige Formeln und erfordert keine Vorkenntnisse im Textmining. Kenntnisse über dpylr, ggplot2 und den %>% Operator in R sind jedoch hilfreich.

R for Data Science

WICKHAM, Hadley und Garrett GROLEMUND, 2017. R for Data Science.

Online-Version des Buches R for Data Science. Es handelt sich nicht um eine Ressource speziell für die Geisteswissenschaften, wird aber als grundlegende Einführung in R empfohlen.

Visualisierung sprachlicher Daten mit R

WOLFER, Sascha und Sandra HANSEN-MORATH, 2018. Visualisierung sprachlicher Daten mit R. In: Noah BUBENHOFER und Marc KUPIETZ (Hrsg.), Visualisierung sprachlicher Daten: Visual Linguistics – Praxis – Tools [online]. Heidelberg: Heidelberg University Publishing.

Buchkapitel zur Visualisierung linguistischer Daten mit R. Anwendungsorientierte Einführung in R, mit praktischen Übungen und Anwendungsbeispielen, die verschiedene Pakete (graphics, vcd, effects, ggplot2, rCharts) vorstellt.

R Markdown: The Definitive Guide

XIE, Yihui, J. J. ALLAIRE und Garrett GROLEMUND, 2022. R Markdown: The Definitive Guide.

Buch über die Erstellung von R Markdown Notebooks zur Unterstützung der Reproduzierbarkeit von Forschungsergebnissen. R-Code, dynamisch generierte Ergebnisse sowie Text, Bilder und Formeln können in einem einzigen Dokument kombiniert werden. Damit sind ausführbare Publikationen möglich. Verschiedene statische und dynamische Ausgabeformate (PDF, Word, HTML, Beamer, ...) können erzeugt werden.