2 Forschung und Lehre

Die fortschreitende Digitalisierung in ganz unterschiedlichen Lebensbereichen zieht Veränderungen und Entwicklungen auch für die historische Arbeit nach sich, und dies auf mehreren Ebenen: in Bezug auf die Arbeit bzw. den Umgang mit Quellen, hinsichtlich des Einsatzes digitaler Methoden nicht nur zur Analyse von Forschungsergebnissen, sondern auch für deren Kommunikation, und schließlich für die Hochschullehre.

Randall Munroe, History Department, xkcd.com (17.12.2018).

2.1 Digitalisierte Quellen, digitale Quellen

Als Historiker:innen steht die Arbeit mit Quellen im Mittelpunkt unserer Analysen. Das bedeutet gleichzeitig, dass der Zugang bzw. die Verfügbarkeit von Dokumenten einen Einfluss darauf hat, welche Fragen wir beantworten oder welche Analysen wir vornehmen können. Zugangsbeschränkungen, die die Größe und Zusammensetzung unseres Untersuchungskorpus beeinflussen, können dabei von Gedächtnisinstitutionen – also Museen, Archiven, Bibliotheken – ausgehen, beispielsweise wenn bei zeitgenössischen Akten eine Schutzfrist festgesetzt wird oder wenn ein Objekt zu fragil für die Benutzung ist. Auch kann es aus finanziellen und/oder organisatorischen Gründen schwierig sein, bestimmte Archive an weiter entfernten Orten aufzusuchen, um weitere Dokumente für die Untersuchung zu berücksichtigen. Groß angelegte Digitalisierungsprojekte in Bibliotheken und Archiven bergen damit die Möglichkeit, zusätzliche Quellen nicht nur über einen Eintrag im Bibliothekskatalog zu finden, sondern die entsprechenden Dokumente in digitaler Form auf den eigenen Rechner zu laden. Gerade auch für wertvolle historische Bestände – antike Papyri, Handschriften aus dem Frühmittelalter, einzelüberlieferte Frühdrucke usw. – entsteht hier die Möglichkeit, diese einem größeren Kreis verfügbar zu machen, ohne das Objekt zu großer Belastung durch häufige Benutzung auszusetzen, und ohne dass die Benutzer:innen lange Reisen auf sich nehmen müssten. Für mittelalterliche und frühneuzeitliche Handschriften und Drucke beispielsweise existieren mittlerweile mehrere (meist nationale) Portale, die eine zentrale Suche über alle Bestände ermöglichen; eine Auswahl findet sich unter Kapitel 2.4.2.

Neben der Digitalisierung vorhandener Quellen (Retrodigitalisierung) steht die unaufhörliche Entstehung neuer Quellen in rein digitaler Form (born digital data). Der relativen Knappheit von Quellen – und damit Daten –, die Vormodernehistoriker:innen oftmals zu beklagen haben, steht eine Überfülle an zeitgenössischem Material gegenüber, und beide Situationen – zu wenig/zu unvollständige und zu viele/zu unübersichtliche Datenmengen – bergen methodische Probleme: Wie stellt man ein Korpus, also eine Sammlung von Quellen zusammen, das ausreichend Dokumente beinhaltet, um Fragestellungen zu beantworten, Thesen zu stützen, neue Erkenntnisse zu erhalten, das aber gleichzeitig in einem Forscher:innenleben bewältigbar bleibt? Historiker:innen müssen neue Kompetenzen erwerben, um mit solchen Fragen reflektiert umzugehen. Zur klassischen Quellenkritik kommt die digitale Quellenkritik, zur Fähigkeit, analoge Quellen zu lesen und zu verstehen, ein Äquivalent für den digitalen Bereich. Etwas ausführlicher geht es in Kapitel 3 um Digital Literacy und Digital Criticism.

2.2 Digitale Tools zur Analyse

Die hier bereits zitierte Definition, die aktive und kritische Nutzung digitaler Werkzeuge in Forschung, Lehre oder Studium sei es, was Digital Humanities ausmachten, wirft die Frage auf, was genau unter digitalen Werkzeugen, unter digital tools zu verstehen ist, und zu welchem Zweck man sie einsetzt. Allein schon das Lesen dieses Guides ist ohne digitale Hilfsmittel nicht möglich – es existiert kein gedrucktes Exemplar davon. Lesen am Bildschirm allein macht noch keinen digital humanist, aber man muss nicht erst eine Programmiersprache lernen, um den Computer für die eigene Arbeit zu nutzen und zu Ergebnissen zu kommen, die mit klassischen Methoden – im Bereich der Geschichtswissenschaften etwa papierbasiertes close reading von Quellen und Forschungsliteratur – nicht im selben Ausmaß erzielt werden könnten.

Untersuchungen, die digitale Methoden einsetzen, sind im Normalfall skalierbar – wenn man eine Software benutzt, die die Häufigkeit von Begriffen in einem Dokument zählt, sollte es keinen Unterschied in der Anwendung machen, ob man eines oder einhundert Dokumente auswerten will. Würde man dasselbe per Hand tun, wäre man analog zum Anwachsen der Dokumente mit der Auszählung beschäftigt. Digitale Werkzeuge ermöglichen es also unter anderem, Untersuchungen auf größere Mengen von Dokumenten auszuweiten. Sie ermöglichen es auch, an ein so erweitertes Korpus andere Fragen zu stellen, als dies mit einer kleineren Quellen-/Datengrundlage möglich wäre. Die vorherrschende Überlieferung historischer Quellen besteht aus Text, handgeschrieben, gemeißelt oder gedruckt – und durch die Möglichkeit, diesen mittels Texterkennung in computerlesbare Daten umzuwandeln, ergeben sich neue Perspektiven für die Arbeit von Historiker:innen: Wenn Texte als Daten verstanden werden, lassen sich aus Textquellen Datenbestände erstellen, die mithilfe quantitativer Methoden untersucht und ausgewertet werden können.¹

Für die Literaturwissenschaften beispielsweise ist ein wichtiges Anwendungsfeld die Überprüfung von Autor:innenschaft: Ob ein anonym überliefertes Werk einem:r namentlich bekannten Autor:in zugeschrieben werden kann, lässt sich entweder durch close reading von Literaturwissenschaftler:innen überprüfen, oder durch die Suche nach patterns, Mustern, nach quantifizierbaren Eigenschaften eines Textes, wie beispielsweise die Häufigkeit von Funktionswörtern, Partikeln, Satzzeichen usw. Der unter dem Pseudonym Robert Galbraith veröffentlichte Kriminalroman The Cuckoo’s Calling konnte mit entsprechender Software Joanne K. Rowling zugeschrieben werden – damit dauerte die Untersuchung dreißig Minuten, was etwa dem Lesen von zwanzig Romanseiten entspricht. Zu einem Artikel, der diesen Fall thematisiert und in das Feld der linguistischen Forensik einbettet, die Straftäter:innen mithilfe quantitativer Textanalyse ermittelt, geht es hier. Ein Video zur Entwicklung und Anwendung von Software zur Zuschreibung von Autor:innenschaft finden Sie hier. Die genutzte Software, JGGAP,² lässt sich offensichtlich auch für historische Analysen nutzen – man denke nur an Herrschaftssysteme, in denen strenge Zensur geübt wird/wurde und viele Autor:innen daher nicht unter ihrem Klarnamen publizier(t)en. Durch eine Identifikation anonymer Schreiber:innen lassen sich weitere Aspekte rund um die Thematik Zensur untersuchen – welche Akteur:innen waren öffentlich bekannt, wer publizierte gleichzeitig anonym und unter Klarnamen, welche Autor:innen schrieben aus dem Exil, welche Netzwerke lassen sich rekonstruieren usw. Dadurch, dass ein Programm durch quantitative Auswertungen die Kärrnerarbeit der Identifikation abnehmen kann – um einen reflektierten Umgang mit Daten und Algorithmen geht es in Kapitel 3 –, bleibt mehr Zeit für die qualitative Arbeit; gleichzeitig fußt die Analyse auf einem aussagekräftigen Datensatz, anstatt nur Einzelbeispiele beleuchten zu können.

Quantitative und qualitative Methoden sollen hier keinesfalls gegeneinander ausgespielt werden; vielmehr soll verdeutlicht werden, dass beide Herangehensweisen Vor- und Nachteile haben, und dass sie im besten Fall gewinnbringend miteinander kombiniert werden können – quantitative Auswertungen nur um ihrer selbst willen und ohne eine spezifische historische Fragestellung generieren kaum je einen Mehrwert.

Je nach Datengrundlage, Analysezweck und Forschungsfrage bieten sich unterschiedliche Tools zur Nutzung an; für die meisten Forschungsvorhaben bis zum Ende des Studiums dürfte existierende Software ausreichen, sei es für die Akquise und Aufbereitung von Daten(-sätzen), für verschiedene Arten von Textanalysen, statistische Auswertungen, Netzwerkanalysen, Geomapping oder Visualisierungen. Eine Auswahl an Tools – alle kostenfrei/open source – für spezifische Analysen findet sich unter Literatur, Tools, Tutorials. Für gewisse Analysen bietet es sich an, Programmierkenntnisse zu erwerben – das Erstellen eigener Skripts, also kleiner Programme, beinhaltet die umfassende Kontrolle darüber, wie Daten eingelesen, aufbereitet, angereichert, analysiert und visualisiert werden; bei wiederkehrenden Prozessen, die händisch einige Arbeitszeit in Anspruch nehmen würden, lässt sich so zusätzlich Zeit sparen.

Für geisteswissenschaftliche Projekte werden zurzeit vor allem zwei Programmiersprachen genutzt, R und Python. Da sich beide großer Beliebtheit in den Humanities erfreuen, existieren mittlerweile zahlreiche Packages, die Data und Text Mining, also groß angelegte Daten- und Textanalysen, sehr einfach machen. Solche Packages für Programmiersprachen kann man sich wie Plug-Ins für Programme vorstellen, beispielsweise ein AdBlocker für den Browser. So etwas war von den Entwickler:innen ursprünglich nicht vorgesehen, aber jemand hatte Bedarf, Werbeanzeigen zu blockieren, hat hierzu ein Programm geschrieben und es der Allgemeinheit zur Verfügung gestellt. Der Unterschied zu einem Package ist, dass dieses verschiedene Funktionen zur Verfügung stellt – auswählen und ausführen müssen die Anwender:innen. Wer in Schule und Studium keine Berührungspunkte mit Programmieren hatte, wird zu Beginn vielleicht größere Berührungsängste haben – aber noch einmal: Sie müssen nicht programmieren können, um quantitativ zu arbeiten. Speziell an Historiker:innen ohne Programmier-Vorkenntnisse richtet sich das Projekt “The Programming Historian”, das seit 2008 zahlreiche Tutorials veröffentlicht, um verschiedene Tools, Techniken und Workflows für die geschichtswissenschaftliche Forschung und Lehre vorzustellen.

2.3 Digitale Tools zur Kommunikation

Auch ohne quantitative/computergestützte Analysen bei der historischen Arbeit selbst bieten sich mithilfe digitaler Unterstützung verschiedene Möglichkeiten an, um Forschungsergebnisse zu kommunizieren. Dies betrifft zum einen unterschiedliche Formen der digitalen Publikation, zum anderen die Nutzung digitaler Tools zur Visualisierung von Ergebnissen. Gedruckte wissenschaftliche Zeitschriften und Buchverlage haben gewisse Kriterien bei der Annahme eines Textes zur Publikation – inhaltliche Qualität ist bei jeder wissenschaftlichen Arbeit wichtig; aber Formalia wie Länge/Umfang/Bebilderung sind für Onlineformate weniger zentral. So können erste Resultate aus einem neuen Forschungsprojekt oder auch Ergebnisse aus einer Seminararbeit einem interessierten Publikum in Form eines Blogbeitrags ohne viel organisatorischen Vorlauf und Rücksicht auf die Auslastung von Druckerpressen präsentiert werden.
Die Zahl der wissenschaftlichen Blogs ist im letzten Jahrzehnt kontinuierlich gestiegen, sodass für verschiedenste Fächer und Themengebiete eine Auswahl an passenden Publikationsorten besteht. Sie verfügen über eine Redaktion, also verantwortlich zeichnende Wissenschaftler:innen, die eine Qualitätssicherung der Beiträge leistet. Auch viele Promotionsprojekte werden von Blogs begleitet – das liefert Sichtbarkeit für die Forschung der Doktorand:innen und bietet eine Plattform für Themen, die in der Dissertation keinen Platz finden, aber doch erwähnenswert sind.
Hypothèses hat sich als eine wichtige Plattform etabliert, die zahlreiche Wissenschaftsblogs hostet; ein Katalog aller Blogs, filterbar nach Themen und Epochen, findet sich hier.
Aus Lehrveranstaltungen und Forschungsprojekten am Departement Geschichte der Universität Basel sind u.a. folgende Blogs hervorgegangen:

Exilland Schweiz. Kulturschaffende und Intellektuelle im Schweizer Exil, 2021–
Global Health Africa. Circulating Knowledge and Innovations, 2019–
Materialized Histories. Materielle Kultur und digitale Forschung, 2021–
Materialized Identities. Objects, Affects and Effects in Early Modern Culture (1450–1750), 2016–2021.
Stadt.Geschichte.Basel. Blog zum Forschungsprojekt, 2019–
The Color Line. Race Relations in Schlüsseltexten amerikanischer Autor:innen (1881–1953), 2022–

Als relativ junges Format haben sich Data Stories etabliert – Narrative, die auf der Basis von (quantitativen oder qualitativen) Daten und Analysen einen Sachverhalt darstellen. Diese Art von (Daten-)Publikation wird u.a. im journalistischen Bereich genutzt, auch, um Interaktivität und Aktualität von Daten zu gewährleisten. Es gibt verschiedene Tools, um solche Stories zu erstellen, zum Teil bereits mit integrierter Publikationsmöglichkeit; eine Auswahl findet sich unter Literatur, Tools, Tutorials.
Ein Beispiel, das auch Input durch die Nutzer:innen ermöglicht, ist Darüber spricht der Bundestag, eine Data Story der “ZEIT”, die alle Reden im deutschen Bundestag seit 1949 analysierbar macht. Ein Beispiel für eine kartenzentrierte Darstellung mit Einbettung verschiedener Medien ist die Reise von Arya aus Game of Thrones. Ein Beispiel für die Nutzung von Volkszählungsdaten stammt vom Schweizer Bundesamt für Statistik, Die Schweiz (er)zählen.

2.4 Projekte und Ressourcen für Forschung und Lehre

2.4.1 Alte Geschichte

Projekte:

D-Scribes: Projekt zur Erkennung antiker Schreiber:innen griechischer und koptischer Papyri

Ressourcen/Portale:

Papyprus Portal: digitale Papyrussammlung
The Arabic Papyrology Database: Datenbank für vormoderne arabische Schriften auf Papyrus, Pergament oder Papier vom 7. bis zum 16. Jahrhundert

2.4.2 Mittelalter und Frühe Neuzeit

Projekte:

Burchards Dekret Digital: Digitale Edition, die die handschriftliche Überlieferung des Decretum Burchardi erschließt.
hallerNet: Editions- und Forschungsplattform mit mehreren Textsammlungen von Gelehrten aus der Übergangszeit zwischen 1700 und 1850, mit Strukturdaten verknüpft
Printed Markets: Projekt zur Digitalisierung und Anreicherung der frühneuzeitlichen Basler Anzeigenzeitung “Avisblatt” (1729–1844)
Repertorium Academicum: Projekt zur Erfassung europäischer Gelehrter zwischen 1250 und 1550

Ressourcen/Portale:

dMGH: Monumenta Germaniae Historica online (Beta-Version)
e-codices: Virtuelle Handschriftenbibliothek der Schweiz
Fragmentarium: Laboratory for Medieval Manuscript Fragments
Handschriftenportal: Zentraler nationaler Nachweis für Buchhandschriften in deutschen Bibliotheken und in deutscher Sprache (Entwicklungsstadium)
Innovating Knowledge: Datenbank und digitale Edition zu Isidors von Sevilla “Etymologiae”
e-manuscripta: Digitalisierte handschriftliche Quellen aus Schweizer Bibliotheken und Archiven
e-rara: Plattform für digitalisierte Drucke aus Schweizer Institutionen
Gallica: Digitalisierte Quellen aus französischen Bibliotheken
Stapfer Enquête: Edition der Helvetischen Schulumfrage von 1799
swisscollections: Suchplattform für historische Schweizer Bestände
transcriptiones: Plattform zum Erstellen, Teilen und Nutzen von Transkriptionen historischer Manuskripte

2.4.3 Moderne und Zeitgeschichte

Projekte:

impresso. Media Monitoring of the Past: Projekt zur Aufbereitung, semantischen Anreicherung, Repräsentation, Exploration und Recherche in historischen Medien (Zeitungen und Radio) über Zeit, Sprachen und Nationalgrenzen hinweg
Living with Machines: Forschungsprojekt über die Auswirkungen der Mechanisierung der Arbeit während der Industrialisierung
Refugee History: Wissenschaftliches Blog und interaktives Netzwerk zu aktuellen Debatten um das Thema “Flüchtlinge”

Ressourcen/Portale:

Datenbank Bild + Ton zur Geschichte (Schweizer) sozialer Bewegungen
Dodis: Wissenschaftliche Edition von Dokumenten zur Schweizer Außenpolitik
Gallica: Digitalisierte Quellen aus französischen Bibliotheken
e-newspaperarchives.ch: Schweizer Zeitungen online
e-periodica: Schweizer Zeitschriften online
Historische Statistik der Schweiz (HSSO)
histat: Zeitreihen zur Historischen Statistik

2.4.4 Jüdische Geschichte

Projekte:

Digital Jewish Studies Online, Stroum Center for Jewish Studies, University of Washington

Ressourcen/Portale:

Blavatnik Archive: Archiv zur Erhaltung und Verfügbarmachung von Material zur (jüdischen) Geschichte des 20. Jahrhunderts mit Fokus auf die zwei Weltkriege und Sowjetrussland.
Menny, Anna; Rürup, Miriam; Siegel, Björn: Jüdische Geschichte im deutschsprachigen Raum, in: Busse, Laura u. a. (Hg.): Clio-Guide. Ein Handbuch zu digitalen Ressourcen für die Geschichtswissenschaften, Berlin 2018, S. E.2-1–E.2-56. Online: https://doi.org/10.18452/19244.

2.4.5 Geschichte Afrikas

Projekte:

Emandulo: Digitales Archiv, das archivalische/museale Sammlungen und Präsentationen über präkoloniale südafrikanische Geschichte zusammenführt und neu zusammenstellt.
Legacies of British Slavery: Forschungsprojekt zum britischen Sklavenhandel und -besitz

Ressourcen/Portale:

FHYA: Experimentelle digitale Forschungsplattform über präkoloniale südafrikanische Geschichte
Legacies of British Slavery: Datenbank zum britischen Sklavenhandel und -besitz
Slave Voyages: Datenbanken zum transatlantischen und interamerikanischen Sklavenhandel und Personendatenbank

2.4.6 Osteuropäische Geschichte

Projekte:

Gulag: Many Days, Many Lives: Archiv und Präsentationsplattform zu den sowjetischen Gulags
Gulag Online: Virtuelles Museum mit Präsentationen und Quellen zum Leben im Gulag, zu Personen und Objekten
Seventeen Moments in Soviet History: Multimediales Online-Archiv mit ausgewählten Quellen zu Ereignissen in der sowjetischen Geschichte anhand 17 verschiedener Jahre zwischen 1917 und 1991
The Imperiia Project: Eine räumliche Geschichte des Russischen Reichs

Ressourcen/Portale:

Blavatnik Archive: Archiv zur Erhaltung und Verfügbarmachung von Material zur (jüdischen) Geschichte des 20. Jahrhunderts mit Fokus auf die zwei Weltkriege und Sowjetrussland.
The Other Side: Webarchiv von Interviews ehemaliger Ostarbeiter:innen, Kriegsgefangener und Insassen deutscher Lager; Publikationsplattform

2.4.7 Epochen-/Areaübergreifend:

Projekte:

Lord of the Rings Project: Interaktive Analyse der Werke J. R. R. Tolkiens

Ressourcen/Portale:

Around DH in 80 days: Portal zur Vorstellung achtzig verschiedener Digital-Humanities-Projekte weltweit und aus verschiedenen Disziplinen
Internet Archive: digitale Bibliothek zur Archivierung von Büchern, Bildern, Filmen, Software, Musik und Webseiten

In der Zeitgeschichte ist dies einfacher möglich, weil viele Texte hier schon digital vorliegen; für Epochen bzw. Forschungsbereiche, die eher eine Quellenarmut zu beklagen haben, ist eine Generierung von Daten aus Texten umso interessanter.↩︎
Java Graphical Authorship Attribution Program, http://evllabs.github.io/JGAAP/.↩︎