NACH OBEN

Digitale Analyse großer Textkorpora


Die digitale Analyse großer Textkorpora zählt zu den wichtigsten Innovationen, die durch Methoden der Digital Humanities möglich werden. Die Korpusanalyse ermöglicht die Untersuchung von unterschiedlichsten Texten und Textsammlungen vor dem Hintergrund verschiedener disziplinärer Ausrichtungen – linguistisch, literaturwissenschaftlich, kulturwissenschaftlich – und bietet darüber hinaus zahlreiche Transfer- und Anwendungsoptionen: forensische Verwendung, soziologische Analyse, Politik- und Sprachberatung u.v.m.


Das Modul ist dreischrittig:

  • Erwerb basaler Programmierkenntnisse (Python, 18.-22.09.2023 und 25.-29.09.2023, jeweils 10-16 Uhr)
  • Blockveranstaltungen mit Input und Hands-on-Übungsphasen (WiSe 2023/24, 14-tägig freitags 14.15-17.15 Uhr, Beginn 20.10.2023)
  • Forschungs- oder Praxisprojektphase (SoSe 2024), in der Sie unter Anleitung eigenständig arbeiten.

Das Modul kann kreditiert werden:

  • im M.A.-Ergänzungsbereich (Germanistik, Arabistik und Islamwissenschaft, Romanistik)
  • im 2-Fach M.A.: (Arabistik und Islamwissenschaft: Vertiefungsmodul 2, entspricht Hauptseminar mit Hausarbeit; es kann allen Modularten zugerechnet werden, je nach Thema, welches für die Forschungs- oder Praxisprojektphase gewählt wird)
  • als Praxismodul (Germanistik, Komparatistik)
  • als Forschungsmodul (Germanistik)

Für weitere Anrechnungsmöglichkeiten wenden Sie sich bitte an stephanie.heimgartner@rub.de und/oder Ihre Studienfachberatung.

Anmeldung ab sofort über eCampus, Veranstaltungsnr. 050325

Sie erlernen in diesem Modul:

  • die für das eigene Fach relevanten Methoden und digitalen Tools im Umgang mit großen Korpora und haben auch Einblick erhalten in die Fragestellungen und Verfahrensweisen benachbarter Fächer.
  • Sie verfügen über Anwendungskenntnisse in der Programmiersprache Python mit Fokus auf dem Thema „korpusanalytische Verfahren“ und sind vertraut mit der Nutzung von Python-Bibliotheken (Natural Language Tool Kit, Pandas).
  • Sie sind imstande, Textkorpora zusammenzustellen und verfügbar zu machen. Sie sind sensibilisiert für die damit verbundenen urheber- und datenschutzrechtlichen Themen sowie für Fragen des Forschungsdatenmanagements wie die Reproduktion, Zweitnutzung, Archivierung und Aufbereitung von Daten
  • Sie lernen Bearbeitungsmöglichkeiten für komplexe Korpora kennen (z.B. Transkription oraler oder sprachlich heterogener Korpora, multimodale Korpora, Übersetzung).
  • Sie haben verschiedene Datenerhebungs-, -aufbereitungs- und -analyseverfahren kennengelernt: z.B. Webscraping, Tokenisierung, Annotation, Kookkurrenz-, Frequenzanalyse, netzwerkanalytische Zugänge.

Das Modul ist geeignet für:

  • Studierende im M.A. und im fortgeschrittenen B.A.

Zeitrahmen und Inhalte:

Wintersemester 2023/24

  • 18.-22.09.2023 und 25.-29.09.2023 Workshop Python (Programmiersprache) mit Selbstlern-Tutorials, Chat und Beratungssprechstunden

Ab dem 20.10.2023 freitags (14-tägig), 14.15-17.15 Uhr

  • 20.10.2023, 14.15 - 17.15 Uhr
  • 03.11.2023, 14.15 - 17.15 Uhr
  • 17.11.2023, 14.15 - 17.15 Uhr
  • 01.12.2023, 14.15 - 17.15 Uhr
  • 15.12.2023, 14.15 - 17.15 Uhr
  • 12.01.2024, 14.15 - 17.15 Uhr
  • 26.01.2024, 14.15 - 17.15 Uhr

Blocktermine mit Input von Forschenden der Fakultät und externen Expert:innen und Hands-on-Phasen

  • ab Februar: Entwicklung eigener Forschungs- oder Praxisprojekte

Sommersemester 2024

  • Arbeit an den Forschungs- oder Praxisvorhaben
  • regelmäßige Feedbackgespräche mit betreuenden Lehrenden
  • Juli 2024: Präsentation der Abschlussergebnisse