NACH OBEN

Digitale Analyse großer Textkorpora


Die digitale Analyse großer Textkorpora zählt zu den wichtigsten Innovationen, die durch Methoden der Digital Humanities möglich werden. Die Korpusanalyse ermöglicht die Untersuchung von unterschiedlichsten Texten und Textsammlungen vor dem Hintergrund verschiedener disziplinärer Ausrichtungen – linguistisch, literaturwissenschaftlich, kulturwissenschaftlich – und bietet darüber hinaus zahlreiche Transfer- und Anwendungsoptionen: forensische Verwendung, soziologische Analyse, Politik- und Sprachberatung u.v.m.


Das Modul ist dreischrittig:

  • Erwerb basaler Programmierkenntnisse (Python, 04.-15.10.2021)
  • Blockveranstaltungen mit Input und Hands-on-Übungsphasen (WiSe 2021/22, 14-tägig freitags 14.15-17.15 Uhr, Beginn 22.10.2021)
  • Forschungs- oder Praxisprojektphase (SoSe 2022), in der Sie unter Anleitung eigenständig arbeiten.

Das Modul kann kreditiert werden:

  • im M.A.-Ergänzungsbereich (Germanistik, Orientalistik und Islamwissenschaft, Romanistik)
  • im 2-Fach M.A.: (Orientalistik und Islamwissenschaft: Vertiefungsmodul 2, entspricht Hauptseminar mit Hausarbeit; es kann allen Modularten zugerechnet werden, je nach Thema, welches für die Forschungs- oder Praxisprojektphase gewählt wird)
  • als Praxismodul (Germanistik, Komparatistik)
  • als Forschungsmodul (Germanistik)
  • im B.A. Grundlagenbereich (Linguistik).

Für weitere Anrechnungsmöglichkeiten wenden Sie sich bitte an stephanie.heimgartner@rub.de und/oder Ihre Studienfachberatung.

Anmeldung ab sofort über eCampus, Veranstaltungsnr. 050421

Sie erlernen in diesem Modul:

  • die für das eigene Fach relevanten Methoden und digitalen Tools im Umgang mit großen Korpora und haben auch Einblick erhalten in die Fragestellungen und Verfahrensweisen benachbarter Fächer.
  • Sie verfügen über Anwendungskenntnisse in der Programmiersprache Python mit Fokus auf dem Thema „korpusanalytische Verfahren“ und sind vertraut mit der Nutzung von Python-Bibliotheken (Natural Language Tool Kit, Pandas).
  • Sie sind imstande, Textkorpora zusammenzustellen und verfügbar zu machen. Sie sind sensibilisiert für die damit verbundenen urheber- und datenschutzrechtlichen Themen sowie für Fragen des Forschungsdatenmanagements wie die Reproduktion, Zweitnutzung, Archivierung und Aufbereitung von Daten
  • Sie lernen Bearbeitungsmöglichkeiten für komplexe Korpora kennen (z.B. Transkription oraler oder sprachlich heterogener Korpora, multimodale Korpora, Übersetzung).
  • Sie haben verschiedene Datenerhebungs-, -aufbereitungs- und -analyseverfahren kennengelernt: z.B. Webscraping, Tokenisierung, Annotation, Kookkurrenz-, Frequenzanalyse, netzwerkanalytische Zugänge.

Das Modul ist geeignet für:

  • alle fortgeschrittenen B.A.-Studierenden, die bereit sind, sich mit Engagement und Eigeninitiative in ein neues, zukunftsträchtiges Thema einzuarbeiten.
  • Besonders empfehlenswert für Studierende im M.A.

Zeitrahmen und Inhalte:

Wintersemester 2021/22

  • 4. - 15. Oktober 2021 Workshop Python (Programmiersprache) mit Selbstlern-Tutorials, Chat und Beratungssprechstunden, asynchron

Ab dem 22.10.2021 freitags (14-tägig), 14.15-17.15 Uhr

  • 22.10.2021, 14.15 - 17.15 Uhr
  • 05.11.2021, 14.15 - 17.15 Uhr
  • 19.11.2021, 14.15 - 17.15 Uhr
  • 03.12.2021, 14.15 - 17.15 Uhr
  • 17.12.2021, 14.15 - 17.15 Uhr
  • 14.01.2021, 14.15 - 17.15 Uhr
  • 28.01.2021, 14.15 - 17.15 Uhr

Blocktermine (synchron, Präsenz im CIP-Pool der Fakultät sofern möglich, sonst Zoom) mit Input von Forschenden der Fakultät und externen Expert:innen und Hands-on-Phasen

  • ab Februar: Entwicklung eigener Forschungs- oder Praxisprojekte

Sommersemester 2022

  • Arbeit an den Forschungs- oder Praxisvorhaben
  • regelmäßige Feedbackgespräche mit betreuenden Lehrenden
  • 8. Juli 2022: Präsentation der Abschlussergebnisse