Strukturierung und Analyse linguistischer Korpusdaten (WiSe 2020/21)

Christian Riepl, Stephan Lücke

Im Rahmen des Moduls „Angewandte Strukturierung und Analyse linguistischer Daten“ vermittelt das Seminar informatische Methoden zur Strukturierung, Abbildung, Annotation und Analyse von Sprach- und Textkorpora auf unterschiedlichen linguistischen Beschreibungsebenen.

Das Modul richtet sich an Studentinnen und Studenten, die eine Abschlussarbeit auf dem Gebiet der Korpuslinguistik vorbereiten. Ein wesentliches Ziel ist die Anwendung der erlernten Methoden auf deren Gegenstand und Fragestellung. Ein bereits in Absprache mit dem Betreuer der Masterarbeit ausgewähltes Sprach- oder Textkorpus ist Voraussetzung für die Teilnahme.

Erwartet werden neben pünktlichem Erscheinen, regelmäßiger Anwesenheit und aktiver Mitarbeit eine kurze Vorstellung des Vorhabens und ein Thesenpapier zu einem auf korpuslinguistische Probleme bezogenen Thema der Informatik.

Im Kurs werden die Module des DHVLab verwendet. Dafür ist eine entsprechende Registrierung der Teilnehmer erforderlich.

Gliederung:

1. Einführung (04.11.2020)
Strukturierung und Analyse linguistischer Korpusdaten
2. DHVLab mit Virtuellem Desktop, Datenbank, Cloud, Team (Mattermost) und DH-Lehre (11.11.2020)
Einführung in Wordpress
Das "Digital Humanities Virtual Laboratory" (DHVLab) (ITG/slu)
Die Unix-Shell (ITG/slu)
Verwendung des Wordpress-Plugins "SQLtoHTML" (ITG/slu)
Zeichenkodierung (Ruopu Chen) [Muster für WP-Beitrag]
3. Zeichenkodierung (18.11.2020)
Zeichenkodierung (Hyunah Chu)
4. Der Editor Vim (25.11.2020)
Der Editor Vim (Ruofan Zhang)
5. Die regulären Ausdrücke (02.12.2020)
Reguläre Ausdrücke (Hana Machova)
Die regulären Ausdrücke (ITG/slu)
6. AWK (09.12.2020)
AWK (Sviatoslav Tugeev)
7. Das DB-Verwaltungstool PMA (16.12.2020)
Das DB-Verwaltungstool PMA (Yu Zhao)
8. Wiederholung und Vertiefung (23.12.2020)
Strukturierung, Tokenisierung, Tagging (ITG/chr)
9. SQL I: Select-Statements (13.01.2021)
SQL I: Select-Statements (Ruopu Chen)
10. SQL II: String-Funktionen (20.01.2021)
SQL II: String-Funktionen (Hanna Pasieka)

11. SQL III: Join, Selfjoin (27.01.2021)
SQL III: Join/Self-Join (Josip Matosevic)
12. SQL IV: Insert, Update, Delete (03.02.2021)
13. SQL V: Korpuslinguistische Kennzahlen ermitteln (10.02.2021)
SQL: Type/Token-Relation (ITG/slu)
Type/Token-Ratio (WiSe 20/21) (ITG/slu)
Allgemeine Beiträge zur Veranstaltung:
Korpuslinguistisches Glossar (ITG/slu)
Kommunikation mit der Datenbank (ITG/chr)
Softwaretools und Methoden für die korpuslinguistische Praxis (KiT 1, 2017)

Zeige alle in der Veranstaltung veröffentlichten Beiträge.

Schreibe einen Kommentar