Beschreibung, Abbildung und Visualisierung von Sprache und Text – WS 16/17

Christian Riepl, Stephan Lücke

Ausgewählte digitale Korpora und Texte werden unter linguistischen Gesichtspunkten strukturiert, beschrieben und analysiert. Die aufbereiteten Daten werden in metasprachlichen Transkriptionen notiert und in einer Datenbank abgebildet. Anschließend wird versucht, die komplexen sprachlichen Strukturen und Beziehungen im Text zu visualisieren. Die bei der Sprachanalyse angewendeten Regeln werden in einer Formelnotation festgehalten. Die so entstandene Wissensbasis bereitet weiterführende Fragestellungen unter sprach- und literaturwissenschaftlichen sowie auch informatischen Gesichtspunkten vor. Die Übung richtet sich vor allem an fortgeschrittene Studierende und Doktoranden mit dem Schwerpunkt Linguistik.

Gliederung:

1. Kodierung I (27.10.2016)
Zeichenkodierung (ITG/slu)
Zahlensysteme (ITG/slu)
2. Kodierung II (03.11.2016)
UTF-8 (ITG/slu)
Byte Order Mark (BOM) (ITG/slu)
Konvertierung des Fileencodings (von latin1 nach utf-8) (ITG/slu)
3. Ermittlung von Korpus-Kennzahlen I (SQL: Join-Operationen) (01.12.2016)
SQL: Häufigkeit von Wortarten innerhalb eines Korpus (ITG/slu)
SQL: Suche im Kontext (ITG/slu)
4. Ermittlung von Korpus-Kennzahlen II (08.12.2016)
SQL: Type/Token-Relation (ITG/slu)
5. Ermittlung von Korpus-Kennzahlen III (15.12.2016)
SQL: Durchschnittliche Anzahl von Tokens pro Satz pro Datei (ITG/slu)
6. Ermittlung von Korpus-Kennzahlen IV (22.12.2016)
SQL: Durchschnittliche Anzahl Tokens pro Satz pro Geschlecht (ITG/slu)
SQL: Erzeugung von n-Grammen (ITG/slu)
SQL: Erzeugung einer Konkordanz (ITG/slu)
Allgemeine Beiträge zur Veranstaltung:
Die regulären Ausdrücke (ITG/slu)
Der Editor VIM (ITG/slu)
MySQL - Installations- und Bedienungsszenarien (ITG/slu)
Backticks, Hochkommata, Anführungszeichen ... (ITG/slu)
Datenimport von Excel in eine MySQL-Datenbank (ITG/slu)
Datenimport in MySQL-Datenbank mit Programm mysqlimport (ITG/slu)
SQL: Umgang mit Groß-/Kleinschreibung (Kollationierung) (ITG/slu)
SQL: Durchschnittliche Tokenlänge in Zeichen (ITG/slu)
SQL: Syntaktische Etikettierung eines relational strukturierten Textkorpus (ITG/slu)

Zeige alle in der Veranstaltung veröffentlichten Beiträge.

Schreibe einen Kommentar