< < Vorheriger BeitragNächster Beitrag > >

Der AIS – eine multiple Datenquelle

Version:

Zitation: Thomas Krefeld (2016): Der AIS – eine multiple Datenquelle. Version 3 (08.06.2016, 20:52). Lehre in den Digital Humanities. , url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=21333&v=3



Lizenzierung

Ein Atlas wie der AIS ist in der Lage, sehr unterschiedliche sprachwissenschaftliche Interessen zu bedienen, da er vielfältige Informationen, zur Phonetik,  zur Morphosyntax, - in sehr reduziertem Maße - zur Syntax und sogar sogar zur Pragmatik gibt; auch das bis heute grundlegende Nachschlagewerk zur italienischen Sprachgeschichte, die Grammatica storica della lingua italiana e dei suoi dialetti (3 Bände, Torino 1966-1970; dt. Original 1949-1954) von Gerhard Rohlfs wäre ohne die AIS-Daten konzeptionell und empirisch nicht möglich gewesen; Rohlfs war ja mehrere Jahre als Explorator für den AIS in Süditalien tätig.

Man darf jedoch vor dem Hintergrund der multiplen Nutzbarkeit der AIS-Daten festhalten, dass die Lexik ganz eindeutig im Zentrum steht: der Name (Sprach- und Sachatlas...) und das zweibändige Bauernwerk (Scheuermeier 1943, 1956) zeigen in ganz eindeutiger Weise die dominant ethnolinguistische Ausrichtung der ganzen Unternehmung. Viele, auch sehr gute Nachfolgearbeiten haben sich gerade davon stark entfernt wie z.B. die Vorstellung des ALD zeigen wird.

Aus den skizzierten, ganz unterschiedlichen sprachwissenschaftlichen Interessen ergeben sich jeweils spezielle, aber gleichzeitig sehr grundsätzliche Anforderungen bei der Digitalisierung der Daten:

  • Zur Bearbeitung phonetischer Fragen ist eine datenbankfähige Transkription, bzw. Retranskription erforderlich.
  • Für die Strukturierung der Lexik, der Morphosyntax und womöglich der Pragmatik müssen die sprachlichen Rohdaten mit geeigneten Metadaten angereichert werden ('tagging'). Dafür ist zunächst die Bestimmung einzelner Wortformen ('tokens') und ihre Gruppierung ('chunking') notwendig, sowie im zweiten Schritt die Zuweisung von Wortarten (POS) und die Indizierung der Reihenfolge.
  • Je nach Forschungsinteresse sind weitere Metainformationen sinnvoll, im Hinblick auf die Lexik ist eine Typisierung der zahlreichen Tokens und eine kategorische Trennung von Bezeichnungen und Konzepten unerlässlich. 
< < Vorheriger BeitragNächster Beitrag > >

5 Antworten

  1. Liebe Frau Mitrikjeska,
    auf den den Beitrag könnte man verlinken, obwohl eine sehr enge Auffassung von ‚Ethnolinguistik‘ vertreten wird; da es sich jedoch um einen Beitrag in einer Printpublikation handelt, müsste in jedem Fall unbedingt auch die genaue Quelle angegeben werden. Können Sie die bibliographischen Informationen geben?

    Viele Grüße
    Thomas Krefeld

    • Sehr geehrter Herr Krefeld,

      hier sind die bibliographischen Infomationen:

      Senft, G. (2003). Ethnolinguistik. In B. Beer, & H. Fischer (Hrsg.), Ethnologie: Einführung und Überblick. 5. Aufl., Neufassung (S. 255-270). Berlin: Reimer

      Mit freundlichen Grüßen,

      Lidija Mitrikjeska

Schreibe einen Kommentar