< < Vorheriger BeitragNächster Beitrag > >

Der AIS – eine multiple Datenquelle

Version:

Zitation: Thomas Krefeld (2016): Der AIS – eine multiple Datenquelle. Lehre in den Digital Humanities. Version 3 (08.06.2016, 20:52). url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=21333&v=3.

Lizenzierung

Ein Atlas wie der AIS ist in der Lage, sehr unterschiedliche sprachwissenschaftliche Interessen zu bedienen, da er vielfältige Informationen, zur Phonetik,  zur Morphosyntax, – in sehr reduziertem Maße – zur Syntax und sogar sogar zur Pragmatik gibt; auch das bis heute grundlegende Nachschlagewerk zur italienischen Sprachgeschichte, die Grammatica storica della lingua italiana e dei suoi dialetti (3 Bände, Torino 1966-1970; dt. Original 1949-1954) von Gerhard Rohlfs wäre ohne die AIS-Daten konzeptionell und empirisch nicht möglich gewesen; Rohlfs war ja mehrere Jahre als Explorator für den AIS in Süditalien tätig.

Man darf jedoch vor dem Hintergrund der multiplen Nutzbarkeit der AIS-Daten festhalten, dass die Lexik ganz eindeutig im Zentrum steht: der Name (Sprach- und Sachatlas…) und das zweibändige Bauernwerk (Scheuermeier 1943, 1956) zeigen in ganz eindeutiger Weise die dominant ethnolinguistische Ausrichtung der ganzen Unternehmung. Viele, auch sehr gute Nachfolgearbeiten haben sich gerade davon stark entfernt wie z.B. die Vorstellung des ALD zeigen wird.

Aus den skizzierten, ganz unterschiedlichen sprachwissenschaftlichen Interessen ergeben sich jeweils spezielle, aber gleichzeitig sehr grundsätzliche Anforderungen bei der Digitalisierung der Daten:

  • Zur Bearbeitung phonetischer Fragen ist eine datenbankfähige Transkription, bzw. Retranskription erforderlich.
  • Für die Strukturierung der Lexik, der Morphosyntax und womöglich der Pragmatik müssen die sprachlichen Rohdaten mit geeigneten Metadaten angereichert werden (‚tagging‘). Dafür ist zunächst die Bestimmung einzelner Wortformen (‚tokens‘) und ihre Gruppierung (‚chunking‘) notwendig, sowie im zweiten Schritt die Zuweisung von Wortarten (POS) und die Indizierung der Reihenfolge.
  • Je nach Forschungsinteresse sind weitere Metainformationen sinnvoll, im Hinblick auf die Lexik ist eine Typisierung der zahlreichen Tokens und eine kategorische Trennung von Bezeichnungen und Konzepten unerlässlich. 
< < Vorheriger BeitragNächster Beitrag > >

11 Antworten

  1. Sehr geehrter Herr Krefeld,

    ich habe diesen Beitrag bei Wikipedia als externen Weblink angegeben und mittels Screenshot dokumentiert. Momentan ist dies leider öffentlich noch nicht sichtbar, da meine Änderung des Wikipedia Artikels noch ungesichtet und somit noch nicht geprüft ist.
    Ich weiß, dass wir diesen Screenshot eigentlich irgendwo online hinterlegen können, leider ist mir noch nicht ganz klar wo.
    Deshalb vorerst auf diese Weise, ich bitte um Entschuldigung!

    https://de.wikipedia.org/wiki/Paul_Scheuermeier

    Liebe Grüße

    Mirjam Hauter

  2. Sehr geehrter Herr Professor Krefeld,
    man könnte im Satz „viele Nachfolgearbeiten haben* gerade davon stark entfernt (z.B. der ALD)“ eine Verlinkung zum Sprachatlas des Dolomitenladinischen und angrenzender Dialekte einfügen: http://ald.sbg.ac.at/ALD/
    Wäre ja auch interessant, wie – neben dem AIS – andere Digitalisierungsprojekte von Sprachatlanten aufgebaut sind.
    * fehlt hier ein ?
    Mit freundlichen Grüßen,
    Laura Umlauf

    • Liebe Frau Mitrikjeska,
      auf den den Beitrag könnte man verlinken, obwohl eine sehr enge Auffassung von ‚Ethnolinguistik‘ vertreten wird; da es sich jedoch um einen Beitrag in einer Printpublikation handelt, müsste in jedem Fall unbedingt auch die genaue Quelle angegeben werden. Können Sie die bibliographischen Informationen geben?

      Viele Grüße
      Thomas Krefeld

      • Sehr geehrter Herr Krefeld,

        hier sind die bibliographischen Infomationen:

        Senft, G. (2003). Ethnolinguistik. In B. Beer, & H. Fischer (Hrsg.), Ethnologie: Einführung und Überblick. 5. Aufl., Neufassung (S. 255-270). Berlin: Reimer

        Mit freundlichen Grüßen,

        Lidija Mitrikjeska

  3. Sehr geehrter Herr Krefeld,

    In der heutigen Gesellschaft, die stark durch digitale Medien beeinflusst ist, finde ich das Projekt für Digitalisierung sprachwissenschaftlicher Daten eine nützliche Möglichkeit, die einen schnellen Zugang und Bequemlichkeit ermöglicht.

    Hier finden Sie Link zu einem Buch, das sich in einigermaßen mit Digitalisierung wissenschaftlicher Daten beschäftigt:

    Deppermann, ArnulfFeilke, Helmuth Linke (2016): Sprachliche und kommunikative Praktiken, De Gruyter Mouton.
    http://www.degruyter.com/view/product/463623

    Ich hoffe, es wäre Ihnen von Nutzen sein!

    Mit freundlichen Grüßen
    Betina Koleva

Schreibe einen Kommentar