Einführung in die Geolinguistik (ITG/slu)

Version:

Zitation: Stephan Lücke (2020): Einführung in die Geolinguistik (ITG/slu). Version 4 (04.11.2020, 10:39). Lehre in den Digital Humanities. url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=78314&v=4

1. Was ist Geolinguistik?

  • Geolinguistik ist die Variation der Sprache in Abhängigkeit vom Raum
  • Banal: In München spricht man anders als in Hamburg, Paris oder Rom, und in Miesbach anders als in Kufstein
  • Geolinguistik beschäftigt sich praktisch ausschließlich mit der gesprochenen Sprache, nicht mit der Schrift- bzw. Standardsprache

1.1. Dimensionen sprachlicher Variation

  • Der geographische Raum nur *eine* von mehreren Dimensionen sprachlicher Variation
  • Weitere Dimensionen sprachlicher Variation:
    • Alter der Sprecher,
    • Bildungsgrad,
    • Geschlecht,
    • Sprechsituation
  • Ferner: Veränderung der an einem Ort gesprochenen Sprache im Lauf Zeit
  • Man verwendet für die genannten Dimensionen die folgenden Fachtermini:
    • diachronische Variation (Zeit)
    • diagenerationelle V. (Alter der Sprecher)
    • diasexuelle V. (Geschlecht)
    • diastratische V. (Bildungsgrad)
    • diaphasische V. (Sprechsituation)
  • Als Terminus zur Bezeichnung der Variation im Raum, mit der sich die Geolinguistik beschäftigt, hat sich „diatopische Variation“ eingebürgert.
  • Diatopische Variation ergo nur eine von mehreren Dimensionen sprachlicher Variation
  • Alle Dimensionen sind untrennbar miteinander verbunden und sollten daher auf keinen Fall isoliert von einander betrachtet werden: Regionale Unterschiede auch in Abhängigkeit von Zeit, Geschlecht etc.
  • Neben Geolinguistik wird diese Teildisziplin der Sprachwissenschaft auch als Areallinguistik, Sprachgeographie oder Dialektologie bezeichnet (wobei hier auch Nuancen festzustellen sind; s. dazu Thomas Krefeld (2019): Zum Namen der Disziplin: ‚Geolinguistik‘ und einige konkurrierende Bezeichnungen. Lehre in den Digital Humanities. Version 5 (03.09.2019, 08:11). url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=20914&v=5.)

1.2. Dynamik der gesprochenen Sprache im Raum

  • Sprache unterliegt permanenter Veränderung
  • Unterschiedliche Szenarien:
    • Wandel durch Mobilität:
      • Kontakt durch Handelsbeziehungen (z.B. in Häfen)
      • Tourismus
      • Migrationsszenarien (Einwanderung, Auswanderung, auch temporär ⇒ Rückkehr)
      • Eroberungen/Unterwerfungen (Völkerwanderung in der Spätantike; Eroberung Englands durch die Normannen …)
      • Besonders dunkel: Verschleppungen des Sklavenhandels (Website https://www.slavevoyages.org/)
    • Wandel durch Medien
      • Funk/Fernsehen,
      • Internet (soziale Medien: Facebook, Twitter etc.)
    • Sprachwandel durch technischen Fortschritt (neue Konzepte)
  • Veränderung bedeutet:
    • Neues kommt hinzu,
    • Altes verschwindet,
    • Reste des Alten bleiben bestehen
  • SubstratSuperstratAdstrat:
  • Sprachwandel auch durch großflächige, massive Einwanderung bzw. Eroberung durch fremdsprachige Bevölkerung; Szenarien:
    • die Sprache der Eroberer verdrängt die lokale Sprache weitestgehend, übernimmt jedoch vereinzelt Elemente (im Bereich der Lexik z.B. Bezeichnungen für Konzepte, die den Eroberern bis dahin unbekannt waren; Beispiel: Terminologie der Almwirtschaft im Lateinischen wird übernommen aus den im Alpenraum verbreiteten Sprachen vor der Eroberung durch die Römer)
    • die Sprache der Eroberer und die der Eroberten vermischen sich zu ähnlichen Anteilen; es entsteht eine neue, gemeinsame Sprache
    • die Eroberer übernehmen die Sprache der Eroberten, einzelne Elemente der Eroberersprache dringen in die Sprache der Eroberten ein (Beispiel: Goten in Spanien in der Spätantike)
  • In diesem Zusammenhang wird häufig von Substrat und Superstrat gesprochen. Beispiel: Das Altfranzösische war nach der Eroberung Englands durch die Normannen 1066 Superstratsprache, das Altenglische der Angelsachsen die Substratsprache

Stratenmodell: Substratsprache, Superstratsprache, Stratum

  • Häufig sind in Sprachen Reflexe älterer Substratsprachen zu finden

Stratigraphiemodell für den Alpenraum (Krefeld 2019)

  • Im Fall der Beeinflussung einer Sprache durch Sprachkontakt außerhalb von Eroberungsszenarien spricht man häufig von Adstrat-Sprachen. Es handelt sich also um eine Sprache, die eine bestehende beeinflusst, aber nicht vollständig überlagert oder verdrängt (z.B.: Einfluss des Englischen auf das Deutsche durch Medien/Internet)

2. Traditionelle Methoden der Geolinguistik

2.1. Pioniere der Geolinguistik

  • Graziadio Ascoli (1829-1907; Orientalist und Sprachwissenschaftler; erstmalige Klassifizierung der italienischen Mundarten; Entwicklung einer Lautschrift zur Erfassung von Dialektmaterial [später weiterentwickelt von Eduard Böhmer, heute bekannt als „Böhmer-Ascoli“])

Graziadio Ascoli (1827-1907) – undatierte Aufnahme (Bildquelle: https://commons.wikimedia.org/w/index.php?title=File:Ascoli.jpg&oldid=122784392 [public domain])

  • Georg Wenker (1852-1911; geboren in Düsseldorf;  „Vater“ des Sprachatlas‘ des Deutschen Reiches [sog. Wenkeratlas; entstanden ab 1878; heute online verfügbar unter regionalsprache.de])

Georg Wenker (1852-1911) – Aufnahme aus dem Jahr 1878 (Bildquelle: https://commons.wikimedia.org/w/index.php?title=File:Georg_Wenker_Georg_Wenker_(1852-1911)_(Alter_Fritz).jpg&oldid=357779382 [public domain])

  • Jules Gilliéron (1854-1926; Atlas linguistique de la France [ALF]; Photo: https://www.peoples.ru/science/linguist/gillieron/)
  • Edmond Edmont (1849-1926; aus der Picardie; Mitarbeiter von Gilliéron, führte die Spracherhebungen zum ALF durch)
  • Karl Jaberg (1877-1958; Schweizer Romanist; zusammen mit Jakob Jud Verfasser des Sprach- und Sachatlas Italiens und der Südschweiz [AIS], Bd. 1–8, Zofingen und Bern 1928–1960
  • Jakob Jud (1882-1952; Schweizer Romanist; zusammen mit Karl Jaberg Verfasser des AIS)

Jakob Jud (1882-1952) – Aufnahme ca. 1920 (Bildquelle: https://commons.wikimedia.org/w/index.php?title=File:(UAZ)_AB.1.0496_Jud.tif&oldid=372459518 [public domain])

2.2. Sammlung von Sprachmaterial

  • Zur Analyse der diatopischen Variation muss stets Material gesprochener Sprache gesammelt werden

2.2.1. Der Raum

  • Erster Schritt ist normalerweise die Definition einer Region, innerhalb derer die gesprochene Sprache untersucht werden soll.
  • Innerhalb der definierten Region wird wiederum ein Netz von Ortschaften festgelegt, an denen das Sprachmaterial gesammelt werden soll (sog. „Erhebungspunkte“). Dieses Netz kann mehr oder weniger dicht sein.
  • Traditionell orientieren sich die Untersuchungsgebiete geolinguistischer Untersuchungen an der Verbreitung von National- bzw. Standardsprachen (Beispiele: Sprachatlas des Deutschen Reichs, Atlas linguistique de la France [ALF], Sprachatlas der deutschen Schweiz [SDS], Sprach- und Sachatlas Italiens und der Südschweiz [AIS])

Erhebungsnetze des Sprach- und Sachatlas Italiens und der Südschweiz (AIS) und Sprachatlas der deutschen Schweiz (SDS) vor dem Hintergrund der Ausdehung des germanischen (grün) und des romanischen (rot) Sprachgebiets (Directlink: https://www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=161&tk=2482)

  • Sprachatlanten, die sich an den Ausdehnung der Nationalsprachen orientieren, umfassen aber unter Umständen kleinere eigenständige Sprachen:

Der im AIS erfasste Ausschnitt des romanischen Dialektkontinuums und die zugeordneten Sprachen (Grafik entnommen aus Thomas Krefeld (2018): Der AIS – Allgemeine Charakterisierung. Lehre in den Digital Humanities. Version 2 (08.06.2018, 10:10). Absatz 5. url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=21088&v=2#p:5).

  • Nationalsprachgrenzüberschreitende Untersuchungen sind bis heute die Ausnahme (Beispiel: VerbaAlpina)
  • ⇒ sprachgrenzüberschreitende Phänomene werden nicht als solche erkannt!
  • Beispiel Basistyp „butyru(m)“: 

Sprachgrenzüberschreitende Verbreitung des morpholexikalischen Typs „Butter“. Karte des Projekts VerbaAlpina (Directlink: https://www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=192&tk=2488)

2.2.2. Informanten

  • An den ausgewählten Erhebungspunkten wird dann von „Informanten“ (auch: „Gewährspersonen„) Sprachmaterial gesammelt
  • Traditionell erfolgte diese Sammlung von Sprachmaterial durch sog. „Exploratoren“, die in die jeweilige Untersuchungsregion gereist sind und vor Ort mit den Informanten Interviews durchgeführt haben.
  • Speziell bei phonetischen Transkriptionen angestrebt: Möglichst wenige Exploratoren, um Einheitlichkeit der – manuellen! – Transkription zu erzielen
  • Großen Einfluss auf die Ergebnisse einer Erhebung üben Anzahl und Auswahl der Informanten aus.
  • Bisweilen akribische Dokumentation der sog. Sozialdaten der Informanten

Sprachatlas von Tirol: Daten zu einem Informanten aus St. Andrä oberhalb von Brixen in Südtirol

  • Anfänglich: In den Erhebungsorten Suche nach möglichst prototypischen Dialektsprechern (möglichst unverfälschter traditioneller Dialekt einer Ortschaft (sog. NORM: Non-mobile Old Rural Male)
  • In ihren Anfängen ist die Geolinguistik stark ethnographisch ausgerichtet gewesen (Erfassung traditioneller Lebenswelt in „archaischer“, als „ursprünglich“ empfundener Umgebung)

Paul Scheuermeier (1888-1973) mit einem Informanten im Ort Ostana im Piemont am 14. August 1922 bei den Erhebungen zum Sprach- und Sachatlas Italiens und der Südschweiz (AIS)

  • Erst später: Versuch, Vielschichtigkeit und Dynamik einer lokalen Sprechergemeinschaft zu erfassen:
    • Auswahl jeweils mehrerer Informanten an einem Ort, die auch andere als nur die diatopische Dimension der Sprachvariation erfassen
    • z.B.: gleichermaßen Frauen und Männer, Personen unterschiedlichen Alters und Bildungsgrads oder auch unterschiedlichen Sprachbiographien interviewt. Man spricht in diesem Zusammenhang auch von „pluridimensionaler Sprachgeographie“ (Krefeld)

2.2.3. Datenerfassung

  • Normalerweise orientierten sich die Exploratoren an Fragenkatalogen, die sie im Dialog mit den Informanten durchgegangen sind.
  • Die Fragenkataloge wurden im Vorfeld der Explorationsreise erstellt und so konzipiert, dass sie möglichst umfassenden Aufschluss über die mit der Untersuchung anvisierten Fragestellungen erwarten ließen.
  • Die „Fragen“ in den Katalogen werden auch als „Stimuli“ bezeichnet. Dabei kann es sich um ganze Sätze, Begriffe im Sinne von Konzepten, oder auch Bilder handeln. Diese werden den Informanten vorgelegt und diese dann aufgefordert, den entsprechenden Satz im eigenen Dialekt zu sprechen bzw. den von ihnen üblicherweise für die Bezeichnung des vorgelegten Konzepts verwendeten Terminus auszusprechen.

Sprachatlas von Tirol (von Eugen Gabriel), Fragebuch S. 94: Konzeptdomäne BUTTERHERSTELLUNG

  • In der vor-elektronischen Zeit konnte die Erfassung der Daten nur manuell auf Papier erfolgen. Meist notierte der Explorator die Antworten des Informanten in Notizbüchern oder auf Zetteln. Bisweilen wurden auch Sozialdaten der Informanten wie Geschlecht, Alter und Bildungsgrad erfasst.

Belegzettel aus dem Sprachatlas von Tirol. Antworten eines Informanten aus dem Erhebungsort Sölden auf die Fragen zur Konzeptdomäne BUTTERHERSTELLUNG (S. 94 des SAT-Fragebuchs). Antwort zu Nr. 9 („Nach dem Herausnehmen muß man die Butter … (das Wasser herauswalgen; ‚pracken‘, ‚walgen‘)“: waldn

  • Eine andere Methode der Datensammlung ist das Versenden von Fragebögen per Post gewesen. Das vielleicht prominenteste Beispiel dafür ist die Datenerhebung für den „Sprachatlas des Deutschen Reichs“ von Georg Wenker (1852-1911) Ende des 19. Jhs.
  • Georg Wenker hatte 40 (auch Varianten zu 38 und 42 Sätzen) Mustersätze entwickelt (die sog. „Wenkersätze„), die er zwischen 1876 und 1888 an sämtliche Volksschullehrer im damaligen Deutschen Reich per Post verschickte (insgesamt 40.736 Schulorte).
    1. Im Winter fliegen die trocknen Blätter durch die Luft herum.
    2. Es hört gleich auf zu schneien, dann wird das Wetter wieder besser.
    3. Thu Kohlen in den Ofen, daß die Milch bald an zu kochen fängt.
    4. Der gute alte Mann ist mit dem Pferde durch´s Eis gebrochen und in das kalte Wasser gefallen.
    5. Er ist vor vier oder sechs Wochen gestorben.
    6. Das Feuer war zu stark/heiß, die Kuchen sind ja unten ganz schwarz gebrannt.
  • Diese, sog. „Wenkerbögen“ (Recherche: http://www.diwa.info/Wenkerbogen/Katalog.aspx) wurden von den Lehrern ausgefüllt und zurückgeschickt (stammte ein Lehrer nicht aus dem Ort, sollte er geeignete Gewährsleute befragen):

Ausgefüllter Wenkerbogen aus dem Schulort Bobenthal (https://www.geonames.org/6555314/bobenthal.html)

  • Manuelle Auswertung und Kartierung ausgewählter Merkmale (u.a. 375 „Wenker-Lemmata“ [https://www.regionalsprache.de/wenkerbogen.aspx#Die%20Wenker-Lemmata])  auf insgesamt 1646 riesigen, von Georg Wenker, Ferdinand Wrede und Emil Maurmann handgezeichneten, kolorierten Karten (heute im Archiv des Forschungszentrums „Deutscher Sprachatlas“ in Marburg)

Ausschnitt aus einer handgezeichneten Wenkerkarte (Nr. 46) mit Kartierung des Wortes „Mann“ aus dem Wenkersatz 4 „Der gute alte Mann ist mit dem Pferde durch´s Eis gebrochen und in das kalte Wasser gefallen.“ (Screenshot aus https://www.regionalsprache.de/SprachGIS/Map.aspx)

Legende zu Wenkerkarte (Nr. 46) mit Kartierung „Mann“ aus Wenkersatz 4

2.3. Traditionelle Publikation und Analyse der gesammelten Sprachdaten

  • Sprachatlanten und geolinguistische Wörterbücher
  • Sprachatlanten ordnen das gesammelte Material nach den Stimuli bzw. Konzepten
  • geolinguistische Wörterbücher (= Wörterbücher mit Informationen zur regionalen Verbreitung von morpholexikalischen Typen) ordnen das Material in alphabetischer Sortierung nach den sprachlichen Bezeichnungen für die Konzepte
  • Sprachatlanten: onomasiologische Perspektive (= ausgehend von den KONZEPTEN),
  • Wörterbücher: semasiologische Perspektive (= ausgehend von den Wörtern)

Zusammenhang zwischen KONZEPT und Bezeichnung

2.3.1. Sprachatlanten

  • Die Sprachatlanten präsentieren das Material auf geographischen Karten
  • Die Sprachdaten werden
    • entweder, zumeist in phonetischer Transkription, direkt auf die Karten geschrieben (jeweils neben den entsprechenden Ort der Erhebung) („Belegkarten„)

Beispiel einer Belegkarte romanistischer Tradition (Karte 1151 des Sprach- und Sachatlas Italiens und der Südschweiz [AIS]: IL PICCIONE, I PICCIONI)

    • oder zunächst typisiert und anschließend Symbole für die jeweiligen Typen auf der Karte eingetragen („Punktsymbolkarten„)

Beispiel einer Punktsymbolkarte germanistischer Tradition (Karte 73 des Vorarlberger Sprachatlas‘ Bd. IV: Die SENNHÜTTE)

  • Beide Kartentypen haben Vor- und Nachteile:
    • Belegkarten liefern jeweils die konkrete Äußerung des Informanten, meist in exakter phonetischer Transkription, sind also maximal quellentreu, dafür aber sehr unübersichtlich
    • Punktsymbolkarten bieten einen guten Überblick, unterdrücken aber die originalen Äußerungen der Informanten und blenden alternative Typisierungen aus

2.3.2. Geolinguistische Wörterbücher

  • Geolinguistische Wörterbücher sind Wörterbücher, die stets auch Angaben zur regionalen Verbreitung der registrierten Wörter enthalten
  • … setzen eine morpholexikalische Typisierung des gesammelten Sprachmaterials voraus (sämtliche phonetische Varianten eines morpholexikalischen Typs werden zu einem Lemmaeintrag zusammengefasst)
  • … decken größere Gebiete oder auch nur einzelne Ortschaften ab (Idiotikon, Dicziunari Rumantsch Grischun [DRG], Dizionario di Montagne di Trento)
  • Beispiel Idiotikon:

Eintrag Teie(n) im Schweizerdeutschen Idiotikon

3. Geolinguistik im Digitalzeitalter

  • vollkommen veränderte Rahmenbedingungen
  • erweiterte Möglichkeiten, daneben aber auch Herausforderungen

3.1. Möglichkeiten

    • Multimedialität, i.e. Integration von Ton, Text und Bild
    • Beispiel: AsiCa – Atlante sintattico della Calabria (2004ff.):

AsiCa2.0, Kartierung der Variable „complemento verbale di ‚piacere'“ des Stimulus F17, „Mi piace andare in giro con la bicicletta .“: Mi piace + Inf (Ich mag es *Fahrrad zu fahren*: orange) vs. Mi piace + Nebensatz (Ich mag es, *dass ich Fahrrad fahre*: rot)

AsiCa2.0, Antwort des Informanten Bel1mD auf den Stimulus F17. Audiofunktion. Directlink: https://www.asica2.gwi.uni-muenchen.de/atlante-table/?quest=F17:&informanti=Bel1mD&frage=29&data_ids=253568/2

Synoptische Kartierung des morpholexikalischen Typs „malga“ und des Konzepts „ALM“ auf der interaktiven Karte des Projekts VerbaAlpina (Directlink: https://www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=192&tk=2484)

    • Synthese von Beleg- und Punktsymbolkarten:

Einzelbelegfenster am Erhebungsort Canzo (VA-Ort 15591) zum morpholexikalischen Typ ‚malga‘ (VA-Morphtyp L90) auf der interaktiven Karte des Projekts VerbaAlpina (Directlink: https://www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=192&tk=2486)

    • (algorithmische) Analyse großer Mengen georeferenzierter Daten möglich (etwa durch Datenbanken):

Transkription des Wenkersatzes Nr. 4 („Der gute alte Mann ist mit dem Pferde durch´s Eis gebrochen und in das kalte Wasser gefallen.“) in der Realisierung durch einen Informanten aus der Ortschaft Rätsch in Siebenbürgen. Das Material ist tokenisiert und morphosyntaktisch annotiert. Daten des Projekts „Audioatlas Siebenbürgisch-Sächsischer Dialekte“ (ASD).

    • Konvergenz: Weg von isolierten Datenbeständen hin zu Vernetzung und Interoperabilität

VerbaAlpina: Verknüpfung des morpholexikalischen Typs „malga“ mit externen Ressourcen (Geonames, T: Vocabolario Treccani, F: Französisches etymologisches Wörterbuch [FEW], H: Handwörterbuch des Rätoromanischen [nicht online verfügbar], Wikidata). (Directlink: https://www.verba-alpina.gwi.uni-muenchen.de?page_id=133&db=192&tk=2486).

    • Pluridirektionaler Informationsaustausch (Auflösung der starren Rollen von „Autor“ und „Leser“, „Experte“ und „Laie“ – Internet erlaubt Informationsaustausch in alle Richtungen)
    • Datensammlung über das Internet („Crowdsourcing„)

Crowdsourcing-Portal des Projekts VerbaAlpina (Directlink: https://www.verba-alpina.gwi.uni-muenchen.de/en/?page_id=1741&db=191)

3.2. Herausforderungen

    • Flüchtigkeit“ der Daten ⇒ Herstellung von Zitierfähigkeit (Stabilität von elektronischen Adressen) und dauerhafte Bewahrung (analog zu Büchern; Stichwort „Forschungsdatenmanagement“)
    • Retro-Digitalisierung (traditionell publizierte Sprachatlanten und Wörterbücher), u.a.:
    • Erfassung komplexer analoger Transkriptionssysteme; Beispiel AIS (http://www3.pd.istc.cnr.it/navigais-web?map=1192&point=5):

Einzelbeleg aus dem Erhebungsort Nr. 5 (Ems in Graubünden) aus der AIS-Karte 1192 (LA CASCINA DI MONTAGNA): Transkriptionsverfahren („Betacode“; in Anlehnung an den Thesaurus Linguae Graecae [TLG])

    • Herstellung von Kompatibilität (bezüglich Transkriptionssystemen und Strukturierungsmodellen); Beispiel: Transkription einer Sprecheräußerung (Wolkenstein im Grödnertal) zum Stimulus „Il burro“ (die Butter) im – von Anbeginn digital konzipierten – „Sprachatlas‘ des Dolomitenladinischen und angrenzender Dialekte“ (ALD) von Hans Goebl:
        • 1l1 6Z1m1a6w1t1s (ALD)
        • ʒmˈawts (IPA-Transkription eines AIS-Eintrags zu Wolkenstein)
        • z^ma?/wts (VA-Betacode für den Eintrag AIS 1208_1, 312 (Wolkenstein)
    • dauerhafter Betrieb von elektronischen Ressourcen (Kosten für Technik und Personal)
    • (vorübergehende?) Asymmetrie: digitale vs. analoge Ressourcen
    • Mindset (Traditionalisten vs. Modernisierer)

4. Datenanalyse

  • … am Beispiel des Audioatlas Siebenbürgisch-Sächsischer Dialekte (ASD): 
    • großes Audiokorpus aus Siebenbürgen (Rumänien)
    • Über 2200 Audiodateien
    • aufgenommen in den 1960er und 1970er Jahren
    • ab 2009 an der ITG digitalisiert und georeferenziert (Lat/Lng)
    • Datenbestand relational (teils tokenisiert) strukturiert in einer MySQL-Datenbank
    • Webportal mit interaktiver online-Karte
    • Aufnahmen von Dialektsprechern im Alter zwischen 5 und 93 Jahren (⇒ diagenerationell)
    • Aufnahmen von Männern und Frauen (⇒ diasexuell)
    • Thematisch sehr heterogen (Erzählungen aus der realen Lebenswelt [Leben im sozialistischen System], Familiengeschichte [u.a. Schicksale im zweiten Weltkrieg], Märchenerzählungen von Kindern ⇒ ethnographisch und historiographisch hochinteressant)
    • auch: rund 140 Aufnahmen von Wenkersätzen aus 110 Ortschaften; von einer Dialektsprecherin (Grete Klaster-Ungureanu [1927-2015]) akribisch phonetisch transkribiert

Kartierung der Erhebungspunkte des ASD; Einteilung in Mundartbezirke gemäß der Redaktion des Siebenbürgisch-Sächsischen Wörterbuchs in Hermannstadt (entworfen von Bernhard Capesius; vgl. dazu S. Lücke / E. Mages, Die informatische Seite des ASD, in: dies. / T. Krefeld, Zwischen traditioneller Dialektologie
und digitaler Geolinguistik: Der Audioatlas siebenbürgischsächsischer Dialekte (ASD) [Korpus im Text; 2], München 2016, S. 28 A. 6)

4.1. Qualitative Analyse

  • Definition von Einzelmerkmalen
  • Jedes Merkmal kann unterschiedliche Merkmalsausprägungen besitzen
  • Beispiel Wenkersatz 4: Der gute alte Mann ist mit dem Pferd durchs Eis gebrochen und in das kalte Wasser gefallen
  • Beispiele der transkribierten Informantenäußerungen:
1

Neppendorf

(100)

dər ˈgɑːt ˈoːld ˈmuːŋ æs mæt ‚əm ˈroːs dʊrç dət ˈɛ͡is gəˌbroːxən ʊnd æs æn dət ˈkoːlt ˈvasər gəˌfalən

2

Almen

(1005a)

dər ˈge͡at ɔːlt ˈmæŋt͡ʃ æs mæt ‚ə ˈgɔrən dʊrç dət ˈa͡is ˈænəgərɔmpəlt ənd æs æn ‚t ˈkɔːlt ˈvɔsər gəˌfɔlən

3

Alzen

(1075a)

dər ˈge͡at ɔːlt ˈmə͡uːn æs mæt ‚əm ˈhu͡ist dʊrç dət ˈa͡is ægəbrə͡oxən ʊx æn dɔːt ˈkɔːlt ˈvɔsər gəˌfɔln

 
  • Lexikalisches Merkmal 1: Verwendung von „Mann“ oder „Mensch“?
  • Zwei Merkmalsausprägungen: 1: Mann – 2: Mensch
  • Typisierung erforderlich: ˈmuːŋ, ˈmə͡uːn ⇒ „Mann„; ˈmæŋt͡ʃ ⇒ „Mensch
  • In ASD erfolgt die Identifizierung bislang durch reguläre Ausdrücke:
    • Mann: WHERE token rlike ‚[ˌˈ]?m.*[nŋuː]$‘ 
    • Mensch: WHERE token rlike ‚m.*[nŋ]t.*‘
  • Kartierung:

Lexikalische Variation des Wortes „Mann“ im Wenkersatz 4

  • Zugrundeliegende SQL-Abfragen: eine sucht nach „Mensch“, die andere nach „Mann“:
select
 ort, 
 nr, 
 group_concat(distinct intervall) as intervall, 
 ws, group_concat(token order by id_token separator ' ') as `Wenkersatz`

from tokens_phon 
join dateien using (nr) 
join (
 select distinct 
  nr, 
  intervall 
 from tokens_phon 
 where 
  token rlike '[ˌˈ]?m.*[nŋuː]$' -- phonetische Varianten von "Mann"
-- token rlike 'm.*[nŋ]t.*' -- phonetische Varianten von "Mensch"  

  and core=1 
  and sprecher=1 
  and ws=4
 ) as sq 
 using (nr, intervall) 

where 
 core=1 
 and sprecher=1 
 and ws=4 

group by
 nr order by ws, nr
;
  • Lexikalisches Merkmal 2: Verwendung von „Pferd“, „Roß“, „Hengst“ oder „Gurre“?
1

Neppendorf

(100)

dər ˈgɑːt ˈoːld ˈmuːŋ æs mæt ‚əm ˈroːs dʊrç dət ˈɛ͡is gəˌbroːxən ʊnd æs æn dət ˈkoːlt ˈvasər gəˌfalən

2

Almen

(1005a)

dər ˈge͡at ɔːlt ˈmæŋt͡ʃ æs mæt ‚ə ˈgɔrən dʊrç dət ˈa͡is ˈænəgərɔmpəlt ənd æs æn ‚t ˈkɔːlt ˈvɔsər gəˌfɔlən

3

Alzen

(1075a)

dər ˈge͡at ɔːlt ˈmə͡uːn æs mæt ‚əm ˈhu͡ist dʊrç dət ˈa͡is ægəbrə͡oxən ʊx æn dɔːt ˈkɔːlt ˈvɔsər gəˌfɔln

 
  • Merkmalsausprägungen: 1: Ross – 2: Gurre – 3: Hengst – (4. Pferd)
  • Typisierung: ˈroːs ⇒ „Ross„; ˈgɔrən ⇒ „Gurre“; ˈhu͡ist ⇒ „Hengst“
  • Reguläre Ausdrücke:
    • Ross: where token rlike ‚[ˈˌ]?r.*s‘
    • Gurre: where token rlike ‚ˈg.*r.*‘
    • Hengst: where token rlike ‚ˈh.*t‘
    • Pferd: where token rlike ‚ˈf.*r[dt][n]*‘
  • Kartierung:

Kartierung der lexikalischen Variation zum Stimulus „Pferd“ im Wenkersatz 4 im ASD-Korpus

  • Noch ein Beispiel aus der Phonetik: Wasser vs. Wosser:
  • Phonetisches Merkmal 1: Realisierung des Stimulus „Wasser“ – „Wasser“ vs. „Wosser“
1

Neppendorf

(100)

dər ˈgɑːt ˈoːld ˈmuːŋ æs mæt ‚əm ˈroːs dʊrç dət ˈɛ͡is gəˌbroːxən ʊnd æs æn dət ˈkoːlt ˈvasər gəˌfalən

2

Almen

(1005a)

dər ˈge͡at ɔːlt ˈmæŋt͡ʃ æs mæt ‚ə ˈgɔrən dʊrç dət ˈa͡is ˈænəgərɔmpəlt ənd æs æn ‚t ˈkɔːlt ˈvɔsər gəˌfɔlən

3

Alzen

(1075a)

dər ˈge͡at ɔːlt ˈmə͡uːn æs mæt ‚əm ˈhu͡ist dʊrç dət ˈa͡is ægəbrə͡oxən ʊx æn dɔːt ˈkɔːlt ˈvɔsər gəˌfɔln

 
  • Merkmalsausprägungen: 1: Wasser- 2: Wosser
  • Typisierung: ˈvasər ⇒ „Wasser„; ˈvɔsər,ˈvɔsər ⇒ „Wosser“
  • Reguläre Ausdrücke:
    • Wasser: where token in (‚ˈvasər‘,’ˈvasɛr‘,’ˌvasər‘,’vas‘)
    • Wosser: where token in (‚ˈvɔsər‘,’vɔs‘,’ˈvə͡oːsər‘,’ˈvoːsər‘,’vɔsər‘,’ˌvɔsər‘,’ˈvosər‘,’ˈvɔsə‘,’ˈvœːsər‘,’ˈve͡osər‘) (ɔ: https://www.fileformat.info/info/unicode/char/0254/index.htm: „LATIN SMALL LETTER OPEN O„)
  • Kartierung:

Kartierung der phonetischen Variation zum Stimulus „Wasser“ im Wenkersatz 4 im ASD-Korpus

  • Isoglossenkarten visualisieren die Verbreitung bestimmter Merkmalsausprägungen
  • sehr suggestiv

Isoglossenkarte zur Verbreitung der morpholexikalischen Typen für die Bezeichnung des TAGES VOR SONNTAG (Quelle: W. König, dtv-Atlas zur deutschen Sprache, Nördlingen 1978, S. 186)

  • Kontrast: Ein etwas anderes Bild von der Verbreitung der beiden morpholexikalischen Typen Samstag bzw. Sonnabend vermittelt die folgende Karte, die aus dem Projekt „Atlas zur deutschen Alltagssprache“ von Stefan Elspaß und Robert Möller stammt (Daten aus dem Jahr 2001/2):
  • Die Karte zeigt, dass das Wort „Sonnabend“ auch in Süddeutschland Verwendung findet. Umgekehrt ist Samstag auch in Norddeutschland weit verbreitet. Offen bleibt zunächst, ob der Kontrast zur Karte von Werner König durch Sprachwandel über die Zeit zu erklären ist (diachronische Dimension):

Karte „der Samstag“ aus dem Atlas zur deutschen Alltagssprache (Daten aus dem Jahr 2001/2)

  • Erzeugung von Isoglossenkarten durch „Parkettierung“ eines Punktnetzes

Verfahren zur Erzeugung Voronoi-Thiessen-Polygonen; Von Markus Matern – Eigenes Werk, Gemeinfrei, https://commons.wikimedia.org/w/index.php?curid=8460523 (leicht modifiziert)

Illustration: Mittelsenkrechte im Dreieck (Quelle: https://www.geogebra.org/geometry)

  • Beispiel: Isoglossenkarte von Sizilien mit der Kartierung des Merkmals „Realisierung des männlichen bestimmten Artikels“ (Merkmalsausprägung: lu, u):

Variation des sizilianischen Artikels Mask. Sg. lu vs. u in AIS 88 IL SANGUE ‚das Blut‘ auf einer Isoglossenkarte (Karte: Thomas Krefeld)

4.2. Quantitative Analyse

  • Arealbildung auf Basis der Kumulation der Verbreitung mehrerer Merkmalsausprägungen
  • Ermittlung der Übereinstimmung von Merkmalsausprägungen ausgehend von einem Referenz-Informanten
  1 2 (Referenzinformant) 3
A (Lexikon) a a a
B (Lexikon) a b c
C (Lexikon) a b b
D (Lexikon) a a a
E (Phonetik) a b b
F (Phonetik) a b b
  • bei Berücksichtigung aller Merkmale (in Klammern: Prozent):
  • Übereinstimmung mit Informant 1: 2 (33)
  • Übereinstimmung mit Informant 3: 5 (83)
  • bei Berücksichtigung nur der lexikalischen Merkmale:
  • Übereinstimmung mit Informant 1: 2 (33)
  • Übereinstimmung mit Informant 3: 3 (50)
  • bei Berücksichtigung nur der phonetischen Merkmale:
  • Übereinstimmung mit Informant 1: 0 (0)
  • Übereinstimmung mit Informant 3: 2 (33)

 

  • Visualisierung: Quantifizierende Kartierung:

    Quantifizierende Kartierung des Wenkermaterials im ASD. Übereinstimmung des Materials aus Rumes (gelber Punkt) mit dem Material aus Felmern. Rote Farbsättigung der Punktsymbole korreliert mit dem Maß der Übereinstimmung.

5. Literatur

5.1. Quellenmaterial (Publikation geolinguistischer Daten)

5.1.1. Sprachatlanten

traditionell (auf Papier):

  • AIS – Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz. vol. 1-7. Zofingen (online-Version: Graziano G. Tisato, NavigAIS. AIS Digital Atlas and Navigation Software, 2009)
  • ALF – Gilliéron, Jules / Edmont, Edmond (1897-1900): l’Atlas linguistique de la France. Paris: Champion.
  • ASLEF – Pellegrini, Giovan Battista (1974-1986): Atlante storico-linguistico-etnografico friulano. vol. 1-6. Padova.
  • DIWA – Schmidt, Jürgen Erich/ Herrgen, Joachim (Hrsg.) (2001-2009): Digitaler Wenkeratlas: http://www.diwa.info/
  • SDS – Baumgartner, Heinrich/ Handschuh, Doris/ Hotzenköcherle, Rudolf (1962-2003): Sprachatlas der Deutschen Schweiz. Band 1-9. Bern: Francke.
  • VALTS – Gabriel, Eugen (1985-2004): Vorarlberger Sprachatlas mit Einschluss des Fürstentums Liechtenstein, Westtirols und des Allgäus. Band 1-5. Bregenz: Vorarlberger Landesbibliothek.

Hybride Übergangsphase von Papier zu digital:

  • ALD-I – Goebl, Hans (1998): Atlant linguistich dl ladin dolomitich y di dialec vejins I. vol. 1-7. Wiesbaden: Reichert. (sprechend: http://ald.sbg.ac.at/ald/ald-i/index.php).
  • ALD-II – Goebl, Hans (2012): Atlant linguistich dl ladin dolomitich y di dialec vejins, 2a pert. vol. 1-5. Editions de Linguistique et de Philologie (Sprachatlas des Dolomitenladinischen und angrenzender Dialekte, 2. Teil).

genuin digital:

  • ASD – Krefeld, Thomas / Lücke, Stephan (seit 2009): Audioatlas siebenbürgisch-sächsischer Dialekte (ASD)
  • AsiCa – Krefeld, Thomas / Lücke Stephan (seit 2007): Atlante sintattico della Calabria (AsiCa)
  • VIVALDI – Kattenbusch, Dieter/ Tosques, Fabio (1998-2016): VIVALDI: Vivaio Acustico delle Lingue e dei Dialetti d’Italia. Aktustischer Sprachatlas der Dialekte und Minderheitensprachen Italiens. Berlin: Humboldt-Universität Berlin, Institut für Romanistik. http://www2.hu-berlin.de/Vivaldi/index.php?id=0001&lang=de

5.1.2. Georeferenzierte Wörterbücher

  • Grassi, Corrado (2009): Dizionario del dialetto di Montagne di Trento. San Michele all’Adige.
  • Idiotikon – Schweizerisches Idiotikon. Schweizerdeutsches Wörterbuch. Basel. http://www.idiotikon.ch/index.php
  • WBOE – Institut für österreichische Dialekt- und Namenlexika (Hrsg.) (1970ff): Wörterbuch der bairischen Mundarten in Österreich. Wien: Verl. der Österr. Akad. der Wiss.

5.2. Sekundärliteratur

  • Elspass/König 2008 – Elspaß, Stephan/ Werner König (Hrsg.) (2008): Sprachgeographie digital. Die neue Generation der Sprachatlanten (mit 80 Karten). Hildesheim/ Zürich/ New York: Olms.
  • Krefeld 2003 – Methodische Grundfragen der Strataforschung, HSK 23.1, 555-567
  • Krefeld/Lücke/Mages 2016 – Krefeld, Thomas / Lücke, Stephan / Mages, Emma (Hrsgg.): Zwischen traditioneller Dialektologie und digitaler Geolinguistik: Der Audioatlas siebenbürgisch-sächsischer Dialekte (ASD) (Korpus im Text 2), Münster 2016
  • Krefeld 2017a – Krefeld, Thomas (2017): Geolinguistik in der Perspektive der ‚digital humanities‘ (am Beispiel von Verba Alpina). Vorlesung dh-lehre. Version 2 (20.10.2017, 08:18). url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=20659&v=2.
  • Krefeld 2017b – Thomas Krefeld (2017): Glossotope statt Isoglossen. Zum Paradigmenwechsel in der Geolinguistik. Korpus im Text. Version 1 (19.10.2017, 07:51). url: http://www.kit.gwi.uni-muenchen.de/?p=13679&v=1.
  • Krefeld 2018 – Krefeld, Thomas (2018): Sprache und Raum – Italien und das Italienische. Vorlesung dh-lehre. Version 2 (2.02.2018, 17:47). url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=77045&v=2.
  • Krefeld/Lücke 2018 – Krefeld, Thomas / Lücke, Stephan (Hrsgg.) (2018): Berichte aus der digitalen Geolinguistik. Korpus im Text. Version 2 (18.06.2018, 09:56). url: http://www.kit.gwi.uni-muenchen.de/?p=4498&v=2

6. Anhang

select 
 a.nr, 
 a.token,
 a.ws,
 c.ort, 
 c.geschlecht, 
 c.`alter`, 
 b.pos,
 b.person,
 b.tempus,
 b.modus,
 b.genus,
 b.numerus,
 d.longitude, 
 d.latitude

from tokens_phon a
left join types_phon b using(id_type)
left join dateien c on a.nr = c.nr
left join orte d on c.ort = d.ort

WHERE
 c.inhalt_ids like 'Wenkersätze'
 and ws = 4
 AND d.ort LIKE 'Rätsch'

order by 
 id_token
;

 

 

Krefeld, Thomas (2019): Stratigraphie. In: , Methodologie. https://doi.org/10.5282/verba-alpina?urlappend=%3Fpage_id%3D493%26db%3D192%26letter%3DS%2355.
König, Werner & Paul, HJ (1978): Dtv-Atlas Zur Deutschen Sprache: Tafeln U, Texte. München: Deutscher Taschenbuch-Verlag.

Schreibe einen Kommentar