< < Vorheriger BeitragNächster Beitrag > >

Bidirektionale Suche: KONZEPT ↔ Bezeichnung

Version:

Zitation: Thomas Krefeld (2020): Bidirektionale Suche: KONZEPT ↔ Bezeichnung. Version 1 (07.10.2020, 17:20). Lehre in den Digital Humanities. , url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=178580&v=1



1. Ein Anwendungsbeispiel: VerbaAlpina

Gegenstand des Projekts VerbaAlpina (Krefeld/Lücke 2014-) ist "der alpine Kulturraum im Spiegel seiner Mehrsprachigkeit"; diese Formulierung will ernst genommen werden, denn sie setzt die systematische Trennung von KONZEPTEN und Bezeichnungen als grundlegendes Prinzip voraus. Im Grunde genommen ergab sie sich in ganz selbstverständlicher Weise aus der Absicht die Mehrsprachigkeit des Raums auf der Ebene der lokalen Dialekte zu erfassen. Den funktionalen Kern der Nutzeroberfläche bildet eine ‘interaktive Karte’ (Link), die es gestattet, den Datenbestand in der kartographischen Darstellung nach KONZEPTEN und nach  Bezeichnungen zu filtern:

Filter der interaktiven Karte von VerbaAlpina (Quelle)

Bei der Eingabe eines Suchbegriffs werden alle Treffer im Datenbestand gemäß den beiden Ebenen sortiert; die Bezeichnungen werden dabei, genauer gesagt, zu ‘Typen’ gruppiert; die Such nach <casa> ergibt beispielsweise das folgende Ergebnis:

Das Feld Suchbegriff

1.1. Suchrichtung KONZEPT → Bezeichnung

Die Darstellung richtet sich nun nach der Auswahl; bei Auswahl eines KONZEPTs werden die zugehörigen Bezeichnungen ausgegeben: so führt die Suche nach dem KONZEPT ALM zu dieser Karte mit insgesamt 562 Belegen. Einen Überblick erhält man, wenn man die jeweiligen Begriffe nicht über das allgemeine Suchfenster, sondern über den Filter  ‘Konzepte’ sucht, wie dieser Link zeigt.

Die KONZEPTE sind letztlich in der Art einer Ontologie geordnet:

Ontologische Ordnung der KONZEPTE in VerbaAlpina

Die oft - wie im Beispiel des Konzepts ALM - zahlreichen Treffer werden zu Typen gruppiert, die in der Kartenlegende erscheinen; dazu gehört u.a. der italienische Typ malga; jeder Typ kann kartographisch hervorgehoben werden, indem die anderen Typen (durch Klick auf das Kreissymbol in der Legende) mit grauen Symbolen in den Hintergrund gerückt werden (vgl. Karte). Einzelbelege können nicht gesucht werden, aber jeder Einzelbeleg ist über die interaktiven Symbole auf der Karte zugänglich; wenn die Symbole angeklickt werden, öffnen sich Präsentationsfenster, die unterschiedliche Informationen liefern:

  • zum Ort;
  • zur Quelle, gegebenenfalls mit der Originaltranskription;
  • zu entsprechenden Einträgen in Referenzwörterbüchern;
  • das jeweilige Konzept mitsamt der Wikidata-QID.

Als Beispiel dient ein Beleg des Typs malga in Fondo im Trentino (Link). Ganz in der Logik der Digital Humanities werden in der Präsentation projekteigene Daten mit  verfügbaren, projektexternen Diensten verknüpft, die weitere Informationen liefern. VerbaAlpina nutzt u.a. geonames; wie der oben einfügte Link zeigt, liefert die Verknüpfung des Ortsnamens mit dem zugehörigen Eintrag in geonames.org die Geocodes des Orts und einen weiterführenden Link auf den entsprechenden Wikipedia-Artikel über Fondo.

1.2. Suchrichtung Bezeichnung  → KONZEPT

In umgekehrter Richtung kann man von Bezeichnungen ausgehen und einen sprachlichen Typ auswählen. Angeboten werden sogenannte ‘morpho-lexikalische Typen’ und ‘Basistypen’. Unter einem ‘morpho-lexikalischen Typen’ werden Belege aus einer Sprachfamilie (Germanisch, Romanisch, Slawisch) gruppiert, die sich nur phonetisch mehr oder weniger unterscheiden, jedoch morphologisch (Wortart, Genus, Wortbildungsmorpheme) identisch sind und auf identische historische Vorläufer zurückgeführt werden können.  Wählt man einen solchen ‘morpho-lexikalischen Typ’,  wie zum Beispiel malga, dann erscheinen auf der jeweiligen Kartenlegende alle damit verbundenen Konzepte; in diesem Fall: ALM | HERDE | HÜTTE | STALL, FÜR KÜHE, MIT WÄNDEN UMSCHLOSSEN (vgl. Karte). So lassen sich die semantischen Prozesse (Krefeld 2018ag) erschließen, die zur Polysemie des jeweiligen Typs geführt haben. Da die relevanten Konzepte allesamt in engem sachlichen Zusammenhang stehen, liegt eine rein metonymische Konstellation vor.

Wählt man anstatt eines morpho-lexikalischen Typs einen ‘Basistyp’, werden ebenfalls die bezeichneten Konzepte in der Legende angezeigt; allerdings  ändert sich gewissermaßen die historische Perspektive, denn es tauchen auch solche Konzepte auf, die nicht nur durch seine direkten Weiterentwicklungen bezeichnet werden, sondern auch solche, die durch sekundär abgeleitete morpho-lexikalischen Typen bezeichnet werden. Sucht man also beispielsweise nicht den romanischen morpho-lexikalischen Typ malga, sondern den zu Grunde liegenden vorrömischen Basistyp malga  (der in diesem Fall zufällig formal identisch ist), dann findet man auch Konzepte wie SENN, das u.a. durch den Typ malgaro (< malga + Suffix -aro; Karte) bezeichnet wird, oder  das Konzept DIE ALM VERLASSEN mit dem zugehörigen verbalen morpho-lexikalischen Typ dismalgare (Karte) usw. Ein Basistyp erfasst weiterhin etwaige Entlehnungen in anderen Sprachfamilien, wie das Beispiel lat. caseu(m) (Karte) illustriert; die Kategorie ist also für die sprachgrenzüberschreitende Kartographie von zentraler Bedeutung.

1.3. Vorgängige Quellenaufbereitung

Die Selbstverständlichkeit, mit der die zweifache Suchrichtung an der Nutzeroberfläche erscheint, darf aber nicht darüber hinwegtäuschen, dass die Voraussetzungen erst mit erheblichem Aufwand geschaffen werden mussten.

Der Datenbestand von VerbaAlpina speist sich aus zwei unterschiedlichen Datenquellen und Datenformaten. Unproblematisch in der Verarbeitung sind die Daten, die durch ein Crowdsourcing-Verfahren (Link) neu erhoben werden, denn sie werden von vornherein den beiden Ebenen der KONZEPTE und Bezeichnungen zugeordnet. 

Von VerbaAlpina durch Crowdsourcing neu erhobene Daten
(Stand vom 12. Mai 2020; Quelle)
Gesamteintragungen: 17105, Anzahl Informanten: 1103 

      • aut: 2455
      • che: 3179
      • deu: 5328
      • fra: 205
      • ita: 5502
      • lie: 4
      • svn: 432

Der deutliche größere Teil des Datenbestands stammt jedoch aus anderen Projekten, seien es bereits publizierte Quellen oder aber (noch) unveröffentlichte Materialien, die uns auf der Grundlage von Kooperationsvereinbarungen zur Verfügung gestellt wurden.  Ein nicht geringer Anteil davon, insbesondere die für das Projekt wichtigen klassischen Sprachatlanten,  entsprach (und entspricht teils noch immer) dem Digitalisierungsgrad 0 (gemäß Lücke 2017). Die Überführung dieser Quellen in strukturierte Daten ist eine wirklich große Herausforderung. Im ersten Schritt ist es wichtig, die gelieferten Informationen eindeutig zu kategorisieren.

Exemplarisch ist die AIS-Karte 1192 LA CASCINA DI MONTAGNA (Link): Der Kartentitel gibt ein eher abstraktes KONZEPT vor, das im Kommentar am linken Kartenrand in einen sachlichen Kontext eingebettet und spezifiziert wird. Relevant ist dieser Passus wo die Bauart und Funktion des Gebäudetyps charakterisiert wird:

Ausschnitt aus dem Kommentar zu AIS 1192 LA CASCINA DI MONTAGNA (Link)

Allerdings werden auf derselben Karte noch weitere Konzepte erfasst, die nicht in allen Orten abgefragt wurden, nämlich MILCH-, KÄSEKELLER sowie ALPSTALL. Die Bezeichnungen finden sich teils am linken Rand der Karte, teils auf der Karte selbst. Kompliziert werden die Verhältnisse dadurch, dass unterschiedliche Gebäudetypen differenziert werden. Im Fall des MILCH-, KÄSEKELLERs werden sie systematisch berücksichtigt, wie der folgende Kommentar zeigt:

Ausschnitt aus dem Kommentar zu AIS 1192 CANTINA DA LATTE, DA FORMAGGIO

Entsprechend werden die erhobenen Bezeichnungen mit A, E, S markiert:

Einige Bezeichnungen des Konzepts CANTINA DA LATTE, DA FORMAGGIO aus AIS 1192

Es ist daher unumgänglich spezifische Konzepte in der Datenbank anzulegen (Link). Man beachte auch, dass diese Konzepte in VerbaAlpina nicht als KELLER, sondern als RAUM beschrieben werden, denn es handelt sich ja gerade nicht um KELLER im Sinn des deu. Wortes Keller, das Räume unter der Erdoberfläche bezeichnet. Dergleichen gibt es auf Almen wegen des felsigen Untergrunds in aller Regel gar nicht.1

Im Fall des Konzepts ALPSTALL wird eine noch genauere Spezifizierung vorgenommen, die oft nur für einen einzigen Beleg zutrifft, so dass es sich unter Umständen um Besonderheiten eines einzigen Referenten (hier: eines singulären Gebäudes) handelt. Im Sinne der Quellentreue ist es aber unumgänglich, auch in diesen Fällen jeweils spezifische Unterkonzepte anzulegen (Link). Auch der Status mancher Illustrationen im AIS und vor allem der Photodokumentation ist im Hinblick auf die Verallgemeinerbarkeit der gezeigten Realia kaum einzuschätzen (vgl. die Photobeispiele in Krefeld 2019b, Link).  

Das heißt im Fazit: Analoge Quellen, wie z.B. prototypische Karten des AIS, liefern  mindestens KONZEPTE und Bezeichnungen, häufig kommen aber Informationen über Referenten hinzu, so dass sich ein dreidimensionaler semiotischer Raum ergibt:

Drei semiotische Dimensionen

Diese Dimensionen müssen in der Datenstruktur eindeutig abgebildet und mit Normdaten versehen werden, im relationalen Format geschieht das in Gestalt spezifischer Tabellen. Vielseitig nutzbare Normdaten sind die Geokoordinaten und Datumsangaben.

2. Eine interdisziplinäre Projektidee: die Anfänge der LUFTFAHRT

Die bidirektionale Erschließung kultureller Wissensbestände wurde am Beispiel eines dialektologischen Projekts skizziert; sie ist aber von ganz grundsätzlicher Bedeutung für alle Humanities, wie ausgehend von einem Roman in ganz elementarer Weise angedeutet werden soll.

2.1. Ein Roman von Filippo Tommaso Marinetti

Die europäische und italienische Literaturgeschichte ist nicht arm an Büchern, die in der Öffentlichkeit Skandale produzierten; dazu gehört der ursprünglich im Jahre 1912, in Paris, auf französisch erschienene Roman Le monoplan du Pape (ita. L'aeroplano del papa; Link). Marinetti war Begründer des Futurismus, einer gewaltverherrlichenden, antibürgerlichen Bewegung, die mit extremem Fortschrittspathos  auftrat und die Errungenschaften der sich stürmisch entwickelnden Technik glorifizierte. Emblematisch für den ganzen Komplex ist das titelgebende, damals noch ganz neue FLUGZEUG. Der Text ist im Digitalisierungsgrad 1 verfügbar und gewissermaßen ideal geeignet für eine Überführung auf einen höheren Grad auf der Grundlage von OCR.

In der Perspektive der Digital Humanities müsste der Roman in ein mehrdimensionales Netz von Informationen eingebunden werden: nämlich in

  • die technische Geschichte der Luftfahrt;
  • die Wortgeschichte der einschlägigen Termini:
  • eine Literaturgeschichte der Luftfahrt und des Flugzeugs im Speziellen;
  • die zeitgenössische literarische Szene der Zeit;
  • die politische Situation Italiens und Mitteleuropas am Vorabend des Ersten Weltkriegs;
  • die zeitgenössische Kunstszene.

2.1.1. Die technische Geschichte der Luftfahrt

Der Darstellung in der Wikipedia (Link) kann man entnehmen, wie rasant sich der Motorflug  entwickelte: Der erste freie und gesteuerte Motorflug  wurde nach herrschender Meinung am 17. Dezember 1903 von den Brüdern Orville und Wilbur Wright durchgeführt (Link).  Bereits seit 1911 (in Indien) und 1912 (in Deutschland) wurden offizielle Luftpostbeförderungen eingerichtet: Damit erhielt das Flugzeug eine gesellschaftliche Funktion.

2.1.2. Die Wortgeschichte der einschlägigen Termini

Marinetti spricht von monoplan (ita. aeroplan), d.h. von einem Eindecker, wie sie in Frankreich seit 1908 gebaut wurden (Link). Schon im Jahre 1884 gründete das italienische Kriegsministerium einen Servizio Aeronautico  (Link); die ital. Bezeichnung - eine Seefahrtsmetapher - ist allerdings noch älter, denn die Lexikographie nennt 1821 als Jahr des Erstbelegs (Link). Zweifellos handelt es sich um eine Entlehnung aus dem Französischen, denn dort ist nach Auskunft des TLFi bereits 1784 von einer (nicht existenten) "Machine aéronautique" die Rede (Link). Die Übertragung der Bezeichnung von schwimmenden auf fliegende Transportmittel ist allerdings noch älter, da sie schon auf Francesco Lana de Terzi (1631-1687; Link) zurückführt, nämlich auf das 6. Kap. Fabricare una Nave, che camini sostentata sopra l’aria, a remi, & a Vele […] seines Buch Prodromo (1670). Als Luftschiffe bezeichnete man also zunächst Phantasievorstellungen und seit der Erfindung der  Brüder Mongolfier auch HEISSLUFTBALLONE, später gasgefüllte BALLONE und dann auch lenkbare  ZEPPELINE.    

2.1.3. Eine Literaturgeschichte der Luftfahrt und des Flugzeugs im Speziellen;

Phantastische Erzählungen über Luftreisen gibt es gewiss schon sehr lange; mit Blick auf die technischen Entwicklungen assoziiert man so unterschiedliche Autoren wie Jean Paul oder Antoine de Saint-Exupéry.

2.1.4. Die zeitgenössische literarische Szene der Zeit 

Von besonderer Bedeutung für den ‘Aufhänger’ Marinetti ist jedoch ein Artikel eines anderen berühmten Schriftstellers, der einen unmittelbaren Italienbezug aufweist, die Rede ist von Franz Kafka, Die Aeroplane von Brescia (Link). Der Texte aus dem Jahre 1909 bezieht sich auf seinen Besuch einer Flugschau in Brescia, an der nicht nur berühmte Flugpioniere der Zeit teilnahmen, sondern bei der auch andere wichtigen Autoren gegenwärtig waren, insbesondere der für seine Flugleidenschaft berühmte Gabriele D'Annunzio, ein Kriegsbegeisterter, wie Marinetti.

2.1.5. Die politische Situation Italiens und Mitteleuropas am Vorabend des Ersten Weltkriegs

Marinettis Roman, jedenfalls seine italienische Übersetzung ist einer Stadt gewidmet, die in Bezug auf die österreichisch-italienischen Auseinandersetzungen im Ersten Weltkrieg eine besondere Rolle spielte: “À Trieste notre belle poudrière” / “Trieste, la nostra bella polveriera”. Marinetti war Kriegsfreiwilliger, ebenso Gabriele D'Annunzio, der im Übrigen kurz vor dem Ende des Kriegs einen spektakulären Flug nach Wien durchführte, bei dem Tausende Flugblätter abgeworfen wurden (Link). 

2.1.6. Die zeitgenössische Kunstszene

Der sogenannte Futurismus war keinesweg eine rein literarische Bewegung, sondern umfasste auch Architekten und Maler; speziell in der Malerei ist die aeropittura zu nennen, die wiederum durch das Erlebnis des Fliegens inspiriert war.

Hier schließt sich nun gewissermaßen der Kreis und es wird klar, dass die Verflechtung der genannten Werke, Richtungen und Personen technisch grundsätzlich zu bewerkstelligen wäre, wenn alle genannten Instanzen auf einen gemeinsamen ontologischen Rahmen bezogen (FLIEGEREI), mit Metadaten einschließlich Normdaten angereichert und in einen sowohl geo- und als auch chronoreferenzierten Rahmen gestellt würden.

Bibliographie

  • Krefeld 2019b = Krefeld, Thomas (2019): AIS: Ethnolinguistik, in: Lehre in den Digital Humanities, München, LMU (Link).
  • AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, vol. 8, Zofingen (Link).
  • Krefeld 2018af = Krefeld, Thomas (2018): Analoge Sprachgeographie, in: Methodologie, VerbaAlpina-de 19/2 (Link).
  • Krefeld 2018ag = Krefeld, Thomas (2018): Semantik, in: Methodologie, VerbaAlpina-de 19/2 (Link).
  • Krefeld/Lücke 2014- = Krefeld, Thomas / Lücke, Stephan (Hrsgg.) (2014-): VerbaAlpina. Der alpine Kulturraum im Spiegel seiner Mehrsprachigkeit, online [Ultimo accesso 20/01/2019 ore 16:02] (Link).
  • Lücke 2017 = Lücke, Stephan (2017): Digitalisierung, in: 17/1, VerbaAlpina-de (Hrsg.), Methodologie (Link).
  • Marinetti 1912 = Marinetti , Filippo Tommaso (1912): Le monoplan du Pape. Roman politique en vers libres, Paris, Sansot (Link).
  • Paul 1959–1963 = Paul, Jean (1959–1963): Des Luftschiffers Giannozzo Seebuch (1801), in: Werke, vol. 3, München (Link).
  • Saint-Exupéry 1931 = Saint-Exupéry, Antoine de (1931): Vol de nuit, Paris, Gallimard (Link).
  • TLFi = atilf (1994): Trésor de la Langue Française informatisé, Nancy, Université de Lorraine - CNRS (Link).
Das mögliche Missverständnis des Kartentitels ist im Übrigen ein typischer Effekt der unscharfen Trennung von KONZEPT und Bezeichnung.

Schreibe einen Kommentar