Konzeption eines dynamischen Briefkorpus




1. Vorwort

Im Rahmen des Masterseminars 'L'italiano dei semicolti', das sich mit der Untersuchung von Leo Spitzers (1921) gesammelten italienischen Kriegsgefangenenbriefen beschäftigt, soll ein dynamisches Briefkorpus konzipiert und erstellt werden, das sowohl die Kriegsgefangenenbriefe Spitzers beinhaltet als auch die Möglichkeit bietet, neues Briefmaterial in das Korpus zu integrieren.
Das Ziel dieses Projektes ist es, das dynamische Briefkorpus so zu konzipieren, dass die verschiedenen Quellen übersichtlich dargestellt werden, Metadaten hinzugefügt werden können und der Vergleich von Briefen einer oder unterschiedlicher Briefsorten ermöglicht wird.

Im Zentrum dieses Projekts steht das sprachwissenschaftliche Interesse, da Briefe in ihren verschiedenen Ausprägungen und Formen das kommunikative routinisierte Alltagswissen des Menschen abbilden und infolgedessen verschiedenste Fragestellungen der Linguistik beantworten können, die sich auf das sprachliche und soziale Handeln des Menschen beziehen (vgl. Ermert 1979, 10-11). In Hinblick auf das Medium Brief wäre es beispielsweise interessant zu sehen, wie das sprachliche Handeln konkret realisiert wird, welche Möglichkeiten sich durch das Medium Brief bieten oder nicht bieten, welche Intensionen innerhalb des Mediums vorgefunden werden können und inwieweit äußere Einflüsse und soziale Gegebenheiten die Gestaltung beeinflussen (vgl. Ermert 1979, 10-11).
Die Kommunikationsform Brief zeichnet sich vor allem durch ihre große Varianz aus und erlaubt die indirekte Kommunikation zwischen zwei Personen, die räumlich und zeitlich voneinander getrennt sind. Um den Anschein eines echten Gesprächs zu erwecken, bedient sich der Schreiber oftmals Elementen der mündlichen Kommunikation, was in manchen Fällen zu einer Vernachlässigung des Schreibstils führen kann (vgl. Gellert 1751, 2-3), und beachtet folglich nicht immer die konventionellen Schreibnormen (vgl. Beck 1973, 84). Diese Vernachlässigung der Schreibnormen kann beispielsweise bei der Integrierung von volkstümlich-umgangssprachlichen Elementen beobachtet werden oder bei der Simplifizierung von Wörtern. 
Elemente und Bedingungen, die die mündliche Kommunikation charakterisieren, sind unter anderem eine höhere Spontaneität, eine starke emotionale Beteiligung, die im Falle der gesammelten Briefe Spitzers durch den Krieg zusätzlich verstärkt wird, und eine freie Themenentwicklung (vgl. Koch/Oesterreicher 2011, 7-8). Diese Elemente spiegeln sich auch in den untersuchten Kriegsbriefen von Spitzer auf Ebene der Graphie, der Morphologie, der Syntax, der Textualität und des Lexikons wider und können in den verlinkten Beiträgen, die im Rahmen des Masterseminars entstanden sind, und den dort aufgeführten Beispielen beobachtet werden.

Die Textsorte Brief setzt sich überdies aus unterschiedliche Briefsorten zusammen, die sich innnerhalb ihrer Konzeption in ihrer Intention, ihrem Handlungsbereich, im Partnerbezug und im Handlungszusammenhang unterscheiden (vgl. Ermert 1979, 70).1 Die kommunikative Beziehung zwischen Absender und Adressat ist in jedem Fall von großer Bedeutung, wie auch der Handlungsbereich des Briefes, der in privat und offiziell gegliedert werden kann. Der offizielle Handlungsbereich kann wiederum in die Kategorien volloffiziell und halboffiziell unterteilt werden, wobei im halboffiziellen Handlungsbereich entweder von einem offiziellen Absender oder von einem offiziellen Empfänger ausgegangen wird (vgl. Ermert 1979, 70). Der private Handlungsbereich ist hingegen durch die privaten Rollen, die die Absender und Empfänger einnehmen, und durch die emotionale Nähe der Korrespondenten, die zum Beispiel Familienangehörige, Freunde oder Bekannte sind, charakterisiert (vgl. Ermert 1979, 76).

Spitzer selbst misst der Briefkorrespondenz hohe Wichtigkeit bei und behauptet, dass "die volkstümliche Briefstellerei [...] zur Klarheit über das Wesen des Volktümlichen überhaupt führen muss" (Spitzer 1921, 1) (Einleitung, 1). Diese Aussage liegt in der Annahme begründet, dass der Schreiber sich selbst auch in Extremsituationen, wie beispielsweise im Ersten Weltkrieg, treu bleibt und infolgedessen seine Gefühle und Gedanken niederschreibt, ohne seinen 'Stil' zu verändern (vgl. Spitzer 1921, 2 / Einleitung, 6). Dies würde folglich auch bedeuten, dass sich die Sprache des Schreibers nicht verändert und in bestimmten Situationen sprachliche Elemente, die zur damaligen Zeit beispielsweise in der Mündlichkeit gebräuchlich waren, in Briefen wiederzufinden sein sollten, die den heutigen Schreibkonventionen nicht entsprechen. Laut Spitzer ist es also wahrscheinlich, dass die Briefe nicht nur Aufschluss über die Sprache sondern auch über die Kultur Italiens zur Zeit des Ersten Weltkriegs geben.

Um einen Überblick darüber zu geben, wovon die gesammelten Kriegsgefangenenbriefe Spitzers handeln und welche Besonderheiten sie aufweisen, wird im Folgenden eine Beschreibung und Erläuterung ebendieser folgen, die zunächst die grundlegenden Charakteristiken der Kriegsgefangenenbriefe betreffen werden und im weiteren Verlauf zusätzlich durch ausgewählte Beispiele ergänzt werden. Zu beachten ist allerdings, dass die Briefe Spitzers im Zuge des Masterseminars 'L'italiano dei semicolti' bereits anhand von verschiedenen linguistischen Kriterien untersucht und analysiert wurden und das folgende Kapitel aufgrund dessen keine vollständige linguistische Analyse der Briefe darstellen wird. Vielmehr soll aufgezeigt werden, was einen Kriegsgefangenenbrief zu einem Kriegsgefangenenbrief macht und worin sich ebendieser von anderen Briefsorten unterscheidet.

2. Besonderheiten der italienischen Kriegsgefangenenbriefe Spitzers

Bei Spitzers gesammelten und untersuchten Briefen handelt es sich demnach nicht lediglich um italienische Briefe, sondern vielmehr um italienische Kriegsbriefe (vgl. Spitzer 1921, 2 / Einleitung, 5), die von Kriegsgefangenen oder Internierten während des Ersten Weltkrieges geschrieben oder erhalten wurden. Diese italienischen Kriegsgefangenenbriefe zeichnen sich laut Spitzer zum einen durch ihre Gleichförmigkeit aus (vgl. Spitzer 1921, 6 / Einleitung, 12) und zum anderen durch die Tatsache, dass viele der Schreiber eine geringe Schreibkompetenz besitzen (vgl. Spitzer 1921, 7 / Einleitung, 14).
Die Gleichförmigkeit der Korrespondenz spiegelt sich einerseits in den immer wiederkehrenden Themen wider, die in den  Briefen vorzufinden sind, wie beispielsweise Klagen über Hunger und Kälte, Sehnsucht und Heimweih, die Hoffnung auf Frieden, Entschuldigungen wegen schlechter Schrift und das Verhältnis der Gefangenen zur Zensur, und andererseits in der Einfachheit der Strukturierung der Briefe, die der mangelnden Schreibkompetenz geschuldet ist (vgl. Spitzer 1921, 7-8 / Einleitung, 14). Vergleicht man die gesammelten Briefe Spitzers miteinander, lassen sich zum Beispiel bestimmte Gruß- und Abschlussformeln finden, die in leicht abgewandeltem Maße immer wieder Verwendung finden und in Beispiel (1) und (2) zu sehen sind. Manchmal dienen diese dazu, von den wichtigen Inhalten des Briefes abzulenken, doch oftmals stellen sie für die ungeübten Schreiber auch eine Art Leitfaden dar (vgl. Spitzer 1921, 48-49 / Kap. I, 2).

(1) it. lo vengo ascrive questa mia lettera perfarti Sapere lottemo stato del mia buona Salute che io e gli mio Campagno stanno molto bene e acosi io spero anche di voi e di mia Madre e di mia Cognata di mia Nipote e dutto di nostra casa io spero che gotete anottema salute, (Spitzer 1921, 49-50) (Kap. I, 3)

(2) it. dunque io termino caro Bepi col lasciarvi colle lagrime alli occhi e un grande dolore al cuore; (Spitzer 1921, 53) (Kap. I, 13)

Die eher geringe Schreibkompetenz und -erfahrung der italienischen Briefschreiber führt auch zu einigen Besonderheiten, die nicht nur die Strukturierung der Briefe betreffen, sondern auch deren Formulierung. Diese Besonderheiten können auf Ebene der Graphie, der Syntax, der Morphologie, der Textualität und des Lexikons beobachtet werden. Grundsätzlich kann gesagt werden, dass auf allen genannten Ebenen häufig eine unbewusste Vereinfachung stattfindet, sei es die fehlende Interpunktion oder der Gebrauch eines dialektalen Wortes anstatt eines standarditalienischen Wortes, und aufgrund dessen die Frage gestellt werden kann, ob man im Falle von den gesammelten Kriegsgefangenenbriefen von Spitzer von einem italiano dei semicolti sprechen kann. 

Fresu (2014) definiert das italiano dei semicolti als "strumento linguistico in modo deviante rispetto alla norma corrente, condivisa e accettata, e il cui comportamento linguistico per tale motivo è soggetto a forte stigmatizzazione sociale".  Diese Definition von Fresu besagt, dass das italiano dei semicolti sowohl verbreitet als auch akzeptiert ist, von der existierenden Norm abweicht und einer starken sozialen Stigmatisierung unterliegt. Des Weiteren erklärt Fresu, dass es sich beim italiano dei semicolti um eine Varietät handelt, die vorwiegend in schriftlichen Texten vorzufinden ist, die privaten oder praktischen Charakter haben, und weit von der literarischen Sprache entfernt ist (vgl. Fresu 2016, 328). Hinzufügend erklärt D'Achille, dass es sich bei den sogenannten 'semicolti‘ um Personen handelt, die zwar alphabetisiert sind, aber niemals eine hohe Kompetenz im Bereich des Schreibens erlangt haben und aus diesem Grund in der Schriftlichkeit viele Merkmale der Mündlichkeit aufweisen (vgl. D'Achille 1994, 41). Zwei Mechanismen beeinflussen die Merkmale dieser Varietät besonders: zum einen der Kontakt zum lokalen Umfeld, der vor allem auf Ebene der Phonetik und des Lexikons zu Interferenzen führt, und zum anderen die Umstrukturierung der italienischen Standardsprache durch beispielsweise Analogien, die Hyperkorrektismen hervorrufen, aber auch zu Simplifizierungen führen können (vgl. Fresu 2016, 329). Diese Kriterien treffen auch auf die gesammelten Briefe von Spitzer zu und lassen dementsprechend die Folgerung zu, dass es sich bei Spitzer tatsächlich hauptsächlich um Schreiber handelt, die ihre Briefe in einem italiano dei semicolti verfassen. 
Die Università di Bologna hat in Hinblick auf die Analyse von testi semicolti eine Checkliste mit Merkmalen entworfen, die normalerweise in Texten, und somit auch in Briefen, von Italienern mit einer niedrigeren Schreibkompetenz festgestellt werden können. Das italiano dei semicolti zeichnet sich demnach durch verschiedenste Merkmale aus, die auf diversen linguistischen Ebenen wiedergefunden werden können, wie beispielsweise die mangelnde Wahrnehmung von Wortgrenzen auf Ebene der Graphie, die fehlende Textkohäsion auf Ebene der Textualität, die Vertauschung von Adjektiven und Adverbien und die Unsicherheiten bei der Verwendung von Präpositionen auf Ebene der Morphologie, die häufige Verwendung des che polivalente auf Ebene der Syntax und der Tausch von Suffixen und Präfixen auf Ebene des Lexikons (vgl. Università di Bologna).2

Doch warum wird in Zusammenhang mit den Kriegsgefangenenbriefen Spitzers von einem italiano dei semicolti geredet und nicht von einem italiano popolare? Eine Grenze zwischen diesen beiden Begrifflichkeiten zu ziehen ist nicht einfach, da sich sowohl der Begriff italiano dei semicolti als auch der Begriff italiano popolare auf die Sprache von weniger Gebildeten oder Ungebildeten bezieht und in beiden Fällen ähnliche Charakteristika aufweist (vgl. Fresu 2016, 328-329 & Berruto 1983, 38-39). Während das italiano dei semicolti aber vor allem ein Phänomen der Schriftlichkeit darstellt, bezieht sich das italiano popolare nicht vorwiegend auf die schriftliche Produktion von Texten, sondern beschäftigt sich in erster Linie mit den linguistischen Phänomenen, die bei Personen auftreten, die Italienisch, jedoch nicht ihren Dialekt sprechen, obwohl sie mit diesem aufgewachsen sind und ihn in allen Lebenslagen verwenden (vgl. D'Achille 1994, 45-46). Die Mündlichkeit steht demnach im Vordergrund und stellt das Hauptinteresse dieser Forschungsdisziplin dar. Da es sich bei Spitzers gesammelten Briefen aber um Schriftmaterial handelt, kann der Begriff italiano dei semicolti ohne Bedenken verwendet werden.

Eine weitere Besonderheit, die die italienischen Kriegsgefangenenbriefe Spitzers auszeichnet, ist der situative Aspekt der Kommunikationssituation in der sich die Schreiber befinden. Durch den Krieg und die Gefangenschaft werden die Schreiber von äußeren Faktoren beeinflusst und formulieren Privatbriefe, die die Besonderheit aufweisen, dass sie nicht nur von den Adressaten gelesen werden, sondern auch von den Zensoren. Die Privatbriefe der Kriegsgefangenen werden demzufolge unter der Bedingung von Öffentlichkeit, die in Gestalt des Zensors präsent ist, verfasst. Diese Produktionsbedingungen beeinflussen sehr häufig den Inhalt der Briefe und deren Strukturierung. In manchen Fällen wenden die Kriegsgefangenen sich beispielsweise direkt an den Zensor, wie in Beispiel (3) und (4) zu sehen ist oder verwenden eine Art Geheimsprache in der Hoffnung, dass der Zensor ebendiese nicht versteht, wie Beispiel (5) aufzeigt. Der Zensor sei dem Briefeschreiber 'allgegenwärtig', so Spitzer (1921, 233) (Kap. XX, 7), und trage zwar dazu bei, dass dieser nicht immer seine wahren Gefühle preisgibt, doch verhindere er selten die Mitteilung wichtiger Geschehnisse oder den Briefwechsel an sich (vgl. Spitzer 1921, 249 / Kap. XX, 66). 

(3) it. Domando scuse al chiarissimo sig. Censore se metto a dura prova la Sua pazienza, facendo Le leggere questi cattivi versi dialettali. Che sia almeno un diversivo dalla continua e noiosissima lettura dell’altrui corrispondenza giornaliera. Auguri. (Spitzer 1921, 241) (Kap. XX, 38)

(4) it. Sono venuta via dalla biblioteca rabbiosa. Ci sono tanti e tanti mosconi che girano e girano intorno ai miei vent’anni alla mia avvenenza e forse, a quella pò di intelligenza che le madre mi à data, Mi urtano. Passo un periodo di calma assoluta. Non voglio saperne di amoretti. Evviva la libertà! Gli uomini sono una manica di cretini (il censore non si abbia a male, chè . . . sono esclusi i presenti) che vuoi? È la mia opinione intima e radicata. (Spitzer 1921, 234) (Kap. XX, 7)

(5) it. Saluti e 2— 1— 3— 9— 13–12— 9 (= bacioni). (Spitzer 1921, 60) (Kap. II, 25)

Die geringere Schreibkompetenz der Internierten und Kriegsgefangenen wurde schon mehrfach erwähnt und als Grund für etliche sprachwissenschaftliche Phänomene genannt, die in den Briefen vorgefunden werden können, doch muss ebenfalls kurz erwähnt werden, dass sich unter den Schreibern auch gebildetere Personen befinden und beispielsweise sogar Gedichte von ihnen geschrieben wurden, wie in Beispiel (6) zu sehen ist.

(6) it. Aria ferma e corrotta, aque stagnanti
Biscie, zanzare e rane
Sabbie senza confin corvi vaganti
Donne brutte e villane
Gente ignorante gialla e discortese
Ecco questo paese.
Vorrei scriverti ancora ma ci son mille censure della malora.
(Spitzer 1921, 233) (Kap. XX, 6)

Die Anzahl von wohlformulierten Briefen ist wesentlich geringer als die Anzahl von Briefen mit Merkmalen des italiano dei semicolti, doch zeigt sich, dass die gesammelten Briefe Spitzers zwar eine hohe Gleichförmigkeit aufweisen, diese aber nicht auf alle Briefe ohne Ausnahme zutrifft. Die Schreibkompetenz der Kriegsgefangenen und Internierten variiert und lässt die pauschalisierende Bezeichnung italiano dei semicolti in manchen Fällen als problematisch erscheinen. Bei der Analyse der gesammelten Kriegsgefangenenbriefe kann ein Gefälle festgestellt werden, das die Schreibkompetenz betrifft, und es wird außerdem deutlich, dass die festgestellten sprachlichen Phänomene oftmals personenspezifisch auftreten. Dies kann unter anderem an der Herkunft der Schreiber, an deren Bildungsgrad oder auch an äußeren Faktoren, wie beispielsweise der Kälte3 liegen und bedeutet, dass nicht alle Schreiber die gleichen Merkmale oder grundsätzlich Merkmale in allen linguistischen Kategorien aufweisen, sondern ein individueller 'Stil' der Schreiber festgestellt werden kann.

Des Weiteren kann über die Briefe Spitzers gesagt werden, dass die Kommunikationspartner vor allem Familienmitglieder sind, aber auch Dienstpersonal oder Freunde unter den Adressaten gefunden werden können. Es handelt sich bei den gesammelten Kriegsgefangenenbriefen also nicht ausschließlich um Familienkorrespondenz und bei den Adressaten auch nicht immer um die engsten Vertrauten. So bittet beispielsweise eine Dienstmagd ihren Hausherren in Beispiel (7) um 500 Kronen und geht in ihrem Brief auf seine Sünden ein, um ihm ein schlechtes Gewissen einzureden.

(7) it. Sig. C. Non posso far di meno di congratularmi con voi e infinitamente ringraziarvi assieme mio marito delle dolci lodi che con grande boccaccia andate dicendo sopra di noi, benche lontana so il tutto quello che mi avette detto. (...) mi avette promeso mercoledi senza fallo vengo a Grigno e ti paghero il tutto, stetti io colla speranza del vostro dire ma le vostre parole furono false, ed io fui costretta andare imprestito di denaro per fare il viaggio di mettere al sicuro le mie chreature. (...) che andate dicendo, quando voi mi spedirette 500, Corone (…) Allora arroscirete voi, mettetevi una mano nella coscienza e esaminatevi un poco e sentirete una voce che vi dice, ritira uomo quello maledete parolo dette con tua brutta lingua, sopra di coloro cho ti feci solo che del bene della tua giustizia e fedelta, da voi stesso vi vergognerette. Vidico che ce un Dio non paga soltanto al sabato ma tutti i giorni statte alerta e pensattevi. (Spitzer 1921, 290-291) (Kap. XXIV, 41)

Die italienischen Kriegsgefangenenbriefe Spitzers weisen also allerlei Besonderheiten auf und sind in erster Linie durch ihre Gleichförmigkeit gekennzeichnet, die einerseits der Situation und andererseits der eingeschränkten Schreibfertigkeit der Schreiber geschuldet ist, sowie durch die Tatsache, dass eine dritte Person den verfassten Brief liest und für geeignet oder ungeeignet erklärt. Die Briefe Spitzers stellen also Privatkorrespondenz dar, die der Öffentlichkeit, in Gestalt des Zensors, zugänglich gemacht wird. Des Weiteren ist zu beachten, dass nicht alle Schreiber als semicolti bezeichnet werden können, doch die gesammelten Briefe die Schlussfolgerung zulassen, dass die große Mehrheit der Kriegsgefangenen eine geringe Schreibkompetenz besitzt.
Diese Merkmale der italienischen Kriegsgefangenenbriefe erlauben interessante Analysen und viele Vergleichsmöglichkeiten innerhalb des Korpus von Spitzer. Um weitere Analysen der Briefe und ihre Annotation zu vereinfachen und die Möglichkeit zu bieten, diese mit anderen Briefsorten zu vergleichen, soll deswegen ein dynamisches Briefkorpus konzipiert werden.

3. Die Konzeption des dynamischen Briefkorpus

3.1. Erstellung der Datenbank

Die Grundlage des dynamischen Briefkorpus bilden die zu untersuchenden Briefe, die in einem ersten Schritt in eine Datenbank eingefügt werden müssen. Für die Erstellung des bereits beschriebenen Korpus wird die Plattform Digital Humanities Virtual Laboratory (DHVLAB) verwendet, die es ermöglicht, eine Datenbank zu erstellen, in die auch weitere Subkorpora eingebunden werden können. Die bereits erstellte Datenbank für das dynamische Briefkorpus trägt den Namen lab_semicolti.
In der Datenbank entspricht jeder Brief einer Datei und wird mit einem Set von Metadaten verknüpft, die separat eingetragen werden müssen. Wie die Erfassung und Eintragung der Metadaten funktioniert, wird im folgenden Kapitel 3.2. ausführlich erklärt.

Um die Briefe in die Datenbank integrieren zu können, müssen diese in digitaler Form existieren. Im Falle von Spitzers Kriegsgefangenenbriefen wurde die Druckausgabe des Buches mithilfe eines Texterkennungsprogramms (OCR) digitalisiert und in einem weiteren Schritt durch die Hilfe der Kursteilnehmer und -leiter dieses Masterseminares nachkorrigiert, sodass eine digitale Textversion entstanden ist, die eins zu eins dem Original entspricht. In einem zweiten Schritt wird nun eine Datei für jeden Brief erstellt werden, in der sich der Brief oder das Brieffragment mit seinen entsprechenden Metadaten befindet. Dabei ist es notwendig, darauf zu achten, dass die Briefe Spitzers aus DH-Lehre zunächst in einen Editor kopiert werden, damit sie ein Unix-Zeilenende und ein UTF-8 Format erhalten. 
Diese Voraussetzungen gelten für alle Briefe oder Schriftstücke, die in die Datenbank integriert werden sollen, und können über interne Editoren des DHVLABs leicht erfüllt werden. Diese findet man unter dem Menüpunkt 'Entwicklung' im DHVLAB.

Auch bei der Benennung der Dateien ist es von höchster Bedeutung ein Muster einzuhalten, da der vergebene Name sowohl als Dateiname im Sammelordner 'orig' als auch zu Beginn der Metadaten angezeigt werden wird und nur die Einheitlichkeit der Namen eine korrekte Auswertung der Daten garantieren kann. Für die Datenbank lab_semicolti wurde folgendes Schema festgelegt:

#datei spi0000m001

spi: Der erste Teil des Dateinamens besteht aus den drei kleingeschriebenen Anfangsbuchstaben des Nachnamens des Autoren oder der Autorin. Im Falle von Spitzer würde der Dateiname also mit den Buchstaben ‚spi' beginnen.

0000: Der zweite Teil des Dateinamens gibt die Jahreszahl an, in dem der Brief oder das Brieffragment verfasst wurde. Wenn keine Jahreszahl bekannt ist, so werden vier Nullen (0000) notiert. In jedem Fall muss die 'Jahreszahl' aber vier Stellen umfassen. Beispiele: 0000, 0910, 1944.

m/f: Der dritte Teil des Dateinamens gibt das Geschlecht des Schreibers oder der Schreiberin an. Ein kleines 'm' steht für männlich bzw. maschile und ein kleines 'f' steht für weiblich bzw. femminile

001: Der letzte und vierte Teil des Dateinamens stellt eine fortlaufende Nummer dar und nummeriert die Briefe und Brieffragmente innerhalb eines Subkorpus. Bei der fortlaufenden Nummerierung wird kein Unterschied zwischen Briefen und Brieffragmenten gemacht, sondern alle Dateien innerhalb eines Subkorpus werden auch trotz unterschiedlicher Gattungen fortlaufend nummeriert. Diese Nummer muss immer dreistellig sein und könnte zum Beispiel wie folgt aussehen: 002, 020, 200.

Zusammenfassend kann gesagt werden, dass vor allem darauf geachtet werden muss, dass jede Datei nur einen Brief umfasst, dieser ein festes Set an Metadaten besitzt und für die Integrierung bestimmte Formatierungen aufweisen muss. Zudem muss bei der Vergabe des Dateinamens das oben aufgeführte Schema eingehalten werden und es muss auf eine korrekte Nummerierung der Briefe geachtet werden.

3.2. Erfassung der Metadaten

Für die Erfassung der Metadaten wurde im DHVLAB ein Muster in der Datenbank lab_semicolti angelegt, das wie folgt aussieht:

#datei
#von
#an
#aus
#nach
#datum
#gattung
#quelle
#anmerkung

Zu Beginn steht der Name der Datei, dessen Zusammenstellung in Kapitel 3.1. erklärt wurde, danach folgt die Variable 'von', die den Verfasser des Briefes betrifft; die Variable 'an', die den Empfänger des Briefes dokumentiert; die Variable 'aus', die den Ort des Absenders vermerkt; die Variable ‚nach', die wiederum den Ort des Empfängers angibt; die Variable 'datum', die das Datum des Verfassens des Briefes, sofern bekannt, verzeichnet; die Variable 'gattung', die pragmatisch betrachtet angibt, ob es sich bei dem zu untersuchenden Schriftstück beispielsweise um einen Brief oder um einen Tagebucheintrag handelt; die Variable 'quelle', die die Quelle des Schriftstückes vermerkt; und zuletzt die Variable 'anmerkung', die eine freie Variable darstellt und Zusatzinformationen enthalten kann.

Das oben aufgeführte Schema gilt für die gesamte Datenbank lab_semicolti, die auf der Plattform DHVLAB zu finden ist und die sowohl die Kriegsgefangenenbriefe Spitzers als auch weitere Subkorpora, wie zum Beispiel das Privatbriefkorpus von Alessia Brancatelli, enthalten wird. Bei der Angabe der Dateinamen innerhalb der Datenbank ist es notwendig, das beschriebene Muster eins zu eins zu übernehmen, damit die reibungslose Weiterverarbeitung der Daten gewährleistet werden kann. Sollte eine Variable nicht definiert werden können, so muss ein einfaches Fragezeichen anstelle des Inhaltes erscheinen.

Ein vollständig ausgefülltes Muster der Metadaten würde demnach wie folgt aussehen:

Muster der Metadaten Anmerkungen
#datei spi0000m001
#von Kriegsgefangener
#an Eltern
#aus Siegmundsherberg
#nach Sansepolcro (AR)
#datum 0000-00-00
#gattung Brief
#quelle Spitzer 1921, S. 14
#anmerkung Dies ist ein Beispiel.

Variable 'datei': Das Geschlecht des Schreibers wird verzeichnet.
Variable 'an': so präzise wie möglich

Variable ‚nach': geläufige Abkürzung für Provinz verwenden
Variable 'datum': yyyy-mm-dd (hier kein Fragezeichen verwenden!)

Bei der Eintragung der Metadaten ist zusätzlich zu beachten, dass im Dateinamen das Geschlecht des Absenders und nicht des Empfängers angegeben wird; dass die Variable 'an' so präzise wie möglich definiert wird, da im Nachhinein noch Oberkategorien formuliert, aber keine Unterkategorien angelegt werden können; dass die Variable ‚nach' unter optimalen Bedingungen sowohl den Ort als auch die Provinz enthält, wobei die Provinz unter Verwendung ihrer geläufigen Abkürzung angegeben wird; und dass es ein festes Datumsformat gibt, das eingehalten werden muss und nicht durch ein einfaches Fragezeichen ersetzt werden kann. Das Datumsformat gibt vor, dass zuerst die Jahreszahl (yyyy) genannt wird, auf diese der Monat (mm) folgt und zum Schluss der Tag (dd) eingetragen wird.
Dieses Muster ist in der Datenbank hinterlegt und kann von allen Personen, die eine Berechtigung für die Datenbank lab_semicolti besitzen, eingesehen und verwendet werden. Sollten weitere Subkorpora in das dynamische Briefkorpus integriert werden, müssen sich auch diese an das vorgegebene Muster halten.

3.3. Annotation

Die Annotation der Briefe erfolgt ebenfalls über DHVLAB. Mithilfe eines eingebundenen TreeTaggers können Wörter innerhalb eines Textes durch Part-of-speech-Tagging (POS-Tagging) Wortarten zugeordnet werden und auch die Zählung der Wörter, Satzzeichen und Sätze wird ermöglicht. Dieses Verfahren erlaubt später Aussagen über die Länge der Briefe, die Anzahl der Sätze und Satzzeichen und die spezifische Verwendung der verschiedenen Wortarten eines jeden Schreibers.

Die lettere semicolte erschweren allerdings die Annotation, da diese, wie bereits erwähnt, eine hohe Varianz auf allen linguistischen Ebenen aufweisen und diese vor allem auf Ebene der Graphie zu Auswertungsproblemen führen könnten. Phänomene wie die mangelnde Wahrnehmung von Wortgrenzen, Schwierigkeiten bei der Darstellung von einfachen und doppelten Konsonanten, Unsicherheiten bei der Darstellung von palatalen Lauten oder die Vertauschung von Konsonanten und Fälle von Hyperkorrektismus könnten beispielsweise dazu führen, dass das Programm bestimmte Wörter nicht erkennt oder keiner Wortart zuordnen kann. Auch in Hinblick auf die Zeichensetzung könnten Fälle von inkorrekter Interpunktion zu einer falschen Satzzählung führen oder fehlende Apostrophe die korrekte Worterkennung verhindern. 
Dennoch erlaubt auch bereits die automatische Annotation interessante Aussagen über die integrierten Briefe und muss in Hinblick auf die Schreibkompetenz der Verfasser lediglich anders interpretiert werden. Würden sich innerhalb einen Briefes beispielsweise nur zwei oder gar keine zu identifizierenden Sätze finden, könnte dies bedeuten, dass der Schreiber keine oder falsche Satzzeichen verwendet hat. Bei vielen Fällen von nicht zu erkennenden Wortarten könnte man außerdem beispielsweise davon ausgehen, dass der Schreiber entweder Wortgrenzen nicht korrekt wahrnimmt oder dialektale Wörter verwendet, die das Programm nicht kennt.
Für eine vollständige und korrekte Analyse jeglicher Briefe der semicolti wird nach der automatischen Annotation des Programmes allerdings eine weitere händische Annotation empfohlen. Eine händische Annotation erlaubt nämlich eine präzisere Analyse der zu untersuchenden Briefe und gewährleistet demzufolge auch mangelfreie Ergebnisse.

Hinsichtlich einer erweiterten Annotation könnte eventuell auch ein Ähnlichkeitsquotient eingeführt werden, der falsch geschriebene, falsch zusammengesetzte oder falsch getrennte Wörter mit bestehenden standarditalienischen Wörtern vergleichen würde, um diese bei einer einzigen Übereinstimmung auszubessern oder Vorschläge für Wörter zu geben, die per Hand als richtig ausgewählt werden könnten. Eine weitere Möglichkeit, die Annotation zu erweitern, wäre die Einbindung eines Dialektwörterbuches, wodurch ein Unterschied zwischen Standarditalienisch und Dialekt innerhalb der Annotation gemacht werden könnte.

Zusätzlich zu einer Annotation sollen auch Editionen der eingespeicherten Briefe und Brieffragmente entstehen, die eine komplett standarditalienische Version ebendieser darstellen sollen. Diese Editionen sollen zum einen zu einem besseren Verständnis der Briefinhalte beitragen und zum anderen Aufschluss darüber geben, welche Wörter in welcher Weise verändert wurden und welche personenspezifischen Fehler vorgefunden werden können.
Die ersten Editionen der Kriegsgefangenenbriefe Spitzers können bereits in dem Beitrag Briefe und Brieffragmente begutachtet werden.

4. Ausblick auf zukünftige Projekte

Das dynamische Briefkorpus wird im nächsten Schritt mit den italienischen Kriegsgefangenenbriefen von Spitzer angereichert werden und zudem durch das Privatbriefkorpus von Alessia Brancatelli ergänzt werden. Dieses Privatbriefkorpus stellt das nächste große Projekt dar, das Teil des dynamischen Briefkorpus sein und sich der erläuterten Funktionen bedienen wird.
Im Gegensatz zu den Kriegsgefangenenbriefen von Spitzer handelt es sich bei diesem Korpus um reine italienische Privatbriefe, die der Verfasser in den letzten Jahrzehnten an seine Familienangehörigen geschickt hat. Die Zeit und Situation, in der die Briefe verfasst wurden, unterscheiden sich demnach stark voneinander und lassen die Frage zu, ob sich das italiano dei semicolti auch in moderneren Zeiten an den gleichen linguistischen Phänomenen orientiert oder ob das geschriebene Italienisch des Verfassers der Privatbriefe sich erheblich vom italiano dei semicolti der Kriegsgefangenen unterscheidet.

Durch die Konzeption eines dynamischen Briefkorpus, das verschiedenste Subkorpora beinhaltet, soll eine Datenbank entstehen, die Briefe und andere Schriftstücke, wie zum Beispiel Tagebucheinträge, nicht nur systematisch darstellt und mit Metadaten versieht, sondern auch durch eine präzise Annotation weiteren Aufschluss über linguistische Besonderheiten innerhalb der Briefe und in Briefen an sich gibt und zudem die Möglichkeit bietet, diverse Briefsorten miteinander zu vergleichen. Es wäre beispielsweise vorstellbar, dass in Zukunft neben den italienischen Kriegsgefangenebriefen von Spitzer und dem italienischen Privatbriefkorpus von Alessia Brancatelli auch Emigrantenbriefe analysiert werden und diese somit eine weitere Briefsorte darstellen werden, die einen Teil des dynamischen Briefkorpus bildet.

Ein genaues Schema der Differenzierungskriterien für Briefsorten findet sich in Ermert (1979).
Aufgrund der Kälte mussten sich viele Schreiber beim Verfassen der Briefe beeilen und zitterten trotzdem beim Schreiben, was oftmals weitere Fehler, vor allem auf Ebene der Graphie, zur Folge hatte (vgl. Kap. III).

Bibliographie

  • Beck 1973 = Beck, Götz (1973): Textsorten und Soziolekte. Funktion und Reziprozität in gesprochener und geschriebener Sprache, in: Sitta, Horst (Hrsg.), Studien zur Texttheorie und zur deutschen Grammatik: Festgabe für Hans Glinz zum 60. Geburtstag, Düsseldorf, Schwann, 73-112 (Link).
  • Berruto 1983 = Berruto, Gaetano (1983): L’italiano popolare e la semplificazione linguistica, in: Vox Romanica, vol. 42, 38-79.
  • D'Achille 1994 = D'Achille, Paolo (1994): L’italiano dei semicolti, in: Serianni, Luca / Trifone, Pietro (Hrsgg.), Storia della lingua italiana. II. Scritto e parlato, Torino, Einaudi, 41-79.
  • Ermert 1979 = Ermert, Karl (1979): Briefsorten. Untersuchungen zu Theorie und Empirie der Textklassifikation, Tübingen, Niemeyer.
  • Fresu 2014 = Fresu, Rita (2014): Scritture dei semicolti, in: Antonelli, Giuseppe / Motolese, Matteo / Tomasin, Lorenzo (Hrsgg.), Storia dell'italiano scritto, vol. 3: Italiano dell'uso, Rom, Carocci, 195-223.
  • Fresu 2016 = Fresu, Rita (2016): L'italiano dei semicolti, in: Lubello, Sergio (Hrsg.), Manuale di linguistica italiana, Berlin, De Gruyter, 328-350.
  • Gellert 1751 = Gellert, Christian Fürchtegott (1751): Briefe, nebst einer praktischen Abhandlung von dem guten Geschmacke in Briefen., in: Die epistolographischen Schriften. Faksimiledruck nach den Ausgaben von 1742 und 1751., Stuttgart, Metzler.
  • Koch/Oesterreicher 2011 = Koch, Peter / Oesterreicher, Wulf (2011): Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch, Berlin, New York, De Gruyter.
  • Spitzer 1921 = Spitzer, Leo (1921): Italienische Kriegsgefangenenbriefe. Materialien zu einer Charakteristik der volkstümlichen italienischen Korrespondenz, Bonn, Hanstein (Link).
  • Università di Bologna = Università di Bologna: Griglia per l’analisi di un testo semicolto , Guide di Linguistica Generale. Alma Mater Studiorum (Link).

Eine Antwort

  1. – „wie das sprachliche Handeln konkret realisiert wird, welche Möglichkeiten sich durch das Medium Brief bieten oder nicht bieten, welche Intensionen innerhalb des Mediums vorgefunden werden“ (…p:2); ist wirklich Intension, oder vllt Intention gemeint? dann besser in Terminologie der Pragmatik: ‚Illokution‘
    – „Um den Anschein eines echten Gesprächs zu erwecken, bedient sich der Schreiber oftmals Elementen der mündlichen Kommunikation, was in manchen Fällen zu einer Vernachlässigung des Schreibstils führen kann“ -> geschieht aber andererseits oft in bewusster, stilistischer Absicht; dann das gegenteil von ‚Vernachlässigung des Stils‘
    – „aus unterschiedliche Briefsorten“ (…p:3) -> ‚aus unterschiedlichen‘
    – „spi: Der erste Teil des Dateinamens besteht aus den drei kleingeschriebenen Anfangsbuchstaben des Nachnamens des Autoren oder der Autorin.“ -> missverständlich, Spitzer ist Herausgeber, nicht Autor der von ihm herausgegeben Briefe; falls Briefe, die nicht vorher publ. erstmals aufgenommen werden, ist es der u.U. der Autor
    – „spi: Der erste Teil des Dateinamens besteht aus den drei kleingeschriebenen Anfangsbuchstaben des Nachnamens des Autoren oder der Autorin.“ -> missverständlich; Spitzer ist Herausgeber, nicht Autor der Briefe
    – „auf allen linguistischen Ebenen“ (…p:38 und öfter) -> bitte den Unterschied zwischen ’sprachlich‘ (das ist an dieser Stelle gemeint: konkrete sprachliche Formen) und ‚Linguistisch‘, d.h. ’sprachwissenschaftlich‘ beachten (ita. ‚linguistico‘, engl. ‚linguistic‘ usw. sind in dieser Hinsicht – leider – doppeldeutig
    – „Zusätzlich zu einer Annotation sollen auch Editionen der eingespeicherten Briefe und Brieffragmente entstehen, die eine komplett standarditalienische Version ebendieser darstellen sollen.“ (…p:40) -> missverständlich, die standardit. Version ist ja immer nur ZUSÄTZLICH

Schreibe einen Kommentar