< < Vorheriger BeitragNächster Beitrag > >

Werk-Erschließung

Version:

Zitation: Thomas Krefeld (2021): Werk-Erschließung. Version 2 (07.06.2021, 19:30). Lehre in den Digital Humanities. , url: https://www.dh-lehre.gwi.uni-muenchen.de/?p=184741&v=2



1. Das Hugo Schuchardt Archiv

Ein außerordentlich wichtiger, kaum überschaubarer und allenfalls ansatzweise in Angriff genommener Aufgabenbereich der Digital Humanities liegt  in der Erschließung des künstlerischen und wissenschaftlichen Lebenswerks bedeutender Persönlichkeiten; denn ihre ‘Bedeutung’ ist ja nichts anderes als der Reflex der Werkrezeption. Sie lässt sich deshalb auch durch quantitativ-mediale Analysen der ‘Breite’ (wie viele Rezipienten?) und ‘Tiefe’  (wie viele Verweise bei einzelnen Rezipienten?) erfassen. Bislang gibt es jedoch erst wenige Portale, die dem Gesamtwerk einzelner Individuen gewidmet sind. Darunter ist ein bemerkenswerter Prototyp, nämlich das von Bernhard Hurch auf den Weg gebrachte und betreute Hugo Schuchardt Archiv (HSA), das die Schriften (Publizierte Texte, Korrespondenz, Manuskripte) des sehr wichtigen Romanisten und allgemeinen Sprachwissenschaftlers zugänglich macht. Hugo Schuchardt  (1842-1927) zählte zu den einflussreichsten und originellsten Linguisten seiner Zeit; über die Biographie informieren die "Vita" im Archiv selbst (Link) sowie die ausführlichen Nachrufe von Elise Richter (Link) und - speziell zum wissenschaftlichen Horizont - von Karl Jaberg (Link). Sein Werk ist in mancher Hinsicht noch heute stimulierend und modern, da er oft gegen den Mainstream der zeitgenössischen Forschung argumentierte und ganz neue Forschungsfelder erschloss, die sich dann fest etablierten. Dazu gehörte vielleicht an erster Stelle die Sprachkontaktforschung, insbesondere zwischen den romanischen und nicht indogermanischen Sprachen (Berberisch, Baskisch, Slawisch) sowie die Kreolistik. Der außerordentlich diskussionsfreudige Schuchardt hat auch die wortgeschichtliche und etymologische Forschung maßgeblich beeinflusst, da er sehr nachdrücklich auf der Notwendigkeit einer sachkundlichen und ethnographischen Absicherung des lexikologischen Kommentars bestand (vgl. z.B. zur Etymologie von fra. trouver /ita. trovare die Texte 335, 355, 441, 460). Schuchardts Werk ist außerordentlich umfangreich, allerdings in der gedruckten Gestalt nicht leicht zu rezipieren. Denn es besteht - abgesehen von der Dissertation über den Vokalismus des Vulgärlateins (Link) - im wesentlichen aus auch längeren Aufsätzen und Rezensionen, die in ihrer gedruckten Gestalt nicht immer leicht zu finden sind. Hinzu kommen zahlreiche nicht publizierte Manuskripte. Dementsprechend ergibt sich für das Portal folgendes Profil:  

"Das Hugo Schuchardt Archiv (HSA) umfaßt im wesentlichen vier große Bereiche:
1. Die elektronische Veröffentlichung von Schuchardts Gesamtwerk mit der dazugehörigen Sekundärliteratur und anderen relevanten biographischen und bibliographischen Materialien;
2. Die Bearbeitung und elektronische Erfassung des handschriftlichen Nachlasses;
3. Die Briefdatenbank, die die wissenschaftlich und forschungshistorisch relevanten Korrespondenzen aufarbeitet und mit Metadaten versehen elektronisch präsentiert;
4. Materialien zur Kontextualisierung und Wirkungsgeschichte Schuchardts.
Das Hugo Schuchardt Archiv will schrittweise und in internationaler Kooperation eine Rekonstruktion des von Schuchardt mitbegründeten internationalen  Netzwerks bieten, was zu einem neuen Verständnis der Professionalisierung, der Institutionalisierung und der inhaltlichen Orientierung  des sprachwissenschaftlichen Diskurses im 19. Jahrhundert führt." (Quelle)

Das Projekt ist längst nicht abgeschlossen, obwohl die Finanzierung bereits ausgelaufen ist; im Folgenden wird für jeden der vier Bereiche der Stand der Dinge (Anfang Juli 2020) kurz notiert.

1.1. Gesamtwerk

Insgesamt werden 826 wissenschaftliche Texte aus den Jahren 1864 bis 1928 (zuletzt zwei postume Arbeiten) zugänglich gemacht (Link). Eine Volltextsuche ist für den Gesamtbestand verfügbar; Filter sind an der Oberfläche (noch) keine verfügbar, so dass der Nutzer entweder wissen muss, was er suchen willen oder aber auf gut Glück Stichwörter eingibt, die ihn interessieren. Etwaige Rezensionen der Schuchardtschen Arbeiten werden gemeinsam mit  dem jeweiligen Text zugänglich gemacht (vgl. z.B. diesen Link). Neben den wissenschaftlichen Veröffentlichungen im engeren Sinn sollen auch "Gutachten und Stellungnahmen" (Link) bereit gestellt werden; dergleichen wird nur sehr selten publiziert, weil die Texte nicht leicht zu erhalten sind. Sie geben natürlich in Verbindung mit den Namen einen tiefen Einblick in das Funktionieren der wissenschaftlichen Szene.

1.2. Nachlass

Der nicht veröffentlichte Nachlass ist "[e]inige zig-tausend Seiten" stark:

"Er umfaßt praktisch alle vorstellbaren Text- und Manuskripttypen: von Kurznotizen auf Einzelzetteln bis hin zu druckreifen Textvorlagen für längere Arbeiten und Arbeitsheften." (Quelle)

De facto wurde hier jedoch noch nichts erschlossen; eine erste Übersicht gibt die Vorarbeit von Michaela  Wolf 1993. Immerhin wird ein noch nicht sehr konkreter Plan mitgeteilt, der grundsätzlich auch den Einbezug von Nutzern vorsieht und deshalb Accessibility voraussetzt:

"Ein erstes Inhaltsverzeichnis gibt den Überblick zu den einzelnen inhaltlichen Bereichen. Danach kann man sich bis zu einzelnen gescannten Manuskriptseiten durchklicken. Metadaten geben Aufschluß über das Manuskript selbst, ein Kommentarfeld bietet die Möglichkeit zur Bearbeitung. Wie die Interaktion mit Nutzern der Webseite konkret funktionieren wird können, ist noch Gegenstand der Festlegung. Mit Sicherheit laden wir die community ein, sich an der Bearbeitung zu beteiligen, was punktuell ja auch bisher schon geschehen ist." (Quelle)

1.3. Korrespondenz

Am weitesten voran geschritten, wenngleich bei weitem noch nicht abgeschlossen ist die Aufbereitung der Korrespondenz, die  13.000 Briefe umfasst; Schuchardt selbst war sich des Werts dieses Korpus wohl bewusst, denn er hat sie teilweise geordnet. Unter den 3022 Korrespondenten sind die allermeisten der maßgeblichen Romanisten und Sprachwissenschaftler seiner Zeit vertreten (vg. DEFAULT). Die bereits bearbeiteten Briefe werden durch ein System von Schlagworten ("Deskriptoren") erschlossen, das als Thesaurus bezeichnet wird (vgl. Schwägerl-Melchior):

"Der Thesaurus befindet sich hier und gliedert sich in folgende Bestandteile: Sprachen, Personen, Orte (geographische Areale) und Sachschlagwörter, die jeweils durch das entsprechende Symbol gekennzeichnet sind. Durch Weg- oder Hinzuklicken der einzelnen Symbole kann man sich entweder alle Kategorien oder nur einzelne in alphabetischer Reihenfolge anzeigen lassen. Beim Klicken auf einzelne Schlagwörter wird neben den mit diesem Deskriptor ausgezeichneten Briefen die hierarchische Einordnung im Thesaurus angezeigt wie z.B. hier. Bezüglich der Sprachen erfolgte die Klassifizierung weitgehend in Anlehnung an die im Ethnologue vergebenen ISO-Codes. Personen wurden – sofern möglich – mit der jeweiligen VIAF-ID verknüpft und erscheinen, abgesehen von klassischen Autoren oder historischen Figuren (wie z.B. Dante Alighieri), in der Nennform „Nachname, Vorname“. Personenschlagwörter wurden insbesondere dann vergeben, wenn in einem Brief von Person A an Person B über Person C gesprochen wird. Die Menge an einbezogenen Personen übersteigt dadurch bei weitem die Zahl der Korrespondenzpartner Schuchardts. Die so gewonnenen Daten können allerdings für die Rekonstruktion des Netzwerks von großem Wert sein. Als Orte (geographische Areale) wurden im Thesaurus sowohl Städte und Regionen als auch Länder angelegt, die als Thema in den Briefen genannt werden. Mit Blick auf die Sprach- und Orts-Tags ist anzumerken, dass hiermit nicht die Briefsprache und der Absendeort des Briefes gemeint ist (die jedoch separat erfasst werden), sondern eine Thematisierung der Sprache oder des Ortes im Brieftext gekennzeichnet wird. [...] Am Ende des durch den FWF geförderten Projekts „Netzwerk des Wissens“ waren ca. 2000 Briefe mit Personen-, Sprach-, Orts- und Sachschlagwörtern ausgezeichnet. Da die Zahl online verfügbarer Korrespondenz mehr als doppelt so hoch ist und die Auszeichnung mit Werk-Tags erst später beginnen konnte, ist die Beschlagwortung der Materialien auf der Website des Hugo Schuchardt Archivs noch nicht abgeschlossen. Dies bedeutet, dass Abfragen mittels des Thesaurus derzeit noch nicht alle Briefe berücksichtigen und damit keine vollständigen Ergebnisse liefern können. Es wird aber ein Anliegen aller Beteiligten sein, den begonnenen Prozess so rasch wie möglich fortzusetzen, um das dem Material innewohnende Erkenntnispotential den Nutzern der Website möglichst vielseitig und vollständig zugänglich zu machen." (Schwägerl-Melchior)

Alle Kategorien, mit denen ein Schriftstück getaggt wurde, sind interaktiv und lassen sich als solche anklicken, so dass alle entsprechend getaggten Dokumente erscheinen, wie das Beispiel eines Briefs von Matteo Bartoli vom 16.12.1899 zeigt (Link). Grundsätzlich wäre es nützlich nicht nur - wie im Zitat erwähnt - die Sprachen und Personen mit Normdaten auszuzeichnen, sondern alle Tags ("Deskriptoren") entsprechend zu ‘normalisieren’: Die Sachschlagwörter sollten auf eine Ontologie referenzieren und die Orte auf einen Dienst wie geonames.org. Über die bereits vergebenen Normdaten für Personen und Orte wäre es im Übrigen leicht Verknüpfungen mit enzyklopädischen Informationen (z.B. aus der Wikipedia) herzustellen. 

1.4. Netzwerk

Im vorhergehenden langen Zitat wird erwähnt, dass das HSA unter dem Namen "Netzwerk des Wissens" gefördert wurde; angesichts seiner aktuellen Frequenz mag der Ausdruck ‘Netzwerk’  der einen oder dem anderen ein wenig trivial erscheinen, denn wir sind alle in zahlreiche mediale Vernetzungsstrukturen eingebunden. Im Hinblick auf die Persönlichkeit, die im Zentrum steht und  hinsichtlich der Zeit, um die es geht (1864-1928) verdient der Ausdruck jedoch ernst genommen zu werden. Es geht ja gerade darum herauszuarbeiten, dass entsprechenden Netzwerke bereits in der analogen Welt mit der größten Selbstverständlichkeit existierten, und wie sie auf der Grundlage von öffentlichem Druck und oft erstaunlich schneller privater Korrespondenz funktionierten. 

Die Schuchardtzeit ist ja gewissermaßen die heroische Epoche der Philologien und Geisteswissenschaften, und nicht wenige der Korrespondenzpartner sind die Initiatoren, Autoren und Herausgeber von monumentalen Großprojekten, die bis heute Standardwerke der Romanistik sind. Manche suchten um Rat bei der Konzeption und Umsetzung; andere reagierten auf Anregungen Schuchardts usw. Der Personenkreis geht weit über die Romanistik hinaus. Genannt werden sollen:

  • einer der Begründer der italienischen Dialektologie, Graziadio Isaia Ascoli (vgl. Lichem/Würdinger 2013a), auf den die Konzeption des ‘Frankoprovenzalischen’ und des ‘Rätoromanischen’ (Ladinischen) als Oberbegriff für Bündnerromanisch / Dolomitenladinisch / Friaulisch  zurückgehen (140 Briefe von A. an S, und 53 von S an A);  
  • die Autoren der ‘klassischen ’ Sprachtatlanten, nämlich des ALF, Jules Gilliéron (vgl. Melchior 2016a), des im Entstehen begriffenen AIS, Karl Jaberg (Link) /Jakob Jud (Link); vom wichtigsten Explorator des AIS, Paul Scheuermeier, wird Schuchardt in einer Postkarte, die während der Feldforschung verschickt wurde, explizit als wichtiger Vordenker identifiziert (Link); die enge Verbundenheit Schuchardts mit der Gruppe des AIS zeigt eine sehr persönliche und emphatische Antwort von Schuchardt an Jud (Link); 
  • der Autor des FEW, Walter von Wartburg, der ihm unmittelbar vor Publikation des ersten Faszikels schreibt (Link);
  • der Autor des  bis heute immer wieder überarbeiteten und neuaufgelegten Etymologischen Wörterbuchs der deutschen Sprache, Friedrich Kluge (Kluge/Seebold 2015; vgl.  Hausmann 2017; 57 Briefe von K an S und 13 von S an A);
  • einer der postumen Herausgeber des Cour de linguistique générale von Ferdinand de Saussure, der Schweizer Charles Bally (vgl. Schwägerl-Melchior 2013);
  • der wichtige Vorläufer einer pluridimensionalen und perzeptiven Dialektologie bzw, Variationslinguistik, Benvenuto Terracini (vgl. Melchior 2016b); die Arbeiten Terracinis wurden nach Schuchardts Tod durch deutsche Romanistik/Italianistik nicht wahrgenommen;
  • die außerordentlich einflussreichen Sprach- und (dominant) Literaturwissenschaftler Leo Spitzer (Hurch 2016) und Karl Vossler  (Schwägerl-Melchior 2015); der viel jüngere Spitzer war offensichtlich eine wichtige Bezugsperson (447 Briefe von Sp. an Sch., 43 von Sch. an Sp.);
  • der Begründer der (keineswegs national orientierten) schweizerischen Volkskunde, Eduard Hoffmann-Krayer (vgl. Sousa 2017 sowie zur Person den Wikipedia-Artikel; Link);
  • usw. usw.

Ein Kapitel für sich sind die fehlenden Korrespondenten, allen voran der wohl bekannteste Romanist der Zeit, Wilhelm Meyer-Lübke, der jedoch oft erwähnt wird (Link). Ebenfalls fehlt der Begründer der deutschen Sprachgeographie und Initiator des gewaltigen Sprachatlas des Deutschen Reichs, Georg Wenker (vgl. zur Person diesen Link): Diese ganz und gar nicht ethnographisch eingebettete Dialektologie war ihm anscheinend vollkommen fremd. 

Die Korrespondenz ist selbstverständlich auch gut geeignet, zur Rekonstruktion der damaligen wissenschaftlichen Kontroversen beizutragen, z.B. der so genannten questione ladina, wie die Zusammenfassung eines ganzen Briefwechsels in einem Schreiben von Schuchardt an Vossler zeigt (Link). 

Bemerkenswert ist auch die Möglichkeit nach bestimmten Sachbegriffen zu suchen; zum Beispiel aus der  Suche nach Phonogramm (Link) / Phonographie (Link) erfährt man Schuchardts Interesse für die technischen Neuerungen der Zeit und für seine Bemühungen, sie zur Aufzeichnung des Baskischen sofort einzusetzen.

In seinem "Ausblick" skizziert Bernard Hurch die Perspektive des Archivs wie folgt:

"Die Idee, dieses Projekt auf ein gesamteuropäisches auszudehnen, das im hier vorgelegten wissenschaftshistorischen Rahmen den europäischen Kontext der Formierung und Institutionalisierung von Wissenschaft im 19. Jahrhundert aufarbeiten hätte sollen, wurde vom European Research Council als nicht förderungswert eingestuft. [...]. Eine Fortsetzung von Teilen des Projekts im Rahmen einer Digital Humanities Initiative des FWF wurde ebenfalls als nicht förderungswürdig eingestuft. Aus der FWF-Begutachtung resultierte das Projekt als zu «germanistisch». Diesen z.T. unsachlichen Ablehnungen stehen die zahlreichen positiven Rückmeldungen und Kooperationen gegenüber, die wir nach wie vor als Zeichen der Akzeptanz und Wertschätzung unserer Arbeit werten und für die wir auf diesem Wege danken." (Quelle)

Die Ablehnung weiterer Förderung soll hier nicht qualifiziert werden; es wird aber die innere Widersprüchlichkeit der projektbasierten Forschung deutlich. Sie ist im Kern prekär und darauf angewiesen entweder institutionelle, das heißt: dauerhafte Anbindungen zu finden und/oder eine FAIRe Web-Umgebung zu schaffen, in der interessierte Nutzer jeder Zeit in der Lage sind, den Status quo zu erweitern. Wichtige Voraussetzungen dafür sind durch das Bekenntnis zur Open Access-Initiative gegeben.

"Aus wissen(schaft)spolitischen Grundsätzen werden – wie das gesamte Material auf dieser Webseite – alle Projektpublikationen im Sinne von Open Access spätestens nach Ablauf von gesetzlichen und/oder verlagsbedingten Sperrfristen frei zugänglich im HSA online gestellt. Von externen Mitarbeitern und kooperierenden Interessenten wird erwartet, daß sie diesem Grundsatz zustimmen, und ihre Beiträge ebenfalls frei zugänglich machen." (Quelle)

Allerdings vermisst man eine entsprechende Lizenzierung.

2. Literarische Beispiele

An brauchbaren digitalen Werkausgaben wichtiger Autoren, die sich mit dem prototypischen Schuchardt Archiv vergleichen ließen, herrscht ohne Zweifel großer Mangel; allerdings ist es auch schwierig sich überhaupt einen Überblick zu verschaffen: Einschlägige Angebote erscheinen nicht in den Bibliothekskatalogen, weder als besonderer medialer Typ, noch unter dem Namen der jeweiligen Autor*innen. Dazu tragen gewiss die oft fehlenden Metadaten bei.

2.1. Luigi Pirandello

Ein umfangreiches, multimediales Portal ist Luigi Pirandello (1876-1936) gewidmet (pirandello.web), der ein bedeutendes literarisches und in geringerem Maße auch essayistisches (Link) Werk geschaffen hat, für das er im Jahre 1934 auch den Literaturnobelpreis erhielt.  Dazu gehören einige frühe Gedichtbände,  sieben Romane, zahlreiche Theaterstücke und sehr viele Novellen. Nicht selten gibt es Parallelversionen als Novelle und als Theaterstück, dabei ist die Bühnenversion gelegentlich (auch) auf Sizilianisch (Link), die entsprechende Novelle dagegen in Standarditalienisch verfasst worden; der Autor ist also grundsätzlich auch von linguistischem Interesse. Das Portal macht das gesamte Werk zugänglich und allem Anschein nach auch verfügbar; denn formalisierte Lizenzierungen fehlen:

"Tutto quanto pubblicato è liberamente divulgabile. È gradita la citazione al sito." (Quelle)

Über die Texte hinaus werden auch Videos von Theateraufführungen, Filme, Photos u.a. angeboten, wie das folgende Beispiel illustriert: 

La patente Text der Novelle (1911) (Link)
Text der Komödie auf Italienisch (1917)  (Link)
A patenti, Text der Komödie auf Sizilianisch (1919) (Link)
 Film (1954) (Link)

Es existiert auch eine Suchfunktion, von der man allerdings nicht erfährt, auf welcher Grundlage (Volltext?) sie operiert  (vgl. z.B. die Suche des Ausdrucks giustizia  mit diesem Ergebnis). Nutzer werden zur Mitarbeit eingeladen:

"Se vuoi contribuire, invia il tuo materiale, specificando se e come vuoi essere citato a
collabora@pirandelloweb.com" (Quelle)

Außerdem wird auf viel Sekundärliteratur hingewiesen (Link). Allerdings wird diese meist - über Amazon - zum Kauf angeboten. Überhaupt ist das Portal mit diesem Unternehmen in nicht ganz klarer Weise verbunden:

"Sei utente di Amazon? Allora puoi sostenere il nostro sito accedendo ad Amazon cliccando sull’immagine qui sotto. Per te nessun costo aggiuntivo, per noi un aiuto per garantire al meglio la continuità e il miglioramento del progetto." (Quelle)

Der zitierte Hinweis macht auf die nicht garantierte Nachhaltigkeit aufmerksam, so dass die  Permalinks, die zu jeder Rubrik angeboten werden (z.B.  für die Novelle per un anno: https://www.pirandelloweb.com/novelle-per-un-anno/) mit Skepis betrachtet werden müssen. Es bleibt im Übrigen vollkommen im Dunkeln, wer das Portal betreibt:

"Chi siamo
L’indirizzo del nostro sito web è: https://www.pirandelloweb.com." (Quelle)

An der gerade zitierten Stelle erfährt man auch, dass alle anfallenden Nutzerdaten einem kommerziellen Datamining unterliegen. Wie prekär entsprechende Angebote sind, zeigt der Fall eines umfangreichen, über viele Jahre verfügbaren Portals <http://www.classicitaliani.it/>, das gewissermaßen über Nacht verschwunden ist.  Man findet unter einer anderen URL noch eine Startseite (Link), auf der jedoch alle Links mittlerweile ins Leere führen:

Über Nacht verschwunden... (Link)

2.2. Dante

Angesichts der sehr überschaubaren Situation soll auch eine größere, aber in hohem Maße unFAIRe Insellösung zu Dante erwähnt werden, nämlich das bekannte Princeton Dante Project (Link): Dort wird Nachnutzung kategorisch ausgeschlossen, so dass drei von Vier FAIR-Prinzipien (A, I, R) gegenstandslos sind :

"A. LICENSEE may use the PROJECT for internal research purposes only. LICENSEE may not copy, download, copy onto a hard drive, diskette, or other storage media, translate or display the PROJECT, in whole or in part, unless expressly authorized in writing by Princeton University." (Quelle)

Darauf baut das Dartmouth Dante Project (Link) auf; es liefert eine virtuelle Synopse zahlreicher Kommentare zur Divina Commedia, die jeweils  zu einzeln suchbaren Stichwörtern, Zeilen und canti aufgerufen werden können. Dieser Link zeigt das Resultat einer Suche nach selva im ersten Gesang des Inferno: Das Suchwort wird in den angegebenen Stellen farbig unterlegt. Der gesamte Datenbestand unterliegt dem Copyright (©):

"Certain material contained on this database is copyrighted by the original publishers, and is subject to the conditions of the original copyright. Material of this kind is denoted with the tag "This material is copyrighted and reproduced by permission." All material not bearing this tag is copyright 2020 by the Trustees of Dartmouth College. You may freely reproduce the material on this database in any form, as long as it is not for profit or redistribution except as reference in scholarly works, or in violation of the terms of other copyrights. You may not edit the material in any way without the express consent of the Dante Project and Dartmouth College." (Quelle; Hervorhebung Th.K.)

Was die hervorgehobenen Stellen im Hinblick auf FAIR bedeuten, ist nicht ganz klar; insbesondere erhebt sich die Frage, ob eine eventuelle Annotation mit auswertender Visualisierung des Textes durch "[y]ou may not edit" ausgeschlossen ist. In diesem Fall wären die Kriterien I und R nicht erfüllt. Ein Download ist nicht vorgesehen. 

2.3. Virtuelle Bibliotheken

Immerhin werden etliche einzelne Texte, Videos usw. auf virtuellen Umgebungen angeboten, die zwar meistens noch nicht erschlossen, aber angesichts ihres technischen Zustands durchaus erschließbar sind. Dazu gehören unter anderen die folgenden Dienste1.

2.3.1. Biblioteca italiana

Dieses nützliche Portal wird von der Sapienza Università di Roma getragen (Link); es enthält zahlreiche italienische und lateinische Texte im Format xml (Link), die vor allem aus drei Quellen stammen: 

"BIBIT - Nata dall’originario progetto diretto da Amedeo Quondam e avviata nel 2003, Bibit è diventata oggi la sezione centrale di Biblioteca Italiana. Una biblioteca digitale di più di 1600 opere in formato testo, in edizione integrale, fondate su edizioni scientifiche di riferimento, codificate in XML/TEI e tutte liberamente accessibili, scaricabili e interrogabili. Bibit fornisce strumenti che consentono di effettuare ricerche contestuali, ricerche di prossimità e full-text e di creare concordanze dinamiche in formato kwic (keywords in context).
SCRITTORI D’ITALIA - È la riproduzione in formato digitale dell’omonima collana di testi, fondata nel 1910 dall’editore Laterza di Bari, sotto la direzione di Benedetto Croce: 287 volumi contenenti 179 opere, per un totale di 125.171 immagini-testo. Il progetto, ideato e diretto da Amedeo Quondam e coordinato da Gianfranco Crupi, è stato realizzato dal Dipartimento di Italianistica e Spettacolo, su incarico del Comitato guida della Biblioteca Digitale Italiana (BDI). Tutte le immagini sono liberamente disponibili grazie all’Editore Laterza che ne ha concesso i diritti.
INCUNABOLI IN VOLGARE - La sezione raccoglie in formato digitale più di 1600 incunaboli appartenenti a circa 70 biblioteche italiane e straniere, per più di 200.000 immagini" (Quelle).

Der Bestand kann nach nach Autoren, Titel, Epochen und Gattungen gefiltert werden; der historische Schwerpunkt liegt im Cinquecento:

Textbestand Biblioteca italiana nach Epochen (Stand: 9.7.2020 - Quelle)

Auch die wichtigen Vertreter des Trecento sind verfügbar; so ist Boccaccio mit 74 Titeln vertreten (Link); für die Texte aus der Sammlung bibit, die im Katalog mit einem grünen Strick gekennzeichnet sind, wird ein XML-Download angeboten (vgl. z.B. Decameron; Link); Metadaten werden nach dem Schema MAG (Link) ausgezeichnet. Die Komponente (bibit) erfüllt somit die FAIR-Kriterien; da jedoch Normdaten fehlen, ist die Findbarkeit eingeschränkt. Eine über die Quellenangabe hinausgehende Erschließung gibt es nicht.

2.3.2. Liber Liber

Diese Plattform (Link) mit ihrem schönen programmatischen Namen (‘freies Buch’) bietet ausschließlich italienischsprachige Texte (einschließlich italienischer Übersetzungen anderssprachiger Originale) an; verfügbare Formate sind meistens ePUB, ODT, PDF und gelegentlich XML oder HTML. Bereitgestellt werden überwiegend literarische aber auch kunstgeschichtliche, historische u.a. Texte (Link), die durchweg bereits älter und daher  gemeinfrei sind (70 Jahre nach dem Tod des Autors/der Autorin, bzw. 20 Jahre nach dem Tod des Übersetzers/der Übersetzerin). Neben den Werken in graphischer Repräsentation finden sich auch einige Hörbücher (Link), wenige Videos sowie Musik. Die Nutzung aller Medien ist gratis, manche kann man jedoch erwerben, um das Projekt zu unterstützen (Link); unklar ist, wie viele Werke zu einem bestimmten Datum verfügbar sind. Teil der Plattform ist der nutzerbasierte progetto Manuzio, der die Community dazu einlädt, weitere Texte einzustellen. Bedingung ist der Verzicht auf das exklusive Nutzungsrecht:

"Cessione dei diritti sui propri contributi

Se deciderai di collaborare all’associazione senza fini di lucro Liber Liber il tuo contributo si intenderà spontaneo e gratuito. Con la spedizione di un tuo contributo (una nota biografica, una illustrazione, un testo digitalizzato, ecc.) accetti implicitamente le regole esposte in queste pagine.

L’autorizzazione a utilizzare il tuo contributo si intende irrevocabile; inoltre con la spedizione del contenuto cedi a Liber Liber tutti i diritti (salvo diverso accordo scritto) in via non esclusiva, ovvero potrai continuare a disporre dei tuoi testi, delle tue illustrazioni e di quanto altro ci spedirai liberamente e a tua discrezione.

Perché abbiamo bisogno di disporre di tutti i diritti? Perché solo così possiamo aggiornare nel tempo la tipologia di licenza Creative Commons adottata. I diritti ci servono anche per distribuire i nostri contenuti attraverso i principali store digitali come Amazon, Google Play, iTunes, ecc. o raccogliere fondi con campagne pubblicitarie, convenzioni, ecc." (Quelle)

Eine wie auch immer geartete Erschließung ist nicht vorgesehen; Norm- und Metadaten fehlen ebenfalls, abgesehen von einer etwaigen ISBN-Nr., die in der virtuellen Welt ohnehin funktionslos ist. Allerdings wird eine Lizenzierung gemäß CC SA-NC 4.0 zugewiesen, wie das Beispiel des Romans Una vita von Italo Svevo zeigt (Link), und damit die Voraussetzung für eine Tiefenerschließung geliefert.  

2.3.3. Wikisource

Teil von Wikimedia Commons (Link) ist das Projekt Wikisource, das nach dem bekannten Wiki-Prinzip auf die kollektive Mitarbeit der Nutzer (Link) vertraut. Grundsätzlich können geschriebene Texte jeglicher Gattung und Thematik aufgenommen werden. Hier eine Übersicht der vorgesehenen Bereiche: 

Diese Bereiche sind teils erst mit wenigen Arbeiten von eher unbedeutenden Autor*innen gefüllt, wie z.B. die Kategorie Linguistica zeigt (Link); zudem erweist sich auch die Fachzuweisung oft als problematisch, denn hier werden je ein Beitrag zur Geschichte der römischen Dialektliteratur, zur römischen Dialektgrammatik, mit zwei  altsardischen und einem älteren mailändischen Text zusammengefasst. Ganz systematisch erfolgt jedoch die Anreicherung der Personen mit Normdaten  (vgl. z.B. die "schede di autorità" zu Croce  [Link]).

Sehr transparent und exemplarisch ist die Information über den Stand und die Verlässlichkeit der angeboteten Version mi Hilfes des SAL-Werts (‘Sato degli Avanzamenti dei Lavori’; (vgl. z.B. die Canti von Leopardi; Link): Es werden unterschiedliche Formate angeboten, so dass der Nutzer selbst korrigieren kann, wenn ihm im Abgleich mit dem pdf der Originalquelle Fehler auffallen. De facto funktioniert das im zuletzt genannten Beispiel jedoch nicht, da kein Scan des Originals vorhanden ist. Außerdem wird mitgeteilt, dass der Text von Liber Liber übernommen wurde; der Link ist jedoch tot und die Quelle - wie oben gezeigt - durchaus prekär (Link).

2.3.4. Internet Archive

Die reichhaltigste Ressource ist wahrscheinlich das Internet Archive (Link): Ein Aufruf am 7. Juli 2020 ergab in der Rubrik italienische Texte 238.888 Treffer, am 9. Juli 2020 bereits 239.239 (Link). Auch hier werden mehrere Formate angeboten; z.B. im Fall von Giuseppe Pitrè 1978 (1913) erhält man folgende "Download Options" :

Die auf der Grundlage von OCR erzeugten digitalen Texte sind vollkommen unkorrigiert und deshalb mit Vorsicht zu genießen; allerdings sind alle FAIR-Kriterien erfüllt, so dass die Voraussetzung für Korrektur und Nutzung gegeben sind.

2.3.5. Fazit

Der wissenschaftliche Umgang mit Texten erfordert Verlässlichkeit, die durchweg nicht garantiert ist; eigene Korrektur ist daher oft Voraussetzung für die Nachnutzung (Kriterium R) verfügbarer Materialien. Dafür bietet der Abgleich mit einem pdf der Quelle die beste Grundlage.

3. Epilog

Wenn man die - womöglich durch FAIR-Prinzipien geregelte - Offenheit wissenschaftlicher Arbeit und ihrer Produkte zum Maßstab für die Digital Humanities macht, sind in sich verkapselte Einzelprojekte, das heißt ‘Inseln’ im strengen Sinn, methodologisch nicht relevant. Ein Beispiel dafür ist die also solche sehr gelungene und technisch bewundernswerte Erschließung des Nachlasses von Ludwig Wittgenstein 2016-.

"On his death in 1951, the Austrian-British philosopher Ludwig Wittgenstein left behind a significant volume of some 20,000 pages written between 1913 and 1951. This Nachlass contains Wittgenstein's unpublished philosophical notebooks, manuscripts, typescripts and dictations. At the time of Wittgenstein's death this body of work was largely unknown." (Quelle)

Dieses riesige, kaum strukturierte Material ist als solches kaum sinnvoll konsumierbar; es war daher eine wirkliche bahnbrechende Leistung von Max Hadersbeck2, es durch eine Such- und Findapplikation WITTFind (Link) zu erschließen. Modellhaft ist die Chronoreferenzierung der Fundstellen, wie sich am Beispiel von schweigen, eines Schlüsselbegriffs der Wittgensteinschen Philosophie, exemplarisch zeigen lässt (Link); man beachte zur Chronoreferenzierung die Zeitleiste am Kopf der Trefferliste und die Funktionen unter dem Button "View statistics."

Das Project Gutenberg ist in Deutschland auf Grund einer richterlichen Entscheidung gesperrt (Link) und wird hier deshalb nicht vorgestellt.
Max Hadersbeck ist leider wenige Tage nach Abfassung dieser Vorlesung, am 2.7.2020, im Alter von nur 63 Jahren verstorben (Link).

Bibliographie

  • AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, vol. 8, Zofingen (Link).
  • ALF = Gilliéron, Jules / Edmont, Edmond (Hrsgg.) (1902-1910): Atlas linguistique de la France (ALF), vol. 10, Paris, Champion, Neudruck: Bologna, Forni, 1968 (Link).
  • FEW = von Wartburg, Walther (1922--2002): Französisches Etymologisches Wörterbuch. Eine Darstellung des galloromanischen Sprachschatzes, 25 Bände, Basel, Zbinden (Link).
  • Hausmann 2016a = Hausmann, Frank-Rutger (Hrsg.) (2016): Die Korrespondenz zwischen Ernst Tappolet und Hugo Schuchardt , in: Hugo Schuchardt Archiv, Graz (Link).
  • Hausmann 2016b = Hausmann, Frank-Rutger (Hrsg.) (2016): Die Korrespondenz zwischen Gerhard Rohlfs und Hugo Schuchardt, in: Hugo Schuchardt Archiv, Graz (Link).
  • Hausmann 2017 = Hausmann, Frank-Rutger (Hrsg.) (2017): Die Korrespondenz zwischen Friedrich Kluge und Hugo Schuchardt, in: Hugo Schuchardt Archiv (Link).
  • Hurch 2015 = Hurch, Bernhard (Hrsg.) (2015): Hugo Schuchardt Archiv, Graz (Link).
  • Hurch 2016 = Hurch, Bernhard. (2016): Die Korrespondenz zwischen Leo Spitzer und Hugo Schuchardt, in: Hugo Schuchardt Archiv (Link).
  • Hurch 2018 = Hurch, Bernhard (2010): Spitzer, Leo, in: Neue Deutsche Biographie, vol. 24, 722-724 (Link).
  • Kluge/Seebold 2015 = Kluge, Friedrich / Seebold, Elmar (252015 [1883]): Etymologisches Wörterbuch der deutschen Sprache, Berlin/Boston, De Gruyter (Link).
  • Lichem/Würdinger 2013a = Lichem, Klaus / Würdinger, Wolfgang (Hrsgg.) (2013): Die Korrespondenz zwischen Graziadio Isaia Ascoli und Hugo Schuchardt, in: Hugo Schuchardt Archiv, Graz (Link).
  • Melchior 2016a = Melchior, Luca (Hrsg.) (2016): Lettres de Jules Gilliéron à Hugo Schuchardt, in: Hugo Schuchardt Archiv, Graz (Link).
  • Melchior 2016b = Melchior, Luca (Hrsg.) (2016): Le epistole di Benvenuto Terracini a Hugo Schuchardt, in: Hugo Schuchardt Archiv, Graz (Link).
  • Melchior/Purgay 2016 = Melchior, Luca / Purgay, Katrin (Hrsgg.) (2016): Die Korrespondenz zwischen Sextil Puşcariu und Hugo Schuchardt, in: Hugo Schuchardt Archiv (Link).
  • Mücke 2015 = Mücke, Johannes (2015): Die Korrespondenz zwischen Hermann Paul und Hugo Schuchardt, in: Hugo Schuchardt Archiv (Link).
  • Pitrè 1978 (1913) = Pitrè, Giuseppe (1978 (1913)): La famiglia, la casa, la vita del popolo siciliano. A cura di Aurelio Rigoli ; prefazione di Bernardo Bernardi (Ristampa anastatica dell'ed.: Palermo, 1913)., Palermo, Il Vespro (Link).
  • Schuchardt 1900 = Schuchardt, Hugo (1900): Über die Klassifikation der romanischen Mundarten, Graz (Link).
  • Schwägerl-Melchior = Schwägerl-Melchior, Verena: Einleitung zum Thesaurus, in: Hugo Schuchardt Portal (Link).
  • Schwägerl-Melchior 2013 = Schwägerl-Melchior, Verena (2013): Die Korrespondenz zwischen Charles Bally und Hugo Schuchardt, in: Hugo Schuchardt Archiv, Graz (Link).
  • Schwägerl-Melchior 2015 = Schwägerl-Melchior, Verena (2015): Die Korrespondenz zwischen Karl Vossler und Hugo Schuchardt, in: Hugo Schuchardt Archiv, Graz (Link).
  • Sousa 2017 = Sousa, Silvio Moreira de (2017): Die Korrespondenz zwischen Eduard Hoffmann-Krayer und Hugo Schuchardt, in: Schwägerl-Melchior 2017, 145-164 (Link).
  • Wittgenstein 2016- = Wittgenstein, Ludwig (2016-): Interactive Dynamic Presentation (IDP) of Ludwig Wittgenstein's philosophical Nachlass. Edited by the Wittgenstein Archives at the University of Bergen under the direction of Alois Pichler, Bergen, Wittgenstein Archives at the University of Bergen (Link).
  • Wolf 1993 = Wolf, Michaela (1993): Hugo Schuchardt Nachlaß. Schlüssel zum Nachlaß des Linguisten und Romanisten Hugo Schuchardt (1842-1927), Graz, Leykam (Link).
< < Vorheriger BeitragNächster Beitrag > >

Schreibe einen Kommentar