1. Wikipedia - Ende und Anfang
Der Kreis als ideale geometrische Gestalt hat bekanntlich weder Anfang noch Ende; dasselbe gilt wohl auch für das Wissen, das auf das Engste mit der allerjüngsten Phase der Evolution verbunden ist, so dass Carl von Linné unsere biologische Species deshalb als Homo sapiens ‘wissender Mensch’ (1758) bezeichnet hat. Einen Anfang und ein Ende haben dagegen historische Formen der Wissensvermittlung, wie z.B. die Gattung der Enzyklopädie (< gr. κύκλος [kyklos] ‘Kreis’; vgl. LSJ, Link, und παιδεία [paideía] ‘Erziehung, Bildung’; vgl. LSJ, Link). Die Wikipedia, die man keinesfalls geringschätzen sollte, gehört einerseits noch in diese Gattung, da sie sich ausdrücklich als Enzyklopädie bezeichnet; sie hat aber andererseits bereits ein vollkommen neues Format begründet; damit markiert die Wikipedia in emblematischer Weise die Formation der aktuellen Wissensgesellschaft. Im Folgenden wird das globale Projekt Wikipedia im Wesentlichen an der italischen Version (Link) exemplifiziert.
2. Am Anfang standen Diderot & Cie
Wie jede Gattung hat auch die Enzyklopädie ihre Vorgeschichte; dennoch lässt sich der Anfang historisch recht genau ausmachen, nämlich im bis heute bewundernswerten, seinerzeit einzigartigen Großprojekt der Encyclopédie, ou Dictionnaire raisonné des sciences, des arts et des métiers von Diderot/d’Alembert 1751 - 1772 (Link; vgl. neuerdings das Digitalisierungsprojekt ENCRRE). An den 17 Textbänden, die durch 9 Abbildungsbände ergänzt wurden, hatten insgesamt bereits 145 Personen mitgearbeitet (Link), unter denen berühmte französische Intellektuelle, wie Voltaire, Montesquieu und Condillac, sowie hervorragende Spezialisten, wie der Naturforscher und Zoologe Lamarck oder der (Genfer) Mathematiker Necker zu finden sind. Die Unternehmung verkörpert die bereits ganz und gar wissensorientierte Bewegung der Aufklärung (fra. [siècle des] Lumières, ita. Illuminismo); man beachte auch die Tatsache, dass im Titel nicht nur die theoretischen Wissenschaften (sciences), sondern auch die praktischen Fertigkeiten (arts)1 und die einfachen Berufe samt ihrer Werkzeuge (métiers), deren Wertschätzung beide Herausgeber nicht ohne Emphase unterstreichen (vgl. d'Alembert/Diderot). Programmatisch ist das Titelbild, in deren Zentrum eine Allegorie der Wahrheit steht, und seine Erklärung durch einen der beiden Herausgeber, Jean le Rond d'Alembert (Link), sowie insbesondere der Artikel Encyclopédie des anderen Herausgebers, Denis Diderot. Dort heißt es:
"En effet, le but d’une Encyclopédie est de rassembler les connoissances éparses sur la surface de la terre ; d’en exposer le système général aux hommes avec qui nous vivons, & de le transmettre aux hommes qui viendront après nous ; afin que les travaux des siecles passés n’aient pas été des travaux inutiles pour les siecles qui succéderont ; que nos neveux, devenant plus instruits, deviennent en même tems plus vertueux & plus heureux, & que nous ne mourions pas sans avoir bien mérité du genre humain." (Diderot, 635).
‘Tatsächlich ist es das Ziel einer Enzyklopädie die auf der Oberfläche der Erde verstreuten Kenntnisse zu sammeln; ihr allgemeines System den Menschen, die mit uns leben, darzulegen und es den Menschen, die nach uns leben werden zu übergeben, damit die Mühen der vergangenen Jahrhundert keine nutzlosen Mühen für die folgenden Jahrhunderte waren, damit unsere Neffen gebildeter und gleichzeitig tugendhafter und glücklicher werden, & damit wir nicht sterben, ohne es verdient zu haben zur Gattung Mensch zu gehören.’ (Übers. Th.K.)
Es werden also die systematische Thesaurierung ("rassembler"), die öffentliche Präsentation ("exposer") und dauerhafte Verfügbarkeit ("transmettre aux hommes qui vivront") des Wissens zum moralischen Auftrag der Menschheit erklärt. Weiterhin wird sehr deutlich das Prinzip einer breiten, d.h. nicht elitären, und uneigennützigen Kollaboration von Autoren herausgestellt, die nur der Menschheit und Menschlichkeit im Allgemeinen verpflichtet sind; das ist auch ein unmissverständliches Bekenntnis zur intellektuellen Freiheit, ohne diesen seinerzeit politisch gefährlichen Ausdruck zu verwenden:
"Quand on vient à considérer la matiere immense d’une Encyclopédie, la seule chose qu’on apperçoive distinctement, c’est que ce ne peut être l’ouvrage d’un seul homme. [...] | C’est à l’exécution de ce projet étendu, non seulement aux différents objets de nos académies, mais à toutes les branches de la connoissance humaine, qu’une Encyclopédie doit suppléer ; Ouvrage qui ne s’exécutera que par une société de gens de lettres & d’artistes, épars, occupés chacun de sa partie, & liés seulement par l’intérêt général du genre humain, & par un sentiment de bienveillance réciproque." (Diderot, 635 f.)
‘Wenn man es unternimmt den immensen Gegenstand einer Enzyklopädie in den Blick zu nehmen, erkennt man ganz klar nur einen einzigen Umstand, nämlich dass es nicht das Werk eines einzigen Menschen sein kann. [...] | Zur Durchführung dieses umfangreichen Projekts muss eine Enzyklopädie nicht nur die unterschiedlichen Gegenstände unserer Akademien berücksichtigen, sondern alle Zweige des menschlichen Wissens - ein Werk, das nur durch eine Gesellschaft von weit gestreuten, gebildeten Menschen und Fachleuten umgesetzt werden wird, von denen sich ein jeder mit seinem Gebiet befasst, und die einander allesamt einzig durch ihr allgemeines Interesse an der Menschheit und ein Gefühl gegenseitigen Wohlwollens verbunden sind.’ (Übers. Th.K.)
Abgesehen von der inhaltlichen Modernität des Vorhabens beachte man die Verwendung zweier sprachlicher Ausdrücke, die zu wirklich internationalen Schlüsselbegriffen der modernen Gesellschaft avancierten: fra. système/ital. sistema/deu. System (usw.) und fra. projet/ita. progetto/deu. Projekt (usw.). Wie weit der zeitgeschichtliche und politische Rahmen der Unternehmung jedoch noch vom Typ der aktuellen Wissensgesellschaft entfernt war, wird klar, wenn man daran erinnert, dass die Veröffentlichung der Encyclopédie ständig mit der staatlichen Zensur und Verboten zu kämpfen hatte (vgl. das Stichwort Publikationsgeschichte unter diesem Link).
Diderot wirft in seinem eben zitierten Artikel ansatzweise bereits eine grundlegende Schwierigkeit auf, die in der medialen Welt des Drucks kaum zu überwindend ist; man könnte geradezu vom enzyklopädischen Paradoxon sprechen. Es besteht - einfach gesagt - darin, dass zwar Sachwissen vermittelt werden soll, dass dieses Sachwissen jedoch in Gestalt einzelsprachlicher, hier: französischer Stichwörter organisiert wird, die zudem in alphabetischer Ordnung, wie in einem Wörterbuch, gereiht sind. Diderot fasst dieses Problem, indem er einen Gegensatz zwischen Encyclopédie ou Dictionnaire raisonné auf der einen Seite und vocabulaire auf der anderen Seite formuliert. Dazu heißt es:
"qu’est-ce qu’un vocabulaire, lorsqu’il est exécuté aussi parfaitement qu’il peut l’être ? Un recueil très-exact des titres à remplir par un dictionnaire encyclopédique & raisonné." (Diderot, 635)
‘was ist denn ein Wörterbuch, wenn es so perfekt wie nur möglich verwirklicht wird wird? Eine sehr exakte Sammlung von Überschriften, die durch ein enzyklopädisches und vernunftgeleitetes Lexikon ausgeführt werden müssen.’ (Übers. Th.K.)
Der Unterschied liegt also einerseits in der Ausführlichkeit der Beschreibung, aber darüber hinaus auch in der Natur der Sprache, die es uns gestattet, Sachen und Sachverhalte treffsicher zu identifizieren, ohne über ihre genaue Beschaffenheit informiert zu sein:
"Un vocabulaire universel est un ouvrage dans lequel on se propose de fixer la signification des termes d’une langue, en définissant ceux qui peuvent être définis, par une énumération courte, exacte, claire & précise, ou des qualités ou des idées qu’on y attache. Il n’y a de bonnes définitions que celles qui rassemblent les attributs essentiels de la chose désignée par le mot. Mais a-t-il été accordé à tout le monde de connoître & d’exposer ces attributs ? L’art de bien définir est-il un art si commun ? Ne sommes nous pas tous, plus ou moins, dans le cas même des enfans, qui appliquent avec une extrème précision, une infinité de termes à la place desquels il leur seroit absolument impossible de substituer la vraie collection de qualités ou d’idées qu’ils représentent ? De-là, combien de difficultés imprévues, quand il s’agit de fixer le sens des expressions les plus communes ? On éprouve à tout moment que celles qu’on entend le moins, sont aussi celles dont on se sert le plus. Quelle est la raison de cet étrange phénomene ? C’est que nous sommes sans cesse dans l’occasion de prononcer qu’une chose est telle ; presque jamais dans la nécessité de déterminer ce que c’est qu’être tel. Nos jugemens les plus fréquens tombent sur des objets particuliers, & le grand usage de la langue & du monde suffit pour nous diriger. Nous ne faisons que répéter ce que nous avons entendu toute notre vie." (Diderot, 635; Hervorhebung Th.K.)
Diese Absicht, das lexikalische Wissen durch ein massives Sachwissen zu ergänzen zeigt sich im Versuch, das gesamte Wissen systematisch zu schematisieren (Link); sie erklärt auch den außerordentlichen Aufwand, der in die Produktion der Abbildungsbände (fra. planches) investiert wurde (vgl. ENCRRE, Planches III, 299 ff.; s.v. CONFISEUR). Hier entsteht - modern gesagt - der Nukleus einer Ontologie, d.h einer außersprachlichen, einzelsprachunabhängigen Referenzebene, die als solche de facto auch erkannt wurde, wie gerade ein italienisches Beispiel, nämlich das mailändische Wörterbuch von Francesco Cherubini 1814 zeigt. Dabei handelt es sich um das erste der zahlreichen und bedeutenden italienischen Wörterbücher des 19. Jahrhunderts. Cherubini beschreibt seine Datensammlung, die nicht nur in der Auswertung literarischer Quellen bestand, sondern auch in intensiver Feldforschung, in der die Abbildungen der Enzyklopädie in Auszügen gewissermaßen als Fragebuch dienten:
"chiamai spesso a consulta varj artisti; e mostrando loro sulle tavole dell’Enciclopédie i varj utensili dell’arte loro, almeno dei principali fra questi mi feci dire da essi i nomi vernacoli; ed io quindi coll’ajuto de’ termini francesi usati dall’Enciclopedia stessa cercai e rinvenni per la maggior parte gli equivalenti toscani." (Cherubini 1814, XIII, Anm.)
Trotz dieser Rezeption muss man einschränkend hinzufügen, dass die Autoren der Encyclopédie allem Anschein noch nicht zu einer kategorischen begrifflichen Trennung zwischen außersprachlichen, sachbezogenen Kategorien und einzelsprachlichen, lexikalischen Kategorien des Französischen gelangen. Zwar werden définitions de noms und définitions de choses unterschieden und für letztere sind Spezialisten unentbehrlich, aber offensichtlich wird gerade kein substantieller Gegensatz gesehen:
"Concluons donc qu’on n’exécutera jamais un bon vocabulaire sans le concours d’un grand nombre de talens, parce que les définitions de noms ne different point des définitions de choses (Voyez l’art. Définition), & que les choses ne peuvent être bien définies ou décrites que par ceux qui en ont fait une longue étude." (Diderot, 635A)
‘Wir kommen also zu dem Schluss, dass man ein gutes Wörterbuch nicht ohne die Mitwirkung einer großen Zahl talentierter Personen verwirklichen kann, weil die Wortdefinitionen sich nicht von den Sachdefinitionen unterscheiden (vgl. den Art. Définition), & und weil die Dinge nur von denjenigen gut definiert oder beschrieben werden können, die sie lange studiert haben.’ (Übers. Th.K.)
3. Treccani - oder das Ende der gedruckten enzyklopädischen Tradition
Die Tradition der aufklärerischen Enzyklopädisten zwischen wort- und sachbezogenen Informationen nicht kategorisch, d.h. nicht qualitativ, sondern auf Grund der Menge und Art der gegebenen Informationen, d.h. quantitativ zu unterscheiden, wurde auch von bedeutenden Sprachwissenschaftlern des 20 Jahrhunderts vertreten (vgl. vor allem Bloomfield 1979 [1933], 139) und reicht bis in unsere Gegenwart. Illustrativ ist ein Blick auf das Portal des Istituto Giovanni Treccani, denn dort werden eine Enciclopedia und ein Vocabolario parallel geführt.
Das folgende Beispiel des Eintrags virus zeigt, dass auch im Vocabolario die sachorientierten Informationen gelegentlich bei weitem dominieren; die wenigen sprachbezogenen und wörterbuchspezifischen Informationen wurden farblich hervorgehoben. Sie betreffen die Grammatik, die Herkunft, und die formale Zusammenfassung der polysemen Bedeutungen 1. und 2.a., 2.b. in einem Text:
"vìrus s. m. [dal lat. virus «veleno»], invar. – 1. In biologia, termine con cui si designa un gruppo di organismi, di natura non cellulare e di dimensioni submicroscopiche, incapaci di un metabolismo autonomo e perciò caratterizzati dalla vita parassitaria endocellulare obbligata, costituiti da un acido nucleico (genoma) rivestito da un involucro proteico (capside). Quando un virus riesce a penetrare all’interno di una cellula con la quale è venuto in contatto, il suo genoma si integra nel materiale genetico della cellula ospite alterandone così il patrimonio genetico e obbligandola a sintetizzare acidi nucleici e proteine virali e quindi alla replicazione del virus. Il genoma virale può essere costituito da DNA o da RNA, cosicché si distinguono virus a DNA o desossivirus e virus a RNA o retrovirus. I virus sono parassiti di animali, piante, batterî, e sono gli agenti eziologici di numerose malattie: in patologia umana una particolare importanza rivestono i virus implicati nella genesi dei tumori (v. oncogeni, papovavirus), i retrovirus associati ad alcuni linfomi, il retrovirus responsabile della sindrome da immunodeficienza acquisita (AIDS). Oltre ai virus descritti sono poi stati individuati agenti infettivi più piccoli e più semplici, responsabili di alcune malattie delle piante, come i viroidi, i virini, i virusoidi, e degli animali, come i virus lenti non convenzionali o prioni; tra questi ultimi sono compresi gli agenti eziologici dello scrapie (v.) della pecora e di alcune malattie del sistema nervoso dell’uomo, tutte caratterizzate dal lungo periodo di incubazione e dal prolungato decorso, quali il kuru (v.) e un tipo di demenza presenile, associata a varie manifestazioni neurologiche, chiamata malattia di Jakob-Creutzfeldt (dai nomi dei neuropsichiatri tedeschi A.M. Jakob e H.G. Creutzfeldt, che ne descrissero il quadro clinico). Per gli ECHO virus o virus ECHO, v. echovirus. 2. fig. a. Intensità quasi patologica di affetti, sentimenti, passioni, istinti irrefrenabili e dannosi: è entrato nel suo animo il v. della gelosia, del sospetto; lo ha rovinato il v. del gioco d’azzardo; si sta nuovamente diffondendo il v. del razzismo. b. In informatica, insieme di istruzioni destinato a danneggiare un sistema di elaborazione (per es., attraverso la cancellazione di parte delle memorie) o a eseguire determinate operazioni all’insaputa dell’utente del computer (per es., comunicare dati personali a un sistema remoto); può essere introdotto direttamente o, più spesso, mascherato all’interno di programmi apparentemente innocui che, duplicati e trasmessi inconsapevolmente da un utente all’altro, diffondono il virus su larga scala con modalità «epidemiche». Sotto l’aspetto tecnico e funzionale, i virus informatici sono oggi distinti in varie categorie (dialer, trojan horse, worm, backdoor, spyware, ecc.: v. le singole voci), globalmente riconducibili sotto l’etichetta di malware (propr. malicious software, in ital. «codice maligno»)." (Quelle)
Im entsprechenden Eintrag der Enciclopedia (Link) fehlen die sprachbezogenen Informationen, während die sachbezogenen Informationen deutlich reichhaltiger sind. Zahlreiche andere Beispiele, wie übrigens ausgerechnet der Artikel enciclopedia aus dem vocabolario, bestätigen, dass es keinen substantiellen Unterschied zwischen den jeweiligen Artikeln gibt, der die Parallelführung und die Aufrechthaltung beider Gattungstraditionen rechtfertigen würde. Es handelt sich bei beiden Werken gewissermaßen um ‘digitales Papier’, denn das konzeptionelle Format entspricht trotz zahlreicher Verlinkungen letztlich dem des gedruckten Buchs.
Dasselbe gilt für die meisten anderen ehrwürdigen Enzyklopädien, die auf deutsch auch als Konversationslexika bezeichnet werden, aus der Drucktradition, wie die ENCYCLOPÆDIA BRITANNICA, die kostenpflichtige Brockhaus Enzyklopädie oder die Encyclopedia Universalis. Sie sind im Vergleich mit dem Großprojekt der Wikimedia Foundation deshalb nicht mehr konkurrenzfähig, weil sie die Optionen der Neuen Medien für die Dokumentation und Organisation des Wissens nicht konsequent nutzen:
"Imagine a world in which every single human being can freely share in the sum of all knowledge." (Quelle)
4. Die Wikipedia - oder der Anfang einer neuen enzyklopädischen Arbeit
4.1. Libera und collaborativa
Im Selbstverständnis eine Enciclopedia libera e collaborativa zu sein radikalisiert das Projekt zwei Prinzipien, zu denen sich im Kern, wie gesagt (vgl. DEFAULT), bereits die französischen Encylopédistes bekannten. Die Spezifikation der Freiheit bezieht sich vor allem auf die Unabhängigkeit von kommerziellen und ideologischen Partikularinteressen. Offensichtlich wird zu den Freiheitsrechten auch die Möglichkeit gerechnet, mit einem nome utente, d.h. nicht mit dem Klarnamen zu firmieren. Diese Verfahrensweise ist weithin im Internet üblich, jedoch nicht wirklich einsichtig: Als Autor sollte man doch Veranwortung für das übernehmen, was man kommuniziert.
Letztlich diskreditiert diese Anonymisierung der Autorenschaft das zweite, im Namen festgeschriebene Prinzip: die Kollaborativität. Anonymität ist nicht geeignet, Vertrauen in die Verlässlichkeit der Information zu erzeugen. Jedenfalls sind die eingebundenen Autoren so zahlreich, dass man von der Vergesellschaftung der Enzyklopädie, oder genauer gesagt: der enzyklopädischen Arbeit sprechen darf. Alle Nutzer sind aufgerufen, sich aktiv an der Verbesserung und Erweiterung des Inhalts durch Text, Bild und Tondokumenten zu beteiligen:
"Grazie al contributo di volontari da tutto il mondo, Wikipedia è disponibile in oltre 290 lingue. Chiunque può contribuire alle voci esistenti o crearne di nuove, affrontando sia gli argomenti tipici delle enciclopedie tradizionali sia quelli presenti in almanacchi, dizionari geografici e pubblicazioni specialistiche.
Tutti i contenuti di Wikipedia sono protetti da una licenza libera, la Creative Commons CC BY-SA, che ne permette il riutilizzo per qualsiasi scopo a condizione di adottare la medesima licenza." (Quelle)
Es gibt also vorab keinerlei Selektionsverfahren der potentiellen Autoren; im Kontext der italienischen Wikipedia ergeben sich (am 30.4.2020) folgende Zahlen:
"La comunità di Wikipedia in lingua italiana è composta da 1 971 268 utenti registrati, dei quali 10 086 hanno contribuito con almeno una modifica nell'ultimo mese e 109 hanno funzioni di servizio. Gli utenti costituiscono una comunità collaborativa, in cui tutti i membri, grazie anche ai progetti tematici e ai rispettivi luoghi di discussione, coordinano i propri sforzi nella redazione delle voci." (Quelle)
Allerdings können die Funktionsträger unter den Wikipedianer (amministratori) in Artikel eingreifen; diese redaktionelle Arbeit ist nicht auf die rein technischen Aspekte beschränkt, sondern schließt auch Kommentare und die Löschung ganzer Artikel ein. Charakterisch sind Hinweise auf unzureichende bibliographische Absicherung und/oder formale, bzw. Formatierungsmängel, wie der Artikel Lessicografia ilustriert. Da auch die Adminstratoren in aller Regel unter Nutzernamen erscheinen, ist die Entstehungsgeschichte eines Artikel nur scheinbar transparent; ein Blick in die cronologia des eben genannten Beispielartikels lässt keinen einzigen eindeutigen Klarnamen erkennen (Link).
In der deutschen Wikipedia wird die im Logo festgeschriebene Freiheit im Wesentlichen über die Freiheit der Inhalte,
"deren kostenlose Nutzung und Weiterverbreitung urheberrechtlich erlaubt ist" (Quelle)
bestimmt.
4.2. Die Wikipedia und die außersprachliche Welt
Ganz ähnlich wie es bereits Diderot getan hatte (s.o.), besteht auch die (italienische) Wikipedia auf der Abgrenzung zur Gattung des Lexikons:
"Wikipedia non è un dizionario," (Quelle)
Es wird genauer gesagt, sogar eine doppelte Abgrenzung vorgenommen, denn es heißt zunächst:
-
- "Wikipedia non è un dizionario enciclopedico",
da keine möglichst prägnante und dichte Beschreibung angestrebt wird. Weiterhin wird festgestellt:
-
- >"Wikipedia non è un vocabolario",
denn sprachspezifische Informationen werden ausdrücklich ausgeschlossen; dafür steht ein anderes Format, nämlich das im Sinne der Wikimedia ebenfalls kollaborativ angelegte Online-Wörterbuch Wikizionario zur Verfügung. Im Sinne der skizzierten enzyklopädischen Tradition ist es wichtig festzuhalten, dass durch die Wikipedia, oder wenigstens in engem Zusammenhang mit der Wikipedia die seit Diderot/d’Alembert 1751 - 1772 eingeforderte kategorische Trennung zwischen sachbezogenen und sprachbezogenen Informationen operationalisiert wurde. Dazu dient das noch zu wenig genutzte Projekt Wikidata.
4.2.1. Wikidata
Zum Wikidataprojekt gelangt man über das linksseitige Menu der Wikipediaseite und den Button Elemento Wikidata (deu. Wikidata-Datenobjekt); etwa zum Wikipedia-Artikel latte ‘Milch’ gehört dieser Elemento Wikidata. Die geöffnete Seite zeigt uns die Funktionalität dieser Datenobjekte: Es handelt sich im Kern um einen permanenten Identifikator (eine sogenannte Q-ID), in diesem Fall: Q8495, der auf die außersprachliche Realität referenziert. Die zu diesem Identifikator gehörige Seite gibt noch weitere Informationen, so die Tatsache, dass sich in 195 Sprachversionen (Stand vom 4.5.2020) der Wikipedia Einträge zum selben Thema finden, und dass alle diese Einträge mit genau diesem identischen Identifikator verknüpft sind. Der Identifikator gibt, anders ausgedrückt, Zugang zu allen 195 Artikeln über WHITE LIQUID PRODUCED BY THE MAMMARY GLANDS OF MAMMALS. Weiterhin von Bedeutung sind die aufgeführten ‘statements’, durch die Relationen mit anderen außersprachlichen Kategorien (‘values’) hergestellt werden; dabei handelt es sich im Grunde um logische Prädikationen auf der Basis zweistelliger Prädikatoren (‘properties’); allen Konstituenten eines solchen Ausdrucks, der dem Schema Subjekt-Prädikat-Objekt entspricht, sind eindeutige und permanente IDs zugeordnet:
Statement | ||
ITEM (Subjekt) | PROPERTY (Prädikat) | VALUE (Objekt) |
milk (Q8495) | subclass of (P279) | food (Q2095) |
drink (Q40050) | ||
food ingredient (Q25403900) | ||
dairy product (Q185217) | ||
body fluid ... | ||
image ... | ||
color ... | white ... | |
has part ... | water ... | |
fat ... | ||
protein ... | ||
usw. | ||
usw., je nach Item auch OSM (= Georef), Datumsangaben (= Chronoref.) | ||
usw. |
Jede ‘value’ kann wiederum zum ‘item’ anderer ‘statements’ gemacht werden. Das Auftreten aller entsprechenden Wikidata-Objekte in den verschiedenen Wikimedia-Projekten kann dank ihrer IDs mit einer speziellen Abfragesprache (SPARQL) genau und sprachunabhängig erfasst werden. Auf dieser Logik beruht letztlich das RDF-Schema, das die Grundlage des sogenannten semantic web bildet. Durch diese Verknüpfungen entsteht eine kontinuierlich angereicherte und komplexer werdende Ontologie. Ganz konsistent ist die Anlage von Wikidata übrigens nicht; denn die dort unter der ‘property pronounciation audio’ abgelegten Audiorealisierungen sind eindeutig sprach- und keineswegs sachorientiert.
4.2.2. Normdaten
Die Identifikatoren (IDs), mit denen digitale Objekte eindeutig identifiziert werden können, bezeichnet man als Normdaten (vgl. Lücke 2019c). Die Wikimedia-Projekte produzieren also Normdaten zu allen bereitgestellten digitalen Objekten. Der Grundgedanke geht auf die Bibliothekswelt zurück, denn die großen Bibliotheken vergeben seit längerem dergleichen Identifikatoren, insbesondere, um die oft mehrdeutigen Eigennamen von Autor*innen, Orten usw. eindeutig identifizieren zu können. So werden in der Gemeinsamen Normdatei (GND) der Deutschen Bibliothek in Frankfurt am Main (online: OGND) 63 Personen mit dem Namen Hans Maier unterschieden (Link). Ähnliche Identifikationssyteme werden von anderen großen Bibliotheken geführt; auf eng. werden Normdaten als authority files bezeichnet. Ein genauer Blick auf die Wikimedia-Objekte zeigt, dass hier möglichst viele Normdatensysteme berücksichtigt werden (vgl. die Hinweise unter aiuto:controllo_di_autorità, deu. Hilfe:Normdaten).
Die mit Normdaten versehenen Ausschnitte der Wirklichkeit werden in folgende Klassen eingeteilt:
-
- für Organisationen/Körperschaften (z. B. Bands, Unternehmen, Universitäten)
- v für Veranstaltungen und Kongresse
- w für Werke (z. B. Zeitschriftentitel)
- s für Sachbegriffe s (z. B. U-Boot, Trampelpfad)
- g für geographische Einheiten (z. B. Slowenien, Landshut) (Quelle)
Der Überblick zeigt, dass dazu mittlerweile auch ‘Sachbegriffe’ gehören; aus sprachwissenschaftlicher Sicht ist das eine ganz grundsätzliche Änderung, denn die Bezeichnung erfolgt in dieser Klasse nicht mit Eigennamen, sondern mit einzelsprachlichen Appellativen: Es wird also de facto sehr viel Lexikon, genauer: deutsches Lexikon in die Normdatei importiert (vgl. zu den Inkonsistenzen Krefeld 2019am, Link). In manchen Bereichen der außersprachlichen Realität existieren seit langem genau standardisierte Normdaten in Gestalt meist wissenschaftlicher Nomenklaturen. In diesen kontrollierten lexikalischen Felder findet sich nur wenig einzelsprachliche Variation; gelegentlich fehlt sie ganz, nämlich dann, wenn für die jeweilige Nomenklatur bestimmte Sprachen, in der Regel Lateinisch und Griechisch festgelegt wurden. Sehr bekannt ist zum Beispiel die eingangs erwähnte biologische Taxonomie, die auf von Carl von Linné (1707-1778; Link) zuürckgeht.
Es ist daher sehr konsequent, wenn die italienische Wikipedia - als sachorientierte Enzyklopädie - die jeweiligen Einträge gemäß dieser Nomenklatur benennt. So kommt es, dass die Suche nach ita. pecora ‘Schaf’ oder ita. vacca ‘Kuh’, automatisch zu den lateinisch betitelten Artikeln Ovis aries bzw. Bos taurus führt (in der deutschen Wikipedia gelangt man bei der entsprechenden Suche von Schaf und Kuh zu Hausschaf bzw. Hausrind).
Normdaten werden jeweils auch am Ende der Wikipedia- und Wikidata-Beiträge genannt: vgl. am Beispiel von ita. latte
- in der Wikipedia unter dem Stichwort ‘controllo di autorità’;
- in Wikidata als ‘property’ mit dem Namen ‘Identifiers’.
Normdaten spielen eine grundlegende Rolle bei der Füllung von Metadatenschemata (vgl. Schulz u.a. 2020). Nicht zuletzt sind sie auch für die Identifizierung der benutzten und dokumentierten Sprachen wichtig; die Wikipedia ist derzeit (4.5.2020) in 309 verschiedenen Sprachen verfügbar; davon sind 299 aktiv (Überblick). Auch hier konkurrieren unterschiedliche Kodes (vgl. ISO-693-3, und Glottolog), so dass die Setzung eigener Codes durch die Wikimedia überrascht; sie ist jedoch angesichts des gelegentlich eigenwilligen Verständnisses nachvollziehbar. So werden die Dialekte Siziliens, Kalabriens und Südapuliens (Salento) unter dem Namen Lingua siciliana zusammengefasst; dieser Sprachgebrauch kann sich auf gemeinsame sprachliche Merkmale stützen, ist jedoch historisch unangemessen.
Bibliographie
- Bloomfield 1979 [1933] = Bloomfield, Leonard (141979 [1933]): Language, London/Boston/Sydney, George Allen & Unwin (Link).
- Cherubini 1814 = Cherubini, Francesco (1814): Vocabolario milanese-italiano, 2 voll., Milano, Milano, Stamperia reale (Link).
- d'Alembert/Diderot = d'Alembert, Jean-le Rond / Diderot, Denis: Métier, in: Diderot/d'Alembert 1751-1772, vol. 10, Tome 10, p. 463-465 (Link).
- Diderot = Diderot, Denis: Encyclopédie, in: Diderot/d'Alembert 1751-1772, vol. 5, 635-648A (Link).
- Diderot u.a. 1751 = Diderot, Denis / Mallet, Edme-François / Yvon, Claude (1751): Art, in: Diderot/d'Alembert 1751-1772, vol. 1, 713-719 (Link).
- Diderot/d’Alembert 1751 — 1772 = Diderot, Denis / d’Alembert, Jean le Rond (Hrsgg.) (1751 — 1772): Encyclopédie, ou Dictionnaire raisonné des sciences, des arts et des métiers , Paris (Link).
- ENCRRE = ENCRRE, Alexandre Guilbaud / Leca-Tsiomis, Marie / Passeron, Irène / Cernuschi, Alain (Hrsgg.) (2018-): Édition Numérique Collaborative et CRitique de l’Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers (1751-1772) (Link).
- Krefeld 2019am = Krefeld, Thomas (2019): Linguistische Theorien im Rahmen der digital humanities, Version 4, in: Korpus im Text, Serie A, vol. 28010, München, LMU (Link).
- LSJ = LSJ: The Online Liddell-Scott-Jones Greek-English Lexicon (Link).
- Lücke 2019c = Lücke, Stephan (2019): Normdaten, in: Methodologie, VerbaAlpina-de 19/2 (Link).
- Schulz u.a. 2020 = Schulz, Julian / Kümmet, Sonja / Lücke, Stephan / Spenger, Martin / Weber, Tobias (2020): Standardisierung eines Standards: Warum und wie ein Best-Practice-Guide für das Metadatenschema DataCite entstand, in: Korpus im Text, Serie A, 42800, München, LMU (Link).
Lieber Herr Prof. Krefeld,
in der Übersetzung (Block 11) am Ende des ersten Satzes ist das Wort „wenn“ einmal zu entfernen.
Viele Grüße
Wolfgang Lallinger