5/2014 Digitales Sprachensterben

Von den etwa 7.000 Sprachen, die es aktuell weltweit gibt, sind etwa 3.000 vom Aussterben bedroht. Die Hälfte der Weltbevölkerung spricht die zwanzig größten Sprachen; 90 Prozent sprechen die 300 größten Sprachen; die übrigen werden vorwiegend von nur wenigen hundert oder tausend Sprechern benützt. Dokumentiert sind die bedrohten Sprachen im UNESCO-Atlas der gefährdeten Sprachen, dessen Inhalt online unter anderem in einer Weltkarte zugänglich ist. Doch noch viel dramatischer fällt die Bilanz in der digitalen Welt aus, wie ein kürzlich (auf Englisch) publizierter Artikel von András Kornai von der ungarischen Akademie der Wissenschaften in der Online-Zeitschrift PLOS One feststellt. Wie er in „Digital Language Death“ beschreibt, existieren nur etwa 5 Prozent aller Sprachen im Internet. Wikipedias gibt es derzeit in 287 verschiedenen Sprachen; aber nur 52 haben über 100.000 Artikel. Wie Kornai beschreibt, besteht beispielsweise Wikipedia Nummer 44 in der Kunstsprache Volapük fast ausschließlich aus automatisch generierten geographischen Angaben und nicht aus realen Artikeln. Der Linguist verwendete etliche Kriterien dafür, ob und wie eine Sprache in der digitalen Welt existiert: Gibt es die Schrift, in der sie geschrieben wird, in Unicode? Gibt es für die Sprache eine Eingabemöglichkeit oder sogar volle Betriebssystem-Unterstützung durch Microsoft und Apple? Gibt es ein Wörterbuch für eine Rechtschreibprüfung (die meistgenützte, HunSpell, enthält 129 Sprachen)? Es wurden vier Klassen von Sprachen in der digitalen Welt gebildet (zwei lebende Klassen, blühend und vital; zwei tote Klassen, schweigend und Kulturerbe), in die alle Sprachen mithilfe von Maschinenlern-Algorithmen eingeordnet wurden. Dabei konnten insgesamt 268 Sprachen als lebend kategorisiert werden (davon 16 als blühend) und 358 als tot. 162 Sprachen fallen in eine Grenzkategorie, sind also mit automatischen Methoden nicht eindeutig zuordenbar. Das heißt selbst mit der optimistischen Annahme, dass ein Großteil der Grenzfälle „lebt“, sind es nur 5 Prozent aller Sprachen, die in der digitalen Welt existieren – und dies wird in zunehmenden Maß auch ein Faktor für das Überleben in Real Life sein. Wenn also erwartet wird, dass nur 2.500 Sprachen das 21. Jahrhundert überleben, müsste man ergänzen: Nur 10 Prozent davon werden digital überleben, alle anderen werden entweder zum sprachlichen Kulturerbe (wie etwa Altgriechisch), oder sie werden sterben, sollte das Weltweite Netz nicht plötzlich polyglott werden.

www.unesco.org/new/en/culture/themes/endangered-languages/atlas-of-languages-in-danger
www.plosone.org/article/info:doi/10.1371/journal.pone.0077056#pone.0077056