Das Internet und seine Sprachenarmut: Wo sind die indigenen Sprachen?
Ein Gastbeitrag von Tobias Eberhard.
Schon beim Lesen dieses ersten Satzes ist eines klar: Dieser Text ist in deutscher Sprache verfasst. Das heißt, er kann von Menschen, die über Kenntnisse in dieser Sprache verfügen, grundsätzlich verstanden werden – so weit, so wenig überraschend. Auch beim Schreiben präsentieren sich mir keinerlei Hindernisse, die außerhalb meiner selbst liegen. Ich tippe auf einer Tastatur, die für die deutsche Sprache ausgelegt ist, ein kleines „DE“ zeigt mir an, dass meinem Textprogramm die deutsche Sprache bekannt ist. Ich bekomme keine Fehlermeldungen, habe keine Anzeigeprobleme, die Autokorrektur ändert meine eingetippten Worte nicht – maximal wird hier und da mal etwas rot oder im etwas freundlicheren Blau unterschlängelt, mehr nicht. Die technischen Voraussetzungen, diesen Text zu schreiben, sind also gegeben. Gleiches gälte, wenn ich diesen Text auf Russisch, Portugiesisch, Japanisch schreiben wollen würde. Die technische Infrastruktur erlaubt es mir (es scheitert dahingehend leider an meinen Sprachkenntnissen). Doch wie sieht das für kleinere Sprachen aus, für Sprachen, die nicht von vielen Menschen gesprochen werden, die in der allgemeinen Aufmerksamkeit nicht sonderlich präsent sind, die über individuelle Schriftsysteme verfügen oder sogar nur mündlich vorliegen?
Damit beschäftigt sich der Artikel „The many languages missing from the internet“ von Miguel Trancozo Treviño, der am 15. April 2020 bei BBC Future erschienen ist. Einige der Statistiken aus dem Artikel sind zwar schon etwas älter, doch an der Grundausrichtung hat sich bis heute wenig verändert: Das Internet wird von einigen wenigen Sprachen dominiert, die man an zwei Händen abzählen kann. Anhand von aktuellen Zahlen lässt sich das gut illustrieren. Mit etwa 25 % bilden Sprecher*innen des Englischen den größten Anteil der Internetnutzer*innen, gefolgt von Sprecher*innen des Chinesischen mit knapp unter 20 %. Laut derselben Statistik teilen sich fast 77 % der Internetnutzer*innen auf gerade mal zehn verschiedene Sprachen auf. Gekoppelt mit den Zahlen von W3Techs über die Sprachen, in denen Webseiten weltweit vorliegen – knapp 60 % der Webseiten, deren Sprache bekannt ist, sind englischsprachig, gefolgt von Russisch mit nicht einmal 9 % (!) – ergibt das ein eindeutiges Bild. Das Wort „Vorherrschaft“ kommt hier in den Sinn, mit allen negativen Konnotationen, die ihm anhaften – wo etwas vorherrscht, wird etwas anderes unterdrückt, entweder mit Vorsatz oder aus einer breiten Ignoranz heraus. Die Tatsache, dass einigen wenigen Sprachen eine Dominanzstellung zukommt, erscheint sehr offensichtlich und wenig überraschend. Und doch finden wir uns heute in einer Situation wieder, in der von großen Unternehmen und Organisationen, die maßgeblich am Aufbau des Internets beteiligt waren, wenig bis nichts unternommen wurde, um dieser Vorherrschaft etwas entgegenzusetzen. Den Menschen, denen sträflicherweise sowieso schon weniger Beachtung geschenkt wird, wird die Möglichkeit des persönlichen Ausdrucks, der persönlichen Repräsentation durch Sprache nicht geboten.
Im Artikel wird eine Studie aus dem Jahr 2003 angeführt, laut der sich 98 % der Internetseiten auf bloß zwölf Sprachen aufteilen – zwölf Sprachen aus etwa 7 000. Nun hat sich das mit der Zeit ein wenig geändert, immerhin zu einer etwas breiteren Vielfalt. Doch völlig unerheblich, ob man die älteren oder aktuellen Zahlen betrachtet: Die Dominanz einiger weniger Sprachen ist damals wie heute erheblich.
Vergessen oder vernachlässigt?
Anhand der älteren Zahlen wird aber noch etwas ganz anderes deutlich: In der Zeit, in der das Internet im Aufbau begriffen war, in der Grundsteine von bis heute fortbestehenden Strukturen gelegt wurden, wurden kleinere (und teilweise auch gar nicht mal so kleine) Sprachen nicht miteinbezogen. Einem massiven Anteil der Weltbevölkerung wurde also von Grund auf kein Platz in der technologischen Entwicklung eingeräumt, die heute unser aller Leben bestimmt und das in absehbarer Zukunft auch weiterhin tun wird.
Für Sprachen, die eine starke Wirkmacht zum Beispiel aufgrund der Vielzahl der Sprecher*innen innehaben stellt das kein Problem dar. Dort kann im Nachhinein eine Integration stattfinden oder es können eigene Strukturen aufgebaut werden, wie es etwa für das Chinesische geschehen ist. Für kleinere Sprachen besteht diese Möglichkeit nicht. Weder ihnen selbst noch ihren Sprecher*innen wird in globaler Sicht eine Handlungsmacht zugestanden, sie spielen in globalkapitalistischen Strukturen keine Rolle. Indigene Sprachen und Minderheitensprachen wurden bei der Konzeption des weitläufigen Internets nicht mitgedacht. Sie wurden weniger vergessen, sondern viel mehr als nicht relevant genug betrachtet, um in der technischen Konzeption der Online-Infrastruktur Beachtung zu finden.
Noch vor ein paar Jahren war überall die Rede davon, dass Zugang zum Internet, auch in entlegenen Gebieten der Erde – sogar in eher ländlichen Gebieten Deutschlands! –, ermöglicht werden muss, um die Globalisierung voranzutreiben. Ja, großartig!, denkt man da zunächst. Endlich können wir alle auf wichtige Informationen zugreifen, endlich können sich alle austauschen, endlich gibt es für alle Menschen auf der Erde die gleichen Voraussetzungen!…
Doch was, wenn nach dem Zugang, nach dem Zugänglichmachen nichts mehr kommt? Es ist schön, wenn Fahrradwege angelegt werden. Wenn darauf jedoch nur Autos unterwegs sind und den Radfahrenden jeder Platz darauf genommen wird, ist die bloße Existenz der Wege nicht viel mehr als ein Gimmick, auf das die Politik bei Fragen in Sachen Nachhaltigkeit und Umweltbewusstsein wohlwollend verweisen kann. Vielleicht entscheidet man sich als Fahrradfahrer*in dann beim nächsten Mal doch lieber für das Auto, weil es einfacher ist. Wenn Sprecher*innen von Minderheitensprachen online keine Inhalte in ihrer eigenen Sprache finden, müssen sie zwangsläufig auf eine andere Sprache ausweichen. Im Artikel kommt Miguel Ángel Oxlaj Kumez zu Wort, der die Cakchiquel-Sprache des gleichnamigen guatemaltekischen Maya-Volks spricht. Insgesamt gibt es etwa 500 000 Sprecher*innen dieser Sprache. Er fragt sich, warum er seinen Kindern Cakchiquel beibringen soll, wenn es im Internet und im Fernsehen nicht stattfindet. Er fragt sich, warum kleinere Sprachen überhaupt gelernt und gelehrt werden sollen, wenn man sie online nicht zur Anwendung bringen kann, wenn sie einfach nicht stattfinden und somit quasi nicht existieren, weil ihnen durch die Nicht-Präsenz im Internet eine gewisse Form der Legitimität fehlt. Das bestärkt die Verdrängung von Minderheitensprachen und gleichzeitig von Sprecher*innen dieser Sprachen aus dem Onlinebereich. Ein Teufelskreis.
Technologische Nichtbeachtung
Es ist nicht getan damit, den Menschen Zugang zu Onlinebereichen zu verschaffen. Wenn Tastaturen nicht für die eigene Sprache ausgelegt sind, wenn Programme die Alphabete nicht verarbeiten können, wenn Programme Schriften nicht darstellen können, wenn Suchmaschinen bestimmte Sprachen nicht erfassen können, was dazu führt, dass Informationen in bestimmten Sprachen quasi nicht auffindbar sind – dann sind das grundsätzliche technische Probleme, deren Behebung das absolute Minimum für die Inklusion von sprachlichen Minderheiten in den alltäglichen Sprachgebrauch im Internet darstellten sollte.
An diesem Punkt setzen kleinere Organisationen und einzelne betroffene Aktivist*innen an, wobei auch etwa die UNESCO im Jahr 2003 eine „Empfehlung zur Förderung und Nutzung der Mehrsprachigkeit und zum allgemeinen Zugang zum Cyberspace“ verabschiedet hat, die der sprachlichen und kulturellen Homogenisierung entgegenwirken soll. Davon betroffen sind etwa Sprecher*innen indigener Sprachen Mittelamerikas, wo das vorherrschende Spanisch die kleineren Sprachen zu verdrängen droht. Um dagegen anzukämpfen, wurden in den letzten Jahren konkrete Projekte ins Leben gerufen, deren Zweck es ist, eigene Schriftarten für bestimmte indigene Sprachen zu entwickeln, etwa für Mixtekisch, eine indigene Sprache Mexikos, die sich in eine Vielzahl an lokalen Varianten unterteilt und die bis vor etwa zwanzig Jahren hauptsächlich in mündlicher Form vorlag. Im Artikel wird die Muttersprachlerin und Linguistikstudentin Victoria Aguilar erwähnt, die es sich zur Aufgabe gemacht hat, eine eigene Schriftart für Mixtekisch zu entwickeln, damit sie sich online in ihrer eigenen Sprache austauschen kann.
Auch in der Vergangenheit wurden schon grundlegende Veränderungen angestoßen, die zur Vielfalt des Internets beigetragen haben. So basierte das Domain Name System, das beim Aufrufen von Internetseiten für die Auflösung von Adressnamen in IP-Adressen zuständig ist, auf ASCII, dessen ausgeschriebener Name das Problem schon verdeutlicht: American Standard Code for Information Interchange. Ein sehr Westsprachen-zentriertes Konzept, das zunächst nur Buchstaben von a bis z bzw. A bis Z, Ziffern von 0 bis 9 und Bindestriche erlaubte. Das bedeutet, Domainnamen waren auf das lateinische Schriftsystem beschränkt. Für die meisten westlichen Sprachen stellt dies kein großes Problem dar, da ihre Alphabete auf diesem Schriftsystem basieren. Doch die Unzahl an Sprachen, die andere Schriftsysteme verwenden, Chinesisch, Hebräisch, Koreanisch, arabische Sprachen, indigene Sprachen, waren im Hintertreffen, weshalb im Nachhinein das Internationalizing Domain Names in Applications System entwickelt werden musste, um weitere Schriftzeichen und Symbole zu erlauben und sprachliche Vielfalt in Domainnamen zu ermöglichen. Die Ergebnisse einer Studie des Council of European National Top-Level Domain Registries und des Oxford Information Labs deuten darauf hin, dass solche nun möglichen länderspezifischen Top-Level-Domains die Präsenz von Landessprachen stärken, was wiederum der Dominanz der großen Sprachen entgegenwirkt.
Glücklicherweise wird auch ständig daran gearbeitet, immer mehr Schriftsysteme digital verfügbar zu machen. So werden Unicode, einem Standard zur Codierung von Schriftzeichen, ständig neue Zeichen und Symbole aus neuen Schriftsystemen hinzugefügt. Mittlerweile deckt Unicode 154 Schriftsysteme ab, darunter auch die einiger indigener Sprachen.
Der wichtige Punkt ist an dieser Stelle: Bei alledem handelt es sich um nachträgliche Änderungen, die erst aufgrund des zur Geltung gebrachten Bedarfs verschiedener Gruppen unternommen wurden.
Die analoge Welt im Digitalen
Neben den technologischen Aspekten besteht jedoch ein weiteres Problem, auf das Victoria Aguilar in Treviños Artikel hinweist, nämlich dass sich die Ungleichheiten der analogen Welt auch ins Internet verlagern. In der „echten“ Welt sozial marginalisierte Gruppen sind dies auch im Internet. Die Stimmen marginalisierter Menschen sind auch online leise, finden selten statt oder Gehör. Es besteht ein Bedarf an Inhalten in den jeweiligen Sprachen, damit Quellen und Texte aus erster Hand im Internet auffindbar sind, womit wiederum etwa Wikipedia-Seiten in diesen Sprachen gefüllt werden können. Die Wikipedia- bzw. Wikimedia-Community ist zum Teil darauf bedacht, die sprachliche und damit informationelle Vielfalt zu erhöhen. So gibt es etwa Gruppen in bestimmten Ländern, die konkret am Aufbau von Wikipedia-Versionen in kleineren Sprachen arbeiten, wie zum Beispiel für die Maya-Sprache Cakchiquel. Ebenso gibt es Projekte wie Lingua Libre, eine Plattform zur Aufzeichnung von ausschließlich gesprochenen Sprachen.
In Sachen sprachlicher Vielfalt im Internet geht es also voran, wenn auch in kleinen Schritten. Zumindest ist das Problem der Marginalisierung und Nichtbeachtung von indigenen und Minderheitensprachen mittlerweile breit anerkannt; trotzdem liegt ein Großteil der Verantwortung noch mehrheitlich in den Händen von Internetaktivist*innen, also bei einzelnen Menschen. Größere Unternehmen, Organisationen und Plattformen genauso wie journalistische und Unterhaltungsmedien und die Wissenschaft müssen sich ihrer Rolle in der Verbreitung und Sichtbarmachung von Minderheitensprachen (und entsprechender Stimmen!) bewusst werden, dies als Teil von Barrierefreiheit im Internet begreifen und entsprechend handeln. Barrierefreiheit in diesem Kontext bedeutet nicht (nur), für einen möglichst breiten Zugang zum Internet zu sorgen, sondern auch allen Menschen das Ausüben der persönlich präferierten Sprache generell zu ermöglichen.
Die vermeintliche Normalität als Problem
Und genau hier, in der grundsätzlichen Auslegung der Technologie, die wir alle benutzen (müssen), um Zugang zu einer Welt außerhalb der analogen zu erhalten, zeigen sich wieder einmal die Konsequenzen davon, ganze Menschengruppen nicht mitzudenken, sie nicht zu repräsentieren, sie nicht zu beteiligen. Gleiches gilt für die Art und Weise, wie, von wem und worüber Inhalte erzeugt werden. Es ist derselbe Mechanismus, der dazu führt, dass die Medizin Frauen benachteiligt oder schwarze Haut von Sensoren nicht erkannt wird. Der Mann, die weiße Haut, die westlichen beziehungsweise wenigen dominanten Sprachen als Neutrum. Alles, was davon abweicht, ein Sonderfall, der nicht einbezogen wird, zwar im besten Fall mitgemeint, aber nicht wirklich mitgedacht. Auf allen noch so unscheinbar anmutenden Ebenen wirkt sich diese Verengung auf ein „normales“ Objekt unmittelbar auf die Menschen aus, die nicht Teil dieser angenommenen Normalität sind.
Daher lässt sich hier einmal mehr bekräftigen: Der Austausch mit und die Repräsentation sowie Einbindung von marginalisierten Menschen bei gleichzeitigem aktivem Hinterfragen der eigenen Privilegien und das Abrücken von einer angeblich neutralen Normalität sind bei der Konzeption und Gestaltung von Technologien, gesellschaftlichen Strukturen und im Endeffekt bei allem, was in irgendeiner Weise eine Auswirkung auf die Welt hat, von zentraler Wichtigkeit und nicht irgendein Randthema, das zu einem späteren Zeitpunkt vielleicht einmal angegangen werden kann, wenn die Bedürfnisse und Forderungen der „neutralen“ Gruppe einmal befriedigt sind.
Über den Autoren:
Tobias Eberhard hat Sprach- und Literaturwissenschaft und anschließend Übersetzungswissenschaft studiert und arbeitet nun als Übersetzer. Für fast alles, was irgendwie mit Sprachen, Filmen, Literatur und Videospielen zu tun hat, kann er sich unverhältnismäßig stark begeistern, was sich entsprechend auch in seiner Twitterblase widerspiegelt (wo er meist zwar nur passiv, aber trotzdem viel zu oft unterwegs ist).
Bibliographie
Alle Links zuletzt abgerufen am 18.06.2020.
Council of European National Top-Level Domain Registries. 2019. Global TLD Market Report. https://stats.centr.org/stats/global
Der Tagesspiegel. 2020. Der große kleine Unterschied: Warum eine geschlechtsspezifische Medizin wichtig ist. https://www.tagesspiegel.de/wissen/der-grosse-kleine-unterschied-warum-eine-geschlechtsspezifische-medizin-wichtig-ist/25576424.html
Internet World Stats. Internet world users by language. https://www.internetworldstats.com/stats7.htm
Kearse, Stephen. 2020. The Ghost in the Machine: How new technologies reproduce racial inequality. The Nation. https://www.thenation.com/article/culture/ruha-benjamin-race-after-technology-book-review/tnamp/?__twitter_impression=true
Treviño, Miguel Trancozo. 2020. The many languages missing from the internet. BBC Future. https://www.bbc.com/future/article/20200414-the-many-lanuages-still-missing-from-the-internet?ocid=ww.social.link.facebook
UNESCO. 2003. Recommendation concerning the Promotion and Use of Multilingualism and Universal Access to Cyberspace. http://portal.unesco.org/en/ev.php-URL_ID=17717&URL_DO=DO_TOPIC&URL_SECTION=201.html
W3Techs. Usage statistics of content languages for websites. https://w3techs.com/technologies/overview/content_language