Unicode: Keyboard 3.0 soll beim Retten digital benachteiligter Sprachen helfen
Die Umsetzungen von Tastaturen auf Betriebssystemen ist ein komplexes Unterfangen. Das lässt sich schnell mit einer Fragestellung aufzeigen: Wo befindet sich eigentlich das große ẞ (nicht das kleine ß) auf einer deutschen oder österreichischen Tastatur? Das wird auf Anhieb kaum einer aus dem Stegreif beantworten können, denn das ist vom Betriebssystem abhängig und war lange nicht überall möglich.
Dabei ist der Großbuchstabe ẞ bereits seit rund sechs Jahren offizieller Bestandteil der deutschen Rechtschreibung (PDF) und die Sprache wird rund 100 Millionen Menschen fließend gesprochen. Es geht aber noch komplizierter. Etwas kleiner mit ungefähr einem Drittel ist das Rumänische. Die dort gängigen Diakritika sind mit der Einführung des Computerzeitalters dermaßen durch die Betriebssystemhersteller verhunzt worden, dass es sogar Rechtschreibfehler auf offiziellen rumänischen Banknoten gibt, wie das Kitblog 2019 ausführlich und mit viel Zorn auf die Industrie darstellt.
Insbesondere in Sprachräumen, in denen viel mit diakritischen Zeichen gearbeitet wird, ist es oft ein Ärgernis. Manche Betriebssystemhersteller stellen vor allem auf mobilen Geräten mitunter die Tastaturen mit Updates um, sehr zum Ärgernis der Muttersprachler.
Einheitliche Tastaturen für alle Systeme
Hier kommt der Keyboard 3.0-Ansatz von Unicode zum Tragen. Mit der Locale Data Markup Language (LDML) für Keyboards (Teil 7) als Bestandteil des Unicode Technical Standard 35 soll das Design von Keyboards vereinfacht werden. Das gilt nicht nur für die physische Tastatur, sondern auch für den virtuellen Konterpart, etwa auf einem Touchscreen.
Am 16. Mai hat Unicode ein Public Review Issue für LDML v43 ausgegeben und bittet bis zum 15. Juli 2023 um Rückmeldungen, ob hier und da noch etwas verändert werden muss. In den letzten 18 Monaten wurde von einem Fachteam der Tastatur-Teil gründlich überarbeitet.
Unicode will damit auch den Vereinten Nationen helfen, die aktuell bis 2032 die Dekade der indigenen Sprachen ausgerufen haben (International Decade of Indigenous Languages 2022 – 2032). Laut Unicode ist das Keyboard-3.0-Projekt ein Pfad für digital benachteiligte Sprach-Communities. Viele Sprachen drohen zu verschwinden.
In Kanada deuteten bereits 2016er-Statistiken darauf hin, dass tendenziell die Älteren die indigenen Sprachen noch sprechen und den Jüngeren die Kenntnisse nicht mehr weitergereicht werden können. 2021 zeigte eine weitere Verschlechterung. Bis zum Ende des Jahrhunderts rechnet die UN, dass 90 bis 95 Prozent aller Sprachen mindestens davon bedroht zu sein. Übrig bleiben dann nur noch 300 bis 600 Sprachen weltweit, denen ein derartiges Schicksal nicht droht.
Dagegen können "führende Mitglieder" einer Sprach-Community ein Keyboard-3.0-Layout ins Common Locale Data Repository (CLDR) einbringen, welches dann die Grundlage für weitere Entwicklungen ist. So können kleine Sprachen leichter in der digitalen Welt fortgeführt und dokumentiert werden.
Ein weiteres Versprechen: Die User sollen es in Zukunft einfacher haben, zwischen Betriebssystemen zu wechseln, indem Inkonsistenzen verschwinden, die – je nach Sprache – mehr oder minder starkes Umgewöhnen bedeuten.
Wer sich weitergehend dafür interessiert: Unicode hat im April erst die CDLR Version 43 veröffentlicht. CDLR ist laut Unicode die größte und umfangreichste Sammlung von Gebietsschemadaten. Außerdem gibt es etwa in Kanada das Canadian Indigenous languages technology project sowie die First-Voices-Initiative, die immerhin 100 indigene Sprachen per App unter iOS und Android bietet. Darunter alle First-Nation-Sprachen aus Kanada, Australien und Neuseeland.