Hilfe:Unterstützung indischer und südostasiatischer Sprachen

Aus Wikivoyage
Themenübersicht > Wiki Markup > Unterstützung indischer und südostasiatischer Sprachen
Wechseln zu: Navigation, Suche

In den Artikeln auf Wikivoyage lassen sich auch Texte indischen Sprachen darstellen. Neben den indischen Schriften Bengali, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Sinhala, Tamilisch und Telugu gehören dazu auch die stark abweichenden Schriften wie Laotisch, Thai, Khmer, Tibetisch, Birmanisch (Myanmar), und Balinesisch. Die Schriften sind im UNICODE codiert und können in die Artikel integriert werden. Allerdings müssen für die Darstellung der Schriften einige Vorraussetzungen erfüllt werden.

Inhaltsverzeichnis

Voraussetzungen [Bearbeiten]

Notwendig für die Darstellung der indischen Schriften ist die Fähigkeit des Systems mit Complex Text Layout umgehen zu können. Dies betrifft die Fähigkeit sowohl bidirektionalen Text darzustellen, als auch Kombinationszeichen korrekt zu rendern. Es gibt in den indischen Sprachen beispielsweise Fälle, in denen ein Konsonant innerhalb des Vokales steht. Die Anwendung muß nun aus beiden nacheinander codierten Zeichen ein neues zusammensetzen. Im Wesentlichen sind zwei Vorraussetzungen nötig:

  • Ein Open Type Font, der die entsprechenden Zeichen zur Verfügung stellt.
  • Eine Renderingmachine, die die korrekte Darstellung durchführt. Unter Windows übernimmt diese Aufgabe Uniscribe.

Wer in seine Dokumenten oder Webseiten fremde Schriftarten nutzen will, sollte sie immer im UTF-8 Format codieren.

Systemcheck [Bearbeiten]

Die folgende Tabelle gibt eine Gegenüberstellung, wie die korrekte Darstellung der einzelnen Schriften aussehen sollte, und wie dein Computer sie in seiner derzeitigen Konfiguration darstellt. Wenn du die Zeichen erkennen kannst, ist schon mal ein passender Font installiert, wenn die Darstellung in der rechten Tabellenspalte dem Bild der mittleren Spalte entspricht, kann deine Computerkonfiguration auch das Text-Layout korrekt rendern.

Schrift Korrekte Darstellung Dein Computer
Bengalisch Example Complex Text Bengali.png ক + ি = কি
Devanagari Example Complex Text Devangari.png क + ि = कि
Gujarati Example Complex Text Gujarati.png ક + િ = કિ
Gurmukhi Example Complex Text Gurmukhi.png ਕ + ਿ = ਕਿ
Kannada Example Complex Text Kannada.png ಕ + ಿ = ಕಿ
Khmer Example Complex Text Khmer.png ៀ + ស = សៀ
Malayalam Example Complex Text Malayalam.png ക + െ = കെ
Tamil Example Complex Text Tamil.png க + ே = கே
Telugu Example Complex Text Telugu.png య + ీ = యీ

Einrichtung der Sprachenunterstützung [Bearbeiten]

Microsoft Windows [Bearbeiten]

Windows XP [Bearbeiten]

Windows XP bringt eine Unterstützung der indischen Sprachen mit. Im Standardfall ist sie auf den Systemen aber nicht mitinstalliert. Auf folgendem Weg lassen sich die Features nachträglich einrichten:

  • Systemsteuerung -> Regions- und Sprachoptionen -> Sprachen -> die beiden Kästchen unter "zusätzliche Sprachoptionen" aktivieren alle notwendigen Features

Nach einem Neustart stehen die Funktionalitäten und eine Reihe neuer Fonts zur Verfügung. Fehlende Fonts müssen dann manuell nachinstalliert werden. Unter Umständen muß man versuchen seine Anwendungen mit einer neueren Uniscribe Version zu betreiben. Nähere Informationen findest du weiter unten.

Uniscribe [Bearbeiten]

Uniscribe übernimmt das Rendern des Complex Text Layout unter Windows. In einigen Fällen reicht es nicht, Uniscribe auf dem Rechner installiert zu haben. Das Modul muß das Regelwerk zu jeder einzelnen Sprache beherrschen. Mit den einzelnen Versionen kamen neue Sprachen hinzu. Um die auf dem System installierte Version zu erkennen gibt es folgende Möglichkeit:

  • Start -> Ausführen -> "msinfo32" -> Unter "Softwareumgebung -> Geladene Module" steht neben der "usp10.dll" ihre entsprechende Versionsunummer (unter Windows XP-SP2 wahrscheinlich die: 1.0420.2600.2180)

Die folgende Tabelle gibt einen Überblick über die verfügbaren Versionen und ihre Sprachfähigkeit.

Version Ausgeliefert mit Arabisch Devanagari Tamil Tibetanisch Khmer Mongolisch Complex Latin Hebräisch Malayalam Kannada Oriya
1.325.2180.1 Windows ME Nein Ja Ja Nein Nein Nein Nein Nein Nein Nein Nein
1.325.2195.4506  ? Nein Ja Ja Nein Nein Nein Nein Nein Nein Nein Nein
1.325.2195.6692 Windows 2000 Ja Ja Ja Nein Nein Nein Nein Nein Nein Nein Nein
1.405.2416.1 MS Word 2000 and MS Office 2002 Ja Ja Ja Nein Nein Nein Nein Ja Nein Nein Nein
1.409.2600.1106 Win XP SP1 Ja Ja Ja Nein Nein Nein Nein Ja Nein Nein Nein
1.420.2600.2180 Win XP SP2 Ja Ja Ja Nein Nein Nein Ja1 Ja Nein Nein Nein
1.453.3665.0 VOLTSupplementalFiles (Aug 2002) Ja Ja Ja Nein  ? Nein Ja Ja Nein Nein Nein
1.460.3707.0 MS VOLT 1.1.206 Ja Ja Ja Nein Ja Nein Ja Ja  ? Nein Nein
1.468.4011.0  ? Ja Ja Ja Ja Ja Nein Ja Ja  ? Nein Nein
1.468.4015.0 Paratext 6 Ja Ja Ja Ja Ja Nein Ja Ja  ? Nein Nein
1.471.4030.0 MS Office 2003 and Google Earth Ja Ja Ja Ja Ja Nein Ja Ja  ? Nein Nein
1.471.4063.0 MS Office 2003 Ja Ja Ja Ja Ja Nein Ja Ja  ? Nein Nein
1.473.4067.0 VOLTSupplementalFiles (Neinv 2004) Ja Ja Ja Ja Ja Nein Ja Ja Ja Nein Nein
1.473.4067.15 MS VOLT 1.1.225 Ja Ja Ja Ja Ja Nein Ja Ja Ja Nein Nein
1.606.5065.1  ? Ja Ja Ja Ja Ja Ja Ja Ja Ja Nein Nein
1.606.5078.0  ? Ja Ja Ja Ja Ja Ja Ja Ja Ja Nein Nein
1.609.5231.2 Vista beta 1 Ja Ja Ja Ja Ja Ja Ja Ja Ja  ?  ?
1.613.5291.0 MS VOLT 1.2 Ja Ja Ja Ja Ja Ja Ja Ja Ja  ?  ?
1.614.5315.0 MS Word 2007 (beta) Ja Ja Ja Ja Ja Ja Ja Ja Ja  ?  ?
1.615.5384.4 Vista beta 2 Ja Ja Ja Ja Ja Ja Ja Ja Ja  ?  ?
1.626.5756.05 Office 2007 Ultimate Ja Ja Ja Ja Ja Ja Ja Ja Ja  ? Ja
1.626.6000.163866 Vista Ultimate Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.6000.20581 Windows Vista Hotfix KB936176 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.6001.16510 Windows Server "Longhorn" Beta 3 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.6001.18000 Windows Vista SP1 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.6002.18005 Windows Vista SP2 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.7600.16385 Windows 7 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.7600.20602 Office 2010 (RTM) Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.7600.20796 Office 2010 SP1 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
1.626.7601.17514 Windows 7 SP1 Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja

Leider wird das vorhandene Uniscribe nicht über die Windows-Update-Funktion aktualisiert. Auch manuell läßt sich ohne weiteres keine neue Version installieren. Neuere Releases werden nur neuen Produkten wie neuen Office- und Windows-Versionen beigefügt. So kann das normale Windows XP trotz installiertem Open Type Fonts z.B. keine Khmer-Schrift 100%-ig korrekt darstellen. Ist darauf ein Microsoft Office 2003 installiert, wird es dargestellt, aber nur Office kann es, nicht hingegen die anderen Programme, wie die Webbrowser. Hier muß man sich im Regelfall mit einigen Workarounds behelfen.

Das Uniscribe versteckt sich in der Datei usp10.dll. Wer eine neuere Version dieser Datei hat, kann sie seinem System manuell zur Verfügung stellen. Besitzer eines Office 2003 sind automatisch im Besitz der Version 1.471.xxxx.x. Allerdings wird sie dadurch leider nur von MS-Office genutzt. Man findet sie Datei an folgender Stelle:

  •   \Programme\Gemeinsame Dateien\Microsoft Shared\OFFICE11\  

Es wird nicht empfohlen, diese Datei systemweit einzubinden, und im Windows Systemverzeichnis auszutauschen. Man sollte die Datei in das Programm-Verzeichnis seiner Programme kopieren. Hier ein Beispiel:

  • Firefox:  \Programme\Mozilla Firefox\  -> Kopiert man die Datei aus dem Office-verzeichnis hier hin, stellt Firefox unter Windows XP auch das obige Beispiel in Khmer korrekt dar. Analog verfährt man mit seinen anderen Anwendungen:
  • Open Office 2.3:  \Programme\OpenOffice.org 2.3\program\  

Mac OS [Bearbeiten]

Folgende Liste enthält die fortschreitende Sprachunterstützung der einzelnen Mac OS-Versionen:

  • Mac OS 10.3: Devanagari, Gujarati, Gurmukhi
  • Mac OS 10.4: Tamil
  • Mac OS 10.5: Tibetisch
  • Mac OS 10.7: Kannada, Telugu, Bengali/Assamese, Malayalam, Sinhala, Oriya, Lao, Khmer und Birmanisch

Linux [Bearbeiten]

Verwendung indischer Sprachen auf Wikivoyage [Bearbeiten]

Oftmals ist es möglich, fremde Schriftarten einfach im Text mit einzugeben. Für eine saubere Einbindung fremder Sprachen sollte man die fremdsprachigen Bereiche als solche kennzeichnen. Nur so ist der Browser in der Lage, auf korrekte Darstellung, Silbentrennung usw. zu achten. Auf Wikivoyage werden solche Textteile über Vorlagen eingebunden. Diese übernehmen die Kennzeichnung sowie die Übergabe aller erforderlichen Parameter. Die folgende Übersicht gibt dir einen Überblick über die zu verwendenden Vorlagen sowie Tipps und Empfehlungen zu den einzelnen Fonts. Unter Umständen sind in den Browser-Einstellungen die Angaben zu den einzelnen Schriftarten nicht korrekt. Die Tabelle gibt dir eine Hilfestellung, welche Fonts im Browser für einzelne Sprachen eingestellt werden sollten. Bei einigen Sprachen ist Wikivoyage auf bestimmte Fonts optimiert.

Sprache Beispieltext Vorlage Browsereinstellung Bemerkungen
Bengalisch জনগণমন Bn / BnS Vrinda
Birmanisch မြန်မာဘာသာ My / MyS Padauk, Myazedi Empfohlen werden die Verwendung der Fonts Padauk und Myazedi.
Devanagari देवनागरी Sa Mangal Die Schrift wird in den Sprachen Sanskrit, Hindi, Marathi, Nepali gelegentlich auch für das Panjabi genutzt. Weitere Devanagari-Fonts gibt es unter anderem auf www.sanskritweb.net
Gujarati હું ગુજરાતી બોલું છુ Gu Shruti
Gurmukhi ਗੁਰਮੁਖੀ Pa Raavi Die Schrift wird für das Panjabi genutzt.
Kannada ಕನ್ನಡ Kn
Khmer ភាសាខ្មែរ Km / KmS Khmer OS Empfohlen wird die Verwendung des Fonts Khmer OS. Auf www.khmeros.info ist dieser Font kostenlos zu beziehen.
Lao ສາທາລະນະລັດ Lo / LoS Saysetta OT Empfohlen wird die Verwendung des Fonts Saysetta OT. Auf www.laoscript.net ist dieser Font kostenlos zu beziehen.
Malayalam മലയാളം Ml Kartika
Tamil தமிழ் Ta Latha
Telugu తెలుగు Te
Thai วัดภูเขาทอง Th / ThS

Die Vorlagen sind für alle Sprachen gleich aufgebaut. Der Name der Vorlage entspricht im Regelfall dem Sprachcode nach ISO 639-1. Danach folgt der eigentliche Text. Optional kann man der Vorlage auch den kompletten Namen der Sprache, die Transkription (Option: trans=) oder die Lautsprache (Option: ipa=) sowie die deutsche Übersetzung mit übergeben.

  • Beispiel:
    •     {{Gu|ગુજરાતી}}
    •     {{Gu|ગુજરાતી|sprache=Gujarati|trans=gujarātī|de=Sprache von Gujarat|ipa=guʤəˈrɑːtiː}}
  • Ergebnis:
    •     ગુજરાતી
    •     Gujarati: ગુજરાતી- IPA: guʤəˈrɑːtiː, gujarātī, Sprache von Gujarat

Weblinks [Bearbeiten]