Mittlerweile sind viele Programme hinsichtlich der Unterstützung von
landesspezifischen Einstellungen so weit genormt, man einen Großteil
der Konfiguration durch Setzen der Umgebungsvariable LANG
auf den
Wert de_DE
erledigen kann. Dies ist ein Standard, der in einem
der vielen POSIX-Standards festgelegt wird, der aber nicht alle
Bereiche abdeckt. So fehlen z.B. Papiergröße und Zeitzone; allerdings
wären beide bei größeren Ländern schlecht mit einer Variable zu
erfassen, so daß man sie außen vorgelassen hat.
Der richtige Ort für das Setzen von Umgebungsvariablen sind die
Dateien /etc/profile
oder ~/.bash_profile
:
#LANG=de_AT # in Österreich
#LANG=de_CH # in der deutschsprachigen Schweiz
LANG=de_DE # in Deutschland
export LANG
Soweit die Theorie. In der Tat ist es etwas nervig, wenn sich deutsche und engliche Fehlermeldungen, Datumsangaben, usw. aufgrund von unvollständiger Internationalisierung mischen:
tar: Kann Archiv 'foo.tgz' nicht öffnen: Permission denied
In einem solchen Fall überschreibt man lieber diesen Aspekt der LANG-Variable:
LC_MESSAGES=C
export LC_MESSAGES
Dabei gehe ich davon aus, daß die eigene Linux-Distribution den POSIX-Standard durch die Locale-Dateien bereitstellt. Leider sind noch nicht alle Linux-Distributionen auf diesem Stand, so daß die obige Einstellung evtl. zu nervigen Fehlermeldungen führt. Beispiel:
Warning: locale not supported by C library, locale unchanged
In einem solchen Fall sollte man sich beim Hersteller des Distribution beschweren. Oder auf eigene Faust die locale-Dateien installieren, inkl. Kompilation der libc.
Details zu den Lokalen findet man im Linux Locale mini-HOWTO oder in der man-page zu locale. Der Rest dieses Kapitels behandelt die "Ausreißer", die die Umgebungsvariable LANG nicht auswerten.
Sowohl für die Textkonsole als auch für X11 existieren Zeichensätze (engl. `fonts'), die nicht alle Zeichen aus ISO-latin1 enthalten. D.h. die fehlenden Zeichen (z.B. Umlaute) werden als Leerzeichen oder gar nicht auf dem Bildschirm dargestellt. In diesem Fall hilft natürlich die Konfiguration der Programme nicht weiter, sondern es muß ein anderer (vollständiger) Zeichensatz gewählt werden.
Konfigurationsdateien: ~/.Xresources
und /etc/X11/Xresources
Das X-Window-System wartet mit einer eigenen Konfigurationsmöglichkeit für Locale auf. Diese muß man aber nur nutzen, wenn man für einzelne X-Programme die Locale anders setzen will, d.h. wenn man die Einstellungen in den Umgebungsvariablen überschreiben will.
Anders ausgedrückt: durch Setzen der Locale über die X-Resourcen verkompliziert man in den meisten Fällen das Setup der eigenen Linux-Machine (und wer will das schon). Andererseits gibt es natürlich Fälle, in denen das evtl. notwendig ist (aber wer hat die schon).
Gerüchten zufolge bestimmen folgende Resourcen die Locale von X11:
!*displayLang: de_DE
!*timeFormat: de_DE
!*inputLang: de_DE
!*basicLocale: de_DE
!*numeric: de_DE
Achtung: das Kommentarzeichen ist `!', nicht `#'.
Solange nicht ausdrücklich erwähnt, betreffen die Einstellungen alle Versionen eines Programms. Die vorzunehmenden Einstellungen sind durch Einrückung markiert.
bash
)Konfigurationsdatei: ~/.inputrc
Versionen: ab bash 1.14.1
set meta-flag on
set convert-meta off
set output-meta on
Kopiert man die Datei außerdem noch nach `/etc/skel/', so erhält sie jeder neu angelegte Benutzer automatisch. Eine globale Konfigurationsdatei gibt es leider noch nicht.
Vorsicht: Kommentare und Leerzeilen in dieser Datei können zu Problemen füren.
Konfigurationsdatei: ~/.telnetrc
Erscheinen beim telnet
statt `äöü' die Zeichen `dv|', so muß
man für jede Maschine einen Eintrag der Form:
localhost
set binary true
anlegen. Denselben Effekt erreicht man mit der Option "-8". Eine
globale Konfigurationsdatei für telnet
existiert nicht.
Konfigurationsdateien: ~/.
und /etc/
Das Programm selection muß neu compiliert werden, damit es Umlaute korrekt per Cut&Paste transportiert. Die notwendigen Modifikationen (Patch) stammen von Andries Brouwer und liegen unter der URL ftp://ftp.win.tue.nl/pub/linux/util
Gegenüber gpm
verbraucht selection
deutlich weniger virtuellen
Speicher, daher ist es auch heute noch von Interesse.
Konfigurationsdateien: ~/.dosrc
und /etc/dosemu.conf
Versionen: ab 0.52pl16
keyboard { layout de-latin1 keybint on rawkeyboard on }
X { updatefreq 8 title `DOS in a BOX' icon_name `xdos' keycode }
Hinweis: die Einstellung `keycode' funktioniert nur einwandfrei mit XFree86, nicht dagegen mit Xterminals o.ä.
Versionen: ab 19.22 (GNU)
Hinweis: einige Versionen des emacs haben Probleme mit der Aktivierung der Umlaute. Ab Version 19.29 sollten damit keinerlei Schwierigkeiten mehr auftreten.
Die Haupt-Konfigurationsdateien für den `emacs' sind:
/usr/lib/emacs/site-lisp/site-start.el (global),
~/.emacs (persönlich),
/usr/lib/emacs/site-lisp/default.el (global),
und werden in dieser Reihenfolge abgearbeitet. Insbesondere überschreiben also die Einstellungen in der `default.el' die Einstellungen aus ` /.emacs' und `site-start.el'. Diese Einträge erlauben das Arbeiten mit Umlauten:
(set-input-mode (car (current-input-mode))
(nth 1 (current-input-mode))
0)
(standard-display-european t)
Speziellere Informationen findet man in der FAQ zum Thema `emacs und Umlaute' von Karl Brodowsky, erhältlich unter der URL:
ftp://ftp.uni-erlangen.de/pub/doc/ISO/deutsch/emacs-umlaute-faq.gz
Konfigurationsdateien: ~/.bash_profile
und /etc/profile
Versionen: nur ältere Versionen sind betroffen
export LESSCHARSET=latin1
Konfigurationsdateien: ~/.pinerc
und /etc/pine.conf
# character-set should reflect the capabilities of the display
# you have. Normal default is US-ASCII. Typical alternatives
# include ISO-8859-x, where x is a number between 1 and 9.
character-set=ISO-8859-1
Konfigurationsdateien: ~/.joerc
und /etc/joe/joerc
-asis
Achtung, das Minus muß in der 1. Spalte stehen.
Konfigurationsdatei: ~/.elm/elmrc
charset = iso-8859-1
displaycharset = iso-8859-1
textencoding = 8bit
Konfigurationsdatei: ~/.nn/init
set data-bits 8
Eine globale Konfigurationsdatei existiert nicht.
Konfigurationsdateien: ~/.lynxrc
und /etc/lynx.cfg
Versionen: ab 2.4
CHARACTER_SET:ISO Latin 1
Kann von Hause aus keine Umlaute. Es ist ein patch erforderlich, dessen Beschreibung die Zielsetzung dieses HOWTO sprengt.
Kommandozeilenoption:
-metric
Der emacs kann in seinen Fähigkeiten durch Lisp-Module erheblich erweitert werden. Er ist dadurch das Schweizer Taschenmesser unter den Texteditoren. "Nur Kaffeekochen kann er nicht".
Die Lisp-Module tragen die Dateiendung .el
oder .elc
;
letztere ist die compilierte Form einer .el
-Datei. emacs
sucht z.B. im Verzeichnis /usr/lib/emacs/site-lisp
nach
solchen Modulen.
Die Laden der Module kann im emacs per Hand mit dem Kommando
<Alt x> load-library <return> pc-mode <return>
vorgenommen werden. Alternativ kann man durch die Anweisung
(load "pc-mode")
in einer der Konfigurationsdateien das Modul dauerhaft laden. Nachfolgend die Beschreibung einiger nützlicher Module:
Konfiguriert die Tastaturbelegung so, wie PC-Benutzer es gewohnt sind. Keine Landesspezifischen Abhängigkeiten, aber oft gefragt. In der Konfigurationsdatei eintragen:
;;; pc-mode.el --- emulate certain key bindings used on PCs.
(load "pc-mode")
(pc-bindings-mode)
Stellt Cut&Paste wie unter MacOS oder Win ein.
;;; pc-select.el --- emulate cut&paste like on PC or Mac
(load "pc-select")
(pc-selection-mode)
Zeigen die Umlaute unverändert an, speichern sie aber in dem TeX-Format ab.
Wie `iso-tex', kann aber nicht nur in beide Richtungen konvertieren, sondern beherrscht auch noch andere Formate wie etwa MIME.
Erlauben die Eingabe von Umlauten und Akzenten durch vorangestellte Zeichen, d.h. ~a wird schon während der Eingabe der Zeichen zu einem a mit der Schlange darüber (und auch als solches abgespeichert).
AUCTeX ist eine leistungsfähige Umgebung zum Verfassen von TeX- und LaTeX-Dokumenten. Die automatische Erkennung von landesspezifischen Besonderheiten wird mit dem Eintrag
(setq TeX-parse-self t)
in einer der Konfigurationsdateien aktiviert. `\usepackage{german}'
wird daraufhin von AUCTeX als Indikator verwendet.
Die erwähnten Pakete sind erhältlich unter der URL:
ftp://ftp.uni-erlangen.de/pub/doc/ISO/charsets/konvers-862.tar.gz
TeX ist ein professionelles Satzsystem. LaTeX ist eine Sammlung von Macros zum effektiven Einsatz von TeX.
Das Paket zur Verwendung des latin1-Zeichensatzes ist mittlerweile fester Bestandteil von LaTeX. Es wird aktiviert mit der Anweisung
\usepackage[latin1]{inputenc}
im Kopfteil des Dokuments.
Für diese Formate gibt es entweder keine Pakete oder nur veraltete
Style-Dateien. Daher kann man Dokumente, die solche veralteten Pakete
enthalten, i.a. nicht an andere versenden. Eine Verwendung der alten
Makros wie iso.sty
, xlatin1.sty
und umlaute.sty
(für den
Atari) wird daher nicht empfohlen.
Folgendes Beispiel kann als simples Grundgerüst für deutsche Texte (hier: Artikel) verwendet werden:
\documentclass[a4paper]{article}
% Die Option "a4paper" stellt als Papiergröße
% DinA4 ein. Alle anderen LaTeX-Pakete verlassen sich auf
% diese Einstellung.
\usepackage{german}
% stellt Abkürzungen für typische deutsche Besonderheiten
% bereit. Die Dokumentation befindet sich auf den
% CTAN-Serven unter /pub/tex/language/german/germdoc.tex
%\usepackage[T1]{fontenc}
% % Erlaubt die Trennung von Wörtern mit Umlauten
\usepackage[latin1]{inputenc}
% gibt den Zeichensatz des Dokuments an und macht somit die
% Eingabe von latin1-Zeichen möglich.
\usepackage{a4}
% stellt den bedruckten Bereich einer Seite, den sogenannten
% <em/Satzspiegel/, ein. Er wird so berechnet, daß
% durchschnittlich circa 60 bis 70 Buchstaben in einer Zeile
% vorkommen, da man sonst beim Lesen die Zeilen verliert.
%\usepackage[german]{babel}
% Aktiviert die Unterstutzung mehrerer Sprachen gleichzeitig.
\begin{document}
...
\end{document}
Weitere Informationen findet man unter der URL http://www.dante.de/dante/dante-faq.html
Eine bessere Alternative zur Satzspiegeleinstellung bietet das Paket "typearea.sty". Dieses Paket findet man bei den Koma-Script-Klassen von Markus Kohm unter ftp://[CTAN]/pub/tex/macros/latex/contrib/supported/koma-script/, die das "typearea.sty"-Paket intern verwenden. Es ist aber auch zusammen mit den Standardklassen (z.B. article) verwendbar.
Die Koma-Script-Klassen beachten auch andere deutsche Typographieregeln und sind daher sehr empfehlenswert. Dokumentation zu den Koma-Script-Klassen und dem "typearea.sty"-Paket befinden sich unter ftp://[CTAN]/pub/tex/macros/latex/contrib/supported/koma-script/scrguide. ps.
Comprehensive TeX Archive Network, bestehend aus (bald wieder)
drei Rechnern in Amerika, Großbritannien und Deutschland. Der
amerikanische und der deutsche Rechner sind von DANTE e.V (
Deutschsprachige Anwendervereinigung TeX) angeschafft und
finanziert worden. Der deutsche Rechner hat den Namen ftp.dante.de
.)
Alle modernen TeX-Distributionen bieten die Möglichkeit, in der zugehörigen Konfigurationsdatei das Kommentarzeichen % vor der Zeile
german ghyph31.tex
zu entfernen. Es werden dann Formate mit den deutschen Trennregeln erzeugt.
Mit der Rechtschreibreform ab 1. August 1998 werden andere Trennregeln gültig. Vermutlich werden dann rechtzeitig neue Trenntabellen zur Verfügung stehen.
Zur Prüfung von Rechtschreibfehlern steht unter Linux das Programm
ispell
zur Verfügung. Die meisten Distributionen bieten dieses
zur Installation an, die zugehörige deutsche Wortliste liegt seltener
bei.
Einen recht brauchbaren Grundstock für eine eigene Wortliste enthält das Paket "hk-deutsch2" von H. Knutzen. Es umfaßt 22 Dateien, die individuell zu einer eigenen Wortliste zusammengefaßt werden können. Die dazu notwendigen Schritte werden in dem beiliegendem README genau erklärt.
Durch die individuelle Zusammenstellung werden die Wortlisten kleiner und somit die Rechtschreibprüfung beschleunigt.
Es soll aber nicht verschwiegen werden, daß man diesen Listen in der
Regel noch eine "eigene" Wörter hinzufügen muß (dies ist mit
ispell
automatisch möglich).
Das Paket ist erhältlich unter der URL:
ftp://ftp.informatik.uni-kiel.de/pub/kiel/dicts/hk2-deutsch.tar.gz
ispell
Da ispell
nicht jedes Textformat automatisch erkennt,
muß man die Optionen -T latin1
und -w "äöüÄÖÜß"
verwenden. Kommen weitere nicht-ascii Zeichen im Text vor, so sollte
man diese ebenfalls mit der '-w'-Option zulassen.
Ein anderes als das englische Wörterbuch wird mit der Option '-d' ausgewählt, also z.B.
ispell -d german -T latin1 -w "äöüÄÖÜß" German-HOWTO.txt
für das Deutsche Wörterbuch in der Datei
/usr/dict/german.hash
(Binärformat).
Ruft man ispell
aus dem Editor emacs
heraus auf, so kann man
obige Parameter automatisch übergeben, indem man folgenden Eintrag in
einer der Konfigurationsdateien des emacs vornimmt:
(setq ispell-extra-args '("-Tlatin1"
"-d" "/usr/lib/german"
"-w" "äöüÄÖÜß"))