Lebende und alte Sprachen (Auswahl)
ISO 639-
ar	ara	Arabisch
cs	ces	Tschechisch
da	dan	Dänisch
de	deu	Deutsch
el	ell	Griechisch (Neu-)
en	eng	Englisch
es	spa	Spanisch
fa	fas	Farsi (=Persisch)
fr	fra	Französisch
he	heb	Hebräisch (modern)
hi	hin	Hindi
hr	hrv	Kroatisch
hu	hun	Ungarisch
it	ita	Italienisch
ja	jpn	Japanisch
nl	nld	Niederländisch
pl	pol	Polnisch
pt	por	Portugiesisch
rm	roh	Rätoromanisch
ru	rus	Russisch
sk	slk	Slowakisch
sl	slv	Slowenisch
sv	swe	Schwedisch
sw	swa	Swahili
tr	tur	Türkisch
zh	zho	Chinesisch
sa	san	Sanskrit
	grc	Altgriechisch
la	lat	Latein
cu	chu	Kirchenslawisch
	non	Altnordisch
	goh	Althochdeutsch
	gmh	Mittelhochdeutsch
	hbo	Althebräisch
	arc	Reichs-Aramäisch
	tmr	Talmud. Aramäisch
Der Sprachcode ist auch Ländercode des Landes, nach dem die Sprache benannt ist.
Der Sprachcode ist nicht Ländercode eines Landes.
Der Sprachcode ist Ländercode eines Landes, dessen Name nichts mit dem Sprachnamen zu tun hat.

Aufbau der Norm ISO 639

Codes zur Abkürzung der Namen von Sprachen sind in der Norm ISO 639 geregelt. Es gibt dabei

zweibuchstabige Kürzel gemäß der Norm ISO 639-1 und
dreibuchstabige Kürzel gemäß den Normen ISO 639-2/T, ISO 639-2/B, ISO 639-3 und ISO 639-5.

Diese zwei- und dreibuchstabigen Sprachcodes dürfen nicht mit den Ländercodes nach ISO 3166 verwechselt werden. Zwar stimmen sie öfters überein, wenn eine Sprache nach einem Land benannt ist, genausooft aber auch nicht (siehe Tabelle rechts). Man begegnet beispielsweise den Ländercodes am Ende von Domainnamen im Internet, dagegen den Sprachcodes am Anfang der Domainnamen der Wikipedia: so ist also etwa ar.wikipedia.org mitnichten die argentinische, sondern die arabischsprachige Wikipedia.

Die dreibuchstabigen Kürzel einzelner Sprachen sind in ISO 639-3 genormt, die von ganzen Sprachfamilien in ISO 639-5. Die beiden ISO 639-2 sind älter und haben keine eigenständige Bedeutung mehr. (ISO 639-2/T enthält nur einen kleinen Teil der Kürzel aus ISO 639-3 und ISO 639-5. ISO 639-2/B enthält dieselben Sprachen wie ISO 639-2/T, jedoch mit einigen Abweichungen, um Kompatibilität mit auf englischen Sprachbezeichnungen beruhenden Kürzeln herzustellen, wie sie im Bibliothekswesen verwendet wurden: unter anderem [chi] statt [zho] für Chinesisch, [cze] statt [ces] für Tschechisch, [dut] statt [nld] für Niederländisch, [fre] statt [fra] für Französisch, [ger] statt [deu] für Deutsch, [gre] statt [ell] für Neugriechisch und [per] statt [fas] für Persisch.)

Die abweichenden dreibuchstabigen Kürzel nach ISO 639-2/B kommen in den anderen Normteilen nicht vor. Ein Kürzel bezeichnet also eine Sprache oder Sprachfamilie immer eindeutig, und eine Sprache oder Sprachfamilie hat nur ein dreibuchstabiges Kürzel über alle Normteile außer ISO 639-2/B hinweg.

Die Norm hat zunächst die zweibuchstabigen Codes enthalten. Später sind die dreibuchstabigen hinzugefügt worden, um mehr Sprachen mit einem Sprachcode versehen zu können, besonders seitdem man das Ziel hat, mehr oder wenige alle Sprachen zu erfassen. In der Praxis, etwa beim Übersetzen von Webseiten oder Gebrauchsanweisungen in ein paar zusätzliche Sprachen, kommt aber man fast immer mit den zweibuchstabigen aus, die zudem viel bekannter sind.

Sprachfamilien, Makro- und Einzelsprachen, Dialekte

Sprachfamilien und Sprachen (Auswahl)
ISO 639-
-1	-3	-2	-5
		ine		Indogermanisch
		roa		Romanisch
		sla		Slawisch
		cel		Keltisch
		gem		Germanisch
			gmq	Nordgermanisch
no	nor			Norwegisch
nn	nno			Nynorsk
nb	nob			Bokmål
			gmw	Westgermanisch
de	deu			Deutsch
	gsw			Schweizerdeutsch
	bar			Bairisch
	sxu			(Ober-)Sächsisch
	nds			Niederdeutsch

Wie schon erwähnt, enthält ISO 639-5 Sprachfamilien und ISO 639-3 einzelne Sprachen, und aus beidem können Sprachcodes auch in ISO 639-2 enthalten sein. Für die möglichen Kombinationen enthält die nebenstehende Tabelle Beispiele.

Eine Zwitterstellung nimmt dort die norwegische Sprache ein: sie enthält zwei einzelne Sprachen, nämlich die beiden Standardvarianten des Norwegischen, wird aber im Rahmen der Norm wie eine Sprache und nicht wie eine Sprachfamilie behandelt. Das wird für solche nahe verwandten Sprachen gemacht, bei denen für viele praktischen Belange der Unterschied keine Rolle spielt, obwohl er groß genug ist, dass man die Sprachen in anderen Zusammenhängen unterscheiden will und ihnen daher getrennte Sprachcodes gibt. Solche Zusammenfassungen von mehreren Sprachen zu einer heißt in der Norm Makrosprache. Man möchte die Makrosprachen unter den Sprachen haben, weil man sich oft nur dafür interessiert, ob ein Text in einer bestimmten Sprache vorliegt, und nicht unbedingt, in welcher Variante davon. Das wird auch daran deutlich, dass die zweibuchstabigen Kürzel nach ISO 639-1, die die ursprüngliche eher grobe Einteilung in deutlich verschiedene Sprachen darstellen, sehr häufig entweder Makrosprachen oder solche Einzelsprachen bezeichnen, die nicht in einer Makrosprache enthalten sind, aber praktisch nie ganze Sprachfamilien und nur ganz ausnahmsweise Einzelsprachen aus Makrosprachen (nämlich die beiden norwegischen, das Indonesische und die Nachfolgersprachen des Serbokroatischen). Am letztgenannten Beispiel sieht man, dass manchmal ethnische und politische Empfindlichkeiten eine Rolle gespielt haben, wenn etwa Volksgruppen darauf Wert legen, dass ihre Sprache nicht weniger Standard ist als die des Nachbarvolks oder dass sie von der des Nachbarvolks so verschieden ist, dass sie einen eigenen Sprachcode haben muss.

Das Konzept der Makrosprachen (siehe den Artikel „Scope of denotation for language identifiers“) wird häufig kritisiert, weil die Anwendung unscharf definiert ist und auch uneinheitlich gehandhabt wird. Diese Inkonsequenz ergibt sich zum Teil daraus, dass die Bedürfnisse einer linguistischen Taxonomie eben andere sind als die einer praktischen Liste von Sprachen, die nicht nur nach linguistischen, sondern auch nach politischen Kriterien und nach dem Empfinden der Sprecher selbst verschiedene oder gleiche Sprachen sind.

Dialekte sind nicht Gegenstand der Norm. Sie von Einzelsprachen abzugrenzen, gelingt jedoch nicht immer. Deutsche Dialekte vertreten das Deutsche nicht (ein Text in Schweizerdeutsch wird nicht als deutscher Text empfunden); deswegen wird das Deutsche auch nicht als Makrosprache geführt, und die deutschen Dialekte erscheinen entweder als eigene Sprachen oder gar nicht. Die Auswahl zwischen diesen beiden Vorgehensweisen wirkt ziemlich zufällig und ist nicht geeignet, die deutschen Dialekte insgesamt zu erfassen.

Manche Kürzel für Sprachfamilien haben ihre Bedeutung verändert, seitdem der Versuch unternommen wird, allen Sprachen einen Sprachcode zuzuweisen. So hat früher [smi] andere, also sonst nicht erfasste, Samisprachen bedeutet, heute aber die Gesamtheit der Samisprachen. Dieser Bedeutungswandel ist nicht überall in gleicher Weise vollzogen worden.

Alte Sprachen

Unter den Einzelsprachen in der Norm ISO 639-3, teilweise zusätzlich auch in ISO 639-2 oder ISO 639-1 enthalten, finden sich auch eine Reihe alter Sprachen, die je nach ihrem Alter und ihrer literarischen Bedeutung als alt (ancient), historisch (historic) oder ausgestorben (extinct) eingestuft werden, wobei diese Unterscheidung in der Praxis der Normanwendung keine Rolle spielt. Der untere Teil der Tabelle am rechten Rand enthält ein paar Beispiele.

Es gibt dabei einen Trend zur immer feineren Unterteilung, der die Bedeutung eines Kürzels nachträglich einschränken kann. So bezeichnete [arc] früher jede aramäische Sprache, heute nur noch eine von fünf Sprachen aus verschiedenen Epochen.

ISO 639: Kürzel für Namen von Sprachen

Aufbau der Norm ISO 639

Links zum Thema

Sprachfamilien, Makro- und Einzelsprachen, Dialekte

Alte Sprachen

Artikel	ISO 639: Kürzel für Namen von Sprachen
Verfasser	Helmut Richter
erstellt / geändert	2004-08-25 / 2015-11-06
Artikel-URL	https://hhr-m.de/iso639/
enthält	gesamten Artikel