Codes for the representation of names of languages

ISO 639-4:2010 gives the general principles of language coding using the codes that are specified in the other parts of ISO 639 and their combination with other codes. It also lays down guidelines for the use of any combination of the parts of ISO 639. The terminology and general descriptions of ISO 639-4 are intended to replace corresponding text of other parts of ISO 639 as relevant in future revisions. Relevant metadata for the description of linguistic entities are given, as a framework for databases of linguistic data to support the ISO 639 series.

Codes pour la représentation des noms de langue

L'ISO 639-4:2010 fournit les principes généraux de codage des langues ŕ l'aide des codes spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d'autres codes. De plus, elle établit des rčgles d'utilisation de n'importe quelle combinaison des parties de l'ISO 639. La terminologie et les descriptions générales de l'ISO 639-4:2010 sont destinées ŕ remplacer le texte correspondant des autres parties de l'ISO 639, selon le cas, dans de futures révisions. Les métadonnées pertinentes pour la description des entités linguistiques sont également fournies et servent de cadre de travail pour les bases de données linguistiques qui accompagnent la série de Normes internationales ISO 639.

Kode za predstavljanje imen jezikov - 4. del: Splošna načela kodiranja predstavitve imen jezikov in sorodnih entitet ter smernice za uporabo

Ta del ISO 639 podaja splošna načela kodiranja jezikov z uporabo kod, ki so določene v drugih delih ISO 639, ter njihovih kombinacij z drugimi kodami. Poleg tega ta del ISO 639 določa smernice za uporabo katere koli kombinacije delov ISO 639. Terminologija in splošni opisi tega dela ISO 639 so namenjeni temu, da primerno nadomestijo ustrezno besedilo drugih delov ISO 639 za prihodnje revizije. Prav tako so podani pomembni metapodatki za opis lingvističnih entitet kot okvir za podatkovne zbirke lingvističnih podatkov v podporo seriji mednarodnih standardov ISO 639.

General Information

Status
Published
Publication Date
15-Jul-2010
Current Stage
6060 - International Standard published
Start Date
08-Jan-2010
Completion Date
16-Jul-2010

Buy Standard

Standard
ISO 639-4:2010 - Codes for the representation of names of languages
English language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 639-4:2010
English language
33 pages
sale 10% off
Preview
sale 10% off
Preview

e-Library read for
1 day
Standard
ISO 639-4:2010 - Codes pour la représentation des noms de langue
French language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 639-4:2010 - Codes pour la représentation des noms de langue
French language
28 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (sample)

INTERNATIONAL ISO
STANDARD 639-4
First edition
2010-07-15
Codes for the representation of names of
languages —
Part 4:
General principles of coding of the
representation of names of languages
and related entities, and application
guidelines
Codes pour la représentation des noms de langue —
Partie 4: Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour la mise
en œuvre
Reference number
ISO 639-4:2010(E)
ISO 2010
---------------------- Page: 1 ----------------------
ISO 639-4:2010(E)
PDF disclaimer

This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but

shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In

downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat

accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.

Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation

parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In

the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.

COPYRIGHT PROTECTED DOCUMENT
© ISO 2010

All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,

electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or

ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2010 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 639-4:2010(E)
Contents Page

Foreword ............................................................................................................................................................iv

Introduction.........................................................................................................................................................v

1 Scope......................................................................................................................................................1

2 Normative references............................................................................................................................1

3 Terms and definitions ...........................................................................................................................2

4 Fundamental concepts of language coding .......................................................................................5

4.1 Language identifiers and languages...................................................................................................5

4.2 Individual languages .............................................................................................................................6

4.3 Macrolanguages ....................................................................................................................................6

4.4 Linguistic norm......................................................................................................................................7

4.5 Dialects...................................................................................................................................................7

4.6 Collective language code elements and language groups...............................................................7

4.7 Extinct, ancient and historic languages..............................................................................................8

4.8 Artificial languages ...............................................................................................................................8

4.9 Writing systems and scripts.................................................................................................................8

5 Relationship between the parts of ISO 639.........................................................................................8

5.1 Parts of ISO 639 .....................................................................................................................................8

5.2 ISO 639 as one code space ..................................................................................................................8

5.3 Principles................................................................................................................................................9

5.4 Common maintenance and language coding database ....................................................................9

6 Implementation issues..........................................................................................................................9

6.1 Applications ...........................................................................................................................................9

6.2 Subsets of the code table...................................................................................................................10

6.3 Language groups ................................................................................................................................10

7 Combining language identifiers with other standards and codes .................................................11

7.1 Combining ISO 639 with ISO 3166 .....................................................................................................11

7.2 Combining ISO 639 with ISO 19111 and ISO 19112 .........................................................................11

7.3 Combining ISO 639 with ISO 15924 ...................................................................................................12

7.4 Other code combinations ...................................................................................................................12

7.5 Formats of combined identifiers........................................................................................................12

8 Language description format (LDF) ..................................................................................................13

8.1 Compatibilities between the ISO 639 model and ISO 12620 ...........................................................13

8.1.1 General .................................................................................................................................................13

8.1.2 Identification ........................................................................................................................................15

8.1.3 Description of an ISO 639 language identifier..................................................................................16

8.2 Extensions to ISO 12620 for ISO 639 LDF.........................................................................................20

8.2.1 Representation ....................................................................................................................................20

8.2.2 Documentation ....................................................................................................................................21

8.3 Language information.........................................................................................................................23

Annex A (informative) Overall steering of ISO 639........................................................................................26

Bibliography......................................................................................................................................................28

© ISO 2010 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO 639-4:2010(E)
Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies

(ISO member bodies). The work of preparing International Standards is normally carried out through ISO

technical committees. Each member body interested in a subject for which a technical committee has been

established has the right to be represented on that committee. International organizations, governmental and

non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the

International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.

International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.

The main task of technical committees is to prepare International Standards. Draft International Standards

adopted by the technical committees are circulated to the member bodies for voting. Publication as an

International Standard requires approval by at least 75 % of the member bodies casting a vote.

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent

rights. ISO shall not be held responsible for identifying any or all such patent rights.

ISO 639-4 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content

resources, Subcommittee SC 2, Terminographical and lexicographical working methods.

ISO 639 consists of the following parts, under the general title Codes for the representation of names of

languages:
⎯ Part 1: Alpha-2 code
⎯ Part 2: Alpha-3 code
⎯ Part 3: Alpha-3 code for comprehensive coverage of languages

⎯ Part 4: General principles of coding of the representation of names of languages and related entities, and

application guidelines
⎯ Part 5: Alpha-3 code for language families and groups
⎯ Part 6: Alpha-4 code for comprehensive coverage of language variants
iv © ISO 2010 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 639-4:2010(E)
Introduction

ISO 639 provides codes for the identification and specification of individual languages, language variants, and

language groups. The identifiers may be used in a variety of applications, including specification of the

language used in a text, the language of terms or words in a dictionary or terminological database, the

language used in a spoken presentation, language proficiency, language capabilities of software, localization,

etc. The various parts of ISO 639 are expected to be implemented in a number of environments.

Parts 1, 2, 3, and 5 of ISO 639 all contain some information about implementation issues. However, it is

deemed necessary to expand those descriptions, and to have the implementation rules in a separate

document. In future revisions of the other parts of ISO 639, it is expected that those standards will reference

this part of ISO 639 rather than duplicating the information.
© ISO 2010 – All rights reserved v
---------------------- Page: 5 ----------------------
INTERNATIONAL STANDARD ISO 639-4:2010(E)
Codes for the representation of names of languages —
Part 4:
General principles of coding of the representation of names of
languages and related entities, and application guidelines
1 Scope

This part of ISO 639 gives the general principles of language coding using the codes that are specified in the

other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down

guidelines for the use of any combination of the parts of ISO 639.

The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of

other parts of ISO 639 as relevant in future revisions.

Relevant metadata for the description of linguistic entities are also given, as a framework for databases of

linguistic data to support the ISO 639 series of International Standards.
2 Normative references

The following referenced documents are indispensable for the application of this document. For dated

references, only the edition cited applies. For undated references, the latest edition of the referenced

document (including any amendments) applies.

ISO 639-1:2002, Codes for the representation of names of languages — Part 1: Alpha-2 code

ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code

ISO 639-3:2007, Codes for the representation of names of languages — Part 3: Alpha-3 code for

comprehensive coverage of languages

ISO 639-5:2008, Codes for the representation of names of languages — Part 5: Alpha-3 code for language

families and groups

ISO 3166-1:2006, Codes for the representation of names of countries and their subdivisions — Part 1:

Country codes

ISO 3166-2:2007, Codes for the representation of names of countries and their subdivisions — Part 2:

Country subdivision code

ISO 3166-3:1999, Codes for the representation of names of countries and their subdivisions — Part 3: Code

for formerly used names of countries

ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of

dates and times

ISO/IEC 11179-1:2004, Information technology — Metadata registries (MDR) — Part 1: Framework

© ISO 2010 – All rights reserved 1
---------------------- Page: 6 ----------------------
ISO 639-4:2010(E)

ISO/IEC 11179-2:2005, Information technology — Metadata registries (MDR) — Part 2: Classification

ISO/IEC 11179-3:2003, Information technology — Metadata registries (MDR) — Part 3: Registry metamodel

and basic attributes

ISO/IEC 11179-4:2004, Information technology — Metadata registries (MDR) — Part 4: Formulation of data

definitions

ISO/IEC 11179-5:2005, Information technology — Metadata registries (MDR) — Part 5: Naming and

identification principles

ISO/IEC 11179-6:2005, Information technology — Metadata registries (MDR) — Part 6: Registration

ISO 12620:2009, Terminology and other language and content resources — Specification of data categories

and management of a Data Category Registry for language resources

ISO 15924:2004, Information and documentation — Codes for the representation of names of scripts

ISO 19111:2007, Geographic information — Spatial referencing by coordinates

ISO 19112:2003, Geographic information — Spatial referencing by geographic identifiers

3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.

In future versions of other parts of ISO 639, it is expected that some or all of the terms and definitions will be

replaced by a reference to the terms and definitions in this part of ISO 639.

NOTE The definitions in this part of ISO 639 are intended for practical use within the context of the various parts of

ISO 639 and their applications. For various linguistic purposes, there are needs for more detailed, and possibly deviating,

definitions.
3.1
code

data transformed or represented in different forms according to a pre-established set of rules

NOTE The usage of the term “code” is not uniform in all standardized coding systems. According to the usage that is

defined in this part of ISO 639, a “code” is to be understood as a code table (3.2) and the set of rules relating to the code

table. Each individual row in a code table is a code element (3.4) (e.g. “de - German - allemand - Deutsch” in Part 1 of

ISO 639), while the item “de” is the language identifier (3.5).
3.2
code table
table of code elements (3.4) as part of a code (3.1)
3.3
code space
totality of possible values for a set of identifiers within a code (3.1)

EXAMPLE All sequences of two letters (a–z) form the code space of the alpha-2 language code as specified in

part 1 of ISO 639.

NOTE The alpha-3 language codes that are specified in parts 2, 3, and 5 of ISO 639 share the same code space, i.e.

no language identifier assigned in one of the parts may be assigned to a different item in another part.

2 © ISO 2010 – All rights reserved
---------------------- Page: 7 ----------------------
ISO 639-4:2010(E)
3.4
code element
individual entry in a code (3.1)

NOTE In the language codes of ISO 639, each code element consists of a language identifier and the names of the

language.
3.5
language identifier
language symbol

string of characters assigned to a linguistic entity for the purpose of uniquely representing it

NOTE 1 In the language codes of Parts 1, 2, 3, and 5 of ISO 639, each language identifier is composed of two or three

letters.
NOTE 2 See 4.1.
3.6
language

systematic use of sounds, characters, symbols or signs to express or communicate meaning or a message

between humans

NOTE 1 This definition is intended to serve as a working definition for the purpose of the ISO 639 series of

International Standards, not as a universal definition of this concept.
NOTE 2 See also 4.1 and 4.2.
3.7
individual language
language (3.6) that is distinctly different from another language
NOTE See 4.2.
3.8
dialect

language variant (3.14) specific to a geographical region or a group of language users

NOTE See 4.5.
3.9
macrolanguage

language (3.6) that for some purpose may be subdivided into two or more individual languages (3.7)

NOTE See 4.3.
3.10
language group

two or more individual languages (3.7) that for a specific purpose may suitably be treated as a unit

NOTE See 4.6.
3.11
language family

two or more individual languages (3.7) that are related to each other through having common ancestry

NOTE In exceptional cases, a language family may have only one individual language as a member.

© ISO 2010 – All rights reserved 3
---------------------- Page: 8 ----------------------
ISO 639-4:2010(E)
3.12
remainder group
language group (3.10) with the explicit exclusion of specified languages
NOTE See 4.6.
3.13
language variation
continuous variation within and between individual languages (3.7)

NOTE Language variation is seen and may be described as variation over time, space, cultural affiliation, etc.

3.14
language variant
variant of an individual language (3.7) that may be identified and named
3.15
standard variant
language variant (3.14) with a high degree of status and normalization

NOTE A standard variant of a language may typically be used in official or public communication and in

communication between users of different language variants.
3.16
writing system

system for writing a language (3.6), including the script (3.17) and character set used

NOTE See also 4.9.
3.17
script

set of graphic characters used for the written form of one or more languages (3.6)

[ISO 15924:2004 and ISO/IEC 10646:2003]
NOTE See also 4.9.
3.18
orthography

set of rules for accepted spelling of words and text in one or more languages (3.6)

3.19
transcription

system for representing text in a different script (3.17) than that in which the text was originally represented

NOTE The resulting text is also referred to as a “transcription”.
3.20
transliteration

transcription (3.19) that enables the reconstruction of the original script (3.17) without any loss of

information about graphic characters
NOTE The resulting text is also referred to as a “transliteration”.
3.21
written language

individual language (3.7) or language variant (3.14) that is commonly represented in writing with a relatively

normalized orthography (3.18)
4 © ISO 2010 – All rights reserved
---------------------- Page: 9 ----------------------
ISO 639-4:2010(E)
3.22
spoken language

individual language (3.7) or language variant (3.14) that is represented in spoken form

NOTE Any spoken language may be represented in writing using a phonetic writing system, where characters

represent sounds (phones or phonemes) directly.
3.23
living language

individual language (3.7) or language variant (3.14) in present-day use, in particular as a spoken

language (3.22)
3.24
extinct language

individual language (3.7) or language variant (3.14) that is no longer in use and that has no present-day

descendant
NOTE See 4.7.
3.25
ancient language

extinct language (3.24) with a distinct literature and special status in the scholarly community

NOTE See 4.7.
3.26
historical language

known earlier historical stage of a living language (3.23) or an extinct language (3.24)

EXAMPLE “Old English” and “Middle English” as historical stages of “English”.
NOTE See 4.7.
3.27
natural language
language (3.6) for human communication that is not an artificial language (3.28)
3.28
artificial language
language (3.6) for human communication that has been artificially devised
NOTE See also 4.8.
4 Fundamental concepts of language coding
4.1 Language identifiers and languages

Language identifiers are composed of the following 26 letters of the Latin alphabet in lower case: a, b, c, d, e, f,

g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. No diacritical marks or modified characters are used.

A language identifier represents a language, which may also be represented by one or more language names.

The objects of identification are languages themselves; language names are the means by which the

languages denoted by language identifiers are designated.

Languages are not static objects every instantiation of which is identical to every other. Every language

corresponds to some range of variation in linguistic expression. In ISO 639, a language identifier denotes

some range of language variation. The range of variation that is denoted can have three different scopes:

individual language, macrolanguage or language group. Also, languages that are represented can be of

© ISO 2010 – All rights reserved 5
---------------------- Page: 10 ----------------------
ISO 639-4:2010(E)

various types: living languages, ancient languages, artificially constructed languages, etc. The following

provides further explanation regarding assignment of identifiers for different scopes or to different types of

languages in ISO 639.
4.2 Individual languages

Identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to denote distinct individual languages, unless the

language name explicitly refers to a language group.

There is no one definition of a “language” that is agreed upon by all and appropriate for all purposes. As a

result, there can be disagreement, even among speakers of the language or experts in linguistics, as to

whether two variants represent dialects of a single language or two distinct languages. For ISO 639,

judgments regarding when two variants are considered to be the same or different languages are based on a

number of factors, including linguistic similarity, intelligibility, a common literature, the views of speakers

concerning the relationship between language and identity, and other factors. The following basic criteria are

followed.

⎯ Two related variants are normally considered variants of the same language if speakers of each variant

have inherent understanding of the other variant (that is, can understand based on knowledge of their

own variant without needing to learn the other variant) at a functional level.

⎯ Where spoken intelligibility between variants is marginal, the existence of a common literature or of a

common ethnolinguistic identity with a central variant that both understand can be strong indicators that

they should nevertheless be considered variants of the same language.

⎯ Where there is enough intelligibility between variants to enable communication, the existence of well-

established distinct ethnolinguistic identities can be a strong indicator that they should nevertheless be

considered to be different languages.

Some of the distinctions made on this basis may not be considered appropriate by some users or for certain

applications. However, these basic criteria are thought to best fit the intended range of applications.

4.3 Macrolanguages

Parts 1 and 2 of ISO 639 include identifiers that correspond in a one-to-many manner with individual language

identifiers in Part 3 of ISO 639. For instance, Part 3 of ISO 639 contains over 30 identifiers designated as

individual language identifiers for distinct variants of Arabic, while Parts 1 and 2 each contain only one

identifier for Arabic, “ar” and “ara” respectively, which are designated as individual language identifiers in

those parts of ISO 639. It is assumed here that the single identifiers for Arabic in Parts 1 and 2 of ISO 639

correspond to the many identifiers collectively for distinct variants of Arabic in Part 3 of ISO 639.

In this example, it may appear that the single identifiers in Parts 1 and 2 of ISO 639 should be designated as

collective language identifiers. That is not assumed, however. In various parts of the world, there are clusters

of closely-related language variants that, based on the criteria discussed in 4.2, can be considered individual

languages, yet in certain usage contexts a single language identity for all is needed. Typical situations in

which this need can occur include the following.

⎯ There is one variant that is more developed and that tends to be used for wider communication by

speakers of various closely-related languages; as a result, there is a perceived common linguistic identity

across these languages. For instance, there are several distinct spoken Arabic languages, but Standard

Arabic is generally used in business and media across all of these communities, and is also an important

aspect of a shared ethno-religious unity. As a result, a perceived common linguistic identity exists.

⎯ There is a common written form used for multiple closely-related languages. For instance, multiple

Chinese languages share a common written form.
6 © ISO 2010 – All rights reserved
---------------------- Page: 11 ----------------------
ISO 639-4:2010(E)

⎯ There is a transitional sociolinguistic situation in which sub-communities of a single language community

are diverging, creating a need for some purposes to recognise distinct languages while, for other

purposes, a single common identity is still valid. For instance, in some business contexts it is necessary

to make a distinction between the languages Bosnian, Croatian, and Serbian; yet there are other contexts

in which these distinctions are not discernable in language resources that are in use.

Where such situations exist, an identifier for the single, common language identity is considered to be a

macrolanguage identifier.

Macrolanguages are distinguished from language groups in that the individual languages that correspond to a

macrolanguage must be very closely related, and there must be some domain in which only a single language

identity is recognized.
4.4 Linguistic norm

Some linguistic forms are “normalized” or “standardized” by official or private bodies like academies or

language councils. This normalization may be applied to any elements: orthography, morphology, syntax,

semantics, phonology, etc. The degree of normalization varies greatly from one language to another.

Languages or forms of languages may be considered to have some sort of official status within countries or

regions. Language status may be established through acts of parliament or through other formal procedures,

giving a language status as “national language”, “official language”, “regional language”, etc.

4.5 Dialects

The linguistic variants denoted by each of the identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to be

distinct languages and not dialects of other languages, even though for some purposes some users may

consider a variant listed in Part 1 or 2, or in particular Part 3 of ISO 639 to be a “dialect” rather than a

“language” (see 4.2 and 4.3). In ISO 639, the term dialect is used as in the field of linguistics where it identifies

any sub-variant of a language such as might be based on geographic region, age, gender, social class, time

period, etc.

The dialects of a language are included within the denotation represented by the identifier for that language.

Thus, each language identifier represents the complete range of all the spoken or written variants of that

language, including any standardized form.

For applications in which it is necessary to identify dialects, a separate standard may be developed that

provides identifiers for dialects, or that combines identifiers from ISO 639 with other distinguishing

identificational qualifiers.
4.6 Collective language code elements and language groups

Part 2 of ISO 639 includes alpha-3 identifiers for collections of languages, and Part 5 is especially dedicated

to language groups and language families. Parts 1 and 3 provide identifiers for individual languages and

macrolanguages only.

Some of the code elements in Part 2 specify remainder groups. These items have the word “other” in their

English names (and “autres” in their French names). The same alpha-3 identifiers are included in Part 5 of

ISO 639 denoting the language group or family as a whole. For applications using Part 2 only, the remainder

group identifiers shall be used for languages that belong to the language group or family in question, but that

do not have an individual-language identifier in Part 2. Applications using Parts 2 and 5 and applications using

Parts 2 and 3 and 5 shall use the collective language code elements in the sense specified in Part 5, allowing

for hierarchies of language identifiers.
© ISO 2010 – All rights reserved 7
---------------------- Page: 12 ----------------------
ISO 639-4:2010(E)
4.7 Extinct, ancient and historic languages
ISO 639 includes
...

SLOVENSKI STANDARD
SIST ISO 639-4:2010
01-november-2010

.RGH]DSUHGVWDYOMDQMHLPHQMH]LNRYGHO6SORãQDQDþHODNRGLUDQMDSUHGVWDYLWYH

LPHQMH]LNRYLQVRURGQLKHQWLWHWWHUVPHUQLFH]DXSRUDER

Codes for the representation of names of languages - Part 4: General principles of

coding of the representation of names of languages and related entities, and application

guidelines

Codes pour la représentation des noms de langue - Partie 4: Principes généraux pour le

codage de la représentation des noms de langue et d'entités connexes, et lignes
directrices pour la mise en oeuvre
Ta slovenski standard je istoveten z: ISO 639-4:2010
ICS:
01.140.20 Informacijske vede Information sciences
SIST ISO 639-4:2010 en,fr

2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

---------------------- Page: 1 ----------------------
SIST ISO 639-4:2010
---------------------- Page: 2 ----------------------
SIST ISO 639-4:2010
INTERNATIONAL ISO
STANDARD 639-4
First edition
2010-07-15
Codes for the representation of names of
languages —
Part 4:
General principles of coding of the
representation of names of languages
and related entities, and application
guidelines
Codes pour la représentation des noms de langue —
Partie 4: Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour la mise
en œuvre
Reference number
ISO 639-4:2010(E)
ISO 2010
---------------------- Page: 3 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
PDF disclaimer

This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but

shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In

downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat

accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.

Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation

parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In

the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.

COPYRIGHT PROTECTED DOCUMENT
© ISO 2010

All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,

electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or

ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2010 – All rights reserved
---------------------- Page: 4 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
Contents Page

Foreword ............................................................................................................................................................iv

Introduction.........................................................................................................................................................v

1 Scope......................................................................................................................................................1

2 Normative references............................................................................................................................1

3 Terms and definitions ...........................................................................................................................2

4 Fundamental concepts of language coding .......................................................................................5

4.1 Language identifiers and languages...................................................................................................5

4.2 Individual languages .............................................................................................................................6

4.3 Macrolanguages ....................................................................................................................................6

4.4 Linguistic norm......................................................................................................................................7

4.5 Dialects...................................................................................................................................................7

4.6 Collective language code elements and language groups...............................................................7

4.7 Extinct, ancient and historic languages..............................................................................................8

4.8 Artificial languages ...............................................................................................................................8

4.9 Writing systems and scripts.................................................................................................................8

5 Relationship between the parts of ISO 639.........................................................................................8

5.1 Parts of ISO 639 .....................................................................................................................................8

5.2 ISO 639 as one code space ..................................................................................................................8

5.3 Principles................................................................................................................................................9

5.4 Common maintenance and language coding database ....................................................................9

6 Implementation issues..........................................................................................................................9

6.1 Applications ...........................................................................................................................................9

6.2 Subsets of the code table...................................................................................................................10

6.3 Language groups ................................................................................................................................10

7 Combining language identifiers with other standards and codes .................................................11

7.1 Combining ISO 639 with ISO 3166 .....................................................................................................11

7.2 Combining ISO 639 with ISO 19111 and ISO 19112 .........................................................................11

7.3 Combining ISO 639 with ISO 15924 ...................................................................................................12

7.4 Other code combinations ...................................................................................................................12

7.5 Formats of combined identifiers........................................................................................................12

8 Language description format (LDF) ..................................................................................................13

8.1 Compatibilities between the ISO 639 model and ISO 12620 ...........................................................13

8.1.1 General .................................................................................................................................................13

8.1.2 Identification ........................................................................................................................................15

8.1.3 Description of an ISO 639 language identifier..................................................................................16

8.2 Extensions to ISO 12620 for ISO 639 LDF.........................................................................................20

8.2.1 Representation ....................................................................................................................................20

8.2.2 Documentation ....................................................................................................................................21

8.3 Language information.........................................................................................................................23

Annex A (informative) Overall steering of ISO 639........................................................................................26

Bibliography......................................................................................................................................................28

© ISO 2010 – All rights reserved iii
---------------------- Page: 5 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies

(ISO member bodies). The work of preparing International Standards is normally carried out through ISO

technical committees. Each member body interested in a subject for which a technical committee has been

established has the right to be represented on that committee. International organizations, governmental and

non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the

International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.

International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.

The main task of technical committees is to prepare International Standards. Draft International Standards

adopted by the technical committees are circulated to the member bodies for voting. Publication as an

International Standard requires approval by at least 75 % of the member bodies casting a vote.

Attention is drawn to the possibility that some of the elements of this document may be the subject of patent

rights. ISO shall not be held responsible for identifying any or all such patent rights.

ISO 639-4 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content

resources, Subcommittee SC 2, Terminographical and lexicographical working methods.

ISO 639 consists of the following parts, under the general title Codes for the representation of names of

languages:
⎯ Part 1: Alpha-2 code
⎯ Part 2: Alpha-3 code
⎯ Part 3: Alpha-3 code for comprehensive coverage of languages

⎯ Part 4: General principles of coding of the representation of names of languages and related entities, and

application guidelines
⎯ Part 5: Alpha-3 code for language families and groups
⎯ Part 6: Alpha-4 code for comprehensive coverage of language variants
iv © ISO 2010 – All rights reserved
---------------------- Page: 6 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
Introduction

ISO 639 provides codes for the identification and specification of individual languages, language variants, and

language groups. The identifiers may be used in a variety of applications, including specification of the

language used in a text, the language of terms or words in a dictionary or terminological database, the

language used in a spoken presentation, language proficiency, language capabilities of software, localization,

etc. The various parts of ISO 639 are expected to be implemented in a number of environments.

Parts 1, 2, 3, and 5 of ISO 639 all contain some information about implementation issues. However, it is

deemed necessary to expand those descriptions, and to have the implementation rules in a separate

document. In future revisions of the other parts of ISO 639, it is expected that those standards will reference

this part of ISO 639 rather than duplicating the information.
© ISO 2010 – All rights reserved v
---------------------- Page: 7 ----------------------
SIST ISO 639-4:2010
---------------------- Page: 8 ----------------------
SIST ISO 639-4:2010
INTERNATIONAL STANDARD ISO 639-4:2010(E)
Codes for the representation of names of languages —
Part 4:
General principles of coding of the representation of names of
languages and related entities, and application guidelines
1 Scope

This part of ISO 639 gives the general principles of language coding using the codes that are specified in the

other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down

guidelines for the use of any combination of the parts of ISO 639.

The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of

other parts of ISO 639 as relevant in future revisions.

Relevant metadata for the description of linguistic entities are also given, as a framework for databases of

linguistic data to support the ISO 639 series of International Standards.
2 Normative references

The following referenced documents are indispensable for the application of this document. For dated

references, only the edition cited applies. For undated references, the latest edition of the referenced

document (including any amendments) applies.

ISO 639-1:2002, Codes for the representation of names of languages — Part 1: Alpha-2 code

ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code

ISO 639-3:2007, Codes for the representation of names of languages — Part 3: Alpha-3 code for

comprehensive coverage of languages

ISO 639-5:2008, Codes for the representation of names of languages — Part 5: Alpha-3 code for language

families and groups

ISO 3166-1:2006, Codes for the representation of names of countries and their subdivisions — Part 1:

Country codes

ISO 3166-2:2007, Codes for the representation of names of countries and their subdivisions — Part 2:

Country subdivision code

ISO 3166-3:1999, Codes for the representation of names of countries and their subdivisions — Part 3: Code

for formerly used names of countries

ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of

dates and times

ISO/IEC 11179-1:2004, Information technology — Metadata registries (MDR) — Part 1: Framework

© ISO 2010 – All rights reserved 1
---------------------- Page: 9 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)

ISO/IEC 11179-2:2005, Information technology — Metadata registries (MDR) — Part 2: Classification

ISO/IEC 11179-3:2003, Information technology — Metadata registries (MDR) — Part 3: Registry metamodel

and basic attributes

ISO/IEC 11179-4:2004, Information technology — Metadata registries (MDR) — Part 4: Formulation of data

definitions

ISO/IEC 11179-5:2005, Information technology — Metadata registries (MDR) — Part 5: Naming and

identification principles

ISO/IEC 11179-6:2005, Information technology — Metadata registries (MDR) — Part 6: Registration

ISO 12620:2009, Terminology and other language and content resources — Specification of data categories

and management of a Data Category Registry for language resources

ISO 15924:2004, Information and documentation — Codes for the representation of names of scripts

ISO 19111:2007, Geographic information — Spatial referencing by coordinates

ISO 19112:2003, Geographic information — Spatial referencing by geographic identifiers

3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.

In future versions of other parts of ISO 639, it is expected that some or all of the terms and definitions will be

replaced by a reference to the terms and definitions in this part of ISO 639.

NOTE The definitions in this part of ISO 639 are intended for practical use within the context of the various parts of

ISO 639 and their applications. For various linguistic purposes, there are needs for more detailed, and possibly deviating,

definitions.
3.1
code

data transformed or represented in different forms according to a pre-established set of rules

NOTE The usage of the term “code” is not uniform in all standardized coding systems. According to the usage that is

defined in this part of ISO 639, a “code” is to be understood as a code table (3.2) and the set of rules relating to the code

table. Each individual row in a code table is a code element (3.4) (e.g. “de - German - allemand - Deutsch” in Part 1 of

ISO 639), while the item “de” is the language identifier (3.5).
3.2
code table
table of code elements (3.4) as part of a code (3.1)
3.3
code space
totality of possible values for a set of identifiers within a code (3.1)

EXAMPLE All sequences of two letters (a–z) form the code space of the alpha-2 language code as specified in

part 1 of ISO 639.

NOTE The alpha-3 language codes that are specified in parts 2, 3, and 5 of ISO 639 share the same code space, i.e.

no language identifier assigned in one of the parts may be assigned to a different item in another part.

2 © ISO 2010 – All rights reserved
---------------------- Page: 10 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
3.4
code element
individual entry in a code (3.1)

NOTE In the language codes of ISO 639, each code element consists of a language identifier and the names of the

language.
3.5
language identifier
language symbol

string of characters assigned to a linguistic entity for the purpose of uniquely representing it

NOTE 1 In the language codes of Parts 1, 2, 3, and 5 of ISO 639, each language identifier is composed of two or three

letters.
NOTE 2 See 4.1.
3.6
language

systematic use of sounds, characters, symbols or signs to express or communicate meaning or a message

between humans

NOTE 1 This definition is intended to serve as a working definition for the purpose of the ISO 639 series of

International Standards, not as a universal definition of this concept.
NOTE 2 See also 4.1 and 4.2.
3.7
individual language
language (3.6) that is distinctly different from another language
NOTE See 4.2.
3.8
dialect

language variant (3.14) specific to a geographical region or a group of language users

NOTE See 4.5.
3.9
macrolanguage

language (3.6) that for some purpose may be subdivided into two or more individual languages (3.7)

NOTE See 4.3.
3.10
language group

two or more individual languages (3.7) that for a specific purpose may suitably be treated as a unit

NOTE See 4.6.
3.11
language family

two or more individual languages (3.7) that are related to each other through having common ancestry

NOTE In exceptional cases, a language family may have only one individual language as a member.

© ISO 2010 – All rights reserved 3
---------------------- Page: 11 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
3.12
remainder group
language group (3.10) with the explicit exclusion of specified languages
NOTE See 4.6.
3.13
language variation
continuous variation within and between individual languages (3.7)

NOTE Language variation is seen and may be described as variation over time, space, cultural affiliation, etc.

3.14
language variant
variant of an individual language (3.7) that may be identified and named
3.15
standard variant
language variant (3.14) with a high degree of status and normalization

NOTE A standard variant of a language may typically be used in official or public communication and in

communication between users of different language variants.
3.16
writing system

system for writing a language (3.6), including the script (3.17) and character set used

NOTE See also 4.9.
3.17
script

set of graphic characters used for the written form of one or more languages (3.6)

[ISO 15924:2004 and ISO/IEC 10646:2003]
NOTE See also 4.9.
3.18
orthography

set of rules for accepted spelling of words and text in one or more languages (3.6)

3.19
transcription

system for representing text in a different script (3.17) than that in which the text was originally represented

NOTE The resulting text is also referred to as a “transcription”.
3.20
transliteration

transcription (3.19) that enables the reconstruction of the original script (3.17) without any loss of

information about graphic characters
NOTE The resulting text is also referred to as a “transliteration”.
3.21
written language

individual language (3.7) or language variant (3.14) that is commonly represented in writing with a relatively

normalized orthography (3.18)
4 © ISO 2010 – All rights reserved
---------------------- Page: 12 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)
3.22
spoken language

individual language (3.7) or language variant (3.14) that is represented in spoken form

NOTE Any spoken language may be represented in writing using a phonetic writing system, where characters

represent sounds (phones or phonemes) directly.
3.23
living language

individual language (3.7) or language variant (3.14) in present-day use, in particular as a spoken

language (3.22)
3.24
extinct language

individual language (3.7) or language variant (3.14) that is no longer in use and that has no present-day

descendant
NOTE See 4.7.
3.25
ancient language

extinct language (3.24) with a distinct literature and special status in the scholarly community

NOTE See 4.7.
3.26
historical language

known earlier historical stage of a living language (3.23) or an extinct language (3.24)

EXAMPLE “Old English” and “Middle English” as historical stages of “English”.
NOTE See 4.7.
3.27
natural language
language (3.6) for human communication that is not an artificial language (3.28)
3.28
artificial language
language (3.6) for human communication that has been artificially devised
NOTE See also 4.8.
4 Fundamental concepts of language coding
4.1 Language identifiers and languages

Language identifiers are composed of the following 26 letters of the Latin alphabet in lower case: a, b, c, d, e, f,

g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. No diacritical marks or modified characters are used.

A language identifier represents a language, which may also be represented by one or more language names.

The objects of identification are languages themselves; language names are the means by which the

languages denoted by language identifiers are designated.

Languages are not static objects every instantiation of which is identical to every other. Every language

corresponds to some range of variation in linguistic expression. In ISO 639, a language identifier denotes

some range of language variation. The range of variation that is denoted can have three different scopes:

individual language, macrolanguage or language group. Also, languages that are represented can be of

© ISO 2010 – All rights reserved 5
---------------------- Page: 13 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)

various types: living languages, ancient languages, artificially constructed languages, etc. The following

provides further explanation regarding assignment of identifiers for different scopes or to different types of

languages in ISO 639.
4.2 Individual languages

Identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to denote distinct individual languages, unless the

language name explicitly refers to a language group.

There is no one definition of a “language” that is agreed upon by all and appropriate for all purposes. As a

result, there can be disagreement, even among speakers of the language or experts in linguistics, as to

whether two variants represent dialects of a single language or two distinct languages. For ISO 639,

judgments regarding when two variants are considered to be the same or different languages are based on a

number of factors, including linguistic similarity, intelligibility, a common literature, the views of speakers

concerning the relationship between language and identity, and other factors. The following basic criteria are

followed.

⎯ Two related variants are normally considered variants of the same language if speakers of each variant

have inherent understanding of the other variant (that is, can understand based on knowledge of their

own variant without needing to learn the other variant) at a functional level.

⎯ Where spoken intelligibility between variants is marginal, the existence of a common literature or of a

common ethnolinguistic identity with a central variant that both understand can be strong indicators that

they should nevertheless be considered variants of the same language.

⎯ Where there is enough intelligibility between variants to enable communication, the existence of well-

established distinct ethnolinguistic identities can be a strong indicator that they should nevertheless be

considered to be different languages.

Some of the distinctions made on this basis may not be considered appropriate by some users or for certain

applications. However, these basic criteria are thought to best fit the intended range of applications.

4.3 Macrolanguages

Parts 1 and 2 of ISO 639 include identifiers that correspond in a one-to-many manner with individual language

identifiers in Part 3 of ISO 639. For instance, Part 3 of ISO 639 contains over 30 identifiers designated as

individual language identifiers for distinct variants of Arabic, while Parts 1 and 2 each contain only one

identifier for Arabic, “ar” and “ara” respectively, which are designated as individual language identifiers in

those parts of ISO 639. It is assumed here that the single identifiers for Arabic in Parts 1 and 2 of ISO 639

correspond to the many identifiers collectively for distinct variants of Arabic in Part 3 of ISO 639.

In this example, it may appear that the single identifiers in Parts 1 and 2 of ISO 639 should be designated as

collective language identifiers. That is not assumed, however. In various parts of the world, there are clusters

of closely-related language variants that, based on the criteria discussed in 4.2, can be considered individual

languages, yet in certain usage contexts a single language identity for all is needed. Typical situations in

which this need can occur include the following.

⎯ There is one variant that is more developed and that tends to be used for wider communication by

speakers of various closely-related languages; as a result, there is a perceived common linguistic identity

across these languages. For instance, there are several distinct spoken Arabic languages, but Standard

Arabic is generally used in business and media across all of these communities, and is also an important

aspect of a shared ethno-religious unity. As a result, a perceived common linguistic identity exists.

⎯ There is a common written form used for multiple closely-related languages. For instance, multiple

Chinese languages share a common written form.
6 © ISO 2010 – All rights reserved
---------------------- Page: 14 ----------------------
SIST ISO 639-4:2010
ISO 639-4:2010(E)

⎯ There is a transitional sociolinguistic situation in which sub-communities of a single language community

are diverging, creating a need for some purposes to recognise distinct languages while, for other

purposes, a single common identity is still valid. For instance, in some business contexts it is necessary

to make a distinction between the languages Bosnian, Croatian, and Serbian; yet there are other contexts

in which these distinctions are not discernable in language resources that are in use.

Where such situations exist, an identifier for the single, common language identity is considered to be a

macrolanguage identifier.

Macrolanguages are distinguished from language groups in that the individual languages that correspond to a

macrolanguage must be very closely related, and there must be some domain in which only a single language

identity is recognized.
4.4 Linguistic norm

Some linguistic forms are “normalized” or “standardized” by official or private bodies like academies or

language councils. This normalization may be applied to any elements: orthography, morphology, syntax,

semantics, phonology, etc. The degree of normalization varies greatly from one language to another.

Languages or forms of languages may be considered to have some sort of official status within countries or

regions. Language status may be established through acts of parliament or through other formal procedures,

giving a language status as “national language”, “official language”, “regional language”, etc.

4.5 Dialects

The linguistic variants denoted by each of the identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to be

distinct languages and not dialects of other languages, even though for some purposes some users may

consider a variant listed in Part 1 or 2, or in particular Part 3 of ISO 639 to be a “dialect” rather than a

“language” (see 4.2 and 4.3). In ISO 639, the term dialect is used as in the field of linguistics where it identifies

any sub-variant of a language such as might be based on geographic region, age, gender, social class, time

period, etc.

The dialects of a language are included within the denotation represented by the identifier for that language.

Thus, each language identifier represents the complete range of all the spoken or written variants of that

language, including any standardized form.

For applications in which it is necessary to identify dialects, a separate standard may be developed that

...

NORME ISO
INTERNATIONALE 639-4
Première édition
2010-07-15
Codes pour la représentation des noms
de langue —
Partie 4:
Principes généraux pour le codage de la
représentation des noms de langue et
d'entités connexes, et lignes directrices
pour la mise en œuvre
Codes for the representation of names of languages —
Part 4: General principles of coding of the representation of names of
languages and related entities, and application guidelines
Numéro de référence
ISO 639-4:2010(F)
ISO 2010
---------------------- Page: 1 ----------------------
ISO 639-4:2010(F)
PDF – Exonération de responsabilité

Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier

peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence

autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées

acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute

responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.

Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info

du fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir

l'exploitation de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation,

veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2010

Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous

quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l'accord écrit

de l'ISO à l'adresse ci-après ou du comité membre de l'ISO dans le pays du demandeur.

ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO 2010 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO 639-4:2010(F)
Sommaire Page

Avant-propos .....................................................................................................................................................iv

Introduction.........................................................................................................................................................v

1 Domaine d'application ..........................................................................................................................1

2 Références normatives.........................................................................................................................1

3 Termes et définitions ............................................................................................................................2

4 Concepts fondamentaux de codage des langues..............................................................................6

4.1 Indicatifs de langue et langues ............................................................................................................6

4.2 Langues individuelles...........................................................................................................................6

4.3 Macrolangues ........................................................................................................................................6

4.4 Norme linguistique ................................................................................................................................7

4.5 Dialectes.................................................................................................................................................7

4.6 Codets de langues collectifs et groupes de langues ........................................................................8

4.7 Langues mortes, anciennes et historiques ........................................................................................8

4.8 Langues artificielles ..............................................................................................................................8

4.9 Systèmes d'écriture et écritures ..........................................................................................................8

5 Relations entre les parties de l'ISO 639 ..............................................................................................8

5.1 Parties de l'ISO 639 ...............................................................................................................................8

5.2 Norme ISO 639 comme espace de codage .........................................................................................9

5.3 Principes.................................................................................................................................................9

5.4 Mise à jour commune et base de données de codage des langues ................................................9

6 Problèmes d'implémentation .............................................................................................................10

6.1 Applications .........................................................................................................................................10

6.2 Sous-ensembles du tableau de codes ..............................................................................................10

6.3 Groupes de langues ............................................................................................................................11

7 Combinaison des indicatifs de langue avec d'autres normes ou d'autres codes........................11

7.1 Combinaison de l'ISO 639 avec l'ISO 3166 .......................................................................................11

7.2 Combinaison de l'ISO 639 avec l'ISO 19111 et l'ISO 19112.............................................................12

7.3 Combinaison de l'ISO 639 avec l'ISO 15924 .....................................................................................12

7.4 Autres combinaisons de codes .........................................................................................................12

7.5 Format des indicatifs combinés ........................................................................................................12

8 Format de description de la langue (LDF) ........................................................................................13

8.1 Compatibilité entre le modèle ISO 639 et l'ISO 12620......................................................................13

8.1.1 Généralités ...........................................................................................................................................13

8.1.2 Identification ........................................................................................................................................15

8.1.3 Description d'un indicatif de langue ISO 639 ...................................................................................17

8.2 Extensions de l'ISO 639 au LDF de l'ISO 12620 ...............................................................................20

8.2.1 Représentation ....................................................................................................................................20

8.2.2 Documentation ....................................................................................................................................22

8.3 Informations sur la langue..................................................................................................................24

Annexe A (informative) Direction générale de l'ISO 639 ...............................................................................26

Bibliographie.....................................................................................................................................................28

© ISO 2010 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO 639-4:2010(F)
Avant-propos

L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de

normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée

aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du

comité technique créé à cet effet. Les organisations internationales, gouvernementales et non

gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec

la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.

Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,

Partie 2.

La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes

internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur

publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres

votants.

L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de

droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne

pas avoir identifié de tels droits de propriété et averti de leur existence.

L'ISO 639-4 a été élaborée par le comité technique ISO/TC 37, Terminologie et autres ressources langagières

et ressources de contenu, sous-comité SC 2, Méthodes de travail terminographiques et lexicographiques.

L'ISO 639 comprend les parties suivantes, présentées sous le titre général Codes pour la représentation des

noms de langue:
⎯ Partie 1: Code alpha-2
⎯ Partie 2: Code alpha-3
⎯ Partie 3: Code alpha-3 pour un traitement exhaustif des langues

⎯ Partie 4: Principes généraux pour le codage de la représentation des noms de langue et d'entités

connexes, et lignes directrices pour la mise en oeuvre
⎯ Partie 5: Code alpha-3 pour les familles de langues et groupes de langues

⎯ Partie 6: Code alpha-4 pour un traitement exhaustif des variantes linguistiques

iv © ISO 2010 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO 639-4:2010(F)
Introduction

L'ISO 639 fournit des codes pour l'identification et la spécification des langues individuelles, des variantes

linguistiques et des groupes de langues. Ces identificateurs peuvent s'utiliser dans de nombreuses

applications, y compris pour spécifier la langue d'un texte, la langue des termes ou des mots d'un dictionnaire

ou d'une base de données terminologique, la langue d'une présentation orale, le niveau de connaissance

d'une langue, les possibilités linguistiques d'un logiciel, la localisation, etc. L'implémentation des diverses

parties de l'ISO 639 est prévue pour de nombreux environnements.

Les Parties 1, 2, 3 et 5 de l'ISO 639 contiennent toutes des informations sur les problèmes d'implémentation.

Cependant, il s'avère nécessaire d'étendre ces descriptions et de stipuler les règles d'implémentation dans un

document séparé. Dans les futures révisions des autres parties de l'ISO 639, il est prévu qu'elles feront

référence à la présente partie de l'ISO 639, plutôt que de dupliquer les informations.

© ISO 2010 – Tous droits réservés v
---------------------- Page: 5 ----------------------
NORME INTERNATIONALE ISO 639-4:2010(F)
Codes pour la représentation des noms de langue —
Partie 4:
Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour
la mise en œuvre
1 Domaine d'application

La présente partie de l'ISO 639 fournit les principes généraux de codage des langues à l'aide des codes

spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d'autres codes. De plus, la

présente partie de l'ISO 639 établit des règles d'utilisation de n'importe quelle combinaison des parties de

l'ISO 639.

La terminologie et les descriptions générales de la présente partie de l'ISO 639 sont destinées à remplacer le

texte correspondant des autres parties de l'ISO 639, selon le cas, dans de futures révisions.

Les métadonnées pertinentes pour la description des entités linguistiques sont également fournies et servent

de cadre de travail pour les bases de données linguistiques qui accompagnent la série de Normes

internationales ISO 639.
2 Références normatives

Les documents de référence suivants sont indispensables pour l'application du présent document. Pour les

références datées, seule l'édition citée s'applique. Pour les références non datées, la dernière édition du

document de référence s'applique (y compris les éventuels amendements).

ISO 639-1:2002, Codes pour la représentation des noms de langue — Partie 1: Code alpha-2

ISO 639-2:1998, Codes pour la représentation des noms de langue — Partie 2: Code alpha-3

ISO 639-3:2007, Codes pour la représentation des noms de langue — Partie 3: Code alpha-3 pour un

traitement exhaustif des langues

ISO 639-5:2008, Codes pour la représentation des noms de langue — Partie 5: Code alpha-3 pour les

familles de langues et groupes de langues

ISO 3166-1:2006, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 1: Codes

de pays

ISO 3166-2:2007, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 2: Code

pour les subdivisions de pays

ISO 3166-3:1999, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 3: Code

pour les noms de pays antérieurement utilisés
© ISO 2010 – Tous droits réservés 1
---------------------- Page: 6 ----------------------
ISO 639-4:2010(F)

ISO 8601:2004, Éléments de données et formats d'échange — Échange d'information — Représentation de

la date et de l'heure

ISO/CEI 11179-1:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 1: Cadre

ISO/CEI 11179-2:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 2:

Classification

ISO/CEI 11179-3:2003, Technologies de l'information — Registres de métadonnées (RM) — Partie 3:

Métamodèle de registre et attributs de base

ISO/CEI 11179-4:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 4:

Formulation des définitions de données

ISO/CEI 11179-5:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 5:

Principes de dénomination et d'identification

ISO/CEI 11179-6:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 6:

Enregistrement

ISO 12620:2009, Terminologie et autres ressources langagières et ressources de contenu — Spécification de

catégories de données et gestion d'un registre de catégories de données pour les ressources langagières

ISO 15924:2004, Information et documentation — Codes pour la représentation des noms d'écritures

ISO 19111:2007, Information géographique — Système de référence spatiales par coordonnées

ISO 19112:2003, Information géographique — Système de références spatiales par identificateurs

géographiques
3 Termes et définitions

Pour les besoins du présent document, les termes et définitions suivants s'appliquent.

Dans les futures versions des autres parties de l'ISO 639, il est prévu que tout ou partie des termes et

définitions seront remplacés par une référence aux termes et définitions de la présente partie de l'ISO 639.

NOTE Les définitions de la présente partie de l'ISO 639 sont destinées à l'utilisation pratique dans le contexte des

diverses parties de l'ISO 639 et de leurs applications. Pour certains objectifs linguistiques, il existe des besoins de

définitions plus détaillées ou qui dévient de celles données ici.
3.1
code

données transformées ou représentées sous différentes formes, selon un jeu de règles préétablies

NOTE L'utilisation du terme «code» n'est pas identique dans tous les systèmes de codage normalisés. Selon

l'utilisation définie dans la présente partie de l'ISO 639, un «code» est compris comme un tableau de codes (3.2) et

l'ensemble des règles relatives à ce tableau de codes. Chaque ligne d'un tableau de codes est un codet (3.4)

(par exemple, «de - German - allemand - Deutsch» dans la Partie 1 de l'ISO 639), alors que l'élément «de» est l'indicatif

de langue (3.5).
3.2
tableau de codes
tableau des codets (3.4) faisant partie d'un code (3.1)
3.3
espace de codage

totalité des valeurs possibles d'un ensemble d'indicatifs au sein d'un code (3.1)

2 © ISO 2010 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO 639-4:2010(F)

EXEMPLE Toutes les combinaisons de deux lettres (de a à z) forment l'espace de codage du code de la langue

alpha-2 spécifié dans la Partie 1 de l'ISO 639.

NOTE Les codes de langue alpha-3 spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent le même espace de

codage: aucun indicatif de langue affecté dans une des parties ne peut être affecté à un autre élément d'une autre partie.

3.4
codet
entrée individuelle d'un code (3.1)

NOTE Dans les codes de langues décrits de l'ISO 639, chaque codet se compose d'un indicatif de langue et des

noms de la langue correspondante.
3.5
indicatif de langue
symbole de langue

chaîne de caractères assignée à une entité linguistique afin de la représenter de façon unique

NOTE 1 Dans les codes de langues décrits dans les Parties 1, 2, 3 et 5 de l'ISO 639, chaque indicatif de langue se

compose de deux ou trois lettres.
NOTE 2 Voir 4.1.
3.6
langue

utilisation systématique de sons, caractères, symboles ou signes pour exprimer ou communiquer un sens ou

un message entre humains

NOTE 1 Cette définition est destinée à servir de définition de travail pour les besoins de la série de Normes

internationales ISO 639, et non de définition universelle de ce concept.
NOTE 2 Voir également 4.1 et 4.2.
3.7
langue individuelle
langue (3.6) distincte de toute autre
NOTE Voir 4.2.
3.8
dialecte

variante linguistique (3.14) propre à une zone géographique ou à un groupe d'utilisateurs d'une langue

NOTE Voir 4.5.
3.9
macrolangue

langue (3.6) qui, dans un but particulier, peut se subdiviser en deux ou plusieurs langues individuelles (3.7)

NOTE Voir 4.3.
3.10
groupe de langues

ensemble de deux ou plusieurs langues individuelles (3.7) qui, dans un but particulier, peut être traité

comme une seule unité
NOTE Voir 4.6.
© ISO 2010 – Tous droits réservés 3
---------------------- Page: 8 ----------------------
ISO 639-4:2010(F)
3.11
famille de langues

ensemble de deux ou plusieurs langues individuelles (3.7) apparentées du fait de leur origine commune

NOTE Dans certains cas exceptionnels, une famille de langues peut ne comprendre qu'une seule langue individuelle.

3.12
groupe restreint
groupe de langues (3.10) qui exclut explicitement des langues spécifiées
NOTE Voir 4.6.
3.13
variation linguistique
variante continue au sein et entre des langues individuelles (3.7)

NOTE Une variation linguistique peut être considérée comme une variation dans le temps, l'espace, ou du fait d'une

appartenance culturelle, etc.
3.14
variante linguistique

variante d'une langue individuelle (3.7) qu'il est possible d'identifier et de nommer

3.15
variante standard
variante linguistique (3.14) possédant un haut niveau de normalisation et d'état

NOTE Une variante standard d'une langue peut généralement s'utiliser dans une communication publique ou

officielle et pour la communication entre des utilisateurs de différentes variantes linguistiques

3.16
système d'écriture

système d'écriture d'une langue (3.6), y compris l'écriture (3.17) et le jeu de caractères utilisés

NOTE Voir également 4.9.
3.17
écriture

ensemble de caractères graphiques utilisé pour la forme écrite d'une ou plusieurs langues (3.6)

[ISO 15924:2004 et ISO/CEI 10646:2003]
NOTE Voir également 4.9.
3.18
orthographe

ensemble des règles régissant la manière admise d'écrire les mots et le texte d'une ou plusieurs langues

(3.6)
3.19
transcription

système de représentation d'un texte dans une écriture (3.17) différente du texte original

NOTE Le résultat textuel est également appelé «transcription».
4 © ISO 2010 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO 639-4:2010(F)
3.20
translittération

transcription (3.19) qui permet de reconstruire l'écriture (3.17) originale sans perdre d'informations sur les

caractères graphiques
NOTE Le résultat textuel est également appelé «translittération».
3.21
langue écrite

langue individuelle (3.7) ou variante linguistique (3.14) communément représentée par écrit avec une

orthographe (3.18) relativement normalisée
3.22
langue orale

langue individuelle (3.7) ou variante linguistique (3.14) représentée sous forme orale

NOTE Une langue orale peut se représenter par écrit à l'aide d'un système d'écriture phonétique dans lequel les

caractères représentent directement des sons (phonèmes).
3.23
langue vivante

langue individuelle (3.7) ou variante linguistique (3.14) actuellement utilisée, en particulier sous forme

orale (3.22)
3.24
langue morte

langue individuelle (3.7) ou variante linguistique (3.14) qui n'est plus utilisée et qui n'a pas de langue

héritée encore en usage
NOTE Voir 4.7.
3.25
langue ancienne

langue morte (3.24) dotée d'une littérature et d'un état particulier dans la communauté scientifique

NOTE Voir 4.7.
3.26
langue historique

état historique précédemment connu d'une langue vivante (3.23) ou d'une langue morte (3.24)

EXEMPLE L'anglo-saxon anglais et l'anglais médiéval sont des langues historiques de l'anglais.

NOTE Voir 4.7.
3.27
langue naturelle

langue (3.6) utilisée pour la communication humaine et qui n'est pas une langue artificielle (3.28)

3.28
langue artificielle
langue (3.6) utilisée pour la communication humaine et conçue artificiellement
NOTE Voir également 4.8.
© ISO 2010 – Tous droits réservés 5
---------------------- Page: 10 ----------------------
ISO 639-4:2010(F)
4 Concepts fondamentaux de codage des langues
4.1 Indicatifs de langue et langues

Les indicatifs de langue sont composés des 26 lettres suivantes, en minuscule, de l'alphabet latin: a, b, c, d, e,

f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. Aucun signe diacritique ou caractère modifié n'est utilisé.

Un indicatif de langue représente une langue qui peut également se représenter par un ou plusieurs noms de

langues. Les objets de l'identification sont les langues elles-mêmes; les noms de langue sont des moyens par

lesquels sont désignées les langues dénommées par les indicatifs de langue.

Les langues ne sont pas des objets statiques dont chaque instanciation est identique à chaque autre. Chaque

langue correspond à une certaine plage de variation de l'expression linguistique. Dans l'ISO 639, un indicatif

de langue désigne donc une certaine plage de variante linguistique. La plage de variante indiquée peut avoir

trois domaines d'application différents: langue individuelle, macrolangue et groupe de langues. De plus, les

langues représentées peuvent être de divers types: langues vivantes, langues anciennes, langues construites

artificiellement, etc. L'exposé suivant fournit une explication plus détaillée de l'attribution des indicatifs pour les

différents domaines d'application ou pour les différents types de langues dans l'ISO 639.

4.2 Langues individuelles

Les indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont censés indiquer des langues individuelles différentes, à

moins que le nom de la langue fasse explicitement référence à un groupe de langues.

Il n'existe pas de définition unique d'une «langue» qui soit acceptée par tous et qui convienne à tous les

besoins. Par conséquent, il peut y avoir désaccord, même entre locuteurs de la langue ou entre linguistes, sur

la question de savoir si deux variantes représentent des dialectes d'une même langue ou deux langues

distinctes. Dans le cadre de l'ISO 639, les jugements pour savoir si deux variantes sont considérées

représenter la même langue ou des langues différentes sont basés sur divers facteurs, notamment la

similarité linguistique, l'intelligibilité, une littérature commune, les points de vue des locuteurs sur la relation

entre langue et identité, pour n'en citer que quelques-uns. Les critères fondamentaux suivants s'appliquent.

⎯ Deux variantes liées sont normalement considérées comme étant des variantes de la même langue si les

personnes parlant chaque variante ont une compréhension fonctionnelle spontanée de l'autre variante

(c'est-à-dire qu'elles peuvent la comprendre en s'appuyant sur la connaissance de leur propre variante

sans devoir apprendre l'autre variante).

⎯ Lorsque l'intelligibilité orale entre variantes est marginale, l'existence d'une littérature commune ou d'une

identité ethnolinguistique commune avec une variante centrale comprise par ces deux variantes peut

fortement indiquer qu'il conviendrait néanmoins de les considérer comme des variantes de la même

langue.

⎯ Lorsqu'il existe entre les variantes une intelligibilité suffisante qui permette de communiquer, l'existence

d'identités ethnolinguistiques distinctes bien établies peut fortement indiquer qu'il conviendrait néanmoins

de les considérer comme des langues différentes.

Certaines des distinctions établies sur ces bases peuvent ne pas être considérées comme appropriées par

certains usagers ou pour certaines applications. Toutefois, ces critères fondamentaux sont considérés comme

étant ceux qui s'adaptent le mieux à la gamme visée d'applications.
4.3 Macrolangues

Les Parties 1 et 2 de l'ISO 639 comprennent des indicatifs qui correspondent, dans une relation «un à

plusieurs», à des indicatifs de langue individuelle de la Partie 3 de l'ISO 639. Par exemple, la Partie 3 de

l'ISO 639 contient plus de 30 indicatifs désignés comme identificateurs de langue individuelle pour différentes

variantes de l'arabe, alors que les Parties 1 et 2 contiennent chacune un seul indicatif pour l'arabe,

respectivement «ar» et «ara», qui est appelé indicatif de langue individuelle dans ces parties de l'ISO 639. Il

est supposé ici que les indicatifs uniques pour l'arabe dans les Parties 1 et 2 de l'ISO 639 correspondent aux

nombreux indicatifs collectivement désignés pour les variétés de l'arabe dans la Partie 3 de l'ISO 639.

6 © ISO 2010 – Tous droits réservés
---------------------- Page: 11 ----------------------
ISO 639-4:2010(F)

Dans cet exemple, il peut sembler qu'il conviendrait d'appeler indicatifs de langue collectifs les indicatifs

uniques des Parties 1 et 2 de l'ISO 639. Ce n'est toutefois pas l'hypothèse admise ici. Dans diverses parties

du monde, il existe des groupes de variantes linguistiques intimement apparentées qui, sur la base des

critères exposés en 4.2, peuvent être considérés comme des langues individuelles, alors que dans certains

contextes d'utilisation, une seule identité de langue sera nécessaire pour l'ensemble de ces langues. Les

situations type où peut apparaître ce besoin sont les suivantes.

⎯ Il existe une variante plus développée qui tend à être utilisée pour une communication plus large par les

locuteurs de diverses langues étroitement apparentées; par conséquent, une identité linguistique

commune est perçue à travers ces langues. Par exemple, il existe plusieurs langues distinctes pour

l'arabe parlé mais l'arabe standard, généralement utilisé dans les affaires et dans les médias par toutes

ces communautés, représente également un aspect important de l'unité ethno-religieuse commune. Par

conséquent, il existe une identité linguistique commune perçue.

⎯ Il existe une forme écrite commune qui est utilisée pour plusieurs langues étroitement apparentées. Par

exemple, plusieurs langues chinoises partagent la même forme écrite.

⎯ Il existe une situation sociolinguistique transitoire dans laquelle des sous-communautés d'une même

communauté linguistique divergent, créant la nécessité, pour un certain nombre de besoins, de

reconnaître des langues distinctes alors que, pour d'autres besoins, une identité commune unique reste

valide. Par exemple, dans un certain nombre de contextes d'affaires, il est nécessaire de faire la

distinction entre les langues bosniaque, croate et serbe alors que dans d'autres contextes, ces

distinctions ne sont pas discernables en termes de ressources linguistiques utilisées.

Dans de telles situations, un indicatif pour l'unique identité linguistique commune est considéré comme un

indicatif de macrolangue.

Les macrolangues se distinguent des groupes de langues par le fait que les langues individuelles qui

correspondent à une macrolangue doivent être très étroitement apparentées et qu'il doit exister un domaine

où seule une identité linguistique unique est reconnue.
4.4 Norme linguistique

Certaines formes linguistiques sont «normalisées» ou «standardisées» par des organismes officiels ou privés

tels que des académies ou des comités linguistiques. Cette normalisation peut s'appliquer à divers éléments:

orthographe, morphologie, syntaxe, sémantique, phonétique, etc. Le degré de normalisation varie

considérablement d'une langue à l'autre.

Les langues ou leurs formes linguistiques peuvent être considérées comme ayant un certain statut officiel

dans certains pays ou régions. Le statut de la langue peut être établi par des actes pa

...

PROJET DE NORME INTERNATIONALE ISO/DIS 639-4
ISO/TC 37/SC 2 Secrétariat: SCC
Début de vote: Vote clos le:
2006-12-22 2007-05-22

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION • МЕЖДУНАРОДНАЯ ОРГАНИЗАЦИЯ ПО СТАНДАРТИЗАЦИИ • ORGANISATION INTERNATIONALE DE NORMALISATION

Codes pour la représentation des noms de langue —
Partie 4:
Lignes directrices pour la mise en oeuvre et principes généraux
des codes de langue
Codes for the representation of names of languages —
Part 4: Implementation guidelines and general principles for language coding
ICS 01.140.20

Pour accélérer la distribution, le présent document est distribué tel qu'il est parvenu du

secrétariat du comité. Le travail de rédaction et de composition de texte sera effectué au

Secrétariat central de l'ISO au stade de publication.

To expedite distribution, this document is circulated as received from the committee secretariat.

ISO Central Secretariat work of editing and text composition will be undertaken at publication

stage.

CE DOCUMENT EST UN PROJET DIFFUSÉ POUR OBSERVATIONS ET APPROBATION. IL EST DONC SUSCEPTIBLE DE MODIFICATION ET NE PEUT

ÊTRE CITÉ COMME NORME INTERNATIONALE AVANT SA PUBLICATION EN TANT QUE TELLE.

OUTRE LE FAIT D'ÊTRE EXAMINÉS POUR ÉTABLIR S'ILS SONT ACCEPTABLES À DES FINS INDUSTRIELLES, TECHNOLOGIQUES ET

COMMERCIALES, AINSI QUE DU POINT DE VUE DES UTILISATEURS, LES PROJETS DE NORMES INTERNATIONALES DOIVENT PARFOIS ÊTRE

CONSIDÉRÉS DU POINT DE VUE DE LEUR POSSIBILITÉ DE DEVENIR DES NORMES POUVANT SERVIR DE RÉFÉRENCE DANS LA

RÉGLEMENTATION NATIONALE.
© Organisation internationale de normalisation, 2006
---------------------- Page: 1 ----------------------
ISO/DIS 639-4
PDF — Exonération de responsabilité

Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier

peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence

autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées

acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute

responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.

Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info du

fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir l'exploitation

de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation, veuillez en informer

le Secrétariat central à l'adresse donnée ci-dessous.
Notice de droit d'auteur

Ce document de l'ISO est un projet de Norme internationale qui est protégé par les droits d'auteur de l'ISO.

Sauf autorisé par les lois en matière de droits d'auteur du pays utilisateur, aucune partie de ce projet ISO ne

peut être reproduite, enregistrée dans un système d'extraction ou transmise sous quelque forme que ce soit

et par aucun procédé, électronique ou mécanique, y compris la photocopie, les enregistrements ou autres,

sans autorisation écrite préalable.

Les demandes d'autorisation de reproduction doivent être envoyées à l'ISO à l'adresse ci-après ou au comité

membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56  CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Toute reproduction est soumise au paiement de droits ou à un contrat de licence.
Les contrevenants pourront être poursuivis.
ii ISO 2006 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO/DIS 639-4
Sommaire Page

Avant-propos ......................................................................................................................................................v

Introduction........................................................................................................................................................vi

1 Domaine d'application ..........................................................................................................................1

2 Références normatives.........................................................................................................................1

3 Termes et définitions ............................................................................................................................2

4 Concepts fondamentaux de codage des langues..............................................................................6

4.1 Indicatifs de langue et langues............................................................................................................6

4.2 Langues individuelles...........................................................................................................................6

4.3 Macro-langues .......................................................................................................................................6

4.4 Norme linguistique................................................................................................................................7

4.5 Dialectes.................................................................................................................................................7

4.6 Codets de langues collectifs et groupes de langues ........................................................................8

4.7 Langues mortes, anciennes et historiques ........................................................................................8

4.8 Langues abstraites................................................................................................................................8

4.9 Systèmes d’écriture et écritures..........................................................................................................8

5 Relations entre les parties de l'ISO 639 ..............................................................................................9

5.1 Parties de l'ISO 639 ...............................................................................................................................9

5.2 Norme ISO 639 comme espace de codage .........................................................................................9

5.3 Principes ................................................................................................................................................9

5.4 Mise à jour commune et base de données de codage des langues ..............................................10

6 Direction générale de l'ISO 639..........................................................................................................10

6.1 Agences d'enregistrement et responsabilités concernant les parties de l'ISO 639.....................10

6.2 Comité consultatif mixte ISO 639/RA-JAC........................................................................................10

6.2.1 Composition.........................................................................................................................................10

6.2.2 Nomination des membres ..................................................................................................................10

6.2.3 Secrétariat ............................................................................................................................................10

6.3 Procédures de travail au sein de l’ISO 639/RA-JAC ........................................................................11

6.4 Ajout et suppression à la liste des entités, modification d’indicatifs............................................11

6.5 Réservation des indicatifs..................................................................................................................11

6.6 Création d’indicatifs de langues........................................................................................................11

6.7 Procédures de vote .............................................................................................................................11

6.8 Stabilité des tableaux de codes.........................................................................................................11

7 Problèmes d'implémentation .............................................................................................................12

7.1 Applications .........................................................................................................................................12

7.2 Sous-ensembles du tableau de codes ..............................................................................................12

7.3 Groupes de langues............................................................................................................................13

8 Combinaison des indicatifs avec d’autres normes ou d’autres codes .........................................13

8.1 Combinaison de l'ISO 639 avec l'ISO 3166 .......................................................................................13

8.2 Combinaison de l'ISO 639 avec l'ISO 19111 et l'ISO 19112.............................................................14

8.3 Combinaison de l'ISO 639 avec l'ISO 15924 .....................................................................................14

8.4 Autres combinaisons de codes .........................................................................................................14

8.5 Formats des indicatifs combinés ......................................................................................................14

© ISO 2006 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO/DIS 639-4

9 Format de description de la langue (LDF)........................................................................................ 15

9.1 Compatibilités entre le modèle ISO 639 et l'ISO 12620................................................................... 15

9.1.1 Identification........................................................................................................................................ 16

9.1.2 Description d’un indicatif de langue ISO 639 .................................................................................. 18

9.2 Extensions de l'ISO 639 à l'ISO 12620 pour LDF ............................................................................. 21

9.2.1 Représentation.................................................................................................................................... 21

9.2.2 Documentation.................................................................................................................................... 23

9.3 Informations sur la langue................................................................................................................. 24

9.3.1 Informations calculables sur la langue ............................................................................................ 24

9.3.2 Attribution des noms aux langues.................................................................................................... 25

9.3.3 Informations sur le pays .................................................................................................................... 25

9.3.4 Informations sur la langue « dépendant du pays »......................................................................... 25

9.3.5 Documentation de référence ............................................................................................................. 26

9.3.6 Informations géographiques ............................................................................................................. 26

9.3.7 Informations socioculturelles............................................................................................................ 26

9.3.8 Caractéristiques linguistiques .......................................................................................................... 26

Bibliographie .................................................................................................................................................... 27

iv © ISO 2006 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO/DIS 639-4
Avant-propos

L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de

normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée

aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du

comité technique créé à cet effet. Les organisations internationales, gouvernementales et non

gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec

la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.

Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,

Partie 2.

La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes

internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur

publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres

votants.

L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de

droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne

pas avoir identifié de tels droits de propriété et averti de leur existence.

L'ISO 639-4 a été élaborée par le comité technique ISO/TC 37, Terminologie, autres ressources langagières

et contenus, sous-comité SC 2, Méthodes de travail terminographiques et lexicographiques.

L'ISO 639 comprend les parties suivantes, présentées sous le titre général Codes pour la représentation des

noms de langue :
⎯ Partie 1 : Code Alpha-2
⎯ Partie 2 : Code Alpha-3
⎯ Partie 3 : Code Alpha-3 pour un traitement exhaustif des langues

⎯ Partie 4 : Guide d'implémentation et principes généraux des codes de langue. [ce document]

⎯ Partie 5 : Code Alpha-3 pour les familles de langues et les groupes de langues
La Partie 6 est en cours d’élaboration :

⎯ Partie 6 : Représentation Alpha-4 pour un traitement exhaustif de la variation linguistique

1) À publier.
2) À publier.
© ISO 2006 – Tous droits réservés v
---------------------- Page: 5 ----------------------
ISO/DIS 639-4
Introduction

L’ISO 639 fournit des codes pour l’identification et la spécification de différentes langues et variantes

linguistiques ainsi que de différents groupes de langues. Ces identificateurs peuvent s’utiliser dans de

nombreuses applications, y compris pour spécifier la langue d’un texte, la langue des termes ou des mots

d’un dictionnaire ou d’une base de données terminologique, la langue d’une présentation orale, le niveau de

connaissance d’une langue, les possibilités linguistiques d’un logiciel, la localisation, etc. L’implémentation

des diverses parties de l'ISO 639 est prévue pour de nombreux environnements.

Les Parties 1, 2, 3 et 5 de l'ISO 639 contiennent toutes des informations sur les problèmes d’implémentation.

Cependant, il s’avère nécessaire d’étendre ces descriptions et de stipuler les règles d’implémentation dans un

document séparé. Dans les futures révisions des autres parties de la présente norme, il est prévu que ces

normes feront référence à cette partie de l'ISO 639, plutôt que de dupliquer les informations.

vi © ISO 2006 – Tous droits réservés
---------------------- Page: 6 ----------------------
PROJET DE NORME INTERNATIONALE ISO/DIS 639-4
Codes pour la représentation des noms de langue —
Partie 4:
Lignes directrices pour la mise en oeuvre et principes généraux
des codes de langue
1 Domaine d'application

La présente partie de l'ISO 639 fournit les principaux généraux de codage des langues à l’aide des codes

spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d’autres codes. De plus, la

présente partie de l'ISO 639 établit des règles d’utilisation de n’importe quelle combinaison des parties de la

norme. Les données pertinentes pour la description des unités linguistiques sont également fournies et

servent de cadre de travail pour les bases de données qui prennent en charge la série de normes ISO 639.

2 Références normatives

Les documents normatifs suivants contiennent des dispositions qui, par suite de la référence qui y est faite,

constituent des dispositions valables pour la présente partie de l’ISO 639. Pour les références datées, les

amendements ultérieurs ou les révisions de ces publications ne s’appliquent pas. Toutefois, les

parties prenantes aux accords fondés sur la présente partie de l’ISO 639 sont invitées à rechercher la

possibilité d'appliquer les éditions les plus récentes des documents normatifs indiqués ci-après. Pour les

références non datées, la dernière édition du document normatif en référence s’applique. Les membres de

l'ISO et de la CEI possèdent le registre des Normes internationales en vigueur.

ISO 639-1:2002, Codes pour la représentation des noms de langue — Partie 1: Code alpha-2.

ISO 639-2:1998, Codes pour la représentation des noms de langue — Partie 2: Code alpha-3.

ISO 639-3:—, Codes pour la représentation des noms de langue — Partie 3: Code alpha-3 pour un traitement

exhaustif des langues.

ISO 639-5:—, Codes pour la représentation des noms de langue — Partie 5 : Code alpha-3 pour les familles

de langues et groupes de langues. .

ISO 3166-1:1997, Codes pour la représentation des noms de pays et de leurs subdivisions —

Partie 1 : Codes pays.

ISO 3166-2:1998, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 2 : code

pour les subdivisions de pays. .

ISO 3166-3:1999, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 3 : Code

pour les noms de pays antérieurement utilisés.
3) À publier.
4) À publier.
5) En cours de révision ; FDIS 2006-05.
6) En cours de révision ; DIS 2005-09.
© ISO 2006 – Tous droits réservés 1
---------------------- Page: 7 ----------------------
ISO/DIS 639-4

ISO 8601:2004, Éléments de données et formats d'échange — Échange d'information — Représentation de

la date et de l'heure.

ISO/CEI 10646:2003, Technologies de l'information — Jeu universel de caractères codés sur plusieurs octets

(JUC).

ISO/CEI 11179-1:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 1 : Cadre.

ISO/CEI 11179-2:2005, Technologies de l'information — Registres de métadonnées (RM) —

Partie 2 : classification.

ISO/CEI 11179-3:2003, Technologies de l'information — Registres de métadonnées (MDR) —

Partie 3 : métamodèle de registre et attributs de base.

ISO/CEI 11179-4:2004, Technologies de l'information — Registres de métadonnées (RM) —

Partie 4 : Formulation des définitions de données.

ISO/CEI 11179-5:2005, Technologies de l'information — Registres de métadonnées (RM) —

Partie 5 : principes de dénomination et d'identification.

ISO/CEI 11179-6:2005, Technologies de l'information — Registres de métadonnées (RM) —

Partie 6 : Enregistrement.
ISO 12620:1999, Aides informatiques en terminologie — Catégories de données.

ISO 15924:2004, Information et documentation — Codes pour la représentation des noms d'écritures.

ISO 16642:2003, Applications informatiques en terminologie — Plate-forme pour le balisage de terminologies

informatisées.

ISO 19111:2003, Information géographique — Système de référence spatiales par coordonnées.

ISO 19112:2003, Information géographique — Système de références spatiales par identificateurs

géographiques.
3 Termes et définitions

Pour les besoins de la présente partie de l'ISO 639, les termes et définitions suivants s'appliquent.

Dans les futures versions de l'ISO 639, il est prévu que certains termes et définitions, ou tous, soient

remplacés par une référence aux termes et définitions de la présente partie de l'ISO 639.

NOTE Les définitions de la présente partie de l'ISO 639 sont destinées à l’utilisation pratique dans le contexte des

diverses parties de cette norme et de leurs applications. Pour quelques objectifs linguistiques, il existe des besoins de

définitions plus détaillées, et éventuellement dérivées.
3.1
code

données transformées ou représentées sous différentes formes, selon un jeu de règles préétablies

NOTE L’utilisation du terme « code » n’est pas identique dans tous les systèmes de codage normalisés. En fonction

de l’utilisation définie dans la présente partie de l'ISO 639, un « code » doit être compris comme un tableau de codes (3.2)

et l’ensemble des règles relatives à ce tableau. Chaque ligne d’un tableau de codes est un codet de langue (3.4) (par

exemple, « de - German - allemande – Deutsch » dans la Partie 1 de l'ISO 639), alors que l’élément « de » est l’indicatif

de la langue (3.5).
7) En cours de révision.
2 © ISO 2006 – Tous droits réservés
---------------------- Page: 8 ----------------------
ISO/DIS 639-4
3.2
tableau de codes
tableau des codets faisant partie d’un code
3.3
espace de codage
totalité des valeurs possibles d’un ensemble d’indicatifs au sein d’un code

EXEMPLE Toutes les suites de deux lettres (aa–zz) forment l’espace de codage du code de la langue alpha-2

spécifié dans la Partie 1 de la norme ISO.

NOTE Les codes de langue alpha-3 spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent le même espace de

codage : aucun indicatif de langue affecté dans une des parties ne peut être affecté à un autre élément d’une autre partie.

3.4
codet
entrée individuelle d’un code

NOTE Dans les codes de langues décrits de l'ISO 639, chaque codet se compose d’un indicatif de langue et des

noms de la langue correspondante.
3.5
indicatif de langue
symbole de langue

chaîne de lettres assignée à une unité linguistique dans le but de la représenter de façon unique

NOTE 1 Dans les codes de langues décrits dans les Parties 1, 2, 3 et 5 de l'ISO 639, chaque indicatif de langue se

compose de deux ou trois lettres.
NOTE 2 Voir 4.1.
3.6
langue

utilisation systématique de sons, caractères, symboles ou signes pour exprimer ou communiquer un sens ou

un message
NOTE Voir également 4.1 et 4.2.
3.7
langue individuelle
langue (3.6) distincte de toute autre
NOTE Voir 4.2.
3.8
dialecte

variante linguistique (3.14) propre à une zone géographique ou à un groupe d’utilisateurs d’une langue

NOTE Voir 4.5.
3.9
macro-langue

langue (3.6) qui, dans un but particulier, peut se subdiviser en deux ou plusieurs langues individuelles (3.7)

NOTE Voir 4.3.
3.10
groupe de langues

ensemble de deux ou plusieurs langues individuelles (3.7) qui, dans un but particulier, peut être traité

comme une seule unité
© ISO 2006 – Tous droits réservés 3
---------------------- Page: 9 ----------------------
ISO/DIS 639-4
NOTE Voir 4.6.
3.11
famille de langues

ensemble de deux ou plusieurs langues individuelles (3.7) apparentées du fait de leur origine commune

NOTE Dans certains cas exceptionnels, une famille de langues peut ne comprendre qu’une seule langue

individuelle.
3.12
groupe restreint
groupe de langues (3.10) qui exclut explicitement des langues spécifiées
NOTE Voir 4.6.
3.13
variation linguistique
variante continue au sein et entre des langues individuelles (3.7)

NOTE Une variation linguistique peut être considérée comme une variation dans le temps, l’espace, du fait d’une

appartenance culturelle, etc.
3.14
variante linguistique

variante d’une langue individuelle (3.7) qu’il est possible d’identifier et de nommer

3.15
variante standard
variante linguistique (3.14) possédant un haut niveau de normalisation et d’état

NOTE Une variante standard d’une langue peut généralement s’utiliser dans une communication publique ou

officielle et pour la communication entre des utilisateurs de différentes variantes linguistiques

3.16
système d’écriture

système d’écriture d’une langue (3.6), y compris l’écriture (3.17) et le jeu de caractères utilisés

NOTE Voir également 4.9.
3.17
écriture

ensemble de caractères graphiques utilisé pour la forme écrite d’une ou plusieurs langues

[ISO 15924 et ISO/CEI 10646]
NOTE Voir également 4.9.
3.18
orthographe

ensemble de règles d’orthographe applicable aux mots et au texte d’une ou plusieurs langues

3.19
transcription

système de représentation d’un texte dans une écriture différente du texte original

NOTE Le résultat textuel est également appelé « transcription ».
4 © ISO 2006 – Tous droits réservés
---------------------- Page: 10 ----------------------
ISO/DIS 639-4
3.20
translittération

transcription (3.19) qui permet de reconstruire l’écriture originale sans perdre d’informations

NOTE Le résultat textuel est également appelé « translittération ».
3.21
langue écrite

langue individuelle (3.7) ou variante linguistique (3.14) communément représentée par écrit avec une

orthographe relativement normalisée (3.18)
3.22
langue orale

langue individuelle (3.7) ou variante linguistique (3.14) représentée sous forme orale

NOTE Une langue orale peut se représenter par écrit à l’aide d’un système d’écriture phonétique dans lequel les

caractères représentent directement des sons (phonèmes).
3.23
langue vivante

langue individuelle (3.7) ou variante linguistique (3.14) actuellement utilisée, en particulier sous forme

orale
3.24
langue morte

langue individuelle (3.7) ou variante linguistique (3.14) qui n’est plus utilisée et qui n’a pas de langue

héritée
NOTE Voir 4.7.
3.25
langue ancienne

langue morte (3.24) dotée d’une littérature et d’un état particulier dans la communauté scientifique

NOTE Voir 4.7.
3.26
langue historique

état historique précédemment connu d’une langue vivante (3.23) ou d’une langue morte (3.24)

EXEMPLE L'anglo-saxon anglais et l’anglais médiéval sont des langues historiques de l’anglais.

NOTE Voir 4.7.
3.27
langue naturelle

langue (3.6) utilisée pour la communication humaine et qui n’est pas une langue artificielle (3.28)

3.28
langue artificielle
langue (3.6) utilisée pour la communication humaine et conçue artificiellement
NOTE Voir également 4.8.
© ISO 2006 – Tous droits réservés 5
---------------------- Page: 11 ----------------------
ISO/DIS 639-4
4 Concepts fondamentaux de codage des langues
4.1 Indicatifs de langue et langues

Un indicatif de langue représente une langue qui peut également se représenter par un ou plusieurs noms de

langues. Les objets de l'identification sont les langues elles-mêmes ; les noms de langue sont des moyens

par lesquels sont désignées les langues dénommées par les indicatifs de langue.

Les langues ne sont pas des objets statiques dont chaque instanciation est identique à chaque autre. Chaque

langue correspond à une certaine plage de variation de l'expression linguistique. Dans les diverses parties

de l'ISO 639, un indicatif de langue désigne donc une certaine plage de variante linguistique. La plage de

variante indiquée peut avoir trois domaines d'application différents : langue individuelle, macro-langue et

groupe de langues. De plus, les langues représentées peuvent être de divers types : langues vivantes,

langues anciennes, langues construites artificiellement, etc. L'exposé suivant fournit une explication plus

détaillée de l'attribution des indicatifs pour les différents domaines d'application ou pour les différents types de

langues dans l'ISO 639.
4.2 Langues individuelles

Les indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont censés indiquer des langues individuelles différentes, à

moins que le nom de la langue fasse explicitement référence à un groupe de langues.

Il n'existe pas de définition unique d’une « langue » qui soit acceptée par tous et qui convienne à tous les

besoins. Par conséquent, il peut y avoir désaccord, même entre locuteurs ou entre linguistes, sur la question

de savoir si deux variantes représentent des dialectes d'une même langue ou deux langues distinctes.

Pour l'ISO 639, les jugements pour savoir si deux variantes sont considérées représenter la même langue ou

des langues différentes sont basés sur divers facteurs, notamment la similarité linguistique, l'intelligibilité, une

littérature commune, les points de vue des locuteurs sur la relation entre langue et identité, pour n’en citer que

quelques-uns. Les critères fondamentaux suivants s’appliquent :

⎯ deux variantes liées sont normalement considérées comme étant des variantes de la même langue si les

personnes parlant chaque variante ont une compréhension fonctionnelle spontanée de l'autre variante

(c'est-à-dire qu'elles peuvent la comprendre en s'appuyant sur la connaissance de leur propre variante

sans devoir apprendre l'autre variante) ;

⎯ lorsque l'intelligibilité orale entre variantes est marginale, l'existence d'une littérature commune ou d'une

identité ethnolinguistique commune avec une variante centrale comprise par ces deux variantes peut

fortement indiquer qu'il conviendrait néanmoins de les considérer comme des variantes de la même

langue ;

⎯ lorsqu'il existe entre les variantes une intelligibilité suffisante qui permette de communiquer, l'existence

d'identités ethnolinguistiques distinctes bien établies peut fortement indiquer qu'il conviendrait néanmoins

...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.