ISO 12200:1999
(Main)Computer applications in terminology — Machine-readable terminology interchange format (MARTIF) — Negotiated interchange
Computer applications in terminology — Machine-readable terminology interchange format (MARTIF) — Negotiated interchange
Applications informatiques en terminologie — Format de transfert de données terminologiques exploitables par la machine (MARTIF) — Transfert négocié
General Information
Buy Standard
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 12200
First edition
1999-10-01
Computer applications in terminology —
Machine-readable terminology interchange
format (MARTIF) — Negotiated interchange
Applications informatiques en terminologie — Format de transfert de
données terminologiques exploitables par la machine (MARTIF) —
Transfert négocié
Reference number
ISO 12200:1999(E)
---------------------- Page: 1 ----------------------
ISO 12200:1999(E)
Contents
Foreword . v
Introduction . vi
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 2
4 Structuring terminological information . 2
5 Terminological entries in MARTIF . 4
5.1 Data categories . 4
5.1.1 Specification of data categories . 4
5.1.2 MARTIF tags . 4
5.1.3 MARTIF attributes . 11
5.1.4 Values of the attribute type . 12
5.2 MARTIF entry structures . 13
5.2.1 MARTIF document structure. 13
5.2.2 The terminological entry . 13
5.2.3 Treatment of quasi-equivalents . 15
5.2.4 Rules governing the . 18
5.2.5 Links . 22
6 Character encoding and the lang attribute . 23
7 Interchange procedures . 24
8 The Document Type Definition (DTD) for MARTIF . 24
8.1 The overall structure of terminology documents . 24
8.2 Prolog . 29
8.2.1 Prolog declarations . 29
8.2.2 MARTIF framework . 31
8.2.3 MARTIF body . 31
8.2.4 MARTIF character entities . 32
8.3 MARTIF header . 33
8.4 MARTIF text . 34
8.4.1 MARTIF components . 34
8.4.2 MARTIF front . 34
8.4.3 MARTIF body . 34
8.4.4 MARTIF back . 36
8.5 Validation . 41
© ISO 1999
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any
means, electronic or mechanical, including photocopying and microfilm, without permission in writing from the publisher.
International Organization for Standardization
Case postale 56 • CH-1211 Genève 20 • Switzerland
Internet iso@iso.ch
Printed in Switzerland
ii
---------------------- Page: 2 ----------------------
© ISO ISO 12200:1999(E)
ANNEX A (normative): Normalized data category representation . 47
ANNEX B (informative): Markup of bibliographic entries . 109
ANNEX C (informative) : Data categories listed according to associated Generic
Identifiers (GIs) and attributes . 121
ANNEX D (informative): Data modeling variance . 127
ANNEX E (informative): Sample MARTIF document . 129
ANNEX F (informative): Terms and definitions taken from
ISO 1087-2 and from ISO 8879:1986 . 133
ANNEX G (informative): Contacts for further information . 135
Bibliography . 136
Index . 137
Index of data categories and links listed in Annex A . 141
iii
---------------------- Page: 3 ----------------------
ISO 12200:1999(E) © ISO
Figures, tables and examples cited in this standard
Figure 1 Sample terminological entry . 3
Figure 2 Example of MARTIF full form tag names . 9
Figure 3 Example of a MARTIF element . 10
Figure 4 The basic structure of a MARTIF terminological entry . 14
Figure 5 Basic components of a MARTIF document . 25
Figure 6 Structure of the document instance . 25
Figure 7 SGML Declaration . 29
Figure 8 ISO 646 subset . 32
Figure 9 The MARTIF framework DTD fragment . 41
Figure 10 The MARTIF body DTD fragment . 44
Figure 11 A sample MARTIF character entity DTD fragment . 46
Table 1 MARTIF tags and their description . 4
Table 2 List of MARTIF attributes . 11
Table A.1 Data category classification . 47
Table A.2 Interpretation for Table A.3 . 51
Table A.3 MARTIF data category representation . 53
Table B.1 Bibliographic data categories . 110
Example 1 Use of the attribute type . 12
Example 2 Use of the attribute lang . 12
Example 3 Full MARTIF term entry . 15
Example 4 Treatment of quasi-equivalents . 16
Example 5 entry . 19
Example 6 entry with use of . 19
Example 7 Use of and notes on notes . 20
Example 8 Use of and . 22
Example 9 Use of . 23
Example 10 Sample MARTIF document . 26
Example 11 Back-matter representation . 38
Example 12 Namespace identifiers . 39
Example 13 Responsibility entry . 40
Example 14 Responsibility references . 40
Example A.1 Concept system . 108
Example A.2 Thesaurus entry . 108
Example B.1 Traditional bibliographic notation (presentational markup) . 119
Example B.2 Sample notation according to ISO 12083 . 119
Example B.3 Sample notation according to ISO 12200-1 . 120
Example E.1 MARTIF Document No. 2 . 129
iv
---------------------- Page: 4 ----------------------
© ISO ISO 12200:1999(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national
standards bodies (ISO member bodies). The work of preparing International Standards is
normally carried out through ISO technical committees. Each member body interested in a
subject for which a technical committee has been established has the right to be represented
on that committee. International organizations, governmental and non-governmental, in liaison
with ISO, also take part in the work. ISO collaborates closely with the International
Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
Draft International Standards adopted by the technical committees are circulated to the
member bodies for voting. Publication as an International Standard requires approval by at
least 75 % of the member bodies casting a vote.
International Standard ISO 12200 was prepared by Technical Committee ISO/TC 37,
Terminology (principles and coordination), Subcommittee SC 3, Computer applications.
The specifications in this International Standard were developed in close cooperation with the
Text Encoding Initiative (TEI) and the Localisation Industry Standards Association (LISA).
ISO 12200 is based on ISO 8879, Standard Generalized Markup Language (SGML). This
International Standard covering negotiated interchange is designed to be as open and flexible
as possible in order to cover all types and forms of terminological entry structures that occur
in terminological databases and specialized dictionaries.
Further parts of ISO 12200 may specify more restricted interchange formats for specific
purposes. The objective of these further parts would be to enable more data to be passed
between systems without customized intervention. Such further parts of ISO 12200 would
specify formats that will be backward compatible with this International Standard so that
documents structured according to further parts of ISO 12200 would be parsable using the
Document Type Definition (DTD) specified in this International Standard, but documents
structured according to this International Standard would not necessarily be parsable with the
DTD specified in one of the further parts of ISO 12200.
Annex A forms an integral part of this International Standard. Annexes B, C, D, E, F and G
are for information only.
v
---------------------- Page: 5 ----------------------
ISO 12200:1999(E) © ISO
Introduction
Terminological data are collected, managed, and stored in a wide variety of terminology
database systems, ranging from personal computer applications for individual users to
mainframe term-bank systems operated by major companies and governmental agencies. The
interchange of terminological data has become increasingly necessary among different
applications, systems, and hardware platforms. This International Standard is designed to
support these needs for efficient data interchange.
ISO 8879, which covers Standard Generalized Markup Language (SGML), provides a method
of describing documents. Instead of encoding how a document is rendered on the page, it
describes the structural properties of the document and the interrelation of the components
making up the document. It is well-known that SGML provides a single universal descriptive
language in which the many available markup systems can be represented to facilitate transfer
of texts (i.e., of information) from one program or application to another. As the use of SGML
grows, it is being more widely used, in accordance with the intentions of its designers, for
marking up text for data interchange and information retrieval, as well as for encoding texts
for manipulation in hypertext environments.
For terminology work in general, the following International Standards are relevant: ISO 704,
ISO 860, ISO 1087 and ISO 10241.
vi
---------------------- Page: 6 ----------------------
© ISO ISO 12200:1999(E)
DATA CATEGORY DATA CATEGORY CONTENT
Subject field appearance of materials
English term opacity
Grammatical information,
part of speech, English term noun
English definition degree of obstruction to the transmission of visible light
English source identifier ASTM Standard E284
English responsibility ASTM Technical Committee E12
Opazität
German term
Grammatical information,
part of speech, German term noun
Grammatical information, gender,
German term feminine
Definition, German Maß für die Lichtundurchlässigkeit
German source identifier DIN 6730:1996-05
German responsibility Normenausschuß Papier und Pappe (NPa) im DIN
French term opacité
Grammatical information,
part of speech, French term noun
Grammatical information, gender,
French term feminine
French definition rapport du flux lumineux incident au flux lumineux
transmis ou réfléchi par un noircissement photographique
French source identifier HJdi1986-539
French responsibility C.I.R.A.D.
Figure 1 — Sample terminological entry displayed by listing data categories and
corresponding data category content
NOTE ± This sample terminological entry represents a realistic working environment where information
on a single concept has been taken from different sources in different languages and combined in a
single terminological entry. Example 3 shows this terminological entry expressed as a MARTIF
, and Example E.1 in Annex E incorporates the same into a full MARTIF
document.
3
---------------------- Page: 7 ----------------------
ISO 12200:1999(E) © ISO
5 Terminological entries in MARTIF
5.1 Data categories
5.1.1 Specification of Data Categories
MARTIF is designed to allow interchange of terminological data residing in terminology
databases of any structure. Therefore each data category within the terminological entry shall
be properly identified and relationships among the data categories shall be encoded within the
entry so that they can be redistributed to any required arrangement in the target database.
The generic identifiers (GIs or tag names) specified in 5.1.2 and attributes specified in 5.1.3
shall be used to mark up (i.e., to name) data categories when they occur in MARTIF
documents. In addition, Annex A specifies the full normalized forms that shall be used for these
data categories in the MARTIF environment, as well as the attribute values that shall be used
with them (see 5.1.4).
Some of these data categories identify sub-categories of information related to terms and the
concepts they represent. Others provide administrative information related to the termi-
nological entry itself and to file management. The data categories listed in Annex A are defined
in ISO 12620 and shall be used for encoding terminological data for interchange using
MARTIF. For this purpose, data category names used in local applications that do not comply
with ISO 12620 shall be converted accordingly. If a data category required in a local
application is not available in ISO 12620, system designers should notify the coordinators of
that standard accordingly (see ISO 12620, Annex E).
5.1.2 MARTIF tags
Table 1 lists the specific Generic Identifiers that shall be used in terminological entries and
bibliographic references within the MARTIF environment.
The MARTIF DTD is designed around three primary categories represented by the generic
identifiers , , and . Annex C lists these and other GIs together with
the data categories associated with them as per the examples shown in Annexes A and B, as
well as those data categories associated with specific attributes.
Table 1 MARTIF tags and their description
Shall contain a single complete terminological entry for one concept
expressed in one language and comprising one or more terms and their
associated descriptive and administrative data, or, in bilingual and
multilingual terminology work, two or more closely related concepts
comprising one or more terms in each language and their associated
descriptive and administrative data.
Attributes include:
type, which classifies the terminological entry as per the data categories
specified in ISO 12620.
4
---------------------- Page: 8 ----------------------
© ISO ISO 12200:1999(E)
Table 1, continued
Language set; within a element, shall be used to group
multiple s and s associated with a single language.
The attribute lang is required, unless inherited
Terminological information group; within a element, shall
contain information elements associated with a single term, all of which
must function on the same level; i.e., embedding within the subordinate
elements of the is not allowed.
The attribute lang is required, unless inherited.
Nested terminological information group; shall be used within a
when some information elements are associated with
internal elements rather than with the entire tig.
The following elements shall be used to accommodate embedding
within the : , , , and
.
The attribute lang is required, unless inherited.
Shall contain a single-word or multi-word term, or a symbolic desig-
nation regarded as a technical term.
Shall contain a element and possibly at least one nested element
in addition to the term.
Shall contain term-related information.
Attributes include:
type, which classifies the as per the data categories
specified in Annex A, A.2 and A.3.
Shall contain a element and possibly at least one nested
element in addition to the term-related information. Shall be used to
accommodate an additional level of embedding inside of the
element.
Shall contain descriptive information such as a definition, context or
explanation describing concepts and terms.
Attributes include:
type, which classifies the as per the data categories specified
in Annex A, A.4 - A.7.
Shall contain a element and possibly at least one nested
element in addition to the descriptive information.
Shall contain administrative data.
Attributes include:
type, which classifies the as per the data categories specified
in Annex A, A.9-A.10.
Shall contain an element and possibly at least one nested
element in addition to the administrative information.
5
---------------------- Page: 9 ----------------------
ISO 12200:1999(E) © ISO
Table 1, continued
Shall contain a single date of the format YYYY-MM-DD, with the
option for date-time notation as YYYY-MM-DD hh:mm:ss.
Attributes include:
type, which classifies the as per data categories specified in
Annex A, A.10.2.1.
Shall contain a note or annotation as comment relating to either an
entire , an entire or or one of the <.Grp>
elements.
Shall be used for note-type information used in when the
content of the note consists of a pick list.
Shall be used for note-type information used in when the
content of the note consists of a pick list.
Shall consist of a pointer to another location in the current document.
Attributes include:
type, which classifies the as per Annex A, A.12.
target, which specifies the destination of the reference as one or more
SGML identifiers.
NOTE ± The GI cannot be associated with supplemental text as content
of the element, as it consists solely of a start-tag with an embedded target. The
, , and elements are all considered to be links because they
connect their current location to another targeted location within a document
or to a location external to the document.
Shall define a reference to another location in the current document, in
terms of one or more identifiable elements. The GI is associated
with supplemental text as content of the element, hence it consists of
a start-tag with an embedded target, followed by the associated text,
and closed by an end-tag.
Attributes include:
type, which classifies the as per Annex A.
target, which specifies the destination of the reference as one or more
SGML identifiers.
Shall define a reference to a graphic, illustration, figure, table, or other
external document or file using an extended pointer notation as the
value of the target attribute of , e.g.,
’documentIdentifier’>, where the id value ’documentIdentifier’ is a code
for the targeted document. The user shall document the extended
pointer notation that is being used by including an appropriate
comment in the element of the DTD header.
6
---------------------- Page: 10 ----------------------
© ISO ISO 12200:1999(E)
Table 1, continued
Attributes include:
type, which classifies the external reference as per Annex A.
target, which specifies the destination of the reference as one or more
SGML identifiers.
NOTE ± External elements targeted by must be accessible to the target
system for import purposes.
Shall be used to mark a word or phrase as graphically highlighted in
contrast to the surrounding text.
Attributes include:
type, which classifies the highlighted material as per Annex A.
target, which specifies the destination of the reference as one or more
SGML identifiers.
NOTE – In terminology management, a major use of is to set off entailed
terms, i.e., terms used in a definition, note, or other textual material that are
defined elsewhere in the terminology resource. See also Annex A, A.2.2.2.
Shall identify a word or phrase as belonging to some language other than
that of the surrounding text.
Attributes include:
lang, which identifies the language of the word or phrase marked.
Shall be used in the back matter and shall contain one or more back-
matter objects, especially shared resources such as bibliographical entries,
responsibility entries, namespace identifiers (URLs and FPIs), frequently
referenced textual material, geographical location lists, external files, and
the like.
Attributes include:
type, which classifies the as per data categories specified
in Annex A, A.11.4.1.
Shall contain an entry generally consisting of a shared resource such as
bibliographic or responsibility information, a namespace identifier, fre-
quently referenced textual material, an item of geographical information,
a reference to an external file, and the like. Bibliographic entries should
reside in the back matter or in an external document (in which case the
bibliographic entry shall be referenced from the back matter using the
element).
NOTE – Some terminology documents contain full bibliographic entries in
undifferentiated format as the content of the source data category (see ISO
12620:1999, A.10.19). This practice encourages redundancy and increased effort
for data maintenance. This information should be converted to back-matter items
if possible.
7
---------------------- Page: 11 ----------------------
ISO 12200:1999(E) © ISO
Table 1, continued
Attributes include:
type, which classifies the as per data categories specified in
Annex A, A.11.4.2. Unless otherwise specified, the type of is
inherited from the type of its respective .
Shall be used in the back matter and shall contain one or more individual
items that are traditionally grouped together, e.g., the items author's
surname and author's first name shall be grouped together in an
of type=author.
Attributes include:
type, which classifies the , primarily according to the data cate-
gories listed in Annex B. This International Standard does not, however,
specify the full range of other data categories that can be used with
.
Shall contain an individual instance of back-matter information.
Attributes include:
type, which classifies information primarily as per the data categories speci-
fied in Annex B for bibliographic information. This International Standard
does not, however, specify the full range of other data categories that can
be used with .
Shall contain one or more s together with a , , or .
Attributes include:
type, which classifies information primarily as per the data categories speci-
fied in Annex B for bibliographic information. This International Standard
does not, however, specify the full range of other data categories that can
be used with .
Figures 2 and 3 provide a schematic representation of the MARTIF full form tag name and of
a full MARTIF element, respectively.
8
---------------------- Page: 12 ----------------------
© ISO ISO 12200:1999(E)
Figure 2 - Example of MARTIF full form tag names
9
---------------------- Page: 13 ----------------------
ISO 12200:1999(E)
© ISO
10
Figure 3 - Example of a MARTIF Element
---------------------- Page: 14 ----------------------
© ISO ISO 12200:1999(E)
5.1.3 MARTIF attributes
The attributes listed in Table 2 shall be used when it is necessary to qualify Generic Identifiers
in a MARTIF document. Global attributes can be used with any MARTIF GI. Every element
shall have an explicit or inherited lang attribute (see Clause 6). The attribute type shall be
associated only with those GIs listed in Table 1 that specify the attribute type.
Table 2: List of MARTIF attributes
Global Attributes:
id Shall be the unique identifier of an element.
According to ISO 8879, the ID value of an id shall consist of an alpha character
followed by a combination of alpha characters, digits, hyphens, or dashes. Each
value of id shall be unique within a given document.
NOTE – If necessary, any element can be assigned an id, although it is more frequently the
case that s are assigned ids. Values of id used in the examples in this Interna-
tional Standard are arbitrarily selected. Aside from the rules stated in this attribute
specification, there are no uniform criteria for assigning meaningful id values in terminology
databases. See also Annex A, A.10.14.
lang Shall indicate the language of the element content. The first two or three characters
of the value of lang shall consist of two or three-letter symbols taken from ISO 639
or ISO 639-2 respectively (see clause 6).
Every MARTIF document shall include the lang attribute after the GI in
the document header, e.g., . This declaration specifies the default
language of the document (e.g., the language of concept-level definitions, notes,
etc.). Elements contained within other elements shall automatically inherit the
language of the higher element unless otherwise marked. The lang attribute shall be
used with or with and unless inherited, although explicit use
of lang is recommended for clarity in multilingual collections. It shall be used with
any other element whose language differs from the language of the element in which
it is embedded.
Nonglobal Attribute:
type Shall be used to associate a generic identifier (GI) with an attribute value in order
to form the complete tag name for a data category.
NOTE – See Annexes A and B for specific use of the attribute type to identify data categories.
11
---------------------- Page: 15 ----------------------
ISO 12200:1999(E)
© ISO
5.1.4 Values of the attribute type
When GIs are used to represent data categories, the GIs and shall be used
independently. As shown in Annexes A and B, other data category names shall be formed by
combining four components (see Figures 2 and 3):
C a generic identifier
C the attribute type
C the = symbol [called a value indicator in SGML]
C a value enclosed in matched pairs of single or double quotation marks
No individual instance of a GI shall be used with more than one data category.
NOTE 1 – Example 1 provides the following three elements of information about the term MARTIF: it
is an acronym (line 4), an admitted term (line 5), and a term taken from ISO 12200 (line 8). The
German in Example 7 in 5.2.4 illustrates a further instance of embedding involving the use of
and embedded qualifiers (Lines 57 and 60).
EXAMPLE 1: Use of the attribute type
1
2
3 MARTIF
4 acronym
5 admitted term
6 Replaced E-TIF (Electronic Terminology
7 Interchange Format) as of August 1995
8
9
10
In cases where the lang= attribute is used or required, its content shall begin with a two or
three letter language symbol taken from ISO 639 or ISO 639-2 (see Table 2 and Example 2).
EXAMPLE 2: Use of the attribute lang
or
NOTE 2 – Annex A lists the data categories taken from ISO 12620, together with their MARTIF full
form tag names. ISO 12620 defines approximately two hundred data categories and permissible
instances used as their content. Tags and attributes are specified in the DTD, but the values of the
attribute type are not listed because it is desirable that the list remain open to accommodate the need
for new data categories. Annex C lists data categories classified according to the generic identifiers and
specific attributes with which they are associated.
12
---------------------- Page: 16 ----------------------
© ISO ISO 12200:1999(E)
5.2 MARTIF entry structures
5.2.1 MARTIF document structure
MARTIF documents shall possess a structure that conforms to ISO 8879 and to the MARTIF
DTD specified in clause 8. This sub-clause discusses the structure of terminological entries (see
Figure 4).
5.2.2 The terminological entry
As illustrated in Example 3, a terminological entry shall be introduced by the tag
and shall contain one or more terms marked with the tag. A single term and its
associated data categories (e.g., , , ), etc.) constitute a
terminological information group. If all these elements function on the same level, the
terminological information group is enclosed in a element. If additional sub-elements
need to be embedded in any of the primary elements, the nested element shall be used,
together with the Group elements , , or . The element
is used when necessary to embed a second level of information inside a
. A can be made up of a single or or of a mixture of two
or more s or s. Multiple s or s in any given language shall be
...
NORME
ISO
INTERNATIONALE
12200
Première édition
1999-10-01
Applications informatiques en
terminologie — Format de transfert de
données terminologiques exploitables par la
machine (MARTIF) — Transfert négocié
Computer applications in terminology — Machine-readable terminology
interchange format (MARTIF) — Negotiated interchange
A
Numéro de référence
ISO 12200:1999(F)
---------------------- Page: 1 ----------------------
ISO 12200:1999(F)
Sommaire Page
1 Domaine d’application. 1
2 Références normatives . 1
3 Termes et définitions. 2
4 Structuration des informations terminologiques. 2
5 Entrées terminologiques dans MARTIF . 3
5.1 Catégories de données. 3
5.1.1 Spécification des catégories de données . 3
5.1.2 Etiquettes MARTIF. 4
5.1.3 Attributs MARTIF. 10
5.1.4 Valeurs de l'attribut type. 10
5.2 Structure des entrées MARTIF . 11
5.2.1 Structure des documents MARTIF. 11
5.2.2 L'entrée terminologique . 11
5.2.3 Traitement des quasi-équivalents. 13
5.2.4 Règles régissant la . 15
5.2.5 Liens . 18
6 Codage des caractères et attribut lang . 18
7 Procédures de transfert . 19
8 Définition du Type de Document (DTD) pour MARTIF. 19
8.1 Structure globale des documents terminologiques. 19
8.2 Prologue. 23
8.2.1 Déclarations du prologue . 23
8.2.2 Cadre MARTIF. 24
8.2.3 Corps MARTIF . 25
© ISO 1999
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication
ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé,
électronique ou mécanique, y compris la photocopie et les microfilms, sans l’accord écrit de
l’éditeur.
Organisation internationale de normalisation
Case postale 56 • CH-1211 Genève 20 • Suisse
Internet iso@iso.ch
ImpriméenSuisse
ii
---------------------- Page: 2 ----------------------
©
ISO ISO 12200:1999(F)
8.2.4 Entités de caractères MARTIF. 25
8.3 En-tête MARTIF. 26
8.4 Texte MARTIF. 27
8.4.1 Composants MARTIF . 27
8.4.2 Avant MARTIF . 27
8.4.3 Corps MARTIF. 27
8.4.4 Arrière MARTIF. 28
8.5 Validation . 32
Annexe A (normative)
Représentation normalisée des catégories de données. 37
Annexe B (informative) Balisage des entrées bibliographiques. 97
Annexe C (informative) Catégories de données énumérées en fonction des
Identifiants Génériques (GI) et des attributs associés . 106
Annexe D (informative) Variance de la modélisation des données. 111
Annexe E (informative) Exemple de document MARTIF. 113
Annexe F (informative)
Termes et définitions extraits d'ISO 1087-2 et d'ISO 8879:1986 . 116
Annexe G (informative) Contacts pour de plus amples renseignements 117
Bibliographie . 118
iii
---------------------- Page: 3 ----------------------
©
ISO 12200:1999(F) ISO
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération
mondiale d’organismes nationaux de normalisation (comités membres de
l’ISO). L’élaboration des Normes internationales est en général confiée aux
comités techniques de l’ISO. Chaque comité membre intéressé par une
étude a le droit de faire partie du comité technique créé à cet effet. Les
organisations internationales, gouvernementales et non gouvernementales,
en liaison avec l’ISO participent également aux travaux. L’ISO collabore
étroitement avec la Commission électrotechnique internationale (CEI) en ce
qui concerne la normalisation électrotechnique.
Les projets de Normes internationales adoptés par les comités techniques
sont soumis aux comités membres pour vote. Leur publication comme
Normes internationales requiert l’approbation de 75 % au moins des
comités membres votants.
La Norme internationale ISO 12200 a été élaborée par le comité technique
ISO/TC 37, Terminologie (principes et coordination), sous-comité SC 3,
Terminologie.
Les spécifications de la présente Norme internationale ont été développées
en étroite collaboration avec l'Initiative de codage de texte (TEI) et
l'Association de normalisation de l'industrie de localisation (LISA).
L’ISO 12200 est basée sur l’ISO 8879, Langage normalisé de balisage
généralisé (SGML). La présente Norme internationale, qui concerne le
transfert négocié, se veut aussi ouverte et souple que possible, de manière
à couvrir tous les types et formes de structures d'entrées terminologiques
rencontrées dans les bases de données terminologiques et les dictionnaires
spécialisés.
Des compléments à l'ISO 12200 pourront définir des formats de transfert
plus restrictifs, utilisables dans des cas spécifiques. Le but de ces
compléments pourrait être de permettre un transfert de volumes plus
importants de données entre systèmes sans intervention personnalisée.
Ces compléments à l’ISO 12200 pourront spécifier des formats rétro-
compatibles avec la présente Norme internationale; de la sorte, les
documents structurés selon les compléments à l’ISO 12200 pourront être
analysés selon la Définition du Type de Document (DTD) spécifiée dans la
présente Norme internationale, tandis que les documents structurés selon
la présente Norme internationale ne pourront pas nécessairement être
analysés selon la DTD spécifiée dans l'un des compléments à l’ISO 12200.
L'Annexe A fait partie intégrante de la présente norme internationale. Les
Annexes B, C, D, E, F et G sont données uniquement à titre d’information.
iv
---------------------- Page: 4 ----------------------
©
ISO ISO 12200:1999(F)
Introduction
Les données terminologiques sont recueillies, gérées et stockées dans des
systèmes de bases de données terminologiques extrêmement variés, allant
des applications sur ordinateur personnel pour utilisateurs individuels aux
banques terminologiques sur ordinateur central exploitées par les grandes
entreprises et les services gouvernementaux. Le besoin de transférer des
données terminologiques entre applications, systèmes et plateformes
informatiques, se développe de jour en jour. La présente Norme
internationale a pour but de satisfaire le besoin d'efficacité accrue du
transfert de données.
L’ISO 8879, Langage normalisé de balisage généralisé (SGML), propose
une méthode de description des documents. Au lieu de coder l'aspect du
document sur la page, la présente Norme internationale décrit les
propriétés structurelles du document et la corrélation entre les éléments qui
le composent. Il est bien connu que SGML propose un langage descriptif
universel unique, dans lequel les nombreux systèmes de balisage existants
peuvent être représentés pour faciliter le transfert de textes (c'est-à-dire
d'informations) depuis un programme ou une application vers un (une)
autre. Avec le développement de l'utilisation de SGML, l'utilisation de la
présente Norme internationale s'est répandue, conformément au souhait de
ses concepteurs, pour le balisage de textes en vue du transfert de données
et de la récupération d'informations, ainsi que pour le codage de textes en
vue de leur manipulation dans les environnements hypertexte.
Les Normes internationales suivantes sont pertinentes pour l'activité
terminologique en général: ISO 704, ISO 860, ISO 1087 et ISO 10241.
v
---------------------- Page: 5 ----------------------
NORME INTERNATIONALE © ISO ISO 12200:1999(F)
Applications informatiques en terminologie — Format de transfert
de données terminologiques exploitables par la machine
(MARTIF) — Transfert négocié
1 Domaine d’application
La présente Norme internationale est basée sur l’ISO 8879. Elle concerne le transfert négocié et se veut aussi
ouverte et souple que possible, de manière à couvrir tous les types et formes de structures d'entrées
terminologiques rencontrées dans les bases de données terminologiques et les dictionnaires spécialisés, ainsi que
dans les diverses applications et plateformes informatiques et les divers systèmes d'exploitation. Elle est surtout
prévue pour être utilisée avec des données terminologiques qui peuvent être stockées, lues, récupérées et
manipulées par un ordinateur. Elle ne se limite pas à un logiciel ou à une configuration matérielle spécifique.
Le premier objectif de la présente Norme internationale est d'aider les programmeurs et les analystes à concevoir
des logiciels d'import/export pour le transfert de données entre bases de données terminologiques. La Définition du
Type de Document (DTD) spécifiée dans la présente Norme internationale permet la validation partielle des fichiers
de transfert à l'aide d'un analyseur SGML généraliste (c'est-à-dire la confirmation que le document est conforme à la
structure spécifiée dans la DTD).
NOTE Avant le premier transfert entre nouveaux partenaires, un certain niveau d'examen des données, de négociation et de
mise au point des routines de conversion, peut être nécessaire.
La présente Norme internationale peut également être utilisée pour la création de routines de conversion permettant
d'accommoder les données conformément à l’ISO 6156. Il est recommandé d'utiliser la présente Norme
internationale conjointement avec l’ISO 12620.
La présente Norme internationale n'a pas pour but de spécifier la structure et la fonction des bases de données
individuelles.
2 Références normatives
Les normes suivantes contiennent des dispositions qui, par suite de la référence qui en est faite, constituent des
dispositions valables pour la présente Norme internationale. Au moment de la publication, les éditions indiquées
étaient en vigueur. Toute norme est sujette à révision et les parties prenantes des accords fondés sur la présente
Norme internationale sont invitées à rechercher la possibilité d’appliquer les éditions les plus récentes des normes
indiquées ci-après. Les membres de la CEI et de l'ISO possèdent le registre des Normes internationales en vigueur
à un moment donné.
ISO 639:1988, Code pour la représentation des noms de langue.
ISO 639-2:1998, Code pour la représentation des noms de langue — Partie 2: Code alpha-3.
ISO/CEI 646:1991, Technologies de l'information — Jeu ISO de caractères codés à 7 éléments pour l’échange
d'informations.
1)
ISO 1087-2:— , Travaux terminologiques — Vocabulaire — Partie 2: Applications informatiques.
1) À publier.
1
---------------------- Page: 6 ----------------------
©
ISO 12200:1999(F) ISO
ISO 3166-1:1997, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 1: Codes pays.
ISO 8601:1988, Eléments de données et formats d’échange — Echange d'information — Représentation de la date
et de l'heure.
ISO 8879:1986, Traitement de l'information — Systèmes bureautiques — Langage normalisé de balisage généralisé
(SGML).
ISO/CEI 10646-1:1993, Technologies de l'information — Jeu universel de caractères codés à plusieurs octets —
Partie 1: Architecture et table multilingue.
ISO 12083:1994, Information et documentation — Préparation et balisage de manuscrits électroniques.
ISO 12620:1999, Terminologie — Applications informatiques en terminologie — Catégories de données.
3 Termes et définitions
Pour les besoins de la présente Norme internationale, les termes et définitions donnés dans l’ISO 8879 et
l’ISO 1087-2 ainsi que les suivants s'appliquent. Pour le confort des utilisateurs de la présente Norme internationale,
certaines définitions pertinentes extraites de l’ISO 8879 et l’ISO 1087-2 sont reprises dans l'annexe F. La définition
donnée ci-après a été adaptée pour éviter toute ambiguïté dans le contexte de la présente Norme internationale.
3.1
attribut
qualité caractéristique d'un identifiant générique
NOTE Adapté de l'ISO 8879:1986.
4 Structuration des informations terminologiques
L'unité de base utilisée pour la gestion des données terminologiques dans les documents MARTIF doit être l'entrée
terminologique. Autrement dit, un document MARTIF doit être composé d'entrées terminologiques. Une entrée
terminologique doit contenir des informations relatives à un concept spécifique ou à plusieurs concepts étroitement
liés entre eux, un ou plusieurs termes dans une ou plusieurs langues, et d'autres informations descriptives et
administratives considérées utiles dans un contexte donné.
NOTE Les données terminologiques peuvent prendre la forme de bases de données terminologiques ou servir à imprimer des
documents sur papier, des dictionnaires techniques ou terminologiques, des vocabulaires et, dans une certaine mesure, des the-
sauri de documentation. Cependant, pour les applications SGML, les bases de données terminologiques elles-mêmes peuvent
être considérées comme des documents. La structure et la présentation des données varient considérablement d'une base de
donnée terminologique à l'autre, en raison de la diversité des besoins des utilisateurs, des méthodes employées et des besoins
des logiciels. Ces variations reflètent également le caractère monolingue, bilingue ou multilingue de l'entrée, et indiquent aussi si
l'entrée contient des informations prescriptives ou descriptives, ainsi que l'environnement de travail dans lequel le fichier de termi-
nologie est créé et utilisé.
Etant donné les différences de conception des diverses bases de données, les structures des entrées
terminologiques individuelles doivent correspondre à la structure MARTIF pour le transfert. Il doit cependant être
noté que, si la structure de la base de données source est plus riche que celle de la base de données cible, seules
une restructuration et un réétiquetage appropriés de la base de données cible permettront d'éviter une perte
d'informations.
La figure 1 représente un exemple d’entrée terminologique pouvant être générée dans un environnement de travail
multilingue.
2
---------------------- Page: 7 ----------------------
©
ISO ISO 12200:1999(F)
CONTENU DE LA CATEGORIE
CATEGORIE DE DONNEES
DE DONNEES
Champ sujet aspect des matériaux
Terme anglais opacity
Information grammaticale, partie du discours, terme anglais nom
Définition en anglais degree of obstruction to the transmission of
visible light
Identifiant source anglais norme ASTM E284
Responsabilité anglaise comité technique ASTM E12
Terme allemand Opazität
Information grammaticale, partie du discours, terme allemand nom
Information grammaticale, genre, terme allemand féminin
Définition en allemand Maß für die Lichtundurchlässigkeit
Identifiant source allemand DIN 6730:1992-08
Responsabilité allemande Normenausschuß Papier und Pappe (Npa)
im DIN
Terme français opacité
Information grammaticale, partie du discours, terme français nom
Information grammaticale, genre, terme français féminin
Définition en français rapport du flux lumineux, incident au flux
lumineux transmis ou réfléchi par un
noircissement photographique
Identifiant source français HJdi1986-539
Responsabilité française C.I.R.A.D.
Figure 1 — Exemple d'entrée terminologique affichée par énumération des catégories de données et du
contenu correspondant de chaque catégorie de données
NOTE Cet exemple d'entrée terminologique représente un environnement de travail réaliste, où des informations sur un concept
donné ont été extraites de différentes sources dans différentes langues, pour être combinées sous une entrée terminologique
unique. L'exemple 3 montre cette entrée terminologique exprimée sous forme de MARTIF, et l'exemple E.1 de
l'annexe E intègre la même dans un document MARTIF complet.
5 Entrées terminologiques dans MARTIF
5.1 Catégories de données
5.1.1 Spécification des catégories de données
MARTIF est conçu pour permettre le transfert de données terminologiques résidant dans des bases de données
terminologiques, indépendamment de la structure de ces dernières. C'est pourquoi chaque catégorie de données
contenue dans l'entrée terminologique devra être correctement identifiée, et les relations entre catégories de
données devront être codées dans l'entrée, pour permettre de les redistribuer selon n'importe quel arrangement
dans la base de données cible.
3
---------------------- Page: 8 ----------------------
©
ISO 12200:1999(F) ISO
Les identifiants génériques (GI ou noms d'étiquettes) spécifiés en 5.1.2. et les attributs spécifiés en 5.1.3. devront
être utilisés pour baliser (nommer) les catégories de données rencontrées dans les documents MARTIF. En outre,
l'Annexe A spécifie les formes normalisées complètes à utiliser pour ces catégories de données dans
l'environnement MARTIF, ainsi que les valeurs des attributs à leur appliquer (voir 5.1.4.).
Certaines de ces catégories de données identifient des sous-catégories d'informations liées aux termes et aux
concepts qu'ils représentent. D'autres donnent des informations administratives concernant l'entrée terminologique
elle-même et la gestion de fichiers. Les catégories de données dont la liste est donnée dans l'Annexe A sont
définies dans l’ISO 12620 et devront être utilisées pour coder les données terminologiques à transférer à l'aide de
MARTIF. A cet effet, les noms des catégories de données utilisées dans les applications locales qui ne respectent
pas l’ISO 12620 devront être convertis en conséquence. Si une catégorie de données requise dans une application
locale n'est pas proposée dans l’ISO 12620, les concepteurs du système devront en avertir les coordinateurs (voir
ISO 12620:1999, annexe E).
5.1.2 Etiquettes MARTIF
Le Tableau 1 est la liste des Identifiants Génériques spécifiques à utiliser dans l'environnement MARTIF pour les
applications terminologiques.
La DTD MARTIF est conçue autour de trois catégories primaires représentées par les identifiants génériques
, et . L'Annexe C donne la liste de ces GI et des autres, et indique les catégories de
données qui leur sont associées selon les exemples indiqués dans les Annexes A et B, et les catégories de données
associées à des attributs spécifiques.
Tableau 1 — Les étiquettes MARTIF et leur description
Doit contenir une seule entrée terminologique complète pour un concept exprimé
dans une langue et comportant un ou plusieurs termes et leurs données
descriptives et administratives associées ou, dans le cadre d'un travail
terminologique bilingue ou multilingue, deux ou plusieurs concepts proches
comprenant un ou plusieurs termes dans chaque langue et leurs données
descriptives et administratives associées.
Attributs :
type, qui classe l'entrée terminologique selon les catégories de données
spécifiées dans l’ISO 12620.
Ensemble linguistique : dans un élément , doit être utilisé pour
regrouper plusieurs et associés à une seule langue.
L'attribut lang est obligatoire ou hérité.
Groupe d'informations terminologiques ; dans un élément , doit
contenir les éléments d'information associés à un terme unique, qui doivent tous
fonctionner au même niveau. Autrement dit, il ne peut pas y avoir d'imbrication
dans les éléments subordonnés du .
L'attribut lang est obligatoire ou hérité.
Groupe d'informations terminologiques imbriqué ; doit être utilisé dans une
lorsque des éléments d'information sont associés à des éléments
internes et non pas à l'ensemble du tig.
Les éléments suivants devront être utilisés pour organiser l'imbrication dans le
: , , et .
L'attribut lang est obligatoire ou hérité.
Doit contenir un terme à un seul ou à plusieurs mots, ou une désignation
symbolique considérée comme un terme technique.
Doit contenir un élément et, éventuellement, au moins un élément
imbriqué en plus du terme.
4
---------------------- Page: 9 ----------------------
©
ISO ISO 12200:1999(F)
Tableau 1 — Les étiquettes MARTIF et leur description
Doit contenir des informations relatives au terme.
Attributs :
type, qui classe la selon les catégories de données spécifiées dans
l'Annexe A, A.2 et A.3.
Doit contenir un élément et, éventuellement, au moins un élément
imbriqué en plus des informations relatives au terme. Doit être utilisé pour
organiser un niveau supplémentaire d'imbrication dans l'élément .
Doit contenir des informations descriptives telles que la définition, le contexte ou
des explications sur les concepts et les termes.
Attributs :
type, qui classe la selon les catégories de données spécifiées dans
l'Annexe A, A.4 et A.7.
Doit contenir un élément et, éventuellement, au moins un élément
imbriqué en plus des informations descriptives.
Doit contenir des informations administratives.
Attributs :
type, qui classe l' selon les catégories de données spécifiées dans
l'Annexe A, A.9 et A.10.
Doit contenir un élément et, éventuellement, au moins un élément
imbriqué en plus des informations administratives.
Doit contenir une seule date au format AAAA-MM-DD, avec l'option de notation
de la date et de l'heure sous la forme AAAA-MM-DD hh:mm:ss.
Attributs :
type, qui classe la selon les catégories de données spécifiées dans
l'Annexe A, A.10.2.1.
Doit contenir une note ou une annotation constituant un commentaire relatif à une
entière, à un ou entier, ou à l'un des éléments <…Grp>.
Doit être utilisé pour les informations de type note utilisées dans
lorsque le contenu de la note comporte une liste de choix.
Doit être utilisé pour les informations de type note utilisées dans
lorsque le contenu de la note comporte une liste de choix.
Doit consister en un pointeur vers un autre emplacement dans le document en
cours.
Attributs :
type, qui classe le selon l'Annexe A, A.12.
target, qui spécifie la destination de la référence sous forme d'un ou de plusieurs
identifiants SGML.
NOTE Le GI ne peut pas être associé à du texte supplémentaire en tant que contenu
de l'élément, car il consiste uniquement en une étiquette de départ avec une cible
imbriquée. Les éléments , et sont tous considérés comme des liens
parce qu'ils mettent en relation leur emplacement courant avec un autre emplacement
cible à l'intérieur d'un document ou avec un emplacement extérieur au document.
5
---------------------- Page: 10 ----------------------
©
ISO 12200:1999(F) ISO
Tableau 1 — Les étiquettes MARTIF et leur description
Doit définir une référence à un autre emplacement dans le document courant,
exprimée en un ou plusieurs éléments identifiables. Le GI est associé à du
texte supplémentaire en tant que contenu de l'élément. De ce fait, il consiste en
une étiquette de départ avec une cible imbriquée, suivie du texte associé, et de
l'étiquette de fin, qui le ferme.
Attributs :
type, qui classe la selon l'Annexe A.
target, qui spécifie la destination de la référence sous forme d'un ou de plusieurs
identifiants SGML.
Doit définir une référence à un graphique, une illustration, une figure, un tableau,
ou tout autre document ou fichier externe, à l'aide d'une notation de pointeur
étendu en tant que valeur de l'attribut target de , par exemple
target='documentIdentifier'>, où la valeur de l'identifiant 'documentIdentifier' est
un code représentant le document cible. L'utilisateur doit documenter la notation
de pointeur étendu qu'il utilise en intégrant un commentaire adéquat dans
l'élément de l'en-tête de la DTD.
Attributs :
type, qui classe la référence externe selon l'Annexe A.
target, qui spécifie la destination de la référence sous forme d'un ou de plusieurs
identifiants SGML.
NOTE Les éléments externes ciblés par doivent être accessibles pour le système
cible en vue de l'importation.
Doit être utilisé pour marquer un mot ou une expression comme étant mis en
évidence graphiquement par rapport au texte environnant.
Attributs :
type, qui classe l'élément mis en évidence selon l'Annexe A.
target, qui spécifie la destination de la référence sous forme d'un ou de plusieurs
identifiants SGML.
NOTE En gestion terminologique, est surtout utilisé pour mettre en valeur les termes
de renvoi, c'est-à-dire les termes utilisés dans une définition, une remarque, ou tout autre
élément du texte, et définis ailleurs dans la ressource terminologique. Voir
aussi l'Annexe A, A.2.2.2.
Doit identifier un mot ou une expression comme appartenant à une langue autre
que celle du texte environnant ;
Attributs :
lang, qui identifie la langue du mot ou de la phrase marqué(e).
Doit être utilisé dans l'appendice et doit contenir un ou plusieurs objets
d'appendice, en particulier les ressources partagées telles que les entrées
bibliographiques, les entrées de responsabilité, les identifiants d'espace de nom
(URL et FPI), les éléments textuels fréquemment référencés, les listes
d'emplacements géographiques, les fichiers externes, etc.
Attributs :
type, qui classe la selon les catégories de données spécifiées en
Annexe A, A.11.4.1.
6
---------------------- Page: 11 ----------------------
©
ISO ISO 12200:1999(F)
Tableau 1 — Les étiquettes MARTIF et leur description
Doit contenir une entrée qui consiste généralement en une ressource partagée
telle que des informations bibliographiques ou de responsabilité, un identifiant de
nom d'espace, des éléments textuels fréquemment référencés, une information
géographique, une référence à un fichier externe, etc. Les entrées
bibliographiques doivent résider dans l'appendice ou dans un document externe
(auquel cas, l'entrée bibliographique doit être référencée à partir de l'appendice à
l'aide de l'élément ).
NOTE Certains documents terminologiques contiennent des entrées bibliographiques
complètes sous un format indifférencié, qui constituent le contenu de la catégorie de
données source (voir ISO 12620:1999, A.10.19). Cette pratique entraîne des redondances
et accroît le travail de maintenance des données. Ces informations doivent être converties,
si possible, en éléments d'appendice.
Attributs :
type, qui classe le selon les catégories de données spécifiées en
Annexe A, A.11.4.2. Sauf mention contraire, le type du est hérité du
type de la correspondante.
Doit être utilisé dans l'appendice et doit contenir un ou plusieurs éléments
individuels qui sont habituellement regroupés ensemble. Par exemple les
éléments nom de l'auteur et prénom de l'auteur seront regroupés dans un
de type=author.
Attributs :
type, qui classe le , tout d’abord en fonction des catégories de données
spécifiées en Annexe B. Cependant, la présente norme internationale ne définit
pas toutes les autres catégories de données pouvant être utilisées avec
.
Doit contenir une instance individuelle d'informations d'appendice.
Attributs :
type, qui classe les informations, tout d’abord en fonction des catégories de
données spécifiées en Annexe B pour les informations bibliographiques.
Cependant, la présente norme internationale ne définit pas toutes les autres
catégories de données pouvant être utilisées avec .
Doit contenir un ou plusieurs , ainsi qu'un , une ou une .
Attributs :
type, qui classe les informations, tout d’abord en fonction des catégories de
données spécifiées en Annexe B pour les informations bibliographiques.
Cependant, la présente norme internationale ne définit pas toutes les autres
catégories de données pouvant être utilisées avec .
La Figure 2 donne une représentation schématique de formes complètes de noms d’étiquettes MARTIF, et la
Figure 3 donne un exemple d’élément MARTIF.
7
---------------------- Page: 12 ----------------------
©
ISO 12200:1999(F) ISO
Étiquette de début (Noms d’étiquettes MARTIF, forme complète)
délimiteur de fermeture
valeur de l’attribut type
indicateur de valeur
attribut type
identifiant générique
délimiteur d’ouverture
(pour une étiquette de début)
Étiquette de fin
délimiteur de fermeture
identifiant générique
délimiteur d’ouverture
(pour une étiquette de fin)
Figure 2 — Exemple de forme
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.