ISO 24613-4:2021
(Main)Language resource management — Lexical markup framework (LMF) — Part 4: TEI serialization
Language resource management — Lexical markup framework (LMF) — Part 4: TEI serialization
This document describes the serialization of the lexical markup framework (LMF) model defined as an XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 4: Sérialisation TEI
Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre les classes de l'ISO 24613‑1 (modèle de base du LMF) ainsi que les classes fournies par l'ISO 24613‑2 (modèle de dictionnaire lisible par ordinateur, MRD) et l'ISO24613‑3 (extension étymologique).
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 4. del: Serializacija TEI
General Information
Relations
Buy Standard
Standards Content (Sample)
SLOVENSKI STANDARD
SIST ISO 24613-4:2021
01-junij-2021
Nadomešča:
SIST ISO 24613:2013
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 4. del:
Serializacija TEI
Language resource management - Lexical markup framework (LMF) - Part 4: TEI
serialization
Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF) - Partie 4:
Sérialisation TEI
Ta slovenski standard je istoveten z: ISO 24613-4:2021
ICS:
01.020 Terminologija (načela in Terminology (principles and
koordinacija) coordination)
01.140.20 Informacijske vede Information sciences
35.240.30 Uporabniške rešitve IT v IT applications in information,
informatiki, dokumentiranju in documentation and
založništvu publishing
SIST ISO 24613-4:2021 en,fr
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.
---------------------- Page: 1 ----------------------
SIST ISO 24613-4:2021
---------------------- Page: 2 ----------------------
SIST ISO 24613-4:2021
INTERNATIONAL ISO
STANDARD 24613-4
First edition
2021-01
Language resource management —
Lexical markup framework (LMF) —
Part 4:
TEI serialization
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
Reference number
ISO 24613-4:2021(E)
©
ISO 2021
---------------------- Page: 3 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved
---------------------- Page: 4 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
Contents Page
Foreword .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 General principles . 1
5 Serialization of the LMF core model (ISO 24613-1) . 2
5.1 Implementing the LexicalResource class . 2
5.2 Implementing the GlobalInformation class. 2
5.3 Implementing the Lexicon class . 3
5.4 Implementing the LexiconInformation class . 4
5.5 Implementing the LexicalEntry class . 4
5.6 Implementing the Form and Lemma classes . 5
5.6.1 Form class . 5
5.6.2 Lemma class . 5
5.7 Implementing the GrammaticalInformation class . 5
5.8 Implementing the Sense class . 7
5.9 Implementing the Definition class . 7
5.10 Implementing the OrthographicRepresentation class . 8
5.11 Implementing the CrossREF class . 8
5.12 Data category selection. 9
6 Serialization of the MRD model (ISO 24613-2) . 9
6.1 Implementing the form representations for the Form class . 9
6.2 Implementing classes derived from the Form class.11
6.2.1 General principles .11
6.2.2 Implementing the WordForm class .11
6.2.3 Implementing the Stem class .11
6.2.4 Implementing the WordPart class .11
6.2.5 Implementing the RelatedForm class .12
6.3 Implementing the Bibliography class .12
6.4 Implementing the CrossREF mechanism to refer to external media files .12
6.5 Implementing the Example class .12
6.6 Implementing the Translation class .13
6.7 Implementing the TextRepresentation class .13
6.8 Implementing the SubjectField class .14
6.9 Implementing the CrossREF mechanism to represent related entries .14
7 Implementing the classes from the etymological extension (ISO 24613-3) .15
7.1 Implementing the Etymology class .15
7.2 Implementing the Etymon class.15
7.2.1 Referencing forms in an etymon .16
7.2.2 Representing the meaning of an etymon .16
7.2.3 Representing the language of an etymon .16
7.2.4 Associating grammatical information to an etymon.16
7.2.5 Dating an etymon .16
7.2.6 Providing sources associated with an etymon .17
7.2.7 Further prose component in an etymological description .17
7.3 Implementing the EtyLink class .17
7.4 Implementing the CognateSet class .17
7.5 Implementing the Cognate class .17
7.6 Implementing the Gloss class .18
8 Additional mechanisms .18
8.1 Overview .18
8.2 Representing punctuation marks with .18
© ISO 2021 – All rights reserved iii
---------------------- Page: 5 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
8.3 Representing various labels with .18
8.4 Encoding simple separating characters with .19
8.5 Providing rendition information with the @rend attribute.19
8.6 Usage example of the additional features introduced in Clause 8 .19
Bibliography .20
iv © ISO 2021 – All rights reserved
---------------------- Page: 6 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to
the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see
www .iso .org/ iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
1)
This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—
2)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/FDIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
© ISO 2021 – All rights reserved v
---------------------- Page: 7 ----------------------
SIST ISO 24613-4:2021
---------------------- Page: 8 ----------------------
SIST ISO 24613-4:2021
INTERNATIONAL STANDARD ISO 24613-4:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope
This document describes the serialization of the lexical markup framework (LMF) model defined as an
XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the
classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine
readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
ISO 24613-3, Language resource management — Lexical markup framework (LMF) — Part 3: Etymological
extension
IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). September 2009. Best Current
Practice. https:// tools .ietf .org/ html/ bcp47
W3C XML Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 November 2008,
http:// www .w3 .org/ TR/ xml/
TEI P5, Guidelines for Electronic Text Encoding and Interchange. [Version number: 4.1.0]. [Last modified
date: 2020-08-19]. TEI Consortium. http:// www .tei -c .org/ Guidelines/ P5/
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and in
ISO 24613-3 apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 General principles
This document aims at providing mostly univocal constructs for each LMF class from the core model
(ISO 24613-1), the MRD extension (ISO 24613-2) and the etymological extension (ISO 24613-3), thus
making the original Text Encoding Initiative (TEI) recommendations from the dictionary chapter
© ISO 2021 – All rights reserved 1
---------------------- Page: 9 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
terser (see References [4], [8], [9], [11] and [14]), while eliciting specific constraints needed to align
with ISO 24613 in general. For instance, precise value lists are given for some attributes such as @type.
In addition, this document complies with the cardinalities expressed in ISO 24613-1, ISO 24613-2 and in
ISO 24613-3.
Unless explicitly stated, all resulting constructs shall be valid TEI representations, which means that
the specification described in this document corresponds to a pure subset of the TEI Guidelines. They
shall thus be well-formed XML documents as specified by the W3C XML recommendation.
This document requires compliance with ISO 24613-1, ISO 24613-2, and ISO 24613-3 when implementing
data categories referred to in the respective parts.
Nevertheless, this document does not elaborate on the metadata aspects from LMF, since the TEI
header, i.e. the metadata component attached to any TEI document, is in essence rich enough in that it
represents all the aspects related to the creation, the content description, the versioning and publishing
of a textual document as a whole.
In all XML examples in this document and in order to simplify the actual representations, it is assumed,
unless otherwise stated, that XML elements belong to the TEI namespace, thus assuming that all
examples are within the scope of the following XML namespace declaration:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"
An updated TEI ODD specification corresponding to this document is available from Reference [12]
together with additional examples.
5 Serialization of the LMF core model (ISO 24613-1)
5.1 Implementing the LexicalResource class
3)
The LexicalResource class shall be implemented by means of the element which groups
together one or several TEI documents for each specific lexicon. The element shall include
a @type attribute with the value “lexicalResource” (see Table 1). In the case where the lexical resource
contains only one lexicon, this level may be omitted, so that the document directly starts with a
root element (see 5.3).
Table 1 — LexicalResource class
LMF class TEI construct
…
/LexicalResource/
teiCorpus>
5.2 Implementing the GlobalInformation class
4)
The GlobalInformation class shall be implemented by means of the TEI element , as a
direct child of the element (see Table 2). For the actual use of the element,
the additional constraints given in the TEI Guidelines shall be followed when encoding any kind of
information related to administrative, documentary and bibliographic information attached to the
corresponding lexical resource.
Table 2 — GlobalInformation class
LMF class TEI construct
…
/GlobalInformation/
3) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiCorpus .html
4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiHeader .html
2 © ISO 2021 – All rights reserved
---------------------- Page: 10 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
The further requirements concerning the GlobalInformation class are implemented as follows:
— since the TEI serialization is based on the W3C XML recommendation, it implements the @xml:
lang attribute to indicate the working language information corresponding to the content of any
specific element. @xml: lang content shall be compliant with IETF BCP 47. There is thus no need for
a specific implementation of the /language coding/ data category in order to ensure compliance of
this document with ISO 24613-1;
— IETF BCP 47 also relies on ISO 15924 for the coding of script names. There is thus no need to have a
specific mechanism in this document for implementing the /script coding/ data category;
— the /character encoding/ data category is implemented in the XML declaration of a TEI conformant
document using the encoding attribute. For instance, an XML-TEI document encoded as UTF-8
according to the Unicode standard ISO/IEC 10646 shall begin with the following declaration:
5.3 Implementing the Lexicon class
5)
The Lexicon class shall be implemented by means of the TEI element , which groups together
all lexical entries of a specific lexicon. The element shall have a @type attribute with the value
“lexicon” (see Table 3).
Table 3 — Lexicon class
LMF class TEI construct
…
/Lexicon/
6)
According to the TEI Guidelines, the actual content of a TEI document is embedded within a
7) 8) 9)
child element which is further decomposed in sub-elements , , and . All
lexical entries of a given lexicon shall be descendant elements of the sub-element of , and
10)
may be further organized in subsets by means of the
to incorporate complementary resources when applicable, for instance bibliographic references.
The following example outlines a simple document organization for a lexicon (without the optional
and elements, and without sub-divisions).
EXAMPLE
…
…
…
…
5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -TEI .html
6) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -text .html
7) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -front .html
8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -body .html
9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -back .html
10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -div .html
© ISO 2021 – All rights reserved 3
---------------------- Page: 11 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
5.4 Implementing the LexiconInformation class
The LexiconInformation class shall also be implemented by means of the TEI element , as
a direct child of the element (see Table 4). For the actual use of the element, the
additional constraints given in the TEI Guidelines shall be followed to encode any kind of information
related to administrative, documentary and bibliographic information attached to the corresponding
lexicon.
Table 4 — LexiconInformation class
LMF class TEI construct
…
/LexiconInformation/
5.5 Implementing the LexicalEntry class
11)
The LexicalEntry class shall be implemented by means of the element in the TEI Guidelines
(see Table 5). Lexical information inside elements shall be encoded through the use of the
following child elements:
12)
— for morphological and grammatical information related to the whole entry (see 5.6.1
and 5.6.2);
13)
— for semantic information, see 5.8;
14)
— for etymological aspects, see Clause 7;
15)
— related entry allows the serialization of information referring to entry-like constructs (e.g.,
related forms, derived forms, multiword expressions), see 6.9;
16)
— for referencing internal or external elements (phrase, equivalent, etc.);
17)
— for any information that does not belong to any of the above elements.
These various constructs are further described in the following subclauses.
Table 5 — LexicalEntry class
LMF class TEI construct
/LexicalEntry/ …
18)
The following example in French illustrates the encoding of a simple dictionary entry .
EXAMPLE
langouste
lägust
n.
11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -entry .html
12) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -form .html
13) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -sense .html
14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -etym .html
15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -re .html
16) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -xr .html
17) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -dictScrap .html
18) Source: Reference [10].
4 © ISO 2021 – All rights reserved
---------------------- Page: 12 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
f.
Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues
de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.
Fig. et fam. (vulg.).
Femme, maîtresse.
XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.
provençal langosta, altér. du lat. class. locusta «sauterelle».
NOTE 1 The element is introduced later in this document.
NOTE 2 The etymological description is not completely encoded here. See Clause 7.
5.6 Implementing the Form and Lemma classes
5.6.1 Form class
The Form class shall be serialized using the TEI element (see Table 6). Further subclasses
derived from the Form class are implemented by means of specific values for the @type attribute on
. See Clause 6.
Table 6 — Form class
LMF class TEI construct
…
/Form/
5.6.2 Lemma class
The Lemma class is derived from the Form class, it shall thus be implemented as the TEI element
further constrained by means of the @type attribute set to “lemma” (see Table 7).
Table 7 — Lemma class
LMF class TEI construct
…
/Lemma/
5.7 Implementing the GrammaticalInformation class
The GrammaticalInformation class gathers grammatical features attached to the LexicalEntry, a
Form, a Translation or a Sense (in the case of specific grammatical restrictions for instance). It shall
19)
be implemented in the TEI by means of the element (see Table 8) combined with various
possible child elements for specific grammatical features (see below).
Table 8 — GrammaticalInformation class
LMF class TEI construct
/GrammaticalInformation/ …
19) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gramGrp .html
© ISO 2021 – All rights reserved 5
---------------------- Page: 13 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
The elements provided by the TEI Guidelines within for grammatical description of an
associated class are as follows.
20)
— (part of speech) to indicate the grammatical category of the lexical item. This corresponds
to the /partOfSpeech/ data category in ISO 24611:2012, Annex A.
NOTE 1 This element is equivalent to the use of the element with the appropriate @type attribute:
[5]
, as used in the TEI Lex 0 initiative .
21)
— (grammatical gender) to indicate the grammatical gender (if relevant) of the lexical
item or one of its inflected forms. This corresponds to the /grammaticalGender/ data category in
ISO 24611:2012, Annex A.
NOTE 2 This element is equivalent to the use of the element with the appropriate @type attribute:
.
22)
— (grammatical number) to indicate the grammatical number (if relevant) of the lexical
item or one of its inflected forms. This corresponds to the /grammaticalNumber/ data category in
ISO 24611:2012, Annex A.
NOTE 3 This element is equivalent to the use of the element with the appropriate @type attribute:
.
23)
— (person) to indicate the grammatical person (if relevant) of the lexical item or one of its
inflected forms. This corresponds to the /person/ data category in ISO 24611:2012, Annex A.
NOTE 4 This element is equivalent to the use of the element with the appropriate @type attribute:
.
24)
— (tense) to indicate the grammatical tense (if relevant) of the lexical item or one of its
inflected forms. This corresponds to the /grammaticalTense/ data category in ISO 24611:2012
...
INTERNATIONAL ISO
STANDARD 24613-4
First edition
2021-01
Language resource management —
Lexical markup framework (LMF) —
Part 4:
TEI serialization
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
Reference number
ISO 24613-4:2021(E)
©
ISO 2021
---------------------- Page: 1 ----------------------
ISO 24613-4:2021(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 24613-4:2021(E)
Contents Page
Foreword .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 General principles . 1
5 Serialization of the LMF core model (ISO 24613-1) . 2
5.1 Implementing the LexicalResource class . 2
5.2 Implementing the GlobalInformation class. 2
5.3 Implementing the Lexicon class . 3
5.4 Implementing the LexiconInformation class . 4
5.5 Implementing the LexicalEntry class . 4
5.6 Implementing the Form and Lemma classes . 5
5.6.1 Form class . 5
5.6.2 Lemma class . 5
5.7 Implementing the GrammaticalInformation class . 5
5.8 Implementing the Sense class . 7
5.9 Implementing the Definition class . 7
5.10 Implementing the OrthographicRepresentation class . 8
5.11 Implementing the CrossREF class . 8
5.12 Data category selection. 9
6 Serialization of the MRD model (ISO 24613-2) . 9
6.1 Implementing the form representations for the Form class . 9
6.2 Implementing classes derived from the Form class.11
6.2.1 General principles .11
6.2.2 Implementing the WordForm class .11
6.2.3 Implementing the Stem class .11
6.2.4 Implementing the WordPart class .11
6.2.5 Implementing the RelatedForm class .12
6.3 Implementing the Bibliography class .12
6.4 Implementing the CrossREF mechanism to refer to external media files .12
6.5 Implementing the Example class .12
6.6 Implementing the Translation class .13
6.7 Implementing the TextRepresentation class .13
6.8 Implementing the SubjectField class .14
6.9 Implementing the CrossREF mechanism to represent related entries .14
7 Implementing the classes from the etymological extension (ISO 24613-3) .15
7.1 Implementing the Etymology class .15
7.2 Implementing the Etymon class.15
7.2.1 Referencing forms in an etymon .16
7.2.2 Representing the meaning of an etymon .16
7.2.3 Representing the language of an etymon .16
7.2.4 Associating grammatical information to an etymon.16
7.2.5 Dating an etymon .16
7.2.6 Providing sources associated with an etymon .17
7.2.7 Further prose component in an etymological description .17
7.3 Implementing the EtyLink class .17
7.4 Implementing the CognateSet class .17
7.5 Implementing the Cognate class .17
7.6 Implementing the Gloss class .18
8 Additional mechanisms .18
8.1 Overview .18
8.2 Representing punctuation marks with .18
© ISO 2021 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO 24613-4:2021(E)
8.3 Representing various labels with .18
8.4 Encoding simple separating characters with .19
8.5 Providing rendition information with the @rend attribute.19
8.6 Usage example of the additional features introduced in Clause 8 .19
Bibliography .20
iv © ISO 2021 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 24613-4:2021(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to
the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see
www .iso .org/ iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
1)
This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—
2)
and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/FDIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
© ISO 2021 – All rights reserved v
---------------------- Page: 5 ----------------------
INTERNATIONAL STANDARD ISO 24613-4:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope
This document describes the serialization of the lexical markup framework (LMF) model defined as an
XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the
classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine
readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
ISO 24613-3, Language resource management — Lexical markup framework (LMF) — Part 3: Etymological
extension
IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). September 2009. Best Current
Practice. https:// tools .ietf .org/ html/ bcp47
W3C XML Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 November 2008,
http:// www .w3 .org/ TR/ xml/
TEI P5, Guidelines for Electronic Text Encoding and Interchange. [Version number: 4.1.0]. [Last modified
date: 2020-08-19]. TEI Consortium. http:// www .tei -c .org/ Guidelines/ P5/
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and in
ISO 24613-3 apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 General principles
This document aims at providing mostly univocal constructs for each LMF class from the core model
(ISO 24613-1), the MRD extension (ISO 24613-2) and the etymological extension (ISO 24613-3), thus
making the original Text Encoding Initiative (TEI) recommendations from the dictionary chapter
© ISO 2021 – All rights reserved 1
---------------------- Page: 6 ----------------------
ISO 24613-4:2021(E)
terser (see References [4], [8], [9], [11] and [14]), while eliciting specific constraints needed to align
with ISO 24613 in general. For instance, precise value lists are given for some attributes such as @type.
In addition, this document complies with the cardinalities expressed in ISO 24613-1, ISO 24613-2 and in
ISO 24613-3.
Unless explicitly stated, all resulting constructs shall be valid TEI representations, which means that
the specification described in this document corresponds to a pure subset of the TEI Guidelines. They
shall thus be well-formed XML documents as specified by the W3C XML recommendation.
This document requires compliance with ISO 24613-1, ISO 24613-2, and ISO 24613-3 when implementing
data categories referred to in the respective parts.
Nevertheless, this document does not elaborate on the metadata aspects from LMF, since the TEI
header, i.e. the metadata component attached to any TEI document, is in essence rich enough in that it
represents all the aspects related to the creation, the content description, the versioning and publishing
of a textual document as a whole.
In all XML examples in this document and in order to simplify the actual representations, it is assumed,
unless otherwise stated, that XML elements belong to the TEI namespace, thus assuming that all
examples are within the scope of the following XML namespace declaration:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"
An updated TEI ODD specification corresponding to this document is available from Reference [12]
together with additional examples.
5 Serialization of the LMF core model (ISO 24613-1)
5.1 Implementing the LexicalResource class
3)
The LexicalResource class shall be implemented by means of the element which groups
together one or several TEI documents for each specific lexicon. The element shall include
a @type attribute with the value “lexicalResource” (see Table 1). In the case where the lexical resource
contains only one lexicon, this level may be omitted, so that the document directly starts with a
root element (see 5.3).
Table 1 — LexicalResource class
LMF class TEI construct
…
/LexicalResource/
teiCorpus>
5.2 Implementing the GlobalInformation class
4)
The GlobalInformation class shall be implemented by means of the TEI element , as a
direct child of the element (see Table 2). For the actual use of the element,
the additional constraints given in the TEI Guidelines shall be followed when encoding any kind of
information related to administrative, documentary and bibliographic information attached to the
corresponding lexical resource.
Table 2 — GlobalInformation class
LMF class TEI construct
…
/GlobalInformation/
3) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiCorpus .html
4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiHeader .html
2 © ISO 2021 – All rights reserved
---------------------- Page: 7 ----------------------
ISO 24613-4:2021(E)
The further requirements concerning the GlobalInformation class are implemented as follows:
— since the TEI serialization is based on the W3C XML recommendation, it implements the @xml:
lang attribute to indicate the working language information corresponding to the content of any
specific element. @xml: lang content shall be compliant with IETF BCP 47. There is thus no need for
a specific implementation of the /language coding/ data category in order to ensure compliance of
this document with ISO 24613-1;
— IETF BCP 47 also relies on ISO 15924 for the coding of script names. There is thus no need to have a
specific mechanism in this document for implementing the /script coding/ data category;
— the /character encoding/ data category is implemented in the XML declaration of a TEI conformant
document using the encoding attribute. For instance, an XML-TEI document encoded as UTF-8
according to the Unicode standard ISO/IEC 10646 shall begin with the following declaration:
5.3 Implementing the Lexicon class
5)
The Lexicon class shall be implemented by means of the TEI element , which groups together
all lexical entries of a specific lexicon. The element shall have a @type attribute with the value
“lexicon” (see Table 3).
Table 3 — Lexicon class
LMF class TEI construct
…
/Lexicon/
6)
According to the TEI Guidelines, the actual content of a TEI document is embedded within a
7) 8) 9)
child element which is further decomposed in sub-elements , , and . All
lexical entries of a given lexicon shall be descendant elements of the sub-element of , and
10)
may be further organized in subsets by means of the
to incorporate complementary resources when applicable, for instance bibliographic references.
The following example outlines a simple document organization for a lexicon (without the optional
and elements, and without sub-divisions).
EXAMPLE
…
…
…
…
5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -TEI .html
6) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -text .html
7) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -front .html
8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -body .html
9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -back .html
10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -div .html
© ISO 2021 – All rights reserved 3
---------------------- Page: 8 ----------------------
ISO 24613-4:2021(E)
5.4 Implementing the LexiconInformation class
The LexiconInformation class shall also be implemented by means of the TEI element , as
a direct child of the element (see Table 4). For the actual use of the element, the
additional constraints given in the TEI Guidelines shall be followed to encode any kind of information
related to administrative, documentary and bibliographic information attached to the corresponding
lexicon.
Table 4 — LexiconInformation class
LMF class TEI construct
…
/LexiconInformation/
5.5 Implementing the LexicalEntry class
11)
The LexicalEntry class shall be implemented by means of the element in the TEI Guidelines
(see Table 5). Lexical information inside elements shall be encoded through the use of the
following child elements:
12)
— for morphological and grammatical information related to the whole entry (see 5.6.1
and 5.6.2);
13)
— for semantic information, see 5.8;
14)
— for etymological aspects, see Clause 7;
15)
— related entry allows the serialization of information referring to entry-like constructs (e.g.,
related forms, derived forms, multiword expressions), see 6.9;
16)
— for referencing internal or external elements (phrase, equivalent, etc.);
17)
— for any information that does not belong to any of the above elements.
These various constructs are further described in the following subclauses.
Table 5 — LexicalEntry class
LMF class TEI construct
/LexicalEntry/ …
18)
The following example in French illustrates the encoding of a simple dictionary entry .
EXAMPLE
langouste
lägust
n.
11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -entry .html
12) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -form .html
13) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -sense .html
14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -etym .html
15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -re .html
16) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -xr .html
17) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -dictScrap .html
18) Source: Reference [10].
4 © ISO 2021 – All rights reserved
---------------------- Page: 9 ----------------------
ISO 24613-4:2021(E)
f.
Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues
de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.
Fig. et fam. (vulg.).
Femme, maîtresse.
XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.
provençal langosta, altér. du lat. class. locusta «sauterelle».
NOTE 1 The element is introduced later in this document.
NOTE 2 The etymological description is not completely encoded here. See Clause 7.
5.6 Implementing the Form and Lemma classes
5.6.1 Form class
The Form class shall be serialized using the TEI element (see Table 6). Further subclasses
derived from the Form class are implemented by means of specific values for the @type attribute on
. See Clause 6.
Table 6 — Form class
LMF class TEI construct
…
/Form/
5.6.2 Lemma class
The Lemma class is derived from the Form class, it shall thus be implemented as the TEI element
further constrained by means of the @type attribute set to “lemma” (see Table 7).
Table 7 — Lemma class
LMF class TEI construct
…
/Lemma/
5.7 Implementing the GrammaticalInformation class
The GrammaticalInformation class gathers grammatical features attached to the LexicalEntry, a
Form, a Translation or a Sense (in the case of specific grammatical restrictions for instance). It shall
19)
be implemented in the TEI by means of the element (see Table 8) combined with various
possible child elements for specific grammatical features (see below).
Table 8 — GrammaticalInformation class
LMF class TEI construct
/GrammaticalInformation/ …
19) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gramGrp .html
© ISO 2021 – All rights reserved 5
---------------------- Page: 10 ----------------------
ISO 24613-4:2021(E)
The elements provided by the TEI Guidelines within for grammatical description of an
associated class are as follows.
20)
— (part of speech) to indicate the grammatical category of the lexical item. This corresponds
to the /partOfSpeech/ data category in ISO 24611:2012, Annex A.
NOTE 1 This element is equivalent to the use of the element with the appropriate @type attribute:
[5]
, as used in the TEI Lex 0 initiative .
21)
— (grammatical gender) to indicate the grammatical gender (if relevant) of the lexical
item or one of its inflected forms. This corresponds to the /grammaticalGender/ data category in
ISO 24611:2012, Annex A.
NOTE 2 This element is equivalent to the use of the element with the appropriate @type attribute:
.
22)
— (grammatical number) to indicate the grammatical number (if relevant) of the lexical
item or one of its inflected forms. This corresponds to the /grammaticalNumber/ data category in
ISO 24611:2012, Annex A.
NOTE 3 This element is equivalent to the use of the element with the appropriate @type attribute:
.
23)
— (person) to indicate the grammatical person (if relevant) of the lexical item or one of its
inflected forms. This corresponds to the /person/ data category in ISO 24611:2012, Annex A.
NOTE 4 This element is equivalent to the use of the element with the appropriate @type attribute:
.
24)
— (tense) to indicate the grammatical tense (if relevant) of the lexical item or one of its
inflected forms. This corresponds to the /grammaticalTense/ data category in ISO 24611:2012,
Annex A.
NOTE 5 This element is equivalent to the use of the element with the appropriate @type attribute:
.
25)
— (subcategorization) to indicate subcategorization information (e.g. transitive/
intransitive/ditransitive, countable/non-countable, etc.).
26)
— (inflectional class) to indicate the inflectional class associated with the lexical item.
For instance, to indicate that the part of speech is a verb and that it is intransitive, the following
construct shall be used, see Examples 1 to 3.
EXAMPLE 1
verb
intransitive
20) http:// tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -pos .html
21) http:// tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gen .html
22) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -number .html
23) http:// tei -c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -per .html
24) http:// tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -tns .html
25) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -subc .html
26) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -iType.html
6 © ISO 2021 – All rights reserved
---------------------- Page: 11 ------------------
...
NORME ISO
INTERNATIONALE 24613-4
Première édition
2021-01
Gestion des ressources
linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
Language resource management — Lexical markup framework
(LMF) —
Part 4: TEI serialization
Numéro de référence
ISO 24613-4:2021(F)
©
ISO 2021
---------------------- Page: 1 ----------------------
ISO 24613-4:2021(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO 24613-4:2021(F)
Sommaire Page
Avant-propos .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Principes généraux . 2
5 Sérialisation du modèle de base LMF (ISO 24613-1) . 2
5.1 Implémentation de la classe LexicalResource . 2
5.2 Implémentation de la classe GlobalInformation . 2
5.3 Implémentation de la classe Lexicon . 3
5.4 Implémentation de la classe LexiconInformation . 4
5.5 Implémentation de la classe LexicalEntry. 4
5.6 Implémentation des classes Form et Lemma . 5
5.6.1 Classe Form . 5
5.6.2 Classe Lemma . 5
5.7 Implémentation de la classe GrammaticalInformation . 5
5.8 Implémentation de la classe Sense . 7
5.9 Implémentation de la classe Definition . 7
5.10 Implémentation de la classe OrthographicRepresentation . 8
5.11 Implémentation de la classe CrossREF . 8
5.12 Sélection des catégories de données . 9
6 Sérialisation du modèle MRD (ISO 24613-2) . 9
6.1 Implémentation des représentations de forme pour la classe Form . 9
6.2 Implémentation des classes dérivées de la classe Form .10
6.2.1 Principes généraux .10
6.2.2 Implémentation de la classe WordForm .10
6.2.3 Implémentation de la classe Stem .11
6.2.4 Implémentation de la classe WordPart .11
6.2.5 Implémentation de la classe RelatedForm .11
6.3 Implémentation de la classe Bibliography .12
6.4 Implémentation du mécanisme CrossREF de renvoi à des fichiers multimédia externes .12
6.5 Implémentation de la classe Example .12
6.6 Implémentation de la classe Translation .13
6.7 Implémentation de la classe TextRepresentation .13
6.8 Implémentation de la classe SubjectField .14
6.9 Implémentation du mécanisme CrossRef pour représenter les entrées associées .14
7 Implémentation des classes à partir de l’extension étymologique (ISO 24613-3) .15
7.1 Implémentation de la classe Etymology .15
7.2 Implémentation de la classe Etymon .15
7.2.1 Référencement des formes dans un étymon .15
7.2.2 Représentation de la signification d’un étymon .16
7.2.3 Représentation de la langue d’un étymon .16
7.2.4 Association d’informations grammaticales à un étymon .16
7.2.5 Datation d’un étymon .16
7.2.6 Citation de sources associées à un étymon .17
7.2.7 Élément de prose supplémentaire dans une description étymologique .17
7.3 Implémentation de la classe EtyLink .17
7.4 Implémentation de la classe CognateSet .17
7.5 Implémentation de la classe Cognate .17
7.6 Implémentation de la classe Gloss .18
8 Mécanismes supplémentaires .18
8.1 Vue d’ensemble .18
8.2 Représentation de signes de ponctuation avec .18
© ISO 2021 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO 24613-4:2021(F)
8.3 Représentation de diverses étiquettes avec .18
8.4 Codage de caractères de séparation simples avec .19
8.5 Transmission d’informations de rendu avec l’attribut @rend .19
8.6 Exemple d’usage des traits supplémentaires présentés à l’Article 8 .19
Bibliographie .20
iv © ISO 2021 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO 24613-4:2021(F)
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes
nationaux de normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est
en général confiée aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l'ISO participent également aux travaux.
L'ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie,
sous-comité SC 4, Gestion des ressources linguistiques.
Cette première édition de l’ISO 24613-4, ainsi que l’ISO 24613-1:2019, l’ISO 24613-2:2020,
1) 2)
l’ISO 24613-3:— et l’ISO 24613-5:— , annule et remplace l’ISO 24613:2008, qui a été révisée
techniquement.
Les principales modifications par rapport à l’édition précédente sont les suivantes:
— révision complète du contenu et de sa sous-division en plusieurs parties.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site Web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En préparation. Étape au moment de la publication: ISO/FDIS 24613-3:2020.
2) En préparation. Étape au moment de la publication: ISO/DIS 24613-5:2020.
© ISO 2021 – Tous droits réservés v
---------------------- Page: 5 ----------------------
NORME INTERNATIONALE ISO 24613-4:2021(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
1 Domaine d’application
Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle
XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre
les classes de l’ISO 24613-1 (modèle de base du LMF) ainsi que les classes fournies par l’ISO 24613-2
(modèle de dictionnaire lisible par ordinateur, MRD) et l’ISO24613-3 (extension étymologique).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1:
Modèle de base
ISO 24613-2, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 2: Modèle de
dictionnaire lisible par ordinateur (MRD)
ISO 24613-3, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 3: Extension
étymologique
IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). Septembre 2009. Meilleure
pr at ique ac t uel le . ht t p s:// t o ol s . ie t f . or g / ht m l/ b c p 47
Recommandation XML W3C, Extensible Markup Language (XML) 1.0 (cinquième édition),
26 novembr e 20 0 8 , ht t p:// w w w .w3 . or g / T R / x m l/
TEI P5 Guidelines for Electronic Text Encoding and Interchange. [Version numéro: 4.1.0]. [Date de la
dernière modification: 19/08/2020]. TEI Consortium. http:// www .tei‑c .org/ Guidelines/ P5/
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp;
— IEC Electropedia: disponible à l’adresse http:// www .electropedia .org/ .
© ISO 2021 – Tous droits réservés 1
---------------------- Page: 6 ----------------------
ISO 24613-4:2021(F)
4 Principes généraux
Le présent document est destiné à fournir des constructions essentiellement univoques pour chaque
classe LMF issue du modèle de base (ISO 24613-1), de l’extension MRD (ISO 24613-2) et de l’extension
étymologique (ISO 24613-3), en rendant ainsi les recommandations d’origine Text Encoding Initiative
(TEI) du chapitre sur les dictionnaires plus laconiques (voir Références [4], [8], [9], [11] et [14]), tout en
spécifiant les contraintes spécifiques nécessaires pour s’aligner sur l’ISO 24613 en général. Par exemple,
des listes de valeurs précises sont données pour certains attributs tels que @type. De plus, le présent
document respecte les cardinalités exprimées dans l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3.
Sauf indication explicite, toutes les constructions résultantes doivent être des représentations valides
de la TEI, ce qui implique que la spécification décrite dans le présent document correspond à un
sous-ensemble strict des lignes directrices de la TEI. Ils doivent par conséquent être des documents
XML bien élaborés, comme spécifié par la recommandation XML W3C.
Le présent document exige la conformité avec l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3 lors de la
mise en œuvre des catégories de données mentionnées dans les parties respectives.
Néanmoins, le présent document n’aborde pas les aspects des métadonnées de LMF, car l’en-tête TEI,
c’est‑à‑dire le composant de métadonnées associé à tout document TEI, est par essence suffisamment
riche, car il représente tous les aspects liés à la création, à la description du contenu, au versionnage et à
la publication d’un document textuel dans son ensemble.
Dans tous les exemples XML du présent document et afin de simplifier les représentations réelles, il est
présumé, sauf indication contraire, que les éléments XML appartiennent à l’espace de nommage TEI,
ce qui suppose que tous les exemples sont dans le domaine d’application de la déclaration d’espace de
nommage XML suivante:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"
Une spécification TEI ODD mise à jour correspondant au présent document est disponible à partir de la
Référence [12] ainsi que des exemples supplémentaires.
5 Sérialisation du modèle de base LMF (ISO 24613-1)
5.1 Implémentation de la classe LexicalResource
3)
La classe LexicalResource doit être implémentée au moyen de l’élément qui regroupe
un ou plusieurs documents TEI pour chaque lexique spécifique. L’élément doit inclure un
attribut @type avec la valeur «lexicalResource» (voir Tableau 1). Si la ressource lexique ne contient
qu’un seul lexique, ce niveau peut être omis, de sorte que le document débute directement par un
élément racine (voir 5.3).
Tableau 1 — Classe LexicalResource
Classe LMF Construction TEI
…
/LexicalResource/
5.2 Implémentation de la classe GlobalInformation
4)
La classe GlobalInformation doit être implémentée au moyen de l’élément TEI , en tant
qu’enfant direct de l’élément (voir Tableau 2). Pour l’utilisation effective de l’élément
, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent être
respectées lors du codage de tout type d’information se rapportant à des informations administratives,
documentaires et bibliographiques rattachées à la ressource lexicale correspondante.
3) http:// www .tei- c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiCorpus .html
4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiHeader .html
2 © ISO 2021 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO 24613-4:2021(F)
Tableau 2 — Classe GlobalInformation
Classe LMF Construction TEI
/GlobalInformation/ …
Les exigences supplémentaires concernant la classe GlobalInformation sont implémentées de la façon
suivante:
— comme la sérialisation TEI repose sur la recommandation XML W3C, elle implémente l’attribut @
xml: lang pour indiquer l’information sur la langue de travail correspondant au contenu de tout
élément spécifique. Le contenu @xml: lang doit être conforme à l’IETF BCP 47. Il n’est donc pas
nécessaire d’effectuer une implémentation spécifique de la catégorie de données /language coding/
afin de garantir la conformité du présent document à l’ISO 24613‑1;
— IETF BCP 47 repose également sur l’ISO 15924 pour le codage des noms d’écritures. Il n’est donc pas
nécessaire de disposer d’un mécanisme spécifique dans le présent document pour implémenter la
catégorie de données /script coding/;
— la catégorie de données /character encoding/ est implémentée dans la déclaration XML d’un
document conforme à la TEI, en utilisant l’attribut encoding. Par exemple, un document XML-TEI
codé en UTF-8 conformément à la norme Unicode ISO/IEC 10646 doit débuter par la déclaration
suivante:
5.3 Implémentation de la classe Lexicon
5)
La classe Lexicon doit être implémentée au moyen de l’élément TEI , qui regroupe toutes les
entrées lexicales d’un lexique spécifique. L’élément doit disposer d’un attribut @type avec la
valeur «lexicon» (voir Tableau 3).
Tableau 3 — Classe Lexicon
Classe LMF Construction TEI
…
/Lexicon/
D’après les lignes directrices de la TEI, le contenu principal d’un document TEI est incorporé dans un
6) 7) 8) 9)
élément enfant qui est ensuite décomposé en sous-éléments , et .
Toutes les entrées lexicales d’un lexique donné doivent être des éléments descendants du sous-élément
10)
de , et peuvent être réorganisées en sous-ensembles au moyen de l’élément
et peuvent être utilisés pour incorporer des ressources complémentaires le cas échéant,
par exemple des références bibliographiques.
L’exemple suivant illustre une organisation documentaire simple pour un lexique (sans les éléments
facultatifs et , et sans subdivisions).
EXEMPLE
…
…
5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/fr/ html/ ref -TEI .html
6) http:// www .tei- c.or g/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -text .html
7) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -front .html
8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -body .html
9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/fr/ html/ ref -back .html
10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -div .html
© ISO 2021 – Tous droits réservés 3
---------------------- Page: 8 ----------------------
ISO 24613-4:2021(F)
…
…
5.4 Implémentation de la classe LexiconInformation
La classe LexiconInformation doit également être implémentée au moyen de l’élément TEI ,
en tant qu’enfant direct de l’élément (voir Tableau 4). Pour l’utilisation effective de l’élément
, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent
être respectées pour coder tout type d’information se rapportant à des informations administratives,
documentaires et bibliographiques rattachées au lexique correspondant.
Tableau 4 — Classe LexiconInformation
Classe LMF Construction TEI
…
/LexiconInformation/
5.5 Implémentation de la classe LexicalEntry
11)
La classe LexicalEntry doit être implémentée au moyen de l’élément des lignes directrices de
la TEI (voir Tableau 5). Les informations lexicales à l’intérieur de l’élément doivent être codées
en utilisant les éléments enfants suivants:
12)
— pour les informations morphologiques et grammaticales liées à toute l’entrée (voir 5.6.1
et 5.6.2);
13)
— pour des informations sémantiques, voir 5.8;
14)
— pour les aspects étymologiques, voir Article 7;
15)
— permet la sérialisation des informations se rapportant à des constructions analogues à des
entrées (par exemple des formes apparentées, des formes dérivées, des expressions multi-termes),
voir 6.9;
16)
— pour référencer des éléments internes ou externes (locution, équivalent, etc.);
17)
— pour toute information qui n’appartient pas à l’un des éléments ci-dessus.
Ces différentes constructions sont décrites plus en détail dans les paragraphes suivants.
Tableau 5 — Classe LexicalEntry
Classe LMF Construction TEI
…
/LexicalEntry/
11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/fr/ html/ ref -entry .html
12) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ fr/ html/ ref -form .html
13) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -sense .html
14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -etym .html
15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -re .html
16) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ fr/ html/ ref -xr .html
17) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -dictScrap .html
4 © ISO 2021 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO 24613-4:2021(F)
18)
L’exemple suivant en français illustre le codage d’une entrée simple d’un dictionnaire .
EXEMPLE
langouste
lägust
n.
f.
Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues
de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.
Fig. et fam. (vulg.).
Femme, maîtresse.
XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.
provençal langosta, altér. du lat. class. locusta «sauterelle».
NOTE 1 L’élément sera présenté ultérieurement dans le présent document.
NOTE 2 La description étymologique n’est pas totalement codée ici. Voir l’Article 7.
5.6 Implémentation des classes Form et Lemma
5.6.1 Classe Form
La classe Form doit être sérialisée en utilisant l’élément TEI (voir Tableau 6). Les sous-classes
supplémentaires dérivées de la classe Form sont implémentées au moyen de valeurs spécifiques pour
l’attribut @type sur . Voir l’Article 6.
Tableau 6 — Classe Form
Classe LMF Construction TEI
…
/Form/
5.6.2 Classe Lemma
La classe Lemma étant dérivée de la classe Form, elle doit donc être implémentée en tant qu’élément TEI
également contraint au moyen de l’attribut @type fixé à «lemma» (voir Tableau 7).
Tableau 7 — Classe Lemma
Classe LMF Construction TEI
…
/Lemma/
5.7 Implémentation de la classe GrammaticalInformation
La classe GrammaticalInformation regroupe les traits grammaticaux associés à la classe LexicalEntry
ou à une classe Form, Translation ou Sense (dans le cas de restrictions grammaticales particulières,
19)
par exemple). Elle doit être implémentée en TEI au moyen de l’élément (voir Tableau 8)
combiné avec différents éléments enfants possibles pour des traits grammaticaux spécifiques
(voir ci-dessous).
18) Source: Référence [10].
19) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -gramGrp .html
© ISO 2021 – Tous droits réservés 5
---------------------- Page: 10 ----------------------
ISO 24613-4:2021(F)
Tableau 8 — Classe GrammaticalInformation
Classe LMF Construction TEI
/GrammaticalInformation/ …
Les éléments fournis par les lignes directrices de la TEI dans pour la description
grammaticale d’une classe associée sont les suivants:
20)
— (partie du discours) pour indiquer la catégorie grammaticale de l’élément lexical. Ceci
correspond à la catégorie de données /partOfSpeech/ de l’ISO 24611:2012, Annexe A;
NOTE 1 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:
[5]
, tel qu’utilisé dans l’initiative TEI Lex 0 .
21)
— (genre grammatical) pour indiquer le genre grammatical (si pertinent) de l’élément lexical
ou de l’une de ses formes fléchies. Ceci correspond à la catégorie de données /grammaticalGender/
de l’ISO 24611:2012, Annexe A;
NOTE 2 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:
.
22)
— (nombre grammatical) pour indiquer le nombre grammatical (si pertinent) de
l’élément lexical ou de l’une de ses formes fléchies. Ceci correspond à la catégorie de données /
grammaticalNumber/ de l’ISO 24611:2012, Annexe A;
NOTE 3 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:
.
23)
— (personne) pour indiquer la personne grammaticale (si pertinente) de l’élément lexical ou de
l’une de ses formes fléchies. Ceci correspond à la catégorie de données /person/ de l’ISO 24611:2012,
Annexe A;
NOTE 4 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:
.
24)
— (temps) pour indiquer le temps grammatical (si pertinent) de l’élément lexical ou de
l’une de ses formes fléchies. Ceci correspond à la catégorie de don
...
FINAL
INTERNATIONAL ISO/FDIS
DRAFT
STANDARD 24613-4
ISO/TC 37/SC 4
Language resource management —
Secretariat: KATS
Lexical markup framework (LMF) —
Voting begins on:
2020-10-22
Part 4:
Voting terminates on:
TEI serialization
2020-12-17
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
RECIPIENTS OF THIS DRAFT ARE INVITED TO
SUBMIT, WITH THEIR COMMENTS, NOTIFICATION
OF ANY RELEVANT PATENT RIGHTS OF WHICH
THEY ARE AWARE AND TO PROVIDE SUPPOR TING
DOCUMENTATION.
IN ADDITION TO THEIR EVALUATION AS
Reference number
BEING ACCEPTABLE FOR INDUSTRIAL, TECHNO-
ISO/FDIS 24613-4:2020(E)
LOGICAL, COMMERCIAL AND USER PURPOSES,
DRAFT INTERNATIONAL STANDARDS MAY ON
OCCASION HAVE TO BE CONSIDERED IN THE
LIGHT OF THEIR POTENTIAL TO BECOME STAN-
DARDS TO WHICH REFERENCE MAY BE MADE IN
©
NATIONAL REGULATIONS. ISO 2020
---------------------- Page: 1 ----------------------
ISO/FDIS 24613-4:2020(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2020
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2020 – All rights reserved
---------------------- Page: 2 ----------------------
ISO/FDIS 24613-4:2020(E)
Contents Page
Foreword .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 General principles . 1
5 Serialization of the LMF core model (ISO 24613-1) . 2
5.1 Implementing the LexicalResource class . 2
5.2 Implementing the GlobalInformation class. 2
5.3 Implementing the Lexicon class . 3
5.4 Implementing the LexiconInformation class . 4
5.5 Implementing the LexicalEntry class . 4
5.6 Implementing the Form and Lemma classes . 5
5.6.1 Form class . 5
5.6.2 Lemma class . 5
5.7 Implementing the GrammaticalInformation class . 5
5.8 Implementing the Sense class . 7
5.9 Implementing the Definition class . 7
5.10 Implementing the OrthographicRepresentation class . 8
5.11 Implementing the CrossREF class . 8
5.12 Data category selection. 9
6 Serialization of the MRD model (ISO 24613-2) . 9
6.1 Implementing the form representations for the Form class . 9
6.2 Implementing classes derived from the Form class.11
6.2.1 General principles .11
6.2.2 Implementing the WordForm class .11
6.2.3 Implementing the Stem class .11
6.2.4 Implementing the WordPart class .11
6.2.5 Implementing the RelatedForm class .12
6.3 Implementing the Bibliography class .12
6.4 Implementing the CrossREF mechanism to refer to external media files .12
6.5 Implementing the Example class .12
6.6 Implementing the Translation class .13
6.7 Implementing the TextRepresentation class .13
6.8 Implementing the SubjectField class .14
6.9 Implementing the CrossREF mechanism to represent related entries .14
7 Implementing the classes from the etymological extension (ISO 24613-3) .15
7.1 Implementing the Etymology class .15
7.2 Implementing the Etymon class.15
7.2.1 Referencing forms in an etymon .16
7.2.2 Representing the meaning of an etymon .16
7.2.3 Representing the language of an etymon .16
7.2.4 Associating grammatical information to an etymon.16
7.2.5 Dating an etymon .16
7.2.6 Providing sources associated with an etymon .17
7.2.7 Further prose component in an etymological description .17
7.3 Implementing the EtyLink class .17
7.4 Implementing the CognateSet class .17
7.5 Implementing the Cognate class .17
7.6 Implementing the Gloss class .18
8 Additional mechanisms .18
8.1 Overview .18
8.2 Representing punctuation marks with .18
© ISO 2020 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO/FDIS 24613-4:2020(E)
8.3 Representing various labels with .18
8.4 Encoding simple separating characters with .19
8.5 Providing rendition information with the @rend attribute.19
8.6 Usage example of the additional features introduced in Clause 8 .19
Bibliography .20
iv © ISO 2020 – All rights reserved
---------------------- Page: 4 ----------------------
ISO/FDIS 24613-4:2020(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to
the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see
www .iso .org/ iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—
1) 2) 3)
, ISO 24613-5:— , and ISO 24613-6:— , cancels and replaces ISO 24613:2008, which has been
technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
1) Under preparation. Stage at the time of publication: ISO/DIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
3) Planned.
© ISO 2020 – All rights reserved v
---------------------- Page: 5 ----------------------
FINAL DRAFT INTERNATIONAL STANDARD ISO/FDIS 24613-4:2020(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope
This document describes the serialization of the lexical markup framework (LMF) model defined as an
XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the
classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine
readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model
ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-
readable dictionary (MRD) model
ISO 24613-3, Language resource management — Lexical markup framework (LMF) — Part 3: Etymological
extension
IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). September 2009. Best Current
Practice. https:// tools .ietf .org/ html/ bcp47
W3C XML Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 November 2008,
http:// www .w3 .org/ TR/ xml/
TEI P5, Guidelines for Electronic Text Encoding and Interchange. [Version number: 4.0.0]. [Last modified
date: 2020-02-13]. TEI Consortium. http:// www .tei -c .org/ Guidelines/ P5/
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 24613-1 and in
ISO 24613-3 apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 General principles
This document aims at providing mostly univocal constructs for each LMF class from the core model
(ISO 24613-1), the MRD extension (ISO 24613-2) and the etymological extension (ISO 24613-3), thus
making the original Text Encoding Initiative (TEI) recommendations from the dictionary chapter
© ISO 2020 – All rights reserved 1
---------------------- Page: 6 ----------------------
ISO/FDIS 24613-4:2020(E)
terser (see References [9], [11], [14], [8] and [4]), while eliciting specific constraints needed to align
with ISO 24613 in general. For instance, precise value lists are given for some attributes such as @type.
In addition, this document complies with the cardinalities expressed in ISO 24613-1, ISO 24613-2 and in
ISO 24613-3.
Unless explicitly stated, all resulting constructs shall be valid TEI representations, which means that
the specification described in this document corresponds to a pure subset of the TEI Guidelines. They
shall thus be well-formed XML documents as specified by the W3C XML recommendation.
This document requires compliance with ISO 24613-1, ISO 24613-2, and ISO 24613-3 when implementing
data categories referred to in the respective parts.
Nevertheless, this document does not elaborate on the metadata aspects from LMF, since the TEI
header, i.e. the metadata component attached to any TEI document, is in essence rich enough in that it
represents all the aspects related to the creation, the content description, the versioning and publishing
of a textual document as a whole.
In all XML examples in this document and in order to simplify the actual representations, it is assumed,
unless otherwise stated, that XML elements belong to the TEI namespace, thus assuming that all
examples are within the scope of the following XML namespace declaration:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"
An updated TEI ODD specification corresponding to this document is available from Reference [12]
together with additional examples.
5 Serialization of the LMF core model (ISO 24613-1)
5.1 Implementing the LexicalResource class
4)
The LexicalResource class shall be implemented by means of the element which groups
together one or several TEI documents for each specific lexicon. The element shall include
a @type attribute with the value “lexicalResource” (see Table 1). In the case where the lexical resource
contains only one lexicon, this level may be omitted, so that the document directly starts with a
root element (see 5.3).
Table 1 — LexicalResource class
LMF class TEI construct
…
/LexicalResource/
teiCorpus>
5.2 Implementing the GlobalInformation class
5)
The GlobalInformation class shall be implemented by means of the TEI element , as a
direct child of the element (see Table 2). For the actual use of the element,
the additional constraints given in the TEI Guidelines shall be followed when encoding any kind of
information related to administrative, documentary and bibliographic information attached to the
corresponding lexical resource.
Table 2 — GlobalInformation class
LMF class TEI construct
…
/GlobalInformation/
4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiCorpus .html
5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiHeader .html
2 © ISO 2020 – All rights reserved
---------------------- Page: 7 ----------------------
ISO/FDIS 24613-4:2020(E)
The further requirements concerning the GlobalInformation class are implemented as follows:
— since the TEI serialization is based on the W3C XML recommendation, it implements the @xml:
lang attribute to indicate the working language information corresponding to the content of any
specific element. @xml: lang content shall be compliant with IETF BCP 47. There is thus no need for
a specific implementation of the /language coding/ data category in order to ensure compliance of
this document with ISO 24613-1;
— IETF BCP 47 also relies on ISO 15924 for the coding of script names. There is thus no need to have a
specific mechanism in this document for implementing the /script coding/ data category;
— the /character encoding/ data category is implemented in the XML declaration of a TEI conformant
document using the encoding attribute. For instance, an XML-TEI document encoded as UTF-8
according to the Unicode standard ISO/IEC 10646 shall begin with the following declaration:
5.3 Implementing the Lexicon class
6)
The Lexicon class shall be implemented by means of the TEI element , which groups together
all lexical entries of a specific lexicon. The element shall have a @type attribute with the value
‘lexicon’ (see Table 3).
Table 3 — Lexicon class
LMF class TEI construct
…
/Lexicon/
7)
According to the TEI Guidelines, the actual content of a TEI document is embedded within a
8) 9) 10)
child element which is further decomposed in sub-elements , , and . All
lexical entries of a given lexicon shall be descendant elements of the sub-element of , and
11)
may be further organized in subsets by means of the
to incorporate complementary resources when applicable, for instance bibliographic references.
The following example outlines a simple document organization for a lexicon (without the optional
and elements, and without sub-divisions).
EXAMPLE
…
…
…
…
6) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -TEI .html
7) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -text .html
8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -front .html
9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -body .html
10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -back .html
11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -div .html
© ISO 2020 – All rights reserved 3
---------------------- Page: 8 ----------------------
ISO/FDIS 24613-4:2020(E)
5.4 Implementing the LexiconInformation class
The LexiconInformation class shall also be implemented by means of the TEI element , as
a direct child of the element (see Table 4). For the actual use of the element, the
additional constraints given in the TEI Guidelines shall be followed to encode any kind of information
related to administrative, documentary and bibliographic information attached to the corresponding
lexicon.
Table 4 — LexiconInformation class
LMF class TEI construct
…
/LexiconInformation/
5.5 Implementing the LexicalEntry class
12)
The LexicalEntry class shall be implemented by means of the element in the TEI Guidelines
(see Table 5). Lexical information inside elements shall be encoded through the use of the
following child elements:
13)
— for morphological and grammatical information related to the whole entry (see 5.6.1
and 5.6.2);
14)
— for semantic information, see 5.8;
15)
— for etymological aspects, see Clause 7;
16)
— related entry allows the serialization of information referring to entry-like constructs (e.g.,
related forms, derived forms, multiword expressions), see 6.9;
17)
— for referencing internal or external elements (phrase, equivalent, etc.);
18)
— for any information that does not belong to any of the above elements.
These various constructs are further described in the following subclauses.
Table 5 — LexicalEntry class
LMF class TEI construct
/LexicalEntry/ …
19)
The following example in French illustrates the encoding of a simple dictionary entry .
EXAMPLE
langouste
lägust
n.
12) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -entry .html
13) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -form .html
14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -sense .html
15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -etym .html
16) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -re .html
17) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -xr .html
18) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -dictScrap .html
19) Source: Reference [10].
4 © ISO 2020 – All rights reserved
---------------------- Page: 9 ----------------------
ISO/FDIS 24613-4:2020(E)
f.
Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues
de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.
Fig. et fam. (vulg.).
Femme, maîtresse.
XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.
provençal langosta, altér. du lat. class. locusta «sauterelle».
NOTE 1 The element is introduced later in this document.
NOTE 2 The etymological description is not completely encoded here. See Clause 7.
5.6 Implementing the Form and Lemma classes
5.6.1 Form class
The Form class shall be serialized using the TEI element (see Table 6). Further subclasses
derived for the Form class are implemented by means of specific values for the @type attribute on
. See Clause 6.
Table 6 — Form class
LMF class TEI construct
…
/Form/
5.6.2 Lemma class
The Lemma class is derived from the Form class, it shall thus be implemented as the TEI element
further constrained by means of the @type attribute set to ‘lemma’ (see Table 7).
Table 7 — Lemma class
LMF class TEI construct
…
/Lemma/
5.7 Implementing the GrammaticalInformation class
The GrammaticalInformation class gathers grammatical features attached to the LexicalEntry, a
Form, a Translation or a Sense (in the case of specific grammatical restrictions for instance). It shall
20)
be implemented in the TEI by means of the element (see Table 8) combined with various
possible child elements for specific grammatical features (see below).
Table 8 — GrammaticalInformation class
LMF class TEI construct
/GrammaticalInformation/ …
20) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gramGrp .html
© ISO 2020 – All rights reserved 5
---------------------- Page: 10 ----------------------
ISO/FDIS 24613-4:2020(E)
The elements provided by the TEI Guidelines within for grammatical description of an
associated class are as follows.
21)
— (part of speech) to indicate the grammatical category of the lexical item. This corresponds
to the /partOfSpeech/ data category in ISO 24611:2012, Annex A.
NOTE 1 This element is equivalent to the use of the element with the appropriate @type attribute:
[5]
, as used in the TEI Lex 0 initiative .
22)
— (grammatical gender) to indicate the grammatical gender (if relevant) of the lexical
item or one of its inflected forms. This corresponds to the /grammaticalGender/ data category in
ISO 24611:2012, Annex A.
NOTE 2 This element is equivalent to the use of the element with the appropriate @type attribute:
.
23)
— (grammatical number) to indicate the grammatical number (if relevant) of the lexical
item or one of its inflected forms. This corresponds to the /grammaticalNumber/ data category in
ISO 24611:2012, Annex A.
NOTE 3 This element is equivalent to the use of the element with the appropriate @type attribute:
.
24)
— (person) to indicate the grammatical person (if relevant) of the lexical item or one of its
inflected forms. This corresponds to the /person/ data category in ISO 24611:2012, Annex A.
NOTE 4 This element is equivalent to the use of the element with the appropriate @type attribute:
.
25)
— (tense) to indicate the grammatical tense (if relevant) of the lexical item or one of its
inflected forms. This corresponds to the /grammaticalTense/ data category in ISO 24611:2012,
Annex A.
NOTE 5 This element is equivalent to the use of the element with the appropriate @type attribute:
.
26)
— (subcategorization) to indicate subcategorization information (e.g. transitive/
intransitive/ditransitive, countable/non-countable, etc.).
27)
— (inflectional class) to indicate the inflectional class associated with the lexical item.
For instance, to indicate that the part of speech is a verb and that it is intransitive, the following
construct shall be used, see Examples 1 to 3.
EXAMPLE 1
verb
intransitive
21) http:// t
...
PROJET
NORME ISO/FDIS
FINAL
INTERNATIONALE 24613-4
ISO/TC 37/SC 4
Gestion des ressources
Secrétariat: KATS
linguistiques — Cadre de balisage
Début de vote:
2020-10-22 lexical (LMF) —
Vote clos le:
Partie 4:
2020-12-17
Sérialisation TEI
Language resource management — Lexical markup framework
(LMF) —
Part 4: TEI serialization
LES DESTINATAIRES DU PRÉSENT PROJET SONT
INVITÉS À PRÉSENTER, AVEC LEURS OBSER-
VATIONS, NOTIFICATION DES DROITS DE PRO-
PRIÉTÉ DONT ILS AURAIENT ÉVENTUELLEMENT
CONNAISSANCE ET À FOURNIR UNE DOCUMEN-
TATION EXPLICATIVE.
OUTRE LE FAIT D’ÊTRE EXAMINÉS POUR
ÉTABLIR S’ILS SONT ACCEPTABLES À DES FINS
INDUSTRIELLES, TECHNOLOGIQUES ET COM-
Numéro de référence
MERCIALES, AINSI QUE DU POINT DE VUE
ISO/FDIS 24613-4:2020(F)
DES UTILISATEURS, LES PROJETS DE NORMES
INTERNATIONALES DOIVENT PARFOIS ÊTRE
CONSIDÉRÉS DU POINT DE VUE DE LEUR POSSI-
BILITÉ DE DEVENIR DES NORMES POUVANT
SERVIR DE RÉFÉRENCE DANS LA RÉGLEMENTA-
©
TION NATIONALE. ISO 2020
---------------------- Page: 1 ----------------------
ISO/FDIS 24613-4:2020(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2020
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2020 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO/FDIS 24613-4:2020(F)
Sommaire Page
Avant-propos .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Principes généraux . 2
5 Sérialisation du modèle de base LMF (ISO 24613-1) . 2
5.1 Implémentation de la classe LexicalResource . 2
5.2 Implémentation de la classe GlobalInformation . 2
5.3 Implémentation de la classe Lexicon . 3
5.4 Implémentation de la classe LexiconInformation . 4
5.5 Implémentation de la classe LexicalEntry. 4
5.6 Implémentation des classes Form et Lemma . 5
5.6.1 Classe Form . 5
5.6.2 Classe Lemma . 5
5.7 Implémentation de la classe GrammaticalInformation . 5
5.8 Implémentation de la classe Sense . 7
5.9 Implémentation de la classe Definition . 7
5.10 Implémentation de la classe OrthographicRepresentation . 8
5.11 Implémentation de la classe CrossREF . 8
5.12 Sélection des catégories de données . 9
6 Sérialisation du modèle MRD (ISO 24613-2) . 9
6.1 Implémentation des représentations de forme pour la classe Form . 9
6.2 Implémentation des classes dérivées de la classe Form .10
6.2.1 Principes généraux .10
6.2.2 Implémentation de la classe WordForm .10
6.2.3 Implémentation de la classe Stem .11
6.2.4 Implémentation de la classe WordPart .11
6.2.5 Implémentation de la classe RelatedForm .11
6.3 Implémentation de la classe Bibliography .12
6.4 Implémentation du mécanisme CrossREF de renvoi à des fichiers multimédia externes .12
6.5 Implémentation de la classe Example .12
6.6 Implémentation de la classe Translation .13
6.7 Implémentation de la classe TextRepresentation .13
6.8 Implémentation de la classe SubjectField .14
6.9 Implémentation du mécanisme CrossRef pour représenter les entrées associées .14
7 Implémentation des classes à partir de l’extension étymologique (ISO 24613-3) .15
7.1 Implémentation de la classe Etymology .15
7.2 Implémentation de la classe Etymon .15
7.2.1 Référencement des formes dans un étymon .15
7.2.2 Représentation de la signification d’un étymon .16
7.2.3 Représentation de la langue d’un étymon .16
7.2.4 Association d’informations grammaticales à un étymon .16
7.2.5 Datation d’un étymon .16
7.2.6 Citation de sources associées à un étymon .17
7.2.7 Élément de prose supplémentaire dans une description étymologique .17
7.3 Implémentation de la classe EtyLink .17
7.4 Implémentation de la classe CognateSet .17
7.5 Implémentation de la classe Cognate .17
7.6 Implémentation de la classe Gloss .18
8 Mécanismes supplémentaires .18
8.1 Vue d’ensemble .18
8.2 Représentation de signes de ponctuation avec .18
© ISO 2020 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO/FDIS 24613-4:2020(F)
8.3 Représentation de diverses étiquettes avec .18
8.4 Codage de caractères de séparation simples avec .19
8.5 Transmission d’informations de rendu avec l’attribut @rend .19
8.6 Exemple d’usage des traits supplémentaires présentés à l’Article 8 .19
Bibliographie .20
iv © ISO 2020 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO/FDIS 24613-4:2020(F)
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes
nationaux de normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est
en général confiée aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l'ISO participent également aux travaux.
L'ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie,
sous-comité SC 4, Gestion des ressources linguistiques.
Cette première édition de l’ISO 24613-4, ainsi que l’ISO 24613-1:2019, l’ISO 24613-2:2020,
1) 2) 3)
l’ISO 24613-3:— , l’ISO 24613-5:— et l’ISO 24613-6:— , annule et remplace l’ISO 24613:2008, qui a
été révisée techniquement.
Les principales modifications par rapport à l’édition précédente sont les suivantes:
— révision complète du contenu et de sa sous-division en plusieurs parties.
Une liste de toutes les parties de la série ISO 24613 se trouve sur le site Web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En préparation. Étape au moment de la puplication: ISO/DIS 24613-3:2020.
2) En préparation. Étape au moment de la puplication: ISO/DIS 24613-5:2020.
3) Prévu.
© ISO 2020 – Tous droits réservés v
---------------------- Page: 5 ----------------------
PROJET FINAL DE NORME INTERNATIONALE ISO/FDIS 24613-4:2020(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
1 Domaine d’application
Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle
XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre
les classes de l’ISO 24613-1 (modèle de base du LMF) ainsi que les classes fournies par l’ISO 24613-2
(modèle de dictionnaire lisible par ordinateur, MRD) et l’ISO24613-3 (extension étymologique).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1:
Modèle de base
ISO 24613-2, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 2: Modèle de
dictionnaire lisible par ordinateur (MRD)
ISO 24613-3, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 3: Extension
étymologique
IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). Septembre 2009. Meilleure
pr at ique ac t uel le . ht t p s:// t o ol s . ie t f . or g / ht m l/ b c p 47
Recommandation XML W3C, Extensible Markup Language (XML) 1.0 (cinquième édition),
26 novembr e 20 0 8 , ht t p:// w w w .w3 . or g / T R / x m l/
TEI P5 Guidelines for Electronic Text Encoding and Interchange. [Version numéro: 4.0.0]. [Date de la
dernière modification: 13/02/2020]. TEI Consortium. http:// www .tei‑c .org/ Guidelines/ P5/
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp;
— IEC Electropedia: disponible à l’adresse http:// www .electropedia .org/ .
© ISO 2020 – Tous droits réservés 1
---------------------- Page: 6 ----------------------
ISO/FDIS 24613-4:2020(F)
4 Principes généraux
Le présent document est destiné à fournir des constructions essentiellement univoques pour chaque
classe LMF issue du modèle de base (ISO 24613-1), de l’extension MRD (ISO 24613-2) et de l’extension
étymologique (ISO 24613-3), en rendant ainsi les recommandations d’origine Text Encoding Initiative
(TEI) du chapitre sur les dictionnaires plus laconiques (voir Références [9], [11], [14], [8] et [4]), tout en
spécifiant les contraintes spécifiques nécessaires pour s’aligner sur l’ISO 24613 en général. Par exemple,
des listes de valeurs précises sont données pour certains attributs tels que @type. De plus, le présent
document respecte les cardinalités exprimées dans l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3.
Sauf indication explicite, toutes les constructions résultantes doivent être des représentations valides
de la TEI, ce qui implique que la spécification décrite dans le présent document correspond à un
sous-ensemble strict des lignes directrices de la TEI. Ils doivent par conséquent être des documents
XML bien élaborés, comme spécifié par la recommandation XML W3C.
Le présent document exige la conformité avec l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3 lors de la
mise en œuvre des catégories de données mentionnées dans les parties respectives.
Néanmoins, le présent document n’aborde pas les aspects des métadonnées de LMF, car l’en-tête TEI,
c’est‑à‑dire le composant de métadonnées associé à tout document TEI, est par essence suffisamment
riche, car il représente tous les aspects liés à la création, à la description du contenu, au versionnage et à
la publication d’un document textuel dans son ensemble.
Dans tous les exemples XML du présent document et afin de simplifier les représentations réelles, il est
présumé, sauf indication contraire, que les éléments XML appartiennent à l’espace de nommage TEI,
ce qui suppose que tous les exemples sont dans le domaine d’application de la déclaration d’espace de
nommage XML suivante:
xmlns = «http:// www .tei -c .org/ ns/ 1 .0»
Une spécification TEI ODD mise à jour correspondant au présent document est disponible à partir de la
Référence [12] ainsi que des exemples supplémentaires.
5 Sérialisation du modèle de base LMF (ISO 24613-1)
5.1 Implémentation de la classe LexicalResource
4)
La classe LexicalResource doit être implémentée au moyen de l’élément qui regroupe
un ou plusieurs documents TEI pour chaque lexique spécifique. L’élément doit inclure un
attribut @type avec la valeur «lexicalResource» (voir Tableau 1). Si la ressource lexique ne contient
qu’un seul lexique, ce niveau peut être omis, de sorte que le document débute directement par un
élément racine (voir 5.3).
Tableau 1 — Classe LexicalResource
Classe LMF Construction TEI
…
/LexicalResource/
5.2 Implémentation de la classe GlobalInformation
5)
La classe GlobalInformation doit être implémentée au moyen de l’élément TEI , en tant
qu’enfant direct de l’élément (voir Tableau 2). Pour l’utilisation effective de l’élément
, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent être
respectées lors du codage de tout type d’information se rapportant à des informations administratives,
documentaires et bibliographiques rattachées à la ressource lexicale correspondante.
4) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiCorpus .html
5) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiHeader .html
2 © ISO 2020 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO/FDIS 24613-4:2020(F)
Tableau 2 — Classe GlobalInformation
Classe LMF Construction TEI
/GlobalInformation/ …
Les exigences supplémentaires concernant la classe GlobalInformation sont implémentées de la façon
suivante:
— comme la sérialisation TEI repose sur la recommandation XML W3C, elle implémente l’attribut @
xml: lang pour indiquer l’information sur la langue de travail correspondant au contenu de tout
élément spécifique. Le contenu @xml: lang doit être conforme à l’IETF BCP 47. Il n’est donc pas
nécessaire d’effectuer une implémentation spécifique de la catégorie de données /language coding/
afin de garantir la conformité du présent document à l’ISO 24613‑1;
— IETF BCP 47 repose également sur l’ISO 15924 pour le codage des noms d’écritures. Il n’est donc pas
nécessaire de disposer d’un mécanisme spécifique dans le présent document pour implémenter la
catégorie de données /script coding/;
— la catégorie de données /character encoding/ est implémentée dans la déclaration XML d’un
document conforme à la TEI, en utilisant l’attribut encoding. Par exemple, un document XML-TEI
codé en UTF-8 conformément à la norme Unicode ISO/IEC 10646 doit débuter par la déclaration
suivante:
5.3 Implémentation de la classe Lexicon
6)
La classe Lexicon doit être implémentée au moyen de l’élément TEI , qui regroupe toutes les
entrées lexicales d’un lexique spécifique. L’élément doit disposer d’un attribut @type avec la
valeur «lexicon» (voir Tableau 3).
Tableau 3 — Classe Lexicon
Classe LMF Construction TEI
…
/Lexicon/
D’après les lignes directrices de la TEI, le contenu principal d’un document TEI est incorporé dans un
7) 8) 9) 10)
élément enfant qui est ensuite décomposé en sous-éléments , et .
Toutes les entrées lexicales d’un lexique donné doivent être des éléments descendants du sous-élément
11)
de , et peuvent être réorganisées en sous-ensembles au moyen de l’élément
et peuvent être utilisés pour incorporer des ressources complémentaires le cas échéant,
par exemple des références bibliographiques.
L’exemple suivant illustre une organisation documentaire simple pour un lexique (sans les éléments
facultatifs et , et sans subdivisions).
EXEMPLE
…
…
6) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -TEI .html
7) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -text .html
8) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -front .html
9) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -body .html
10) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -back .html
11) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -div .html
© ISO 2020 – Tous droits réservés 3
---------------------- Page: 8 ----------------------
ISO/FDIS 24613-4:2020(F)
…
…
5.4 Implémentation de la classe LexiconInformation
La classe LexiconInformation doit également être implémentée au moyen de l’élément TEI ,
en tant qu’enfant direct de l’élément (voir Tableau 4). Pour l’utilisation effective de l’élément
, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent
être respectées pour coder tout type d’information se rapportant à des informations administratives,
documentaires et bibliographiques rattachées au lexique correspondant.
Tableau 4 — Classe LexiconInformation
Classe LMF Construction TEI
…
/LexiconInformation/
5.5 Implémentation de la classe LexicalEntry
12)
La classe LexicalEntry doit être implémentée au moyen de l’élément des lignes directrices de
la TEI (voir Tableau 5). Les informations lexicales à l’intérieur de l’élément doivent être codées
en utilisant les éléments enfants suivants:
13)
— pour les informations morphologiques et grammaticales liées à toute l’entrée (voir 5.6.1
et 5.6.2);
14)
— pour des informations sémantiques, voir 5.8;
15)
— pour les aspects étymologiques, voir Article 7;
16)
— permet la sérialisation des informations se rapportant à des constructions analogues à des
entrées (par exemple des formes apparentées, des formes dérivées, des expressions multi-termes),
voir 6.9;
17)
— pour référencer des éléments internes ou externes (locution, équivalent, etc.);
18)
— pour toute information qui n’appartient pas à l’un des éléments ci-dessus.
Ces différentes constructions sont décrites plus en détail dans les paragraphes suivants.
Tableau 5 — Classe LexicalEntry
Classe LMF Construction TEI
…
/LexicalEntry/
12) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -entry .html
13) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -form .html
14) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -sense .html
15) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -etym .html
16) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -re .html
17) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -xr .html
18) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -dictScrap .html
4 © ISO 2020 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO/FDIS 24613-4:2020(F)
19)
L’exemple suivant en français illustre le codage d’une entrée simple d’un dictionnaire .
EXEMPLE
langouste
lägust
n.
f.
Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues
de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.
Fig. et fam. (vulg.).
Femme, maîtresse.
XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.
provençal langosta, altér. du lat. class. locusta «sauterelle».
NOTE 1 L’élément sera présenté ultérieurement dans le présent document.
NOTE 2 La description étymologique n’est pas totalement codée ici. Voir l’Article 7.
5.6 Implémentation des classes Form et Lemma
5.6.1 Classe Form
La classe Form doit être sérialisée en utilisant l’élément TEI (voir Tableau 6). Les sous-classes
supplémentaires dérivées de la classe Form sont implémentées au moyen de valeurs spécifiques pour
l’attribut @type sur . Voir l’Article 6.
Tableau 6 — Classe Form
Classe LMF Construction TEI
…
/Form/
5.6.2 Classe Lemma
La classe Lemma étant dérivée de la classe Form, elle doit donc être implémentée en tant qu’élément TEI
également contraint au moyen de l’attribut @type fixé à «lemma» (voir Tableau 7).
Tableau 7 — Classe Lemma
Classe LMF Construction TEI
…
/Lemma/
5.7 Implémentation de la classe GrammaticalInformation
La classe GrammaticalInformation regroupe les traits grammaticaux associés à la classe LexicalEntry
ou à une classe Form, Translation ou Sense (dans le cas de restrictions grammaticales particulières,
20)
par exemple). Elle doit être implémentée en TEI au moyen de l’élément (voir Tableau 8)
combiné avec différents éléments enfants possibles pour des traits grammaticaux spécifiques
(voir ci-dessous).
19) Source: Référence [10].
20) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -gramGrp .html
© ISO 2020 – Tous droits réservés 5
---------------------- Page: 10 ----------------------
ISO/FDIS 24613-4:2020(F)
Tableau 8 — Classe GrammaticalInformation
Classe LMF Construction TEI
/GrammaticalInformation/ …
Les éléments fournis par les lignes directrices de la TEI dans pour la description
grammaticale d’une classe associée sont les suivants:
21)
— (partie du discours) pour indiquer la catégorie grammaticale de l’élément lexical. Ceci
correspond à la catégorie de données /partOfSpeech/ de l’ISO 24611:2012, Annexe A;
NOTE 1 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:
[5]
, tel qu’utilisé dans l’initiative TEI Lex 0 .
22)
— (genre grammatical) pour indiquer le genre grammatical (si pertinent) de l’élément lexical
ou de l’une de ses formes fléchies. Ceci correspond à la catégorie de données /grammaticalGender/
de l’ISO 24611:2012, Annexe A;
NOTE 2 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:
.
23)
— (nombre grammatical) pour indiquer le nombre grammatical (si pertinent) de
l’élément lexic
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.