Language resource management -- Lexical markup framework (LMF)

This document describes the serialization of the lexical markup framework (LMF) model defined as an XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).

Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF)

Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modčle XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre les classes de l'ISO 24613‑1 (modčle de base du LMF) ainsi que les classes fournies par l'ISO 24613‑2 (modčle de dictionnaire lisible par ordinateur, MRD) et l'ISO24613‑3 (extension étymologique).

Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 4. del: Serializacija TEI

General Information

Status
Published
Publication Date
14-Jan-2021
Current Stage
5060 - Close of voting Proof returned by Secretariat
Start Date
18-Dec-2020
Completion Date
17-Dec-2020

RELATIONS

Buy Standard

Standard
ISO 24613-4:2021
English language
25 pages
sale 10% off
Preview
sale 10% off
Preview

e-Library read for
1 day
Standard
ISO 24613-4:2021 - Language resource management -- Lexical markup framework (LMF)
English language
20 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24613-4:2021 - Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF)
French language
20 pages
sale 15% off
Preview
sale 15% off
Preview
Draft
ISO/FDIS 24613-4 - Language resource management -- Lexical markup framework (LMF)
English language
20 pages
sale 15% off
Preview
sale 15% off
Preview
Draft
ISO/FDIS 24613-4 - Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF)
French language
20 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (sample)

SLOVENSKI STANDARD
SIST ISO 24613-4:2021
01-junij-2021
Nadomešča:
SIST ISO 24613:2013
Upravljanje jezikovnih virov - Ogrodje za označevanje leksikonov (LMF) - 4. del:
Serializacija TEI
Language resource management - Lexical markup framework (LMF) - Part 4: TEI
serialization

Gestion des ressources linguistiques -- Cadre de balisage lexical (LMF) - Partie 4:

Sérialisation TEI
Ta slovenski standard je istoveten z: ISO 24613-4:2021
ICS:
01.020 Terminologija (načela in Terminology (principles and
koordinacija) coordination)
01.140.20 Informacijske vede Information sciences
35.240.30 Uporabniške rešitve IT v IT applications in information,
informatiki, dokumentiranju in documentation and
založništvu publishing
SIST ISO 24613-4:2021 en,fr

2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

---------------------- Page: 1 ----------------------
SIST ISO 24613-4:2021
---------------------- Page: 2 ----------------------
SIST ISO 24613-4:2021
INTERNATIONAL ISO
STANDARD 24613-4
First edition
2021-01
Language resource management —
Lexical markup framework (LMF) —
Part 4:
TEI serialization
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
Reference number
ISO 24613-4:2021(E)
ISO 2021
---------------------- Page: 3 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2021

All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may

be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting

on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address

below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved
---------------------- Page: 4 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
Contents Page

Foreword ..........................................................................................................................................................................................................................................v

1 Scope ................................................................................................................................................................................................................................. 1

2 Normative references ...................................................................................................................................................................................... 1

3 Terms and definitions ..................................................................................................................................................................................... 1

4 General principles ............................................................................................................................................................................................... 1

5 Serialization of the LMF core model (ISO 24613-1) ......................................................................................................... 2

5.1 Implementing the LexicalResource class ......................................................................................................................... 2

5.2 Implementing the GlobalInformation class.................................................................................................................... 2

5.3 Implementing the Lexicon class ............................................................................................................................................... 3

5.4 Implementing the LexiconInformation class ................................................................................................................ 4

5.5 Implementing the LexicalEntry class .................................................................................................................................. 4

5.6 Implementing the Form and Lemma classes ................................................................................................................ 5

5.6.1 Form class .............................................................................................................................................................................. 5

5.6.2 Lemma class ......................................................................................................................................................................... 5

5.7 Implementing the GrammaticalInformation class ................................................................................................... 5

5.8 Implementing the Sense class .................................................................................................................................................... 7

5.9 Implementing the Definition class ......................................................................................................................................... 7

5.10 Implementing the OrthographicRepresentation class ......................................................................................... 8

5.11 Implementing the CrossREF class .......................................................................................................................................... 8

5.12 Data category selection.................................................................................................................................................................... 9

6 Serialization of the MRD model (ISO 24613-2) .................................................................................................................... 9

6.1 Implementing the form representations for the Form class ........................................................................... 9

6.2 Implementing classes derived from the Form class.............................................................................................11

6.2.1 General principles ........................................................................................................................................................11

6.2.2 Implementing the WordForm class ..............................................................................................................11

6.2.3 Implementing the Stem class .............................................................................................................................11

6.2.4 Implementing the WordPart class .................................................................................................................11

6.2.5 Implementing the RelatedForm class .........................................................................................................12

6.3 Implementing the Bibliography class ...............................................................................................................................12

6.4 Implementing the CrossREF mechanism to refer to external media files ........................................12

6.5 Implementing the Example class .........................................................................................................................................12

6.6 Implementing the Translation class ..................................................................................................................................13

6.7 Implementing the TextRepresentation class ..............................................................................................................13

6.8 Implementing the SubjectField class ................................................................................................................................14

6.9 Implementing the CrossREF mechanism to represent related entries ...............................................14

7 Implementing the classes from the etymological extension (ISO 24613-3) .......................................15

7.1 Implementing the Etymology class ....................................................................................................................................15

7.2 Implementing the Etymon class............................................................................................................................................15

7.2.1 Referencing forms in an etymon .....................................................................................................................16

7.2.2 Representing the meaning of an etymon .................................................................................................16

7.2.3 Representing the language of an etymon ................................................................................................16

7.2.4 Associating grammatical information to an etymon......................................................................16

7.2.5 Dating an etymon .........................................................................................................................................................16

7.2.6 Providing sources associated with an etymon ....................................................................................17

7.2.7 Further prose component in an etymological description .......................................................17

7.3 Implementing the EtyLink class ............................................................................................................................................17

7.4 Implementing the CognateSet class ...................................................................................................................................17

7.5 Implementing the Cognate class ...........................................................................................................................................17

7.6 Implementing the Gloss class ..................................................................................................................................................18

8 Additional mechanisms ..............................................................................................................................................................................18

8.1 Overview ...................................................................................................................................................................................................18

8.2 Representing punctuation marks with ..............................................................................................................18

© ISO 2021 – All rights reserved iii
---------------------- Page: 5 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)

8.3 Representing various labels with ..........................................................................................................................18

8.4 Encoding simple separating characters with ..........................................................................19

8.5 Providing rendition information with the @rend attribute..........................................................................19

8.6 Usage example of the additional features introduced in Clause 8 .........................................................19

Bibliography .............................................................................................................................................................................................................................20

iv © ISO 2021 – All rights reserved
---------------------- Page: 6 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards

bodies (ISO member bodies). The work of preparing International Standards is normally carried out

through ISO technical committees. Each member body interested in a subject for which a technical

committee has been established has the right to be represented on that committee. International

organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.

ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of

electrotechnical standardization.

The procedures used to develop this document and those intended for its further maintenance are

described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the

different types of ISO documents should be noted. This document was drafted in accordance with the

editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).

Attention is drawn to the possibility that some of the elements of this document may be the subject of

patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of

any patent rights identified during the development of the document will be in the Introduction and/or

on the ISO list of patent declarations received (see www .iso .org/ patents).

Any trade name used in this document is information given for the convenience of users and does not

constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and

expressions related to conformity assessment, as well as information about ISO's adherence to

the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see

www .iso .org/ iso/ foreword .html.

This document was prepared by Technical Committee ISO/TC 37, Language and terminology,

Subcommittee SC 4, Language resource management.

This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—

and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.

The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.

Any feedback or questions on this document should be directed to the user’s national standards body. A

complete listing of these bodies can be found at www .iso .org/ members .html.

1) Under preparation. Stage at the time of publication: ISO/FDIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
© ISO 2021 – All rights reserved v
---------------------- Page: 7 ----------------------
SIST ISO 24613-4:2021
---------------------- Page: 8 ----------------------
SIST ISO 24613-4:2021
INTERNATIONAL STANDARD ISO 24613-4:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope

This document describes the serialization of the lexical markup framework (LMF) model defined as an

XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the

classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine

readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references

The following documents are referred to in the text in such a way that some or all of their content

constitutes requirements of this document. For dated references, only the edition cited applies. For

undated references, the latest edition of the referenced document (including any amendments) applies.

ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model

ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-

readable dictionary (MRD) model

ISO 24613-3, Language resource management — Lexical markup framework (LMF) — Part 3: Etymological

extension

IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). September 2009. Best Current

Practice. https:// tools .ietf .org/ html/ bcp47

W3C XML Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 November 2008,

http:// www .w3 .org/ TR/ xml/

TEI P5, Guidelines for Electronic Text Encoding and Interchange. [Version number: 4.1.0]. [Last modified

date: 2020-08-19]. TEI Consortium. http:// www .tei -c .org/ Guidelines/ P5/
3 Terms and definitions

For the purposes of this document, the terms and definitions given in ISO 24613-1 and in

ISO 24613-3 apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 General principles

This document aims at providing mostly univocal constructs for each LMF class from the core model

(ISO 24613-1), the MRD extension (ISO 24613-2) and the etymological extension (ISO 24613-3), thus

making the original Text Encoding Initiative (TEI) recommendations from the dictionary chapter

© ISO 2021 – All rights reserved 1
---------------------- Page: 9 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)

terser (see References [4], [8], [9], [11] and [14]), while eliciting specific constraints needed to align

with ISO 24613 in general. For instance, precise value lists are given for some attributes such as @type.

In addition, this document complies with the cardinalities expressed in ISO 24613-1, ISO 24613-2 and in

ISO 24613-3.

Unless explicitly stated, all resulting constructs shall be valid TEI representations, which means that

the specification described in this document corresponds to a pure subset of the TEI Guidelines. They

shall thus be well-formed XML documents as specified by the W3C XML recommendation.

This document requires compliance with ISO 24613-1, ISO 24613-2, and ISO 24613-3 when implementing

data categories referred to in the respective parts.

Nevertheless, this document does not elaborate on the metadata aspects from LMF, since the TEI

header, i.e. the metadata component attached to any TEI document, is in essence rich enough in that it

represents all the aspects related to the creation, the content description, the versioning and publishing

of a textual document as a whole.

In all XML examples in this document and in order to simplify the actual representations, it is assumed,

unless otherwise stated, that XML elements belong to the TEI namespace, thus assuming that all

examples are within the scope of the following XML namespace declaration:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"

An updated TEI ODD specification corresponding to this document is available from Reference [12]

together with additional examples.
5 Serialization of the LMF core model (ISO 24613-1)
5.1 Implementing the LexicalResource class

The LexicalResource class shall be implemented by means of the element which groups

together one or several TEI documents for each specific lexicon. The element shall include

a @type attribute with the value “lexicalResource” (see Table 1). In the case where the lexical resource

contains only one lexicon, this level may be omitted, so that the document directly starts with a

root element (see 5.3).
Table 1 — LexicalResource class
LMF class TEI construct
… /LexicalResource/
teiCorpus>
5.2 Implementing the GlobalInformation class

The GlobalInformation class shall be implemented by means of the TEI element , as a

direct child of the element (see Table 2). For the actual use of the element,

the additional constraints given in the TEI Guidelines shall be followed when encoding any kind of

information related to administrative, documentary and bibliographic information attached to the

corresponding lexical resource.
Table 2 — GlobalInformation class
LMF class TEI construct

/GlobalInformation/

3) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiCorpus .html

4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiHeader .html

2 © ISO 2021 – All rights reserved
---------------------- Page: 10 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)

The further requirements concerning the GlobalInformation class are implemented as follows:

— since the TEI serialization is based on the W3C XML recommendation, it implements the @xml:

lang attribute to indicate the working language information corresponding to the content of any

specific element. @xml: lang content shall be compliant with IETF BCP 47. There is thus no need for

a specific implementation of the /language coding/ data category in order to ensure compliance of

this document with ISO 24613-1;

— IETF BCP 47 also relies on ISO 15924 for the coding of script names. There is thus no need to have a

specific mechanism in this document for implementing the /script coding/ data category;

— the /character encoding/ data category is implemented in the XML declaration of a TEI conformant

document using the encoding attribute. For instance, an XML-TEI document encoded as UTF-8

according to the Unicode standard ISO/IEC 10646 shall begin with the following declaration:


5.3 Implementing the Lexicon class

The Lexicon class shall be implemented by means of the TEI element , which groups together

all lexical entries of a specific lexicon. The element shall have a @type attribute with the value

“lexicon” (see Table 3).
Table 3 — Lexicon class
LMF class TEI construct

/Lexicon/

According to the TEI Guidelines, the actual content of a TEI document is embedded within a

7) 8) 9)

child element which is further decomposed in sub-elements , , and . All

lexical entries of a given lexicon shall be descendant elements of the sub-element of , and

10)

may be further organized in subsets by means of the

element. and may be used

to incorporate complementary resources when applicable, for instance bibliographic references.

The following example outlines a simple document organization for a lexicon (without the optional

and elements, and without sub-divisions).
EXAMPLE










5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -TEI .html

6) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -text .html

7) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -front .html

8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -body .html

9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -back .html

10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -div .html

© ISO 2021 – All rights reserved 3
---------------------- Page: 11 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
5.4 Implementing the LexiconInformation class

The LexiconInformation class shall also be implemented by means of the TEI element , as

a direct child of the element (see Table 4). For the actual use of the element, the

additional constraints given in the TEI Guidelines shall be followed to encode any kind of information

related to administrative, documentary and bibliographic information attached to the corresponding

lexicon.
Table 4 — LexiconInformation class
LMF class TEI construct

/LexiconInformation/
5.5 Implementing the LexicalEntry class
11)

The LexicalEntry class shall be implemented by means of the element in the TEI Guidelines

(see Table 5). Lexical information inside elements shall be encoded through the use of the

following child elements:
12)

for morphological and grammatical information related to the whole entry (see 5.6.1

and 5.6.2);
13)
— for semantic information, see 5.8;
14)
— for etymological aspects, see Clause 7;
15)

— related entry allows the serialization of information referring to entry-like constructs (e.g.,

related forms, derived forms, multiword expressions), see 6.9;
16)
— for referencing internal or external elements (phrase, equivalent, etc.);
17)

— for any information that does not belong to any of the above elements.

These various constructs are further described in the following subclauses.
Table 5 — LexicalEntry class
LMF class TEI construct
/LexicalEntry/ …
18)

The following example in French illustrates the encoding of a simple dictionary entry .

EXAMPLE


langouste
lägust

n.

11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -entry .html

12) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -form .html

13) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -sense .html

14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -etym .html

15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -re .html

16) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -xr .html

17) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -dictScrap .html

18) Source: Reference [10].
4 © ISO 2021 – All rights reserved
---------------------- Page: 12 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)
f.



Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues

de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.



Fig. et fam. (vulg.).
Femme, maîtresse.

XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.

provençal langosta, altér. du lat. class. locusta «sauterelle».

NOTE 1 The element is introduced later in this document.

NOTE 2 The etymological description is not completely encoded here. See Clause 7.

5.6 Implementing the Form and Lemma classes
5.6.1 Form class

The Form class shall be serialized using the TEI element

(see Table 6). Further subclasses

derived from the Form class are implemented by means of specific values for the @type attribute on

. See Clause 6.
Table 6 — Form class
LMF class TEI construct

/Form/
5.6.2 Lemma class

The Lemma class is derived from the Form class, it shall thus be implemented as the TEI element

further constrained by means of the @type attribute set to “lemma” (see Table 7).

Table 7 — Lemma class
LMF class TEI construct

/Lemma/
5.7 Implementing the GrammaticalInformation class

The GrammaticalInformation class gathers grammatical features attached to the LexicalEntry, a

Form, a Translation or a Sense (in the case of specific grammatical restrictions for instance). It shall

19)

be implemented in the TEI by means of the element (see Table 8) combined with various

possible child elements for specific grammatical features (see below).
Table 8 — GrammaticalInformation class
LMF class TEI construct
/GrammaticalInformation/ …

19) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gramGrp .html

© ISO 2021 – All rights reserved 5
---------------------- Page: 13 ----------------------
SIST ISO 24613-4:2021
ISO 24613-4:2021(E)

The elements provided by the TEI Guidelines within for grammatical description of an

associated class are as follows.
20)

— (part of speech) to indicate the grammatical category of the lexical item. This corresponds

to the /partOfSpeech/ data category in ISO 24611:2012, Annex A.

NOTE 1 This element is equivalent to the use of the element with the appropriate @type attribute:

[5]
, as used in the TEI Lex 0 initiative .
21)

— (grammatical gender) to indicate the grammatical gender (if relevant) of the lexical

item or one of its inflected forms. This corresponds to the /grammaticalGender/ data category in

ISO 24611:2012, Annex A.

NOTE 2 This element is equivalent to the use of the element with the appropriate @type attribute:

.
22)

— (grammatical number) to indicate the grammatical number (if relevant) of the lexical

item or one of its inflected forms. This corresponds to the /grammaticalNumber/ data category in

ISO 24611:2012, Annex A.

NOTE 3 This element is equivalent to the use of the element with the appropriate @type attribute:

.
23)

— (person) to indicate the grammatical person (if relevant) of the lexical item or one of its

inflected forms. This corresponds to the /person/ data category in ISO 24611:2012, Annex A.

NOTE 4 This element is equivalent to the use of the element with the appropriate @type attribute:

.
24)

— (tense) to indicate the grammatical tense (if relevant) of the lexical item or one of its

inflected forms. This corresponds to the /grammaticalTense/ data category in ISO 24611:2012

...

INTERNATIONAL ISO
STANDARD 24613-4
First edition
2021-01
Language resource management —
Lexical markup framework (LMF) —
Part 4:
TEI serialization
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
Reference number
ISO 24613-4:2021(E)
ISO 2021
---------------------- Page: 1 ----------------------
ISO 24613-4:2021(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2021

All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may

be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting

on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address

below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 24613-4:2021(E)
Contents Page

Foreword ..........................................................................................................................................................................................................................................v

1 Scope ................................................................................................................................................................................................................................. 1

2 Normative references ...................................................................................................................................................................................... 1

3 Terms and definitions ..................................................................................................................................................................................... 1

4 General principles ............................................................................................................................................................................................... 1

5 Serialization of the LMF core model (ISO 24613-1) ......................................................................................................... 2

5.1 Implementing the LexicalResource class ......................................................................................................................... 2

5.2 Implementing the GlobalInformation class.................................................................................................................... 2

5.3 Implementing the Lexicon class ............................................................................................................................................... 3

5.4 Implementing the LexiconInformation class ................................................................................................................ 4

5.5 Implementing the LexicalEntry class .................................................................................................................................. 4

5.6 Implementing the Form and Lemma classes ................................................................................................................ 5

5.6.1 Form class .............................................................................................................................................................................. 5

5.6.2 Lemma class ......................................................................................................................................................................... 5

5.7 Implementing the GrammaticalInformation class ................................................................................................... 5

5.8 Implementing the Sense class .................................................................................................................................................... 7

5.9 Implementing the Definition class ......................................................................................................................................... 7

5.10 Implementing the OrthographicRepresentation class ......................................................................................... 8

5.11 Implementing the CrossREF class .......................................................................................................................................... 8

5.12 Data category selection.................................................................................................................................................................... 9

6 Serialization of the MRD model (ISO 24613-2) .................................................................................................................... 9

6.1 Implementing the form representations for the Form class ........................................................................... 9

6.2 Implementing classes derived from the Form class.............................................................................................11

6.2.1 General principles ........................................................................................................................................................11

6.2.2 Implementing the WordForm class ..............................................................................................................11

6.2.3 Implementing the Stem class .............................................................................................................................11

6.2.4 Implementing the WordPart class .................................................................................................................11

6.2.5 Implementing the RelatedForm class .........................................................................................................12

6.3 Implementing the Bibliography class ...............................................................................................................................12

6.4 Implementing the CrossREF mechanism to refer to external media files ........................................12

6.5 Implementing the Example class .........................................................................................................................................12

6.6 Implementing the Translation class ..................................................................................................................................13

6.7 Implementing the TextRepresentation class ..............................................................................................................13

6.8 Implementing the SubjectField class ................................................................................................................................14

6.9 Implementing the CrossREF mechanism to represent related entries ...............................................14

7 Implementing the classes from the etymological extension (ISO 24613-3) .......................................15

7.1 Implementing the Etymology class ....................................................................................................................................15

7.2 Implementing the Etymon class............................................................................................................................................15

7.2.1 Referencing forms in an etymon .....................................................................................................................16

7.2.2 Representing the meaning of an etymon .................................................................................................16

7.2.3 Representing the language of an etymon ................................................................................................16

7.2.4 Associating grammatical information to an etymon......................................................................16

7.2.5 Dating an etymon .........................................................................................................................................................16

7.2.6 Providing sources associated with an etymon ....................................................................................17

7.2.7 Further prose component in an etymological description .......................................................17

7.3 Implementing the EtyLink class ............................................................................................................................................17

7.4 Implementing the CognateSet class ...................................................................................................................................17

7.5 Implementing the Cognate class ...........................................................................................................................................17

7.6 Implementing the Gloss class ..................................................................................................................................................18

8 Additional mechanisms ..............................................................................................................................................................................18

8.1 Overview ...................................................................................................................................................................................................18

8.2 Representing punctuation marks with ..............................................................................................................18

© ISO 2021 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO 24613-4:2021(E)

8.3 Representing various labels with ..........................................................................................................................18

8.4 Encoding simple separating characters with ..........................................................................19

8.5 Providing rendition information with the @rend attribute..........................................................................19

8.6 Usage example of the additional features introduced in Clause 8 .........................................................19

Bibliography .............................................................................................................................................................................................................................20

iv © ISO 2021 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 24613-4:2021(E)
Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards

bodies (ISO member bodies). The work of preparing International Standards is normally carried out

through ISO technical committees. Each member body interested in a subject for which a technical

committee has been established has the right to be represented on that committee. International

organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.

ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of

electrotechnical standardization.

The procedures used to develop this document and those intended for its further maintenance are

described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the

different types of ISO documents should be noted. This document was drafted in accordance with the

editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).

Attention is drawn to the possibility that some of the elements of this document may be the subject of

patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of

any patent rights identified during the development of the document will be in the Introduction and/or

on the ISO list of patent declarations received (see www .iso .org/ patents).

Any trade name used in this document is information given for the convenience of users and does not

constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and

expressions related to conformity assessment, as well as information about ISO's adherence to

the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see

www .iso .org/ iso/ foreword .html.

This document was prepared by Technical Committee ISO/TC 37, Language and terminology,

Subcommittee SC 4, Language resource management.

This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—

and ISO 24613-5:— , cancels and replaces ISO 24613:2008, which has been technically revised.

The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.

Any feedback or questions on this document should be directed to the user’s national standards body. A

complete listing of these bodies can be found at www .iso .org/ members .html.

1) Under preparation. Stage at the time of publication: ISO/FDIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
© ISO 2021 – All rights reserved v
---------------------- Page: 5 ----------------------
INTERNATIONAL STANDARD ISO 24613-4:2021(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope

This document describes the serialization of the lexical markup framework (LMF) model defined as an

XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the

classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine

readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references

The following documents are referred to in the text in such a way that some or all of their content

constitutes requirements of this document. For dated references, only the edition cited applies. For

undated references, the latest edition of the referenced document (including any amendments) applies.

ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model

ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-

readable dictionary (MRD) model

ISO 24613-3, Language resource management — Lexical markup framework (LMF) — Part 3: Etymological

extension

IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). September 2009. Best Current

Practice. https:// tools .ietf .org/ html/ bcp47

W3C XML Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 November 2008,

http:// www .w3 .org/ TR/ xml/

TEI P5, Guidelines for Electronic Text Encoding and Interchange. [Version number: 4.1.0]. [Last modified

date: 2020-08-19]. TEI Consortium. http:// www .tei -c .org/ Guidelines/ P5/
3 Terms and definitions

For the purposes of this document, the terms and definitions given in ISO 24613-1 and in

ISO 24613-3 apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 General principles

This document aims at providing mostly univocal constructs for each LMF class from the core model

(ISO 24613-1), the MRD extension (ISO 24613-2) and the etymological extension (ISO 24613-3), thus

making the original Text Encoding Initiative (TEI) recommendations from the dictionary chapter

© ISO 2021 – All rights reserved 1
---------------------- Page: 6 ----------------------
ISO 24613-4:2021(E)

terser (see References [4], [8], [9], [11] and [14]), while eliciting specific constraints needed to align

with ISO 24613 in general. For instance, precise value lists are given for some attributes such as @type.

In addition, this document complies with the cardinalities expressed in ISO 24613-1, ISO 24613-2 and in

ISO 24613-3.

Unless explicitly stated, all resulting constructs shall be valid TEI representations, which means that

the specification described in this document corresponds to a pure subset of the TEI Guidelines. They

shall thus be well-formed XML documents as specified by the W3C XML recommendation.

This document requires compliance with ISO 24613-1, ISO 24613-2, and ISO 24613-3 when implementing

data categories referred to in the respective parts.

Nevertheless, this document does not elaborate on the metadata aspects from LMF, since the TEI

header, i.e. the metadata component attached to any TEI document, is in essence rich enough in that it

represents all the aspects related to the creation, the content description, the versioning and publishing

of a textual document as a whole.

In all XML examples in this document and in order to simplify the actual representations, it is assumed,

unless otherwise stated, that XML elements belong to the TEI namespace, thus assuming that all

examples are within the scope of the following XML namespace declaration:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"

An updated TEI ODD specification corresponding to this document is available from Reference [12]

together with additional examples.
5 Serialization of the LMF core model (ISO 24613-1)
5.1 Implementing the LexicalResource class

The LexicalResource class shall be implemented by means of the element which groups

together one or several TEI documents for each specific lexicon. The element shall include

a @type attribute with the value “lexicalResource” (see Table 1). In the case where the lexical resource

contains only one lexicon, this level may be omitted, so that the document directly starts with a

root element (see 5.3).
Table 1 — LexicalResource class
LMF class TEI construct
… /LexicalResource/
teiCorpus>
5.2 Implementing the GlobalInformation class

The GlobalInformation class shall be implemented by means of the TEI element , as a

direct child of the element (see Table 2). For the actual use of the element,

the additional constraints given in the TEI Guidelines shall be followed when encoding any kind of

information related to administrative, documentary and bibliographic information attached to the

corresponding lexical resource.
Table 2 — GlobalInformation class
LMF class TEI construct

/GlobalInformation/

3) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiCorpus .html

4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiHeader .html

2 © ISO 2021 – All rights reserved
---------------------- Page: 7 ----------------------
ISO 24613-4:2021(E)

The further requirements concerning the GlobalInformation class are implemented as follows:

— since the TEI serialization is based on the W3C XML recommendation, it implements the @xml:

lang attribute to indicate the working language information corresponding to the content of any

specific element. @xml: lang content shall be compliant with IETF BCP 47. There is thus no need for

a specific implementation of the /language coding/ data category in order to ensure compliance of

this document with ISO 24613-1;

— IETF BCP 47 also relies on ISO 15924 for the coding of script names. There is thus no need to have a

specific mechanism in this document for implementing the /script coding/ data category;

— the /character encoding/ data category is implemented in the XML declaration of a TEI conformant

document using the encoding attribute. For instance, an XML-TEI document encoded as UTF-8

according to the Unicode standard ISO/IEC 10646 shall begin with the following declaration:


5.3 Implementing the Lexicon class

The Lexicon class shall be implemented by means of the TEI element , which groups together

all lexical entries of a specific lexicon. The element shall have a @type attribute with the value

“lexicon” (see Table 3).
Table 3 — Lexicon class
LMF class TEI construct

/Lexicon/

According to the TEI Guidelines, the actual content of a TEI document is embedded within a

7) 8) 9)

child element which is further decomposed in sub-elements , , and . All

lexical entries of a given lexicon shall be descendant elements of the sub-element of , and

10)

may be further organized in subsets by means of the

element. and may be used

to incorporate complementary resources when applicable, for instance bibliographic references.

The following example outlines a simple document organization for a lexicon (without the optional

and elements, and without sub-divisions).
EXAMPLE










5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -TEI .html

6) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -text .html

7) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -front .html

8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -body .html

9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -back .html

10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -div .html

© ISO 2021 – All rights reserved 3
---------------------- Page: 8 ----------------------
ISO 24613-4:2021(E)
5.4 Implementing the LexiconInformation class

The LexiconInformation class shall also be implemented by means of the TEI element , as

a direct child of the element (see Table 4). For the actual use of the element, the

additional constraints given in the TEI Guidelines shall be followed to encode any kind of information

related to administrative, documentary and bibliographic information attached to the corresponding

lexicon.
Table 4 — LexiconInformation class
LMF class TEI construct

/LexiconInformation/
5.5 Implementing the LexicalEntry class
11)

The LexicalEntry class shall be implemented by means of the element in the TEI Guidelines

(see Table 5). Lexical information inside elements shall be encoded through the use of the

following child elements:
12)

for morphological and grammatical information related to the whole entry (see 5.6.1

and 5.6.2);
13)
— for semantic information, see 5.8;
14)
— for etymological aspects, see Clause 7;
15)

— related entry allows the serialization of information referring to entry-like constructs (e.g.,

related forms, derived forms, multiword expressions), see 6.9;
16)
— for referencing internal or external elements (phrase, equivalent, etc.);
17)

— for any information that does not belong to any of the above elements.

These various constructs are further described in the following subclauses.
Table 5 — LexicalEntry class
LMF class TEI construct
/LexicalEntry/ …
18)

The following example in French illustrates the encoding of a simple dictionary entry .

EXAMPLE


langouste
lägust

n.

11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -entry .html

12) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -form .html

13) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -sense .html

14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -etym .html

15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -re .html

16) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -xr .html

17) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -dictScrap .html

18) Source: Reference [10].
4 © ISO 2021 – All rights reserved
---------------------- Page: 9 ----------------------
ISO 24613-4:2021(E)
f.



Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues

de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.



Fig. et fam. (vulg.).
Femme, maîtresse.

XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.

provençal langosta, altér. du lat. class. locusta «sauterelle».

NOTE 1 The element is introduced later in this document.

NOTE 2 The etymological description is not completely encoded here. See Clause 7.

5.6 Implementing the Form and Lemma classes
5.6.1 Form class

The Form class shall be serialized using the TEI element

(see Table 6). Further subclasses

derived from the Form class are implemented by means of specific values for the @type attribute on

. See Clause 6.
Table 6 — Form class
LMF class TEI construct

/Form/
5.6.2 Lemma class

The Lemma class is derived from the Form class, it shall thus be implemented as the TEI element

further constrained by means of the @type attribute set to “lemma” (see Table 7).

Table 7 — Lemma class
LMF class TEI construct

/Lemma/
5.7 Implementing the GrammaticalInformation class

The GrammaticalInformation class gathers grammatical features attached to the LexicalEntry, a

Form, a Translation or a Sense (in the case of specific grammatical restrictions for instance). It shall

19)

be implemented in the TEI by means of the element (see Table 8) combined with various

possible child elements for specific grammatical features (see below).
Table 8 — GrammaticalInformation class
LMF class TEI construct
/GrammaticalInformation/ …

19) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gramGrp .html

© ISO 2021 – All rights reserved 5
---------------------- Page: 10 ----------------------
ISO 24613-4:2021(E)

The elements provided by the TEI Guidelines within for grammatical description of an

associated class are as follows.
20)

— (part of speech) to indicate the grammatical category of the lexical item. This corresponds

to the /partOfSpeech/ data category in ISO 24611:2012, Annex A.

NOTE 1 This element is equivalent to the use of the element with the appropriate @type attribute:

[5]
, as used in the TEI Lex 0 initiative .
21)

— (grammatical gender) to indicate the grammatical gender (if relevant) of the lexical

item or one of its inflected forms. This corresponds to the /grammaticalGender/ data category in

ISO 24611:2012, Annex A.

NOTE 2 This element is equivalent to the use of the element with the appropriate @type attribute:

.
22)

— (grammatical number) to indicate the grammatical number (if relevant) of the lexical

item or one of its inflected forms. This corresponds to the /grammaticalNumber/ data category in

ISO 24611:2012, Annex A.

NOTE 3 This element is equivalent to the use of the element with the appropriate @type attribute:

.
23)

— (person) to indicate the grammatical person (if relevant) of the lexical item or one of its

inflected forms. This corresponds to the /person/ data category in ISO 24611:2012, Annex A.

NOTE 4 This element is equivalent to the use of the element with the appropriate @type attribute:

.
24)

— (tense) to indicate the grammatical tense (if relevant) of the lexical item or one of its

inflected forms. This corresponds to the /grammaticalTense/ data category in ISO 24611:2012,

Annex A.

NOTE 5 This element is equivalent to the use of the element with the appropriate @type attribute:

.
25)

— (subcategorization) to indicate subcategorization information (e.g. transitive/

intransitive/ditransitive, countable/non-countable, etc.).
26)

— (inflectional class) to indicate the inflectional class associated with the lexical item.

For instance, to indicate that the part of speech is a verb and that it is intransitive, the following

construct shall be used, see Examples 1 to 3.
EXAMPLE 1

verb
intransitive

20) http:// tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -pos .html
21) http:// tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gen .html

22) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -number .html

23) http:// tei -c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -per .html
24) http:// tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -tns .html

25) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -subc .html

26) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -iType.html

6 © ISO 2021 – All rights reserved
---------------------- Page: 11 ------------------
...

NORME ISO
INTERNATIONALE 24613-4
Première édition
2021-01
Gestion des ressources
linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
Language resource management — Lexical markup framework
(LMF) —
Part 4: TEI serialization
Numéro de référence
ISO 24613-4:2021(F)
ISO 2021
---------------------- Page: 1 ----------------------
ISO 24613-4:2021(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021

Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette

publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,

y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut

être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.

ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO 24613-4:2021(F)
Sommaire Page

Avant-propos ................................................................................................................................................................................................................................v

1 Domaine d’application ................................................................................................................................................................................... 1

2 Références normatives ................................................................................................................................................................................... 1

3 Termes et définitions ....................................................................................................................................................................................... 1

4 Principes généraux ............................................................................................................................................................................................ 2

5 Sérialisation du modèle de base LMF (ISO 24613-1) ..................................................................................................... 2

5.1 Implémentation de la classe LexicalResource ............................................................................................................. 2

5.2 Implémentation de la classe GlobalInformation ........................................................................................................ 2

5.3 Implémentation de la classe Lexicon ................................................................................................................................... 3

5.4 Implémentation de la classe LexiconInformation .................................................................................................... 4

5.5 Implémentation de la classe LexicalEntry....................................................................................................................... 4

5.6 Implémentation des classes Form et Lemma ............................................................................................................... 5

5.6.1 Classe Form .......................................................................................................................................................................... 5

5.6.2 Classe Lemma ..................................................................................................................................................................... 5

5.7 Implémentation de la classe GrammaticalInformation ....................................................................................... 5

5.8 Implémentation de la classe Sense ........................................................................................................................................ 7

5.9 Implémentation de la classe Definition ............................................................................................................................. 7

5.10 Implémentation de la classe OrthographicRepresentation .............................................................................. 8

5.11 Implémentation de la classe CrossREF .............................................................................................................................. 8

5.12 Sélection des catégories de données .................................................................................................................................... 9

6 Sérialisation du modèle MRD (ISO 24613-2) .......................................................................................................................... 9

6.1 Implémentation des représentations de forme pour la classe Form ....................................................... 9

6.2 Implémentation des classes dérivées de la classe Form ..................................................................................10

6.2.1 Principes généraux .....................................................................................................................................................10

6.2.2 Implémentation de la classe WordForm ..................................................................................................10

6.2.3 Implémentation de la classe Stem .................................................................................................................11

6.2.4 Implémentation de la classe WordPart .....................................................................................................11

6.2.5 Implémentation de la classe RelatedForm .............................................................................................11

6.3 Implémentation de la classe Bibliography ...................................................................................................................12

6.4 Implémentation du mécanisme CrossREF de renvoi à des fichiers multimédia externes ..12

6.5 Implémentation de la classe Example ..............................................................................................................................12

6.6 Implémentation de la classe Translation ......................................................................................................................13

6.7 Implémentation de la classe TextRepresentation ..................................................................................................13

6.8 Implémentation de la classe SubjectField ....................................................................................................................14

6.9 Implémentation du mécanisme CrossRef pour représenter les entrées associées ..................14

7 Implémentation des classes à partir de l’extension étymologique (ISO 24613-3) ......................15

7.1 Implémentation de la classe Etymology ........................................................................................................................15

7.2 Implémentation de la classe Etymon ................................................................................................................................15

7.2.1 Référencement des formes dans un étymon ........................................................................................15

7.2.2 Représentation de la signification d’un étymon ................................................................................16

7.2.3 Représentation de la langue d’un étymon ..............................................................................................16

7.2.4 Association d’informations grammaticales à un étymon ..........................................................16

7.2.5 Datation d’un étymon ...............................................................................................................................................16

7.2.6 Citation de sources associées à un étymon ............................................................................................17

7.2.7 Élément de prose supplémentaire dans une description étymologique ......................17

7.3 Implémentation de la classe EtyLink ................................................................................................................................17

7.4 Implémentation de la classe CognateSet .......................................................................................................................17

7.5 Implémentation de la classe Cognate ...............................................................................................................................17

7.6 Implémentation de la classe Gloss ......................................................................................................................................18

8 Mécanismes supplémentaires .............................................................................................................................................................18

8.1 Vue d’ensemble ....................................................................................................................................................................................18

8.2 Représentation de signes de ponctuation avec ..........................................................................................18

© ISO 2021 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO 24613-4:2021(F)

8.3 Représentation de diverses étiquettes avec .................................................................................................18

8.4 Codage de caractères de séparation simples avec ...............................................................19

8.5 Transmission d’informations de rendu avec l’attribut @rend ...................................................................19

8.6 Exemple d’usage des traits supplémentaires présentés à l’Article 8 .....................................................19

Bibliographie ...........................................................................................................................................................................................................................20

iv © ISO 2021 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO 24613-4:2021(F)
Avant-propos

L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes

nationaux de normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est

en général confiée aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude

a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,

gouvernementales et non gouvernementales, en liaison avec l'ISO participent également aux travaux.

L'ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui

concerne la normalisation électrotechnique.

Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont

décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents

critères d’approbation requis pour les différents types de documents ISO. Le présent document a été

rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www

.iso .org/ directives).

L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de

droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable

de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant

les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de

l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de

brevets reçues par l’ISO (voir www .iso .org/ brevets).

Les appellations commerciales éventuellement mentionnées dans le présent document sont données

pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un

engagement.

Pour une explication de la nature volontaire des normes, la signification des termes et expressions

spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion

de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles

techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant-propos.

Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie,

sous-comité SC 4, Gestion des ressources linguistiques.

Cette première édition de l’ISO 24613-4, ainsi que l’ISO 24613-1:2019, l’ISO 24613-2:2020,

1) 2)

l’ISO 24613-3:— et l’ISO 24613-5:— , annule et remplace l’ISO 24613:2008, qui a été révisée

techniquement.

Les principales modifications par rapport à l’édition précédente sont les suivantes:

— révision complète du contenu et de sa sous-division en plusieurs parties.

Une liste de toutes les parties de la série ISO 24613 se trouve sur le site Web de l’ISO.

Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent

document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes

se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En préparation. Étape au moment de la publication: ISO/FDIS 24613-3:2020.
2) En préparation. Étape au moment de la publication: ISO/DIS 24613-5:2020.
© ISO 2021 – Tous droits réservés v
---------------------- Page: 5 ----------------------
NORME INTERNATIONALE ISO 24613-4:2021(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
1 Domaine d’application

Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle

XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre

les classes de l’ISO 24613-1 (modèle de base du LMF) ainsi que les classes fournies par l’ISO 24613-2

(modèle de dictionnaire lisible par ordinateur, MRD) et l’ISO24613-3 (extension étymologique).

2 Références normatives

Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur

contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.

Pour les références non datées, la dernière édition du document de référence s’applique (y compris les

éventuels amendements).

ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1:

Modèle de base

ISO 24613-2, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 2: Modèle de

dictionnaire lisible par ordinateur (MRD)

ISO 24613-3, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 3: Extension

étymologique

IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). Septembre 2009. Meilleure

pr at ique ac t uel le . ht t p s:// t o ol s . ie t f . or g / ht m l/ b c p 47

Recommandation XML W3C, Extensible Markup Language (XML) 1.0 (cinquième édition),

26 novembr e 20 0 8 , ht t p:// w w w .w3 . or g / T R / x m l/

TEI P5 Guidelines for Electronic Text Encoding and Interchange. [Version numéro: 4.1.0]. [Date de la

dernière modification: 19/08/2020]. TEI Consortium. http:// www .tei‑c .org/ Guidelines/ P5/

3 Termes et définitions

Pour les besoins du présent document, les termes et définitions suivants s’appliquent.

L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en

normalisation, consultables aux adresses suivantes:

— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp;

— IEC Electropedia: disponible à l’adresse http:// www .electropedia .org/ .
© ISO 2021 – Tous droits réservés 1
---------------------- Page: 6 ----------------------
ISO 24613-4:2021(F)
4 Principes généraux

Le présent document est destiné à fournir des constructions essentiellement univoques pour chaque

classe LMF issue du modèle de base (ISO 24613-1), de l’extension MRD (ISO 24613-2) et de l’extension

étymologique (ISO 24613-3), en rendant ainsi les recommandations d’origine Text Encoding Initiative

(TEI) du chapitre sur les dictionnaires plus laconiques (voir Références [4], [8], [9], [11] et [14]), tout en

spécifiant les contraintes spécifiques nécessaires pour s’aligner sur l’ISO 24613 en général. Par exemple,

des listes de valeurs précises sont données pour certains attributs tels que @type. De plus, le présent

document respecte les cardinalités exprimées dans l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3.

Sauf indication explicite, toutes les constructions résultantes doivent être des représentations valides

de la TEI, ce qui implique que la spécification décrite dans le présent document correspond à un

sous-ensemble strict des lignes directrices de la TEI. Ils doivent par conséquent être des documents

XML bien élaborés, comme spécifié par la recommandation XML W3C.

Le présent document exige la conformité avec l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3 lors de la

mise en œuvre des catégories de données mentionnées dans les parties respectives.

Néanmoins, le présent document n’aborde pas les aspects des métadonnées de LMF, car l’en-tête TEI,

c’est‑à‑dire le composant de métadonnées associé à tout document TEI, est par essence suffisamment

riche, car il représente tous les aspects liés à la création, à la description du contenu, au versionnage et à

la publication d’un document textuel dans son ensemble.

Dans tous les exemples XML du présent document et afin de simplifier les représentations réelles, il est

présumé, sauf indication contraire, que les éléments XML appartiennent à l’espace de nommage TEI,

ce qui suppose que tous les exemples sont dans le domaine d’application de la déclaration d’espace de

nommage XML suivante:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"

Une spécification TEI ODD mise à jour correspondant au présent document est disponible à partir de la

Référence [12] ainsi que des exemples supplémentaires.
5 Sérialisation du modèle de base LMF (ISO 24613-1)
5.1 Implémentation de la classe LexicalResource

La classe LexicalResource doit être implémentée au moyen de l’élément qui regroupe

un ou plusieurs documents TEI pour chaque lexique spécifique. L’élément doit inclure un

attribut @type avec la valeur «lexicalResource» (voir Tableau 1). Si la ressource lexique ne contient

qu’un seul lexique, ce niveau peut être omis, de sorte que le document débute directement par un

élément racine (voir 5.3).
Tableau 1 — Classe LexicalResource
Classe LMF Construction TEI

/LexicalResource/
5.2 Implémentation de la classe GlobalInformation

La classe GlobalInformation doit être implémentée au moyen de l’élément TEI , en tant

qu’enfant direct de l’élément (voir Tableau 2). Pour l’utilisation effective de l’élément

, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent être

respectées lors du codage de tout type d’information se rapportant à des informations administratives,

documentaires et bibliographiques rattachées à la ressource lexicale correspondante.

3) http:// www .tei- c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiCorpus .html

4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiHeader .html

2 © ISO 2021 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO 24613-4:2021(F)
Tableau 2 — Classe GlobalInformation
Classe LMF Construction TEI
/GlobalInformation/ …

Les exigences supplémentaires concernant la classe GlobalInformation sont implémentées de la façon

suivante:

— comme la sérialisation TEI repose sur la recommandation XML W3C, elle implémente l’attribut @

xml: lang pour indiquer l’information sur la langue de travail correspondant au contenu de tout

élément spécifique. Le contenu @xml: lang doit être conforme à l’IETF BCP 47. Il n’est donc pas

nécessaire d’effectuer une implémentation spécifique de la catégorie de données /language coding/

afin de garantir la conformité du présent document à l’ISO 24613‑1;

— IETF BCP 47 repose également sur l’ISO 15924 pour le codage des noms d’écritures. Il n’est donc pas

nécessaire de disposer d’un mécanisme spécifique dans le présent document pour implémenter la

catégorie de données /script coding/;

— la catégorie de données /character encoding/ est implémentée dans la déclaration XML d’un

document conforme à la TEI, en utilisant l’attribut encoding. Par exemple, un document XML-TEI

codé en UTF-8 conformément à la norme Unicode ISO/IEC 10646 doit débuter par la déclaration

suivante:

5.3 Implémentation de la classe Lexicon

La classe Lexicon doit être implémentée au moyen de l’élément TEI , qui regroupe toutes les

entrées lexicales d’un lexique spécifique. L’élément doit disposer d’un attribut @type avec la

valeur «lexicon» (voir Tableau 3).
Tableau 3 — Classe Lexicon
Classe LMF Construction TEI

/Lexicon/

D’après les lignes directrices de la TEI, le contenu principal d’un document TEI est incorporé dans un

6) 7) 8) 9)

élément enfant qui est ensuite décomposé en sous-éléments , et .

Toutes les entrées lexicales d’un lexique donné doivent être des éléments descendants du sous-élément

10)

de , et peuvent être réorganisées en sous-ensembles au moyen de l’élément

.

et peuvent être utilisés pour incorporer des ressources complémentaires le cas échéant,

par exemple des références bibliographiques.

L’exemple suivant illustre une organisation documentaire simple pour un lexique (sans les éléments

facultatifs et , et sans subdivisions).
EXEMPLE





5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/fr/ html/ ref -TEI .html

6) http:// www .tei- c.or g/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -text .html

7) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -front .html

8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -body .html

9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/fr/ html/ ref -back .html

10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -div .html

© ISO 2021 – Tous droits réservés 3
---------------------- Page: 8 ----------------------
ISO 24613-4:2021(F)





5.4 Implémentation de la classe LexiconInformation

La classe LexiconInformation doit également être implémentée au moyen de l’élément TEI ,

en tant qu’enfant direct de l’élément (voir Tableau 4). Pour l’utilisation effective de l’élément

, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent

être respectées pour coder tout type d’information se rapportant à des informations administratives,

documentaires et bibliographiques rattachées au lexique correspondant.
Tableau 4 — Classe LexiconInformation
Classe LMF Construction TEI

/LexiconInformation/
5.5 Implémentation de la classe LexicalEntry
11)

La classe LexicalEntry doit être implémentée au moyen de l’élément des lignes directrices de

la TEI (voir Tableau 5). Les informations lexicales à l’intérieur de l’élément doivent être codées

en utilisant les éléments enfants suivants:
12)

pour les informations morphologiques et grammaticales liées à toute l’entrée (voir 5.6.1

et 5.6.2);
13)
— pour des informations sémantiques, voir 5.8;
14)
— pour les aspects étymologiques, voir Article 7;
15)

— permet la sérialisation des informations se rapportant à des constructions analogues à des

entrées (par exemple des formes apparentées, des formes dérivées, des expressions multi-termes),

voir 6.9;
16)

— pour référencer des éléments internes ou externes (locution, équivalent, etc.);

17)

— pour toute information qui n’appartient pas à l’un des éléments ci-dessus.

Ces différentes constructions sont décrites plus en détail dans les paragraphes suivants.

Tableau 5 — Classe LexicalEntry
Classe LMF Construction TEI

/LexicalEntry/

11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/fr/ html/ ref -entry .html

12) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ fr/ html/ ref -form .html

13) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -sense .html

14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -etym .html

15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -re .html

16) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ fr/ html/ ref -xr .html

17) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -dictScrap .html

4 © ISO 2021 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO 24613-4:2021(F)
18)

L’exemple suivant en français illustre le codage d’une entrée simple d’un dictionnaire .

EXEMPLE


langouste
lägust

n.
f.



Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues

de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.



Fig. et fam. (vulg.).
Femme, maîtresse.

XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.

provençal langosta, altér. du lat. class. locusta «sauterelle».

NOTE 1 L’élément sera présenté ultérieurement dans le présent document.

NOTE 2 La description étymologique n’est pas totalement codée ici. Voir l’Article 7.

5.6 Implémentation des classes Form et Lemma
5.6.1 Classe Form

La classe Form doit être sérialisée en utilisant l’élément TEI

(voir Tableau 6). Les sous-classes

supplémentaires dérivées de la classe Form sont implémentées au moyen de valeurs spécifiques pour

l’attribut @type sur . Voir l’Article 6.
Tableau 6 — Classe Form
Classe LMF Construction TEI

/Form/
5.6.2 Classe Lemma

La classe Lemma étant dérivée de la classe Form, elle doit donc être implémentée en tant qu’élément TEI

également contraint au moyen de l’attribut @type fixé à «lemma» (voir Tableau 7).

Tableau 7 — Classe Lemma
Classe LMF Construction TEI

/Lemma/
5.7 Implémentation de la classe GrammaticalInformation

La classe GrammaticalInformation regroupe les traits grammaticaux associés à la classe LexicalEntry

ou à une classe Form, Translation ou Sense (dans le cas de restrictions grammaticales particulières,

19)

par exemple). Elle doit être implémentée en TEI au moyen de l’élément (voir Tableau 8)

combiné avec différents éléments enfants possibles pour des traits grammaticaux spécifiques

(voir ci-dessous).
18) Source: Référence [10].

19) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -gramGrp .html

© ISO 2021 – Tous droits réservés 5
---------------------- Page: 10 ----------------------
ISO 24613-4:2021(F)
Tableau 8 — Classe GrammaticalInformation
Classe LMF Construction TEI
/GrammaticalInformation/ …

Les éléments fournis par les lignes directrices de la TEI dans pour la description

grammaticale d’une classe associée sont les suivants:
20)

— (partie du discours) pour indiquer la catégorie grammaticale de l’élément lexical. Ceci

correspond à la catégorie de données /partOfSpeech/ de l’ISO 24611:2012, Annexe A;

NOTE 1 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:

[5]
, tel qu’utilisé dans l’initiative TEI Lex 0 .
21)

— (genre grammatical) pour indiquer le genre grammatical (si pertinent) de l’élément lexical

ou de l’une de ses formes fléchies. Ceci correspond à la catégorie de données /grammaticalGender/

de l’ISO 24611:2012, Annexe A;

NOTE 2 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:

.
22)

— (nombre grammatical) pour indiquer le nombre grammatical (si pertinent) de

l’élément lexical ou de l’une de ses formes fléchies. Ceci correspond à la catégorie de données /

grammaticalNumber/ de l’ISO 24611:2012, Annexe A;

NOTE 3 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:

.
23)

— (personne) pour indiquer la personne grammaticale (si pertinente) de l’élément lexical ou de

l’une de ses formes fléchies. Ceci correspond à la catégorie de données /person/ de l’ISO 24611:2012,

Annexe A;

NOTE 4 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:

.
24)

— (temps) pour indiquer le temps grammatical (si pertinent) de l’élément lexical ou de

l’une de ses formes fléchies. Ceci correspond à la catégorie de don
...

FINAL
INTERNATIONAL ISO/FDIS
DRAFT
STANDARD 24613-4
ISO/TC 37/SC 4
Language resource management —
Secretariat: KATS
Lexical markup framework (LMF) —
Voting begins on:
2020-10-22
Part 4:
Voting terminates on:
TEI serialization
2020-12-17
Gestion des ressources linguistiques — Cadre de balisage lexical
(LMF) —
Partie 4: Sérialisation TEI
RECIPIENTS OF THIS DRAFT ARE INVITED TO
SUBMIT, WITH THEIR COMMENTS, NOTIFICATION
OF ANY RELEVANT PATENT RIGHTS OF WHICH
THEY ARE AWARE AND TO PROVIDE SUPPOR TING
DOCUMENTATION.
IN ADDITION TO THEIR EVALUATION AS
Reference number
BEING ACCEPTABLE FOR INDUSTRIAL, TECHNO-
ISO/FDIS 24613-4:2020(E)
LOGICAL, COMMERCIAL AND USER PURPOSES,
DRAFT INTERNATIONAL STANDARDS MAY ON
OCCASION HAVE TO BE CONSIDERED IN THE
LIGHT OF THEIR POTENTIAL TO BECOME STAN-
DARDS TO WHICH REFERENCE MAY BE MADE IN
NATIONAL REGULATIONS. ISO 2020
---------------------- Page: 1 ----------------------
ISO/FDIS 24613-4:2020(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2020

All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may

be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting

on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address

below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2020 – All rights reserved
---------------------- Page: 2 ----------------------
ISO/FDIS 24613-4:2020(E)
Contents Page

Foreword ..........................................................................................................................................................................................................................................v

1 Scope ................................................................................................................................................................................................................................. 1

2 Normative references ...................................................................................................................................................................................... 1

3 Terms and definitions ..................................................................................................................................................................................... 1

4 General principles ............................................................................................................................................................................................... 1

5 Serialization of the LMF core model (ISO 24613-1) ......................................................................................................... 2

5.1 Implementing the LexicalResource class ......................................................................................................................... 2

5.2 Implementing the GlobalInformation class.................................................................................................................... 2

5.3 Implementing the Lexicon class ............................................................................................................................................... 3

5.4 Implementing the LexiconInformation class ................................................................................................................ 4

5.5 Implementing the LexicalEntry class .................................................................................................................................. 4

5.6 Implementing the Form and Lemma classes ................................................................................................................ 5

5.6.1 Form class .............................................................................................................................................................................. 5

5.6.2 Lemma class ......................................................................................................................................................................... 5

5.7 Implementing the GrammaticalInformation class ................................................................................................... 5

5.8 Implementing the Sense class .................................................................................................................................................... 7

5.9 Implementing the Definition class ......................................................................................................................................... 7

5.10 Implementing the OrthographicRepresentation class ......................................................................................... 8

5.11 Implementing the CrossREF class .......................................................................................................................................... 8

5.12 Data category selection.................................................................................................................................................................... 9

6 Serialization of the MRD model (ISO 24613-2) .................................................................................................................... 9

6.1 Implementing the form representations for the Form class ........................................................................... 9

6.2 Implementing classes derived from the Form class.............................................................................................11

6.2.1 General principles ........................................................................................................................................................11

6.2.2 Implementing the WordForm class ..............................................................................................................11

6.2.3 Implementing the Stem class .............................................................................................................................11

6.2.4 Implementing the WordPart class .................................................................................................................11

6.2.5 Implementing the RelatedForm class .........................................................................................................12

6.3 Implementing the Bibliography class ...............................................................................................................................12

6.4 Implementing the CrossREF mechanism to refer to external media files ........................................12

6.5 Implementing the Example class .........................................................................................................................................12

6.6 Implementing the Translation class ..................................................................................................................................13

6.7 Implementing the TextRepresentation class ..............................................................................................................13

6.8 Implementing the SubjectField class ................................................................................................................................14

6.9 Implementing the CrossREF mechanism to represent related entries ...............................................14

7 Implementing the classes from the etymological extension (ISO 24613-3) .......................................15

7.1 Implementing the Etymology class ....................................................................................................................................15

7.2 Implementing the Etymon class............................................................................................................................................15

7.2.1 Referencing forms in an etymon .....................................................................................................................16

7.2.2 Representing the meaning of an etymon .................................................................................................16

7.2.3 Representing the language of an etymon ................................................................................................16

7.2.4 Associating grammatical information to an etymon......................................................................16

7.2.5 Dating an etymon .........................................................................................................................................................16

7.2.6 Providing sources associated with an etymon ....................................................................................17

7.2.7 Further prose component in an etymological description .......................................................17

7.3 Implementing the EtyLink class ............................................................................................................................................17

7.4 Implementing the CognateSet class ...................................................................................................................................17

7.5 Implementing the Cognate class ...........................................................................................................................................17

7.6 Implementing the Gloss class ..................................................................................................................................................18

8 Additional mechanisms ..............................................................................................................................................................................18

8.1 Overview ...................................................................................................................................................................................................18

8.2 Representing punctuation marks with ..............................................................................................................18

© ISO 2020 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO/FDIS 24613-4:2020(E)

8.3 Representing various labels with ..........................................................................................................................18

8.4 Encoding simple separating characters with ..........................................................................19

8.5 Providing rendition information with the @rend attribute..........................................................................19

8.6 Usage example of the additional features introduced in Clause 8 .........................................................19

Bibliography .............................................................................................................................................................................................................................20

iv © ISO 2020 – All rights reserved
---------------------- Page: 4 ----------------------
ISO/FDIS 24613-4:2020(E)
Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards

bodies (ISO member bodies). The work of preparing International Standards is normally carried out

through ISO technical committees. Each member body interested in a subject for which a technical

committee has been established has the right to be represented on that committee. International

organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.

ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of

electrotechnical standardization.

The procedures used to develop this document and those intended for its further maintenance are

described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the

different types of ISO documents should be noted. This document was drafted in accordance with the

editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).

Attention is drawn to the possibility that some of the elements of this document may be the subject of

patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of

any patent rights identified during the development of the document will be in the Introduction and/or

on the ISO list of patent declarations received (see www .iso .org/ patents).

Any trade name used in this document is information given for the convenience of users and does not

constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and

expressions related to conformity assessment, as well as information about ISO's adherence to

the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see

www .iso .org/ iso/ foreword .html.

This document was prepared by Technical Committee ISO/TC 37, Language and terminology,

Subcommittee SC 4, Language resource management.

This first edition of ISO 24613-4, together with ISO 24613-1:2019, ISO 24613-2:2020, ISO 24613-3:—

1) 2) 3)

, ISO 24613-5:— , and ISO 24613-6:— , cancels and replaces ISO 24613:2008, which has been

technically revised.
The main changes compared to the previous edition are as follows:
— entire revision of the content and its subdivision into several parts.
A list of all parts in the ISO 24613 series can be found on the ISO website.

Any feedback or questions on this document should be directed to the user’s national standards body. A

complete listing of these bodies can be found at www .iso .org/ members .html.

1) Under preparation. Stage at the time of publication: ISO/DIS 24613-3:2020.
2) Under preparation. Stage at the time of publication: ISO/DIS 24613-5:2020.
3) Planned.
© ISO 2020 – All rights reserved v
---------------------- Page: 5 ----------------------
FINAL DRAFT INTERNATIONAL STANDARD ISO/FDIS 24613-4:2020(E)
Language resource management — Lexical markup
framework (LMF) —
Part 4:
TEI serialization
1 Scope

This document describes the serialization of the lexical markup framework (LMF) model defined as an

XML model compliant with the Text Encoding Initiative (TEI) Guidelines. This serialization covers the

classes of ISO 24613-1 (the LMF core model) as well as classes provided by ISO 24613-2 (the machine

readable dictionary, MRD, model) and ISO 24613-3 (the etymological extension).
2 Normative references

The following documents are referred to in the text in such a way that some or all of their content

constitutes requirements of this document. For dated references, only the edition cited applies. For

undated references, the latest edition of the referenced document (including any amendments) applies.

ISO 24613-1, Language resource management — Lexical markup framework (LMF) — Part 1: Core model

ISO 24613-2, Language resource management — Lexical markup framework (LMF) — Part 2: Machine-

readable dictionary (MRD) model

ISO 24613-3, Language resource management — Lexical markup framework (LMF) — Part 3: Etymological

extension

IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). September 2009. Best Current

Practice. https:// tools .ietf .org/ html/ bcp47

W3C XML Recommendation, Extensible Markup Language (XML) 1.0 (Fifth Edition), 26 November 2008,

http:// www .w3 .org/ TR/ xml/

TEI P5, Guidelines for Electronic Text Encoding and Interchange. [Version number: 4.0.0]. [Last modified

date: 2020-02-13]. TEI Consortium. http:// www .tei -c .org/ Guidelines/ P5/
3 Terms and definitions

For the purposes of this document, the terms and definitions given in ISO 24613-1 and in

ISO 24613-3 apply.

ISO and IEC maintain terminological databases for use in standardization at the following addresses:

— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 General principles

This document aims at providing mostly univocal constructs for each LMF class from the core model

(ISO 24613-1), the MRD extension (ISO 24613-2) and the etymological extension (ISO 24613-3), thus

making the original Text Encoding Initiative (TEI) recommendations from the dictionary chapter

© ISO 2020 – All rights reserved 1
---------------------- Page: 6 ----------------------
ISO/FDIS 24613-4:2020(E)

terser (see References [9], [11], [14], [8] and [4]), while eliciting specific constraints needed to align

with ISO 24613 in general. For instance, precise value lists are given for some attributes such as @type.

In addition, this document complies with the cardinalities expressed in ISO 24613-1, ISO 24613-2 and in

ISO 24613-3.

Unless explicitly stated, all resulting constructs shall be valid TEI representations, which means that

the specification described in this document corresponds to a pure subset of the TEI Guidelines. They

shall thus be well-formed XML documents as specified by the W3C XML recommendation.

This document requires compliance with ISO 24613-1, ISO 24613-2, and ISO 24613-3 when implementing

data categories referred to in the respective parts.

Nevertheless, this document does not elaborate on the metadata aspects from LMF, since the TEI

header, i.e. the metadata component attached to any TEI document, is in essence rich enough in that it

represents all the aspects related to the creation, the content description, the versioning and publishing

of a textual document as a whole.

In all XML examples in this document and in order to simplify the actual representations, it is assumed,

unless otherwise stated, that XML elements belong to the TEI namespace, thus assuming that all

examples are within the scope of the following XML namespace declaration:
xmlns="http:// www .tei -c .org/ ns/ 1 .0"

An updated TEI ODD specification corresponding to this document is available from Reference [12]

together with additional examples.
5 Serialization of the LMF core model (ISO 24613-1)
5.1 Implementing the LexicalResource class

The LexicalResource class shall be implemented by means of the element which groups

together one or several TEI documents for each specific lexicon. The element shall include

a @type attribute with the value “lexicalResource” (see Table 1). In the case where the lexical resource

contains only one lexicon, this level may be omitted, so that the document directly starts with a

root element (see 5.3).
Table 1 — LexicalResource class
LMF class TEI construct
… /LexicalResource/
teiCorpus>
5.2 Implementing the GlobalInformation class

The GlobalInformation class shall be implemented by means of the TEI element , as a

direct child of the element (see Table 2). For the actual use of the element,

the additional constraints given in the TEI Guidelines shall be followed when encoding any kind of

information related to administrative, documentary and bibliographic information attached to the

corresponding lexical resource.
Table 2 — GlobalInformation class
LMF class TEI construct

/GlobalInformation/

4) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiCorpus .html

5) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -teiHeader .html

2 © ISO 2020 – All rights reserved
---------------------- Page: 7 ----------------------
ISO/FDIS 24613-4:2020(E)

The further requirements concerning the GlobalInformation class are implemented as follows:

— since the TEI serialization is based on the W3C XML recommendation, it implements the @xml:

lang attribute to indicate the working language information corresponding to the content of any

specific element. @xml: lang content shall be compliant with IETF BCP 47. There is thus no need for

a specific implementation of the /language coding/ data category in order to ensure compliance of

this document with ISO 24613-1;

— IETF BCP 47 also relies on ISO 15924 for the coding of script names. There is thus no need to have a

specific mechanism in this document for implementing the /script coding/ data category;

— the /character encoding/ data category is implemented in the XML declaration of a TEI conformant

document using the encoding attribute. For instance, an XML-TEI document encoded as UTF-8

according to the Unicode standard ISO/IEC 10646 shall begin with the following declaration:


5.3 Implementing the Lexicon class

The Lexicon class shall be implemented by means of the TEI element , which groups together

all lexical entries of a specific lexicon. The element shall have a @type attribute with the value

‘lexicon’ (see Table 3).
Table 3 — Lexicon class
LMF class TEI construct

/Lexicon/

According to the TEI Guidelines, the actual content of a TEI document is embedded within a

8) 9) 10)

child element which is further decomposed in sub-elements , , and . All

lexical entries of a given lexicon shall be descendant elements of the sub-element of , and

11)

may be further organized in subsets by means of the

element. and may be used

to incorporate complementary resources when applicable, for instance bibliographic references.

The following example outlines a simple document organization for a lexicon (without the optional

and elements, and without sub-divisions).
EXAMPLE










6) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -TEI .html

7) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -text .html

8) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -front .html

9) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -body .html

10) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -back .html

11) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -div .html

© ISO 2020 – All rights reserved 3
---------------------- Page: 8 ----------------------
ISO/FDIS 24613-4:2020(E)
5.4 Implementing the LexiconInformation class

The LexiconInformation class shall also be implemented by means of the TEI element , as

a direct child of the element (see Table 4). For the actual use of the element, the

additional constraints given in the TEI Guidelines shall be followed to encode any kind of information

related to administrative, documentary and bibliographic information attached to the corresponding

lexicon.
Table 4 — LexiconInformation class
LMF class TEI construct

/LexiconInformation/
5.5 Implementing the LexicalEntry class
12)

The LexicalEntry class shall be implemented by means of the element in the TEI Guidelines

(see Table 5). Lexical information inside elements shall be encoded through the use of the

following child elements:
13)

for morphological and grammatical information related to the whole entry (see 5.6.1

and 5.6.2);
14)
— for semantic information, see 5.8;
15)
— for etymological aspects, see Clause 7;
16)

— related entry allows the serialization of information referring to entry-like constructs (e.g.,

related forms, derived forms, multiword expressions), see 6.9;
17)
— for referencing internal or external elements (phrase, equivalent, etc.);
18)

— for any information that does not belong to any of the above elements.

These various constructs are further described in the following subclauses.
Table 5 — LexicalEntry class
LMF class TEI construct
/LexicalEntry/ …
19)

The following example in French illustrates the encoding of a simple dictionary entry .

EXAMPLE


langouste
lägust

n.

12) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/en/ html/ ref -entry .html

13) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -form .html

14) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -sense .html

15) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -etym .html

16) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -re .html

17) http:// www .tei-c .org/ release/ doc/ tei -p5-doc/ en/ html/ ref -xr .html

18) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -dictScrap .html

19) Source: Reference [10].
4 © ISO 2020 – All rights reserved
---------------------- Page: 9 ----------------------
ISO/FDIS 24613-4:2020(E)
f.



Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues

de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.



Fig. et fam. (vulg.).
Femme, maîtresse.

XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.

provençal langosta, altér. du lat. class. locusta «sauterelle».

NOTE 1 The element is introduced later in this document.

NOTE 2 The etymological description is not completely encoded here. See Clause 7.

5.6 Implementing the Form and Lemma classes
5.6.1 Form class

The Form class shall be serialized using the TEI element

(see Table 6). Further subclasses

derived for the Form class are implemented by means of specific values for the @type attribute on

. See Clause 6.
Table 6 — Form class
LMF class TEI construct

/Form/
5.6.2 Lemma class

The Lemma class is derived from the Form class, it shall thus be implemented as the TEI element

further constrained by means of the @type attribute set to ‘lemma’ (see Table 7).

Table 7 — Lemma class
LMF class TEI construct

/Lemma/
5.7 Implementing the GrammaticalInformation class

The GrammaticalInformation class gathers grammatical features attached to the LexicalEntry, a

Form, a Translation or a Sense (in the case of specific grammatical restrictions for instance). It shall

20)

be implemented in the TEI by means of the element (see Table 8) combined with various

possible child elements for specific grammatical features (see below).
Table 8 — GrammaticalInformation class
LMF class TEI construct
/GrammaticalInformation/ …

20) http:// www .tei-c .org/ release/ doc/ tei -p5 -doc/ en/ html/ ref -gramGrp .html

© ISO 2020 – All rights reserved 5
---------------------- Page: 10 ----------------------
ISO/FDIS 24613-4:2020(E)

The elements provided by the TEI Guidelines within for grammatical description of an

associated class are as follows.
21)

— (part of speech) to indicate the grammatical category of the lexical item. This corresponds

to the /partOfSpeech/ data category in ISO 24611:2012, Annex A.

NOTE 1 This element is equivalent to the use of the element with the appropriate @type attribute:

[5]
, as used in the TEI Lex 0 initiative .
22)

— (grammatical gender) to indicate the grammatical gender (if relevant) of the lexical

item or one of its inflected forms. This corresponds to the /grammaticalGender/ data category in

ISO 24611:2012, Annex A.

NOTE 2 This element is equivalent to the use of the element with the appropriate @type attribute:

.
23)

— (grammatical number) to indicate the grammatical number (if relevant) of the lexical

item or one of its inflected forms. This corresponds to the /grammaticalNumber/ data category in

ISO 24611:2012, Annex A.

NOTE 3 This element is equivalent to the use of the element with the appropriate @type attribute:

.
24)

— (person) to indicate the grammatical person (if relevant) of the lexical item or one of its

inflected forms. This corresponds to the /person/ data category in ISO 24611:2012, Annex A.

NOTE 4 This element is equivalent to the use of the element with the appropriate @type attribute:

.
25)

— (tense) to indicate the grammatical tense (if relevant) of the lexical item or one of its

inflected forms. This corresponds to the /grammaticalTense/ data category in ISO 24611:2012,

Annex A.

NOTE 5 This element is equivalent to the use of the element with the appropriate @type attribute:

.
26)

— (subcategorization) to indicate subcategorization information (e.g. transitive/

intransitive/ditransitive, countable/non-countable, etc.).
27)

— (inflectional class) to indicate the inflectional class associated with the lexical item.

For instance, to indicate that the part of speech is a verb and that it is intransitive, the following

construct shall be used, see Examples 1 to 3.
EXAMPLE 1

verb
intransitive

21) http:// t
...

PROJET
NORME ISO/FDIS
FINAL
INTERNATIONALE 24613-4
ISO/TC 37/SC 4
Gestion des ressources
Secrétariat: KATS
linguistiques — Cadre de balisage
Début de vote:
2020-10-22 lexical (LMF) —
Vote clos le:
Partie 4:
2020-12-17
Sérialisation TEI
Language resource management — Lexical markup framework
(LMF) —
Part 4: TEI serialization
LES DESTINATAIRES DU PRÉSENT PROJET SONT
INVITÉS À PRÉSENTER, AVEC LEURS OBSER-
VATIONS, NOTIFICATION DES DROITS DE PRO-
PRIÉTÉ DONT ILS AURAIENT ÉVENTUELLEMENT
CONNAISSANCE ET À FOURNIR UNE DOCUMEN-
TATION EXPLICATIVE.
OUTRE LE FAIT D’ÊTRE EXAMINÉS POUR
ÉTABLIR S’ILS SONT ACCEPTABLES À DES FINS
INDUSTRIELLES, TECHNOLOGIQUES ET COM-
Numéro de référence
MERCIALES, AINSI QUE DU POINT DE VUE
ISO/FDIS 24613-4:2020(F)
DES UTILISATEURS, LES PROJETS DE NORMES
INTERNATIONALES DOIVENT PARFOIS ÊTRE
CONSIDÉRÉS DU POINT DE VUE DE LEUR POSSI-
BILITÉ DE DEVENIR DES NORMES POUVANT
SERVIR DE RÉFÉRENCE DANS LA RÉGLEMENTA-
TION NATIONALE. ISO 2020
---------------------- Page: 1 ----------------------
ISO/FDIS 24613-4:2020(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2020

Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette

publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,

y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut

être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.

ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2020 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO/FDIS 24613-4:2020(F)
Sommaire Page

Avant-propos ................................................................................................................................................................................................................................v

1 Domaine d’application ................................................................................................................................................................................... 1

2 Références normatives ................................................................................................................................................................................... 1

3 Termes et définitions ....................................................................................................................................................................................... 1

4 Principes généraux ............................................................................................................................................................................................ 2

5 Sérialisation du modèle de base LMF (ISO 24613-1) ..................................................................................................... 2

5.1 Implémentation de la classe LexicalResource ............................................................................................................. 2

5.2 Implémentation de la classe GlobalInformation ........................................................................................................ 2

5.3 Implémentation de la classe Lexicon ................................................................................................................................... 3

5.4 Implémentation de la classe LexiconInformation .................................................................................................... 4

5.5 Implémentation de la classe LexicalEntry....................................................................................................................... 4

5.6 Implémentation des classes Form et Lemma ............................................................................................................... 5

5.6.1 Classe Form .......................................................................................................................................................................... 5

5.6.2 Classe Lemma ..................................................................................................................................................................... 5

5.7 Implémentation de la classe GrammaticalInformation ....................................................................................... 5

5.8 Implémentation de la classe Sense ........................................................................................................................................ 7

5.9 Implémentation de la classe Definition ............................................................................................................................. 7

5.10 Implémentation de la classe OrthographicRepresentation .............................................................................. 8

5.11 Implémentation de la classe CrossREF .............................................................................................................................. 8

5.12 Sélection des catégories de données .................................................................................................................................... 9

6 Sérialisation du modèle MRD (ISO 24613-2) .......................................................................................................................... 9

6.1 Implémentation des représentations de forme pour la classe Form ....................................................... 9

6.2 Implémentation des classes dérivées de la classe Form ..................................................................................10

6.2.1 Principes généraux .....................................................................................................................................................10

6.2.2 Implémentation de la classe WordForm ..................................................................................................10

6.2.3 Implémentation de la classe Stem .................................................................................................................11

6.2.4 Implémentation de la classe WordPart .....................................................................................................11

6.2.5 Implémentation de la classe RelatedForm .............................................................................................11

6.3 Implémentation de la classe Bibliography ...................................................................................................................12

6.4 Implémentation du mécanisme CrossREF de renvoi à des fichiers multimédia externes ..12

6.5 Implémentation de la classe Example ..............................................................................................................................12

6.6 Implémentation de la classe Translation ......................................................................................................................13

6.7 Implémentation de la classe TextRepresentation ..................................................................................................13

6.8 Implémentation de la classe SubjectField ....................................................................................................................14

6.9 Implémentation du mécanisme CrossRef pour représenter les entrées associées ..................14

7 Implémentation des classes à partir de l’extension étymologique (ISO 24613-3) ......................15

7.1 Implémentation de la classe Etymology ........................................................................................................................15

7.2 Implémentation de la classe Etymon ................................................................................................................................15

7.2.1 Référencement des formes dans un étymon ........................................................................................15

7.2.2 Représentation de la signification d’un étymon ................................................................................16

7.2.3 Représentation de la langue d’un étymon ..............................................................................................16

7.2.4 Association d’informations grammaticales à un étymon ..........................................................16

7.2.5 Datation d’un étymon ...............................................................................................................................................16

7.2.6 Citation de sources associées à un étymon ............................................................................................17

7.2.7 Élément de prose supplémentaire dans une description étymologique ......................17

7.3 Implémentation de la classe EtyLink ................................................................................................................................17

7.4 Implémentation de la classe CognateSet .......................................................................................................................17

7.5 Implémentation de la classe Cognate ...............................................................................................................................17

7.6 Implémentation de la classe Gloss ......................................................................................................................................18

8 Mécanismes supplémentaires .............................................................................................................................................................18

8.1 Vue d’ensemble ....................................................................................................................................................................................18

8.2 Représentation de signes de ponctuation avec ..........................................................................................18

© ISO 2020 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO/FDIS 24613-4:2020(F)

8.3 Représentation de diverses étiquettes avec .................................................................................................18

8.4 Codage de caractères de séparation simples avec ...............................................................19

8.5 Transmission d’informations de rendu avec l’attribut @rend ...................................................................19

8.6 Exemple d’usage des traits supplémentaires présentés à l’Article 8 .....................................................19

Bibliographie ...........................................................................................................................................................................................................................20

iv © ISO 2020 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO/FDIS 24613-4:2020(F)
Avant-propos

L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes

nationaux de normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est

en général confiée aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude

a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,

gouvernementales et non gouvernementales, en liaison avec l'ISO participent également aux travaux.

L'ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui

concerne la normalisation électrotechnique.

Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont

décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents

critères d’approbation requis pour les différents types de documents ISO. Le présent document a été

rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www

.iso .org/ directives).

L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de

droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable

de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant

les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de

l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de

brevets reçues par l’ISO (voir www .iso .org/ brevets).

Les appellations commerciales éventuellement mentionnées dans le présent document sont données

pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un

engagement.

Pour une explication de la nature volontaire des normes, la signification des termes et expressions

spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion

de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles

techniques au commerce (OTC), voir le lien suivant: www .iso .org/ iso/ fr/ avant-propos.

Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie,

sous-comité SC 4, Gestion des ressources linguistiques.

Cette première édition de l’ISO 24613-4, ainsi que l’ISO 24613-1:2019, l’ISO 24613-2:2020,

1) 2) 3)

l’ISO 24613-3:— , l’ISO 24613-5:— et l’ISO 24613-6:— , annule et remplace l’ISO 24613:2008, qui a

été révisée techniquement.

Les principales modifications par rapport à l’édition précédente sont les suivantes:

— révision complète du contenu et de sa sous-division en plusieurs parties.

Une liste de toutes les parties de la série ISO 24613 se trouve sur le site Web de l’ISO.

Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent

document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes

se trouve à l’adresse www .iso .org/ fr/ members .html.
1) En préparation. Étape au moment de la puplication: ISO/DIS 24613-3:2020.
2) En préparation. Étape au moment de la puplication: ISO/DIS 24613-5:2020.
3) Prévu.
© ISO 2020 – Tous droits réservés v
---------------------- Page: 5 ----------------------
PROJET FINAL DE NORME INTERNATIONALE ISO/FDIS 24613-4:2020(F)
Gestion des ressources linguistiques — Cadre de balisage
lexical (LMF) —
Partie 4:
Sérialisation TEI
1 Domaine d’application

Le présent document décrit la sérialisation du cadre de balisage lexical (LMF) défini en tant que modèle

XML conforme aux lignes directrices de la TEI (Text Encoding Initiative). Cette sérialisation couvre

les classes de l’ISO 24613-1 (modèle de base du LMF) ainsi que les classes fournies par l’ISO 24613-2

(modèle de dictionnaire lisible par ordinateur, MRD) et l’ISO24613-3 (extension étymologique).

2 Références normatives

Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur

contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.

Pour les références non datées, la dernière édition du document de référence s’applique (y compris les

éventuels amendements).

ISO 24613-1, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 1:

Modèle de base

ISO 24613-2, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 2: Modèle de

dictionnaire lisible par ordinateur (MRD)

ISO 24613-3, Gestion des ressources linguistiques — Cadre de balisage lexical (LMF) — Partie 3: Extension

étymologique

IETF BCP 47, Tags for Identifying Languages. (ed A. Phillips, M. Davis). Septembre 2009. Meilleure

pr at ique ac t uel le . ht t p s:// t o ol s . ie t f . or g / ht m l/ b c p 47

Recommandation XML W3C, Extensible Markup Language (XML) 1.0 (cinquième édition),

26 novembr e 20 0 8 , ht t p:// w w w .w3 . or g / T R / x m l/

TEI P5 Guidelines for Electronic Text Encoding and Interchange. [Version numéro: 4.0.0]. [Date de la

dernière modification: 13/02/2020]. TEI Consortium. http:// www .tei‑c .org/ Guidelines/ P5/

3 Termes et définitions

Pour les besoins du présent document, les termes et définitions suivants s’appliquent.

L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en

normalisation, consultables aux adresses suivantes:

— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp;

— IEC Electropedia: disponible à l’adresse http:// www .electropedia .org/ .
© ISO 2020 – Tous droits réservés 1
---------------------- Page: 6 ----------------------
ISO/FDIS 24613-4:2020(F)
4 Principes généraux

Le présent document est destiné à fournir des constructions essentiellement univoques pour chaque

classe LMF issue du modèle de base (ISO 24613-1), de l’extension MRD (ISO 24613-2) et de l’extension

étymologique (ISO 24613-3), en rendant ainsi les recommandations d’origine Text Encoding Initiative

(TEI) du chapitre sur les dictionnaires plus laconiques (voir Références [9], [11], [14], [8] et [4]), tout en

spécifiant les contraintes spécifiques nécessaires pour s’aligner sur l’ISO 24613 en général. Par exemple,

des listes de valeurs précises sont données pour certains attributs tels que @type. De plus, le présent

document respecte les cardinalités exprimées dans l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3.

Sauf indication explicite, toutes les constructions résultantes doivent être des représentations valides

de la TEI, ce qui implique que la spécification décrite dans le présent document correspond à un

sous-ensemble strict des lignes directrices de la TEI. Ils doivent par conséquent être des documents

XML bien élaborés, comme spécifié par la recommandation XML W3C.

Le présent document exige la conformité avec l’ISO 24613-1, l’ISO 24613-2 et l’ISO 24613-3 lors de la

mise en œuvre des catégories de données mentionnées dans les parties respectives.

Néanmoins, le présent document n’aborde pas les aspects des métadonnées de LMF, car l’en-tête TEI,

c’est‑à‑dire le composant de métadonnées associé à tout document TEI, est par essence suffisamment

riche, car il représente tous les aspects liés à la création, à la description du contenu, au versionnage et à

la publication d’un document textuel dans son ensemble.

Dans tous les exemples XML du présent document et afin de simplifier les représentations réelles, il est

présumé, sauf indication contraire, que les éléments XML appartiennent à l’espace de nommage TEI,

ce qui suppose que tous les exemples sont dans le domaine d’application de la déclaration d’espace de

nommage XML suivante:
xmlns = «http:// www .tei -c .org/ ns/ 1 .0»

Une spécification TEI ODD mise à jour correspondant au présent document est disponible à partir de la

Référence [12] ainsi que des exemples supplémentaires.
5 Sérialisation du modèle de base LMF (ISO 24613-1)
5.1 Implémentation de la classe LexicalResource

La classe LexicalResource doit être implémentée au moyen de l’élément qui regroupe

un ou plusieurs documents TEI pour chaque lexique spécifique. L’élément doit inclure un

attribut @type avec la valeur «lexicalResource» (voir Tableau 1). Si la ressource lexique ne contient

qu’un seul lexique, ce niveau peut être omis, de sorte que le document débute directement par un

élément racine (voir 5.3).
Tableau 1 — Classe LexicalResource
Classe LMF Construction TEI

/LexicalResource/
5.2 Implémentation de la classe GlobalInformation

La classe GlobalInformation doit être implémentée au moyen de l’élément TEI , en tant

qu’enfant direct de l’élément (voir Tableau 2). Pour l’utilisation effective de l’élément

, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent être

respectées lors du codage de tout type d’information se rapportant à des informations administratives,

documentaires et bibliographiques rattachées à la ressource lexicale correspondante.

4) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiCorpus .html

5) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -teiHeader .html

2 © ISO 2020 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO/FDIS 24613-4:2020(F)
Tableau 2 — Classe GlobalInformation
Classe LMF Construction TEI
/GlobalInformation/ …

Les exigences supplémentaires concernant la classe GlobalInformation sont implémentées de la façon

suivante:

— comme la sérialisation TEI repose sur la recommandation XML W3C, elle implémente l’attribut @

xml: lang pour indiquer l’information sur la langue de travail correspondant au contenu de tout

élément spécifique. Le contenu @xml: lang doit être conforme à l’IETF BCP 47. Il n’est donc pas

nécessaire d’effectuer une implémentation spécifique de la catégorie de données /language coding/

afin de garantir la conformité du présent document à l’ISO 24613‑1;

— IETF BCP 47 repose également sur l’ISO 15924 pour le codage des noms d’écritures. Il n’est donc pas

nécessaire de disposer d’un mécanisme spécifique dans le présent document pour implémenter la

catégorie de données /script coding/;

— la catégorie de données /character encoding/ est implémentée dans la déclaration XML d’un

document conforme à la TEI, en utilisant l’attribut encoding. Par exemple, un document XML-TEI

codé en UTF-8 conformément à la norme Unicode ISO/IEC 10646 doit débuter par la déclaration

suivante:

5.3 Implémentation de la classe Lexicon

La classe Lexicon doit être implémentée au moyen de l’élément TEI , qui regroupe toutes les

entrées lexicales d’un lexique spécifique. L’élément doit disposer d’un attribut @type avec la

valeur «lexicon» (voir Tableau 3).
Tableau 3 — Classe Lexicon
Classe LMF Construction TEI

/Lexicon/

D’après les lignes directrices de la TEI, le contenu principal d’un document TEI est incorporé dans un

7) 8) 9) 10)

élément enfant qui est ensuite décomposé en sous-éléments , et .

Toutes les entrées lexicales d’un lexique donné doivent être des éléments descendants du sous-élément

11)

de , et peuvent être réorganisées en sous-ensembles au moyen de l’élément

.

et peuvent être utilisés pour incorporer des ressources complémentaires le cas échéant,

par exemple des références bibliographiques.

L’exemple suivant illustre une organisation documentaire simple pour un lexique (sans les éléments

facultatifs et , et sans subdivisions).
EXEMPLE





6) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -TEI .html

7) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -text .html

8) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -front .html

9) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -body .html

10) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -back .html

11) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -div .html

© ISO 2020 – Tous droits réservés 3
---------------------- Page: 8 ----------------------
ISO/FDIS 24613-4:2020(F)





5.4 Implémentation de la classe LexiconInformation

La classe LexiconInformation doit également être implémentée au moyen de l’élément TEI ,

en tant qu’enfant direct de l’élément (voir Tableau 4). Pour l’utilisation effective de l’élément

, les contraintes supplémentaires indiquées dans les lignes directrices de la TEI doivent

être respectées pour coder tout type d’information se rapportant à des informations administratives,

documentaires et bibliographiques rattachées au lexique correspondant.
Tableau 4 — Classe LexiconInformation
Classe LMF Construction TEI

/LexiconInformation/
5.5 Implémentation de la classe LexicalEntry
12)

La classe LexicalEntry doit être implémentée au moyen de l’élément des lignes directrices de

la TEI (voir Tableau 5). Les informations lexicales à l’intérieur de l’élément doivent être codées

en utilisant les éléments enfants suivants:
13)

pour les informations morphologiques et grammaticales liées à toute l’entrée (voir 5.6.1

et 5.6.2);
14)
— pour des informations sémantiques, voir 5.8;
15)
— pour les aspects étymologiques, voir Article 7;
16)

— permet la sérialisation des informations se rapportant à des constructions analogues à des

entrées (par exemple des formes apparentées, des formes dérivées, des expressions multi-termes),

voir 6.9;
17)

— pour référencer des éléments internes ou externes (locution, équivalent, etc.);

18)

— pour toute information qui n’appartient pas à l’un des éléments ci-dessus.

Ces différentes constructions sont décrites plus en détail dans les paragraphes suivants.

Tableau 5 — Classe LexicalEntry
Classe LMF Construction TEI

/LexicalEntry/

12) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -entry .html

13) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -form .html

14) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -sense .html

15) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -etym .html

16) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -re .html

17) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -xr .html

18) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -dictScrap .html

4 © ISO 2020 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO/FDIS 24613-4:2020(F)
19)

L’exemple suivant en français illustre le codage d’une entrée simple d’un dictionnaire .

EXEMPLE


langouste
lägust

n.
f.



Grand crustacé marin (Décapodes macroures) aux pattes antérieures dépourvues

de pinces, aux antennes longues et fortes, et dont la chair est très appréciée.



Fig. et fam. (vulg.).
Femme, maîtresse.

XIIIe; languste, v. 1120, «sauterelle»; encore dans Corneille (Hymnes, 7); anc.

provençal langosta, altér. du lat. class. locusta «sauterelle».

NOTE 1 L’élément sera présenté ultérieurement dans le présent document.

NOTE 2 La description étymologique n’est pas totalement codée ici. Voir l’Article 7.

5.6 Implémentation des classes Form et Lemma
5.6.1 Classe Form

La classe Form doit être sérialisée en utilisant l’élément TEI

(voir Tableau 6). Les sous-classes

supplémentaires dérivées de la classe Form sont implémentées au moyen de valeurs spécifiques pour

l’attribut @type sur . Voir l’Article 6.
Tableau 6 — Classe Form
Classe LMF Construction TEI

/Form/
5.6.2 Classe Lemma

La classe Lemma étant dérivée de la classe Form, elle doit donc être implémentée en tant qu’élément TEI

également contraint au moyen de l’attribut @type fixé à «lemma» (voir Tableau 7).

Tableau 7 — Classe Lemma
Classe LMF Construction TEI

/Lemma/
5.7 Implémentation de la classe GrammaticalInformation

La classe GrammaticalInformation regroupe les traits grammaticaux associés à la classe LexicalEntry

ou à une classe Form, Translation ou Sense (dans le cas de restrictions grammaticales particulières,

20)

par exemple). Elle doit être implémentée en TEI au moyen de l’élément (voir Tableau 8)

combiné avec différents éléments enfants possibles pour des traits grammaticaux spécifiques

(voir ci-dessous).
19) Source: Référence [10].

20) http:// www .tei -c .org/ release/ doc/ tei -p5 -doc/ fr/ html/ ref -gramGrp .html

© ISO 2020 – Tous droits réservés 5
---------------------- Page: 10 ----------------------
ISO/FDIS 24613-4:2020(F)
Tableau 8 — Classe GrammaticalInformation
Classe LMF Construction TEI
/GrammaticalInformation/ …

Les éléments fournis par les lignes directrices de la TEI dans pour la description

grammaticale d’une classe associée sont les suivants:
21)

— (partie du discours) pour indiquer la catégorie grammaticale de l’élément lexical. Ceci

correspond à la catégorie de données /partOfSpeech/ de l’ISO 24611:2012, Annexe A;

NOTE 1 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:

[5]
, tel qu’utilisé dans l’initiative TEI Lex 0 .
22)

— (genre grammatical) pour indiquer le genre grammatical (si pertinent) de l’élément lexical

ou de l’une de ses formes fléchies. Ceci correspond à la catégorie de données /grammaticalGender/

de l’ISO 24611:2012, Annexe A;

NOTE 2 Cet élément équivaut à l’utilisation de l’élément avec l’attribut @type approprié:

.
23)

— (nombre grammatical) pour indiquer le nombre grammatical (si pertinent) de

l’élément lexic
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.