ISO 1087-2:2000
(Main)Terminology work - Vocabulary - Part 2: Computer applications
Terminology work - Vocabulary - Part 2: Computer applications
Travaux terminologiques — Vocabulaire — Partie 2: Applications logicielles
General Information
Relations
Frequently Asked Questions
ISO 1087-2:2000 is a standard published by the International Organization for Standardization (ISO). Its full title is "Terminology work - Vocabulary - Part 2: Computer applications". This standard covers: Terminology work - Vocabulary - Part 2: Computer applications
Terminology work - Vocabulary - Part 2: Computer applications
ISO 1087-2:2000 is classified under the following ICS (International Classification for Standards) categories: 01.040.35 - Information technology (Vocabularies); 35.240.30 - IT applications in information, documentation and publishing. The ICS classification helps identify the subject area and facilitates finding related standards.
ISO 1087-2:2000 has the following relationships with other standards: It is inter standard links to ISO 1087:1990. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.
You can purchase ISO 1087-2:2000 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 1087-2
NORME
First edition
Première édition
INTERNATIONALE
2000-03-01
Terminology work — Vocabulary —
Part 2:
Computer applications
Travaux terminologiques — Vocabulaire —
Partie 2:
Applications logicielles
Reference number
Numéro de référence
©
ISO 2000
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but shall not
be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In downloading this
file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat accepts no liability in this
area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation parameters
were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In the unlikely event
that a problem relating to it is found, please inform the Central Secretariat at the address given below.
PDF – Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier peut
être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence autorisant
l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées acceptent de fait la
responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute responsabilité en la
matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info du
fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir l'exploitation de
ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation, veuillez en informer le
Secrétariat central à l'adresse donnée ci-dessous.
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means, electronic
or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or ISO's member body
in the country of the requester. / Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être
reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les
microfilms, sans l'accord écrit de l’ISO à l’adresse ci-après ou du comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 � CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 734 10 79
E-mail copyright@iso.ch
Web www.iso.ch
Printed in Switzerland/Imprimé en Suisse
ii © ISO 2000 – All rights reserved/Tous droits réservés
Contents Page
Foreword.v
Introduction.vii
1 Scope .1
2 General concepts.1
3 Data organization.6
4 Filtering of terminological data .7
5 Characters .9
6 Storing data.11
7 Information retrieval .13
8 Data handling .15
9 Data validation .16
10 Operations.18
11 Related fields of application.20
Bibliography.21
Alphabetical index .23
Sommaire Page
Avant-propos.vi
Introduction .viii
1 Domaine d'application.1
2 Concepts généraux.1
3 Organisation des données.6
4 Filtrage des données terminologiques.7
5 Caractères.9
6 Stockage des données.11
7 Recherche documentaire.13
8 Manipulation des données.15
9 Validation des données.16
10 Opérations .18
11 Domaines d’application associés .20
Bibliographie .21
Index alphabétique .25
iv © ISO 2000 – All rights reserved/Tous droits réservés
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies (ISO
member bodies). The work of preparing International Standards is normally carried out through ISO technical
committees. Each member body interested in a subject for which a technical committee has been established has
the right to be represented on that committee. International organizations, governmental and non-governmental, in
liaison with ISO, also take part in the work. ISO collaborates closely with the International Electrotechnical
Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 3.
Draft International Standards adopted by the technical committees are circulated to the member bodies for voting.
Publication as an International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this part of ISO 1087 may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
International Standard ISO 1087-2 was prepared by Technical Committee ISO/TC 37, Terminology (principles and
coordination), Subcommittee SC 3, Computer applications.
This part of ISO 1087 cancels and replaces ISO 1087:1990, clause 7. ISO 1087-1, which is being prepared, will
constitute a technical revision of the other clauses of ISO 1087:1990.
ISO 1087 consists of the following parts, under the general title Terminology work — Vocabulary:
� Part 1: Theory and application
� Part 2: Computer applications
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de
normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée aux
comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du comité
technique créé à cet effet. Les organisations internationales, gouvernementales et non gouvernementales, en
liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec la Commission
électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI, Partie 3.
Les projets de Normes internationales adoptés par les comités techniques sont soumis aux comités membres pour
vote. Leur publication comme Normes internationales requiert l'approbation de 75 % au moins des comités
membres votants.
L’attention est appelée sur le fait que certains des éléments de la présente partie de l’ISO 1087 peuvent faire
l’objet de droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable de
ne pas avoir identifié de tels droits de propriété et averti de leur existence.
La Norme internationale ISO 1087-2 a été élaborée par le comité technique ISO/TC 37, Terminologie (principes et
coordination), sous-comité SC 3, Terminotique.
La présente partie de l'ISO 1087 annule et remplace l’ISO 1087:1990, article 7. L’ISO 1087-1, actuellement en
cours d’élaboration, constituera une révision technique des autres articles de l’ISO 1087:1990.
L'ISO 1087 comprend les parties suivantes, présentées sous le titre général Travaux terminologiques —
Vocabulaire:
� Partie 1: Théorie et application
� Partie 2: Applications logicielles
vi © ISO 2000 – All rights reserved/Tous droits réservés
Introduction
The terms of this international terminology standard are given in a clustered ordering subsumed under a few
general headings. Usually, terms necessary for the definition of other terms are preceding the entries of the latter.
For convenience of use, however, an alphabetical index is to be found at the end of this part of ISO 1087.
The layout is designed according to ISO 10241. Thus, the elements of an entry appear in the following order:
entry number
preferred term (bold face), word class
short form (bold face)
admitted term
deprecated term: labelled “(deprecated)”
subject field �between angle brackets�
definition
U
|
|
reference to another entry in bold face followed by entry number in brackets, when it is first
examples
V
mentioned
|
|
notes
W
Except for entry number, preferred term and definition, elements appear only where appropriate.
Entries are nouns except where stated otherwise.
Introduction
Les termes de la présente Norme internationale terminologique sont classés par thème dans plusieurs sous-
groupes généraux. En principe, les termes qui entrent dans la définition d’autres termes précèdent les entrées de
ces derniers. Néanmoins, pour des raisons pratiques, un index alphabétique est fourni à la fin de la présente partie
de l'ISO 1087.
La structure est établie conformément à l’ISO 10241. Les éléments de chaque entrée sont affichés dans l’ordre
suivant:
� le numéro d’entrée
� le terme privilégié (en gras), la classe de mots
� l’abréviation (en gras)
� le(s) terme(s) admis
� le terme rejeté, indiqué par «(rejeté)»
� le domaine�affiché entre ces signes�
� une définition
U
|
|
une référence à une autre entrée, en gras et suivie par le numéro d’entrée entre
� des exemples
V
parenthèses, quand elle est mentionnée la première fois
|
|
� des notes
W
À l’exception du numéro d’entrée, toujours affiché, le terme privilégié et les différents éléments de la définition ne
sont indiqués que lorsque cela est nécessaire.
Sauf indication contraire, les entrées sont des noms.
viii © ISO 2000 – All rights reserved/Tous droits réservés
INTERNATIONAL STANDARD
NORME INTERNATIONALE
Terminology work — Travaux terminologiques —
Vocabulary — Vocabulaire —
Part 2: Partie 2:
Computer applications Applications logicielles
1 Scope 1 Domaine d'application
This International Standard defines terms for La présente Norme internationale définit les termes
language and information processing for applications utilisés pour le traitement du langage et de l’infor-
in terminology work and terminography. mation dans les applications liées à la terminologie et
à la terminographie.
2 General concepts 2 Concepts généraux
2.1 2.1
information information
�information processing� knowledge concerning such �traitement de l’information� connaissance d’éléments
things as facts, concepts, objects, events, ideas
tels que des faits, des concepts, des objets, des
événements et des idées
NOTE 1 Adapted from ISO 2382-1:1993.
NOTE 1 Adapté de l'ISO 2382-1:1993.
NOTE 2 Information is defined differently in other
application areas.
NOTE 2 Le terme information est défini différemment
dans d’autres domaines d’application.
2.2 2.2
data donnée
representation of information (2.1) in a formalized informations (2.1) représentées sous une forme
manner suitable for communication, interpretation, conventionnelle convenant à la communication, à
storing or processing l’interprétation, au stockage ou au traitement
NOTE Adapted from ISO/IEC 2382-1:1993. NOTE Adapté de l’ISO/CEI 2382-1:1993.
2.3 2.3
data processing traitement des données
DP
déroulement systématique d’opérations sur des
systematic performance of operations upon data (2.2) données (2.2)
EXAMPLE Arithmetic or logic operations upon data EXEMPLE Opérations arithmétiques ou logiques sur
(2.2) , merging (8.5) or sorting (8.4) of data, assembling or des données (2.2), fusion (8.5) ou tri (8.4) de données,
compiling of programs, or operations on text (2.6), such as assemblage ou compilation de programmes, ou opérations
text editing (11.3), sorting, merging, storing, retrieving, sur du texte (2.6) comme l’édition de texte (11.3), le tri, la
displaying (8.6), or printing. fusion, le stockage, la recherche, l’affichage (8.6) ou
l’impression.
NOTE The term should not be used as a synonym for NOTE Il convient que ce terme ne soit pas utilisé
information processing (2.4). comme un synonyme du terme traitement de l’information
(2.4).
[ISO 2382-1:1993]
[ISO 2382-1:1993]
2.4 2.4
information processing traitement de l’information
systematic performance of operations upon infor- déroulement systématique d’opérations sur des infor-
mation (2.1) that includes data processing (2.3) mations (2.1), incluant également le traitement de
données (2.3)
NOTE 1 The term must not be used as a synonym for
data processing (2.3).
NOTE 1 Il convient que ce terme ne soit pas utilisé
comme un synonyme du terme traitement des données
(2.3).
NOTE 2 Adapted from ISO 2382-1:1993.
NOTE 2 Adapté de l’ISO 2382-1:1993.
2.5 2.5
language processing traitement du langage
information processing (2.4) on language traitement de l’information (2.4) sur le langage
EXAMPLE Proofreading: proofreading can be carried EXEMPLE La correction d’un texte peut être réalisée
out intellectually and by using a spell-checker. Both intellectuellement ou en utilisant un correcteur orthogra-
operations are complementary. phique. Ces deux opérations sont complémentaires.
2.6 2.6
text texte
data (2.2) in the form of characters (5.1), symbols, données (2.2) sous la forme de caractères (5.1), de
words, phrases, paragraphs, sentences, tables, or symboles, de mots, de phrases, de paragraphes, de
other character arrangements, intended to convey a tableaux, ou de tout autre disposition de caractères,
meaning, and whose interpretation is essentially dont l’objectif est de véhiculer du sens, et dont
based upon the knowledge of some natural or artificial l’interprétation repose essentiellement sur la
language connaissance d’un langage naturel ou artificiel
NOTE Adapted from ISO 2382-1:1993. NOTE Adapté de l’ISO 2382-1:1993
2.7 2.7
text corpus corpus de textes
corpus corpus
�language engineering� systematic collection of �ingénierie linguistique� regroupement systématique
machine-readable texts (see also 6.4) or parts of text
de textes exploitables par une machine (voir
prepared, coded and stored according to predefined également: 6.4) ou de fragments de texte préparés,
rules
codés et stockés selon des règles prédéfinies
NOTE 1 A text corpus may be limited according to
NOTE 1 Un corpus de textes peut ne regrouper que les
aspects of subject fields, size or time, e.g. mathematical
textes correspondant à certaines des caractéristiques du
texts, certain periodicals from 1986 onwards. It is used as
domaine étudié, telles que la taille ou la période, par
source material for further linguistic analysis or terminology
exemple textes mathématiques, périodiques spécifiques
work.
parus depuis 1986. Un corpus est utilisé comme le matériau
source à partir duquel peuvent être réalisés des analyses
NOTE 2 See also ISO 1087-1. linguistiques ou des travaux de terminologie.
NOTE 2 Voir aussi l’ISO 1087-1.
2 © ISO 2000 – All rights reserved/Tous droits réservés
2.8 2.8
type type
�language engineering� linguistic unit in a text (2.6) �ingénierie linguistique� unité linguistique dans un
representing a defined class texte (2.6) représentant une classe définie
NOTE Such linguistic units are usually character
NOTE Ces unités linguistiques sont généralement des
strings (5.13) uninterrupted by delimiters (2.10). chaînes de caractères (5.13) non interrompues par des
délimiteurs (2.10).
2.9 2.9
token occurrence
�natural-language processing� occurrence of a type �traitement en langage naturel� nombre de fois où
(2.8) apparaît un type (2.8)
EXAMPLE If the class is defined as all word forms
EXEMPLE Si la classe est définie comme l’ensemble
(2.11) of “good”, then all the occurrences of the word forms
des formes lexicales (2.11) du mot «bon», alors toutes les
“good”, “better” and “best” are tokens.
occasions où apparaissent les formes lexicales «bon» et
«meilleur» sont des occurrences.
2.10 2.10
delimiter délimiteur
separator séparateur
one or more characters (5.1) usedto indicatethe un ou plusieurs caractères (5.1) utilisés pour marquer
beginning or the end of a character string (5.13) le début ou la fin d’une chaîne de caractères (5.13)
[ISO 2382-4:1987] [ISO 2382-4:1987]
NOTE Blanks or punctuation marks often function as NOTE Les blancs ou les signes de ponctuation sont
delimiters. souvent utilisés comme délimiteurs.
2.11 2.11
word form forme lexicale
morphosyntactical variant of a given word variante morphosyntaxique d’un mot donné
EXAMPLE Indicate: indicates, visitor: visitors, visitor's. EXEMPLE Indiquer: indiquons, indiquant; instituteur:
instituteurs, institutrices
NOTE In inflecting languages, word forms are often
equivalent to inflected forms e.g. “go”, “goes”; but also: “go”, NOTE Dans les langages conjugués, les formes
“went”, “gone”. lexicales correspondent souvent aux formes conjuguées,
par exemple «être», «est», mais aussi «être», «fut», «été».
2.12 2.12
paradigm paradigme
�natural-language processing� class of word forms �traitement en langage naturel� classe de formes
(2.11) belonging to a given word or multi-word term
lexicales (2.11) se rapportant à un mot simple ou à
(2.14) un terme composé (2.14)
EXAMPLE Sell, sells, sold, selling
EXEMPLE Dormir, dort, dormi, dormant
2.13 2.13
base form forme de base
reference form forme de référence
word form (2.11) chosen according to lexicographical forme lexicale (2.11) choisie selon des conventions
conventions representing the forms of a paradigm lexicographiques et représentant les formes d’un
(2.12) paradigme (2.12)
NOTE 1 Adapted from ISO 1087:1990. NOTE 1 Adapté de l’ISO 1087:1990.
EXAMPLE bind: bind, bound, binds, binding EXEMPLE Prendre: prends, pris, prenant
NOTE 2 The term “base form” is also applied to multi-
NOTE 2 Le terme «forme de base» s’applique égale-
word terms (2.14). ment aux termes composés (2.14).
2.14 2.14
multi-word term terme composé
term consisting of more than one character string terme comprenant une ou plusieurs chaînes de
(5.13) caractères (5.13)
2.15 2.15
compressed form forme comprimée
reduced form (deprecated) forme réduite (rejeté)
character string (5.13) having undergone com- chaîne de caractères (5.13) ayant subi une com-
pression (7.4) pression (7.4)
EXAMPLE The string “input/output-algorithm” becomes EXEMPLE Une fois comprimée, la chaîne
the compressed form: “inputoutputalgorithm”. «algorithme-entrée/sortie» devient: «algorithmeentréesortie».
NOTE The term “reduced form” may be misleading in NOTE Le terme «forme réduite» peut induire en erreur
this context. dans ce contexte.
2.16 2.16
deinflection suppression des désinences
deletion of inflectional elements in word forms (2.11) suppression d’éléments flexionnels dans des formes
lexicales (2.11)
2.17 2.17
deinflected word form forme lexicale sans désinence
word part (2.18) remaining after deinflection (2.16) partie de mot (2.18) restant à la suite de la sup-
pression des désinences (2.16)
2.18 2.18
word part partie de mot
word segment segment de mot
character string (5.13) taken from a word form chaîne de caractères (5.13) tirée d’une forme
(2.11) for a specific application lexicale (2.11) pour une application donnée
2.19 2.19
lemmatization lemmatisation
process of deriving the base form (2.13) processus consistant à dériver la formedebase
(2.13)
EXAMPLE “go” becomes the base form (2.13) of
“goes”, by deinflection (2.16); “go” also serves as the base
EXEMPLE «naître» devient la forme de base (2.13)
form (2.13) of “went” by virtue of irregular verb conventions
de «naît» par suppression des désinences (2.16) , mais
that do not conform to standard inflectional practice.
«naître» est également la forme de base de «naquit» en
vertu des règles régissant les verbes irréguliers, qui
NOTE The result may also be called lemmatization. diffèrent des pratiques courantes de conjugaison.
NOTE Le résultat peut également être appelé lem-
matisation.
4 © ISO 2000 – All rights reserved/Tous droits réservés
2.20 2.20
parsing analyse syntaxique
�language processing� operation segregating a given �traitement du langage� opération consistant à isoler
textual structure into its grammatical, categorial and/or dans une structure de texte donnée les éléments
lexical elements according to a given algorithm
grammaticaux, catégoriels et/ou lexicaux en fonction
d’un algorithme défini
EXAMPLE In the sentence “all unsaturated fatty acids
are not degradable by biological methods”, “unsaturated
EXEMPLE Dans la phrase «tous les acides gras
fatty acids” and “biological methods” are identified as multi-
insaturés ne peuvent pas être dégradés par des méthodes
word terms (2.14) and can be extracted (7.9).
biologiques», «acides gras insaturés» et «méthodes
biologiques» sont identifiés comme des termes composés
NOTE Parsing does not necessarily provide a complete (2.14) et peuvent être extraits (7.9).
analysis of the sentence structure.
NOTE L’analyse syntaxique ne constitue pas
nécessairement une analyse complète de la structure de la
phrase.
2.21 2.21
terminological data collection collecte de données terminologiques
collection of data (2.2) containing information (2.1) regroupement de données (2.2) contenant des
on concepts of specific subject fields informations (2.1) sur des concepts propres à un
domaine donné
2.22 2.22
terminological entry entrée terminologique
part of a terminological data collection (2.21) that élément d’une collecte de données termino-
contains the terminological data (2.2) related to one logiques (2.21) contenant les données (2.2)
concept terminologiques associées à un concept
2.23 2.23
homograph homographe
each of two or more word forms (2.11) or words with chacune des formes lexicales (2.11) ou chacun des
identical spelling but representing different concepts mots de même orthographe mais représentant des
(semantic homography) or syntactic functions concepts différents (homographie sémantique) ou des
(syntactic homography) fonctions syntaxiques différentes (homographie
syntaxique)
EXAMPLE lead (Pb) versus lead (guidance); bark
(sound) versus bark (of a tree)
EXEMPLES Le mousse (marin)/la mousse (végétal);
louer (un appartement)/louer (le ciel).
NOTE Word forms (2.11) having different spelling but
becoming homographic after compression (7.4) are not
NOTE Les formes lexicales (2.11) avec une ortho-
called “homographs”.
graphe différente mais devenant homographiques après
compression (7.4) ne sont pas appelés «homographes».
2.24 2.24
disambiguation désambiguïsation
differentiation between homographs (2.23) by opération consistant à différencier des homographes
assigning each of them to the relevant concept or, (2.23) en affectant chacun d’entre eux au concept
where appropriate, to the relevant syntactic function correspondant ou, le cas échéant, à la fonction
syntaxique appropriée
3 Data organization 3 Organisation des données
3.1 3.1
sort value valeur de tri
sorting value position de l’élément d’un jeu de caractères (5.2) en
position of an element of a character set (5.2) fonction d’un ordre prédéfini
according to a predefined order
EXEMPLE En français, la valeur de tri de la lettre A
est inférieure à celle de la lettre B. La décision d’affecter
EXAMPLE In French, the letter A has a lower sort value
aux lettres majuscules une valeur de tri identique à celle
than the letter B. The question of whether or not to assign
attribuée aux lettres minuscules varie en fonction du but
lower-case letters the same sort value as their upper-case
recherché. Les lettres avec des diacritiques sont parfois
counterpart will depend on the application. Letters with
traitées comme les lettres de base correspondantes, parfois
diacritics are sometimes treated like the corresponding basic
considérées comme des lettres différentes.
letter and sometimes as a different letter.
3.2 3.2
sort key clé de tri
sorting key critère de tri
character string (5.13) designed to meet certain chaîne de caractères (5.13) destinée à répondre à
requirements for sorting (8.4) and merging (8.5) certaines exigences liées aux opérations de tri (8.4)
operations et de fusion (8.5)
EXAMPLE When bibliographical data are sorted to EXEMPLE Lorsque des données bibliographiques
produce an author's catalogue, the author's surname is the sont triées afin de générer un catalogue d’auteurs, le nom
primary sort key, with the given name as a secondary key. If de famille des auteurs est la clé de tri principale, et leur
there are two titles by the same author, the year of prénom constitue la clé de tri secondaire. S’il existe deux
publication or the title is used as an additional sort key. titres du même auteur, l’année de publication ou le titre sont
utilisés comme clés de tri complémentaires.
3.3 3.3
alphabetical ordering ordre alphabétique
arrangement of character strings (5.13) in such a arrangement de chaînes de caractères (5.13) de
way that the position of each string (5.12) in the list is sorte que la position de chaque chaîne (5.12) dans la
uniquely determined by the appropriate sort value liste soit uniquement déterminée par la valeur de tri
(3.1) starting from the beginning of the string (5.12) (3.1) appropriée, en commençant à partir du début de
la chaîne (5.12)
NOTE 1 Special sort values (3.1) may have to be
assigned for letters with diacritics and ligatures and for other
NOTE 1 Des valeursdetri (3.1) spéciales peuvent être
symbols, e.g. numerals, superscripts, subscripts, etc.
affectées à des lettres comportant des diacritiques et des
ligatures, ou à d’autres symboles, par exemple des
NOTE 2 The rules of alphabetical ordering may differ
numéraux, des indices et des exposants, etc.
from language to language.
NOTE 2 Les règles régissant l’ordre alphabétique peuvent
varier d’un langage à un autre.
3.4 3.4
reverse alphabetical ordering ordre alphabétique inversé
arrangement of character strings (5.13) in such a arrangement de chaînes de caractères (5.13) de
way that the position of each string (5.12) in the list is sorte que la position de chaque chaîne (5.12) dans la
uniquely determined by the appropriate sort value liste soit uniquement déterminée par la valeur de tri
(3.1) starting from the end of the string (3.1) appropriée, en commençant à partir de la fin de
la chaîne
3.5 3.5
frequency order ordre de fréquence
order of types (2.8) either ascending or descending ordre croissant ou décroissant des types (2.8) selon la
according to the frequency of occurrence of the fréquence de leurs occurrences (2.9) respectives dans
respective tokens (2.9) in a specified text (2.6)ora un texte (2.6) ou un corpus de textes (2.7) donné
text corpus (2.7)
NOTE Les listes les plus courante sont les listes de
fréquence de formes lexicales (2.11) et les listes de
NOTE The usual types of lists are word form (2.11)
fréquence de termes lemmatisés.
frequency lists and lemmatized frequency lists.
6 © ISO 2000 – All rights reserved/Tous droits réservés
3.6 3.6
permutation permutation
arrangement of lexical units so that each of their arrangement d’unités lexicales de sorte que chacun
constituent parts appears at the appropriate position de leurs éléments constitutifs apparaisse à une
position donnée
EXAMPLE The lexical unit “millions of instructions per
second” [MIPS] would appear as: “instructions, millions of
EXEMPLE L’unité lexicale «millions d’instructions par
per second and “second, millions of instructions per”, to
seconde» [MIPS] devrait apparaître comme suit:
ensure that the desired constituent parts appear at the
«instructions, millions par seconde» et «seconde, millions
appropriate, in this case alphabetical, positions.
d’instructions par», afin de garantir que les éléments
constitutifs souhaités apparaissent aux positions appro-
NOTE A given term may have only one lexically priées, alphabétiques dans ce cas.
relevant constituent part.
NOTE Un terme donné peut n’avoir qu’un seul élément
constitutif d’un point de vue lexical.
3.7 3.7
concatenation concaténation
operation of joining two or more character strings opération consistant à joindre deux ou plusieurs
(5.13) in a specified order, forming one string (5.12) chaînes de caractères (5.13) dans un ordre défini,
the length of which is equal to the sum of the length of pour former une chaîne (5.12) dont la longueur est
the character strings (5.13) égale à la somme des longueurs des chaînes de
caractères (5.13)
4 Filtering of terminological data 4 Filtrage des données terminologiques
4.1 4.1
exclusion list liste d’exclusion
stop word list liste de chaînes de caractères (5.13) sélectionnés
list of user-selected character strings (5.13) to be par l’utilisateur afin d’être ignorées au cours des opé-
ignored in further data processing (2.3) operations rations ultérieures de traitement des données (2.3)
NOTE 1 For terminological purposes, it may be useful to NOTE 1 Dans une optique terminologique, il peut
produce lists where function words (pronouns, articles, etc.) s’avérer utile de générer des listes dans lesquelles certains
are ignored. mots de fonction (pronoms, articles, etc.) seront ignorés.
NOTE 2 Sometimes the character strings in the NOTE 2 Les chaînes de caractères de la liste
exclusion listare retained,e.g.ina concordance (4.4), but d’exclusion sont parfois retenues, par exemple lors d’une
concordance (4.4), mais dans ce cas, aucune fréquence
with no frequency given.
n’est indiquée.
4.2 4.2
inclusion list liste d’inclusion
plus word list liste de chaînes de caractères (5.13) sélectionnés
list of user-selected character strings (5.13) to be par l’utilisateur afin d’être retenues ou consultées pour
retained or considered for further data processing des opérations ultérieures de traitement des
(2.3) operations, while the rest is ignored données (2.3), le reste étant ignoré
EXAMPLE All sentences containing “bank” or “credit EXEMPLES Toutes les phrases contenant «banque»
institution” are to be extracted; all entries starting with 'M' ou «établissement de crédit» doivent être extraites, toutes
are to be retrieved in an index of names; all words starting les entrées commençant par 'M' doivent être recherchées
with “anti-” are to be selected. dans un index de noms, tous les mots commençant par
«anti-» doivent être sélectionnés.
NOTE When appropriate, the inclusion list can also
contain word parts (2.18) or other character strings NOTE Une liste d’inclusion peut également contenir
des parties de mots (2.18) ou d’autres chaînes de
(5.13).
caractères (5.13).
4.3 4.3
free-text search système de recherche en forme libre
search (7.7) in a text (2.6)ora text corpus (2.7) recherche (7.7) dans un texte (2.6) ou dans un
enabling the user to retrieve any occurrence of any corpus de textes (2.7) permettant à l’utilisateur
type (2.8) d’extraire toute occurrence d’un type (2.8)
quelconque
4.4 4.4
concordance concordance
�computer applications� alphabetically ordered list of �applications logicielles� liste de formes lexicales
word forms (2.11) extracted (7.9) from a text (2.6)
(2.11) classées par ordre alphabétique et extraites
including the source reference for each item as well
(7.9) d’un texte (2.6) comprenant la référence source
as a selectable portion of the text preceding and de chaque élément ainsi qu’une portion sélection-
following the word form in question
nable du texte qui précède et qui suit la forme lexicale
concernée
NOTE A concordance usually has the form of a KWIC
(keyword in context) concordance or of a sentence
NOTE Une concordance se présente généralement
concordance.
sous la forme d’une concordance KWIC (mot-clé dans le
contexte) ou d’une concordance de phrase.
4.5 4.5
index index
�natural-language processing� ordered list of �traitement en langage naturel� liste ordonnée de
character strings (5.13) together with keys or
chaînes de caractères (5.13) avec des clés ou des
references to their location or locations in the a text
références à leur(s) position(s) respective(s) dans un
(2.6)ora text corpus (2.7) texte (2.6) ou un corpus de textes (2.7)
4.6 4.6
term index index de termes
index (4.5) that refers to terminological entries index (4.5) se rapportant aux entrées termino-
(2.22) in a vocabulary or in a terminological logiques (2.22) d’une liste de vocabulaire ou d’une
database (6.6) base de données terminologiques (6.6)
NOTE The terms in a term index can be ordered NOTE Dans un index de termes, les termes peuvent
alphabetically or systematically. être triés par ordre alphabétique ou de façon systémique.
4.7 4.7
alphabetical index index alphabétique
index (4.5) produced by alphabetical ordering (3.3) index (4.5) établi par ordre alphabétique (3.3)
4.8 4.8
systematic index index systémique
index (4.5) in which all the terms are ordered to index (4.5) dans lequel tous les termes sont orga-
reflect the systematic relations between the concepts nisés de façon à refléter les relations systémiques
of a specific subject field entre les différents concepts d’un domaine spécifique
4.9 4.9
permuted index index permuté
alphabetical index (4.7) produced according to the index alphabétique (4.7) établi conformément au
principle of permutation (3.6) principe de la permutation (3.6)
4.10 4.10
reverse index index inversé
term index (4.6) produced by reverse alphabetical index de termes (4.6) établi par ordre alphabétique
ordering (3.4) inversé (3.4)
8 © ISO 2000 – All rights reserved/Tous droits réservés
4.11 4.11
inverted index index à l’envers
index (4.5) of all types (2.8) derived from a text (2.6) index (4.5) de tous les types (2.8) dérivés d’un texte
together with all the references to their corresponding (2.6) avec toutes les références correspondant à leurs
tokens (2.9) occurrences (2.9) respectives
4.12 4.12
word form index index de formes lexicales
word index index de mots
index (4.5) of all the word forms (2.11) in a text index (4.5) de toutes les formes lexicales (2.11)
(2.6), or a corpus (2.7) together with all the dans un texte (2.6) ou dans un corpus (2.7) avec
references to their location or locations in the text or toutes les références correspondant à leur(s) posi-
the corpus tion(s) dans ce texte ou ce corpus
4.13 4.13
lemmatized word index index de mots lemmatisés
word form index (4.12) in which the word forms indexdeformeslexicales (4.12) dans lequel ces
(2.11) are represented by their respective base forms formes lexicales (2.11) sont représentées sous leur
(2.13) formedebase (2.13) respective
5 Characters 5 Caractères
5.1 5.1
character caractère
member of a set of elements that is used for the élément d’un ensemble utilisé pour la représentation,
representation, organization or control of data (2.2) l’organisation ou le contrôle des données (2.2)
[ISO 2382-4:1987] [ISO 2382-4:1987]
NOTE Characters may be categorized as graphical NOTE Les caractères peuvent être classés en carac-
characters (5.3) and control characters (5.9). tères graphiques (5.3) et caractères de commande (5.9).
5.2 5.2
character set jeu de caractères
finite set of different characters (5.1) that is complete ensemble fini de différents caractères (5.1) considéré
for a given purpose comme complet à des fins déterminées
[ISO 2382-4:1987] [ISO 2382-4:1987]
EXAMPLE The international reference version of the EXEMPLES La version internationale de référence du
character set of ISO 646; the 128 ASCII characters. jeu de caractères de l’ISO 646; les 128 caractères ASCII.
5.3 5.3
graphical character caractère graphique
character (5.1), other than a control character (5.9), caractère (5.1) autre qu’un caractère de commande
that has a visual representation and is produced by (5.9) ayant une représentation visuelle généralement
writing (8.2), printing or displaying (8.6) écrite (8.2), imprimée ou affichée (8.6)
NOTE 1 Adapted from ISO 2382-4: 1987. NOTE 1 Adapté de l'ISO 2382-4:1987.
NOTE 2 Graphical characters may be alphabetical NOTE 2 Les caractères graphiques peuvent être des
characters (5.5), digits (5.7) or special characters (5.8). caractères alphabétiques (5.5), des chiffres (5.7) ou des
caractères spéciaux (5.8).
5.4 5.4
alphanumerical character caractère alphanumérique
alphabetical character(5.5)ora digit (5.7) caractère alphabétique (5.5) ou chiffre (5.7)
5.5 5.5
alphabetical character caractère alphabétique
graphical character (5.3) that is a letter as used in caractère graphique (5.3) correspondant à une lettre
the written representation of a given language utilisée dans la représentation écrite d’un langage
donné
NOTE This also includes letters with diacritical marks.
NOTE Cela comprend aussi les lettres avec signes
diacritiques.
5.6 5.6
alphabet alphabet
linearly ordered set of alphabetical characters (5.5), jeu de caractères alphabétiques (5.5) présentés de
the order of which has been agreed upon façon linéaire, respectant un ordre convenu
NOTE 1 This definition also covers the alphabets of
NOTE 1 Cette définition s’applique aussi aux alphabets
natural languages consisting of those characters (5.1)
de langages naturels constitués de caractères (5.1)
represented by letters including letters with diacritics.
représentés par des lettres avec des signes diacritiques.
NOTE 2 Adapted from ISO 2382-4:1987.
NOTE 2 Adapté de l’ISO 2382-4:1987.
5.7 5.7
digit chiffre
numerical character caractère (5.1) représentant un nombre entier positif
character (5.1) that represents a non-negative integer ou nul
[ISO 2382-4:1987] [ISO 2382-4:1987]
5.8 5.8
special character caractère spécial
graphical character (5.3) that is not an alpha- caractère graphique (5.3) autre qu’un caractère
numerical character (5.4) alphanumérique (5.4)
EXAMPLE Any punctuation mark, the ampersand (&), EXEMPLES Signe de ponctuation, perluète (&), signe
the percent sign (%), the plus sign (+). de pourcentage (%), signe plus (+).
NOTE Adapted from ISO 2382-4:1987. NOTE Adapté de l’ISO 2382-4:1987.
5.9 5.9
control character caractère de commande
character (5.1) whose occurrence in a particular caractère (5.1) dont l’apparition dans un contexte
context specifies a control function déterminé provoque une fonction de commande
[ISO 2382-4:1987] [ISO 2382-4:1987]
NOTE Control characters initiate, modify and break a NOTE Les caractères de commande permettent de
data processing (2.3) operation. démarrer, de modifier et d’arrêter une opération de
traitement des données (2.3).
5.10 5.10
space character caractère espace
control character (5.9) that causes the print or caractère de commande (5.9) provoquant, sur la
display position to advance one position forward along même ligne, l’avancement d’un cran de la position
the line without producing any graphical character d’impression ou d’affichage sans produire de carac-
(5.3) tère graphique (5.3)
NOTE 1 Space as control character (5.9) is described NOTE 1 L’espace en tant que caractère de commande
in ISO/IEC 646, ISO/IEC 4873 and ISO 6937-1. (5.9) est décrit dans l’ISO/CEI 646, l’ISO/CEI 4873 et
l’ISO 6937-1.
NOTE 2 Adapted from ISO 2382-4:1987.
NOTE 2 Adapté de l’ISO 2382-4:1987.
10 © ISO 2000 – All rights reserved/Tous droits réservés
5.11 5.11
blank blanc
character (5.1) that represents an empty position in a caractère (5.1) qui représente une position libre dans
string (5.12) of graphical characters (5.3) une chaîne
...








Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.
Loading comments...