ISO/IEC 5259-1:2024
(Main)Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 1: Overview, terminology, and examples
Artificial intelligence — Data quality for analytics and machine learning (ML) — Part 1: Overview, terminology, and examples
This document provides the means for understanding and associating the individual documents of the ISO/IEC 5259 series and is the foundation for conceptual understanding of data quality for analytics and machine learning. It also discusses associated technologies and examples (e.g. use cases and usage scenarios).
Intelligence artificielle — Qualité des données pour les analyses de données et l’apprentissage automatique (AA) — Partie 1: Vue d'ensemble, terminologie et exemples
General Information
Buy Standard
Standards Content (Sample)
International
Standard
ISO/IEC 5259-1
First edition
Artificial intelligence — Data
2024-07
quality for analytics and machine
learning (ML) —
Part 1:
Overview, terminology, and
examples
Intelligence artificielle — Qualité des données pour les analyses
de données et l’apprentissage automatique —
Partie 1: Vue d'ensemble, terminologie et exemples
Reference number
© ISO/IEC 2024
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
© ISO/IEC 2024 – All rights reserved
ii
Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Symbols and abbreviated terms. 5
5 Data quality concepts for analytics and machine learning . 5
5.1 Data quality considerations for analytics and machine learning .5
5.1.1 General .5
5.1.2 Machine learning and data quality .5
5.1.3 Data characteristics that pose quality challenges for analytics and machine
learning .6
5.1.4 Data sharing, data re-use and data quality for analytics and machine learning .6
5.2 Data quality concept framework for analytics and machine learning .6
5.2.1 Overview .6
5.2.2 Data quality management .7
5.2.3 Data quality governance .10
5.2.4 Data provenance .10
5.3 Data life cycle for analytics and ML .10
5.3.1 Overview .10
5.3.2 Data life cycle model .10
5.3.3 Processes across the multiple stages . 13
Annex A (informative) Examples and scenarios .15
Bibliography .18
© ISO/IEC 2024 – All rights reserved
iii
Foreword
ISO (the International Organization for Standardization) and IEC (the International Electrotechnical
Commission) form the specialized system for worldwide standardization. National bodies that are
members of ISO or IEC participate in the development of International Standards through technical
committees established by the respective organization to deal with particular fields of technical activity.
ISO and IEC technical committees collaborate in fields of mutual interest. Other international organizations,
governmental and non-governmental, in liaison with ISO and IEC, also take part in the work.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of document should be noted. This document was drafted in accordance with the editorial rules of the ISO/
IEC Directives, Part 2 (see www.iso.org/directives or www.iec.ch/members_experts/refdocs).
ISO and IEC draw attention to the possibility that the implementation of this document may involve the
use of (a) patent(s). ISO and IEC take no position concerning the evidence, validity or applicability of any
claimed patent rights in respect thereof. As of the date of publication of this document, ISO and IEC had not
received notice of (a) patent(s) which may be required to implement this document. However, implementers
are cautioned that this may not represent the latest information, which may be obtained from the patent
database available at www.iso.org/patents and https://patents.iec.ch. ISO and IEC shall not be held
responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO's adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT) see www.iso.org/iso/foreword.html.
In the IEC, see www.iec.ch/understanding-standards.
This document was prepared by Joint Technical Committee ISO/IEC JTC 1, Information technology,
Subcommittee SC 42, Artificial intelligence.
A list of all parts in the ISO/IEC 5259 series can be found on the ISO and IEC websites.
Any feedback or questions on this document should be directed to the user’s national standards
body. A complete listing of these bodies can be found at www.iso.org/members.html and
www.iec.ch/national-committees.
© ISO/IEC 2024 – All rights reserved
iv
Introduction
Data are the raw material for analytics and machine learning (ML) and data quality is a critical aspect for
related analytics and ML projects and systems. The aim of the ISO/IEC 5259 series is to provide tools and
methods to assess and improve the quality of data used for analytics and ML.
Other parts of the ISO/IEC 5259 series include:
1)
— ISO/IEC 5259-2 provides a data quality model, data quality measures and guidance on reporting data
quality in the context of analytics and ML. ISO/IEC 5259-2 builds on the ISO 8000 series, ISO/IEC 25012
and ISO/IEC 25024.
The aim of ISO/IEC 5259-2 is to enable organizations to achieve their data quality objectives and is
applicable to all types of organizations.
— ISO/IEC 5259-3 specifies requirements and provides guidance for establishing, implementing,
maintaining and continually improving the quality for data used in the areas of analytics and ML.
ISO/IEC 5259-3 does not define detailed processes, methods or measurement. Rather it defines the
requirements and guidance for a quality management process along with a reference process and
methods that can be tailored to meet the requirements in ISO/IEC 5259-3.
The requirements and recommendations set out in ISO/IEC 5259-3 are generic and are intended to be
applicable to all organizations, regardless of type, size or nature.
— ISO/IEC 5259-4 provides general common organizational approaches, regardless of type, size or nature
of the applying organization, to ensure data quality for training and evaluation in analytics and ML. It
includes guidelines on the data quality process for:
— supervised ML with regard to the labelling of data used for training ML systems, including common
organizational approaches for training data labelling;
— unsupervised ML;
— semi-supervised ML;
— reinforcement learning;
— analytics.
ISO/IEC 5259-4 is applicable to training and evaluation data that come from different sources, including
data acquisition and data composition, data pre-processing, data labelling, evaluation and data use.
ISO/IEC 5259-4 does not define specific services, platforms or tools.
2)
— ISO/IEC 5259-5 provides a data quality governance framework for analytics and machine learning to
enable the governing bodies of organization to direct and oversee the implementation and operation of
data quality measures, management, and related processes with adequate controls throughout the DLC
model according to ISO/IEC 5259-1.
3)
— ISO/IEC TR 5259-6 describes a visualization framework for data quality in analytics and ML. The aim is
to enable stakeholders using visualization methods to access the results of data quality measures. This
visualization framework supports data quality goals.
1) Under preparation. Stage at the time of publication: ISO/IEC FDIS 5259-2:2024.
2) Under preparation. Stage at the time of publication: ISO/IEC DIS 5259-5:2023.
3) Under preparation. Stage at the time of publication: ISO/IEC CD TR 5259-6:2023.
© ISO/IEC 2024 – All rights reserved
v
International Standard ISO/IEC 5259-1:2024(en)
Artificial intelligence — Data quality for analytics and
machine learning (ML) —
Part 1:
Overview, terminology, and examples
1 Scope
This document provides the means for understanding and associating the individual documents of the
ISO/IEC 5259 series and is the foundation for conceptual understanding of data quality for analytics and
machine learning. It also discusses associated technologies and examples (e.g. use cases and usage scenarios).
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO/IEC 22989, Information technology — Artificial intelligence — Concepts and terminology
ISO/IEC 23053, Framework for Artificial Intelligence (AI) Systems Using Machine Learning (ML)
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO/IEC 22989 and ISO/IEC 23053 and
the following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
data life cycle
life cycle of data
stages in the process of data usage from idea conception to its discontinuation
3.2
data originator
party that created the data and that can have rights
Note 1 to entry: A data originator can be an individual person.
Note 2 to entry: The data originator can be distinct from the natural or legal person(s) mentioned in, described by, or
implicitly or explicitly associated with the data. For example, PII can be collected by a data originator that identifies
other individuals. Those data subjects (PII Principals) can also have rights, in relation to the data set.
Note 3 to entry: Rights can include the right to publicity, right to display name, right to identity, right to prohibit data
use in a way that offends honourable mention.
[SOURCE: ISO/IEC 23751:2022, 3.2]
© ISO/IEC 2024 – All rights reserved
3.3
data holder
party that has legal control to authorize data processing of the data by other parties
Note 1 to entry: A data originator (3.2) can be a data holder.
[SOURCE: ISO/IEC 23751:2022, 3.4]
3.4
data user
party that is authorized to perform processing of data under the legal control of a data holder (3.3)
[SOURCE: ISO/IEC 23751:2022, 3.5]
3.5
data quality
characteristic of data that the data meet the organization's data requirements for a specified context
3.6
data quality characteristic
category of data quality attributes (3.13) that has a bearing on data quality (3.5)
[SOURCE: ISO/IEC 25012:2008, 4.4, modified — Definition revised.]
3.7
data quality model
defined set of characteristics which provides a framework for specifying data quality requirements (3.9) and
eval
...
Norme
internationale
ISO/IEC 5259-1
Première édition
Intelligence artificielle — Qualité
2024-07
des données pour les analyses
de données et l’apprentissage
automatique (AA) —
Partie 1:
Vue d'ensemble, terminologie et
exemples
Artificial intelligence — Data quality for analytics and machine
learning (ML) —
Part 1: Overview, terminology, and examples
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO/IEC 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
© ISO/IEC 2024 – Tous droits réservés
ii
Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Symboles et abréviations . 5
5 Concepts de qualité des données pour l’analyse de données et l’apprentissage
automatique . 5
5.1 Considérations relatives à la qualité des données pour l’analyse de données et
l’apprentissage automatique .5
5.1.1 Généralités .5
5.1.2 Apprentissage automatique et qualité des données .6
5.1.3 Caractéristiques des données qui entraînent des défis de qualité pour l’analyse
de données et l’apprentissage automatique .6
5.1.4 Partage des données, réutilisation des données et qualité des données pour
l’analyse de données et l’apprentissage automatique .6
5.2 Cadre conceptuel de qualité des données pour l’analyse de données et l’apprentissage
automatique .7
5.2.1 Vue d’ensemble .7
5.2.2 Gestion de la qualité des données .7
5.2.3 Gouvernance de la qualité des données .10
5.2.4 Provenance des données .10
5.3 Cycle de vie des données pour l’analyse de données et l’AA .11
5.3.1 Vue d’ensemble .11
5.3.2 Modèle de cycle de vie des données .11
5.3.3 Processus utilisés au cours des multiples étapes .14
Annexe A (informative) Exemples et scénarios .16
Bibliographie . 19
© ISO/IEC 2024 – Tous droits réservés
iii
Avant-propos
L’ISO (Organisation internationale de normalisation) et l’IEC (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l’ISO ou
de l’IEC participent au développement de Normes internationales par l’intermédiaire des comités techniques
créés par l’organisation concernée afin de s’occuper des domaines particuliers de l’activité technique.
Les comités techniques de l’ISO et de l’IEC collaborent dans des domaines d’intérêt commun. D’autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l’ISO et l’IEC,
participent également aux travaux.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents. Le présent document a été rédigé conformément
aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives ou
www.iec.ch/members_experts/refdocs).
L’ISO et l’IEC attirent l’attention sur le fait que la mise en application du présent document peut entraîner
l’utilisation d’un ou de plusieurs brevets. L’ISO et l’IEC ne prennent pas position quant à la preuve, à la validité
et à l’applicabilité de tout droit de propriété revendiqué à cet égard. À la date de publication du présent
document, l’ISO et l’IEC n’avaient pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires
à sa mise en application. Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent
document que des informations plus récentes sont susceptibles de figurer dans la base de données de
brevets, disponible à l’adresse www.iso.org/brevets et https://patents.iec.ch. L’ISO et l’IEC ne sauraient être
tenues pour responsables de ne pas avoir identifié tout ou partie de tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/iso/avant-propos. Pour l’IEC, voir www.iec.ch/understanding-standards.
Le présent document a été élaboré par le comité technique mixte ISO/IEC JTC 1, Technologies de l’information,
sous-comité SC 42, Intelligence artificielle.
Une liste de toutes les parties de la série ISO/IEC 5259 se trouve sur les sites Web de l’ISO et de l’IEC.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve aux adresses www.iso.org/members.html et www.iec.ch/national-committees.
© ISO/IEC 2024 – Tous droits réservés
iv
Introduction
Les données sont la matière première des analyses de données et de l’apprentissage automatique (AA, aussi
appelé «apprentissage machine» et abrégé en ML, de l’anglais «Machine Learning»). La qualité des données
est donc un aspect critique pour les projets et systèmes d’analyse de données et d’AA associés. L’objectif de
la série ISO/IEC 5259 est de fournir des outils et des méthodes permettant d’évaluer et d’améliorer la qualité
des données utilisées pour l’analyse de données et l’AA.
Les autres parties de la série ISO/IEC 5259 sont énumérées ci-dessous.
1)
— L’ISO/IEC 5259-2 fournit un modèle de qualité des données, des mesures de la qualité des données et
des recommandations concernant l’établissement de rapports sur la qualité des données dans le contexte
de l’analyse de données et de l’AA. L’ISO/IEC 5259-2 s’appuie sur la série ISO 8000, l’ISO/IEC 25012 et
l’ISO/IEC 25024.
L’objectif de l’ISO/IEC 5259-2 est de permettre aux organismes d’atteindre leurs objectifs de qualité des
données et s’applique à tous les types d’organismes.
— L’ISO/IEC 5259-3 spécifie des exigences et fournit des recommandations pour l’établissement, la mise en
œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les domaines de
l’analyse de données et de l’AA.
L’ISO/IEC 5259-3 ne définit pas de processus, de méthodes ou de mesurages détaillés. Elle définit
plutôt les exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un
processus et des méthodes de référence qui peuvent être adaptés pour satisfaire aux exigences de
l’ISO/IEC 5259-3.
Les exigences et recommandations énoncées dans l’ISO/IEC 5259-3 sont génériques et prévues pour
s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.
— L’ISO/IEC 5259-4 fournit des approches organisationnelles communes générales, indépendamment du
type, de la taille ou de la nature de l’organisme demandeur, afin de garantir la qualité des données pour
l’entraînement et l’évaluation dans le cadre de l’analyse de données et de l’AA. Elle comprend des lignes
directrices relatives au processus de qualité des données pour:
— l’AA supervisé en ce qui concerne l’étiquetage des données utilisées pour entraîner les systèmes d’AA,
y compris les approches organisationnelles communes pour l’étiquetage des données d’entraînement;
— l’AA non supervisé;
— l’AA semi-supervisé;
— l’apprentissage par renforcement;
— l’analyse de données.
L’ISO/IEC 5259-4 s’applique aux données d’entraînement et d’évaluation provenant de différentes
sources, y compris l’acquisition et la composition des données, le prétraitement des données, l’étiquetage
des données, l’évaluation et l’utilisation des données. L’ISO/IEC 5259-4 ne définit pas de services,
plateformes ou outils spécifiques.
2)
— L’ISO/IEC 5259-5 fournit un cadre de gouvernance de la qualité des données pour l’analyse de données
et l’apprentissage automatique afin de permettre aux organes de gouvernance de l’organisme de diriger
et de superviser la mise en œuvre et le fonctionnement des mesures de la qualité des données, la gestion
et les processus associés avec des contrôles adéquats dans l’ensemble du modèle de cycle de vie des
données (CVD) conformément à l’ISO/IEC 5259-1.
1) En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
2) En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
© ISO/IEC 2024 – Tous droits réservés
v
3)
L’ISO/IEC TR 5259-6 décrit un cadre de visualisation pour la qualité des données dans le cadre de
l’analyse de données et de l’AA. L’objectif est de permettre aux parties prenantes utilisant des méthodes
de visualisation d’accéder aux résultats des mesures de la qualité des données. Ce cadre de visualisation
soutient les objectifs de qualité des données.
3) En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
© ISO/IEC 2024 – Tous droits réservés
vi
Norme internationale ISO/IEC 5259-1:2024(fr)
Intelligence artificielle — Qualité des données pour les
analyses de données et l’apprentissage automatique (AA) —
Partie 1:
Vue d'ensemble, terminologie et exemples
1 Domaine d’application
Le présent document fournit les moyens de comprendre et d’associer les documents individuels de la série
ISO/IEC 5259 et constitue la base de la compréhension conceptuelle de la qualité des données pour l’analyse
de données et l’apprentissage automatique. Il traite également des technologies et exemples associés (par
exemple, cas d’utilisation et scénarios d’utilisation).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour
les références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO/IEC 22989, Technologies de l'information — Intelligence artificielle — Concepts et terminologie relatifs à
l'intelligence artificielle
ISO/
...
ISO/IEC JTC 1/SC 42
Date: 2025-06-05
ISO/IEC 5259--1:2024(fr)
Première édition
2024-07
Intelligence artificielle — Qualité des données pour les analyses
de données et l’apprentissage automatique (AA) — —
Partie 1:
Vue d’ensemble d'ensemble, terminologie et exemples
Artificial intelligence — Data quality for analytics and machine learning (ML) — —
Part 1: Overview, terminology, and examples
ICS: 01.040.35; 35.020
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO/IEC 2024
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre oeuvre, aucune partie
de cette publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique
ou mécanique, y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable.
Une autorisation peut être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays
du demandeur.
ISO copyright office
Case postaleCP 401 • • Ch. de Blandonnet 8
CH-1214 Vernier, GenèveGeneva
Tél.: +Phone: + 41 22 749 01 11
E-mail: copyright@iso.org
WebWebsite: www.iso.org
Publié en Suisse
© ISO/IEC 2024 – Tous droits réservés
iii
Sommaire Page
Avant-propos . v
Introduction . vi
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Symboles et abréviations . 5
5 Concepts de qualité des données pour l’analyse de données et l’apprentissage
automatique . 5
5.1 Considérations relatives à la qualité des données pour l’analyse de données et
l’apprentissage automatique . 5
5.2 Cadre conceptuel de qualité des données pour l’analyse de données et l’apprentissage
automatique . 7
5.3 Cycle de vie des données pour l’analyse de données et l’AA . 12
Annexe A (informative) Exemples et scénarios . 18
Bibliographie . 21
© ISO/IEC 2024 – Tous droits réservés
iv
Avant-propos
L’ISO (Organisation internationale de normalisation) et l’IEC (Commission électrotechnique internationale)
forment le système spécialisé de la normalisation mondiale. Les organismes nationaux membres de l’ISO ou
de l’IEC participent au développement de Normes internationales par l’intermédiaire des comités techniques
créés par l’organisation concernée afin de s’occuper des domaines particuliers de l’activité technique. Les
comités techniques de l’ISO et de l’IEC collaborent dans des domaines d’intérêt commun. D’autres
organisations internationales, gouvernementales et non gouvernementales, en liaison avec l’ISO et l’IEC,
participent également aux travaux.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites
dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères
d’approbation requis pour les différents types de documents. Le présent document a été rédigé conformément
aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives ou
www.iec.ch/members_experts/refdocs).
L’ISO et l’IEC attirent l’attention sur le fait que la mise en application du présent document peut entraîner
l’utilisation d’un ou de plusieurs brevets. L’ISO et l’IEC ne prennent pas position quant à la preuve, à la validité
et à l’applicabilité de tout droit de propriété revendiqué à cet égard. À la date de publication du présent
document, l’ISO et l’IEC n’avaient pas reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires
à sa mise en application. Toutefois, il y a lieu d’avertir les responsables de la mise en application du présent
document que des informations plus récentes sont susceptibles de figurer dans la base de données de brevets,
disponible à l’adresse www.iso.org/brevets et https://patents.iec.ch. L’ISO et l’IEC ne sauraient être tenues
pour responsables de ne pas avoir identifié tout ou partie de tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions spécifiques
de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux
principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au commerce
(OTC), voir www.iso.org/iso/avant-propos. Pour l’IEC, voir www.iec.ch/understanding-standards.
Le présent document a été élaboré par le comité technique mixte ISO/IEC JTC 1, Technologies de l’information,
sous-comité SC 42, Intelligence artificielle.
Une liste de toutes les parties de la série ISO/IEC 5259 se trouve sur les sites Web de l’ISO et de l’IEC.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve aux adresses www.iso.org/members.html et www.iec.ch/national-committees.
© ISO/IEC 2024 – Tous droits réservés
v
Introduction
Les données sont la matière première des analyses de données et de l’apprentissage automatique (AA, aussi
appelé «apprentissage machine» et abrégé en ML, de l’anglais «Machine Learning»). La qualité des données
est donc un aspect critique pour les projets et systèmes d’analyse de données et d’AA associés. L’objectif de la
série ISO/IEC 5259 est de fournir des outils et des méthodes permettant d’évaluer et d’améliorer la qualité
des données utilisées pour l’analyse de données et l’AA.
Les autres parties de la série ISO/IEC 5259 sont énumérées ci-dessous.
11)
— — L’ISO/IEC 5259--2 fournit un modèle de qualité des données, des mesures de la qualité des données
et des recommandations concernant l’établissement de rapports sur la qualité des données dans le
contexte de l’analyse de données et de l’AA. L’ISO/IEC 5259--2 s’appuie sur la série ISO 8000,
l’ISO/IEC 25012 et l’ISO/IEC 25024.
L’objectif de l’ISO/IEC 5259--2 est de permettre aux organismes d’atteindre leurs objectifs de qualité des
données et s’applique à tous les types d’organismes.
— — L’ISO/IEC 5259--3 spécifie des exigences et fournit des recommandations pour l’établissement,
la mise en œuvre, le maintien et l’amélioration continue de la qualité des données utilisées dans les
domaines de l’analyse de données et de l’AA.
L’ISO/IEC 5259--3 ne définit pas de processus, de méthodes ou de mesurages détaillés. Elle définit plutôt
les exigences et recommandations associées à un processus de gestion de la qualité, ainsi qu’un processus
et des méthodes de référence qui peuvent être adaptés pour satisfaire aux exigences de l’ISO/IEC 5259--
3.
Les exigences et recommandations énoncées dans l’ISO/IEC 5259--3 sont génériques et prévues pour
s’appliquer à tout organisme, quels que soient son type, sa taille et sa nature.
— — L’ISO/IEC 5259--4 fournit des approches organisationnelles communes générales, indépendamment
du type, de la taille ou de la nature de l’organisme demandeur, afin de garantir la qualité des données pour
l’entraînement et l’évaluation dans le cadre de l’analyse de données et de l’AA. Elle comprend des lignes
directrices relatives au processus de qualité des données pour:
— — l’AA supervisé en ce qui concerne l’étiquetage des données utilisées pour entraîner les
systèmes d’AA, y compris les approches organisationnelles communes pour l’étiquetage des données
d’entraînement;
— — l’AA non supervisé;
— — l’AA semi-supervisé;
— — l’apprentissage par renforcement;
— — l’analyse de données.
L’ISO/IEC 5259--4 s’applique aux données d’entraînement et d’évaluation provenant de différentes
sources, y compris l’acquisition et la composition des données, le prétraitement des données, l’étiquetage
des données, l’évaluation et l’utilisation des données. L’ISO/IEC 5259--4 ne définit pas de services,
plateformes ou outils spécifiques.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
1)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC FDIS 5259-2:2024.
© ISO/IEC 2024 – Tous droits réservés
vi
22)
— — L’ISO/IEC 5259--5 fournit un cadre de gouvernance de la qualité des données pour l’analyse de
données et l’apprentissage automatique afin de permettre aux organes de gouvernance de l’organisme de
diriger et de superviser la mise en œuvre et le fonctionnement des mesures de la qualité des données, la
gestion et les processus associés avec des contrôles adéquats dans l’ensemble du modèle de cycle de vie
des données (CVD) conformément à l’ISO/IEC 5259--1.
33)
L’ISO/IEC TR 5259--6 décrit un cadre de visualisation pour la qualité des données dans le cadre de l’analyse
de données et de l’AA. L’objectif est de permettre aux parties prenantes utilisant des méthodes de visualisation
d’accéder aux résultats des mesures de la qualité des données. Ce cadre de visualisation soutient les objectifs
de qualité des données.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
2)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC DIS 5259-5:2023.
En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
3)
En cours d’élaboration. Stade au moment de la publication : ISO/IEC CD TR 5259-6:2023.
© ISO/IEC 2024 – Tous droits réservés
vii
Norme internationale ISO/IEC 5259-1:2024(fr)
Intelligence artificielle — Qualité des données pour les analyses de
données et l’apprentissage automatique (AA) — —
Partie 1:
Vue d’ensembled'ensemble, terminologie et exemples
1 Domaine d’application
Le présent document fournit les moyens de comprendre et d’associer les documents individuels de la série
ISO/IEC 5259 et constitue la base de la compréhension conceptuelle de la qualité des données pour l’analyse
de données et l’apprentissage automatique. Il traite également des technologies et exemples associés (par
exemple, cas d’utilisation et scénarios d’utilisation).
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur contenu,
des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour les
références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO/IEC 22989, Technologies de l'information — Intelligence artificielle — Concepts et terminologie relatifs à
l'intelligence artificielle
ISO/IEC 23053, Cadre pour les systèmes d'intelligence artificielle (IA) qui utilisent l'apprentissage machine (ML)
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO/IEC 22989, l’ISO/IEC 23053 ainsi
que les suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— — ISO Online browsing platform: disponible à l’adresse https://www.iso.org/obp
— — IEC Electropedia: disponible à l’adresse https://www.electropedia.org/
3.1 3.1
cycle de vie des données
étapes du processus d’utilisation des données, depuis la conception de l’idée jusqu’à son arrêt
3.2 3.2
créateur de données
partie qui a créé les données et qui peut avoir des droits
Note 1 à l’articlel'article: Un créateur de données peut être une personne physique.
Note 2 à l’articlel'article: Le créateur de données peut être distinct de la ou des personnes physiques ou morales
mentionnées dans les données, décrites par ces dernières, ou associées implicitement ou explicitement à celles-ci. Par
© ISO/IEC 2024 – Tous droits réservés
exemple, des données à caractère personnel (DCP) peuvent être recueillies par un créateur de données qui identifie
d’autres personnes. Les personnes concernées (également appelées «personnes concernées par des DCP») peuvent
également avoir des droits, en relation avec l’ensemble de données.
Note 3 à l’articlel'article: Les droits peuvent inclure le droit à la publicité, le droit d’afficher un nom, le droit à l’identité
et le droit d’interdire l’utilisation des données dans un but offensant.
[SOURCE: ISO/IEC 23751:2022, 3.2]
3.3 3.3
détenteur de données
partie ayant le contrôle légal pour autoriser le traitement de données par d’autres parties
Note 1 à l’article l'article: Un créateur de données (3.2(3.2)) peut être un détenteur de données.
[SOURCE: ISO/IEC 23751:2022, 3.4]
3.4 3.4
utilisateur de données
partie autorisée à effectuer le traitement de données sous le contrôle légal d’un détenteur de données (3.3(3.3))
[SOURCE: ISO/IEC 23751
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.