ISO 19157:2013
(Main)Geographic information — Data quality
Geographic information — Data quality
ISO 19157:2013 establishes the principles for describing the quality of geographic data. It - defines components for describing data quality; - specifies components and content structure of a register for data quality measures; - describes general procedures for evaluating the quality of geographic data; - establishes principles for reporting data quality. ISO 19157:2013 also defines a set of data quality measures for use in evaluating and reporting data quality. It is applicable to data producers providing quality information to describe and assess how well a data set conforms to its product specification and to data users attempting to determine whether or not specific geographic data are of sufficient quality for their particular application. ISO 19157:2013 does not attempt to define minimum acceptable levels of quality for geographic data.
Information géographique — Qualité des données
L'ISO 19157:2013 établit les principes de description de la qualité des données géographiques. Elle - définit des composants destinés à décrire la qualité de données; - spécifie des composants et la structure du contenu d'un registre de mesures de qualité des données; - décrit des procédures générales d'évaluation de la qualité des données géographique; - pose les principes de la description de la qualité des données dans des rapports. L'ISO 19157:2013 définit également un ensemble de mesures de qualité des données destinées à l'évaluation et à la mise en place de rapports sur la qualité de données. Elle s'applique aux producteurs de données fournissant des informations de qualité pour décrire et évaluer la façon dont un jeu de données répond à sa spécification de produit et aux utilisateurs cherchant à déterminer si des données géographiques spécifiques sont ou non de qualité suffisante pour leur application particulière. L'ISO 19157:2013 ne cherche pas à définir des niveaux minimums acceptables de qualité en matière de données géographiques.
General Information
Relations
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 19157
First edition
2013-12-15
Geographic information — Data quality
Information géographique — Qualité des données
Reference number
ISO 19157:2013(E)
©
ISO 2013
---------------------- Page: 1 ----------------------
ISO 19157:2013(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2013
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized otherwise in any form
or by any means, electronic or mechanical, including photocopying, or posting on the internet or an intranet, without prior
written permission. Permission can be requested from either ISO at the address below or ISO’s member body in the country of
the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2013 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 19157:2013(E)
Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Conformance . 1
3 Normative references . 1
4 Terms and definitions . 2
5 Abbreviated terms . 4
5.1 Abbreviations . 4
5.2 Package abbreviations . 5
6 Overview of data quality . 5
7 Components of data quality . 6
7.1 Overview of the components . 6
7.2 Data quality unit . 7
7.3 Data quality elements . 8
7.4 Descriptors of data quality elements .11
7.5 Metaquality elements .14
7.6 Descriptors of a metaquality element .15
8 Data quality measures .16
8.1 General .16
8.2 Standardized data quality measures .16
8.3 User defined data quality measures .16
8.4 Catalogue of data quality measures .16
8.5 List of components .17
8.6 Component details .18
9 Data quality evaluation.20
9.1 The process for evaluating data quality .20
9.2 Data quality evaluation methods .21
9.3 Aggregation and derivation.23
10 Data quality reporting .23
10.1 General .23
10.2 Particular cases .24
Annex A (normative) Abstract test suites .26
Annex B (informative) Data quality concepts and their use .28
Annex C (normative) Data dictionary for data quality .34
Annex D (normative) List of standardized data quality measures .50
Annex E (informative) Evaluating and reporting data quality .96
Annex F (informative) Sampling methods for evaluating .119
Annex G (normative) Data quality basic measures .127
Annex H (informative) Management of data quality measures .132
Annex I (informative) Guidelines for the use of Quality Elements .135
Annex J (informative) Aggregation of data quality results .144
Bibliography .146
© ISO 2013 – All rights reserved iii
---------------------- Page: 3 ----------------------
ISO 19157:2013(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www.iso.org/patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation on the meaning of ISO specific terms and expressions related to conformity
assessment, as well as information about ISO’s adherence to the WTO principles in the Technical Barriers
to Trade (TBT) see the following URL: Foreword - Supplementary information
The committee responsible for this document is ISO/TC 211, Geographic information/Geomatics
This edition of ISO 19157:2013 cancels and replaces ISO/TS 19138:2006, ISO 19114:2003 and
ISO 19113:2002, which have been technically revised.
iv © ISO 2013 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 19157:2013(E)
Introduction
Geographic data are increasingly being shared, interchanged and used for purposes other than their
producers’ intended ones. Information about the quality of available geographic data are vital to the
process of selecting a data set in that the value of data are directly related to its quality. A user of
geographic data may have multiple data sets from which to choose. Therefore, it is necessary to compare
the quality of the data sets to determine which best fulfils the requirements of the user.
The purpose of describing the quality of geographic data is to facilitate the comparison and selection
of the data set best suited to application needs or requirements. Complete descriptions of the quality
of a data set will encourage the sharing, interchange and use of appropriate data sets. Information on
the quality of geographic data allows a data producer to evaluate how well a data set meets the criteria
set forth in its product specification and assists data users in evaluating a product’s ability to satisfy
the requirements for their particular application. For the purpose of this evaluation, clearly defined
procedures are used in a consistent manner.
To facilitate comparisons, it is essential that the results of the quality reports are expressed in a
comparable way and that there is a common understanding of the data quality measures that have
been used. These data quality measures provide descriptors of the quality of geographic data through
comparison with the universe of discourse. The use of incompatible measures makes data quality
comparisons impossible to perform. This International Standard standardizes the components and
structures of data quality measures and defines commonly used data quality measures.
This International Standard recognizes that a data producer and a data user may view data quality
from different perspectives. Conformance quality levels can be set using the data producer’s product
specification or a data user’s data quality requirements. If the data user requires more data quality
information than that provided by the data producer, the data user can follow the data producer’s data
quality evaluation process flow to get the additional information. In this case the data user requirements
are treated as a product specification for the purpose of using the data producer process flow.
The objective of this International Standard is to provide principles for describing the quality for
geographic data and concepts for handling quality information for geographic data, and a consistent
and standard manner to determine and report a data set’s quality information. It aims also to provide
guidelines for evaluation procedures of quantitative quality information for geographic data.
© ISO 2013 – All rights reserved v
---------------------- Page: 5 ----------------------
INTERNATIONAL STANDARD ISO 19157:2013(E)
Geographic information — Data quality
1 Scope
This International Standard establishes the principles for describing the quality of geographic data. It
— defines components for describing data quality;
— specifies components and content structure of a register for data quality measures;
— describes general procedures for evaluating the quality of geographic data;
— establishes principles for reporting data quality.
This International Standard also defines a set of data quality measures for use in evaluating and reporting
data quality. It is applicable to data producers providing quality information to describe and assess how
well a data set conforms to its product specification and to data users attempting to determine whether
or not specific geographic data are of sufficient quality for their particular application.
This International Standard does not attempt to define minimum acceptable levels of quality for
geographic data.
2 Conformance
Any product claiming conformance to this International Standard shall pass all the requirements
described in the abstract test suite presented in Annex A as follows:
a) A data quality evaluation process shall pass the tests outlined in A.1;
b) Data quality metadata shall pass the tests outlined in A.2 and A.3;
c) A standalone quality report shall pass the tests outlined in A.4;
d) A data quality measure shall pass the tests outlined in A.5.
3 Normative references
The following referenced documents, in whole or in part, are normatively referenced in this document
and are indispensable for its application. For dated references, only the edition cited applies. For undated
references, the latest edition of the referenced document (including any amendments) applies.
ISO/TS 19103:2005, Geographic information — Conceptual schema language
ISO 19108:2002, Geographic information — Temporal schema
1)
ISO 19115-1:2014, Geographic information — Metadata — Part 1: Fundamentals
ISO 19115-2:2009, Geographic information — Metadata — Part 2: Extensions for imagery and gridded data
ISO 19135:2005, Geographic information — Procedures for item registration
1) Under preparation.
© ISO 2013 – All rights reserved 1
---------------------- Page: 6 ----------------------
ISO 19157:2013(E)
4 Terms and definitions
4.1
accuracy
closeness of agreement between a test result or measurement result and the true value
Note 1 to entry: In this International Standard, the true value can be a reference value that is accepted as true.
[SOURCE: ISO 3534-2:2006, 3.3.1, modified – original Note has been deleted. New Note 1 to entry
has been added.]
4.2
catalogue
collection of items (4.18) or an electronic or paper document that contains information about the
collection of items
[SOURCE: ISO 10303-227:2005, 3.3.10, modified - Note has been deleted.]
4.3
conformance
fulfilment of specified requirements
[SOURCE: ISO 19105:2000, 3.8]
4.4
conformance quality level
threshold value or set of threshold values for data quality (4.21) results used to determine how well a
dataset (4.8) meets the criteria set forth in its data product specification (4.6) or user requirements
4.5
correctness
correspondence with the universe of discourse (4.24)
4.6
data product specification
detailed description of a dataset (4.8) or dataset series (4.9) together with additional information that
will enable it to be created, supplied to and used by another party
[SOURCE: ISO 19131:2007, 4.7, modified - Note has been deleted.]
4.7
data quality basic measure
generic data quality (4.21) measure used as a basis for the creation of specific data quality measures
Note 1 to entry: Data quality basic measures are abstract data types. They cannot be used directly when reporting
data quality.
4.8
dataset
identifiable collection of data
Note 1 to entry: A data set can be a smaller grouping of data which, though limited by some constraint such as
spatial extent or feature type (4.15), is located physically within a larger data set. Theoretically, a data set can be
as small as a single feature (4.11) or feature attribute (4.12) contained within a larger data set. A hardcopy map or
chart can be considered a data set.
2)
[SOURCE: ISO 19115-1:—, 4.3 ]
2) To be published.
2 © ISO 2013 – All rights reserved
---------------------- Page: 7 ----------------------
ISO 19157:2013(E)
4.9
dataset series
collection of datasets (4.8) sharing common characteristics
3)
[SOURCE: ISO 19115-1:—, 4.10]
4.10
direct evaluation method
method of evaluating the quality (4.21) of a dataset (4.8) based on inspection of the items (4.18)
within the dataset
4.11
feature
abstraction of real world phenomena
Note 1 to entry: A feature may occur as a type or an instance. Feature type (4.15) or feature instance (4.13) will be
used when only one is meant.
[SOURCE: ISO 19101:2002, 4.11]
4.12
feature attribute
characteristic of a feature (4.11)
Note 1 to entry: A feature attribute has a name, a data type and a value domain associated with it. A feature
attribute for a feature instance (4.13) also has an attribute value taken from the value domain.
[SOURCE: ISO 19101:2002, 4.12, modified – Examples have been deleted. Note 1 to entry has been added.]
4.13
feature instance
individual of a given feature type (4.15) having specified feature attribute (4.12) values
4)
[SOURCE: ISO 19101-1:—, 4.1.14]
4.14
feature operation
operation that every instance of a feature type (4.15) may perform
[SOURCE: ISO 19110:2005, 4.5 - modified, Example and Note have been removed.]
4.15
feature type
class of features (4.11) having common characteristics
[SOURCE: ISO 19156:2011, 4.7]
4.16
geographic data
data with implicit or explicit reference to a location relative to the Earth
[SOURCE: ISO 19109:2005, 4.12, modified - Note has been deleted.]
4.17
indirect evaluation method
method of evaluating the quality (4.21) of a dataset (4.8) based on external knowledge
Note 1 to entry: Examples of external knowledge are data set lineage, such as production method or source data.
3) To be published.
4) To be published.
© ISO 2013 – All rights reserved 3
---------------------- Page: 8 ----------------------
ISO 19157:2013(E)
4.18
item
anything that can be described and considered separately
Note 1 to entry: An item can be any part of a data set (4.8), such as a feature (4.11), feature relationship, feature
attribute (4.12), or combination of these.
[SOURCE: ISO 2859-5:2005, 3.4, modified – Original Example has been removed. Note 1 to entry has
been added.]
4.19
metadata
information about a resource
5)
[SOURCE: ISO 19115-1:—, 4.9]
4.20
metaquality
information describing the quality (4.21) of data quality
4.21
quality
degree to which a set of inherent characteristics fulfils requirements
[SOURCE: ISO 9000:2005, 3.1.1, modified - Original Notes have been removed.]
4.22
register
set of files containing identifiers assigned to items (4.18) with descriptions of the associated items
[SOURCE: ISO 19135:2005, 4.1.9]
4.23
standalone quality report
free text document providing fully detailed information about data quality (4.21) evaluations, results
and measures used
4.24
universe of discourse
view of the real or hypothetical world that includes everything of interest
[SOURCE: ISO 19101:2002, 4.29]
5 Abbreviated terms
5.1 Abbreviations
ADQR aggregated data quality results
AQL acceptance quality limit [ISO 3534-2:2006]
RMSE root mean square error
UML Unified Modeling Language
XML Extensible Markup Language
5) To be published.
4 © ISO 2013 – All rights reserved
---------------------- Page: 9 ----------------------
ISO 19157:2013(E)
5.2 Package abbreviations
Abbreviations are used to denote the package that contains a class. Those abbreviations precede class
names, connected by a “_”. The standard in which those classes are located is indicated in parentheses.
A list of those abbreviations follows.
CI Citation [ISO 19115-1:2014]
CT Catalogues [ISO/TS 19139:2007]
DQ Data Quality [ISO 19157]
DQM Data Quality Measure [ISO 19157]
EX Extent [ISO 19115-1:2014]
GF General Feature [ISO 19109:2005]
MD Metadata [ISO 19115-1:2014]
QE Quality Extended [ISO 19115-2:2009]
RE Registration [ISO 19135:2005]
6 Overview of data quality
Working with data quality includes:
— understanding of the concepts of data quality related to geographic data. Annex B is a description of
data quality concepts used to establish the components for describing the quality of geographic data;
— defining data quality conformance levels in data product specifications or based on user
requirements. Establishment of data product specifications is described in ISO 19131:2007;
— specifying quality aspects in application schemas;
— evaluating data quality;
— reporting data quality.
NOTE 1 The development of application schemas is described in ISO 19109:2005.
A data quality evaluation can be applied to data set series, a data set or a subset of data within a data set,
sharing common characteristics so that its quality can be evaluated.
Data quality shall be described using the data quality elements. Data quality elements and their
descriptors are used to describe how well a data set meets the criteria set forth in its data product
specification or user requirements and provide quantitative quality information.
When data quality information describes data that have been created without a detailed data product
specification or with a data product specification that lacks quantitative measures and descriptors, the
data element may be evaluated in a non-quantitative subjective way as a descriptive result for each element.
© ISO 2013 – All rights reserved 5
---------------------- Page: 10 ----------------------
ISO 19157:2013(E)
Some quality related information is provided by purpose, usage and lineage. This information is reported
as metadata in conformance with ISO 19115-1:2014.
NOTE 2 Purpose describes the rationale for creating a data set and contains information about its intended
use, which may not be the same as the actual use of the data set. Usage describes the application(s) for which a
data set has been used, either by the data producer or by other data users. Lineage describes the history of a data
set and recounts the life cycle of a data set from collection and acquisition through compilation and derivation to
its current form. This general, non-quantitative information is illustrative for users and can help assessing the
quality of a data set, especially in cases where it is used for a particular application that differs from the intended
application (see also 9.2.3).
This International Standard recognizes that quantitative data quality elements may have associated
quality which is termed metaquality. Metaquality describes the quality of the data quality results in
terms of defined characteristics.
NOTE 3 The concept of metaquality is described in 7.5.
Figure 1 provides an overview of data quality information.
co ncerns Standalone quality report
geog ra ph ic da ta
is re po rted in
de i ned by
Data quality scope Data quality
Metadata ISO19115
su bd ivid es in to is expresse d by
Result scope Data quality element
is de scri bed by
Data quality measureData quality ev aluation Data quality result Metaquality
Figure 1 — Conceptual model of quality for geographic data
7 Components of data quality
7.1 Overview of the components
The components of data quality are described in Clause 7. Figure 2 presents an overview of the
components and the connections between them. See the data dictionary defined in Annex C (normative)
for more details about components and their attributes.
6 © ISO 2013 – All rights reserved
---------------------- Page: 11 ----------------------
ISO 19157:2013(E)
DQ_FullInspection DQ_ConformanceResult
DQ_SampleBasedInspection DQ_QuantitativeResult
DQ_IndirectEvaluation DQ_DescriptiveResult
DQ_DataEvaluation
DQ_AggregationDerivation
DQ_MeasureReference DQ_EvaluationMethod DQ_Result
+measure 0.1 +evaluationMethod 0.1 +result1.*
DQ_StandaloneQualityReportInformation
0.*
+standaloneQualityReport0.1
DQ_Metaquality DQ_Element
+elementReport
+relatedElement
+report
+derivedElement DQ_DataQuality
1.*
0.*
DQ_Confidence
DQ_Representativity
DQ_UsabilityElement
DQ_LogicalConsistency
DQ_Homogeneity
DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_Completeness
DQ_DomainConsistency
DQ_AbsoluteExternalPositionalAccuracy
DQ_CompletenessCommission
DQ_FormatConsistency
DQ_RelativeInternalPositionalAccuracy
DQ_CompletenessOmission
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativeAttributeCorrectness
DQ_TemporalConsistency
DQ_QuantitativeAttributeAccuracy
DQ_TemporalValidity
Figure 2 — Overview of the components of data quality
7.2 Data quality unit
When describing the quality of geographic data, different quality elements and different subsets of the
data may be considered. In order to describe these, data quality units are used. A data quality unit is the
combination of a scope and data quality elements, see Figure 3.
© ISO 2013 – All rights reserved 7
---------------------- Page: 12 ----------------------
ISO 19157:2013(E)
DQ_DataQuality DQ_Element
+report
+ scope :M D_ Scop e
1.*
Figure 3 — Data quality unit
The scope of the data quality unit(s) specifies the extent, spatial and/or temporal, and/or common
characteristic(s) that identify the data on which data quality is to be evaluated.
One data quality scope shall be specified for each data quality unit. One data quality report (metadata
or standalone quality report) may encompass several data quality units, since scopes are often different
for individual data quality elements. These different scopes may be, for example, spatially separate,
overlapping or even sharing the same extents.
The following are examples of what defines a data quality scope (see also MD_Scope in ISO 19115-1):
a) a data set series;
b) a data set;
c) a subset of data defined by one or more of the following characteristics:
1) types of items (sets of feature types, feature attributes, feature operations or feature
relationships);
2) specific items (sets of feature instances, attribute values or instances of feature relationships);
3) geographic extent;
4) temporal extent (the time frame of reference and accuracy of the time frame).
7.3 Data quality elements
7.3.1 General
A data quality element is a component describing a certain aspect of the quality of geographic data and
these have been organized into different categories. These categories are shown in Figure 4.
8 © ISO 2013 – All rights reserved
---------------------- Page: 13 ----------------------
ISO 19157:2013(E)
DQ_Element
+derivedElement 0.*
DQ_UsabilityElement
DQ_Completeness DQ_LogicalConsistency
DQ_CompletenessCommission DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_DomainConsistency
DQ_CompletenessOmission
DQ_AbsoluteExternalPositionalAccuracy
DQ_FormatConsistency
DQ_RelativeInternalPositionalAccuracy
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativeAttributeCorrectness
DQ_TemporalConsistency
DQ_QuantitativeAttributeAccuracy
DQ_TemporalValidity
Figure 4 — Overview of the data quality elements
7.3.2 Completeness
Completeness is defined as the presence and absence of features, their attributes and relationships. It
consists of two data quality elements:
— commission: excess data present in a data set;
— omission: data absent from a data set.
7.3.3 Logical consistency
Logical consistency is defined as the degree of adherence to l
...
NORME ISO
INTERNATIONALE 19157
Première édition
2013-12-15
Information géographique — Qualité
des données
Geographic information — Data quality
Numéro de référence
ISO 19157:2013(F)
©
ISO 2013
---------------------- Page: 1 ----------------------
ISO 19157:2013(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2013
Droits de reproduction réservés. Sauf indication contraire, aucune partie de cette publication ne peut être reproduite ni utilisée
sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie, l’affichage sur
l’internet ou sur un Intranet, sans autorisation écrite préalable. Les demandes d’autorisation peuvent être adressées à l’ISO à
l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Version française parue en 2014
Publié en Suisse
ii © ISO 2013 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO 19157:2013(F)
Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Conformité . 1
3 Références normatives . 1
4 Termes et définitions . 2
5 Abréviations . 4
5.1 Abréviations . 4
5.2 Abréviations relatives aux paquetages . 5
6 Aperçu de la qualité de données . 5
7 Composants de la qualité des données . 6
7.1 Aperçu des composants . 6
7.2 Unité de qualité des données . 7
7.3 Éléments de qualité des données . 8
7.4 Descripteurs des éléments de qualité des données .11
7.5 Éléments de métaqualité .14
7.6 Descripteurs d’un élément de métaqualité .15
8 Mesures de qualité des données .16
8.1 Généralités .16
8.2 Mesures de qualité des données normalisées.16
8.3 Mesures de qualité des données définies par l’utilisateur .16
8.4 Catalogue de mesures de qualité des données .16
8.5 Liste des composants .17
8.6 Détails des composants .18
9 Évaluation de la qualité de données .20
9.1 Processus d’évaluation de la qualité de données .20
9.2 Méthodes d’évaluation de la qualité de données.22
9.3 Agrégation et dérivation .23
10 Rendre compte de la qualité des données .24
10.1 Généralités .24
10.2 Cas particuliers .24
Annexe A (normative) Suite de tests abstraits .26
Annexe B (informative) Les concepts de la qualité des données et leur utilisation .28
Annexe C (normative) Dictionnaire de données pour la qualité des données.34
Annexe D (normative) Catalogue des mesures normalisées de la qualité de données .55
Annexe E (informative) Évaluation et rapportage de la qualité des données .106
Annexe F (informative) Méthodes par échantillonnage pour l’évaluation .131
Annexe G (normative) Mesures de base de la qualité des données.140
Annexe H (informative) Gestion des mesures de la qualité des données.145
Annexe I (informative) Lignes directrices relatives à l’utilisation des éléments de qualité .148
Annexe J (informative) Agrégation des résultats de la qualité des données .158
Bibliographie .160
© ISO 2013 – Tous droits réservés iii
---------------------- Page: 3 ----------------------
ISO 19157:2013(F)
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (CEI) en ce qui concerne
la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/CEI, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/CEI, Partie 2 (voir www.
iso.org/directives).
L’attention est appelée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant les
références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de l’élaboration
du document sont indiqués dans l’Introduction et/ou sur la liste ISO des déclarations de brevets reçues
(voir www.iso.org/patents).
Les éventuelles appellations commerciales utilisées dans le présent document sont données pour
information à l’intention des utilisateurs et ne constituent pas une approbation ou une recommandation.
Pour une explication de la signification des termes et expressions spécifiques de l’ISO liés à l’évaluation de
la conformité, aussi bien que pour des informations au-sujet de l’adhésion de l’ISO aux principes de l’OMC
concernant les obstacles techniques au commerce (OTC) voir le lien suivant: Foreword - Supplementary
information
Le comité chargé de l’élaboration du présent document est l’ISO/TC 211, Information
géographique/Géomatique.
Cette deuxième édition de l’ISO 19157:2013 annule et remplace l’ISO/TS 19138:2006, l’ISO 19114:2003
et l’ISO 19113:2002, qui ont fait l’objet d’une révision technique.
iv © ISO 2013 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO 19157:2013(F)
Introduction
Les données géographiques sont de plus en plus partagées, échangées et utilisées à d’autres fins que
celles initialement prévues par leur producteur. Les informations se rapportant à la qualité des données
géographiques disponibles sont essentielles au processus de sélection d’un jeu de données, la valeur
des données étant directement liée à leur qualité. Un utilisateur de données géographiques peut avoir
à opérer un choix entre de multiples jeux de données. Il est, par conséquent, nécessaire de comparer la
qualité des jeux de données pour déterminer celui qui répond le mieux aux exigences de l’utilisateur.
La description de la qualité des données géographiques a pour objectif de faciliter la comparaison des jeux
de données et la sélection de l’ensemble le mieux adapté aux besoins ou aux exigences de l’application.
Une description exhaustive de leur qualité encouragera le partage, l’échange et l’utilisation des jeux de
données appropriés. Les informations relatives à la qualité des données géographiques permettent au
producteur de données d’évaluer la façon dont un jeu répond aux critères définis dans une spécification
de produit et permet aux utilisateurs de données d’évaluer la capacité d’un produit à répondre aux
exigences de leur application spécifique. Pour répondre aux besoins de cette évaluation, on recourt de
façon systématique à des procédures clairement définies.
Pour faciliter les comparaisons, il est essentiel d’exprimer les résultats dans les rapports de qualité des
données de manière comparable et d’avoir une compréhension commune des mesures de qualité qui
ont été utilisées. Ces mesures fournissent des descripteurs de la qualité des données géographiques
par comparaison avec l’univers du discours. L’utilisation de mesures incompatibles rend impossible la
comparaison de la qualité des données. La présente Norme internationale normalise les composants
et les structures des mesures de la qualité des données et définit les mesures de qualité d’utilisation
fréquente.
La présente Norme internationale reconnaît qu’un producteur de données ou un utilisateur puisse
considérer la qualité des données sous des perspectives différentes. Des niveaux de qualité peuvent être
établis en utilisant les spécifications de produit d’un producteur ou les exigences qualité d’un utilisateur.
Si l’utilisateur de données exige plus d’informations sur la qualité des données que celles fournies par le
producteur, l’utilisateur peut se référer au schéma de circulation du processus d’évaluation de la qualité
du producteur de données pour obtenir les informations supplémentaires. Dans ce cas, les exigences de
l’utilisateur de données sont traitées comme une spécification de produit visant à utiliser le schéma de
circulation du processus du producteur.
L’objectif de la présente Norme internationale est de fournir des principes de description de la qualité
des données géographiques et des concepts de gestion de ces informations sur la qualité, ainsi qu’une
manière cohérente et normalisée de déterminer et de présenter des informations sur la qualité d’un jeu
de données. Elle vise également à fournir des lignes directrices pour les procédures d’évaluation des
informations de qualité quantitatives relatives aux données géographiques.
© ISO 2013 – Tous droits réservés v
---------------------- Page: 5 ----------------------
NORME INTERNATIONALE ISO 19157:2013(F)
Information géographique — Qualité des données
1 Domaine d’application
La présente Norme internationale établit les principes de description de la qualité des données
géographiques. Elle
— définit des composants destinés à décrire la qualité de données;
— spécifie des composants et la structure du contenu d’un registre de mesures de qualité des données;
— décrit des procédures générales d’évaluation de la qualité des données géographique;
pose les principes de la description de la qualité des données dans des rapports.
La présente Norme internationale définit également un ensemble de mesures de qualité des données
destinées à l’évaluation et à la mise en place de rapports sur la qualité de données. Elle s’applique aux
producteurs de données fournissant des informations de qualité pour décrire et évaluer la façon dont
un jeu de données répond à sa spécification de produit et aux utilisateurs cherchant à déterminer si des
données géographiques spécifiques sont ou non de qualité suffisante pour leur application particulière.
La présente Norme internationale ne cherche pas à définir des niveaux minimums acceptables de qualité
en matière de données géographiques.
2 Conformité
Tout produit revendiquant une conformité à la présente Norme internationale doit répondre avec succès
à toutes les exigences suivantes décrites dans la suite de tests abstraits présentée en Annexe A:
a) un processus d’évaluation de la qualité des données doit passer avec succès les tests définis en A.1;
b) des métadonnées de qualité des données doivent passer avec succès les tests définis en A.2 et A.3;
c) un rapport qualité autosuffisant doit passer avec succès les tests définis en A.4;
d) des mesures de qualité des données doivent passer avec succès les tests définis en A.5.
3 Références normatives
Les documents suivants, en totalité ou en partie, sont référencés de manière normative dans le présent
document et sont indispensables pour son application. Pour les références datées, seule l’édition citée
s’applique. Pour les références non datées, la dernière édition du document de référence s’applique (y
compris les éventuels amendements).
ISO/TS 19103:2005, Information géographique — Langage de schéma conceptuel
ISO 19108:2002, Information géographique — Schéma temporel
ISO 19115-1:2014, Information géographique — Métadonnées — Partie 1: Principes fondamentaux
ISO 19115-2:2009, Information géographique — Métadonnées — Partie 2: Extensions pour les images et les
matrices
ISO 19135:2005, Information géographique — Procédures pour l’enregistrement d’éléments
© ISO 2013 – Tous droits réservés 1
---------------------- Page: 6 ----------------------
ISO 19157:2013(F)
4 Termes et définitions
4.1
exactitude
précision, justesse de l’accord entre un résultat de test ou mesure et la valeur vraie
Note 1 à l’article: à l’Article Dans la présente Norme internationale, la vraie valeur peut être une valeur de référence
acceptée comme vraie.
[SOURCE: ISO 3534-2:2006, 3.3.1, modifié – Une Note 1 à l’article a été ajoutée.]
4.2
catalogue
ensemble d’éléments (4.18) ou document sous forme électronique ou papier contenant des informations
sur l’ensemble d’éléments
[SOURCE: ISO 10303-227:2005, 3.3.10, modifié – La Note a été supprimée.]
4.3
conformité
satisfaction des exigences spécifiées
[SOURCE: ISO 19105:2000, 3.8]
4.4
niveau de conformité
valeur seuil ou ensemble de valeurs seuil devant être atteint par des résultats d’évaluation de la qualité
(4.21) et utilisé pour déterminer dans quelle mesure un jeu de données (4.8) respecte les critères exposés
dans sa spécification de produit (4.6) ou les exigences utilisateur
4.5
justesse
correspondance avec l’univers du discours (4.24)
4.6
spécification de produit (de données)
description détaillée d’un jeu de données (4.8) ou d’une série de jeux de données (4.9) comprenant
également des informations supplémentaires permettant leur création, fourniture, utilisation par une
tierce partie
[SOURCE: ISO 19131:2007, 4.7, modifié – La Note a été supprimée.]
4.7
mesure de base de qualité de données
mesure générique de qualité (4.21) des données utilisée comme une base pour la création de mesures
spécifiques de qualité de données
Note 1 à l’article: à l’Article Les mesures de base de la qualité de données sont des types de données abstraits. Elles
ne peuvent pas être utilisées directement lors de l’élaboration d’un rapport de qualité de données.
4.8
jeu de données
collection identifiable de données
Note 1 à l’article: à l’Article Un jeu de données peut être un groupe plus petit de données qui, bien que faisant
l’objet de certaines contraintes (l’étendue spatiale ou le type d’entité (4.15), par exemple), se trouve physiquement
dans un jeu de données plus important. En théorie, un jeu de données peut être aussi petit qu’une entité (4.11)
ou qu’un attribut d’entité (4.12) dans un jeu de données plus important. Une carte imprimée peut être considérée
comme un jeu de données.
[SOURCE: ISO 19115-1:2014, 4.3]
2 © ISO 2013 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO 19157:2013(F)
4.9
séries de jeux de données
collection de jeux de données (4.8) partageant des caractéristiques communes
[SOURCE: ISO 19115-1:2014, 4.4]
4.10
méthode d’évaluation directe
méthode d’évaluation de la qualité (4.21) d’un jeu de données (4.8) basée sur l’inspection des éléments
(4.18) du jeu de données
4.11
entité
abstraction d’un phénomène du monde réel
Note 1 à l’article: à l’Article Une entité peut se présenter sous la forme d’un type ou d’une instance. On n’utilisera
le type d’entité (4.15) ou l’instance d’entité (4.13) que lorsque l’un d’eux seulement est impliqué.
[SOURCE: ISO 19101:2002, 4.11]
4.12
attribut d’entité
caractéristique d’une entité (4.11)
Note 1 à l’article: à l’Article Un attribut d’entité possède un nom, un type de donnée et un domaine de valeur qui
lui sont associés. Un attribut d’entité pour une instance d’entité (4.13) possède également une valeur d’attribut
émanant du domaine de valeur.
[SOURCE: ISO 19101:2002, 4.12 modifié – Une Note 1 à l’article a été ajoutée]
4.13
instance d’entité
individu d’un type d’entité (4.15) ayant des valeurs d’attribut d’entité (4.12) spécifiées
1)
[SOURCE: ISO 19101-1:—, 4.1.14]
4.14
opération sur entité
opération que chaque instance d’un type d’entité (4.15) peut exécuter
[SOURCE: ISO 19110:2005, 4.5, modifié - L’exemple et la note ont été supprimés.]
4.15
type d’entité
classe d’entités (4.11) ayant des caractéristiques communes
[SOURCE: ISO 19156:2011, 4.7]
4.16
donnée géographique
donnée avec des références implicites ou explicites à une localisation relative à la Terre
[SOURCE: ISO 19109:2005, 4.12, modifié - La note a été supprimée.]
4.17
méthode d’évaluation indirecte
méthode d’évaluation de la qualité (4.21) d’un jeu de données (4.8) basée sur une connaissance externe
(à ce jeu de données)
EXEMPLE La généalogie d’un jeu de données, comme la méthode de production ou les données sources
constituent des exemples de connaissance externe.
1) À publier.
© ISO 2013 – Tous droits réservés 3
---------------------- Page: 8 ----------------------
ISO 19157:2013(F)
4.18
élément
tout ce qui peut être décrit et considéré séparément
Note 1 à l’article: à l’Article Un élément peut faire partie d’un jeu de données (4.8), par exemple une entité (4.11),
une relation d’entité, un attribut d’entité (4.12) ou d’une combinaison de ceux-ci.
[SOURCE: ISO 2859-5:2005, 3.4 modifié – L’exemple d’origine a été supprimé. une Note 1 à l’article a été
ajoutée]
4.19
métadonnées
informations sur une ressource
[SOURCE: ISO 19115-1:2014, 4.9]
4.20
métaqualité
informations décrivant la qualité (4.21) de la qualité de données
4.21
qualité
aptitude d’un ensemble de caractéristiques intrinsèques à satisfaire des exigences
[SOURCE: ISO 9000:2005, 3.1.1, modifié - Les notes d’origine ont été supprimées.]
4.22
registre
ensemble de fichiers contenant les identifiants attribués aux éléments (4.18) et les descriptions de ces
éléments
[SOURCE: ISO 19135:2005, 4.1.9]
4.23
rapport qualité autosuffisant
document en texte libre fournissant des informations détaillées et exhaustives sur les évaluations de la
qualité (4.21) des données, les résultats et les mesures utilisées
4.24
univers du discours
vue du monde réel ou hypothétique incluant tout objet d’intérêt
[SOURCE: ISO 19101:2002, 4.29]
5 Abréviations
5.1 Abréviations
ADQR aggregated data quality results (résultats agrégés de la qualité des données)
AQL limite d’acceptation de qualité [ISO 3534-2:2006]
RMSE root mean square error (erreur quadratique moyenne)
UML Unified Modeling Language (langage de modélisation unifié)
XML Extensible Markup Language (Langage à balises extensible)
4 © ISO 2013 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO 19157:2013(F)
5.2 Abréviations relatives aux paquetages
On utilise des abréviations pour désigner le paquetage contenant une classe. Ces abréviations précèdent
le nom des classes reliées par “_”. La norme dans laquelle sont définies ces classes est indiquée entre
parenthèses. Ci-dessous une liste de ces abréviations:
CI Citation (Citation) [ISO 19115-1:—]
CT Catalogues (Catalogues) [ISO/TS 19139:2007]
DQ Data Quality (Qualité des données) [ISO 19157]
DQM Data Quality Measure (Mesure de qualité des données) [ISO 19157]
EX Extent (Étendue) [ISO 19115-1:—]
GF General Feature (Entité générale) [ISO 19109:2005]
MD Metadata (Métadonnées) [ISO 19115-1:—]
QE Quality Extended (Qualité des données étendues) [ISO 19115-2:2009]
RE Registration (Registre) [ISO 19135:2005]
6 Aperçu de la qualité de données
Travailler avec la qualité de données consiste à:
— comprendre les concepts de qualité liés aux données géographiques. L’Annexe B est une description
des concepts de qualité des données servant à mettre en place les composants de la description de
la qualité des données géographiques;
— définir les niveaux de conformité de qualité des données dans les spécifications de produit ou à
partir des exigences de l’utilisateur. La constitution des spécifications de produit est décrite dans
l’ISO 19131:2007;
— spécifier les aspects liés à la qualité dans les schémas d’application;
— évaluer la qualité des données;
— rendre compte de la qualité des données.
NOTE 1 L’élaboration de schémas d’application est décrite dans l’ISO 19109:2005.
Une évaluation de la qualité des données peut concerner une série de jeux de données, un jeu de données
ou un sous-ensemble de données au sein d’un jeu de données partageant des caractéristiques communes
permettant d’évaluer sa qualité.
La qualité des données doit être décrite en utilisant les éléments de qualité des données. Les éléments de
qualité des données et leurs descripteurs servent à décrire la façon dont un jeu de données répond aux
critères définis dans sa spécification de produit ou aux exigences du client et délivrent des informations
quantitatives sur la qualité.
Lorsque des informations de qualité des données décrivent des données qui ont été créées sans
spécification de produit ou avec une spécification de produit manquant de mesures quantitatives et de
descripteurs, les éléments des données peuvent être évalués d’une façon non quantitative subjective
sous forme de résultat descriptif de chaque élément.
© ISO 2013 – Tous droits réservés 5
---------------------- Page: 10 ----------------------
ISO 19157:2013(F)
Certaines informations liées à la qualité sont fournies en décrivant un objectif, une utilisation et
une généalogie. Ces informations sont décrites sous forme de métadonnées en conformité avec
l’ISO 19115-1:—.
NOTE 2 L’objectif décrit la raison pour laquelle un jeu de données est créé et comporte des informations sur
l’utilisation prévue de ce jeu de données, qui peut s’avérer différente de l’utilisation véritable qui en est faite.
L’utilisation décrit la ou les applications pour lesquelles un jeu de données est utilisé, soit par le producteur des
données, soit par les utilisateurs. La généalogie décrit l’historique d’un jeu de données et détaille son cycle de vie
depuis la collecte et l’acquisition des données, en passant par leur compilation et leur dérivation pour atteindre
leur forme présente. Ces informations générales, non qualitatives fournissent des indications aux utilisateurs
et peuvent permettre d’évaluer la qualité du jeu de données, notamment dans les cas où il sert à une application
particulière différant de l’application prévue (voir également 9.2.3).
La présente Norme internationale reconnaît que les éléments de qualité des données quantitatifs peuvent
avoir une qualité associée qualifiée de métaqualité. La métaqualité décrit la qualité des résultats de la
qualité des données en termes de caractéristiques définies.
NOTE 3 Le concept de métaqualité est décrit en 7.5.
La Figure 1 fournit un aperçu des informations de qualité des données.
Figure 1 — Modèle conceptuel de la qualité de données géographiques
7 Composants de la qualité des données
7.1 Aperçu des composants
Les composants de la qualité des données sont décrits dans le présent article (Article 7). La Figure 2
présente un aperçu des composants et les relations qui existent entre eux. Voir le dictionnaire de données
défini à l’Annexe C (normative) pour plus de détails sur les composants et leurs attributs.
6 © ISO 2013 – Tous droits réservés
---------------------- Page: 11 ----------------------
ISO 19157:2013(F)
DQ_FullInspection DQ_ConformanceResult
DQ_SampleBasedInspection DQ_Quantitativ eResult
DQ_IndirectEv aluation DQ_DescriptiveResult
DQ_DataEvaluation
DQ_AggregationDeriv ation
DQ_MeasureReference DQ_EvaluationMethod DQ_Result
+measure 0.1 +evaluationMethod 0.1 +result1.*
DQ_StandaloneQualityReportInformation
0.*
+standaloneQualityReport0.1
DQ_Metaquality DQ_Element
+elementReport
+relatedElement
+report
+derivedElement DQ_DataQuality
1.*
0.*
DQ_Confidence
DQ_Representativ ity
DQ_UsabilityElement
DQ_LogicalConsistency
DQ_Homogeneity
DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_Completeness
DQ_DomainConsistency
DQ_AbsoluteExternalPositionalAccuracy
DQ_CompletenessCommission
DQ_FormatConsistency
DQ_Relativ eInternalPositionalAccuracy
DQ_CompletenessOmission
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativ eAttributeCorrectness
DQ_TemporalConsistency
DQ_Quantitativ eAttributeAccuracy
DQ_TemporalValidity
Figure 2 — Aperçu des composants de la qualité des données
7.2 Unité de qualité des données
Lors de la description de la qualité des données géographique, différents éléments de qualité et différents
sous-ensembles de données peuvent être examinés. Pour les décrire, on se sert d’unités de qualité. Une
unité de qualité est la combinaison d’un domaine d’application et d’éléments de qualité des données: voir
Figure 3.
© ISO 2013 – Tous droits réservés 7
---------------------- Page: 12 ----------------------
ISO 19157:2013(F)
DQ_DataQuality DQ_Element
+report
+ scope :M D_ Scop e
1.*
Figure 3 — Unité de qualité des données
Le domaine d’application de l’unité (des unités) de qualité spécifie l’étendue, spatiale et/ou temporelle,
et/ou la c
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.