ISO 19157:2013
(Main)Geographic information - Data quality
Geographic information - Data quality
ISO 19157:2013 establishes the principles for describing the quality of geographic data. It - defines components for describing data quality; - specifies components and content structure of a register for data quality measures; - describes general procedures for evaluating the quality of geographic data; - establishes principles for reporting data quality. ISO 19157:2013 also defines a set of data quality measures for use in evaluating and reporting data quality. It is applicable to data producers providing quality information to describe and assess how well a data set conforms to its product specification and to data users attempting to determine whether or not specific geographic data are of sufficient quality for their particular application. ISO 19157:2013 does not attempt to define minimum acceptable levels of quality for geographic data.
Information géographique — Qualité des données
L'ISO 19157:2013 établit les principes de description de la qualité des données géographiques. Elle - définit des composants destinés à décrire la qualité de données; - spécifie des composants et la structure du contenu d'un registre de mesures de qualité des données; - décrit des procédures générales d'évaluation de la qualité des données géographique; - pose les principes de la description de la qualité des données dans des rapports. L'ISO 19157:2013 définit également un ensemble de mesures de qualité des données destinées à l'évaluation et à la mise en place de rapports sur la qualité de données. Elle s'applique aux producteurs de données fournissant des informations de qualité pour décrire et évaluer la façon dont un jeu de données répond à sa spécification de produit et aux utilisateurs cherchant à déterminer si des données géographiques spécifiques sont ou non de qualité suffisante pour leur application particulière. L'ISO 19157:2013 ne cherche pas à définir des niveaux minimums acceptables de qualité en matière de données géographiques.
General Information
Relations
Overview
ISO 19157:2013 - Geographic information - Data quality defines principles and structured methods for describing, evaluating and reporting the quality of geographic data (geospatial data). The standard specifies components for describing data quality, the content structure of a register (catalog) of data quality measures, general procedures for evaluating data quality, and principles for reporting quality information. It is intended for both data producers and data users and standardizes how data quality results are expressed so that datasets can be compared and selected for particular applications. Notably, ISO 19157:2013 does not set minimum acceptable quality levels.
Key Topics
- Data quality components: standardized building blocks (data quality unit, data quality elements, descriptors and metaquality elements) used to describe quality consistently.
- Data quality measures: definitions of standardized and user-defined measures, including a catalogue and data dictionary for consistent metrics.
- Evaluation procedures: general methods for assessing quality (direct evaluation, sampling, methods for aggregation and derivation).
- Reporting and metadata: principles for packaging and reporting quality results so they are interoperable and comparable across datasets and systems.
- Conformance and tests: abstract test suites (Annex A) define conformance tests for evaluation processes, metadata, standalone reports and measures.
- Supporting annexes: normative and informative annexes cover a data dictionary, list of standardized measures, basic measures, sampling methods, aggregation, and reporting guidance.
Applications
ISO 19157 is practical for organizations and workflows that require reliable, consistent geospatial data quality information to support decision-making:
- Selecting the best dataset for mapping, urban planning, environmental monitoring, infrastructure, emergency response or insurance risk assessment.
- Documenting data lineage and quality for data sharing portals and national mapping agencies.
- Implementing quality assurance (QA) and quality control (QC) workflows in GIS projects, remote sensing processing and database management.
- Enabling interoperable metadata and quality reporting between data producers, custodians and end users.
- Building software tools for automated quality evaluation, sampling, aggregation, and standards-compliant reporting.
Who Should Use It
- Geospatial data producers (mapping agencies, surveyors, remote sensing teams)
- Data users and analysts evaluating data fitness-for-use
- GIS managers, QA/QC teams and metadata specialists
- Software developers creating geospatial data quality tools
- Organizations managing data catalogs and geospatial data infrastructures
Related Standards
ISO 19157 is commonly used with other ISO/TC 211 standards for geospatial metadata and schemas, such as:
- ISO 19115-1 / ISO 19115-2 (Geographic information - Metadata)
- ISO/TS 19103 (Conceptual schema language)
- ISO 19135 (Procedures for item registration)
By applying ISO 19157:2013, organizations can produce consistent, comparable geospatial data quality information that improves data selection, interoperability and trust in GIS-driven decisions.
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 19157
First edition
2013-12-15
Geographic information — Data quality
Information géographique — Qualité des données
Reference number
©
ISO 2013
© ISO 2013
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized otherwise in any form
or by any means, electronic or mechanical, including photocopying, or posting on the internet or an intranet, without prior
written permission. Permission can be requested from either ISO at the address below or ISO’s member body in the country of
the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2013 – All rights reserved
Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Conformance . 1
3 Normative references . 1
4 Terms and definitions . 2
5 Abbreviated terms . 4
5.1 Abbreviations . 4
5.2 Package abbreviations . 5
6 Overview of data quality . 5
7 Components of data quality . 6
7.1 Overview of the components . 6
7.2 Data quality unit . 7
7.3 Data quality elements . 8
7.4 Descriptors of data quality elements .11
7.5 Metaquality elements .14
7.6 Descriptors of a metaquality element .15
8 Data quality measures .16
8.1 General .16
8.2 Standardized data quality measures .16
8.3 User defined data quality measures .16
8.4 Catalogue of data quality measures .16
8.5 List of components .17
8.6 Component details .18
9 Data quality evaluation.20
9.1 The process for evaluating data quality .20
9.2 Data quality evaluation methods .21
9.3 Aggregation and derivation.23
10 Data quality reporting .23
10.1 General .23
10.2 Particular cases .24
Annex A (normative) Abstract test suites .26
Annex B (informative) Data quality concepts and their use .28
Annex C (normative) Data dictionary for data quality .34
Annex D (normative) List of standardized data quality measures .50
Annex E (informative) Evaluating and reporting data quality .96
Annex F (informative) Sampling methods for evaluating .119
Annex G (normative) Data quality basic measures .127
Annex H (informative) Management of data quality measures .132
Annex I (informative) Guidelines for the use of Quality Elements .135
Annex J (informative) Aggregation of data quality results .144
Bibliography .146
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www.iso.org/patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation on the meaning of ISO specific terms and expressions related to conformity
assessment, as well as information about ISO’s adherence to the WTO principles in the Technical Barriers
to Trade (TBT) see the following URL: Foreword - Supplementary information
The committee responsible for this document is ISO/TC 211, Geographic information/Geomatics
This edition of ISO 19157:2013 cancels and replaces ISO/TS 19138:2006, ISO 19114:2003 and
ISO 19113:2002, which have been technically revised.
iv © ISO 2013 – All rights reserved
Introduction
Geographic data are increasingly being shared, interchanged and used for purposes other than their
producers’ intended ones. Information about the quality of available geographic data are vital to the
process of selecting a data set in that the value of data are directly related to its quality. A user of
geographic data may have multiple data sets from which to choose. Therefore, it is necessary to compare
the quality of the data sets to determine which best fulfils the requirements of the user.
The purpose of describing the quality of geographic data is to facilitate the comparison and selection
of the data set best suited to application needs or requirements. Complete descriptions of the quality
of a data set will encourage the sharing, interchange and use of appropriate data sets. Information on
the quality of geographic data allows a data producer to evaluate how well a data set meets the criteria
set forth in its product specification and assists data users in evaluating a product’s ability to satisfy
the requirements for their particular application. For the purpose of this evaluation, clearly defined
procedures are used in a consistent manner.
To facilitate comparisons, it is essential that the results of the quality reports are expressed in a
comparable way and that there is a common understanding of the data quality measures that have
been used. These data quality measures provide descriptors of the quality of geographic data through
comparison with the universe of discourse. The use of incompatible measures makes data quality
comparisons impossible to perform. This International Standard standardizes the components and
structures of data quality measures and defines commonly used data quality measures.
This International Standard recognizes that a data producer and a data user may view data quality
from different perspectives. Conformance quality levels can be set using the data producer’s product
specification or a data user’s data quality requirements. If the data user requires more data quality
information than that provided by the data producer, the data user can follow the data producer’s data
quality evaluation process flow to get the additional information. In this case the data user requirements
are treated as a product specification for the purpose of using the data producer process flow.
The objective of this International Standard is to provide principles for describing the quality for
geographic data and concepts for handling quality information for geographic data, and a consistent
and standard manner to determine and report a data set’s quality information. It aims also to provide
guidelines for evaluation procedures of quantitative quality information for geographic data.
INTERNATIONAL STANDARD ISO 19157:2013(E)
Geographic information — Data quality
1 Scope
This International Standard establishes the principles for describing the quality of geographic data. It
— defines components for describing data quality;
— specifies components and content structure of a register for data quality measures;
— describes general procedures for evaluating the quality of geographic data;
— establishes principles for reporting data quality.
This International Standard also defines a set of data quality measures for use in evaluating and reporting
data quality. It is applicable to data producers providing quality information to describe and assess how
well a data set conforms to its product specification and to data users attempting to determine whether
or not specific geographic data are of sufficient quality for their particular application.
This International Standard does not attempt to define minimum acceptable levels of quality for
geographic data.
2 Conformance
Any product claiming conformance to this International Standard shall pass all the requirements
described in the abstract test suite presented in Annex A as follows:
a) A data quality evaluation process shall pass the tests outlined in A.1;
b) Data quality metadata shall pass the tests outlined in A.2 and A.3;
c) A standalone quality report shall pass the tests outlined in A.4;
d) A data quality measure shall pass the tests outlined in A.5.
3 Normative references
The following referenced documents, in whole or in part, are normatively referenced in this document
and are indispensable for its application. For dated references, only the edition cited applies. For undated
references, the latest edition of the referenced document (including any amendments) applies.
ISO/TS 19103:2005, Geographic information — Conceptual schema language
ISO 19108:2002, Geographic information — Temporal schema
1)
ISO 19115-1:2014, Geographic information — Metadata — Part 1: Fundamentals
ISO 19115-2:2009, Geographic information — Metadata — Part 2: Extensions for imagery and gridded data
ISO 19135:2005, Geographic information — Procedures for item registration
1) Under preparation.
4 Terms and definitions
4.1
accuracy
closeness of agreement between a test result or measurement result and the true value
Note 1 to entry: In this International Standard, the true value can be a reference value that is accepted as true.
[SOURCE: ISO 3534-2:2006, 3.3.1, modified – original Note has been deleted. New Note 1 to entry
has been added.]
4.2
catalogue
collection of items (4.18) or an electronic or paper document that contains information about the
collection of items
[SOURCE: ISO 10303-227:2005, 3.3.10, modified - Note has been deleted.]
4.3
conformance
fulfilment of specified requirements
[SOURCE: ISO 19105:2000, 3.8]
4.4
conformance quality level
threshold value or set of threshold values for data quality (4.21) results used to determine how well a
dataset (4.8) meets the criteria set forth in its data product specification (4.6) or user requirements
4.5
correctness
correspondence with the universe of discourse (4.24)
4.6
data product specification
detailed description of a dataset (4.8) or dataset series (4.9) together with additional information that
will enable it to be created, supplied to and used by another party
[SOURCE: ISO 19131:2007, 4.7, modified - Note has been deleted.]
4.7
data quality basic measure
generic data quality (4.21) measure used as a basis for the creation of specific data quality measures
Note 1 to entry: Data quality basic measures are abstract data types. They cannot be used directly when reporting
data quality.
4.8
dataset
identifiable collection of data
Note 1 to entry: A data set can be a smaller grouping of data which, though limited by some constraint such as
spatial extent or feature type (4.15), is located physically within a larger data set. Theoretically, a data set can be
as small as a single feature (4.11) or feature attribute (4.12) contained within a larger data set. A hardcopy map or
chart can be considered a data set.
2)
[SOURCE: ISO 19115-1:—, 4.3 ]
2) To be published.
2 © ISO 2013 – All rights reserved
4.9
dataset series
collection of datasets (4.8) sharing common characteristics
3)
[SOURCE: ISO 19115-1:—, 4.10]
4.10
direct evaluation method
method of evaluating the quality (4.21) of a dataset (4.8) based on inspection of the items (4.18)
within the dataset
4.11
feature
abstraction of real world phenomena
Note 1 to entry: A feature may occur as a type or an instance. Feature type (4.15) or feature instance (4.13) will be
used when only one is meant.
[SOURCE: ISO 19101:2002, 4.11]
4.12
feature attribute
characteristic of a feature (4.11)
Note 1 to entry: A feature attribute has a name, a data type and a value domain associated with it. A feature
attribute for a feature instance (4.13) also has an attribute value taken from the value domain.
[SOURCE: ISO 19101:2002, 4.12, modified – Examples have been deleted. Note 1 to entry has been added.]
4.13
feature instance
individual of a given feature type (4.15) having specified feature attribute (4.12) values
4)
[SOURCE: ISO 19101-1:—, 4.1.14]
4.14
feature operation
operation that every instance of a feature type (4.15) may perform
[SOURCE: ISO 19110:2005, 4.5 - modified, Example and Note have been removed.]
4.15
feature type
class of features (4.11) having common characteristics
[SOURCE: ISO 19156:2011, 4.7]
4.16
geographic data
data with implicit or explicit reference to a location relative to the Earth
[SOURCE: ISO 19109:2005, 4.12, modified - Note has been deleted.]
4.17
indirect evaluation method
method of evaluating the quality (4.21) of a dataset (4.8) based on external knowledge
Note 1 to entry: Examples of external knowledge are data set lineage, such as production method or source data.
3) To be published.
4) To be published.
4.18
item
anything that can be described and considered separately
Note 1 to entry: An item can be any part of a data set (4.8), such as a feature (4.11), feature relationship, feature
attribute (4.12), or combination of these.
[SOURCE: ISO 2859-5:2005, 3.4, modified – Original Example has been removed. Note 1 to entry has
been added.]
4.19
metadata
information about a resource
5)
[SOURCE: ISO 19115-1:—, 4.9]
4.20
metaquality
information describing the quality (4.21) of data quality
4.21
quality
degree to which a set of inherent characteristics fulfils requirements
[SOURCE: ISO 9000:2005, 3.1.1, modified - Original Notes have been removed.]
4.22
register
set of files containing identifiers assigned to items (4.18) with descriptions of the associated items
[SOURCE: ISO 19135:2005, 4.1.9]
4.23
standalone quality report
free text document providing fully detailed information about data quality (4.21) evaluations, results
and measures used
4.24
universe of discourse
view of the real or hypothetical world that includes everything of interest
[SOURCE: ISO 19101:2002, 4.29]
5 Abbreviated terms
5.1 Abbreviations
ADQR aggregated data quality results
AQL acceptance quality limit [ISO 3534-2:2006]
RMSE root mean square error
UML Unified Modeling Language
XML Extensible Markup Language
5) To be published.
4 © ISO 2013 – All rights reserved
5.2 Package abbreviations
Abbreviations are used to denote the package that contains a class. Those abbreviations precede class
names, connected by a “_”. The standard in which those classes are located is indicated in parentheses.
A list of those abbreviations follows.
CI Citation [ISO 19115-1:2014]
CT Catalogues [ISO/TS 19139:2007]
DQ Data Quality [ISO 19157]
DQM Data Quality Measure [ISO 19157]
EX Extent [ISO 19115-1:2014]
GF General Feature [ISO 19109:2005]
MD Metadata [ISO 19115-1:2014]
QE Quality Extended [ISO 19115-2:2009]
RE Registration [ISO 19135:2005]
6 Overview of data quality
Working with data quality includes:
— understanding of the concepts of data quality related to geographic data. Annex B is a description of
data quality concepts used to establish the components for describing the quality of geographic data;
— defining data quality conformance levels in data product specifications or based on user
requirements. Establishment of data product specifications is described in ISO 19131:2007;
— specifying quality aspects in application schemas;
— evaluating data quality;
— reporting data quality.
NOTE 1 The development of application schemas is described in ISO 19109:2005.
A data quality evaluation can be applied to data set series, a data set or a subset of data within a data set,
sharing common characteristics so that its quality can be evaluated.
Data quality shall be described using the data quality elements. Data quality elements and their
descriptors are used to describe how well a data set meets the criteria set forth in its data product
specification or user requirements and provide quantitative quality information.
When data quality information describes data that have been created without a detailed data product
specification or with a data product specification that lacks quantitative measures and descriptors, the
data element may be evaluated in a non-quantitative subjective way as a descriptive result for each element.
Some quality related information is provided by purpose, usage and lineage. This information is reported
as metadata in conformance with ISO 19115-1:2014.
NOTE 2 Purpose describes the rationale for creating a data set and contains information about its intended
use, which may not be the same as the actual use of the data set. Usage describes the application(s) for which a
data set has been used, either by the data producer or by other data users. Lineage describes the history of a data
set and recounts the life cycle of a data set from collection and acquisition through compilation and derivation to
its current form. This general, non-quantitative information is illustrative for users and can help assessing the
quality of a data set, especially in cases where it is used for a particular application that differs from the intended
application (see also 9.2.3).
This International Standard recognizes that quantitative data quality elements may have associated
quality which is termed metaquality. Metaquality describes the quality of the data quality results in
terms of defined characteristics.
NOTE 3 The concept of metaquality is described in 7.5.
Figure 1 provides an overview of data quality information.
co ncerns Standalone quality report
geog ra ph ic da ta
is re po rted in
de i ned by
Data quality scope Data quality
Metadata ISO19115
su bd ivid es in to is expresse d by
Result scope Data quality element
is de scri bed by
Data quality measureData quality ev aluation Data quality result Metaquality
Figure 1 — Conceptual model of quality for geographic data
7 Components of data quality
7.1 Overview of the components
The components of data quality are described in Clause 7. Figure 2 presents an overview of the
components and the connections between them. See the data dictionary defined in Annex C (normative)
for more details about components and their attributes.
6 © ISO 2013 – All rights reserved
DQ_FullInspection DQ_ConformanceResult
DQ_SampleBasedInspection DQ_QuantitativeResult
DQ_IndirectEvaluation DQ_DescriptiveResult
DQ_DataEvaluation
DQ_AggregationDerivation
DQ_MeasureReference DQ_EvaluationMethod DQ_Result
+measure 0.1 +evaluationMethod 0.1 +result1.*
DQ_StandaloneQualityReportInformation
0.*
+standaloneQualityReport0.1
DQ_Metaquality DQ_Element
+elementReport
+relatedElement
+report
+derivedElement DQ_DataQuality
1.*
0.*
DQ_Confidence
DQ_Representativity
DQ_UsabilityElement
DQ_LogicalConsistency
DQ_Homogeneity
DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_Completeness
DQ_DomainConsistency
DQ_AbsoluteExternalPositionalAccuracy
DQ_CompletenessCommission
DQ_FormatConsistency
DQ_RelativeInternalPositionalAccuracy
DQ_CompletenessOmission
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativeAttributeCorrectness
DQ_TemporalConsistency
DQ_QuantitativeAttributeAccuracy
DQ_TemporalValidity
Figure 2 — Overview of the components of data quality
7.2 Data quality unit
When describing the quality of geographic data, different quality elements and different subsets of the
data may be considered. In order to describe these, data quality units are used. A data quality unit is the
combination of a scope and data quality elements, see Figure 3.
DQ_DataQuality DQ_Element
+report
+ scope :M D_ Scop e
1.*
Figure 3 — Data quality unit
The scope of the data quality unit(s) specifies the extent, spatial and/or temporal, and/or common
characteristic(s) that identify the data on which data quality is to be evaluated.
One data quality scope shall be specified for each data quality unit. One data quality report (metadata
or standalone quality report) may encompass several data quality units, since scopes are often different
for individual data quality elements. These different scopes may be, for example, spatially separate,
overlapping or even sharing the same extents.
The following are examples of what defines a data quality scope (see also MD_Scope in ISO 19115-1):
a) a data set series;
b) a data set;
c) a subset of data defined by one or more of the following characteristics:
1) types of items (sets of feature types, feature attributes, feature operations or feature
relationships);
2) specific items (sets of feature instances, attribute values or instances of feature relationships);
3) geographic extent;
4) temporal extent (the time frame of reference and accuracy of the time frame).
7.3 Data quality elements
7.3.1 General
A data quality element is a component describing a certain aspect of the quality of geographic data and
these have been organized into different categories. These categories are shown in Figure 4.
8 © ISO 2013 – All rights reserved
DQ_Element
+derivedElement 0.*
DQ_UsabilityElement
DQ_Completeness DQ_LogicalConsistency
DQ_CompletenessCommission DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_DomainConsistency
DQ_CompletenessOmission
DQ_AbsoluteExternalPositionalAccuracy
DQ_FormatConsistency
DQ_RelativeInternalPositionalAccuracy
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativeAttributeCorrectness
DQ_TemporalConsistency
DQ_QuantitativeAttributeAccuracy
DQ_TemporalValidity
Figure 4 — Overview of the data quality elements
7.3.2 Completeness
Completeness is defined as the presence and absence of features, their attributes and relationships. It
consists of two data quality elements:
— commission: excess data present in a data set;
— omission: data absent from a data set.
7.3.3 Logical consistency
Logical consistency is defined as the degree of adherence to logical rules of data structure, attribution
and relationships (data structure can be conceptual, logical or physical). If these logical rules are
documented elsewhere (for example, in a data product specification) then the source should be
referenced (for example, in the data quality evaluation). It consists of four data quality elements:
— conceptual consistency: adherence to rules of the conceptual schema;
— domain consistency: adherence of values to the value domains;
— format consistency: degree to which data are stored in accordance with the physical structure of
the data set;
— topological consistency: correctness of the explicitly encoded topological characteristics of a data set.
7.3.4 Positional accuracy
Positional accuracy is defined as the accuracy of the position of features within a spatial reference
system. It consists of three data quality elements:
— absolute or external accuracy: closeness of reported coordinate values to values accepted as or
being true;
— relative or internal accuracy: closeness of the relative positions of features in a data set to their
respective relative positions accepted as or being true;
— gridded data positional accuracy: closeness of gridded data spatial position values to values accepted
as or being true.
7.3.5 Thematic accuracy
Thematic accuracy is defined as the accuracy of quantitative attributes and the correctness of non-
quantitative attributes and of the classifications of features and their relationships. It consists of three
data quality elements:
— classification correctness: comparison of the classes assigned to features or their attributes to a
universe of discourse (e.g. ground truth or reference data);
— non-quantitative attribute correctness: measure of whether a non-quantitative attribute is correct
or incorrect;
— quantitative attribute accuracy: closeness of the value of a quantitative attribute to a value accepted
as or known to be true.
7.3.6 Temporal quality
Temporal quality is defined as the quality of the temporal attributes and temporal relationships of
features. It consists of three data quality elements:
— accuracy of a time measurement: closeness of reported time measurements to values accepted as or
known to be true;
— temporal consistency: correctness of the order of events;
— temporal validity: validity of data with respect to time.
NOTE Time measurement can be either a defined point in time or a period.
EXAMPLE March 33 is an example of invalid data.
7.3.7 Usability element
Usability is based on user requirements. All quality elements may be used to evaluate usability.
Usability evaluation may be based on specific user requirements that cannot be described using the
quality elements described above. In this case, the usability element shall be used to describe specific
quality information about a data set’s suitability for a particular application or conformance to a set of
requirements.
It is recommended when using the usability element, to use all applicable quality elements descriptors
(see 7.4) and to define the quality measures applied in conformance with Clause 8 or Annex D, in order
to provide precise details on the evaluation.
EXAMPLE With this element, a data producer can show how a data set is suitable for various identified usages.
This element can be used to declare the conformance of the data set to a particular specification.
10 © ISO 2013 – All rights reserved
7.4 Descriptors of data quality elements
7.4.1 General
An evaluation of a data quality element is described by the following:
— measure: the type of evaluation;
— evaluation method: the procedure used to evaluate the measure;
— result: the output of the evaluation.
These are shown in Figure 5, and are described in 7.4.2, 7.4.3 and 7.4.4.
DQ_Element
+m easure +evaluationM ethod +result
0.1 0.1 1.*
DQ_MeasureReference DQ_EvaluationMethod DQ_Result
Figure 5 — Data quality element descriptors
7.4.2 Measure
A data quality element should refer to one measure only, by means of a measure reference (see Figure 6),
providing an identifier of a measure fully described elsewhere (DQM_Measure.measureIdentifier,
see 8.6.1) and/or providing the name and a short description of the measure.
NOTE The whole description can be found within a measure register or catalogue, which can form part of a
data product specification or a standalone quality report.
DQ_Element
From IS O 19115-1:2014
+m ea su re 0.1
«DataT yp e»
MD_Identi ier
DQ_MeasureReference
+ au th ority :CI_ Ci ta ti on [0 .1 ]
+ me asureIden ti i ca ti on :M D_ Id en ti i er [0 .1]
+ co de :Cha ra cterStri ng
+ na me OfMe asure :Cha ra cterStri ng [0 .*]
+ co deSpace :Cha ra cterStri ng [0 .1]
+ me asureDescrip ti on :Cha ra cterStri ng [0 .1]
+ ve rsio n :Cha ra cterStri ng [0 .1 ]
constraints
+ de scri ptio n :Cha ra cterStri ng [0 .1]
{If me asureIdenti icatio n is no t provid ed ,then na me OfMe asure sh a ll be
provid ed }
Figure 6 — Data quality measure reference
Data quality measures are further described in Clause 8 of this International Standard. Annex D contains
a list of standardized data quality measures.
EXAMPLE The percentage of the values of an attribute which are correct.
This International Standard recognizes that the quality of a data set is measured using a variety of
methods. A single data quality measure might be insufficient for fully evaluating the quality of the data
specified by a data quality scope and providing a measure of quality for all possible utilizations of a data
set. A combination of data quality measures can give useful information. Multiple data quality measures
may be reported for the data specified by a data quality scope. The data quality report should then
include one instance of DQ_Element for each measure applied.
7.4.3 Evaluation method
Data quality evaluation method describes those procedures and methods which are applied to the
geographic data to arrive at a data quality result, see Figure 7. Different evaluations are often used for
the various data quality elements.
Data quality evaluation method should be included for each applied data quality measure. Data quality
evaluation method is used for describing, or for referencing documentation describing, the methodology
used to apply a data quality measure to the data specified by a data quality scope.
NOTE Data quality evaluation is further described in Clause 9.
EXAMPLE Examples of documentation are data product specifications, published articles or accepted
industry standards.
One date or range of dates should be included for each evaluation. If the evaluation was carried out on
non-consecutive dates, each single date should be included. The dates shall be in conformance with
ISO 19108:2002.
Data quality::DQ_Element
+ standa lo neQ ual ityReportDetai ls :Cha ra cterStri ng [0 .1]
+d erivedEl em en t 0.*
+e va l uatio nM ethod 0 .1
DQ_EvaluationMethod
«CodeL ist»
DQ_EvaluationMethodTypeCode
+ da te Ti me :DateT im e [0 .*]
+ eval ua ti on Me th odDescrip ti on :Cha ra cterStri ng [0 .1]
+ di re ctIn te rn al
+ eval ua ti onProcedure :CI_ Ci ta ti on [0 .1 ]
+ di re ctExte rn al
+ re fe re nceDoc :CI_ Ci ta ti on [0 .*]
+ in di re ct
+ eval ua ti on Me th odT yp e :DQ_ Eval ua ti on Me th od Type Co de [0 .1]
Figure 7 — Data quality evaluation method
7.4.4 Result
7.4.4.1 General
At least one data quality result shall be provided for each data quality element. This could be a quantitative
result, a conformance result, a descriptive result or a coverage result, see also Figure 8.
NOTE 1 Different types of results can be provided for the same data quality element.
12 © ISO 2013 – All rights reserved
DQ_Element
+resul t
1.*
DQ_Result
+ da te Ti me :DateT im e [0 .1]
+ re su ltScope :M D_ Scope [0 .1]
constraints
{resul tS co pe is a subset of DQ _DataQ ua li ty.sco pe }
DQ_Quantitativ eResult DQ_ConformanceResult DQ_DescriptiveResult
+ va lu e :Record [1 .*] + pa ss :B oo le an + statem ent :Cha ra cterStri ng
+ va lu eUnit :Uni tO fM ea su re [0 .1] + sp eciicatio n :CI_ Ci ta ti on
+ va lu eRecordT yp e :RecordT yp e [0 .1 ] + expl anatio n :Cha ra cterStri ng [0 .1 ]
Figure 8 — Data quality result
Quality frequently differs between various parts of the data set for which quality is evaluated. Therefore
several evaluations may be applied for the same data quality element to more completely and, in more
detail, describe quantitative data quality. To avoid repeating the measure and evaluation procedure
descriptions in several instances of data quality element (DQ_Element), several results with individual
result scopes can be used.
NOTE 2 The result scope is a subset of the data quality scope (see 7.2).
EXAMPLE A data set contains features of identical type but whose positions have been established with
separate methods yielding different positional accuracies. The same quality evaluation method and the same
measure are, however, applied for the whole data set, and provide different results depending of the data
acquisition method. In this case, it may be desirable to have several results with individual result scopes (the area
covered by each data acquisition method) and one data quality scope (the data set).
7.4.4.2 Quantitative result
Quantitative result may be a single value or multiple values, depending on the values of attributes
valueType and valueStructure defined in the description of the measure applied.
The attribute valueRecordType is used to describe how the valueType and valueStructure defined in the
measure are implemented to provide the value of the quantitative result.
NOTE The attribute valueRecordType is of type RecordType, which is a generic data type defined in
ISO/TS 19103:2005. Its value changes depending on which implementation solution is used for providing the
quantitative result. An example of XML implementation for recordType is provided in ISO/TS 19139:2007.
EXAMPLE 1 Using an XML implementation: simple example: value = 5, valueRecordType = gco:Integer,
valueUnit = “metre.”
EXAMPLE 2 Within the description of the measure, the valueType is an integer, the valueStructure: matrix (nxn).
The value attribute of the quantitative result provides the result matrix itself, within a numeric encoding using
a particular XML type called MatrixType (for example). The attribute valueRecordType provides the description
of the type MatrixType in XML. If another encoding is used, the attribute valueRecordType will change to provide
the description of the type Matrix in the other encoding, and the implementation of the attribute value will change
accordingly, but the value itself will not change.
One value unit should be included for each result, if applicable.
EXAMPLE 3 Possible distance units: metre, centimetre, millimetre.
EXAMPLE 4 Measure “Rate of excess items” (see Table D.3) is used to evaluate the number of excess items in
the data set in relation to the number of items that should have been present. The quantitative result value is
of value type Real. The value unit is used in this case to show that the value is a percentage, the value has been
multiplied by 100. In this example the value unit is “%”.
7.4.4.3 Conformance result
A conformance result is the outcome of comparing the value or set of values obtained from applying a
measure to the data specified by a data quality scope with a specified acceptable conformance quality level.
When a conformance quality level is defined, the obtained result is compared with this to evaluate if the
quality of the data meets the specified level of quality.
A conformance result may be provided for each measure. The conformance quality level may be specified
in suitable reference documentation such as the data product specification or a user defined requirements
specification. If conformance is evaluated, a reference to the relevant reference documentation shall be
made and the conformance quality level used shall be specified.
More than one data quality conformance result may be provided for the same measure, if evaluation has
been performed against conformance levels originating from different sources.
7.4.4.4 Descriptive result
In some cases (e.g. with thematic and geoscientific observations), it is not possible to produce a
quantitative result for a data quality element. A subjective evaluation of an element can then be expressed
with a textual statement as a data quality descriptive result.
EXAMPLE The relative positional accuracy is higher between a geological feature and a nearby feature from
a base map (roads, rivers, lakes etc) than the absolute positional accuracy on the geological feature itself.
This descriptive result can also be used to provide a short synthetic description of the result of the data
quality evaluation, to accompany the complete quantitative result or replace it, if no quantitative value
can be provided.
7.4.4.5 Coverage result
A coverage result is the result of a data quality evaluation, organized as a coverage. This is documented
in ISO 19115-2:2009.
7.5 Metaquality elements
Metaquality elements are a set of quantitative and qualitative statements about a quality evaluation and
its result. The knowledge about the quality and the suitability of the evaluation method, the measure
applied, and the given result may be of the same importance as the result itself.
See E.5.3 for an example of metaquality evaluation.
Metaquality may be described using the following elements, represented in Figure 9:
— Confidence: trustworthiness of a data quality result.
14 © ISO 2013 – All rights reserved
NOTE 1 Quantitative figures for confidence can be obtained by statistical parameters such as standard
deviation or a confidence interval on a given confidence level.
EXAMPLE Confidence originates primarily from the method used and of its reliability, as well, to a lesser
extent, from the concerned population.
— Representativity: degree to which the sample used has produced a result which is representative of
the data within the data quality scope.
NOTE 2 A statistical method based on sampling could be considered as reliable as a global method when all the
geographic zones and concerned time periods are covered and the population is sufficiently large. It is not only
the size of the sample which is crucial but also ho
...
NORME ISO
INTERNATIONALE 19157
Première édition
2013-12-15
Information géographique — Qualité
des données
Geographic information — Data quality
Numéro de référence
©
ISO 2013
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2013
Droits de reproduction réservés. Sauf indication contraire, aucune partie de cette publication ne peut être reproduite ni utilisée
sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie, l’affichage sur
l’internet ou sur un Intranet, sans autorisation écrite préalable. Les demandes d’autorisation peuvent être adressées à l’ISO à
l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Version française parue en 2014
Publié en Suisse
ii © ISO 2013 – Tous droits réservés
Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Conformité . 1
3 Références normatives . 1
4 Termes et définitions . 2
5 Abréviations . 4
5.1 Abréviations . 4
5.2 Abréviations relatives aux paquetages . 5
6 Aperçu de la qualité de données . 5
7 Composants de la qualité des données . 6
7.1 Aperçu des composants . 6
7.2 Unité de qualité des données . 7
7.3 Éléments de qualité des données . 8
7.4 Descripteurs des éléments de qualité des données .11
7.5 Éléments de métaqualité .14
7.6 Descripteurs d’un élément de métaqualité .15
8 Mesures de qualité des données .16
8.1 Généralités .16
8.2 Mesures de qualité des données normalisées.16
8.3 Mesures de qualité des données définies par l’utilisateur .16
8.4 Catalogue de mesures de qualité des données .16
8.5 Liste des composants .17
8.6 Détails des composants .18
9 Évaluation de la qualité de données .20
9.1 Processus d’évaluation de la qualité de données .20
9.2 Méthodes d’évaluation de la qualité de données.22
9.3 Agrégation et dérivation .23
10 Rendre compte de la qualité des données .24
10.1 Généralités .24
10.2 Cas particuliers .24
Annexe A (normative) Suite de tests abstraits .26
Annexe B (informative) Les concepts de la qualité des données et leur utilisation .28
Annexe C (normative) Dictionnaire de données pour la qualité des données.34
Annexe D (normative) Catalogue des mesures normalisées de la qualité de données .55
Annexe E (informative) Évaluation et rapportage de la qualité des données .106
Annexe F (informative) Méthodes par échantillonnage pour l’évaluation .131
Annexe G (normative) Mesures de base de la qualité des données.140
Annexe H (informative) Gestion des mesures de la qualité des données.145
Annexe I (informative) Lignes directrices relatives à l’utilisation des éléments de qualité .148
Annexe J (informative) Agrégation des résultats de la qualité des données .158
Bibliographie .160
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (CEI) en ce qui concerne
la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/CEI, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/CEI, Partie 2 (voir www.
iso.org/directives).
L’attention est appelée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant les
références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de l’élaboration
du document sont indiqués dans l’Introduction et/ou sur la liste ISO des déclarations de brevets reçues
(voir www.iso.org/patents).
Les éventuelles appellations commerciales utilisées dans le présent document sont données pour
information à l’intention des utilisateurs et ne constituent pas une approbation ou une recommandation.
Pour une explication de la signification des termes et expressions spécifiques de l’ISO liés à l’évaluation de
la conformité, aussi bien que pour des informations au-sujet de l’adhésion de l’ISO aux principes de l’OMC
concernant les obstacles techniques au commerce (OTC) voir le lien suivant: Foreword - Supplementary
information
Le comité chargé de l’élaboration du présent document est l’ISO/TC 211, Information
géographique/Géomatique.
Cette deuxième édition de l’ISO 19157:2013 annule et remplace l’ISO/TS 19138:2006, l’ISO 19114:2003
et l’ISO 19113:2002, qui ont fait l’objet d’une révision technique.
iv © ISO 2013 – Tous droits réservés
Introduction
Les données géographiques sont de plus en plus partagées, échangées et utilisées à d’autres fins que
celles initialement prévues par leur producteur. Les informations se rapportant à la qualité des données
géographiques disponibles sont essentielles au processus de sélection d’un jeu de données, la valeur
des données étant directement liée à leur qualité. Un utilisateur de données géographiques peut avoir
à opérer un choix entre de multiples jeux de données. Il est, par conséquent, nécessaire de comparer la
qualité des jeux de données pour déterminer celui qui répond le mieux aux exigences de l’utilisateur.
La description de la qualité des données géographiques a pour objectif de faciliter la comparaison des jeux
de données et la sélection de l’ensemble le mieux adapté aux besoins ou aux exigences de l’application.
Une description exhaustive de leur qualité encouragera le partage, l’échange et l’utilisation des jeux de
données appropriés. Les informations relatives à la qualité des données géographiques permettent au
producteur de données d’évaluer la façon dont un jeu répond aux critères définis dans une spécification
de produit et permet aux utilisateurs de données d’évaluer la capacité d’un produit à répondre aux
exigences de leur application spécifique. Pour répondre aux besoins de cette évaluation, on recourt de
façon systématique à des procédures clairement définies.
Pour faciliter les comparaisons, il est essentiel d’exprimer les résultats dans les rapports de qualité des
données de manière comparable et d’avoir une compréhension commune des mesures de qualité qui
ont été utilisées. Ces mesures fournissent des descripteurs de la qualité des données géographiques
par comparaison avec l’univers du discours. L’utilisation de mesures incompatibles rend impossible la
comparaison de la qualité des données. La présente Norme internationale normalise les composants
et les structures des mesures de la qualité des données et définit les mesures de qualité d’utilisation
fréquente.
La présente Norme internationale reconnaît qu’un producteur de données ou un utilisateur puisse
considérer la qualité des données sous des perspectives différentes. Des niveaux de qualité peuvent être
établis en utilisant les spécifications de produit d’un producteur ou les exigences qualité d’un utilisateur.
Si l’utilisateur de données exige plus d’informations sur la qualité des données que celles fournies par le
producteur, l’utilisateur peut se référer au schéma de circulation du processus d’évaluation de la qualité
du producteur de données pour obtenir les informations supplémentaires. Dans ce cas, les exigences de
l’utilisateur de données sont traitées comme une spécification de produit visant à utiliser le schéma de
circulation du processus du producteur.
L’objectif de la présente Norme internationale est de fournir des principes de description de la qualité
des données géographiques et des concepts de gestion de ces informations sur la qualité, ainsi qu’une
manière cohérente et normalisée de déterminer et de présenter des informations sur la qualité d’un jeu
de données. Elle vise également à fournir des lignes directrices pour les procédures d’évaluation des
informations de qualité quantitatives relatives aux données géographiques.
NORME INTERNATIONALE ISO 19157:2013(F)
Information géographique — Qualité des données
1 Domaine d’application
La présente Norme internationale établit les principes de description de la qualité des données
géographiques. Elle
— définit des composants destinés à décrire la qualité de données;
— spécifie des composants et la structure du contenu d’un registre de mesures de qualité des données;
— décrit des procédures générales d’évaluation de la qualité des données géographique;
pose les principes de la description de la qualité des données dans des rapports.
La présente Norme internationale définit également un ensemble de mesures de qualité des données
destinées à l’évaluation et à la mise en place de rapports sur la qualité de données. Elle s’applique aux
producteurs de données fournissant des informations de qualité pour décrire et évaluer la façon dont
un jeu de données répond à sa spécification de produit et aux utilisateurs cherchant à déterminer si des
données géographiques spécifiques sont ou non de qualité suffisante pour leur application particulière.
La présente Norme internationale ne cherche pas à définir des niveaux minimums acceptables de qualité
en matière de données géographiques.
2 Conformité
Tout produit revendiquant une conformité à la présente Norme internationale doit répondre avec succès
à toutes les exigences suivantes décrites dans la suite de tests abstraits présentée en Annexe A:
a) un processus d’évaluation de la qualité des données doit passer avec succès les tests définis en A.1;
b) des métadonnées de qualité des données doivent passer avec succès les tests définis en A.2 et A.3;
c) un rapport qualité autosuffisant doit passer avec succès les tests définis en A.4;
d) des mesures de qualité des données doivent passer avec succès les tests définis en A.5.
3 Références normatives
Les documents suivants, en totalité ou en partie, sont référencés de manière normative dans le présent
document et sont indispensables pour son application. Pour les références datées, seule l’édition citée
s’applique. Pour les références non datées, la dernière édition du document de référence s’applique (y
compris les éventuels amendements).
ISO/TS 19103:2005, Information géographique — Langage de schéma conceptuel
ISO 19108:2002, Information géographique — Schéma temporel
ISO 19115-1:2014, Information géographique — Métadonnées — Partie 1: Principes fondamentaux
ISO 19115-2:2009, Information géographique — Métadonnées — Partie 2: Extensions pour les images et les
matrices
ISO 19135:2005, Information géographique — Procédures pour l’enregistrement d’éléments
4 Termes et définitions
4.1
exactitude
précision, justesse de l’accord entre un résultat de test ou mesure et la valeur vraie
Note 1 à l’article: à l’Article Dans la présente Norme internationale, la vraie valeur peut être une valeur de référence
acceptée comme vraie.
[SOURCE: ISO 3534-2:2006, 3.3.1, modifié – Une Note 1 à l’article a été ajoutée.]
4.2
catalogue
ensemble d’éléments (4.18) ou document sous forme électronique ou papier contenant des informations
sur l’ensemble d’éléments
[SOURCE: ISO 10303-227:2005, 3.3.10, modifié – La Note a été supprimée.]
4.3
conformité
satisfaction des exigences spécifiées
[SOURCE: ISO 19105:2000, 3.8]
4.4
niveau de conformité
valeur seuil ou ensemble de valeurs seuil devant être atteint par des résultats d’évaluation de la qualité
(4.21) et utilisé pour déterminer dans quelle mesure un jeu de données (4.8) respecte les critères exposés
dans sa spécification de produit (4.6) ou les exigences utilisateur
4.5
justesse
correspondance avec l’univers du discours (4.24)
4.6
spécification de produit (de données)
description détaillée d’un jeu de données (4.8) ou d’une série de jeux de données (4.9) comprenant
également des informations supplémentaires permettant leur création, fourniture, utilisation par une
tierce partie
[SOURCE: ISO 19131:2007, 4.7, modifié – La Note a été supprimée.]
4.7
mesure de base de qualité de données
mesure générique de qualité (4.21) des données utilisée comme une base pour la création de mesures
spécifiques de qualité de données
Note 1 à l’article: à l’Article Les mesures de base de la qualité de données sont des types de données abstraits. Elles
ne peuvent pas être utilisées directement lors de l’élaboration d’un rapport de qualité de données.
4.8
jeu de données
collection identifiable de données
Note 1 à l’article: à l’Article Un jeu de données peut être un groupe plus petit de données qui, bien que faisant
l’objet de certaines contraintes (l’étendue spatiale ou le type d’entité (4.15), par exemple), se trouve physiquement
dans un jeu de données plus important. En théorie, un jeu de données peut être aussi petit qu’une entité (4.11)
ou qu’un attribut d’entité (4.12) dans un jeu de données plus important. Une carte imprimée peut être considérée
comme un jeu de données.
[SOURCE: ISO 19115-1:2014, 4.3]
2 © ISO 2013 – Tous droits réservés
4.9
séries de jeux de données
collection de jeux de données (4.8) partageant des caractéristiques communes
[SOURCE: ISO 19115-1:2014, 4.4]
4.10
méthode d’évaluation directe
méthode d’évaluation de la qualité (4.21) d’un jeu de données (4.8) basée sur l’inspection des éléments
(4.18) du jeu de données
4.11
entité
abstraction d’un phénomène du monde réel
Note 1 à l’article: à l’Article Une entité peut se présenter sous la forme d’un type ou d’une instance. On n’utilisera
le type d’entité (4.15) ou l’instance d’entité (4.13) que lorsque l’un d’eux seulement est impliqué.
[SOURCE: ISO 19101:2002, 4.11]
4.12
attribut d’entité
caractéristique d’une entité (4.11)
Note 1 à l’article: à l’Article Un attribut d’entité possède un nom, un type de donnée et un domaine de valeur qui
lui sont associés. Un attribut d’entité pour une instance d’entité (4.13) possède également une valeur d’attribut
émanant du domaine de valeur.
[SOURCE: ISO 19101:2002, 4.12 modifié – Une Note 1 à l’article a été ajoutée]
4.13
instance d’entité
individu d’un type d’entité (4.15) ayant des valeurs d’attribut d’entité (4.12) spécifiées
1)
[SOURCE: ISO 19101-1:—, 4.1.14]
4.14
opération sur entité
opération que chaque instance d’un type d’entité (4.15) peut exécuter
[SOURCE: ISO 19110:2005, 4.5, modifié - L’exemple et la note ont été supprimés.]
4.15
type d’entité
classe d’entités (4.11) ayant des caractéristiques communes
[SOURCE: ISO 19156:2011, 4.7]
4.16
donnée géographique
donnée avec des références implicites ou explicites à une localisation relative à la Terre
[SOURCE: ISO 19109:2005, 4.12, modifié - La note a été supprimée.]
4.17
méthode d’évaluation indirecte
méthode d’évaluation de la qualité (4.21) d’un jeu de données (4.8) basée sur une connaissance externe
(à ce jeu de données)
EXEMPLE La généalogie d’un jeu de données, comme la méthode de production ou les données sources
constituent des exemples de connaissance externe.
1) À publier.
4.18
élément
tout ce qui peut être décrit et considéré séparément
Note 1 à l’article: à l’Article Un élément peut faire partie d’un jeu de données (4.8), par exemple une entité (4.11),
une relation d’entité, un attribut d’entité (4.12) ou d’une combinaison de ceux-ci.
[SOURCE: ISO 2859-5:2005, 3.4 modifié – L’exemple d’origine a été supprimé. une Note 1 à l’article a été
ajoutée]
4.19
métadonnées
informations sur une ressource
[SOURCE: ISO 19115-1:2014, 4.9]
4.20
métaqualité
informations décrivant la qualité (4.21) de la qualité de données
4.21
qualité
aptitude d’un ensemble de caractéristiques intrinsèques à satisfaire des exigences
[SOURCE: ISO 9000:2005, 3.1.1, modifié - Les notes d’origine ont été supprimées.]
4.22
registre
ensemble de fichiers contenant les identifiants attribués aux éléments (4.18) et les descriptions de ces
éléments
[SOURCE: ISO 19135:2005, 4.1.9]
4.23
rapport qualité autosuffisant
document en texte libre fournissant des informations détaillées et exhaustives sur les évaluations de la
qualité (4.21) des données, les résultats et les mesures utilisées
4.24
univers du discours
vue du monde réel ou hypothétique incluant tout objet d’intérêt
[SOURCE: ISO 19101:2002, 4.29]
5 Abréviations
5.1 Abréviations
ADQR aggregated data quality results (résultats agrégés de la qualité des données)
AQL limite d’acceptation de qualité [ISO 3534-2:2006]
RMSE root mean square error (erreur quadratique moyenne)
UML Unified Modeling Language (langage de modélisation unifié)
XML Extensible Markup Language (Langage à balises extensible)
4 © ISO 2013 – Tous droits réservés
5.2 Abréviations relatives aux paquetages
On utilise des abréviations pour désigner le paquetage contenant une classe. Ces abréviations précèdent
le nom des classes reliées par “_”. La norme dans laquelle sont définies ces classes est indiquée entre
parenthèses. Ci-dessous une liste de ces abréviations:
CI Citation (Citation) [ISO 19115-1:—]
CT Catalogues (Catalogues) [ISO/TS 19139:2007]
DQ Data Quality (Qualité des données) [ISO 19157]
DQM Data Quality Measure (Mesure de qualité des données) [ISO 19157]
EX Extent (Étendue) [ISO 19115-1:—]
GF General Feature (Entité générale) [ISO 19109:2005]
MD Metadata (Métadonnées) [ISO 19115-1:—]
QE Quality Extended (Qualité des données étendues) [ISO 19115-2:2009]
RE Registration (Registre) [ISO 19135:2005]
6 Aperçu de la qualité de données
Travailler avec la qualité de données consiste à:
— comprendre les concepts de qualité liés aux données géographiques. L’Annexe B est une description
des concepts de qualité des données servant à mettre en place les composants de la description de
la qualité des données géographiques;
— définir les niveaux de conformité de qualité des données dans les spécifications de produit ou à
partir des exigences de l’utilisateur. La constitution des spécifications de produit est décrite dans
l’ISO 19131:2007;
— spécifier les aspects liés à la qualité dans les schémas d’application;
— évaluer la qualité des données;
— rendre compte de la qualité des données.
NOTE 1 L’élaboration de schémas d’application est décrite dans l’ISO 19109:2005.
Une évaluation de la qualité des données peut concerner une série de jeux de données, un jeu de données
ou un sous-ensemble de données au sein d’un jeu de données partageant des caractéristiques communes
permettant d’évaluer sa qualité.
La qualité des données doit être décrite en utilisant les éléments de qualité des données. Les éléments de
qualité des données et leurs descripteurs servent à décrire la façon dont un jeu de données répond aux
critères définis dans sa spécification de produit ou aux exigences du client et délivrent des informations
quantitatives sur la qualité.
Lorsque des informations de qualité des données décrivent des données qui ont été créées sans
spécification de produit ou avec une spécification de produit manquant de mesures quantitatives et de
descripteurs, les éléments des données peuvent être évalués d’une façon non quantitative subjective
sous forme de résultat descriptif de chaque élément.
Certaines informations liées à la qualité sont fournies en décrivant un objectif, une utilisation et
une généalogie. Ces informations sont décrites sous forme de métadonnées en conformité avec
l’ISO 19115-1:—.
NOTE 2 L’objectif décrit la raison pour laquelle un jeu de données est créé et comporte des informations sur
l’utilisation prévue de ce jeu de données, qui peut s’avérer différente de l’utilisation véritable qui en est faite.
L’utilisation décrit la ou les applications pour lesquelles un jeu de données est utilisé, soit par le producteur des
données, soit par les utilisateurs. La généalogie décrit l’historique d’un jeu de données et détaille son cycle de vie
depuis la collecte et l’acquisition des données, en passant par leur compilation et leur dérivation pour atteindre
leur forme présente. Ces informations générales, non qualitatives fournissent des indications aux utilisateurs
et peuvent permettre d’évaluer la qualité du jeu de données, notamment dans les cas où il sert à une application
particulière différant de l’application prévue (voir également 9.2.3).
La présente Norme internationale reconnaît que les éléments de qualité des données quantitatifs peuvent
avoir une qualité associée qualifiée de métaqualité. La métaqualité décrit la qualité des résultats de la
qualité des données en termes de caractéristiques définies.
NOTE 3 Le concept de métaqualité est décrit en 7.5.
La Figure 1 fournit un aperçu des informations de qualité des données.
Figure 1 — Modèle conceptuel de la qualité de données géographiques
7 Composants de la qualité des données
7.1 Aperçu des composants
Les composants de la qualité des données sont décrits dans le présent article (Article 7). La Figure 2
présente un aperçu des composants et les relations qui existent entre eux. Voir le dictionnaire de données
défini à l’Annexe C (normative) pour plus de détails sur les composants et leurs attributs.
6 © ISO 2013 – Tous droits réservés
DQ_FullInspection DQ_ConformanceResult
DQ_SampleBasedInspection DQ_Quantitativ eResult
DQ_IndirectEv aluation DQ_DescriptiveResult
DQ_DataEvaluation
DQ_AggregationDeriv ation
DQ_MeasureReference DQ_EvaluationMethod DQ_Result
+measure 0.1 +evaluationMethod 0.1 +result1.*
DQ_StandaloneQualityReportInformation
0.*
+standaloneQualityReport0.1
DQ_Metaquality DQ_Element
+elementReport
+relatedElement
+report
+derivedElement DQ_DataQuality
1.*
0.*
DQ_Confidence
DQ_Representativ ity
DQ_UsabilityElement
DQ_LogicalConsistency
DQ_Homogeneity
DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_Completeness
DQ_DomainConsistency
DQ_AbsoluteExternalPositionalAccuracy
DQ_CompletenessCommission
DQ_FormatConsistency
DQ_Relativ eInternalPositionalAccuracy
DQ_CompletenessOmission
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativ eAttributeCorrectness
DQ_TemporalConsistency
DQ_Quantitativ eAttributeAccuracy
DQ_TemporalValidity
Figure 2 — Aperçu des composants de la qualité des données
7.2 Unité de qualité des données
Lors de la description de la qualité des données géographique, différents éléments de qualité et différents
sous-ensembles de données peuvent être examinés. Pour les décrire, on se sert d’unités de qualité. Une
unité de qualité est la combinaison d’un domaine d’application et d’éléments de qualité des données: voir
Figure 3.
DQ_DataQuality DQ_Element
+report
+ scope :M D_ Scop e
1.*
Figure 3 — Unité de qualité des données
Le domaine d’application de l’unité (des unités) de qualité spécifie l’étendue, spatiale et/ou temporelle,
et/ou la caractéristique (les caractéristiques) commune(s) qui identifie(nt) les données sur lesquelles
porte l’évaluation de la qualité.
Un unique domaine d’application de qualité doit être spécifié pour chaque unité de qualité. Un rapport
de qualité des données (métadonnées ou rapport qualité autosuffisant) peut englober plusieurs unités
de qualité, puisque les domaines d’application sont souvent différents pour des éléments individuels
de qualité. Ces différents domaines d’application peuvent, par exemple, être séparés dans l’espace, se
chevaucher, voire partager les mêmes informations d’étendues.
Voici des exemples de ce qui définit un domaine d’application de qualité des données (voir également
MD_Scope dans l’ISO 19115-1):
a) une série de jeux de données;
b) un jeu de données;
c) un sous-ensemble de données défini par une ou plusieurs des caractéristiques suivantes:
1) types d’éléments (ensembles de types d’entités, d’attributs d’entités, d’opérations d’entités ou
de relations d’entités);
2) éléments spécifiques (ensembles d’instances d’entités, de valeurs d’attributs ou d’instances de
relations d’entités);
3) étendue géographique;
4) étendue temporelle (période de référence et exactitude de la période).
7.3 Éléments de qualité des données
7.3.1 Généralités
Un élément de qualité des données est un composant décrivant un certain aspect de la qualité des données
géographiques, celles-ci étant organisées en différentes catégories. Ces catégories sont présentées à la
Figure 4.
8 © ISO 2013 – Tous droits réservés
DQ_Element
+derivedElement 0.*
DQ_UsabilityElement
DQ_Completeness DQ_LogicalConsistency
DQ_CompletenessCommission DQ_ConceptualConsistency DQ_PositionalAccuracy
DQ_DomainConsistency
DQ_CompletenessOmission
DQ_AbsoluteExternalPositionalAccuracy
DQ_FormatConsistency
DQ_Relativ eInternalPositionalAccuracy
DQ_TopologicalConsistency
DQ_GriddedDataPositionalAccuracy
DQ_ThematicAccuracy
DQ_TemporalQuality
DQ_ThematicClassificationCorrectness
DQ_AccuracyOfATimeMeasurement
DQ_NonQuantitativ eAttributeCorrectness
DQ_TemporalConsistency
DQ_Quantitativ eAttributeAccuracy
DQ_TemporalValidity
Figure 4 — Aperçu des éléments de qualité des données
7.3.2 Exhaustivité (completeness)
L’exhaustivité se définit comme la présence et l’absence d’entités, de leurs attributs et de leurs relations.
Elle se compose de deux éléments de qualité de données:
— l’excédent: données excédentaires présentes dans un jeu de données;
— l’omission: données absentes d’un jeu de données
7.3.3 Cohérence logique (logical consistency)
La cohérence logique se définit comme le degré d’adhésion à des règles logiques de structure des
données, d’attribution et de relations (les structures de données peuvent être conceptuelles, logiques
ou physiques). Si ces règles logiques sont documentées ailleurs (par exemple, dans une spécification de
produit), il convient alors que la source soit référencée (par exemple dans l’évaluation de la qualité des
données). La cohérence logique se compose de quatre éléments de qualité des données:
— la cohérence conceptuelle: adhésion aux règles du schéma conceptuel;
— la cohérence des domaines de valeurs: adhésion des valeurs aux domaines de valeurs;
— la cohérence du format: degré de conformité des données stockées à la structure physique du jeu de
données;
— la cohérence topologique: la justesse des caractéristiques topologiques du jeu de données encodées
de manière explicite.
7.3.4 Précision de position (positional accuracy)
La précision de position se définit comme la précision de la position des entités au sein d’un système de
référence spatial. Elle se compose de trois éléments de qualité:
— la précision absolue ou externe: proximité des valeurs de coordonnées reportées par rapport aux
valeurs vraies ou reconnues en tant que tel,
— la précision relative ou interne: proximité des positions relatives des entités dans un jeu de données
par rapport à leurs positions relatives respectives vraies ou reconnues en tant que tel,
— la précision de position de données matricielles: proximité des valeurs de la position spatiale de
données matricielles par rapport aux valeurs vraies ou reconnues en tant que tel.
7.3.5 Précision thématique (thematic accuracy)
La précision thématique se définit comme la précision des attributs quantitatifs et la justesse des
attributs non quantitatifs et du classement des entités et de leurs relations. Elle se compose de trois
éléments de qualité de données:
— La justesse du classement: comparaison des classes attribuées aux entités ou à leurs attributs par
rapport à un univers de discours (par exemple, monde réel ou données de référence),
— la justesse des attributs non quantitatifs: mesure permettant d’établir si un attribut non quantitatif
est correct ou incorrect,
— la précision des attributs quantitatifs: proximité de la valeur d’un attribut quantitatif par rapport à
une valeur vraie ou reconnue comme vraie.
7.3.6 Qualité temporelle (temporal quality)
La qualité temporelle se définit comme la qualité des attributs temporels et des relations temporelles
des entités. Elle se compose de trois éléments de qualité:
— l’exactitude de la mesure temporelle: exactitude des mesures temporelles décrites par rapport aux
valeurs acceptées ou reconnues comme vraies;
— cohérence temporelle: justesse de la chronologie des événements;
— validité temporelle: validité des données en ce qui concerne les aspects temporels.
NOTE La mesure temporelle peut être soit un point défini dans le temps, soit une durée.
EXEMPLE 33 mars est un exemple de donnée invalide.
7.3.7 Élément d’utilisabilité (Usability)
L’utilisabilité est fonction des exigences de l’utilisateur. Tous les éléments de qualité peuvent être utilisés
pour évaluer l’utilisabilité. L’évaluation de l’utilisabilité peut être fonction d’exigences spécifiques de
l’utilisateur qui ne peuvent être décrites en utilisant les éléments de qualité décrits ci-dessus. Dans
ce cas, l’élément d’utilisabilité doit être utilisé pour décrire les informations de qualité spécifiques
à l’adéquation d’un jeu de données à une application particulière ou sa conformité à un ensemble
d’exigences.
Il est recommandé, en cas de recours à l’élément d’utilisabilité, d’utiliser tous les descripteurs d’éléments
de qualité applicables (voir 7.4) et de définir les mesures de qualité appliquées en conformité avec
l’Article 8 ou l’Annexe D, afin de fournir les détails précis de l’évaluation.
EXEMPLE Avec cet élément, un producteur de données peut démontrer la façon dont un jeu de données
convient à différentes utilisations identifiées. Cet élément peut servir à déclarer la conformité du jeu de données
à la spécification considérée.
10 © ISO 2013 – Tous droits réservés
7.4 Descripteurs des éléments de qualité des données
7.4.1 Généralités
On décrit l’évaluation d’un élément de qualité des données au moyen:
— d’une mesure: le type d’évaluation;
— d’une méthode d’évaluation: la procédure utilisée pour évaluer la mesure;
— d’un résultat: le produit de l’évaluation.
Ces descripteurs sont représentés à la Figure 5 et sont décrits en 7.4.2, 7.4.3 et 7.4.4.
DQ_Element
+m easure +evaluationMethod +result
0.1 0.1 1.*
DQ_MeasureReference DQ_EvaluationMethod DQ_Result
Figure 5 — Descripteurs des éléments de qualité des données
7.4.2 Mesure
Il convient qu’un élément de qualité des données ne se réfère qu’à une seule mesure, au moyen d’une
référence à une mesure (voir Figure 6), fournissant un identifiant de la mesure décrite en détail par
ailleurs (DQM_Measure.measureIdentifier, voir 8.6.1) et/ou en donnant le nom et une brève description
de la mesure.
NOTE La description complète peut figurer dans un catalogue ou un registre de mesures qui peut faire partie
intégrante d’une spécification de produit ou d’un rapport qualité autosuffisant.
Figure 6 — Référence de la mesure de qualité des données
Les mesures de qualité des données sont décrites plus en détail à l’Article 8 de la présente Norme
internationale. L’Annexe D comporte une liste de mesures de qualité des données normalisées.
EXEMPLE Le pourcentage de valeurs correctes d’un attribut.
La présente Norme internationale reconnaît que la qualité d’un jeu de données se mesure à l’aide de
méthodes diverses. Une seule mesure de qualité peut être insuffisante pour une évaluation détaillée
de la qualité des données spécifiée par un domaine d’application des informations sur la qualité des
données et prévoyant une mesure de qualité pour toutes les utilisations possibles d’un jeu de données.
Une combinaison des mesures de qualité des données peut donner des informations utiles. Il est
possible de rendre compte de multiples mesures de qualité pour les données spécifiées par le domaine
d’application. Il convient que le rapport de qualité comporte alors une instance de DQ_Element pour
chaque mesure appliquée.
7.4.3 Méthode d’évaluation
La méthode d’évaluation de la qualité des données décrit les procédures et les méthodes appliquées aux
données géographiques pour parvenir à un résultat de la qualité de ces données: voir Figure 7. On utilise
souvent des évaluations différentes dans le cas de plusieurs éléments de qualité des données.
Il convient d’inclure la méthode d’évaluation de la qualité des données pour chaque mesure de qualité
appliquée. La méthode d’évaluation de la qualité des données sert à décrire la méthodologie utilisée
pour appliquer une mesure de qualité à des données spécifiées par le domaine d’application, ou à faire
référence à la documentation décrivant cette méthodologie.
NOTE L’évaluation de la qualité de données est décrite plus en détail à l’Article 9.
EXEMPLE Des spécifications de produit, des articles publiés ou des normes professionnelles reconnues
constituent des exemples de documentation.
Il convient d’inclure à chaque évaluation une date ou une série de dates. Si l’évaluation a été réalisée à des
dates qui ne se suivent pas, il convient d’inclure chacune de ces dates. Ces dates doivent être conformes
aux exigences de l’ISO 19108:2002.
Data quality::DQ_Element
+ standa lo neQ ual ityReportDetai ls :Cha ra cterStri ng [0 .1]
+d erivedEl em en t 0.*
+e va l uatio nM ethod 0 .1
DQ_EvaluationMethod
«CodeL ist»
DQ_EvaluationMethodTypeCode
+ da te Ti me :DateT im e [0 .*]
+ eval ua ti on Me th odDescrip ti on :Cha ra cterStri ng [0 .1]
+ di re ctIn te rn al
+ eval ua ti onProcedure :CI_ Ci ta ti on [0 .1 ]
+ di re ctExte rn al
+ re fe re nceDoc :CI_ Ci ta ti on [0 .*]
+ in di re ct
+ eval ua ti on Me th odT yp e :DQ_ Eval ua ti on Me th od Type Co de [0 .1]
Figure 7 — Méthode d’évaluation de la qualité des données
7.4.4 Résultat
7.4.4.1 Généralités
Au moins un résultat de la qualité des données doit être fourni pour chaque élément de qualité des
données. Ce résultat peut être un résultat quantitatif, un résultat de conformité, un résultat descriptif
ou un résultat de type couverture: voir également Figure 8.
NOTE 1 Différents types de résultats peuvent être fournis pour un même élément de qualité des données.
12 © ISO 2013 – Tous droits réservés
Figure 8 — Résultat de la qualité des données
La qualité varie fréquemment entre les différentes parties d’un jeu de données soumis à évaluation. Par
conséquent, plusieurs évaluations peuvent être effectuées sur le même élément de qualité des données
pour décrire de façon plus complète et plus détaillée la qualité quantitative des données. Pour éviter de
répéter les descriptions de la mesure et de la procédure d’évaluation en plusieurs instances de l’élément
de qualité des données (DQ_Element), il est possible d’utiliser plusieurs résultats avec des domaines
d’application de résultats individuels.
NOTE 2 Le domaine d’application du résultat est un sous-ensemble du domaine d’application des informations
sur la qualité des données (7.2).
EXEMPLE Un jeu de données contient des entités de type identique, mais dont les positions ont été établies
par des méthodes séparées produisant des précisions de position différentes. La même méthode d’évaluation
de la qualité et la même mesure sont cependant appliquées au jeu de données complet et donnent des résultats
différents en fonction de la méthode d’acquisition des données. Dans ce cas, il peut être souhaitable de disposer
de plusieurs résultats avec des domaines d’application de résultats individuels (la zone couverte par chaque
méthode d’acquisition de données) et un seul domaine d’application des informations sur la qualité des données
(le jeu de données).
7.4.4.2 Résultat quantitatif
Le résultat quantitatif peut être une valeur unique ou des valeurs multiples en fonction des valeurs des
attributs valueType et valueStructure définies dans la description de la mesure utilisée.
L’attribut valueRecordType sert à décrire la façon dont valueType et valueStructure définies dans la
mesure sont mises en œuvre pour donner la valeur du résultat quantitatif.
NOTE L’attribut valueRecordType est de type RecordType, qui est un type de données générique défini dans
l’ISO/TS 19103:2005. Sa valeur varie en fonction de la solution d’implémentation utilisée pour fournir le résultat
quantitatif. L’ISO/TS 19139:2007 donne un exemple d’implémentation XML pour recordType.
EXEMPLE 1 Implémentation XML: exemple simple: value = 5, valueRecordType = gco:Integer, valueUnit = “metre”
EXEMPLE 2 Dans la description de la mesure, valueType est une valeur entière, valueStructure une matrice
(nxn). L’attribut « value » du résultat quantitatif donne la matrice du résultat, dans un encodage numérique utilisant
un type XML particulier appelé MatrixType (par exemple). L’attribut valueRecordType donne la description du
type MatrixType en XML. Si l’on utilise un autre encodage, l’attribut valueRecordType changera pour donner
la description du type Matrix dans l’autre encodage et l’implémentation de l’attribut « value » par conséquent
changera, mais sans que la valeur elle-même ne varie.
Il convient d’inclure, le cas échéant, une unité de valeur pour chaque résultat.
EXEMPLE 3 Unités de distance possibles: mètre, centimètre, millimètre
EXEMPLE 4 La mesure “Rate of excess items” (voir Tableau D.3) sert à évaluer le nombre d’éléments en excès
dans le jeu de données par rapport au nombre d’éléments prévu. La valeur du résultat quantitatif est une valeur de
type Real. L’unité de valeur sert, dans ce cas, à montrer
...
Frequently Asked Questions
ISO 19157:2013 is a standard published by the International Organization for Standardization (ISO). Its full title is "Geographic information - Data quality". This standard covers: ISO 19157:2013 establishes the principles for describing the quality of geographic data. It - defines components for describing data quality; - specifies components and content structure of a register for data quality measures; - describes general procedures for evaluating the quality of geographic data; - establishes principles for reporting data quality. ISO 19157:2013 also defines a set of data quality measures for use in evaluating and reporting data quality. It is applicable to data producers providing quality information to describe and assess how well a data set conforms to its product specification and to data users attempting to determine whether or not specific geographic data are of sufficient quality for their particular application. ISO 19157:2013 does not attempt to define minimum acceptable levels of quality for geographic data.
ISO 19157:2013 establishes the principles for describing the quality of geographic data. It - defines components for describing data quality; - specifies components and content structure of a register for data quality measures; - describes general procedures for evaluating the quality of geographic data; - establishes principles for reporting data quality. ISO 19157:2013 also defines a set of data quality measures for use in evaluating and reporting data quality. It is applicable to data producers providing quality information to describe and assess how well a data set conforms to its product specification and to data users attempting to determine whether or not specific geographic data are of sufficient quality for their particular application. ISO 19157:2013 does not attempt to define minimum acceptable levels of quality for geographic data.
ISO 19157:2013 is classified under the following ICS (International Classification for Standards) categories: 35.240.70 - IT applications in science. The ICS classification helps identify the subject area and facilitates finding related standards.
ISO 19157:2013 has the following relationships with other standards: It is inter standard links to ISO 15589-1:2003, ISO 19157:2013/Amd 1:2018, ISO 19157-1:2023, ISO/TS 19138:2006, ISO 19114:2003, ISO 19113:2002. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.
You can purchase ISO 19157:2013 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.










Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.
Loading comments...