Condition monitoring and diagnostics of machines — Data interpretation and diagnostics techniques — Part 2: Data-driven applications

ISO 13379-2:2015 gives procedures to implement data-driven monitoring and diagnostic methods to facilitate the work of analysis carried out by specialist staff typically located in a monitoring centre.

Surveillance et diagnostic d'état des machines — Interprétation des données et techniques de diagnostic — Partie 2: Applications à base de modèles de données

L'ISO 13379-2:2015 fournit des procédures permettant de mettre en ?uvre des méthodes de surveillance et de diagnostic guidées par les données afin de faciliter les travaux d'analyse effectués par un personnel spécialisé généralement basé dans un centre de surveillance.

General Information

Status
Published
Publication Date
07-Apr-2015
Current Stage
9093 - International Standard confirmed
Completion Date
09-Apr-2021
Ref Project

Buy Standard

Standard
ISO 13379-2:2015 - Condition monitoring and diagnostics of machines -- Data interpretation and diagnostics techniques
English language
12 pages
Preview
Preview
Standard
ISO 13379-2:2015 - Surveillance et diagnostic d'état des machines -- Interprétation des données et techniques de diagnostic
French language
15 pages
Preview
Preview

Standards Content (Sample)

INTERNATIONAL ISO
STANDARD 13379-2
First edition
2015-04-01
Condition monitoring and diagnostics
of machines — Data interpretation
and diagnostics techniques —
Part 2:
Data-driven applications
Surveillance et diagnostic d’état des machines — Interprétation des
données et techniques de diagnostic —
Partie 2: Systèmes guidés par les données
Reference number
ISO 13379-2:2015(E)
©
ISO 2015

---------------------- Page: 1 ----------------------
ISO 13379-2:2015(E)

COPYRIGHT PROTECTED DOCUMENT
© ISO 2015
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized otherwise in any form
or by any means, electronic or mechanical, including photocopying, or posting on the internet or an intranet, without prior
written permission. Permission can be requested from either ISO at the address below or ISO’s member body in the country of
the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2015 – All rights reserved

---------------------- Page: 2 ----------------------
ISO 13379-2:2015(E)

Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 2
4 Procedure to implement data-driven monitoring . 2
4.1 Principle of data-driven monitoring methods . 2
4.2 Asset critical failures and process parameters selection . 3
4.3 Data cleaning and resampling. 3
4.3.1 General. 3
4.3.2 Interpolation errors . 3
4.3.3 Data quality issues . 3
4.3.4 Data resampling. 4
4.4 Model development . 4
4.4.1 General. 4
4.4.2 Definition of models and selection of relevant inputs . 4
4.4.3 Selection of relevant operating conditions and data . 4
4.4.4 Preparation of the model tests . 5
4.5 Model performance evaluation . 5
4.6 Alarm setting . 5
5 Procedure to implement data-driven diagnosis . 6
5.1 General . 6
5.2 Automated pattern classification approach . 6
5.3 Simplified automated signature classification approach . 7
6 General recommendations to implement data-driven monitoring methods .8
Annex A (informative) Example of data-driven monitoring application . 9
Annex B (informative) Example of data-driven diagnostic application .11
Bibliography .12
© ISO 2015 – All rights reserved iii

---------------------- Page: 3 ----------------------
ISO 13379-2:2015(E)

Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of any
patent rights identified during the development of the document will be in the Introduction and/or on
the ISO list of patent declarations received (see www.iso.org/patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation on the meaning of ISO specific terms and expressions related to conformity
assessment, as well as information about ISO’s adherence to the WTO principles in the Technical Barriers
to Trade (TBT), see the following URL: Foreword - Supplementary information.
The committee responsible for this document is ISO/TC 108, Mechanical vibration, shock and condition
monitoring, Subcommittee SC 5, Condition monitoring and diagnostics of machine systems.
ISO 13379 consists of the following parts, under the general title Condition monitoring and diagnostics of
machines — Data interpretation and diagnostics techniques:
— Part 1: General guidelines
— Part 2: Data-driven applications
— Part 3: Knowledge-based applications
iv © ISO 2015 – All rights reserved

---------------------- Page: 4 ----------------------
ISO 13379-2:2015(E)

Introduction
This part of ISO 13379 contains general procedures that can be used to determine the condition of a
machine relative to a set of baseline parameters. Changes from the baseline values and comparison
to alarm criteria are used to indicate anomalous behaviour and to generate alarms: this is usually
designated as condition monitoring. Additionally, procedures that identify the cause(s) of the anomalous
behaviour are given in order to assist in the determination of the proper corrective action: this is usually
designated as diagnostics.
© ISO 2015 – All rights reserved v

---------------------- Page: 5 ----------------------
INTERNATIONAL STANDARD ISO 13379-2:2015(E)
Condition monitoring and diagnostics of machines — Data
interpretation and diagnostics techniques —
Part 2:
Data-driven applications
1 Scope
This part of ISO 13379 gives procedures to implement data-driven monitoring and diagnostic methods
to facilitate the work of analysis carried out by specialist staff typically located in a monitoring centre.
Although some of the steps are embedded in existing tools, it is essential to be aware of the following
steps for optimum use:
— selection of the asset, the critical failures and the available process parameters;
— data cleaning and resampling;
— model development;
— model initialization and tuning;
— model performance evaluation;
— diagnostics process.
The implementation of these steps does not require a thorough knowledge of the statistical methods.
It does require the competence first to build the training models and then to carry out monitoring and
diagnostics processes.
The training in data-driven monitoring is carried out on equipment that is exhibiting normal behaviour.
In that case, the principle of fault detection is to compare observed data to estimated data. A difference
(called residuals) between an observed and expected values of the parameters reveals the presence of
an anomaly, which can be related either to equipment or instrument.
The training in data-driven diagnosis is carried out both on equipment that is exhibiting normal
behaviour and failures. The principle of the method is not to detect the deviation of a parameter but to
identify a fault by comparison of the observed situation to the faults learnt during the training phase.
The technique usually applied is pattern recognition followed by pattern classification.
Data can be available from the data historian of the distributed control system (DCS) or from specialized
monitoring systems.
2 Normative references
The following documents, in whole or in part, are normatively referenced in this document and are
indispensable for its application. For dated references, only the edition cited applies. For undated
references, the latest edition of the referenced document (including any amendments) applies.
ISO 13372, Condition monitoring and diagnostics of machines — Vocabulary
ISO 13379-1, Condition monitoring and diagnostics of machines — Data interpretation and diagnostics
techniques — Part 1: General guidelines
© ISO 2015 – All rights reserved 1

---------------------- Page: 6 ----------------------
ISO 13379-2:2015(E)

3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 13372 and ISO 13379-1 apply.
4 Procedure to implement data-driven monitoring
4.1 Principle of data-driven monitoring methods
Advanced statistical methods that simultaneously consider multiple plant signals and model the
underlying relationship between them are beginning to replace the classical methods for condition
monitoring which are based on the observation of trends of individual signals.
These monitoring methods rely on the same principle to detect a fault, which is to compare observed
data to estimated data.
Prior to the monitoring phase, it is required to build the model of the normal equipment behaviour,
during a training phase. Faults can thus often be detected as deviations between an observed and an
expected value of the parameters of the system.
Figure 1 shows an example of an application on a gas turbine. The objective is to detect abnormal shaft
displacements after a shut down. Several inputs are considered in the model: active and reactive power
and bearing displacements.
Key
green training
blue monitoring
red prediction
Figure 1 — Gas turbine displacement magnitude and residual
2 © ISO 2015 – All rights reserved

---------------------- Page: 7 ----------------------
ISO 13379-2:2015(E)

Data-driven monitoring methods generally applied are Auto associative kernel regression (AAKR),
cluster and partial least square (PLS), support vector machine (SVM), and/or Mahalanobis-Taguchi
(MT) methods.
4.2 Asset critical failures and process parameters selection
The procedure for the implementation of data-driven monitoring is precisely described in ISO 17359. It
includes two main audits:
— equipment audit: identify equipment and its function;
— reliability and criticality audit: produce a reliability block diagram, establish equipment criticality
and perform failure modes, effects and criticality analysis.
Once this preliminary study is carried out and the list of the critical faults is identified, it is necessary
to list the process data available in the data historian or in specialized monitoring systems. An example
would be a vibration monitoring system.
It might be necessary to consider the installation of additional sensors or location of existing sensors if
the detection scope of the critical faults is not completely covered.
4.3 Data cleaning and resampling
4.3.1 General
In order to build a robust model, one shall first collect data covering all the operating conditions in which
the system is expected to run and for which signal validation is desired. These data are historical data
that have been collected and stored. In fact, they might not always represent the real plant state due to
several anomalies that commonly occur, including interpolation errors, random data errors, missing
data, loss of significant figures, stuck data, and others. Data should always be checked and corrected.
WARNING — Caution shall be taken before deleting data.
4.3.2 Interpolation errors
The first problem usually encountered when using historical data for model training is that available
conditioned data do not correspond to actual data, but instead, data resulting from compression routines
normally implemented in data archival programs. Generally, the data historian creates a data archive
that is a time series database. However, all of the data are not stored at each collection time. Only data
values that have changed by more than a specified tolerance are stored along with their time stamp.
This method requires much less storage but results in a loss of data fidelity. When data are extracted
from the historian, data values between logged data points are calculated through either a simple linear
interpolation or a step at the time of the second data point. The resulting data appear to be a saw-tooth
time series and the correlations between sensors might be severely changed.
As a conclusion, data collected for model training should be actual data and tolerances should be set as
small as possible or not used.
4.3.3 Data quality issues
Several of the most common data quality issues are:
— missing data;
— noisy or random data;
— defective sensors for which the data value is not updated or is out of calibration;
— unreasonable data values (out of range).
© ISO 2015 – All rights reserved 3

---------------------- Page: 8 ----------------------
ISO 13379-2:2015(E)

Most of these data problems can be visually identified or can be detected by a data clean-up utility. These
utilities remove bad data or replace it with the most probable data value using an algorithm. It is most
common to delete all bad data observations from the training data set. Most software systems include
automated tools for data clean-up; these tools easily identify extreme outlying data but are typically
insensitive to data errors that occur within the expected region of operation. The addition of bad data
points in a training set can invalidate a model.
4.3.4 Data resampling
Once the data have been cleaned, it might be necessary to resample the data at a lower rate determined
by the selected operation modes. Thus, it is advised to keep all the time stamps to characterize the
transients of the significant operating parameters (e.g. run down of a machine) whereas under steady-
state operation, a sample every 10 min (obtained by average or not) might be sufficient.
4.4 Model development
4.4.1 General
Model development is not trivial. There are several steps that need to be performed including:
— selecting relevant features;
— selecting relevant operating regions and training data;
— preparing the model tests.
Construction of a data-driven model requires:
— a set of parameters (sensors) which focus on a specific type of fault (mechanical, electrical, therm
...

NORME ISO
INTERNATIONALE 13379-2
Première édition
2015-04-01
Surveillance et diagnostic d’état
des machines — Interprétation des
données et techniques de diagnostic —
Partie 2:
Applications à base de modèles de
données
Condition monitoring and diagnostics of machines — Data
interpretation and diagnostics techniques —
Part 2: Data-driven applications
Numéro de référence
ISO 13379-2:2015(F)
©
ISO 2015

---------------------- Page: 1 ----------------------
ISO 13379-2:2015(F)

DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2015
Droits de reproduction réservés. Sauf indication contraire, aucune partie de cette publication ne peut être reproduite ni utilisée
sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie, l’affichage sur
l’internet ou sur un Intranet, sans autorisation écrite préalable. Les demandes d’autorisation peuvent être adressées à l’ISO à
l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO 2015 – Tous droits réservés

---------------------- Page: 2 ----------------------
ISO 13379-2:2015(F)

Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 2
4 Procédure de mise en œuvre d’une surveillance guidée par les données .2
4.1 Principe des méthodes de surveillance guidée par les données . 2
4.2 Sélection de l’équipement, des défaillances critiques et des paramètres du procédé . 3
4.3 Nettoyage et rééchantillonnage des données . 4
4.3.1 Généralités . 4
4.3.2 Erreurs d’interpolation . 4
4.3.3 Problèmes de qualité des données . 4
4.3.4 Rééchantillonnage des données . 4
4.4 Développement du modèle. 5
4.4.1 Généralités . 5
4.4.2 Définition de modèles et sélection des données d’entrée pertinentes . 5
4.4.3 Sélection des conditions de fonctionnement et des données pertinentes . 5
4.4.4 Préparation des tests du modèle . 6
4.5 Évaluation des performances du modèle . 6
4.6 Réglage de l’alarme . 6
5 Procédure de mise en œuvre d’un diagnostic guidé par les données .7
5.1 Généralités . 7
5.2 Méthode de classification automatisée de formes . 8
5.3 Méthode de classification simplifiée et automatisée de signatures . 9
6 Recommandations générales pour mettre en œuvre les méthodes de surveillance
empiriques (basées sur un modèle de données) . 9
Annexe A (informative) Exemple de système de surveillance guidée par les données .11
Annexe B (informative) Exemple de système de diagnostic à base de modèle de données .13
Bibliographie .15
© ISO 2015 – Tous droits réservés iii

---------------------- Page: 3 ----------------------
ISO 13379-2:2015(F)

Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui concerne
la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.
iso.org/directives).
L’attention est appelée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant les
références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de l’élaboration
du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de brevets reçues par
l’ISO (voir www.iso.org/brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la signification des termes et expressions spécifiques de l’ISO liés à l’évaluation de
la conformité, ou pour toute information au sujet de l’adhésion de l’ISO aux principes de l’OMC concernant
les obstacles techniques au commerce (OTC), voir le lien suivant: Avant-propos — Informations
supplémentaires.
Le comité chargé de l’élaboration du présent document est l’ISO/TC 108, Vibrations et chocs mécaniques,
et leur surveillance, sous-comité SC 5, Surveillance et diagnostic des systèmes de machines.
L’ISO 13379 comprend les parties suivantes, présentées sous le titre général Surveillance et diagnostic
d’état des machines — Interprétation des données et techniques de diagnostic:
— Partie 1: Lignes directrices générales
— Partie 2: Applications à base de modèles de données
— Partie 3: Applications à base de modèles de connaissances
iv © ISO 2015 – Tous droits réservés

---------------------- Page: 4 ----------------------
ISO 13379-2:2015(F)

Introduction
La présente partie de l’ISO 13379 contient des procédures générales pouvant être utilisées pour
déterminer l’état d’une machine par rapport à un ensemble de paramètres de référence. Les variations
par rapport aux valeurs de référence et une comparaison à des critères d’alarme sont utilisées pour
indiquer un comportement anormal et pour générer des alarmes: ces procédures sont généralement
désignées en tant que surveillance de l’état. De plus, des procédures permettant d’identifier la (les)
cause(s) du comportement anormal sont données pour aider à déterminer l’action corrective appropriée:
elles sont généralement désignées en tant que diagnostic.
© ISO 2015 – Tous droits réservés v

---------------------- Page: 5 ----------------------
NORME INTERNATIONALE ISO 13379-2:2015(F)
Surveillance et diagnostic d’état des machines —
Interprétation des données et techniques de diagnostic —
Partie 2:
Applications à base de modèles de données
1 Domaine d’application
La présente partie de l’ISO 13379 fournit des procédures permettant de mettre en œuvre des méthodes
de surveillance et de diagnostic guidées par les données afin de faciliter les travaux d’analyse effectués
par un personnel spécialisé généralement basé dans un centre de surveillance.
Bien que certaines des étapes soient intégrées à des outils existants, il est essentiel de connaître les
étapes suivantes pour une utilisation optimale:
— sélection de l’équipement, des défaillances critiques et des paramètres de procédé disponibles;
— nettoyage et rééchantillonnage des données;
— développement du modèle;
— initialisation et réglage fin du modèle;
— évaluation des performances du modèle;
— processus de diagnostic.
La mise en œuvre de ces étapes ne nécessite pas une connaissance approfondie des méthodes statistiques.
Elle exige en revanche des compétences d’une part dans la construction de modèles d’apprentissage et,
d’autre part, dans l’exécution des processus de surveillance et de diagnostic.
Dans le cadre d’une surveillance basée sur un modèle de données, l’apprentissage est réalisé sur un
équipement présentant un comportement normal. Dans ce cas, le principe de détection de défaut
consiste à comparer les données observées aux données estimées. Un écart (appelé résidu) entre la
valeur observée et la valeur attendue des paramètres révèle la présence d’une anomalie qui peut être
liée à l’équipement ou à l’instrumentation.
Dans le cadre d’un diagnostic basé sur un modèle de données, l’apprentissage est réalisé sur un équipement
présentant à la fois un comportement normal et des défaillances. Le principe de la méthode n’est pas de
détecter l’écart d’un paramètre, mais d’identifier un défaut en comparant la situation observée avec la
situation correspondant aux défauts utilisés pour la phase d’apprentissage. La technique généralement
appliquée est la reconnaissance de formes suivie d’une classification de formes.
Les données peuvent provenir du système d’historisation des données inclus dans le système de
commande réparti (DCS) ou de systèmes de surveillance spécialisés.
2 Références normatives
Les documents ci-après, dans leur intégralité ou non, sont des références normatives indispensables à
l’application du présent document. Pour les références datées, seule l’édition citée s’applique. Pour les
références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO 13372, Surveillance et diagnostic de l’état des machines — Vocabulaire
© ISO 2015 – Tous droits réservés 1

---------------------- Page: 6 ----------------------
ISO 13379-2:2015(F)

ISO 13379-1, Surveillance et diagnostic d’état des machines — Interprétation des données et techniques de
diagnostic — Partie 1: Lignes directrices générales
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions donnés dans l’ISO 13372 et l’ISO 13379-1
s’appliquent.
4 Procédure de mise en œuvre d’une surveillance guidée par les données
4.1 Principe des méthodes de surveillance guidée par les données
Des méthodes statistiques avancées prenant en compte simultanément les multiples signaux transmis par
une installation et modélisant la relation sous-jacente entre ceux-ci commencent à remplacer les méthodes
classiques de surveillance de l’état basées sur l’observation des tendances de signaux individuels.
Ces méthodes de surveillance reposent sur le même principe pour détecter un défaut, à savoir comparer
les données observées aux données estimées.
Avant la phase de surveillance, il est nécessaire de construire le modèle de comportement normal de
l’équipement, au cours de la phase d’apprentissage. Ainsi, les défauts peuvent souvent être détectés
comme des écarts entre une valeur observée et la valeur attendue des paramètres du système.
La Figure 1 montre un exemple d’application sur une turbine à gaz. L’objectif est de détecter des
déplacements anormaux de l’arbre après un arrêt. Plusieurs données d’entrée sont prises en considération
dans le modèle: puissance active, puissance réactive et déplacements des paliers.
2 © ISO 2015 – Tous droits réservés

---------------------- Page: 7 ----------------------
ISO 13379-2:2015(F)

Légende
vert apprentissage
bleu surveillance
rouge prédiction
Figure 1 — Amplitude des déplacements d’une turbine à gaz et résidus
Les méthodes de surveillance guidée par les données généralement appliquées sont la méthode de
régression auto-associative de Kernel (AAKR), la méthode de regroupement et de régression partielle
par les moindres carrés (PLS), la machine à vecteurs de support (SVM) et/ou la méthode de Mahalanobis-
Taguchi (MT).
4.2 Sélection de l’équipement, des défaillances critiques et des paramètres du procédé
La procédure de mise en œuvre d’une surveillance à base de modèles de données est décrite de façon
précise dans l’ISO 17359. Elle inclut deux audits principaux:
— audit de l’équipement: identifier l’équipement et ses fonctions;
— audit de fiabilité et de criticité: réaliser un diagramme de fiabilité, établir la criticité de l’équipement
et réaliser une analyse des modes de défaillance, de leurs effets et de leur criticité.
Une fois cette analyse préliminaire réalisée et la liste des défauts critiques identifiée, il est nécessaire de
répertorier les données de procédé disponibles dans le système d’historisation des données ou dans des
systèmes de surveillance spécialisés. Un système de surveillance vibratoire est un exemple.
Il peut être nécessaire d’envisager l’installation de capteurs supplémentaires ou de reconsidérer la position
des capteurs existants si le périmètre de détection des défauts critiques n’est pas entièrement couvert.
© ISO 2015 – Tous droits réservés 3

---------------------- Page: 8 ----------------------
ISO 13379-2:2015(F)

4.3 Nettoyage et rééchantillonnage des données
4.3.1 Généralités
Pour construire un modèle robuste, il faut d’abord collecter les données couvrant toutes les conditions
de fonctionnement dans lesquelles le système est susceptible de fonctionner et pour lesquelles une
validation des signaux est souhaitée. Ces données sont les données historiques qui ont été collectées
et enregistrées. En réalité, elles peuvent ne pas toujours représenter l’état réel de l’installation dû à
plusieurs anomalies se produisant couramment, notamment des erreurs d’interpolation, des erreurs
aléatoires des données, des données manquantes, la perte de chiffres significatifs, des données bloquées
et autres. Il convient de toujours vérifier et corriger les données.
AVERTISSEMENT — Il convient de faire preuve de prudence avant de supprimer des données.
4.3.2 Erreurs d’interpolation
Le premier problème généralement rencontré lorsque des données historiques sont utilisées pour
l’apprentissage du modèle est lié au fait que les données conditionnées disponibles ne correspondent pas
aux données réelles, mais plutôt aux données résultant des programmes de compression normalement
implémentés dans les programmes d’archivage des données. En général, le système d’historisation des
données crée une archive de données qui est une base de données chronologiques. Toutefois, l’ensemble
des données n’est pas enregistré à chaque collecte. Seules les valeurs de données dont la variation est
supérieure à une tolérance spécifiée sont enregistrées avec l’horodatage correspondant. Cette méthode
nécessite beaucoup moins de mémoire, mais entraîne une perte de fidélité des données. Lorsque les
données sont extraites du système d’historisation, les valeurs des données entre les points de données
consignés sont calculées soit par une simple interpolation linéaire soit par un saut jusqu’au moment du
second point de données. Les données obtenues apparaissent comme une série temporelle en dents de
scie et les corrélations entre capteurs peuvent être sévèrement modifiées.
En conclusion, il convient que les données collectées pour l’apprentissage du modèle soient des données
réelles et il convient de fixer des tolérances aussi faibles que possible ou de ne pas les utiliser.
4.3.3 Problèmes de qualité des données
Les problèmes de qualité des données les plus courants sont les suivants:
— données manquantes;
— données bruitées ou aléatoires;
— capteurs défectueux pour lesquels la valeur des données n’est pas actualisée ou qui sont mal étalonnés;
— valeurs de données non raisonnables (en dehors des limites).
La plupart de ces problèmes de données peuvent être identifiés visuellement ou peuvent être détectés
par un utilitaire de nettoyage des données. Ces utilitaires éliminent les données incorrectes ou les
remplacent par les valeurs de données les plus probables en utilisant un algorithme. Il est plus courant
de supprimer toutes les données incorrectes observées de l’ensemble des données d’apprentissage. La
plupart des systèmes logiciels intègrent des outils automatiques de nettoyage des données; ces outils
identifient facilement les données extrêmes aberrantes, mais sont généralement insensibles aux erreurs
de données se produisant dans le domaine de fonctionnement attendu. L’introduction de points de
données incorrects dans une base d’apprentissage peut invalider un modèle.
4.3.4 Rééchantillonnage des données
Une fois les données nettoyées, il peut être nécessaire de rééchantillonner les données à une fréquence
plus faible déterminée par les modes de fonctionnement sélectionnés. Ainsi, il est conseillé de conserver
tous les horodatages pour caractériser les transitoires des paramètres de fonctionnement significatifs
4 © ISO 2015 – Tous droits réservés

---------------------- Page: 9 ----------------------
ISO 13379-2:2015(F)

(par exemple, arrêt d’une machine) alors qu’en régime permanent, un échantillon toutes les 10 minutes
(obtenu en moyenne ou non) peut suffire.
4.4 Développement du modèle
4.4.1 Généralités
Le développement du modèle n’est pas trivial. Plusieurs étapes doivent être réalisées, notamment:
— la sélection des descripteurs caractéristiques;
— la sélection des domaines de fonctionnement et des données d’apprentissage appropriés;
— la préparation des tests du modèle.
La construction d’un modèle empirique nécessite:
— un ensemble de paramètres (capteurs) axés sur un type spécifique de défaut (mécanique, électrique,
thermique, etc.);
— des échantillons de données pour une période durant laquelle la machine est connue pour être en
bon état.
4.4.2 Définition de modèles et sélection des données d’entrée pertinentes
Une fois que la qualité des données a été validée, les descripteurs du modèle doivent être définis. Les
descripteurs peuvent être les valeurs brutes fournies par les capteurs ou être dérivés des valeurs
fournies par les capteurs (moyennes mobiles à pondération exponentielle, moyennes, kurtosis, etc.). Une
grande installation industrielle peut posséder des centaines de paramètres devant être surveillés pour
l’évaluation d’un équipement critique. Par conséquent, ils
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.