ISO 13379-1:2012
(Main)Condition monitoring and diagnostics of machines — Data interpretation and diagnostics techniques — Part 1: General guidelines
Condition monitoring and diagnostics of machines — Data interpretation and diagnostics techniques — Part 1: General guidelines
This part of ISO 13379 gives guidelines for the data interpretation and diagnostics of machines. It is intended to — allow the users and manufacturers of condition monitoring and diagnostics systems to share common concepts in the fields of machine diagnostics; — enable users to prepare the necessary technical characteristics that are used for the further diagnosis of the condition of the machine; — give an appropriate approach to achieve a diagnosis of machine faults. Since these are general guidelines, a list of the machine types addressed is not included. However, the machine sets covered by this part of ISO 13379 normally include industrial machines such as turbines, compressors, pumps, generators, electrical motors, blowers, gearboxes, and fans.
Surveillance et diagnostic d'état des machines — Interprétation des données et techniques de diagnostic — Partie 1: Lignes directrices générales
La présente partie de l'ISO 13379 fournit des lignes directrices pour l'interprétation des données et le diagnostic des machines. Elle est destinée à: — permettre aux utilisateurs et aux fabricants de systèmes de surveillance et de diagnostic de partager des concepts communs dans le domaine du diagnostic des machines; — permettre aux utilisateurs de préparer les caractéristiques techniques nécessaires qui sont utilisées ultérieurement pour le diagnostic de l'état de la machine; — donner une méthode appropriée pour obtenir un diagnostic des défauts de la machine. Étant donné qu'il s'agit de lignes directrices générales, une liste des types de machines concernées n'est pas incluse. Toutefois, les groupes de machines couverts par la présente partie de l'ISO 13379 comprennent normalement les machines industrielles telles que les turbines, les compresseurs, les pompes, les générateurs, les moteurs électriques, les soufflantes, les boîtes d'engrenages et les ventilateurs.
General Information
Relations
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 13379-1
First edition
2012-05-01
Condition monitoring and diagnostics
of machines — Data interpretation and
diagnostics techniques —
Part 1:
General guidelines
Surveillance et diagnostic d’état des machines — Interprétation des
données et techniques de diagnostic —
Partie 1: Lignes directrices générales
Reference number
©
ISO 2012
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or ISO’s
member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2012 – All rights reserved
Contents Page
Foreword .iv
Introduction . v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Condition monitoring set-up and diagnostics requirements . 1
4.1 Role of diagnostics in operation and maintenance . 1
4.2 Establishing diagnostics needs . 1
4.3 Failure mode symptoms analysis . 2
4.4 Diagnostics requirements report . 6
5 Elements used for diagnostics . 6
5.1 Condition monitoring data . 6
5.2 Machine data . 8
5.3 Machine history . 8
6 Diagnostic approaches . 9
6.1 Two types of approaches . 9
6.2 General guidelines for the selection of appropriate diagnostic approaches . 9
6.3 Data-driven approaches .10
6.4 Knowledge-based approaches .14
6.5 Confidence factor determination .18
Annex A (informative) Failure mode and symptoms analysis (FMSA) .20
Annex B (informative) Effectiveness of the diagnostics system .23
Annex C (informative) Comparative analysis of diagnostic models .25
Annex D (informative) Most commonly used diagnostic models by monitoring technique .26
Annex E (informative) Example of diagnostic report .27
Annex F (informative) Example of causal tree modelling: bearing spalling .30
Annex G (informative) Example of diagnosis confidence level determination .32
Bibliography .33
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the International
Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 13379-1 was prepared by Technical Committee ISO/TC 108, Mechanical vibration, shock and condition
monitoring, Subcommittee SC 5, Condition monitoring and diagnostics of machines.
This first edition of ISO 13379-1 cancels and replaces ISO 13379:2003, which has been technically revised.
ISO 13379 consists of the following parts, under the general title Condition monitoring and diagnostics of
machines — Data interpretation and diagnostics techniques:
— Part 1: General guidelines
The following parts are planned:
— Part 2: Data-driven applications
— Part 3: Knowledge-based applications
iv © ISO 2012 – All rights reserved
Introduction
This part of ISO 13379 contains general procedures that can be used to determine the condition of a machine
relative to a set of baseline parameters. Changes from the baseline values and comparison to alarm criteria
are used to indicate anomalous behaviour and to generate alarms: this is usually designated as condition
monitoring. Additionally, procedures that identify the cause(s) of the anomalous behaviour are given in order to
assist in the determination of the proper corrective action: this is usually designated as diagnostics.
INTERNATIONAL STANDARD ISO 13379-1:2012(E)
Condition monitoring and diagnostics of machines — Data
interpretation and diagnostics techniques —
Part 1:
General guidelines
1 Scope
This part of ISO 13379 gives guidelines for the data interpretation and diagnostics of machines. It is intended to
— allow the users and manufacturers of condition monitoring and diagnostics systems to share common
concepts in the fields of machine diagnostics;
— enable users to prepare the necessary technical characteristics that are used for the further diagnosis of
the condition of the machine;
— give an appropriate approach to achieve a diagnosis of machine faults.
Since these are general guidelines, a list of the machine types addressed is not included. However, the machine
sets covered by this part of ISO 13379 normally include industrial machines such as turbines, compressors,
pumps, generators, electrical motors, blowers, gearboxes, and fans.
2 Normative references
The following documents, in whole or in part, are normatively referenced in this document and are indispensable
for its application. For undated references, the latest edition of the referenced document (including any
amendments) applies.
ISO 13372, Condition monitoring and diagnostics of machines — Vocabulary
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 13372 apply.
4 Condition monitoring set-up and diagnostics requirements
4.1 Role of diagnostics in operation and maintenance
Diagnostics have an essential role in decision making for operation and maintenance tasks. In order to be
effective, diagnostics procedures should be set up according to the faults that can occur in the machine.
Therefore, it is strongly recommended that a preliminary study be carried out when preparing the requirements
for the condition monitoring and diagnostics system of a machine.
4.2 Establishing diagnostics needs
The principle of this study is shown in Figure 1. The V-shape has been intentionally chosen to represent
the high-level concerns (maintenance: machine, risk assessment) and the “low level” ones (measurements:
monitoring, periodical tests, data processing).
The left branch corresponds to the preliminary study, which prepares, for a particular machine, the necessary
data for condition monitoring and diagnostics. The right branch of the sketch corresponds to the condition
monitoring and diagnostic activities that are normally undertaken after the machine has been commissioned.
Each layer consists of a preparatory design phase (left) and a usage phase (right).
Figure 1 — Condition monitoring and diagnostics (CM and D) cycle:
design and use of the application on a machine
The generic steps of the diagnostic study include the following:
a) analyse the machine availability, maintainability, criticality with respect to the whole process;
b) list the major components and their functions;
c) analyse the failure modes and their causes as component faults;
d) express the criticality, taking into account the significance (safety, availability, maintenance costs,
production quality) and the occurrence;
e) decide accordingly which faults should be covered by diagnostics (“diagnosable”);
f) analyse under which operating conditions the different faults can be best observed and define
reference conditions;
g) express the symptoms that can serve in assessing the condition of the machine and that are used for diagnostics;
h) list the descriptors that are used to evaluate (recognize) the different symptoms;
i) identify the necessary measurements and transducers from which the descriptors are derived or computed.
The steps given in a), b), c) and d) may be followed using maintenance optimization such as FMEA (failure
modes and effects analysis) or FMECA (failure modes, their effects and criticality analysis). They also may
be accomplished within a more general process of maintenance optimization like RCM (reliability-centred
maintenance).
[6]
NOTE The FMEA and FMECA procedures are outlined in IEC 60812 .
The steps given in c), d), e), f), g), h) and i) may be followed using the FMSA (failure mode symptoms analysis)
methodology explained in 4.3.
4.3 Failure mode symptoms analysis
4.3.1 Process of failure mode symptoms analysis
The aim of this process is to select monitoring technologies and strategies that maximize the confidence level
in the diagnosis and prognosis of any given failure mode.
This methodology is designed to assist with the selection of monitoring techniques that provide the greatest
sensitivity to detection and rate of change of a given symptom. Where the confidence in a technique’s
2 © ISO 2012 – All rights reserved
sensitivity and resulting diagnosis/prognosis accuracy is questionable, the use of additional techniques for
further correlation is recommended.
This process is essentially a modification of a FMECA process with a focus on the symptoms produced by
each failure mode identified and the subsequent selection of the most appropriate detection and monitoring
techniques and strategies.
This tool should be used in conjunction with an existing FMECA analysis that has already identified and ranked
possible failure modes.
4.3.2 Guide for usage
This process is best represented by Table A.1. The essential items are as follows:
— listing the components involved;
— listing the possible failure modes for each component;
— listing the effects of each failure mode;
— listing the causes of each failure mode;
— listing the symptoms produced by each failure mode;
— listing the most appropriate monitoring technique;
— listing the estimated frequency of monitoring;
— ranking each failure mode by detection, severity, diagnosis confidence and prognosis confidence resulting
in a monitoring priority number (MPN);
— listing the most appropriate correlation techniques;
— listing the frequency of monitoring for the correlation techniques.
The greatest difficulty arises in establishing the correct terms for failure mode, effect, and cause. The failure
mode is a definition of how the failure would be observed, i.e. bent, corroded, etc. In the FMECA processes that
should have been carried out prior to the FMSA process, there are areas of overlap between the terms used for
the failure modes, effects and causes. An item may appear as a cause of failure in one line when considering a
component and as a failure mode in another. A term may also appear as an effect in one line when dealing with a
component and as a failure mode when dealing with an assembly. This also remains true for the FMSA process.
Care shall be taken to avoid duplication of failure mode and cause on the same line. For any one item the failure
mode, effect, and cause shall read logically across the page. It can help to use the following form:
— a failure mode could result in an effect due to a cause.
When considering monitoring strategies, the following form can also be used:
— a failure mode produces symptoms, which are best detectable by a primary monitoring technique resulting
in a high diagnosis and prognosis confidence when monitored at a given monitoring frequency;
— increased diagnosis and prognosis confidence can be gained by using “correlation techniques” when
monitored at a given “monitoring frequency”.
4.3.3 Guide for rating
4.3.3.1 General
A rating which estimates the likelihood of detection, prognosis accuracy, and the degree of severity is assigned
to each column. Provided that a user applies a consistent rating throughout all analyses, the higher risk
categories reflect a higher MPN.
4.3.3.2 Rating detection (DET)
The likelihood of detection is rated from 1 to 5 and is designed to reflect the overall detectability of a failure
mode irrespective of the following accuracy of diagnosis or prognosis. This rating is designed to highlight
failure modes which:
— produce symptoms that are detectable but unrepeatable;
— produce symptoms that are undetectable;
— produce symptoms that are not measurable in practice; or
— produce symptoms that may be masked by other failure mode symptoms.
This is estimated on a scale of 1 to 5, where:
— 1 means “There is a REMOTE LIKELIHOOD that this failure mode will be detected.”
— 2 means “There is a LOW LIKELIHOOD that this failure mode will be detected.”
— 3 means “There is a MODERATE LIKELIHOOD that this failure mode will be detected.”
— 4 means “There is a HIGH LIKELIHOOD that this failure mode will be detected.”
— 5 means “It is VIRTUALLY CERTAIN that this failure mode will be detected.”
4.3.3.3 Severity of failure (SEV)
This ranking should reflect any previous FMECA analysis and is designed to rank individual failure modes by risk.
This is estimated on a scale of 1 to 4, where
— 1 means “Any event which could cause degradation of system performance function(s) resulting in
negligible damage to either system or its environment, and no damage to life or limb.”
— 2 means “Any event which degrades system performance function(s) without appreciable damage to
either system or life or limb.”
— 3 means “Any event which could potentially cause the loss of primary system function(s) resulting in
significant damage to the said system or its environment and negligible hazard to life or limb.”
— 4 means “Any event which could potentially cause the loss of primary system function(s) resulting in
significant damage to the system or its environment, and/or cause the loss of life or limb.”
4.3.3.4 Diagnosis confidence (DGN)
The predicted accuracy of the diagnosis is also rated from 1 to 5. This rating is designed to identify failure
modes with:
— detectable, but unrepeatable, symptoms;
— unknown symptoms; or
— symptoms that are not distinguishable from other failure mode symptoms.
This is estimated on a scale of 1 to 5, where:
— 1 means “There is a REMOTE LIKELIHOOD that this failure mode diagnosis will be accurate.”
— 2 means “There is a LOW LIKELIHOOD that this failure mode diagnosis will be accurate.”
— 3 means “There is a MODERATE LIKELIHOOD that this failure mode diagnosis will be accurate.”
— 4 means “There is a HIGH LIKELIHOOD that this failure mode diagnosis will be accurate.”
4 © ISO 2012 – All rights reserved
— 5 means “It is VIRTUALLY CERTAIN that this failure mode diagnosis will be accurate.”
4.3.3.5 Prognosis confidence (PGN)
The predicted accuracy of the prognosis is also rated from 1 to 5. This rating is designed to identify failure
modes with:
— detectable, but unrepeatable, symptoms;
— symptoms that are not sensitive to changes in degradation;
— unknown failure rates; or
— symptoms that are not distinguishable from other failure mode symptoms.
This is estimated on a scale of 1 to 5, where:
— 1 means “There is a REMOTE LIKELIHOOD that this failure mode prognosis will be accurate.”
— 2 means “There is a LOW LIKELIHOOD that this failure mode prognosis will be accurate.”
— 3 means “There is a MODERATE LIKELIHOOD that this failure mode prognosis will be accurate.”
— 4 means “There is a HIGH LIKELIHOOD that this failure mode prognosis will be accurate.”
— 5 means “It is VIRTUALLY CERTAIN that this failure mode prognosis will be accurate.”
The frequency of monitoring also contributes to the determination of the accuracy of expected prognosis, i.e. the
greater the frequency of monitoring used, the higher the confidence in the expected failure rate and prognosis.
4.3.3.6 Monitoring priority number (MPN)
The ranking is the multiplication of the four preceding rankings and results in an overall rating of each failure mode.
A high MPN value indicates that the nominated technique is the most suitable for the detection, diagnosis, and
prognosis of the associated failure mode.
It should be noted that a low MPN value does not imply that monitoring is not necessary but rather that a
low confidence level for detection, analysis, and prognosis can be expected with the nominated monitoring
technique and frequency.
The least favourable case is a failure mode with high severity, low detectability, low diagnosis confidence and
low prognosis confidence.
The most favourable case is a failure mode with low severity, easily detectable, with known failure modes and
associated patterns and, therefore, high diagnosis and prognosis confidence levels.
The implementation of a FMSA review and monitoring system design should therefore be carried out taking
into consideration:
— safety risk of each failure mode;
— expected rate of deterioration of each failure mode;
— mean time between failures (MTBF) for each failure mode;
— secondary/subsequent failure modes;
— failure mode interrelationships;
— maintenance lead time required;
— availability of spare parts;
— required reliability and availability.
Continuous reassessment should be carried out when experience with a new installation has been gained or
when a modification has been carried out.
4.4 Diagnostics requirements report
It is recommended that the synthesis of the preliminary study be stored in a “diagnostics requirements report”.
This report should normally:
a) present the adopted breakdown of the machine into components;
b) list the faults associated with these components;
c) give the potentially observable symptoms for each fault;
d) name the condition monitoring descriptors that are to be used; and
e) indicate the method and parameters used for calculation of the descriptors.
It may arise that all the critical faults are not covered by condition monitoring and, as such, are not diagnosable.
For this reason, it is strongly recommended that the faults which are addressed and those which are not be
emphasized clearly in the report. It may be of use to re-evaluate the value of adding the capability to detect
specific faults.
Formally, the diagnostics requirements report can be composed of two parts:
1) a machine description [corresponding to items a) to b) of 4.2]: identification, role in the process,
components, criticality analysis;
2) a failure modes/symptoms analysis [corresponding to items c) to i) listed in 4.2]: failure modes,
symptoms, descriptors and measurements that are to be used for diagnostics.
Item b) may be realized easily with the FMSA chart given in Annex A.
It is also recommended that the theoretical effectiveness of the diagnostics system be calculated. For this
purpose, a proposal for a criterion for the effectiveness of a diagnostics system is given in Annex B.
5 Elements used for diagnostics
5.1 Condition monitoring data
5.1.1 Measurements
All the measurements used for condition monitoring are generally suitable for diagnostics. Descriptors are
preferred instead of raw measurements for diagnostics as they offer greater selectivity with respect to faults.
Table 1 gives, as an example, a set of various measurements and parameters used for condition monitoring
and diagnostics of a machine.
6 © ISO 2012 – All rights reserved
Table 1 — Example of measurements and parameters used for diagnostics
Oil analysis, product quality
Performance Mechanical Electrical
and others
Power consumption Thermal expansion Current Oil analysis
Efficiency Position Voltage Ferrography wear debris analysis
Temperature Fluid level Resistance Product dimensions
Pressure Temperature Inductance Product physical properties
IR thermography Vibration displacement IR thermography Product chemical properties
Flow IR thermography Capacitance — colour
Vibration velocity Magnetic field — visual aspect
Vibration acceleration Insulation resistance — smell
Audible noise Partial discharge — other non-destructive testing
Ultrasonic waves
5.1.2 Descriptors
Descriptors can be obtained from the condition monitoring system, either directly or after the processing of the
measurements. Descriptors are often preferred to measurements for reasons of selectivity. The more selective
the descriptors are, the more selective the symptoms and, therefore, the easier the diagnosis. The descriptor
selectivity reduces the number of fault hypotheses when inferring from symptoms to fault.
EXAMPLES Amplitude of the first harmonic of the shaft displacement of vibration, crest factor of the acceleration of
the vibration, oil total acid number, rotational speed, rolling element bearing damage factor, temperature gradient on an
infrared thermography trace.
5.1.3 Symptoms
A symptom can be expressed in the following terms.
a) Time characteristic: the time constant of the evolution of the descriptor.
EXAMPLES 1 h; 10 days; slow.
b) Type of evolution and magnitude change
EXAMPLES Presence; absence; regular increase; decrease; stability; >10; <200; 40 μm cyclic evolution.
c) Descriptor: the descriptor used.
EXAMPLES Temperature; first harmonic of the displacement of the vibration.
d) Location: where the symptom is observable on the machine.
EXAMPLES Shaftline at bearing No. 3 vertical direction; bearing pedestal No. 4; high-pressure body (front left);
bearing No. 2.
e) Circumstance: operating conditions in which the symptom is seen.
EXAMPLES During run down; within 1 h after cold start-up; at 100 % power; any circumstance.
When preparing the selection of symptoms for a fault, care should be taken to avoid taking two or several
symptoms that may be too dependent (highly correlated), as the evaluation of dependent symptoms does not
give more information and, thus, does not allow the diagnosis to progress.
EXAMPLES Slow and regular evolution of first harmonic vector of shaft displacement; bearing temperature is 10 °C
above usual value in nominal conditions; a 2 mm/s instantaneous change in pedestal vibration velocity; cyclic evolution of
the first harmonic of the displacement of the vibration (>10 μm, after a change in power delivered by the machine); unusual
noise; dark colour of the lubricant oil.
5.1.4 Fault
A fault can be expressed in the following terms.
a) Machine: the name or the identifier of the machine.
EXAMPLES Unit No. 1 turbine; boiler feed water pump No. 2; BFW PU2; circulation pump; coal crusher No. 5.
b) Component: name or identifier of the component of the machine on which the fault occurs.
EXAMPLES Bearing No. 3; shaft; piston; low pressure body; seal No. 2.
c) Type of degradation of the component of the machine (compulsory).
EXAMPLES Incorrect clearance, fractures, unbalance, misalignment, opening of contacts.
d) Severity: integer number for example (defined in 4.3.3.3) representative of the magnitude of the degradation
or failure mode.
5.1.5 Operational parameters
Operational parameters are often used for diagnostics. They are used both for:
— establishing some descriptors; and
— establishing the operating conditions in which the symptoms appear (circumstance).
Care should be taken when considering operational parameters. When it is a descriptor or enters the computation
of a descriptor, the parameter is an output. It is an input when it characterizes an operating condition. This should
be considered in order to avoid using an operating condition as a descriptor. For example, the turbine body
temperature is a descriptor when monitoring and diagnosing the body. It becomes an operating condition when
monitoring the bearing for it has an influence on the work of the bearing, but is not descriptive of bearing faults.
5.2 Machine data
Knowledge of specific data of the machine is often necessary for diagnostics. This is the case, for example:
— for vibrations — data regarding the kinematics of the components of the machine such as rotational
speeds, number of teeth on gears, ball bearings characteristic frequencies;
— for oil analysis — data regarding the oil path of the machine, flows, metal composition, filters disposition
and fineness;
— for thermography — IR emissivity of a surface.
A distinction should be made between data related to the techniques used for processing descriptors and data
related to the configuration of the machine. It is important to record both for the purpose of diagnostics. Data related
to the configuration of the machine are normally recorded in the machine file, as it is preferable to record machine
data related to condition monitoring techniques within diagnostics requirements, when specifying the descriptors.
5.3 Machine history
Fault occurrence can be linked not only to operation, but also to maintenance of the machine. It may arise that
a fault has been introduced during an overhaul or a particular situation. Therefore, it is important to keep a
record of the fault history, operational history and maintenance history of the machine in order to take these
facts into account for diagnostics.
8 © ISO 2012 – All rights reserved
6 Diagnostic approaches
6.1 Two types of approaches
The diagnosis process is generally triggered by detection of an anomaly during routine monitoring, routine
analysis, random analysis or human perception. This detection is carried out by making a comparison between
the present descriptors of a machine and reference values (generally called baseline values or data) chosen
from experience, from the manufacturer’s specifications, from commissioning tests or computed from statistical
data (e.g. long-term average).
The possible result of any diagnostic process should include a scenario when no fault exists.
Two main approaches can be used for diagnosing the condition of the machine.
a) Data-driven approaches (simple trending, neural network, pattern recognition, statistical, histographic
Pareto approach or other numerical approaches). These methods are generally automated, do not require
deep knowledge of the mechanism of fault initiation and propagation, but do require training the algorithm
using a large set of observed fault data.
b) Knowledge-based approaches, which rely on an explicit representation fault behaviour or symptoms
through, for example, fault models, correct behaviour models or case description.
It is recognized that these methods may overlap and solutions may be developed which utilize a
combination of several approaches.
It should be noted that, in order to analyse the entire process of modelling for the purpose of diagnosis, a
definition of an “observation specification” is also needed. This specification can provide a procedure that
describes and interprets the observations from acquired data. Different levels of detail may be needed: e.g.
how the observation model should handle descriptions of parameter evolution, shape, time-related information,
levels, and correlations.
The different usable models are described in 6.2 to 6.4.
6.2 General guidelines for the selection of appropriate diagnostic approaches
The choice of appropriate diagnostic approaches (see Figure 2) depends on the:
— application or the equipment;
— end-user of the diagnostic approach;
— monitoring technique;
— complexity of the knowledge to be modelled;
— need for having an explanatory model;
— need to retrain the model;
— availability of existing data with known faults and normal operation.
NOTE It is very important to consider in the initial design how to split online and off-line fault diagnostic processing,
accounting for software and hardware capability. Once it is defined, it is important to consider how to combine them.
Some additional guidelines are given in Annexes C and D.
Figure 2 — General approach to the choice of a diagnostic model
6.3 Data-driven approaches
6.3.1 List of methods
This subclause presents several data-driven approaches:
— statistical data analysis and case-based reasoning;
— neural networks;
— classification trees;
— random forests (RF);
— logistic regression (LR); and
— support vector machines (SVM).
Note that there are numerous alternative data-driven approaches; these are merely reference examples
of common ones.
10 © ISO 2012 – All rights reserved
The basic principle underlying all data-driven approaches is the use of a model to classify various operating
conditions of a machine, normal, fault one, fault two, etc. This is accomplished by first training the model on
previously recorded data from each condition, and then feeding the model new data to be classified.
The strong and weak points common to all the data-driven approaches are first described. Then for each
approach, the following paragraphs detail the principle, some guidelines to build the model and the specific
strong and weak points, when necessary.
6.3.2 Strengths and weaknesses common to all data-driven approaches
Compared to knowledge-based diagnostic approaches, data-driven methods have the advantage of not
requiring in-depth knowledge of the system to be diagnosed.
Additionally, they do not have constraints on the format of the independent variables. They can be dichotomous
(e.g. on or off), categorical (e.g. machine state, such as “warm up”, “normal operation”, “max power”, “idle”) or
continuous (e.g. sensed temperatures, pressures, speeds).
These types of modelling imply some drawbacks for machine diagnostics.
— Learning, calibration and potentially tuning phases are necessary prior to using the model. It may be
necessary to repeat these phases, should the equipment or its usage evolve significantly or when new
cases are encountered.
— A relatively large number of identified fault and non-fault samples are necessary to build the model.
— The model does not produce an explicative diagnosis.
— The model can be quite computationally intensive to train.
Several approaches (LR, neural network, classification tree, RF and SVM) are best used when there is no
mathematical formulation, but rather a base of examples obtained from experience or simulation (tests of
quality “pass-no pass”, testing of a chemical reactor, etc.).
6.3.3 Statistical data analysis and case-based reasoning
6.3.3.1 General description
The principle is to exploit the similarity between an observed situation and cases already known and resolved
(“the present condition of the equipment resembles other cases”).
A case may be described using basic observed data (mono- or multidimensional, trends, patterns, etc.) or
processed data (aggregated into symptoms).
This approach usually identifies a case or a set of cases in the database closely resembling the case one
wishes to diagnose. These models require a learning phase based on good feedback, which is to say several
well-described cases.
6.3.3.2 Building the model
The first step is to identify the data that will be used to describe a case.
The second is to select the type of similarity or relationship metric (commonly called distance) and classification
mechanism that will support the resemblance between cases.
Finally, calibration and potentially iterative tuning of the model occurs during the learning period during which
known cases are submitted to the system.
6.3.3.3 Specific strong and weak points
Compared to the other data-driven approaches, this approach requires the cases to be well structured and described.
6.3.4 Neural networks
6.3.4.1 General description
A neural network (also known as artificial neural network) is a non-linear statistical data model, which can
be used to model complex relationships. Neural networks are associations of many elementary processors
(neurons), whose collective behaviour approximates a given function.
6.3.4.2 Building the model
A neural network shall undergo a training phase where the model is tuned by examining normal and faulty data
and changing the internal weights of the model such that the output of the model matches the state of the input
data. Once the training process is completed, the network behaves as a “black box”, generating output related
to the operational state of the machine (consistent with the training data) as new data are entered.
6.3.5 Classification trees
6.3.5.1 General description
Classification trees (Reference [9]) constitute a non-parametric technique that recursively partitions the data
into subsets of greater class purity (normal, fault one, fault two, etc.), examining all variables and all possible
splits at each node, and selecting the single best variable and value to split on. Not all variables are necessarily
used to partition the data, and some variables may be used multiple times in different nodes.
Trees grown to 100 % node purity will naturally overfit the training data. To avoid this, cross-validation can be
used to remove lower branches of the tree so that the classifier generalizes well to new data. This process is
known as “pruning”.
6.3.5.2 Building the model
A classification tree shall undergo a training phase, i.e. the algorithm shall build the tree, generally to full
purity, and then prune it back to optimal depth using cross-validation. Once the training and pruning steps are
completed, new data for monitoring and diagnostic purposes can be run through the tree and classified.
6.3.6 Random forests
6.3.6.1 General description
Random forest (RF, Reference [7]) is a non-parametric classification method that applies bagging (Reference
[8]) to a variation of classification trees (Reference [9]). A standard classification tree is constructed by splitting
the data on the best of all possible features at each node. For RF, only a randomly selected subset (always
chosen from the full set) of features is eligible to split each node. Moreover, each individual tree is constructed
on a bootstrap sample of the data. A bootstrap sample is created from a particular data set by selecting cases
at random with replacement. Each same-size bootstrap sample will be slightly different from one another. By
random selection with replacement from the sample, some cases occur more than once in a bootstrap sample,
and some cases do not occur at all.
Finally, in contrast to standard classification trees, the individual RF trees are not pruned; rather, they are
typically grown to 100 % node purity. Although hundreds of trees may be developed, RFs are very quick to train
(e.g. much faster than typical neural networks for a given data set and processor). Predictions are made by
aggregating the predictions of the ensemble (majority vote for classification). Random forest generally exhibits
a substantial performance improvement over the single classification tree classifier.
6.3.6.2 Building the model
A bootstrap sample (a sample, drawn with replacement, of the same length as the original data) of cases is
chosen from the full set of cases. A small number of features (approximately the square root of the number of
features) are randomly selected from the full set of features. The single best split point and feature is used to
12 © ISO 2012 – All rights reserved
partition the sample into two more pure nodes. This feature selection and splitting procedure is repeated until
each leaf node of the tree is at 100 % purity. Then a new bootstrap sample is selected, and a new tree is built
for that sample. To classify a case, it is run through each tree, and the “votes” from each tree are counted. The
case is classified as the class with the greatest number of votes.
6.3.6.3 Specific strong and weak points
Compared to classification trees, one substantial advantage of the RF algorithm is that it provides an estimate
of variable importance, which can be used for variable selection.
Another substantial advantage is that because of the bagging procedure, RF has the advantage of being able
to use all of the data to train on, i.e. it is not necesssary to reserve data for a test set for cross-validation, etc.
Another advantage of RF is that, except in rare cases, unlike many classification algorithms, RF cannot be
overtrained. Rather, as training continues, performance oscillates (due to noise) around some minimum error rate.
Finally, in sharp contrast to many classification algorithms, RF has only two parameters to tune (number of
trees and number of variables to examine at each node), and the performance of the RF is not very sensitive
to these parameters (i.e. there is an optimum, but performance falls off slowly).
A weak point of RF is that, as with many data-driven classifiers, it is a “black box”, i.e. given a particular case,
it is not easy to explain how a particular classification was arrived at by examining the model.
6.3.7 Logistic regression (LR)
6.3.7.1 General description
Logistic regression (Reference [10]) models the relationship between a set of variables x to the expected value
i
E(y ), with logistic function. The LR model can be expressed as:
i
exp αβ+ x
()
Ey() = (1)
1++exp αβx
()
After a transformation, it becomes
Ey
()
ln =+αβx (2)
1−Ey
()
Note that the dependent data are expected to be dichotomous (0 or 1), and that the logistic model output
[the expected conditional mean, E(y )] is between 0 and 1. An appropriate threshold needs to be selected to
i
transform the logistic regression output to a binary decision. Because of this, in the cases of multiple fault
modes, it is necessary to use a series of models, typically with a supervisory model classifying normal or
abnormal behaviour, and an ensemble of models classifying “fault one” or one of all other faults, “fault two” or
all other faults, and so on.
6.3.7.2 Building the model
Maximum likelihood method is usually used to estimate the parameters in LR model. In practice, any good
statistical package has the ability to generate an LR model.
6.3.7.3 Specific strong and weak points
The coefficients of the LR model provide insight into the importance of making a unit change in an
independent variable.
Care shall be taken when selecting features to train the LR model on. Generally, some explicit “feature selection”
procedure (e.g. employing cross-validation) is necessary to optimally tune the model.
6.3.8 Support vector machines (SVM)
6.3.8.1 General description
The support vector machine (Reference [11]) algorithm non-linearly maps an input characteristic data set into a
higher dimensional set. A linear classifier is then constructed in the higher dimensional set to separate classes.
Once the SVM is trained, it is very efficient for the evaluation of new cases.
6.3.8.2 Building the model
Gradient descent methods are generally used to estimate the coefficients in SVM models. In practice, there are
many computer-based packages available that build SVM models.
6.3.8.3 Specific strong and weak points
SVMs have only one solution for a given problem (cf. neural networks, which can have multiple local optima).
Moreover, in contrast to neural networks, the computational complexity of SVMs does not depend on the
dimensionality of the input data.
The biggest drawback to SVM is that it is directly applicable for two-class problems only. Thus, for multi-class
problems (e.g. multi-fault isolation problems), the problem needs to be portioned into multiple binary problems.
6.4 Knowledge-based approaches
6.4.1 Fault/symptom diagnostic approach
6.4.1.1 General description
This approach is based on the exploitation of fault/symptom relationships and is known as an associative
knowledge model, because the relationships between faults and symptoms are associations. The diagnostic
activity results from different tasks, each of which is devoted to a particular aspect. The main tasks are listed
and explained below. Figure 3 gives an illustration of the phases of the fault/symptom association approach.
The starting point for the diagnostics is taken to be either:
— the presence of a real anomaly, alarm or abnormal behaviour; or
— a suspicion expressed like an anomaly in order to assess the condition of the machine.
Figure 3 — Fault/symptom diagnostic approach
...
NORME ISO
INTERNATIONALE 13379-1
Première édition
2012-05-01
Surveillance et diagnostic d’état des
machines — Interprétation des données
et techniques de diagnostic —
Partie 1:
Lignes directrices générales
Condition monitoring and diagnostics of machines — Data interpretation
and diagnostics techniques —
Part 1: General guidelines
Numéro de référence
©
ISO 2012
DOCUMENT PROTÉGÉ PAR COPYRIGHT
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l’accord écrit
de l’ISO à l’adresse ci-après ou du comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO 2012 – Tous droits réservés
Sommaire Page
Avant-propos .iv
Introduction . v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Exigences relatives à la préparation de la surveillance et au diagnostic d’état . 1
4.1 Rôle du diagnostic dans l’exploitation et la maintenance . 1
4.2 Détermination des besoins de diagnostic . 1
4.3 Analyse des modes de défaillance et des symptômes . 3
4.4 Compte rendu des exigences de diagnostic . 6
5 Éléments utilisés pour le diagnostic . 7
5.1 Données de surveillance d’état . 7
5.2 Données relatives à la machine . 9
5.3 Historique de la machine . 9
6 Méthodes de diagnostic . 9
6.1 Deux types de méthodes . 9
6.2 Lignes directrices générales pour la sélection de méthodes de diagnostic appropriées .10
6.3 Méthodes basées sur les données . 11
6.4 Méthodes basées sur les connaissances .16
6.5 Détermination du facteur de certitude .20
Annexe A (informative) Analyse des modes de défaillance et des symptômes (AMDS) .22
Annexe B (informative) Efficacité du système de diagnostic .25
Annexe C (informative) Analyse comparative des modèles de diagnostic .27
Annexe D (informative) Modèles de diagnostic les plus couramment utilisés en fonction de la technique
de surveillance .28
Annexe E (informative) Exemple de compte rendu de diagnostic .29
Annexe F (informative) Exemple de modélisation par arbre causal: écaillage d’un palier .32
Annexe G (informative) Exemple de détermination du niveau de confiance du diagnostic .34
Bibliographie .35
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux de
normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général confiée aux
comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du comité
technique créé à cet effet. Les organisations internationales, gouvernementales et non gouvernementales,
en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec la Commission
électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI, Partie 2.
La tâche principale des comités techniques est d’élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur publication
comme Normes internationales requiert l’approbation de 75 % au moins des comités membres votants.
L’attention est appelée sur le fait que certains des éléments du présent document peuvent faire l’objet de droits
de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable de ne pas avoir
identifié de tels droits de propriété et averti de leur existence.
L’ISO 13379-1 a été élaborée par le comité technique ISO/TC 108, Vibrations et chocs mécaniques, et leur
surveillance, sous-comité SC 5, Surveillance et diagnostic des machines.
Cette première édition de l’ISO 13379-1 annule et remplace l’ISO 13379:2003, qui a fait l’objet d’une
révision technique.
L’ISO 13379 comprend les parties suivantes, présentées sous le titre général Surveillance et diagnostic d’état
des machines — Interprétation des données et techniques de diagnostic:
— Partie 1: Lignes directrices générales
Les parties suivantes sont prévues:
— Partie 2: Systèmes guidés par les données
— Partie 3: Systèmes de gestion des connaissances
iv © ISO 2012 – Tous droits réservés
Introduction
La présente partie de l’ISO 13379 contient des procédures générales pouvant être utilisées pour déterminer
l’état d’une machine par rapport à un ensemble de paramètres de référence. Les variations par rapport aux
valeurs de référence et une comparaison à des critères d’alarme sont utilisées pour indiquer un comportement
anormal et pour générer des alarmes: elles sont généralement désignées en tant que surveillance de l’état.
De plus, des procédures permettant d’identifier la (les) cause(s) du comportement anormal sont données pour
aider à déterminer l’action corrective appropriée: elles sont généralement désignées en tant que diagnostic.
NORME INTERNATIONALE ISO 13379-1:2012(F)
Surveillance et diagnostic d’état des machines — Interprétation
des données et techniques de diagnostic —
Partie 1:
Lignes directrices générales
1 Domaine d’application
La présente partie de l’ISO 13379 fournit des lignes directrices pour l’interprétation des données et le diagnostic
des machines. Elle est destinée à:
— permettre aux utilisateurs et aux fabricants de systèmes de surveillance et de diagnostic de partager des
concepts communs dans le domaine du diagnostic des machines;
— permettre aux utilisateurs de préparer les caractéristiques techniques nécessaires qui sont utilisées
ultérieurement pour le diagnostic de l’état de la machine;
— donner une méthode appropriée pour obtenir un diagnostic des défauts de la machine.
Étant donné qu’il s’agit de lignes directrices générales, une liste des types de machines concernées n’est
pas incluse. Toutefois, les groupes de machines couverts par la présente partie de l’ISO 13379 comprennent
normalement les machines industrielles telles que les turbines, les compresseurs, les pompes, les générateurs,
les moteurs électriques, les soufflantes, les boîtes d’engrenages et les ventilateurs.
2 Références normatives
Les documents suivants, en totalité ou en partie, sont référencés de manière normative dans le présent
document et sont indispensables pour son application. Pour les références datées, seule l’édition citée
s’applique. Pour les références non datées, la dernière édition du document de référence s’applique (y compris
les éventuels amendements).
ISO 13372, Surveillance et diagnostic des machines — Vocabulaire
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions donnés dans l’ISO 13372 s’appliquent.
4 Exigences relatives à la préparation de la surveillance et au diagnostic d’état
4.1 Rôle du diagnostic dans l’exploitation et la maintenance
Le diagnostic joue un rôle essentiel dans la prise de décision relative aux tâches d’exploitation et de
maintenance. Pour être efficaces, il convient que les procédures de diagnostic soient établies en fonction des
défauts pouvant survenir dans la machine. Par conséquent, il est fortement recommandé de réaliser une étude
préliminaire lors de l’élaboration des exigences relatives au système de surveillance et de diagnostic d’état
d’une machine.
4.2 Détermination des besoins de diagnostic
Le principe de cette étude est illustré à la Figure 1. La forme en «V» a été volontairement choisie pour
représenter les préoccupations de haut niveau (maintenance: machine, évaluation des risques) et celles de
«bas niveau» (mesurages: surveillance, essais périodiques, traitement des données).
La branche de gauche correspond à l’étude préliminaire qui, pour une machine donnée, prépare les données
nécessaires pour la surveillance et le diagnostic d’état. La branche de droite correspond aux activités de surveillance
et de diagnostic d’état qui sont normalement réalisées après la mise en service de la machine. Chaque couche
comprend une phase d’élaboration préparatoire (à gauche) et une phase de mise en œuvre (à droite).
Figure 1 — Cycle de surveillance et de diagnostic d’état (SDE):
élaboration et mise en œuvre de l’application sur une machine
Les étapes génériques de l’étude du diagnostic comprennent ce qui suit:
a) analyser la disponibilité, la maintenabilité, la criticité de la machine par rapport à l’ensemble du procédé;
b) établir la liste des principaux composants et de leurs fonctions;
c) analyser les modes de défaillance et leurs causes en tant que défauts des composants;
d) exprimer la criticité en tenant compte de l’importance (sécurité, disponibilité, coûts de la maintenance,
qualité de la production) et de l’occurrence;
e) décider en conséquence des défauts devant être couverts par le diagnostic («pouvant être diagnostiqués»);
f) analyser dans quelles conditions de fonctionnement les différents défauts peuvent être le mieux observés
et définir les conditions de référence;
g) exprimer les symptômes pouvant servir à évaluer l’état de la machine et qui sont utilisés pour le diagnostic;
h) établir la liste des descripteurs qui sont utilisés pour évaluer (reconnaître) les différents symptômes;
i) identifier les mesures et capteurs nécessaires à partir desquels sont dérivés ou calculés les descripteurs.
Les étapes indiquées en a), b), c) et d) peuvent être suivies en appliquant une optimisation de la maintenance
telle qu’une Analyse des modes de défaillance et de leurs effets (AMDE) ou une Analyse des modes de
défaillance, de leurs effets et de leurs criticité (AMDEC). Elles peuvent également être accomplies dans le
cadre d’un processus plus général d’optimisation de la maintenance, tel que la Maintenance basée sur la
fiabilité (MBF).
NOTE Les procédures d’AMDE et d’AMDEC sont décrites dans la CEI 60812.
Les étapes indiquées en c), d), e), f), g), h) et i) peuvent être suivies en appliquant la méthodologie AMDS
(Analyse des modes de défaillance et des symptômes) expliquée en 4.3.
2 © ISO 2012 – Tous droits réservés
4.3 Analyse des modes de défaillance et des symptômes
4.3.1 Processus d’analyse des modes de défaillance et des symptômes
Ce processus a pour objectif de sélectionner des technologies et stratégies de surveillance permettant de
maximiser le niveau de confiance du diagnostic et du pronostic d’un mode de défaillance donné.
Cette méthodologie est conçue pour faciliter le choix des techniques de surveillance offrant la plus grande
sensibilité à la détection et au taux de variation d’un symptôme donné. Lorsque le niveau de confiance dans la
sensibilité d’une technique et l’exactitude du diagnostic/pronostic qui en résulte est faible, il est recommandé
d’utiliser des techniques supplémentaires pour renforcer la corrélation.
Ce processus est essentiellement une modification du processus AMDEC axée sur les symptômes produits
par chaque mode de défaillance identifié et la sélection subséquente des techniques et stratégies de détection
et de surveillance les plus appropriées.
Il convient d’utiliser cet outil conjointement à une analyse AMDEC existante qui a déjà identifié et classé les
modes de défaillance possibles.
4.3.2 Guide de mise en œuvre
Ce processus est mieux représenté par le Tableau A.1. Les éléments essentiels sont les suivants:
— établir la liste des composants concernés;
— établir la liste des modes de défaillance possibles pour chaque composant;
— établir la liste des effets de chaque mode de défaillance;
— établir la liste des causes de chaque mode de défaillance;
— établir la liste des symptômes produits par chaque mode de défaillance;
— déterminer la technique de surveillance la plus appropriée;
— déterminer la fréquence de surveillance estimée;
— classer chaque mode de défaillance par ordre de détection, gravité, niveau de confiance du diagnostic et
niveau de confiance du pronostic pour obtenir un ordre de priorité de surveillance;
— établir la liste des techniques de corrélation les plus appropriées;
— déterminer la fréquence de surveillance pour les techniques de corrélation.
La plus grande difficulté est de déterminer les termes corrects pour le mode de défaillance, l’effet et la
cause. Le mode de défaillance est une définition de la façon dont la défaillance sera observée, c’est-à-dire
fléchi, corrodé, etc. Dans les processus AMDEC réalisés avant le processus AMDS, il existe des zones de
chevauchement entre les termes utilisés pour les modes de défaillance, les effets et les causes. Lorsque l’on
considère un composant, un élément peut apparaître comme une «cause de défaillance» dans une ligne et
comme un «mode de défaillance» dans une autre. Un terme peut aussi apparaître comme un effet dans une
ligne lorsqu’il concerne un composant et comme un «mode de défaillance» lorsqu’il concerne un assemblage.
Cette observation s’applique aussi au processus AMDS.
On doit prendre soin d’éviter toute duplication d’un mode de défaillance et d’une cause sur la même ligne. Pour
un élément donné, le mode de défaillance, l’effet et la cause doivent se suivre de manière logique sur la page.
Il peut être utile d’employer la forme suivante:
— un mode de défaillance pourrait entraîner un effet dû à une cause.
Lorsqu’il s’agit des stratégies de surveillance, la forme suivante peut aussi être utilisée:
— un mode de défaillance produit des symptômes qui sont mieux détectables par une technique de surveillance
principale permettant d’atteindre un niveau de confiance élevé dans le diagnostic et le pronostic lorsque
la surveillance est assurée à une fréquence de surveillance donnée;
— le niveau de confiance du diagnostic et du pronostic peut être amélioré en utilisant des «techniques de
corrélation» lorsque la surveillance est assurée à une «fréquence de surveillance» donnée.
4.3.3 Guide de notation
4.3.3.1 Généralités
Une notation qui estime la probabilité de détection, l’exactitude du pronostic et le degré de gravité est assignée
à chaque colonne. Sous réserve qu’un utilisateur applique une notation cohérente pour toutes les analyses, les
catégories à haut risque reflètent un ordre élevé de priorité de surveillance.
4.3.3.2 Notation de la détection (DET)
La probabilité de détection est notée de 1 à 5 afin de refléter la détectabilité globale d’un mode de défaillance,
sans tenir compte de l’exactitude ultérieure du diagnostic ou du pronostic. Cette notation est conçue pour
mettre en évidence les modes de défaillance qui
— produisent des symptômes pouvant être détectés, mais pas répétés,
— produisent des symptômes non détectables,
— produisent des symptômes non mesurables en pratique, ou
— produisent des symptômes pouvant être masqués par d’autres symptômes du mode de défaillance.
Elle est estimée sur une échelle de 1 à 5, où:
— 1 signifie «Il y a une TRÈS FAIBLE PROBABILITÉ que ce mode de défaillance soit détecté.»
— 2 signifie «Il y a une FAIBLE PROBABILITÉ que ce mode de défaillance soit détecté.»
— 3 signifie «Il y a une PROBABILITÉ MOYENNE que ce mode de défaillance soit détecté.»
— 4 signifie «Il y a une FORTE PROBABILITÉ que ce mode de défaillance soit détecté.»
— 5 signifie «Il est PRATIQUEMENT CERTAIN que ce mode de défaillance sera détecté.»
4.3.3.3 Gravité de la défaillance (SEV)
Il convient que cette notation reflète toute analyse AMDEC antérieure et soit conçue pour classer les modes
de défaillance individuels par ordre de risque.
Elle est estimée sur une échelle de 1 à 4, où:
— 1 signifie «Tout événement pouvant provoquer une dégradation de la (des) fonction(s) de performance
du système entraînant des dommages négligeables du système ou de son environnement et aucune
atteinte à la vie ou aux membres.»
— 2 signifie «Tout événement qui dégrade la (les) fonction(s) de performance du système sans dommage
notable pour le système, ni atteinte à la vie ou aux membres.»
— 3 signifie «Tout événement pouvant potentiellement provoquer une perte de la (des) fonction(s)
principale(s) du système entraînant des dommages significatifs dudit système ou de son environnement et
un risque négligeable pour la vie ou les membres.»
4 © ISO 2012 – Tous droits réservés
— 4 signifie «Tout événement pouvant potentiellement provoquer une perte de la (des) fonction(s)
principale(s) du système entraînant des dommages significatifs du système ou de son environnement
et/ou provoquant la mort ou la perte d’un membre.»
4.3.3.4 Niveau de confiance du diagnostic (DGN)
L’exactitude prévue du diagnostic est également notée de 1 à 5. Cette notation est conçue pour identifier les
modes de défaillance associés à
— des symptômes pouvant être détectés, mais pas répétés,
— des symptômes inconnus, ou
— des symptômes ne pouvant pas être distingués d’autres symptômes du mode de défaillance.
Elle est estimée sur une échelle de 1 à 5, où:
— 1 signifie «Il y a une TRÈS FAIBLE PROBABILITÉ que ce diagnostic de mode de défaillance soit exact.»
— 2 signifie «Il y a une FAIBLE PROBABILITÉ que ce diagnostic de mode de défaillance soit exact.»
— 3 signifie «Il y a une PROBABILITÉ MOYENNE que ce diagnostic de mode de défaillance soit exact.»
— 4 signifie «Il y a une FORTE PROBABILITÉ que ce diagnostic de mode de défaillance soit exact.»
— 5 signifie «Il est PRATIQUEMENT CERTAIN que ce diagnostic de mode de défaillance sera exact.»
4.3.3.5 Niveau de confiance du pronostic (PGN)
L’exactitude prévue du pronostic est également notée de 1 à 5. Cette notation est conçue pour identifier les
modes de défaillance associés à
— des symptômes pouvant être détectés, mais pas répétés,
— des symptômes qui ne sont pas sensibles aux variations de dégradation,
— des taux de défaillance inconnus, ou
— des symptômes ne pouvant pas être distingués d’autres symptômes du mode de défaillance.
Elle est estimée sur une échelle de 1 à 5, où:
— 1 signifie «Il y a une TRÈS FAIBLE PROBABILITÉ que ce pronostic de mode de défaillance soit exact.»
— 2 signifie «Il y a une FAIBLE PROBABILITÉ que ce pronostic de mode de défaillance soit exact.»
— 3 signifie «Il y a une PROBABILITÉ MOYENNE que ce pronostic de mode de défaillance soit exact.»
— 4 signifie «Il y a une FORTE PROBABILITÉ que ce pronostic de mode de défaillance soit exact.»
— 5 signifie «Il est PRATIQUEMENT CERTAIN que ce pronostic de mode de défaillance sera exact.»
La fréquence de surveillance contribue également à la détermination de l’exactitude du pronostic prévu, c’est-
à-dire que plus la fréquence de surveillance utilisée est élevée, plus le niveau de confiance dans le taux de
défaillance et le pronostic prévus est élevé.
4.3.3.6 Ordre de priorité de surveillance (MPN)
La notation est le produit des quatre notations précédentes et constitue une notation globale de chaque mode
de défaillance.
Une valeur MPN élevée indique que la technique proposée est la mieux adaptée pour la détection, le diagnostic
et le pronostic du mode de défaillance associé.
Il convient de noter qu’une faible valeur de MPN n’implique pas qu’une surveillance est inutile, mais plutôt qu’un
faible niveau de confiance en matière de détection, d’analyse et de pronostic peut être prévu avec la technique
et la fréquence de surveillance proposées.
Le cas le plus défavorable est un mode de défaillance associé à une gravité élevée, une faible détectabilité, un
faible niveau de confiance du diagnostic et un faible niveau de confiance du pronostic.
Le cas le plus favorable est un mode de défaillance associé à une faible gravité, facilement détectable, avec des
modes et schémas de défaillance connus et, par conséquent, des niveaux de confiance élevés du diagnostic
et du pronostic.
Il convient donc que la mise en œuvre d’un système de revue et de surveillance AMDS soit effectuée en
tenant compte:
— du risque pour la sécurité de chaque mode de défaillance;
— du taux de détérioration prévu pour chaque mode de défaillance;
— de la moyenne des temps de bon fonctionnement (MTBF) pour chaque mode de défaillance;
— des modes de défaillance secondaires/ultérieurs;
— des relations entre les modes de défaillance;
— du délai d’exécution requis pour la maintenance;
— de la disponibilité des pièces de rechange;
— de la fiabilité et de la disponibilité requises.
Il convient de procéder à une réévaluation continue lorsqu’une expérience a été acquise avec une nouvelle
installation ou lorsqu’une modification a été apportée.
4.4 Compte rendu des exigences de diagnostic
Il est recommandé de conserver la synthèse de l’étude préliminaire dans un «compte rendu des exigences de
diagnostic». Il convient normalement que ce compte rendu
a) présente la décomposition en composants adoptée pour la machine,
b) établisse la liste des défauts associés à ces composants,
c) indique les symptômes potentiellement observables pour chaque défaut,
d) nomme les descripteurs de surveillance d’état qui seront utilisés, et
e) indique la méthode et les paramètres utilisés pour le calcul des descripteurs.
Il se peut que les défauts critiques ne soient pas tous couverts par la surveillance d’état et, de ce fait, ne
puissent pas être diagnostiqués. C’est la raison pour laquelle il est fortement recommandé de mettre clairement
en évidence dans le compte rendu les défauts qui sont traités et ceux qui ne le sont pas. Il peut être utile de
réévaluer la valeur en ajoutant la capacité à détecter les défauts spécifiques.
Officiellement, le compte rendu des exigences de diagnostic peut être constitué de deux parties:
1) une description de la machine [correspondant aux éléments de liste a) et b) en 4.2]: identification, rôle
dans le procédé, composants, analyse de la criticité;
2) une analyse des modes de défaillance/symptômes [correspondant aux éléments de liste c) à i) en 4.2]:
modes de défaillance, symptômes, descripteurs et mesurages qui sont utilisés pour le diagnostic.
Le point b) peut être réalisé facilement à l’aide du tableau AMDS donné à l’Annexe A.
6 © ISO 2012 – Tous droits réservés
Il est également recommandé de calculer l’efficacité théorique du système de diagnostic. À cet effet, un critère
d’efficacité du système de diagnostic est proposé à l’Annexe B.
5 Éléments utilisés pour le diagnostic
5.1 Données de surveillance d’état
5.1.1 Mesurages
Tous les mesurages utilisés pour la surveillance de l’état conviennent généralement pour le diagnostic. Les
descripteurs sont préférés aux mesures brutes pour le diagnostic car ils offrent une plus grande sélectivité en
ce qui concerne les défauts.
À titre d’exemple, le Tableau 1 donne un ensemble de différentes mesures et différents paramètres utilisés
pour la surveillance et le diagnostic d’état d’une machine.
Tableau 1 — Exemple de mesures et paramètres utilisés pour le diagnostic
Caractéristiques Analyse de l’huile, qualité
Mécanique Électrique
de fonctionnement du produit et autres
Consommation d’énergie Dilatation thermique Intensité Analyse de l’huile
Rendement Position Tension Analyse des débris d’usure par
ferrographie
Température Niveau de fluide Résistance Dimensions du produit
Pression Température Inductance Propriétés physiques du produit
Thermographie IR Déplacement vibratoire Thermographie IR Propriétés chimiques du produit
Débit Thermographie IR Capacité — couleur
Vitesse vibratoire Champ magnétique — aspect visuel
Accélération vibratoire Résistance d’isolement — odeur
Bruit audible Décharge partielle — autres essais non destructifs
Ondes ultrasonores
5.1.2 Descripteurs
Les descripteurs peuvent être obtenus à partir du système de surveillance d’état, soit directement soit après le
traitement des mesures. Pour des raisons de sélectivité, les descripteurs sont souvent préférés aux mesures. Plus
les descripteurs sont sélectifs, plus les symptômes sont sélectifs et donc plus le diagnostic est aisé. La sélectivité
des descripteurs réduit le nombre d’hypothèses erronées lorsque des symptômes laissent supposer un défaut.
EXEMPLES Amplitude de la première harmonique du déplacement des vibrations de l’arbre, facteur de crête de
l’accélération des vibrations, indice d’acidité de l’huile, vitesse de rotation, facteur de dommage des paliers à roulement,
gradient de température sur une thermographie infrarouge.
5.1.3 Symptômes
Un symptôme peut s’exprimer dans les termes suivants.
a) Caractéristique de temps: la constante de temps de l’évolution du descripteur.
EXEMPLES 1 h; 10 jours; lent.
b) Type d’évolution et variation d’amplitude.
EXEMPLES Présence; absence; augmentation régulière; diminution; stabilité; > 10; < 200; évolution cyclique de
40 µm.
c) Descripteur: le descripteur utilisé.
EXEMPLES Température; première harmonique du déplacement des vibrations.
d) Emplacement: emplacement où le symptôme est observable sur la machine.
o o
EXEMPLES Ligne d’arbres au niveau du palier n 3 direction verticale; chaise de palier n 4; corps sous haute
o
pression (avant gauche); palier n 2.
e) Circonstances: conditions de fonctionnement dans lesquelles le symptôme est observé.
EXEMPLES Pendant la décélération; dans l’heure qui suit un démarrage à froid; à pleine puissance; en toutes
circonstances.
Lors de la préparation de la sélection des symptômes pour un défaut, il convient d’éviter de prendre deux ou
plusieurs symptômes pouvant être trop dépendants les uns des autres (hautement corrélés), car l’évaluation de
symptômes dépendants ne fournira pas plus d’informations et ne permettra donc pas au diagnostic de progresser.
EXEMPLES Évolution lente et régulière du premier vecteur harmonique du déplacement de l’arbre; la température du
palier est supérieure de 10 °C à la valeur habituelle dans des conditions nominales; variation instantanée de 2 mm/s de la
vitesse de vibration de la chaise de palier; évolution cyclique de la première harmonique du déplacement des vibrations
(> 10 µm, après une variation de la puissance développée par la machine); bruit inhabituel; couleur sombre de l’huile de
lubrification.
5.1.4 Défaut
Un défaut peut s’exprimer dans les termes suivants.
a) Machine: le nom ou l’identifiant de la machine.
o o
EXEMPLES Turbine de l’unité n 1; pompe d’alimentation en eau n 2 de la chaudière; BFW PU2; pompe de
o
circulation; broyeur de charbon n 5.
b) Composant: nom ou identifiant du composant de la machine sur lequel apparaît le défaut.
o o
EXEMPLES Palier n 3; arbre; piston; corps sous basse pression; joint d’étanchéité n 2.
c) Type de dégradation du composant de la machine (obligatoire).
EXEMPLES Jeu incorrect, fissures, déséquilibre, défaut d’alignement, ouverture de contacts.
d) Gravité: nombre entier, par exemple (défini en 4.3.3.3), représentant l’amplitude de la dégradation ou du
mode de défaillance.
5.1.5 Paramètres opérationnels
Les paramètres opérationnels sont souvent utilisés pour le diagnostic. Ils sont employés à la fois pour
— établir certains descripteurs, et
— établir les conditions de fonctionnement dans lesquelles apparaissent les symptômes (circonstances).
Il convient de prendre des précautions en ce qui concerne les paramètres opérationnels. Lorsqu’il s’agit d’un
descripteur ou qu’il entre dans le calcul d’un descripteur, le paramètre est une sortie. Il s’agit d’une entrée
lorsqu’il caractérise une condition de fonctionnement. Il convient d’en tenir compte afin d’éviter l’utilisation
d’une condition de fonctionnement comme descripteur. Par exemple, la température du corps d’une turbine
est un descripteur lorsque la surveillance et le diagnostic concernent le corps. Elle devient une condition de
fonctionnement en cas de surveillance du palier car elle a une incidence sur le travail du palier, mais n’est pas
descriptive des défauts du palier.
8 © ISO 2012 – Tous droits réservés
5.2 Données relatives à la machine
Pour le diagnostic, il est souvent nécessaire de connaître les données spécifiques de la machine. C’est le
cas, par exemple:
— pour les vibrations: données relatives à la cinématique des composants de la machine telles que vitesses
de rotation, nombre de dents des engrenages, fréquences caractéristiques des roulements à billes;
— pour l’analyse de l’huile: données relatives au circuit d’huile de la machine, débits, composition des métaux,
disposition et finesse des filtres;
— pour la thermographie: émissivité IR d’une surface.
Il convient de faire la distinction entre les données relatives aux techniques utilisées pour traiter les descripteurs
et les données relatives à la configuration de la machine. Il est important d’enregistrer les deux en vue du
diagnostic. Les données relatives à la configuration de la machine sont normalement enregistrées dans le
dossier de la machine, car il est préférable d’enregistrer les données machine relatives aux techniques de
surveillance de l’état dans les exigences relatives au diagnostic, lors de la spécification des descripteurs.
5.3 Historique de la machine
L’apparition d’un défaut peut être liée non seulement au fonctionnement, mais aussi à la maintenance de la
machine. Il se peut qu’un défaut ait été introduit pendant une remise en état ou dans une situation particulière.
Par conséquent, il est important de conserver un enregistrement de l’historique des défauts, de l’historique de
l’exploitation et de l’historique de la maintenance de la machine afin de tenir compte de ces faits pour le diagnostic.
6 Méthodes de diagnostic
6.1 Deux types de méthodes
Le processus de diagnostic est généralement déclenché par la détection d’une anomalie au cours d’une
surveillance de routine, d’une analyse de routine, d’une analyse aléatoire ou par la perception humaine. Cette
détection est effectuée en comparant les descripteurs actuels d’une machine à des valeurs de référence
(généralement appelées valeurs ou données de référence) choisies sur la base de l’expérience, des
spécifications du fabricant, des essais de mise en service, ou calculées à partir de données statistiques (par
exemple moyenne à long terme).
Il convient que le résultat possible d’un processus de diagnostic inclue un scénario dans lequel aucun défaut n’existe.
Deux méthodes principales peuvent être utilisées pour diagnostiquer l’état de la machine.
a) Méthodes basées sur les données (simple évaluation de tendance, réseau de neurones, reconnaissance
de formes, méthode statistique, méthode histographique de Pareto ou autres méthodes numériques).
Ces méthodes sont généralement automatisées, ne nécessitent pas de connaissances approfondies
du mécanisme de déclenchement et de propagation des défauts, mais exigent un apprentissage de
l’algorithme en utilisant un vaste ensemble de données de défauts observés.
b) Méthodes basées sur les connaissances, qui s’appuient sur une représentation explicite d’un
comportement ou de symptômes de défaut, par exemple par des modèles de défaut, des modèles de
comportement correct ou une description de cas.
Il est reconnu que ces méthodes peuvent se recouper et il est possible de développer des solutions
utilisant une combinaison de plusieurs méthodes.
Il convient de noter que, pour analyser l’intégralité du processus de modélisation à des fins de diagnostic, il
est également nécessaire de définir une «spécification d’observation». Cette spécification peut fournir une
procédure décrivant et interprétant les observations faites à partir des données acquises. Différents niveaux
de détail peuvent être nécessaires: par exemple comment le modèle d’observation doit traiter les descriptions
de l’évolution des paramètres, la forme, les informations liées au temps, les niveaux et corrélations, etc.
Les différents modèles pouvant être utilisés sont décrits de 6.2 à 6.4.
6.2 Lignes directrices générales pour la sélection de méthodes de diagnostic appropriées
Le choix de méthodes de diagnostic appropriées (voir Figure 2) dépend de:
— l’application ou l’équipement;
— l’utilisateur final de la méthode de diagnostic;
— la technique de surveillance;
— la complexité des connaissances devant être modélisées;
— la nécessité de disposer d’un modèle explicatif;
— la nécessité de procéder à un nouvel apprentissage du modèle;
— la disponibilité de données existantes associées à des défauts connus et au fonctionnement normal.
NOTE Lors de la conception initiale, il est très important d’étudier la manière de diviser le traitement de diagnostic
des défauts en traitement en ligne et traitement hors ligne, compte tenu des capacités logicielle et matérielle. Une fois
définis, il est important d’étudier la manière de les combiner.
D’autres lignes directrices sont données dans les Annexes C et D.
10 © ISO 2012 – Tous droits réservés
Figure 2 — Méthode générale pour choisir un modèle de diagnostic
6.3 Méthodes basées sur les données
6.3.1 Liste de méthodes
Le présent paragraphe présente plusieurs méthodes basées sur les données:
— analyse statistique des données et raisonnement basé sur des cas;
— réseaux de neurones;
— arbres de classification;
— forêts aléatoires (RF);
— régression logistique (LR);
— machines à vecteurs de support (SVM).
Il est à noter qu’il existe de nombreuses autres méthodes basées sur les données; celles présentées ici sont
simplement des exemples de référence des méthodes courantes.
Le principe de base de toutes les méthodes basées sur les données est d’utiliser le modèle pour classer
différentes conditions de fonctionnement d’une machine (normal, défaut un, défaut deux, etc.). Pour cela, le
modèle fait tout d’abord l’objet d’un apprentissage en se fondant sur les données préalablement enregistrées
dans chaque condition, puis il est alimenté par les nouvelles données à classer.
Les points forts et les points faibles communs à toutes les méthodes basées sur les données sont tout d’abord
décrits. Puis, pour chaque méthode, les paragraphes suivants détaillent le principe, donnent certaines lignes
directrices pour élaborer le modèle et indiquent si nécessaire les points forts et points faibles spécifiques.
6.3.2 Points forts et points faibles communs à toutes les méthodes basées sur les données
Comparées aux méthodes de diagnostic basées sur les connaissances, les méthodes basées sur les données
offrent l’avantage de ne pas nécessiter de connaissances approfondies du système à diagnostiquer.
De plus, elles n’imposent pas de contraintes quant au format des variables indépendantes. Elles peuvent être
dichotomiques (par exemple sous tension ou hors tension), catégoriques (par exemple état de la machine,
tel que «mise en température», «fonctionnement normal», «pleine puissance», «ralenti») ou continues (par
exemple températures, pressions, vitesses captées, etc.).
Ces types de modélisation présentent certains inconvénients pour le diagnostic des machines.
— Des phases d’apprentissage, d’étalonnage et éventuellement de réglage fin sont nécessaires avant
d’utiliser le modèle. Il peut être nécessaire de répéter ces phases si l’équipement ou son usage évolue de
manière significative ou lorsque de nouveaux cas sont rencontrés.
— Un nombre relativement important d’échantillons sans défaut et présentant des défauts identifiés est
nécessaire pour construire le modèle.
— Le modèle ne produit pas de diagnostic explicatif.
— L’apprentissage du modèle peut nécessiter une capacité de calcul relativement élevée.
Plusieurs méthodes (régression logistique, réseau de neurones, arbre de classification, forêt aléatoire et
SVM) sont mieux utilisées lorsque l’on ne dispose pas de formulation mathématique, mais plutôt d’une base
d’exemples obtenus par l’expérience ou la simulation (essais de qualité de type «réussite-échec», essais d’un
réacteur chimique, etc.).
6.3.3 Analyse statistique des données et raisonnement basé sur des cas
6.3.3.1 Description générale
Le principe est d’exploiter la similitude entre une situation observée et des cas déjà connus et résolus («l’état
actuel de l’équipement ressemble à d’autres cas»).
Un cas peut être décrit en utilisant les données fondamentales observées (unidimensionnelles ou
multidimensionnelles, tendances, formes, etc.) ou des données traitées (regroupées en symptômes).
Cette méthode identifie généralement dans la base de données un cas ou un ensemble de cas ressemblant
étroitement au cas que l’on souhaite diagnostiquer. Ces modèles nécessitent une phase d’apprentissage
basée sur un bon retour d’informations, c’est-à-dire plusieurs cas bien décrits.
6.3.3.2 Construction du modèle
La première étape consiste à identifier les données qui seront utilisées pour décrire un cas.
La deuxième étape consiste à choisir le type de similitude ou de mesure de parenté (couramment appelée
distance) et le mécanisme de classification qui supportera la ressemblance entre les cas.
Enfin, un étalonnage et un réglage fin éventuellement itératif du modèle interviennent pendant la période
d’apprentissage au cours de laquelle des cas connus sont soumis au système.
12 © ISO 2012 – Tous droits réservés
6.3.3.3 Points forts et points faibles spécifiques
Comparée aux autres méthodes basées sur les données, cette méthode exige que les cas soient bien
structurés et décrits.
6.3.4 Réseaux de neurones
6.3.4.1 Description générale
Un réseau de neurones (également connu en tant que réseau de neurones artificiels) est un modèle de
données statistiques non linéaire qui peut être utilisé pour modéliser des relations complexes. Les réseaux
de neurones sont des associations de nombreux processeurs élémentaires (neurones) dont le comportement
collectif approche une fonction donnée.
6.3.4.2 Construction du modèle
Un réseau de neurones doit subir une phase d’apprentissage au cours de laquelle le modèle est finement
réglé par l’examen de données normales et de données de défaut et la modification des pondérations internes
du modèle afin que la sortie du modèle corresponde à l’état des données d’entrée. Une fois le processus
d’apprentissage terminé, le réseau se comporte comme une «boîte noire», générant une sortie en rapport avec
l’état opérationnel de la machine (cohérente avec les données d’apprentissage) lorsque de nouvelles données
sont entrées.
6.3.5 Arbres de classification
6.3.5.1 Description générale
Les arbres de classification (Référence [9]) représentent une technique non paramétrique qui partitionne les
données, de manière récursive, en sous-ensembles ayant une plus grande pureté de classe (normal, défaut
un, défaut deux, etc.), en examinant toutes les variables et tous les fractionnements possibles au niveau
de chaque nœud, et en sélectionnant les meilleures variable et valeur individuelles pour le fractionnement.
Toutes les variables ne sont pas nécessairement utilisées pour partitionner les données et certaines variables
peuvent être utilisées plusieurs fois dans différents nœuds.
Les arbres développés jusqu’à atteindre une pureté de nœud de 100 % conduiront naturellement à un
surapprentissage. Pour éviter cela, une validation croisée peut être utilisée pour éliminer les branches
inférieures de l’arbre afin que le classifieur traite bien les nouvelles données. Ce processus est connu en tant
que «élagage».
6.3.5.2 Construction du modèle
Un arbre de classification doit subir une phase d’apprentissage, c’est-à-dire que l’algorithme doit construire
l’arbre, généralement jusqu’à la pureté totale, puis l’élaguer à sa profondeur optimale en utilisant une validation
croisée. Une fois les étapes d’apprentissage et d’élagage terminées, de nouvelles données peuvent être
introduites et classées à des fins de surveillance et de diagnostic.
6.3.6 Forêts aléatoires
6.3.6.1 Description générale
Une forêt aléatoire (RF, Référence [9]) est une méthode de classification non paramétrique qui applique un
ensachage (Référence [8]) à une variation des arbres de classification (Référence [9]). Un arbre de classification
standard est construit en fractionnant les données sur la meilleure de toutes les caractéristiques possibles au
niveau de chaque nœud. Pour la forêt aléatoire, seul un sous-ensemble choisi aléatoirement (toujours choisi
dans l’ensemble complet) de caractéristiques est éligible pour fractionner chaque nœud. Par ailleurs, chaque
arbre individuel est construit sur un échantillon de données d’amorçage. Un échantillon d’amorçage est créé à
partir d’un ensemble particulier de données en sélectionnant des cas au hasard avec remplacement. Chaque
échantillon d’amorçage de même taille est légèrement différent d’un autre. En utilisant la sélection au hasard
...










Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.