ISO 5479:1997
(Main)Statistical interpretation of data — Tests for departure from the normal distribution
Statistical interpretation of data — Tests for departure from the normal distribution
Interprétation statistique des données — Tests pour les écarts à la distribution normale
General Information
Buy Standard
Standards Content (Sample)
INTERNATIONAL
STANDARD
First edition
1997-05-I 5
Statistical interpretation of data - Tests for
departure from the normal distribution
In terpr&a tion s ta tistique des don&es - Tests pour /es &arts zi la
distribution normale
Reference number
IS0 5479:1997(E)
---------------------- Page: 1 ----------------------
IS0 5479:1997(E)
Page
Contents
1
.............................................................................................
1 Scope
1
2 Normative references .
2
................................................................
3 Definitions and symbols
3
..........................................................................................
4 General
4
5 Graphical method .
11
.............................................................................
6 Directional tests
15
(multidirectional test). .
7 Joint test using Jbl and b2
16
8 Omnibus tests .
.............................. 22
9 Joint test using several independent samples
24
Statistical tables .
10
Annexes
............................................ 32
A Blank normal probability graph paper
33
Bibliography .
B
0 IS0 1997
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced
or utilized in any form or by any means, electronic or mechanical, including photocopying and
microfilm, without permission in writing from the publisher.
International Organization for Standardization
Case postale 56 l W-1 211 Geneve 20 l Switzerland
Internet central@iso.ch
x.400 c=ch; a=400net; p=iso; o=isocs; s=central
Printed in Switzerland
ii
---------------------- Page: 2 ----------------------
@ IS0 IS0 5479:1997(E)
Foreword
IS0 (the International Organization for Standardization) is a worldwide
federation of national standards bodies (IS0 member bodies). The work of
preparing International Standards is normally carried out through IS0
technical committees. Each member body interested in a subject for which
a technical committee has been established has the right to be rep-
resented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. IS0
collaborates closely with the International Electrotechnical Commission
(I EC) on all matters of electrotechnical standardization.
Draft International Standards adopted by the technical committees are
circulated to the member bodies for voting. Publication as an International
Standard requires approval by at least 75 % of the member bodies casting
a vote.
International Standard IS0 5479 was prepared by Technical Committee
lSO/TC 69, Applications of statistical methods, Subcommittee SC 6,
Measurement methods and results.
Annexes A and B of this International Standard are for information only.
---------------------- Page: 3 ----------------------
IS0 5479:1997(E) 0 IS0
Introduction
Many of the statistical methods recommended in International Standards,
such as those described in IS0 2854[l], are based on the assumption that
the random variable(s) to which these methods apply are independently
distributed according to a normal distribution with one or both of its
parameters unknown.
The following question therefore arises. Is the distribution that is
represented by the sample sufficiently close to the normal distribution that
the methods provided by these International Standards can be used
reliably?
There is no simple yes or no answer to this question which is valid in all
cases. For this reason a large number of “tests of normality” have been
developed, each of which is more or less sensitive to a particular feature of
the distribution under consideration; e.g. asymmetry or kurtosis.
Generally the test used is designed to correspond to a predetermined a
priori risk that the hypothesis of normality is rejected even if it is true (error
of the first kind). On the other hand, the probability that this hypothesis is
not rejected when it is not true (error of the second kind) cannot be
determined unless the alternative hypothesis (i.e. that which is opposed to
the hypothesis of normality) can be precisely defined. This is not possible
in general and, furthermore, it requires computational effort. For a distinct
test, this risk is particularly large if the sample size is small.
---------------------- Page: 4 ----------------------
IS0 5479:1997(E)
INTERNATIONAL STANDARD @ IS0
Statistical interpretation of data - Tests for departure from
the normal distribution
1 Scope
1.1 This International Standard gives guidance on methods and tests for use in deciding whether or not the
hypothesis of a normal distribution should be rejected, assuming that the observations are independent.
1.2 Whenever there are doubts as to whether the observations are normally distributed, the use of a test for
departure from the normal distribution may be useful or even necessary. In the case of robust methods, however
(i.e. where the results are only altered very slightly when the real probability distribution of the observations is not a
normal distribution), a test for departure from the normal distribution is not very helpful. This is the case, for
example, when the mean of a single random sample of observations is to be checked against a given theoretical
value using a t-test.
1.3 It is not strictly necessary to use such a test whenever one refers to statistical methods based on the
hypothesis of normality. It is possible that there is no doubt at all as to the normal distribution of the observations,
whether theoretical (e.g. physical) reasons are present which confirm the hypothesis or because this hypothesis is
deemed to be acceptable according to prior information.
1.4 The tests for departure from the normal distribution selected in this International Standard are primarily
intended for complete data, not grouped data. They are unsuitable for censored data.
1.5 The tests for departure from the normal distribution selected in this International Standard may be applied
either to observed values or to functions of them, such as the logarithm or the square root.
1.6 Tests for departure from the normal distribution are very ineffective for samples of size less than eight.
Accordingly, this International Standard is restricted to samples of eight or more.
2 Normative reference
The following standard contains provisions which, through reference in this text, constitute provisions of this
International Standard. At the time of publication, the edition indicated was valid. All standards are subject to
revision and parties to agreements based on this International Standard are encouraged to investigate the
possibility of applying the most recen% edition of the s%andard indicated below. Members of IEC and IS0 maintain
registers of currently valid international Standards
IS0 3534-I : 1993, Statistics - Vocabulary and symbols - Part 7: Probability and general statistical terms.
---------------------- Page: 5 ----------------------
IS0 5479:1997(E)
@ IS0
3 Definitions and symbols
3.1 Definitions
For the purposes of this International Standard, the definitions given in IS0 3534-l apply.
32 . Symbols
coefficient of the Shapiro-Wilk test
ak
A auxiliary quantity for the Epps-Pulley test
empirical kurtosis
b2
empirical skewness
61
lr
B auxiliary quantity for the Epps-Pulley test
E expectation
auxiliary quantity for the joint test using several independent samples
Gi
h number of consecutive samples
null hypothesis
HO
alternative hypothesis
HI
k within the sample, arranged in non-decreasing order, the number of the observed value x
central moment of order-j of the sample
mj
n sample size
probability associated with the p-quantile of a distribution
P
P probability
probability associated with X(k)
Pk
s auxiliary quantity for the Shapiro-Wilk test
T test statistic
test statistic of the Epps-Pulley test
TEP
antile of the standardized normal distribution
P-w
%
auxi iary quantity for the join% test using several independent samples
9
W test statistic of the Shapiro-Wilk test
auxi iary quantity for the joint test using several independent samples
wj
x value of X
X
random variable
jfh value in the sample, arranged in non-decreasing order
X(j)
kfh value in the sample, arranged in non-decreasing order
+I
F arithmetic average
a significance level
2
---------------------- Page: 6 ----------------------
@ IS0 IS0 5479:1997(E)
probability of an error of the second kind
P
kurtosis of the population
P2
p2--3 excess of the population
1 skewness of the population
AF
auxiliary quantity for the joint test using several independent samples
Y
coefficient of the joint test using several independent samples
77 n 1
6 auxiliary quantity for the joint test using several independent samples
coefficient of the joint test using several independent samples
4n)
& auxiliary quantity for the joint test using several independent samples
coefficient of the joint test using several independent samples
%)
expectation
P
variance of the population
P2
central moment of the third order of the population
P3
central moment of the fourth order of the population
P4
standard deviation of the population (=
P2)
lr
4 General
4.1 There are several categories of tests for departure from normality. In this International Standard, graphical
methods, moment tests, regression tests and characteristic function tests are considered. Chi-squared tests are
appropriate for grouped data only but, because grouping results in a loss of information, they are not considered in
this International Standard.
4.2 If no additional information about the sample is available, it is recommended first to do a normal probability
plot; i.e. to plot the cumulative distribution function of the observed values on normal probability graph paper
consisting of a system of coordinate axes where the cumulative distribution function of the normal distribution is
represented by a straight line.
This method, which is described in clause 5, allows one to “see” immediately whether the distribution observed is
close to the normal distribution or not. With this additional information it can be decided whether to carry out a
directional test, or to carry out either a regression test or a characteristic function test, or no test at all. In addition,
although such a graphical representation cannot be considered as a rigorous test, the summary information that it
provides is an essential supplement to any test for departure from the normal distribution. In the case of rejection
of the null hypothesis it is often possible to envisage by this means the type of alternative that might be applicable.
4.3 A test for departure from the normal distribution is a test of the null hypothesis that the sample consists of n
independent observations coming from one and the same normal distribution.
It consists of the calculation of a
function T of the observations, which is called the test statistic. The null hypothesis of a normal distribution is then
not rejected or rejected depending on whether or not the value of T lies within a set of values near to the expected
value that corresponds to the normal distribution.
---------------------- Page: 7 ----------------------
IS0 5479:1997(E) @ IS0
4.4 The critical region of the test is the set of values of T that leads to the rejection of the null hypothesis. The
significance level of the test is the probability P of obtaining a value of T within the critical region when the null
hypothesis is correct. This level gives the probability of erroneously rejecting the null hypothesis (error of the first
kind).
The boundary of the critical region is (or, in the case of a two-sided test, the boundaries of the critical region are)
the critical value(s) of the test statistic.
4.5 The power of the test is the probability of rejecting the null hypothesis when it is incorrect A high power
kind).
corresponds to a low probability of not rejecting the null hypothesis erroneously (error of the second
It should be emphasized that the power of a test (i.e. for a given situation, the probability that the nu I hypothesis of
a normal distribution will be rejected if it is wrong) increases as the number of observations increases. For
example, a departure from the normal distribution which would become apparent when using a test for departure
from the normal distribution on a large sample might not be detected by the same test if there were fewer
observations.
4.6 A distinction is made between two categories of tests for departure from the normal distribution. When the
form of departure from the normal distribution is specified in the alternative hypothesis, then the test is a
directional test. However, when the form of departure from the normal distribution is not specified in the
alternative hypothesis, the test is an omnibus test.
In a directional test, the critical region is determined in such a way that the power of the test reaches its maximum
value. In an omnibus test, it is necessary to divide the critical region in such a way that the critical region consists
of those values of the test statistic which lie far away from the expected value.
If assumptions are present about the type of departure from the normal distribution, i.e. when a distribution is
envisaged whose asymmetry or kurtosis is different from that of the normal distribution, a directional test should
be applied, because its power is greater than the power of an omnibus test.
Note that a directional test is essentially one-sided. In the case of asymmetry, for example, it centres either
4.7
on positive asymmetry or on negative asymmetry. However, when several alternatives are considered jointly, the
test is multidirectional. This is the case particularly when a non-null asymmetry and a kurtosis different from that of
the normal distribution are considered together.
4.8 Tables 8 to 14 and figure 9 allow the tests to be performed for the most usual levels of a; i.e. a = O,O5 and
a = 0,Ol. The level of significance has to be stipulated before the test is performed. Note that a test may result in
the rejection of the null hypothesis at the 0,05 level and the non-rejection of this same hypothesis at the 0,Ol level.
4.9 During computation of test statistics, it is necessary to use at least six significant digits. Subtotals, inter-
mediate results and auxiliary quantities shall not be rounded to less than six significant digits.
5 Graphical method
5.1 The cumulative distribution function of the observed values is plotted on normal probability graph paper. On
this paper, one of the axes (in this International Standard it is the vertical axis) is non-linearly scaled according to
the area under the standardized normal distribution function and is marked with the corresponding values of the
cumulative relative frequency. The other axis is linearly scaled for the ordered values of X. The cumulative
distribution function of the variable X then approximates to a straight line.
Sometimes these two axes are interchanged with each other Furthermore, if a normalizing transformation of the
variable X is made, the linear scale may be replaced by a logarithmic, quadratic, reciprocal or other scale.
Figure 1 gives an example of normal probability graph paper. On the vertical axis the values of the cumulative
relative frequency are given as percentages, while the horizontal axis has an arbitrary linear scale.
4
---------------------- Page: 8 ----------------------
IS0 5479:1997(E)
@ IS0
A sheet of blank normal probability graph paper is provided in annex A.
If a plot on this paper gives a set of points that appears to be scattered around a straight line, this provides crude
support for the assumption that the sample can reasonably be regarded as having come from a normal distribution.
However, if there is a systematic departure from the straight line, the plot often suggests the type of distribution
to be taken into consideration.
The importance of this approach is that it easily provides visual information on the type of departure from the
normal distribution.
If the graph indicates that the data come from a shaped distribution (e.g. if the graph of the cumulative distribution
function is as shown in figure 5 or 6), a transformation of the data might result in a normal distribution.
If the graph indicates that the data do not come from a simple homogeneous distribution, but rather from a mixture
of two or more homogeneous subpopulations (e.g. if the graph of the cumulative distribution function is as shown
in figure 7), it is recommended that the subpopulations be identified and the analysis on each subpopulation be
continued separately.
It should be kept in mind that such a plot is in no way a test for departure from the normal distribution in the strict
sense. In the case of small samples, pronounced curves may occur for normal distributions, whilst for large
samples slight curves may indicate non-normal distributions.
5.2 The graphical procedure consists of arranging the observed values (X(J), x(2), . . . ,X(n)) in non-decreasing order,
and then plotting
Pk = (k - 3/8)/(n + l/4) . . .
(1)
against x(k) on normal probability graph paper.
NOTE 1 Commonly used alternatives to equation (1) are
Pk = (k - 1/2)/n
Pk = k/(n + 1)
These are poorer approximations to the normal distribution function of the expected order statistics, F [E(X& and their use is
not recommended.
5.3 An example of how normal probability graph paper is used is shown in figure 2.
---------------------- Page: 9 ----------------------
IS0 5479:1997(E)
s
99,99
ii
!i
CT
aJ I I I I I I I I I I I I I I I i I I
c
%
99,9
aJ
>
.-
c
99,0
m
z
L
:
.-
c 99
m
3
98
E
975
I=
IlIlllIlIIIIIIIIIIIIIIIIlIlIiiiiiiiiiiiiiiiiiiiiiiiiiiiTiii
95
90
84
80
30
60
50
40
30
20
16
10
II I III I III I I/III I I I1 I IIIII
I IIII I I
11 1 III 1 4’111 I I I I I I
I IIll I I I
I IIIII III iiiiii ii riiirii iiii iii i1 iiiiiiii I I I II11 I II I1
5
11 11 1 I!!! ! I! !! I j ! I [! ! I&! ! I! ii i i i j j i [iii i ii i i j j i i i i i i j i i i i
IlllllllllllllllllIlll~lIllIllIlllllllIlIlllllllllIlllll~T~r----------------------
I I I, / 1 I I, 1 I I I,, , ,
2s
I I II i iI i i iii i i
2
1
05
02
00'1
0,os
1 I I
0,Ol
p - 1,960
P-d P p + 1,96c
P+C
Figure 1 - Annotated normal probability graph paper
---------------------- Page: 10 ----------------------
8
5 99,99
. I , I
,,,,,,,,,,,,,,,,,I,,,,,,,,, ~~~~~~,~,~~,~~,~~~,,IIlI
I! !! !!!!
llllllllllllllll1llIII I II
5
s
1 99,9
F 99,0
a-
t
ru
z 99
: 90
I!! f I!! I i i 1; 1 iii i / iiiiiiiiiiiiiiiii
z=
2 95
s 90
00
70
60
50
40
30
20
10
5
I I i i j j i i i j i i 1 i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 1
2
1
OS
02
Otl
I I I I II I ” ” ” “‘I
II I I III1 II II II I II I III I I I Ii
0,os
I!ll!
-
lIIIIIIIl WI IllI IllI II II 111 c
I-I-1 1 I I I I I I I I I I I I I I I
0,Ol I I I
2 lg (IO XI
1 IS
6 7 0 9 IO II 12 x 0 OS
0 1 2 3 4 5
b)
a)
---------------------- Page: 11 ----------------------
OS0 5479:1997(E) @ IS0
Table 1 shows the values x(k) in non-decreasing order of the result of a series of 15 independent rotating-bend
fatigue tests.
Table 1 - Results, x(k) of a series of 15 rotating-bend fatigue tests
and corresponding values of Ig (IO x(k))
p k-318
=-
k
Ig(l Ox(,))
X(k)
n+1/4
1 0,041 0,200 0,301
2 0,107 0,330 0,519
0,172 0,445 0,648
3
4 0,238 0,490 0,690
0,303 0,780 0,892
5
6 0,369 0,920 0,964
0,950
7 0,434 0,978
8 0,500 0,970 0,987
9 0,566 1,040 1,017
0,631 1,710
10 1,233
11 0,697 2,220 1,346
12 0,762 2,275 1,357
13 0,828 3,650 1,562
14 0,893 7,000 1,845
8,800
15 0,959 1,944
NOTE 2 In table 1 and the following examples, the units for the observations are omitted because they are not relevant for
the tests in this International Standard.
By associating the probability
Pk = (k - 3/8)/(n + l/4)
with the kth smallest ~(~1, the series of points shown in figure 2a) is obtained. It is immediately seen from
this graph that these points do not form a straight line. However, if x(k) is replaced by lg(10 x(~)), the new graph
[figure 2b)] leads to a series of points which this time lie acceptably close to a straight line.
The hypothesis of a normal distribution of the logarithm of the observations therefore seems adequate.
5.4 It should be noted that extreme observed values have greater variance than middle values. Therefore, and
since the scale for the cumulative relative frequency widens towards the extremes, a few values at either end of
the cumulative distribution which distinctly depart from the straight line defined by the middle values cannot be
regarded as indicators of departure from the normal distribution.
The larger the sample size, the more reliable are the conclusions that can be derived from the shape of the graph.
If the graph of the cumulative distribution function of the observed values is such that the large values tend to be
well below the straight line defined by the other values, a transformation such as
y = log x
or
Y=&
will generally lead to a graph that conforms more to a straight line [see figure 2b) and figure 51.
The upper parts of figures 3 to 7 show the cumulative distribution function in comparison with the corresponding
density function shown in the lower part of each figure.
---------------------- Page: 12 ----------------------
@ IS0 IS0 5479:1997(E)
If the graph of the cumulative distribution function of the observed values is as shown in figure 3 or 4, the
corresponding frequency distribution is of kurtosis in default (platykurtic) or of kurtosis in excess (leptokurtic),
respectively.
The graphs of the cumulative distribution functions shown in figures 5 and 6 correspond to a density function with
positive skewness and negative skewness respectively.
Figure 7 shows the cumulative distribution function and the density function of a superposition of two different
density functions.
s
SI
U
: 98
G 98
z
i%
aJ
aJ
k
k
?
!z
5 84
g 84
A
aJ
G
L
L
F
.- ?
.-
% 50
Tii 50
16
16
Figure 3 - Density function with Figure 4 - Density function with
kurtosis in default kurtosis in excess
---------------------- Page: 13 ----------------------
IS0 5479:1997(E) @ IS0
G
L
z
it
.-
.-
2 5o
$ 5o
E
E
lz
3
16
16
2
1
X
X
Figure 5 - Density function with Figure 6 - Density function with
positive skewness negative skewness
10
---------------------- Page: 14 ----------------------
@ IS0
IS0 5479:1997(E)
:
gj a4
”
L
aJ
>
.-
16
2
Figure 7 - Superposition of two different
density functions
6 Directional tests
6.1 General
6.‘Ml The directional tests considered here concern solely the characteristics either of skewness or of kurtosis
of the distribution of observations. They are based on the fact that in the case of a normal random variable x with
mean ,U = E(X), the central moment of the third order is
p3 = E[(X-/d31 = 0
. . . (2)
the standardized central moment of the third order is
. . .
(3)
and the standardized central moment of the fourth order is
P2 =PdPz2 =3
. . .
(4)
where
,Uz=mx - @*I
. . .
(51
p4=EHX- p141
. . . (6)
11
---------------------- Page: 15 ----------------------
IS0 5479:1997(E)
is the skewness of the population and may be greater than, equal to, or less than zero;
is the kurtosis of the population and is always positive;
p2 - 3 is the excess of the population;
the inequality p2 >(&)'+I always holds.
6.1.2 In a skewness test, the alternative hypothesis is either
H1:p3>0
or, equivalently,
which means positive skewness (see figure 5), or
or, equivalently,
l
Jp
which means negative skewness (see figure 6).
Generally, a d istribution wit h posit ive skewness has a h igher dispersion a mongst the high values of the variable
than amongst the low ones; the co ntrary is the case for n egative skewness
6.7.3 In a kurtosis test, the alternative hypothesis is either
Hl:P2 > 3
which means a kurtosis in excess (leptokurtic density function) (see figure 4), or
Hl:P2 < 3
which means a kurtosis in default (platykurtic density function) (see figure 3).
Compared with the normal distribution, a distribution with kurtosis in excess tends to have a preponderance of
values of the variable both close to the average and towards both extremes. The contrary is the case for a kurtosis
in default.
6.1.4 The use of a directional test is justified only when there is specific information about the way in which the
real distribution may differ from the normal distribution This information may come from the physical nature of the
data or the kind of disturbance that may affect the generating process.
For example, the fact that a variable is non-negative, with a mean close to zero in comparison with the value of the
standard deviation, may be a physical reason for positive skewness of the real distribution. Similarly, any
disturbance in a generating process that produces a mixture of normal populations of the same mean but of
different variances results in a non-normal distribution with p2 > 3.
In any case, the choice of a directional test should be based on general considerations regarding the nature
6.1.5
of the observations or the process that produces them and not on the particular form of the distribution of the
values observed. In this latter case, only the result of an omnibus test can be considered to be objective.
12
---------------------- Page: 16 ----------------------
IS0 5479:1997(E)
@ IS0
If Xl, x2, . . . . xn designates the series of observations, then
1
-
. . . (7)
3
c
n
i
I
- X)’
=-
. . .
(8)
(3
mi n
c
i
wherej = 2, 3, 4
and the test statistics for skewness and kurtosis respectively are the quantities
m3
=-
. . .
(9)
bl
II-
3/Z
m2
and
m4
=-
. . .
(10)
k2
2
m2
6.2 Directional test for skewness using ,/&
> 8; however, for practical reasons, table 8 is limited to y2 s 5000.
This test is applicable for y1
If the alternative hypothesis consists of positive skewness, the test should be only if m3 > 0. On the
carried out
other hand, if the alternative hypothesis consists of negative skewness, the test should be carried out only if
m3<0.
In the two cases of skewness, the conclusion is in favour of the rejection of the null hypothesis at the significance
level a if the statistic I,/&1 exceeds the p-quantile for p = I- a.
Table 8 shows for this test statistic the p-quantile for p = I- a where a = 0,05 and a = 0,Ol
and for the sample size ~2 = 8(1)10,12,15(5)50(10)100(25)200(50)1000(200)2000(500)5000.
EXAMPLE 1
An example of the use of the directional test for skewness using ,/& is as follows. Table 2 gives 50
independent measurements of the depth of the sapwood in pieces of wood intended for use as telegraph poles.
As the depth of sapwood is a characteristic having essentially non-negative values close to zero, positive
skewness may be assumed. It is therefore necessary to perform the appropriate directional test with the
alternative hypothesis
Thus, from the observed values listed in table 2, the following are calculated:
T = (I,25 + I,35 -I- 1.e + 5,10)/50 = 2,873
+ (5,lO - 2,873)2]/50 = Q,937 921
= [(I,25 - 2,873)2 -i- . . .
m2
= [(I,25 - 2,873)" + . . . + (5,lO - 2,873)3]/50 = 0,254 559
m3
13
---------------------- Page: 17 ----------------------
@ IS0
IS0 5479:1997(E)
Hence
m3
= 3/2 = 0,280
bl
lr
m2
For the significance level a = 0,05, i.e. p = 1 - a = 0,95, and y1 = 50, the critical value of the test statistic is 0,53
t us the null hypothesis of a normal distribution is
(see table 8). This value is greater than the calculated I,/&1 ; h
not rejected at the significance level chosen.
Table 2 - Depth of sapwood
I,25 2,05 2,60 3,lO 4,00
2,60
I,35 2,lO 3,15 4,00
I,40 2,15 2,70 3,15 4,05
I,50 2,15 2,75 3,20 4,05
2,15 2,75 3,30
I,55 4,lO
I,60 2,20 2,80 3,45 4,20
2,25 2,95
I,75 3,50 4,45
I,75 2,35 2,95 3,50 4,50
I,85 2,40 3,00 3,80 4,70
2,55 3,05 3,90 5,lO
I,95
NOTE - Series arranged according to
the non-
decreasing values of 50 observations.
I
6.3 Directional test for kurtosis using b2
This test is applicable for ~2 2 8. , however for practical reasons, table 9 is limited to ~1 G 5 000.
I
In a test for kurtosis in excess, the alternative hypothesis is
The null hypothesis shall be rejected at the predetermined significance level of, for example, a = 0,05 or 0,Ol if the
calculated value b2 exceeds the critical value of the test statistic corresponding to the p-quantile for p = 1 - a =
0,95 or p = 1 - a = 0,99 and the sample size ~2.
In a test for kurtosis in default, the alternative hypothesis is
H1: p2 < 3
The null hypothesis shall be rejected at the predetermined significance level of, for example, a = 0,05 or 0,Ol if the
calculated value b2 is less than the critical value of the test statistic corresponding to the p-quantile for p = a = O,O5
= cd = 0,Ol and the sample size ~2.
OrP
Table 9 shows the critical values of the test statistic &2 for p = O,Ol, 0,05, 0,95 and 0,99 and the sample size
n = 8( 1 )I 0,12,15(5)50(25)150(50)1000(200)2000(500)5000.
EXAMPLE 2
An example of the use of the directional test for kurtosis using 62 is as follows. Table 3 shows a series of 50
independ
...
NORME
INTERNATIONALE
Première édition
1997-05-I 5
Interprétation statistique des données -
Tests pour les écarts à la distribution
normale
Statistical interpretation of data - Tests for departure from the normal
distribution
Numéro de référence
BS0 5479:1997(F)
---------------------- Page: 1 ----------------------
IlSO 5479:1997(F)
Page
Sommaire
................................................................... 1
Domaine d’application
1
.................................................................
Références normatives
......................... 2
Définitions et symboles .
.................................................................................... 3
Généralités
................... 4
....................................................
l’vléthode graphique
........................................................................ 11
Tests directionnels
15
(test multidirectionnel) . . . . . . . . . . . . . . . .
Test conjoint utilisant & et !II~
16
Tests omnibus .
8
.......... 22
9 Test conjoint utilisant plusieurs échantillons indépendants
24
Tables statistiques .
10
Annexes
......................... 32
A Feuille de papier quadrillé de probabilité normale
33
Références bibliographiques .
B
0 60 1997
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publi-
cation ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun pro-
cédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l’accord
écrit de l’éditeur.
Organisation Internationale de normalisation
Case postale 56 l CH-l 211 Geneve 20 l Suisse
lnternet central@iso.ch
c=ch; a=400net; p=iso; o=isocs; s=central
x.400
Imprimé en Suisse
ii
---------------------- Page: 2 ----------------------
ISO 5479:1997(F)
@ ISO
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération
mondiale d’organismes nationaux de normalisation (comités membres de
I’ISO). L’élaboration des Normes internationales est en général confiée aux
comités techniques de I’ISO. Chaque comité membre intéressé par une
étude a le droit de faire partie du comité technique créé à cet effet. Les
organisations internationales, gouvernementales et non gouvernemen-
tales, en liaison avec I’ISO participent également aux travaux. L’ISO
collabore étroitement avec la Commission électrotechnique internationale
(CEI) en ce qui concerne la normalisation électrotechnique.
Les projets de Normes internationales adoptés par les comités techniques
sont soumis aux comités membres pour vote. Leur publication comme
Normes internationales requiert l’approbation de 75 % au moins des
comités membres votants.
La Norme internationale ISO 5479 a été élaborée par le comité technique
lSO/TC 69, Application des méthodes statistiques, sous-comité SC 6,
Méthodes et résultats de mesure.
Les annexes A et B de la présente Norme internationale sont données
uniquement à titre d’information.
. . .
III
---------------------- Page: 3 ----------------------
ISO 5479:1997(F) 0 ISO
Introduction
De nombreuses méthodes statistiques recommandées dans les Normes
internationales, telles que celles qui sont décrites dans I’ISO 2854[‘], sont
fondées sur l’hypothèse que la (les) variable(s) aléatoire(s) à laquelle
(auxquelles) ces méthodes s’appliquent sont distribuées indépendamment
selon une distribution normale avec un ou deux de ses paramètres
inconnus.
La question suivante se pose alors: la distribution représentée par I’échan-
tillon est-elle suffisamment proche de la distribution normale pour que les
méthodes données par ces Normes internationales puissent être valable-
ment utilisées?
II n’y a pas de réponse simple par oui ou non à cette question qui soit
valable dans tous les cas. Pour cette raison, un grand nombre de ((tests de
normalité)) ont été mis au point, dont chacun est plus ou moins sensible à
un aspect particulier de la distribution en cause; par exemple l’asymétrie
ou l’aplatissement.
En général, le test utilisé est conçu pour correspondre à un risque prédé-
terminé a priori que l’hypothèse de normalité est rejetée même si elle est
vraie (erreur de première espèce). D’autre part, la probabilité que cette
hypothèse n’est pas rejetée alors qu’elle n’est pas vraie (erreur de
deuxième espèce) ne peut être déterminée à moins que l’hypothèse
alternative (c’est-à-dire celle qui est opposée à l’hypothèse de normalité)
ne puisse être définie avec précision. Cela n’est pas possible en général et,
de plus, nécessite des calculs complémentaires. Pour un test donné, ce
risque est particulièrement élevé si la taille d’échantillon est faible.
---------------------- Page: 4 ----------------------
NORME INTERNATIONALE @ Iso ISO 5479:1997(F)
Interprétation statistique des données - Tests pour les
écarts à la distribution normale
1 Domaine d’application
1.1 La présente Norme internationale donne des lignes directrices concernant des méthodes et des tests utilisés
pour décider s’il convient ou non de rejeter l’hypothèse de distribution normale, en supposant que les observations
sont indépendantes.
1.2 Chaque fois qu’il y a doute sur la normalité de la distribution des observations, l’emploi d’un test d’écart à la
distribution normale peut être utile ou même nécessaire. Cependant, dans le cas de méthodes robustes (c’est-à-
dire où les résultats ne sont que très légèrement modifiés quand la véritable distribution des observations n’est
pas une distribution normale), un test d’écart à la distribution normale n’est pas d’une grande aide. C’est le cas, par
exemple, quand la moyenne d’un échantillon aléatoire unique d’observations doit être comparée à une valeur
théorique donnée en utilisant un test t.
1.3 II n’est pas strictement nécessaire d’utiliser un test chaque fois qu’on se réfère à des méthodes statistiques
fondées sur l’hypothèse de normalité. II est possible qu’il n’existe aucun doute quant à la normalité de la
distribution des observations, soit qu’il y ait des raisons théoriques (par exemple physiques) qui confirment cette
hypothèse, ou parce que cette hypothèse est réputée acceptable selon une information antérieure.
1.4 Les tests d’écart à la distribution normale, sélectionnés dans la présente Norme internationale, sont
principalement destinés à des données complètes, et non à des données groupées. Ils ne sont pas adaptés pour
des données tronquées.
1.5 Les tests d’écart à la distribution normale sélectionnés dans la présente Norme internationale peuvent être
appliqués soit aux valeurs observées ou à des fonctions de celles-ci, telles que le logarithme ou la racine carrée.
1.6 Les tests d’écart à la distribution normale sont très inefficaces pour des échantillons de taille inférieure à huit.
En conséquence, la présente Norme internationale est limitée à des échantillons de taille égale ou supérieure à
huit.
2 Référence normative
La norme suivante contient des dispositions qui, par suite de la référence qui en est faite, constituent des
dispositions valables pour la présente Norme internationale. Au moment de la publication, l’édition indiquée était en
vigueur. Toute norme est sujette à révision et les parties prenantes des accords fondés sur la présente Norme
internationale sont invitées à rechercher la possibilité d’appliquer l’édition la plus récente de la norme indiquée ci-
après. Les membres de la CEI et de I’ISO possèdent le registre des Normes internationales en vigueur à un
moment donné.
ISO 3534-l :1993, Statistique - Vocabulaire et symboles - Partie 1: Probabilité et termes statistiques généraux.
1
---------------------- Page: 5 ----------------------
ISO 5479:1997(F)
@ ISO
3 Définitions et symboles
3.1 Définitions
Pour les besoins de la présente Norme internationale, les définitions données dans NS0 3534-l s’appliquent.
.
32 Symboles
coefficient du test Shapiro-Wilk
ak
A quantité auxiliaire pour le test d’Epps-Pulley
aplatissement empirique
b2
asymétrie empirique
h
Ar
B quantité auxiliaire pour le test d’Epps-Pulley
E espérance mathématique
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
Gj
h nombre d’échantillons successifs
hypothèse nulle
Ho
hypothèse alternative
HI
k dans l’échantillon arrangé en ordre non décroissant, nombre de valeurs x observées
moment centré d’ordre j de l’échantillon
mj
n taille de l’échantillon
probabilité associée au quantile d’ordre p de la distribution
P
P probabilité
probabilité associée à X(k)
Pk
S quantité auxiliaire pour le test de Shapiro-Wilk
T statistique de test
statistique de test d’Epps-Pulley
TEP
quantile d’ordre p de la distribution réduite
UP
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
vj
W statistique de test de Shapiro-Wilk
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
wj
x valeur de X
X variable aléatoire
Oème valeur observée de l’échantillon arrangé en ordre non décroissant
9
kème valeur observée de l’echantillon arrangé en ordre non decroissant
moyenne arithmétique
niveau de signification
2
---------------------- Page: 6 ----------------------
ISO 5479:1997(F)
@ os0
probabilité de l’erreur de seconde espèce
P
aplatissement de la population
P2
excès de la population
P2 - 3
asymétrie de la population
1
fi
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
Y
coefficient du test conjoint utilisant plusieurs échantillons indépendants
n
ri)
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
6
coefficient du test conjoint utilisant plusieurs échantillons indépendants
44
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
E
coefficient du test conjoint utilisant plusieurs échantillons indépendants
9n)
espérance mathématique
P
moment centré du deuxième ordre (variante) de la population
P2
moment centré du troisième ordre de la population -
P3
moment centré du quatrième ordre de la population
P4
écart-type de la population (= &)
0
4 Généralités
4.1 II y a plusieurs catégories de tests d’écart à la normalité. Dans la présente Norme internationale, sont traitées
les méthodes graphiques, les tests de moments, les tests de régression et les tests de fonction caractéristique.
Les tests de Chi-carré sont appropriés pour des données groupées seulement mais, comme le groupement des
résultats entraîne une perte d’information, ces tests ne sont pas traités dans la présente Norme internationale.
4.2 Si on ne dispose pas d’autre information sur l’échantillon, il est recommandé de faire en premier lieu un
graphique de probabilité normale; c’est-à-dire de reporter la fonction cumulative de distribution des valeurs
observées sur un papier quadrillé de probabilité normale, consistant en un système d’axes de coordonnées où la
fonction cumulative de distribution de la distribution normale est représentée par une droite.
Cette méthode, qui est décrite dans l’article 5, permet de ((voir)) immédiatement si la distribution observée est
proche ou non de la distribution normale. Avec cette information additionnelle, on peut décider s’il est
recommandé d’effectuer un test directionnel, ou de pratiquer soit un test de régression ou un test de fonction
caractéristique, ou aucun test du tout. De plus, bien qu’une telle représentation graphique ne puisse être
considérée comme un test rigoureux, l’information résumée qu’elle apporte est un supplément essentiel à tout
test d’écart à la distribution normale. Dans le cas du rejet de l’hypothèse nulle, il est souvent possible d’envisager
par ce moyen le type d’alternative qui pourrait s’appliquer.
4m3 Un test d’écart à la distribution normale est un test de l’hypothèse nulle selon laquelle l’échantillon est
constitué de n observations indépendantes tirées d’une même distribution normale. II consiste dans le calcul de la
fonction Tdes observations, qui est appelée la statistique du test. L’hypothèse nulle d’une distribution normale est
alors rejetée ou non selon que la valeur de T se trouve ou non dans un intervalle de valeurs proches de la valeur
attendue qui correspond à la distribution normale.
3
---------------------- Page: 7 ----------------------
Q ISO
ISO 5479:1997(F)
4.4 La région critique du test est l’ensemble des valeurs de T qui conduisent au rejet de I’hypothese nulle. Le
niveau de signification du test est la probabilité p d’obtenir une valeur de T dans la région critique quand
l’hypothèse nulle est correcte. Ce niveau donne la probabilite de rejeter de façon erronée l’hypothèse nulle (erreur
de premier-e espèce).
La limite de la région critique est (ou, dans le cas d’un test bilatéral, les limites de la région critique sont) la (les)
valeur(s) critique(s) de la statistique du test.
4.5 La puissance du test est la probabilité de rejeter l’hypothèse nulle quand elle n’est pas vérifiée. Une
puissance élevée donne une faible probabilité de ne pas rejeter l’hypothèse nulle de façon erronée (erreur de
deuxième espèce).
II convient de souligner que la puissance d’un test (c’est-à-dire pour une situation donnée, la probabilité que
l’hypothèse nulle d’une distribution normale sera rejetée si elle est fausse) augmente si le nombre d’observations
augmente. Par exemple, un écart à la distribution normale qui deviendrait apparent quand on utilise un test d’écart
à la distribution normale sur un échantillon important pourrait ne pas être détecté par le même test s’il y avait
moins d’observations.
4.6 Une distinction est faite entre deux catégories de tests d’écart à la distribution normale. Quand la forme de
l’écart à la distribution normale est spécifiée dans l’hypothèse alternative, le test est alors un test directionnel.
Cependant, quand la forme de l’écart à la distribution normale n’est pas spécifiée dans l’hypothèse alternative, le
test est un test omnibus.
Dans un test directionnel, la région critique est déterminée d’une façon telle que la puissance du test atteigne sa
valeur maximale. Dans un test omnibus, il est nécessaire de diviser la région critique de façon telle que la région
critique soit constituée des valeurs de la statistique de test qui sont éloignées de la valeur attendue.
S’il y a des suppositions sur le type d’écart à la distribution normale, c’est-à-dire quand on envisage une distribution
dont l’asymétrie ou l’aplatissement diffère de celui (celle) de la distribution normale, il convient d’appliquer un test
directionnel, parce que sa puissance est plus grande que celle d’un test omnibus.
4.7 II est à noter qu’un test directionnel est par essence unilatéral. Dans le cas d’asymétrie, par exemple, il est
centré soit sur l’asymétrie positive, soit par l’asymétrie négative. Cependant, lorsque l’on considère de façon
conjointe plusieurs alternatives, le test est multidirectionnel. C’est le cas, en particulier, quand une asymétrie non
nulle et un aplatissement diffèrent de celui de la distribution normale sont considérés conjointement.
4.8 Les tables 8 à 14 et la figure 9 permettent de pratiquer les tests pour les niveaux les pius usuels de a, c’est-à-
dire a = 0,05 et a = 0,Ol. II faut spécifier le niveau de signification avant de pratiquer le test. À noter, qu’un test
peut conduire au rejet de l’hypothèse nulle au niveau 0,05 et au non-rejet de cette même hypothèse au niveau
0,Ol.
4.9 Au cours du calcul électronique des statistiques de test, il est nécessaire d’utiliser au moins 6 chiffres
significatifs. Les sous-totaux, résultats intermédiaires et quantités auxiliaires ne doivent pas être arrondis à moins
de 6 chiffres significatifs.
5 Méthode graphique
5.1 La fonction cumulative de distribution des valeurs observées est reportée sur un papier quadrillé de
probabilité normale. Sur ce papier, l’un des axes (dans la présente Norme internationale, l’axe vertical) est à une
échelle non linéaire selon l’aire au-dessous de la distribution normale réduite et est coté avec les valeurs
correspondantes de la fréquence relative cumulée. L’autre axe a une échelle linéaire pour les valeurs ordonnées de
X0 La fonction cumulative de distribution de la variable X est alors representée de façon approximative par une ligne
droite.
Parfois les deux axes sont échangés. De plus, si une transformation norma lisante de l a variable X est faite,
e linéaire p eut êt re re mplacée pa
I’échell une éche Ile Poga ithmique, quadratique, récipro Ique ou autre.
---------------------- Page: 8 ----------------------
@ ISO ISO 5479:1997(F)
La figure 1 donne un exemple du papier quadrillé de probabilité normale. Sur l’axe vertical, les valeurs de la
fréquence relative cumulée sont données en pourcentage, tandis que l’axe horizontal a une échelle linéaire
arbitraire.
Une feuille vierge du papier quadrillé de probabilité normale est fournie en annexe A.
Si un graphique sur ce papier présente un ensemble de points qui semblent dispersés autour d’une ligne droite,
ceci fournit un argument grossier en faveur de l’hypothèse que l’échantillon peut être raisonnablement considéré
comme provenant d’une distribution normale.
s’il y a un écart systématique par rapport à la ligne droite, le graphique suggère
Cependant, souvent le type de
distribution à prendre en considération.
L’importance de cette approche est qu’elle fournit aisément une information visuelle sur le type d’écart à la
distribution normale.
Si le graphique indique que les données proviennent d’une distribution déformée (par exemple si le graphique de la
fonction cumulative de distribution est tel que sur la figure 5 ou 6), une transformation des données peut conduire
à une distribution normale.
Si le graphique indique que les données ne proviennent pas d’une simple distribution homogène, mais plutôt d’un
mélange de deux sous-populations homogènes ou plus (par exemple si le graphique de la fonction cumulative de
distribution est tel que sur la figure 7), il est recommandé d’identifier ces sous-populations et de poursuivre
l’analyse séparément sur chaque sous-population.
II convient de garder présent à l’esprit le fait qu’un tel graphique n’est en aucune façon un test d’écart à la
distribution normale au sens strict. Dans le cas de petits échantillons, une courbure prononcée peut se rencontrer
pour des populations normales, tandis que pour de grands échantillons, une faible courbure peut indiquer des
distributions non normales.
5.2 La procédure graphique consiste à arranger les valeurs observées x(,,)] en ordre non décroissant,
b(l), X(2)1 l **t
et à reporter
pk = (k - 3/8)/(n + 1/4) . . .
(1)
en fonction de x(k) sur un papier quadrillé de probabilité normale.
NOTE 1 Des alternatives communément utilisées à la place de l’équation (1) sont
Pk = (k - l/Z)/n
Pk = k/(n + 1)
Ce sont des approximations m oins bonnes que la fonction de distrib ution n ormale de la statistiq ue usuelle, F [ , et leur
E(Q) 1
emploi n’est pas recommandé.
53 . Un exemple d’utilisation du papier quadrillé de probabilité normale est représenté à la figure 2.
---------------------- Page: 9 ----------------------
SI YY,YY
3
5
U
99,9
QI
>
i-
99,0
c
m
G
i 99
5 98
c 95
90
80
70
60
SO
40
30
20
10
5
2
1
os
02
O,l
0,os
-
0,Ol
’ ’ 1 ” ” i ” ” i ” ” i ’ ’ ” i ” ’ ‘,i ‘l I I I I I I-
0 1 2 3 4 5 6 7 0 9 10 Il 12 x 0 1 1s 2 lg (10 XI
a) b)
---------------------- Page: 10 ----------------------
@ ISO
ISO 5479:1997(F)
La table 1 montre les valeurs x(k) en ordre non décroissant du résultat d’une série de 15 essais indépendants de
fatigue sous flexion rotative.
Table 1 - Résultats x(k) d’une série de 15 essais de fatigue en flexion rotative
et valeurs correspondantes de Ig (10 x(k))
10 0,631 1,710 1,233
II 0,697 2,220 1,346
12 0,762 2,275 1,357
13 0,828 3,650 1,562
14 0,893 1,845
7,000
15 0,959 8,800 1,944
NOTE 2 Dans la table 1 et les exemples suivants, on a omis les unit& des observations parce qu’elles ne sont pas
concernkes par les tests de la présente Norme internationale.
En associant la probabilité
Pk = (k - 3/8)/(n + 1/4)
valeur x(k), on obtient la série de points indiquée sur la figure 2a). On voit immédiatement sur ce graphique
à la kème
que ces points ne sont pas alignés. Cependant, si x(k) est remplacé par Ig (10 x(k)), le nouveau graphique [figure 2b)]
conduit a une série de points qui, cette fois, se tiennent raisonnablement près d’une ligne droite.
L’hypothèse d’une distribution normale du logarithme des observations semble donc adéquate.
5.4 II convient de noter le fait que les valeurs observées extrêmes ont une variante plus grande que les valeurs
du milieu. Par conséquent, et comme l’échelle de fréquence relative cumulée s’agrandit vers les extrêmes,
quelques valeurs a chaque extrémité de la distribution cumulative qui sont distinctement en dehors de la ligne
droite définie par les valeurs du milieu ne peuvent être considérées comme des indicateurs d’un écart à la
distribution normale.
Plus la taille de l’échantillon est élevée, plus fiables sont les conclusions qu’on peut déduire de la forme du graphique.
Si le graphique de la fonction cumulative de distribution des valeurs observées est tel que les grandes valeurs
tendent à être nettement au-dessous de la ligne droite définie par les autres valeurs, une transformation telle que
conduira en général à un graphique plus proche d’une ligne droite [voir les figures 2b) et 51.
Les parties supérieures des figures 3 à 7 montrent la fonction cumulative de distribution comparée à la fonction de
densité correspondante présentée dans la partie inférïeure de chaque figure.
8
---------------------- Page: 11 ----------------------
ISO 5479:1997(F)
@ ISO
Si le graphique de la fonction cumulative de distribution des valeurs observées est tel que celui représenté à la
figure 3 ou 4, la distribution de fréquence correspondante est respectivement un aplatissement en défaut
(platikurtique) ou un aplatissement en excès (leptocurtique).
Les graphiques des fonctions cumulatives de distribution des figures 5 et 6 correspondent à une fonction de
densité à asymétrie respectivement positive et négative.
La figure 7 montre la fonction cumulative de distribution et la fonction de densité de la superposition de deux
fonctions de densité différentes.
8 8
ai ai
a a
2 98 2 98
3
3
U U
:
>f
.-
.-
c t
; a4 ; a4
IL L
QI
c
3
g 5o
lk
16 16
Figure 3 - Fonction de densité avec Figure 4 - Fonction de densité avec
aplatissement en défaut aplatissement en excès
---------------------- Page: 12 ----------------------
ISO 5479:1997(F)
@ ISO
8
8
ai
aJ ai
QJ
2 98
2 98
II
u 3
U
z
.-
:
t
.-
c
z a4
2 04
c
c
aJ
u
u
6
k
,; 50
,$ 50
G
t
16
16
2
2
Figure 5 -
Fonction de densité avec asymétrie
Figure 6 -
Fonction de densité avec asymétrie
positive
négative
10
---------------------- Page: 13 ----------------------
ISO 5479:1997(F)
@ ISO
8
m
2
2 98
3
U
F
.-
t
; 84
L
a
U
ii
,$ 50
t
16
2
Figure 7 - Superposition de deux fonctions
de densité différentes
6 Tests directionnek
6.1 Généralités
6.1.1 Les tests directionnels considérés ici concernent uniquement les caractéristiques d’asymétrie ou
d’aplatissement de la distribution des observations. Ils sont fondés sur le fait que dans le cas d’une variable
= E(X), le moment centré du troisième ordre est
aléatoire normale X de moyenne p
p3 = E[(~+L)~] = 0 . . .
(2)
le moment centré réduit du troisième ordre est
. . .
(3)
et le moment centré réduit du quatrième ordre est
. . .
(4)
p2 = p4b22 = 3
ou
. . .
p2=EI(X - PI21 (51
. . .
p4=E[(X-p)4B 6)
11
---------------------- Page: 14 ----------------------
ISO 5479:1997(F)
est l’asymétrie de la population et peut être superieure, égale ou inférieure a zero;
1
IF
est l’aplatissement de la population et est toujours positive;
P2
p2 - 3 est l’excès de la population;
+l est toujours exacte.
l’inégalité p2 2 (Jp;)2
6.1.2 Dans un test d’asymétrie, l’hypothèse alternative est soit:
HI : p3 > 0
ou de façon équivalente,
qui signifie une asymétrie positive (voir figure 5), ou
ou de façon équivalente,
1
Jp
qui signifie une asymétrie négative (voir figure 6).
En général, une distribution a asymétrie positive a une dispersion plus élevée pour les valeurs élevées de la
variable que pour les valeurs basses; le cas de l’asymétrie négative est l’inverse.
6.1.3 Dans un test d’aplatissement, l’hypothèse alternative est soit
HI$~> 3
qui signifie un aplatissement en excès (fonction de densité leptocurtique) (voir figure 4), ou
qui signifie un aplatissement en défaut (fonction de densité platicurtique) (voir figure 3).
Comparée à la distribution normale, une distribution à aplatissement en excès tend à avoir une prépondérance de
valeurs de la variable proches à la fois de la moyenne et des deux extrêmes. Le cas d’un aplatissement en défaut
est l’inverse.
6.1.$ L’emploi d’un test directionnel ne se justifie que lorsqu’on dispose d’une information spécifique sur la façon
dont la distribution reelle peut différer de la distribution normale. Cette information peut provenir de la nature
physique des données ou de la nature de la perturbation qui peut affecter le processus générateur.
Par exemple, le fait qu’une variable soit non négative, avec une moyenne proche de zéro par rapport à la valeur de
l’écart-type, peut être une raison physique de l’asymétrie positive de la distribution réelle. De même, toute
perturbation dans un processus générateur qui produit un mélange de populations normales de même moyenne
mais de variantes différentes conduit à une distribution non normale avec p2 > 3.
6.1.5 Dans tous les cas, il convient que le choix d’un test directionnel soit fondé sur des considérations générales
sur la nature des observations ou du processus qui les produit et non sur la forme particulière de la distribution des
valeurs observées. Dans ce dernier cas, seul le résultat d’un test omnibus peut être considéré comme objectif.
---------------------- Page: 15 ----------------------
@ ISO
ISO 5479:1997(F)
6.1.6 Si XI, x2, . . . . xn désignent la série des observations, alors:
. . .
(7)
1
- $
=-
. . .
Cxj (8)
"i n
c
i
avec j = 2, 3,4
et les statistiques de test pour l’asymétrie et l’aplatissement respectivement sont les quantités.
m3
=-
. . .
(9)
bl
lr
312
m2
et
m4
=-
. . .
(10)
b2
2
m2
6.2 Test directionnel d’asymétrie utilisant &
Ce test est applicable pour ~1 3 8; cependant, pour des raisons pratiques, la table 8 est limitée à I-Z G 5000.
Si l’hypothèse alternative consiste en une asymétrie positive, il convient que le test ne soit conduit que si m3 > 0.
D’autre part, si l’hypothèse alternative consiste en une asymétrie négative, il convient que le test ne soit conduit
que si n-23 < 0.
Dans les deux cas d’asymétrie, la conclusion est en faveur du rejet de l’hypothèse nulle au niveau de signification a
si la statistique I&i excède le quantile d’ordre p avec p = 1- a.
La table 8 montre pour cette statistique de test le quantile d’ordre p pour p = l- a où a = 0,05 et a = 0,Ol
et pour les tailles d’échantillon YI =
8( 1)10,12,15(5)50(10)100(25)200(50)1000(200)2000(500)5000.
EXEMPLE 1
Un exemple d’emploi du test directionnel
pour l’asymétrie utilisant Jbi est le suivant. La table 2 donne 50
mesures indépendantes de la profondeur de l’aubier dans des pièces de bois destinées à leur utilisation comme
poteaux télégraphiques. Comme la profondeur de l’aubier est une caractéristique avec des valeurs qui sont
essentiellement non négatives voisines de zéro, on peut supposer une asymétrie positive. II est donc nécessaire
de pratiquer le test directionnel approprié avec l’hypothèse alternative
Ainsi, on tire des valeurs observées de la table 2:
‘- (1,25 + 1,35 + o.o -R- 5,10)/50 = 2,873
2
= [(If25 - 2,873)2 -e . . . + (5,lO- 2,873)2]/50 = 0,937 921
rn2
= [(1,25 - 2,873)3 + . . .
+ (5,lO - 2,873)3]/50 = 0,254 559
m3
13
---------------------- Page: 16 ----------------------
ISO 5479:1997(F)
D’où
m3
= 3/2 = 0,280
bl
Jr
m2
1 - a = 0,95, et IZ = 50, la valeur critique de la statistique
Pour le niveau de signification a = 0,05, c’est-à-dire p =
du test est 0,53 (voir table 8). Cette valeur est supérieure à la valeur calculée I&i; ainsi, l’hypothèse nulle d’une
distribution normale ne peut être rejetée au niveau de signification choisi.
Table 2 - Profondeur de l’aubier
2,40 3,00 3,80 4,70
1,85
1,95 2,55 3,05 3,90 5,lO
NOTE - Série arrangée selon les valeurs non
décroissantes de 50 observations.
6.3 Test directionnel d’aplatissement utilisant b2
Ce test est applicable pour ~2 a 8; cependant, pour des raisons pratiques, la table 9 est limitée à yt 6 5 000.
Dans un test d’aplatissement en excès, l’hypothèse alternative est:
HI: & > 3
L’hypothèse nulle devra être rejetée au niveau de signification prédéterminé de, par exemple, a = 0,05 ou O,Ol, si
la valeur calculée &2 excède la valeur critique de la statistique du test correspondant au quantile d’ordre p pour
p= 1 -a=0,95oup= 1 - a = 0,99 et pour la taille yt de l’échantillon.
Dans un test d’aplatissement en défaut, l’hypothèse alternative est
HI: p2 < 3
L’hypothèse nulle devra être rejetée au niveau de signification prédéterminée de, par exemple, a = 0,05 ou 0,Ol si
la valeur calculée &2 est inférieure à la valeur critique de la statistique de test correspondant au quantile d’ordre p
=0,05oup=a= 0,Ol et pour la taille ~1 de l’échant
...
NORME
INTERNATIONALE
Première édition
1997-05-I 5
Interprétation statistique des données -
Tests pour les écarts à la distribution
normale
Statistical interpretation of data - Tests for departure from the normal
distribution
Numéro de référence
BS0 5479:1997(F)
---------------------- Page: 1 ----------------------
IlSO 5479:1997(F)
Page
Sommaire
................................................................... 1
Domaine d’application
1
.................................................................
Références normatives
......................... 2
Définitions et symboles .
.................................................................................... 3
Généralités
................... 4
....................................................
l’vléthode graphique
........................................................................ 11
Tests directionnels
15
(test multidirectionnel) . . . . . . . . . . . . . . . .
Test conjoint utilisant & et !II~
16
Tests omnibus .
8
.......... 22
9 Test conjoint utilisant plusieurs échantillons indépendants
24
Tables statistiques .
10
Annexes
......................... 32
A Feuille de papier quadrillé de probabilité normale
33
Références bibliographiques .
B
0 60 1997
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publi-
cation ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun pro-
cédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l’accord
écrit de l’éditeur.
Organisation Internationale de normalisation
Case postale 56 l CH-l 211 Geneve 20 l Suisse
lnternet central@iso.ch
c=ch; a=400net; p=iso; o=isocs; s=central
x.400
Imprimé en Suisse
ii
---------------------- Page: 2 ----------------------
ISO 5479:1997(F)
@ ISO
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération
mondiale d’organismes nationaux de normalisation (comités membres de
I’ISO). L’élaboration des Normes internationales est en général confiée aux
comités techniques de I’ISO. Chaque comité membre intéressé par une
étude a le droit de faire partie du comité technique créé à cet effet. Les
organisations internationales, gouvernementales et non gouvernemen-
tales, en liaison avec I’ISO participent également aux travaux. L’ISO
collabore étroitement avec la Commission électrotechnique internationale
(CEI) en ce qui concerne la normalisation électrotechnique.
Les projets de Normes internationales adoptés par les comités techniques
sont soumis aux comités membres pour vote. Leur publication comme
Normes internationales requiert l’approbation de 75 % au moins des
comités membres votants.
La Norme internationale ISO 5479 a été élaborée par le comité technique
lSO/TC 69, Application des méthodes statistiques, sous-comité SC 6,
Méthodes et résultats de mesure.
Les annexes A et B de la présente Norme internationale sont données
uniquement à titre d’information.
. . .
III
---------------------- Page: 3 ----------------------
ISO 5479:1997(F) 0 ISO
Introduction
De nombreuses méthodes statistiques recommandées dans les Normes
internationales, telles que celles qui sont décrites dans I’ISO 2854[‘], sont
fondées sur l’hypothèse que la (les) variable(s) aléatoire(s) à laquelle
(auxquelles) ces méthodes s’appliquent sont distribuées indépendamment
selon une distribution normale avec un ou deux de ses paramètres
inconnus.
La question suivante se pose alors: la distribution représentée par I’échan-
tillon est-elle suffisamment proche de la distribution normale pour que les
méthodes données par ces Normes internationales puissent être valable-
ment utilisées?
II n’y a pas de réponse simple par oui ou non à cette question qui soit
valable dans tous les cas. Pour cette raison, un grand nombre de ((tests de
normalité)) ont été mis au point, dont chacun est plus ou moins sensible à
un aspect particulier de la distribution en cause; par exemple l’asymétrie
ou l’aplatissement.
En général, le test utilisé est conçu pour correspondre à un risque prédé-
terminé a priori que l’hypothèse de normalité est rejetée même si elle est
vraie (erreur de première espèce). D’autre part, la probabilité que cette
hypothèse n’est pas rejetée alors qu’elle n’est pas vraie (erreur de
deuxième espèce) ne peut être déterminée à moins que l’hypothèse
alternative (c’est-à-dire celle qui est opposée à l’hypothèse de normalité)
ne puisse être définie avec précision. Cela n’est pas possible en général et,
de plus, nécessite des calculs complémentaires. Pour un test donné, ce
risque est particulièrement élevé si la taille d’échantillon est faible.
---------------------- Page: 4 ----------------------
NORME INTERNATIONALE @ Iso ISO 5479:1997(F)
Interprétation statistique des données - Tests pour les
écarts à la distribution normale
1 Domaine d’application
1.1 La présente Norme internationale donne des lignes directrices concernant des méthodes et des tests utilisés
pour décider s’il convient ou non de rejeter l’hypothèse de distribution normale, en supposant que les observations
sont indépendantes.
1.2 Chaque fois qu’il y a doute sur la normalité de la distribution des observations, l’emploi d’un test d’écart à la
distribution normale peut être utile ou même nécessaire. Cependant, dans le cas de méthodes robustes (c’est-à-
dire où les résultats ne sont que très légèrement modifiés quand la véritable distribution des observations n’est
pas une distribution normale), un test d’écart à la distribution normale n’est pas d’une grande aide. C’est le cas, par
exemple, quand la moyenne d’un échantillon aléatoire unique d’observations doit être comparée à une valeur
théorique donnée en utilisant un test t.
1.3 II n’est pas strictement nécessaire d’utiliser un test chaque fois qu’on se réfère à des méthodes statistiques
fondées sur l’hypothèse de normalité. II est possible qu’il n’existe aucun doute quant à la normalité de la
distribution des observations, soit qu’il y ait des raisons théoriques (par exemple physiques) qui confirment cette
hypothèse, ou parce que cette hypothèse est réputée acceptable selon une information antérieure.
1.4 Les tests d’écart à la distribution normale, sélectionnés dans la présente Norme internationale, sont
principalement destinés à des données complètes, et non à des données groupées. Ils ne sont pas adaptés pour
des données tronquées.
1.5 Les tests d’écart à la distribution normale sélectionnés dans la présente Norme internationale peuvent être
appliqués soit aux valeurs observées ou à des fonctions de celles-ci, telles que le logarithme ou la racine carrée.
1.6 Les tests d’écart à la distribution normale sont très inefficaces pour des échantillons de taille inférieure à huit.
En conséquence, la présente Norme internationale est limitée à des échantillons de taille égale ou supérieure à
huit.
2 Référence normative
La norme suivante contient des dispositions qui, par suite de la référence qui en est faite, constituent des
dispositions valables pour la présente Norme internationale. Au moment de la publication, l’édition indiquée était en
vigueur. Toute norme est sujette à révision et les parties prenantes des accords fondés sur la présente Norme
internationale sont invitées à rechercher la possibilité d’appliquer l’édition la plus récente de la norme indiquée ci-
après. Les membres de la CEI et de I’ISO possèdent le registre des Normes internationales en vigueur à un
moment donné.
ISO 3534-l :1993, Statistique - Vocabulaire et symboles - Partie 1: Probabilité et termes statistiques généraux.
1
---------------------- Page: 5 ----------------------
ISO 5479:1997(F)
@ ISO
3 Définitions et symboles
3.1 Définitions
Pour les besoins de la présente Norme internationale, les définitions données dans NS0 3534-l s’appliquent.
.
32 Symboles
coefficient du test Shapiro-Wilk
ak
A quantité auxiliaire pour le test d’Epps-Pulley
aplatissement empirique
b2
asymétrie empirique
h
Ar
B quantité auxiliaire pour le test d’Epps-Pulley
E espérance mathématique
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
Gj
h nombre d’échantillons successifs
hypothèse nulle
Ho
hypothèse alternative
HI
k dans l’échantillon arrangé en ordre non décroissant, nombre de valeurs x observées
moment centré d’ordre j de l’échantillon
mj
n taille de l’échantillon
probabilité associée au quantile d’ordre p de la distribution
P
P probabilité
probabilité associée à X(k)
Pk
S quantité auxiliaire pour le test de Shapiro-Wilk
T statistique de test
statistique de test d’Epps-Pulley
TEP
quantile d’ordre p de la distribution réduite
UP
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
vj
W statistique de test de Shapiro-Wilk
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
wj
x valeur de X
X variable aléatoire
Oème valeur observée de l’échantillon arrangé en ordre non décroissant
9
kème valeur observée de l’echantillon arrangé en ordre non decroissant
moyenne arithmétique
niveau de signification
2
---------------------- Page: 6 ----------------------
ISO 5479:1997(F)
@ os0
probabilité de l’erreur de seconde espèce
P
aplatissement de la population
P2
excès de la population
P2 - 3
asymétrie de la population
1
fi
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
Y
coefficient du test conjoint utilisant plusieurs échantillons indépendants
n
ri)
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
6
coefficient du test conjoint utilisant plusieurs échantillons indépendants
44
quantité auxiliaire pour le test conjoint utilisant plusieurs échantillons indépendants
E
coefficient du test conjoint utilisant plusieurs échantillons indépendants
9n)
espérance mathématique
P
moment centré du deuxième ordre (variante) de la population
P2
moment centré du troisième ordre de la population -
P3
moment centré du quatrième ordre de la population
P4
écart-type de la population (= &)
0
4 Généralités
4.1 II y a plusieurs catégories de tests d’écart à la normalité. Dans la présente Norme internationale, sont traitées
les méthodes graphiques, les tests de moments, les tests de régression et les tests de fonction caractéristique.
Les tests de Chi-carré sont appropriés pour des données groupées seulement mais, comme le groupement des
résultats entraîne une perte d’information, ces tests ne sont pas traités dans la présente Norme internationale.
4.2 Si on ne dispose pas d’autre information sur l’échantillon, il est recommandé de faire en premier lieu un
graphique de probabilité normale; c’est-à-dire de reporter la fonction cumulative de distribution des valeurs
observées sur un papier quadrillé de probabilité normale, consistant en un système d’axes de coordonnées où la
fonction cumulative de distribution de la distribution normale est représentée par une droite.
Cette méthode, qui est décrite dans l’article 5, permet de ((voir)) immédiatement si la distribution observée est
proche ou non de la distribution normale. Avec cette information additionnelle, on peut décider s’il est
recommandé d’effectuer un test directionnel, ou de pratiquer soit un test de régression ou un test de fonction
caractéristique, ou aucun test du tout. De plus, bien qu’une telle représentation graphique ne puisse être
considérée comme un test rigoureux, l’information résumée qu’elle apporte est un supplément essentiel à tout
test d’écart à la distribution normale. Dans le cas du rejet de l’hypothèse nulle, il est souvent possible d’envisager
par ce moyen le type d’alternative qui pourrait s’appliquer.
4m3 Un test d’écart à la distribution normale est un test de l’hypothèse nulle selon laquelle l’échantillon est
constitué de n observations indépendantes tirées d’une même distribution normale. II consiste dans le calcul de la
fonction Tdes observations, qui est appelée la statistique du test. L’hypothèse nulle d’une distribution normale est
alors rejetée ou non selon que la valeur de T se trouve ou non dans un intervalle de valeurs proches de la valeur
attendue qui correspond à la distribution normale.
3
---------------------- Page: 7 ----------------------
Q ISO
ISO 5479:1997(F)
4.4 La région critique du test est l’ensemble des valeurs de T qui conduisent au rejet de I’hypothese nulle. Le
niveau de signification du test est la probabilité p d’obtenir une valeur de T dans la région critique quand
l’hypothèse nulle est correcte. Ce niveau donne la probabilite de rejeter de façon erronée l’hypothèse nulle (erreur
de premier-e espèce).
La limite de la région critique est (ou, dans le cas d’un test bilatéral, les limites de la région critique sont) la (les)
valeur(s) critique(s) de la statistique du test.
4.5 La puissance du test est la probabilité de rejeter l’hypothèse nulle quand elle n’est pas vérifiée. Une
puissance élevée donne une faible probabilité de ne pas rejeter l’hypothèse nulle de façon erronée (erreur de
deuxième espèce).
II convient de souligner que la puissance d’un test (c’est-à-dire pour une situation donnée, la probabilité que
l’hypothèse nulle d’une distribution normale sera rejetée si elle est fausse) augmente si le nombre d’observations
augmente. Par exemple, un écart à la distribution normale qui deviendrait apparent quand on utilise un test d’écart
à la distribution normale sur un échantillon important pourrait ne pas être détecté par le même test s’il y avait
moins d’observations.
4.6 Une distinction est faite entre deux catégories de tests d’écart à la distribution normale. Quand la forme de
l’écart à la distribution normale est spécifiée dans l’hypothèse alternative, le test est alors un test directionnel.
Cependant, quand la forme de l’écart à la distribution normale n’est pas spécifiée dans l’hypothèse alternative, le
test est un test omnibus.
Dans un test directionnel, la région critique est déterminée d’une façon telle que la puissance du test atteigne sa
valeur maximale. Dans un test omnibus, il est nécessaire de diviser la région critique de façon telle que la région
critique soit constituée des valeurs de la statistique de test qui sont éloignées de la valeur attendue.
S’il y a des suppositions sur le type d’écart à la distribution normale, c’est-à-dire quand on envisage une distribution
dont l’asymétrie ou l’aplatissement diffère de celui (celle) de la distribution normale, il convient d’appliquer un test
directionnel, parce que sa puissance est plus grande que celle d’un test omnibus.
4.7 II est à noter qu’un test directionnel est par essence unilatéral. Dans le cas d’asymétrie, par exemple, il est
centré soit sur l’asymétrie positive, soit par l’asymétrie négative. Cependant, lorsque l’on considère de façon
conjointe plusieurs alternatives, le test est multidirectionnel. C’est le cas, en particulier, quand une asymétrie non
nulle et un aplatissement diffèrent de celui de la distribution normale sont considérés conjointement.
4.8 Les tables 8 à 14 et la figure 9 permettent de pratiquer les tests pour les niveaux les pius usuels de a, c’est-à-
dire a = 0,05 et a = 0,Ol. II faut spécifier le niveau de signification avant de pratiquer le test. À noter, qu’un test
peut conduire au rejet de l’hypothèse nulle au niveau 0,05 et au non-rejet de cette même hypothèse au niveau
0,Ol.
4.9 Au cours du calcul électronique des statistiques de test, il est nécessaire d’utiliser au moins 6 chiffres
significatifs. Les sous-totaux, résultats intermédiaires et quantités auxiliaires ne doivent pas être arrondis à moins
de 6 chiffres significatifs.
5 Méthode graphique
5.1 La fonction cumulative de distribution des valeurs observées est reportée sur un papier quadrillé de
probabilité normale. Sur ce papier, l’un des axes (dans la présente Norme internationale, l’axe vertical) est à une
échelle non linéaire selon l’aire au-dessous de la distribution normale réduite et est coté avec les valeurs
correspondantes de la fréquence relative cumulée. L’autre axe a une échelle linéaire pour les valeurs ordonnées de
X0 La fonction cumulative de distribution de la variable X est alors representée de façon approximative par une ligne
droite.
Parfois les deux axes sont échangés. De plus, si une transformation norma lisante de l a variable X est faite,
e linéaire p eut êt re re mplacée pa
I’échell une éche Ile Poga ithmique, quadratique, récipro Ique ou autre.
---------------------- Page: 8 ----------------------
@ ISO ISO 5479:1997(F)
La figure 1 donne un exemple du papier quadrillé de probabilité normale. Sur l’axe vertical, les valeurs de la
fréquence relative cumulée sont données en pourcentage, tandis que l’axe horizontal a une échelle linéaire
arbitraire.
Une feuille vierge du papier quadrillé de probabilité normale est fournie en annexe A.
Si un graphique sur ce papier présente un ensemble de points qui semblent dispersés autour d’une ligne droite,
ceci fournit un argument grossier en faveur de l’hypothèse que l’échantillon peut être raisonnablement considéré
comme provenant d’une distribution normale.
s’il y a un écart systématique par rapport à la ligne droite, le graphique suggère
Cependant, souvent le type de
distribution à prendre en considération.
L’importance de cette approche est qu’elle fournit aisément une information visuelle sur le type d’écart à la
distribution normale.
Si le graphique indique que les données proviennent d’une distribution déformée (par exemple si le graphique de la
fonction cumulative de distribution est tel que sur la figure 5 ou 6), une transformation des données peut conduire
à une distribution normale.
Si le graphique indique que les données ne proviennent pas d’une simple distribution homogène, mais plutôt d’un
mélange de deux sous-populations homogènes ou plus (par exemple si le graphique de la fonction cumulative de
distribution est tel que sur la figure 7), il est recommandé d’identifier ces sous-populations et de poursuivre
l’analyse séparément sur chaque sous-population.
II convient de garder présent à l’esprit le fait qu’un tel graphique n’est en aucune façon un test d’écart à la
distribution normale au sens strict. Dans le cas de petits échantillons, une courbure prononcée peut se rencontrer
pour des populations normales, tandis que pour de grands échantillons, une faible courbure peut indiquer des
distributions non normales.
5.2 La procédure graphique consiste à arranger les valeurs observées x(,,)] en ordre non décroissant,
b(l), X(2)1 l **t
et à reporter
pk = (k - 3/8)/(n + 1/4) . . .
(1)
en fonction de x(k) sur un papier quadrillé de probabilité normale.
NOTE 1 Des alternatives communément utilisées à la place de l’équation (1) sont
Pk = (k - l/Z)/n
Pk = k/(n + 1)
Ce sont des approximations m oins bonnes que la fonction de distrib ution n ormale de la statistiq ue usuelle, F [ , et leur
E(Q) 1
emploi n’est pas recommandé.
53 . Un exemple d’utilisation du papier quadrillé de probabilité normale est représenté à la figure 2.
---------------------- Page: 9 ----------------------
SI YY,YY
3
5
U
99,9
QI
>
i-
99,0
c
m
G
i 99
5 98
c 95
90
80
70
60
SO
40
30
20
10
5
2
1
os
02
O,l
0,os
-
0,Ol
’ ’ 1 ” ” i ” ” i ” ” i ’ ’ ” i ” ’ ‘,i ‘l I I I I I I-
0 1 2 3 4 5 6 7 0 9 10 Il 12 x 0 1 1s 2 lg (10 XI
a) b)
---------------------- Page: 10 ----------------------
@ ISO
ISO 5479:1997(F)
La table 1 montre les valeurs x(k) en ordre non décroissant du résultat d’une série de 15 essais indépendants de
fatigue sous flexion rotative.
Table 1 - Résultats x(k) d’une série de 15 essais de fatigue en flexion rotative
et valeurs correspondantes de Ig (10 x(k))
10 0,631 1,710 1,233
II 0,697 2,220 1,346
12 0,762 2,275 1,357
13 0,828 3,650 1,562
14 0,893 1,845
7,000
15 0,959 8,800 1,944
NOTE 2 Dans la table 1 et les exemples suivants, on a omis les unit& des observations parce qu’elles ne sont pas
concernkes par les tests de la présente Norme internationale.
En associant la probabilité
Pk = (k - 3/8)/(n + 1/4)
valeur x(k), on obtient la série de points indiquée sur la figure 2a). On voit immédiatement sur ce graphique
à la kème
que ces points ne sont pas alignés. Cependant, si x(k) est remplacé par Ig (10 x(k)), le nouveau graphique [figure 2b)]
conduit a une série de points qui, cette fois, se tiennent raisonnablement près d’une ligne droite.
L’hypothèse d’une distribution normale du logarithme des observations semble donc adéquate.
5.4 II convient de noter le fait que les valeurs observées extrêmes ont une variante plus grande que les valeurs
du milieu. Par conséquent, et comme l’échelle de fréquence relative cumulée s’agrandit vers les extrêmes,
quelques valeurs a chaque extrémité de la distribution cumulative qui sont distinctement en dehors de la ligne
droite définie par les valeurs du milieu ne peuvent être considérées comme des indicateurs d’un écart à la
distribution normale.
Plus la taille de l’échantillon est élevée, plus fiables sont les conclusions qu’on peut déduire de la forme du graphique.
Si le graphique de la fonction cumulative de distribution des valeurs observées est tel que les grandes valeurs
tendent à être nettement au-dessous de la ligne droite définie par les autres valeurs, une transformation telle que
conduira en général à un graphique plus proche d’une ligne droite [voir les figures 2b) et 51.
Les parties supérieures des figures 3 à 7 montrent la fonction cumulative de distribution comparée à la fonction de
densité correspondante présentée dans la partie inférïeure de chaque figure.
8
---------------------- Page: 11 ----------------------
ISO 5479:1997(F)
@ ISO
Si le graphique de la fonction cumulative de distribution des valeurs observées est tel que celui représenté à la
figure 3 ou 4, la distribution de fréquence correspondante est respectivement un aplatissement en défaut
(platikurtique) ou un aplatissement en excès (leptocurtique).
Les graphiques des fonctions cumulatives de distribution des figures 5 et 6 correspondent à une fonction de
densité à asymétrie respectivement positive et négative.
La figure 7 montre la fonction cumulative de distribution et la fonction de densité de la superposition de deux
fonctions de densité différentes.
8 8
ai ai
a a
2 98 2 98
3
3
U U
:
>f
.-
.-
c t
; a4 ; a4
IL L
QI
c
3
g 5o
lk
16 16
Figure 3 - Fonction de densité avec Figure 4 - Fonction de densité avec
aplatissement en défaut aplatissement en excès
---------------------- Page: 12 ----------------------
ISO 5479:1997(F)
@ ISO
8
8
ai
aJ ai
QJ
2 98
2 98
II
u 3
U
z
.-
:
t
.-
c
z a4
2 04
c
c
aJ
u
u
6
k
,; 50
,$ 50
G
t
16
16
2
2
Figure 5 -
Fonction de densité avec asymétrie
Figure 6 -
Fonction de densité avec asymétrie
positive
négative
10
---------------------- Page: 13 ----------------------
ISO 5479:1997(F)
@ ISO
8
m
2
2 98
3
U
F
.-
t
; 84
L
a
U
ii
,$ 50
t
16
2
Figure 7 - Superposition de deux fonctions
de densité différentes
6 Tests directionnek
6.1 Généralités
6.1.1 Les tests directionnels considérés ici concernent uniquement les caractéristiques d’asymétrie ou
d’aplatissement de la distribution des observations. Ils sont fondés sur le fait que dans le cas d’une variable
= E(X), le moment centré du troisième ordre est
aléatoire normale X de moyenne p
p3 = E[(~+L)~] = 0 . . .
(2)
le moment centré réduit du troisième ordre est
. . .
(3)
et le moment centré réduit du quatrième ordre est
. . .
(4)
p2 = p4b22 = 3
ou
. . .
p2=EI(X - PI21 (51
. . .
p4=E[(X-p)4B 6)
11
---------------------- Page: 14 ----------------------
ISO 5479:1997(F)
est l’asymétrie de la population et peut être superieure, égale ou inférieure a zero;
1
IF
est l’aplatissement de la population et est toujours positive;
P2
p2 - 3 est l’excès de la population;
+l est toujours exacte.
l’inégalité p2 2 (Jp;)2
6.1.2 Dans un test d’asymétrie, l’hypothèse alternative est soit:
HI : p3 > 0
ou de façon équivalente,
qui signifie une asymétrie positive (voir figure 5), ou
ou de façon équivalente,
1
Jp
qui signifie une asymétrie négative (voir figure 6).
En général, une distribution a asymétrie positive a une dispersion plus élevée pour les valeurs élevées de la
variable que pour les valeurs basses; le cas de l’asymétrie négative est l’inverse.
6.1.3 Dans un test d’aplatissement, l’hypothèse alternative est soit
HI$~> 3
qui signifie un aplatissement en excès (fonction de densité leptocurtique) (voir figure 4), ou
qui signifie un aplatissement en défaut (fonction de densité platicurtique) (voir figure 3).
Comparée à la distribution normale, une distribution à aplatissement en excès tend à avoir une prépondérance de
valeurs de la variable proches à la fois de la moyenne et des deux extrêmes. Le cas d’un aplatissement en défaut
est l’inverse.
6.1.$ L’emploi d’un test directionnel ne se justifie que lorsqu’on dispose d’une information spécifique sur la façon
dont la distribution reelle peut différer de la distribution normale. Cette information peut provenir de la nature
physique des données ou de la nature de la perturbation qui peut affecter le processus générateur.
Par exemple, le fait qu’une variable soit non négative, avec une moyenne proche de zéro par rapport à la valeur de
l’écart-type, peut être une raison physique de l’asymétrie positive de la distribution réelle. De même, toute
perturbation dans un processus générateur qui produit un mélange de populations normales de même moyenne
mais de variantes différentes conduit à une distribution non normale avec p2 > 3.
6.1.5 Dans tous les cas, il convient que le choix d’un test directionnel soit fondé sur des considérations générales
sur la nature des observations ou du processus qui les produit et non sur la forme particulière de la distribution des
valeurs observées. Dans ce dernier cas, seul le résultat d’un test omnibus peut être considéré comme objectif.
---------------------- Page: 15 ----------------------
@ ISO
ISO 5479:1997(F)
6.1.6 Si XI, x2, . . . . xn désignent la série des observations, alors:
. . .
(7)
1
- $
=-
. . .
Cxj (8)
"i n
c
i
avec j = 2, 3,4
et les statistiques de test pour l’asymétrie et l’aplatissement respectivement sont les quantités.
m3
=-
. . .
(9)
bl
lr
312
m2
et
m4
=-
. . .
(10)
b2
2
m2
6.2 Test directionnel d’asymétrie utilisant &
Ce test est applicable pour ~1 3 8; cependant, pour des raisons pratiques, la table 8 est limitée à I-Z G 5000.
Si l’hypothèse alternative consiste en une asymétrie positive, il convient que le test ne soit conduit que si m3 > 0.
D’autre part, si l’hypothèse alternative consiste en une asymétrie négative, il convient que le test ne soit conduit
que si n-23 < 0.
Dans les deux cas d’asymétrie, la conclusion est en faveur du rejet de l’hypothèse nulle au niveau de signification a
si la statistique I&i excède le quantile d’ordre p avec p = 1- a.
La table 8 montre pour cette statistique de test le quantile d’ordre p pour p = l- a où a = 0,05 et a = 0,Ol
et pour les tailles d’échantillon YI =
8( 1)10,12,15(5)50(10)100(25)200(50)1000(200)2000(500)5000.
EXEMPLE 1
Un exemple d’emploi du test directionnel
pour l’asymétrie utilisant Jbi est le suivant. La table 2 donne 50
mesures indépendantes de la profondeur de l’aubier dans des pièces de bois destinées à leur utilisation comme
poteaux télégraphiques. Comme la profondeur de l’aubier est une caractéristique avec des valeurs qui sont
essentiellement non négatives voisines de zéro, on peut supposer une asymétrie positive. II est donc nécessaire
de pratiquer le test directionnel approprié avec l’hypothèse alternative
Ainsi, on tire des valeurs observées de la table 2:
‘- (1,25 + 1,35 + o.o -R- 5,10)/50 = 2,873
2
= [(If25 - 2,873)2 -e . . . + (5,lO- 2,873)2]/50 = 0,937 921
rn2
= [(1,25 - 2,873)3 + . . .
+ (5,lO - 2,873)3]/50 = 0,254 559
m3
13
---------------------- Page: 16 ----------------------
ISO 5479:1997(F)
D’où
m3
= 3/2 = 0,280
bl
Jr
m2
1 - a = 0,95, et IZ = 50, la valeur critique de la statistique
Pour le niveau de signification a = 0,05, c’est-à-dire p =
du test est 0,53 (voir table 8). Cette valeur est supérieure à la valeur calculée I&i; ainsi, l’hypothèse nulle d’une
distribution normale ne peut être rejetée au niveau de signification choisi.
Table 2 - Profondeur de l’aubier
2,40 3,00 3,80 4,70
1,85
1,95 2,55 3,05 3,90 5,lO
NOTE - Série arrangée selon les valeurs non
décroissantes de 50 observations.
6.3 Test directionnel d’aplatissement utilisant b2
Ce test est applicable pour ~2 a 8; cependant, pour des raisons pratiques, la table 9 est limitée à yt 6 5 000.
Dans un test d’aplatissement en excès, l’hypothèse alternative est:
HI: & > 3
L’hypothèse nulle devra être rejetée au niveau de signification prédéterminé de, par exemple, a = 0,05 ou O,Ol, si
la valeur calculée &2 excède la valeur critique de la statistique du test correspondant au quantile d’ordre p pour
p= 1 -a=0,95oup= 1 - a = 0,99 et pour la taille yt de l’échantillon.
Dans un test d’aplatissement en défaut, l’hypothèse alternative est
HI: p2 < 3
L’hypothèse nulle devra être rejetée au niveau de signification prédéterminée de, par exemple, a = 0,05 ou 0,Ol si
la valeur calculée &2 est inférieure à la valeur critique de la statistique de test correspondant au quantile d’ordre p
=0,05oup=a= 0,Ol et pour la taille ~1 de l’échant
...
Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.