Statistical interpretation of data - Part 8: Determination of prediction intervals

This part of ISO 16269 specifies methods of determining prediction intervals for a single continuously distributed variable. These are ranges of values of the variable, derived from a random sample of size n, for which a prediction relating to a further randomly selected sample of size m from the same population may be made with a specified confidence. Three different types of population are considered, namely: a) normally distributed with unknown standard deviation; b) normally distributed with known standard deviation; c) continuous but of unknown form. For each of these three types of population, two methods are presented, one for one-sided prediction intervals and one for symmetric two-sided prediction intervals. In all cases, there is a choice from among six confidence levels. The methods presented for cases a) and b) may also be used for non-normally distributed populations that can be transformed to normality. For cases a) and b) the tables presented in this part of ISO 16269 are restricted to prediction intervals containing all the further m sampled values of the variable. For case c) the tables relate to prediction intervals that contain at least m - r of the next m values, where r takes values from 0 to 10 or 0 to m - 1, whichever range is smaller. For normally distributed populations a procedure is also provided for calculating prediction intervals for the mean of m further observations.

Interprétation statistique des données - Partie 8: Détermination des intervalles de prédiction

L'ISO 16269-8:2004 spécifie des méthodes pour déterminer des intervalles de prédiction pour une variable unique dont la loi est continue. Ces intervalles sont des étendues de valeurs de la variable, calculées à partir d'un échantillon aléatoire d'effectif n, pour lesquelles une prédiction se rapportant à un nouvel échantillon aléatoire d'effectif m de la même population peut être faite avec une confiance spécifiée.
Trois différents types de population sont considérés, à loi normale avec écart-type inconnu, à loi normale avec écart-type connu, à loi continue mais de forme inconnue.
Pour chacun de ces trois types de population, deux méthodes sont présentées, l'une pour les intervalles de prédiction unilatéraux, l'autre pour les intervalles de prédiction bilatéraux symétriques. Tous les cas présentent un choix entre six niveaux de confiance.
Les méthodes présentées pour les cas à loi normale avec écart-type inconnu et à loi normale avec écart-type connu peuvent aussi être utilisées pour des populations distribuées selon des lois non normales qu'il est possible de transformer à la normalité.
Pour les cas à loi normale avec écart-type inconnu et à loi normale avec écart-type connu, les tableaux présentés sont limités aux intervalles de prédiction contenant toutes les nouvelles valeurs échantillonnées m de la variable. Pour le cas à loi continue mais de forme inconnue, les tableaux se rapportent à des intervalles de prédiction qui contiennent au moins m - r valeurs sur les m valeurs suivantes, où r prend les valeurs de 0 à 10 ou de 0 à m - 1, la plus petite étendue étant retenue.
Pour les populations à loi normale, une procédure est également donnée pour calculer les intervalles de prédiction relatifs à la moyenne de m nouvelles observations.

Statistično tolmačenje podatkov - 8. del: Ugotavljanje napovednih intervalov

Ta del ISO 16269 specificira metode ugotavljanja napovednih intervalov za eno konstantno porazdeljeno spremenljivko. Obstajajo razponi vrednosti spremenljivke, ki izhajajo iz naključnega vzorca velikosti n, za katerega je lahko ugotavljanje, ki se nanaša na nadaljnji naključno izbrani vzorec velikosti m iz iste populacije, izvedeno s specificiranim zaupanjem. Upoštevajo se trije različni tipi populacije, in sicer: a) normalno porazdeljena z neznano standardno deviacijo; b) normalno porazdeljen z znano standardno deviacijo; c) konstantna, vendar neznana oblika. Za vsakega od teh treh tipov populacije sta predstavljeni dve metodi, ena za enostranske napovedne intervale in druga za simetrične dvostranske napovedne intervale. V vseh primerih obstaja izbira med šestimi ravni zaupanja. Metode, predstavljene za primere a) in b), se lahko uporabljajo tudi za nenormalno porazdeljene populacije, ki se jih lahko preoblikuje v normalne. Za primere a) in b) so preglednice, predstavljene v tem delu ISO 16269, omejene na napovedne intervale, ki vsebujejo vse nadaljnje m vzorčene vrednosti spremenljivke. Za primer c) se preglednice nanašajo na napovedne intervale, ki vsebujejo vsaj m – r od naslednjih m vrednosti, pri čemer r zavzema vrednosti od 0 do 10 ali od 0 do m - 1, katerakoli je pač manjša. Za normalno porazdeljene populacije je podan tudi postopek za izračun napovednih intervalov za povprečje m nadaljnjih ugotovitev.

General Information

Status
Published
Publication Date
07-Jun-2010
Technical Committee
Current Stage
6060 - National Implementation/Publication (Adopted Project)
Start Date
31-May-2010
Due Date
05-Aug-2010
Completion Date
08-Jun-2010

Buy Standard

Standard
ISO 16269-8:2004 - Statistical interpretation of data
English language
108 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 16269-8:2010
English language
114 pages
sale 10% off
Preview
sale 10% off
Preview
e-Library read for
1 day
Standard
ISO 16269-8:2004 - Interprétation statistique des données
French language
108 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (Sample)

INTERNATIONAL ISO
STANDARD 16269-8
First edition
2004-09-15

Statistical interpretation of data —
Part 8:
Determination of prediction intervals
Interprétation statistique des données —
Partie 8: Détermination des intervalles de prédiction




Reference number
ISO 16269-8:2004(E)
©
ISO 2004

---------------------- Page: 1 ----------------------
ISO 16269-8:2004(E)
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.


©  ISO 2004
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland

ii © ISO 2004 – All rights reserved

---------------------- Page: 2 ----------------------
ISO 16269-8:2004(E)
Contents Page
Foreword. v
Introduction . vi
1 Scope. 1
2 Normative references . 1
3 Terms, definitions and symbols . 2
3.1 Terms and definitions. 2
3.2 Symbols . 2
4 Prediction intervals. 3
4.1 General. 3
4.2 Comparison with other types of statistical interval . 4
4.2.1 Choice of type of interval . 4
4.2.2 Comparison with a statistical tolerance interval . 4
4.2.3 Comparison with a confidence interval for the mean . 4
5 Prediction intervals for all observations in a further sample from a normally distributed
population with unknown population standard deviation. 4
5.1 One-sided intervals. 4
5.2 Symmetric two-sided intervals . 5
5.3 Prediction intervals for non-normally distributed populations that can be transformed
to normality. 5
5.4 Determination of a suitable initial sample size, n, for a given maximum value of
the prediction interval factor, k. 6
5.5 Determination of the confidence level corresponding to a given prediction interval . 6
6 Prediction intervals for all observations in a further sample from a normally distributed
population with known population standard deviation . 6
6.1 One-sided intervals. 6
6.2 Symmetric two-sided intervals . 7
6.3 Prediction intervals for non-normally distributed populations that can be transformed
to normality. 7
6.4 Determination of a suitable initial sample size, n, for a given value of k. 7
6.5 Determination of the confidence level corresponding to a given prediction interval . 8
7 Prediction intervals for the mean of a further sample from a normally distributed
population. 8
8 Distribution-free prediction intervals. 8
8.1 General. 8
8.2 One-sided intervals. 8
8.3 Two-sided intervals. 9
Annex A (normative) Tables of one-sided prediction interval factors, k, for unknown population
standard deviation . 13
Annex B (normative) Tables of two-sided prediction interval factors, k, for unknown population
standard deviation . 31
Annex C (normative) Tables of one-sided prediction interval factors, k, for known
population standard deviation. 49
Annex D (normative) Tables of two-sided prediction interval factors, k, for known
population standard deviation. 67
© ISO 2004 – All rights reserved iii

---------------------- Page: 3 ----------------------
ISO 16269-8:2004(E)
Annex E (normative) Tables of sample sizes for one-sided distribution-free prediction intervals .85
Annex F (normative) Tables of sample sizes for two-sided distribution-free prediction intervals.91
Annex G (normative) Interpolating in the tables .97
Annex H (informative) Statistical theory underlying the tables .101
Bibliography.108

iv © ISO 2004 – All rights reserved

---------------------- Page: 4 ----------------------
ISO 16269-8:2004(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 16269-8 was prepared by Technical Committee ISO/TC 69, Application of statistical methods.
ISO 16269 consists of the following parts, under the general title Statistical interpretation of data:
― Part 6: Determination of statistical tolerance intervals
― Part 7: Median — Estimation and confidence intervals
― Part 8: Determination of prediction intervals

© ISO 2004 – All rights reserved v

---------------------- Page: 5 ----------------------
ISO 16269-8:2004(E)
Introduction
Prediction intervals are of value wherever it is desired or required to predict the results of a future sample of a
given number of discrete items from the results of an earlier sample of items produced under identical
conditions. They are of particular use to engineers who need to be able to set limits on the performance of a
relatively small number of manufactured items. This is of increasing importance with the recent shift towards
small-scale production in some industries.
Despite the first review article on prediction intervals and their applications being published as long ago as
1973, there is still a surprising lack of awareness of their value, perhaps due in part to the inaccessibility of the
research work for the potential user, and also partly due to confusion with confidence intervals and statistical
tolerance intervals. The purpose of this part of ISO 16269 is therefore twofold:
 to clarify the differences between prediction intervals, confidence intervals and statistical tolerance
intervals;
 to provide procedures for some of the more useful types of prediction interval, supported by extensive,
newly-computed tables.
For information on prediction intervals that are outside the scope of this part of ISO 16269, the reader is
referred to the Bibliography.

vi © ISO 2004 – All rights reserved

---------------------- Page: 6 ----------------------
INTERNATIONAL STANDARD ISO 16269-8:2004(E)

Statistical interpretation of data —
Part 8:
Determination of prediction intervals
1 Scope
This part of ISO 16269 specifies methods of determining prediction intervals for a single continuously
distributed variable. These are ranges of values of the variable, derived from a random sample of size n, for
which a prediction relating to a further randomly selected sample of size m from the same population may be
made with a specified confidence.
Three different types of population are considered, namely:
a) normally distributed with unknown standard deviation;
b) normally distributed with known standard deviation;
c) continuous but of unknown form.
For each of these three types of population, two methods are presented, one for one-sided prediction intervals
and one for symmetric two-sided prediction intervals. In all cases, there is a choice from among six confidence
levels.
The methods presented for cases a) and b) may also be used for non-normally distributed populations that
can be transformed to normality.
For cases a) and b) the tables presented in this part of ISO 16269 are restricted to prediction intervals
containing all the further m sampled values of the variable. For case c) the tables relate to prediction intervals
that contain at least m – r of the next m values, where r takes values from 0 to 10 or 0 to m – 1, whichever
range is smaller.
For normally distributed populations a procedure is also provided for calculating prediction intervals for the
mean of m further observations.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
ISO 3534-1, Statistics — Vocabulary and symbols — Part 1: Probability and general statistical terms
ISO 3534-2, Statistics — Vocabulary and symbols — Part 2: Statistical quality control
© ISO 2004 – All rights reserved 1

---------------------- Page: 7 ----------------------
ISO 16269-8:2004(E)
3 Terms, definitions and symbols
3.1 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 3534-1 and ISO 3534-2 and the
following apply.
3.1.1
prediction interval
interval determined from a random sample from a population in such a way that one may have a specified
level of confidence that no fewer than a given number of values in a further random sample of a given size
from the same population will fall
NOTE In this context, the confidence level is the long-run proportion of intervals constructed in this manner that will
have this property.
3.1.2
order statistics
sample values identified by their position after ranking in non-decreasing order of magnitude
NOTE The sample values in order of selection are denoted in this part of ISO 16269 by x , x , …, x . After arranging
1 2 n
in non-decreasing order, they are denoted by x , x , …, x , where x u x u … u x . The word “non-decreasing” is
[1] [2] [n] [1] [2] [n]
used in preference to “increasing” to include the case where two or more values are equal, at least to within measurement
error. Sample values that are equal to one another are assigned distinct, contiguous integer subscripts in square brackets
when represented as order statistics.
3.2 Symbols
a lower limit to the values of the variable in the population
α nominal maximum probability that more than r observations from the further random sample of size m
will lie outside the prediction interval
b upper limit to the values of the variable in the population
C confidence level expressed as a percentage: C = 100 (1 – α)
k prediction interval factor
m size of further random sample to which the prediction applies
n size of random sample from which the prediction interval is derived
n
2
s sample standard deviation: sx=−x n−1
() ( )
i

i = 1
r specified maximum number of observations from the further random sample of size m that will not lie in
the prediction interval
T lower prediction limit
1
T upper prediction limit
2
x ith observation in a random sample
i
x ith order statistic
[i]
2 © ISO 2004 – All rights reserved

---------------------- Page: 8 ----------------------
ISO 16269-8:2004(E)
n
x sample mean: xx= n
i

i = 1
4 Prediction intervals
4.1 General
A two-sided prediction interval is an interval of the form (T , T ), where T < T ; T and T are derived from a
1 2 1 2 1 2
random sample of size n and are called the lower and upper prediction limits, respectively.
If a and b are respectively the lower and upper limits of the variable in the population, a one-sided prediction
interval will be of the form (T , b) or (a, T ).
1 2
NOTE 1 For practical purposes a is often taken to be zero for variables that cannot be negative, and b is often taken to
be infinity for variables with no natural upper limit.
NOTE 2 Sometimes a population is treated as normal for the purpose of determining a prediction interval, even when it
has a finite limit. This may seem incongruous, as the normal distribution ranges from minus infinity to plus infinity.
However, in practice, many populations with a finite limit are closely approximated by a normal distribution.
The practical meaning of a prediction interval relating to individual sample values is that the experimenter
claims that a further random sample of m values from the same population will have at most r values not lying
in the interval, while admitting a small nominal probability that this assertion may be wrong. The nominal
probability that an interval constructed in such a way satisfies the claim is called the confidence level.
The practical meaning of a prediction interval relating to a sample mean is that the experimenter claims that
the mean of a further random sample of m values from the same population will lie in the interval, while
admitting a small nominal probability that this assertion may be wrong. Again, the nominal probability that an
interval constructed in such a way satisfies the claim is called the confidence level.
This part of ISO 16269 presents procedures applicable to a normally distributed population for r = 0 and
procedures applicable to the mean of a further sample from a normally distributed population. It also provides
procedures applicable to populations of unknown distributional form for r = 0, 1, …, 10 or 0 to m – 1,
whichever range is smaller. In all cases, the tables present prediction interval factors or sample sizes that
provide at least the stated level of confidence. In general, the actual confidence level is marginally greater
than the stated level.
The limits of the prediction intervals for normally distributed populations are at a distance of k times the
sample standard deviation (or, where known, the population standard deviation) from the sample mean, where
k is the prediction interval factor. In the case of unknown population standard deviation, the value of k
becomes very large for small values of n in combination with large values of m and high levels of confidence.
Use of large values of k, for example in excess of 10 or 15, should be avoided whenever possible, as the
resulting prediction intervals are likely to be too wide to be of any practical use, other than to indicate that the
initial sample was too small to yield any useful information about future values. Moreover, for large values of k
the integrity of the resulting prediction intervals could be badly compromised by even small departures from
normality. Values of k up to 250 are included in the tables primarily to show how rapidly k decreases as the
initial sample size n increases.
For prediction intervals relating to the individual values in a further sample, Form A may be used to organize
the calculations for a normally distributed population and Form C when the population is of unknown
distributional form. Form B is provided to assist with the calculation of a prediction interval for the mean of a
further sample from a normally distributed population.
Annexes A to D provide tables of prediction interval factors. Annexes E and F provide tables of sample sizes
required when the population is of unknown distributional form. Annex G gives the procedure for interpolating
in the tables when the required combination of n, m and confidence level is not tabulated. Annex H presents
the statistical theory underlying the tables.
© ISO 2004 – All rights reserved 3

---------------------- Page: 9 ----------------------
ISO 16269-8:2004(E)
4.2 Comparison with other types of statistical interval
4.2.1 Choice of type of interval
In practice, it is often the case that predictions are required for a finite number of observations based on the
results of an initial random sample. These are the circumstances under which this part of ISO 16269 is
appropriate. There is sometimes confusion with other types of statistical interval. Subclauses 4.2.2 and 4.2.3
are presented in order to clarify the distinctions.
4.2.2 Comparison with a statistical tolerance interval
A prediction interval for individual sample values is an interval, derived from a random sample from a
population, about which a confidence statement may be made concerning the maximum number of values in a
further random sample from the population that will lie outside the interval. A statistical tolerance interval (such
as that defined in ISO 16269-6) is also an interval derived from a random sample from a population for which
a confidence statement may be made; however, the statement in this case relates to the maximum proportion
of values in the population lying outside the interval (or, equivalently, to the minimum proportion of values in
the population lying inside the interval).
NOTE 1 A statistical tolerance interval constant is the limit of a prediction interval constant as the future sample size, m,
tends to infinity while the number, r, of items in the future sample falling outside the interval remains a constant fraction
of m, provided r > 0. This is illustrated in Table 1 for a 95 % confidence level for one-sided and two-sided intervals when
r/m = 0,1.
However, there is no such analogy between statistical tolerance interval constants and prediction interval constants for
r = 0, the case on which this part of ISO 16269 is primarily focussed.
Table 1 — Example of prediction interval constants
r 1 2 5 10 20 50 100 1 000 Statistical tolerance
interval constants for
m 10 20 50 100 200 500 1 000 10 000
a minimum proportion
of 0,9 of the population
Prediction interval constants covered
One-sided
1,887 1,846 1,767 1,718 1,686 1,663 1,655 1,647 1,646
intervals
Two-sided
2,208 2,172 2,103 2,061 2,034 2,014 2,007 2,000 2,000
intervals
NOTE 2 The case r = 0 is particularly important in applications related to safety.
4.2.3 Comparison with a confidence interval for the mean
A prediction interval for a mean is an interval, derived from a random sample from a population, for which it
may be asserted with a given level of confidence that the mean of a further random sample of specified size
will lie. A confidence interval for a mean (such as that defined in ISO 2602) is also an interval derived from a
random sample from a population for which a confidence statement may be made; however, the statement in
this case relates to the mean of the population.
5 Prediction intervals for all observations in a further sample from a normally
distributed population with unknown population standard deviation
5.1 One-sided intervals
A one-sided prediction interval relating to a normally distributed population with unknown population standard
deviation is of the form (,xk−sb) or (,ax +ks) where the values of the sample mean x and the sample
standard deviation s are determined from a random sample of size n from the population. The prediction
4 © ISO 2004 – All rights reserved

---------------------- Page: 10 ----------------------
ISO 16269-8:2004(E)
interval factor k depends on n, on the further sample size m and on the confidence level C; values of k are
presented in Annex A.
EXAMPLE The pressures in gun barrels caused by firing artillery shells of a given type are known from past
experience to be closely approximated by a normal distribution. A sample of 20 rounds has a mean pressure of 562,3 MPa
and a standard deviation of pressure of 8,65 MPa. A batch of 5 000 further rounds in total is to be produced under
identical manufacturing conditions. What barrel pressure can one be 95 % confident will not be exceeded by any of the
5 000 shells fired under identical conditions ?
Table A.2 provides prediction interval factors at the 95 % confidence level. From Table A.2 it is found that the appropriate
prediction interval factor is k = 5,251. The upper limit to a one-sided prediction interval at 95 % confidence is therefore
xk+=s 562,3+ 5,251× 8,65= 607,7 MPa
Hence one may be 95 % confident that none of the batch of 5 000 rounds will produce a barrel pressure in excess of
607,7 MPa.
This example is also used to illustrate the use of Form A.
5.2 Symmetric two-sided intervals
A symmetric two-sided prediction interval for a normally distributed population with unknown population
standard deviation is of the form (,xk−+sx ks). The prediction interval factor k depends on n, on the further
sample size m and on the confidence level C; values of k are presented in Annex B.
EXAMPLE The time to detonation of a particular type of hand grenade after the pin has been removed is known to
have an approximate normal distribution. A random sample of size 30 is drawn and tested, and the times to detonation are
recorded. The sample mean time is 5,140 s and the sample standard deviation is 0,241 s. A symmetric two-sided
prediction interval is required for all of the next lot of 10 000 grenades at 99 % confidence.
Table B.4 provides prediction interval factors at the 99 % confidence level. Entering Table B.4 with n = 30 and m = 10 000
yields the value k = 6,059. The symmetric prediction interval is
(xk−+s,x ks)= (5,140− 6,059× 0,241, 5,140+ 6,059× 0,241)= (3,68, 6,60)
One may therefore be 99 % confident that none of the next lot of 10 000 grenades will have a time to detonation outside
the range 3,68 s to 6,60 s.
5.3 Prediction intervals for non-normally distributed populations that can be transformed
to normality
For non-normally distributed populations that can be transformed to normality, first the procedures for normally
distributed populations are applied to the transformed data; the prediction interval is then found by applying
the inverse transformation to the resulting prediction limits.
EXAMPLE Suppose that for the data of the example in 5.2 it is known instead that times to detonation are
approximately log-normally distributed, i.e. the logarithm of the time to detonation is approximately normally distributed.
The sample times x , x , …, x are accordingly transformed to normality by taking their natural logarithms, namely y = In x
1 2 n i i
for i = 1, 2, …, 30. Suppose that the sample mean of the transformed data is y = 1,60 and the sample standard deviation
is s = 0,05. The prediction interval factor for 99 % confidence that none of the next 10 000 times falls outside a two-sided
y
interval is, of course, unchanged at k = 6,059. The symmetric prediction interval for the transformed data is
(yk−+s , y ks )= (1,60− 6,059×0,05, 1,60+ 6,059×0,05)= (1,297, 1,903)
yy
The units of measurement of y are log-seconds. The inverse transformation to convert the units back to seconds is
exponentiation. The prediction interval at 99 % confidence for the time to detonation of all of the next ten thousand
grenades is therefore
1,297 1,903
e , e = (3,66, 6,71) s
()
NOTE 1 The same result would have been obtained using logarithms to any other base, provided that the antilogarithm
to the same base is used when converting back to the original units.
© ISO 2004 – All rights reserved 5

---------------------- Page: 11 ----------------------
ISO 16269-8:2004(E)
NOTE 2 When a two-sided prediction interval is determined in accordance with 5.2 or 6.2, its limits for normally
distributed populations are symmetric about (i.e. equidistant from) the estimated median of the population. This symmetry
is lost for non-normally distributed populations that are transformed to normality in accordance with 5.3 or 6.3.
5.4 Determination of a suitable initial sample size, n, for a given maximum value of
the prediction interval factor, k
Sometimes the confidence level, future sample size m and approximate desired value of the prediction interval
factor are given and it is required to determine the initial sample size n. Locate the table for the given
confidence level and the sidedness of the prediction interval (i.e. one of the tables in Annex A for a one-sided
interval or one of the tables in Annex B for two-sided intervals) and find the column for the given value of m.
Look down this column until the first value of k no greater than the given maximum is found. The value of n in
the leftmost column of this row of the table gives the required initial sample size.
NOTE If the entry at the bottom of this column exceeds the maximum acceptable value of k then there is no initial
sample size large enough to satisfy the requirement. A reduction in the confidence level should be considered.
EXAMPLE Consider a situation in acceptance sampling in which, prior to the use of this part of ISO 16269, it has
been the practice to accept lots of size 5 000 whenever xs+ 4,75 u 0,1, where x is the normally distributed porosity of a
sintered component and x and s are the sample mean and sample standard deviation based on a random sample of
size 30 from a normally distributed population. Suppose that it has been decided to replace this acceptance criterion with
one that will provide 95 % confidence that none of the items in the lot
...

SLOVENSKI STANDARD
SIST ISO 16269-8:2010
01-julij-2010
6WDWLVWLþQRWROPDþHQMHSRGDWNRYGHO8JRWDYOMDQMHQDSRYHGQLKLQWHUYDORY
Statistical interpretation of data - Part 8: Determination of prediction intervals
Interprétation statistique des données - Partie 8: Détermination des intervalles de
prédiction
Ta slovenski standard je istoveten z: ISO 16269-8:2004
ICS:
03.120.30 8SRUDEDVWDWLVWLþQLKPHWRG Application of statistical
methods
SIST ISO 16269-8:2010 en
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

---------------------- Page: 1 ----------------------

SIST ISO 16269-8:2010

---------------------- Page: 2 ----------------------

SIST ISO 16269-8:2010


INTERNATIONAL ISO
STANDARD 16269-8
First edition
2004-09-15

Statistical interpretation of data —
Part 8:
Determination of prediction intervals
Interprétation statistique des données —
Partie 8: Détermination des intervalles de prédiction




Reference number
ISO 16269-8:2004(E)
©
ISO 2004

---------------------- Page: 3 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.


©  ISO 2004
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland

ii © ISO 2004 – All rights reserved

---------------------- Page: 4 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
Contents Page
Foreword. v
Introduction . vi
1 Scope. 1
2 Normative references . 1
3 Terms, definitions and symbols . 2
3.1 Terms and definitions. 2
3.2 Symbols . 2
4 Prediction intervals. 3
4.1 General. 3
4.2 Comparison with other types of statistical interval . 4
4.2.1 Choice of type of interval . 4
4.2.2 Comparison with a statistical tolerance interval . 4
4.2.3 Comparison with a confidence interval for the mean . 4
5 Prediction intervals for all observations in a further sample from a normally distributed
population with unknown population standard deviation. 4
5.1 One-sided intervals. 4
5.2 Symmetric two-sided intervals . 5
5.3 Prediction intervals for non-normally distributed populations that can be transformed
to normality. 5
5.4 Determination of a suitable initial sample size, n, for a given maximum value of
the prediction interval factor, k. 6
5.5 Determination of the confidence level corresponding to a given prediction interval . 6
6 Prediction intervals for all observations in a further sample from a normally distributed
population with known population standard deviation . 6
6.1 One-sided intervals. 6
6.2 Symmetric two-sided intervals . 7
6.3 Prediction intervals for non-normally distributed populations that can be transformed
to normality. 7
6.4 Determination of a suitable initial sample size, n, for a given value of k. 7
6.5 Determination of the confidence level corresponding to a given prediction interval . 8
7 Prediction intervals for the mean of a further sample from a normally distributed
population. 8
8 Distribution-free prediction intervals. 8
8.1 General. 8
8.2 One-sided intervals. 8
8.3 Two-sided intervals. 9
Annex A (normative) Tables of one-sided prediction interval factors, k, for unknown population
standard deviation . 13
Annex B (normative) Tables of two-sided prediction interval factors, k, for unknown population
standard deviation . 31
Annex C (normative) Tables of one-sided prediction interval factors, k, for known
population standard deviation. 49
Annex D (normative) Tables of two-sided prediction interval factors, k, for known
population standard deviation. 67
© ISO 2004 – All rights reserved iii

---------------------- Page: 5 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
Annex E (normative) Tables of sample sizes for one-sided distribution-free prediction intervals .85
Annex F (normative) Tables of sample sizes for two-sided distribution-free prediction intervals.91
Annex G (normative) Interpolating in the tables .97
Annex H (informative) Statistical theory underlying the tables .101
Bibliography.108

iv © ISO 2004 – All rights reserved

---------------------- Page: 6 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 16269-8 was prepared by Technical Committee ISO/TC 69, Application of statistical methods.
ISO 16269 consists of the following parts, under the general title Statistical interpretation of data:
― Part 6: Determination of statistical tolerance intervals
― Part 7: Median — Estimation and confidence intervals
― Part 8: Determination of prediction intervals

© ISO 2004 – All rights reserved v

---------------------- Page: 7 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
Introduction
Prediction intervals are of value wherever it is desired or required to predict the results of a future sample of a
given number of discrete items from the results of an earlier sample of items produced under identical
conditions. They are of particular use to engineers who need to be able to set limits on the performance of a
relatively small number of manufactured items. This is of increasing importance with the recent shift towards
small-scale production in some industries.
Despite the first review article on prediction intervals and their applications being published as long ago as
1973, there is still a surprising lack of awareness of their value, perhaps due in part to the inaccessibility of the
research work for the potential user, and also partly due to confusion with confidence intervals and statistical
tolerance intervals. The purpose of this part of ISO 16269 is therefore twofold:
 to clarify the differences between prediction intervals, confidence intervals and statistical tolerance
intervals;
 to provide procedures for some of the more useful types of prediction interval, supported by extensive,
newly-computed tables.
For information on prediction intervals that are outside the scope of this part of ISO 16269, the reader is
referred to the Bibliography.

vi © ISO 2004 – All rights reserved

---------------------- Page: 8 ----------------------

SIST ISO 16269-8:2010
INTERNATIONAL STANDARD ISO 16269-8:2004(E)

Statistical interpretation of data —
Part 8:
Determination of prediction intervals
1 Scope
This part of ISO 16269 specifies methods of determining prediction intervals for a single continuously
distributed variable. These are ranges of values of the variable, derived from a random sample of size n, for
which a prediction relating to a further randomly selected sample of size m from the same population may be
made with a specified confidence.
Three different types of population are considered, namely:
a) normally distributed with unknown standard deviation;
b) normally distributed with known standard deviation;
c) continuous but of unknown form.
For each of these three types of population, two methods are presented, one for one-sided prediction intervals
and one for symmetric two-sided prediction intervals. In all cases, there is a choice from among six confidence
levels.
The methods presented for cases a) and b) may also be used for non-normally distributed populations that
can be transformed to normality.
For cases a) and b) the tables presented in this part of ISO 16269 are restricted to prediction intervals
containing all the further m sampled values of the variable. For case c) the tables relate to prediction intervals
that contain at least m – r of the next m values, where r takes values from 0 to 10 or 0 to m – 1, whichever
range is smaller.
For normally distributed populations a procedure is also provided for calculating prediction intervals for the
mean of m further observations.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
ISO 3534-1, Statistics — Vocabulary and symbols — Part 1: Probability and general statistical terms
ISO 3534-2, Statistics — Vocabulary and symbols — Part 2: Statistical quality control
© ISO 2004 – All rights reserved 1

---------------------- Page: 9 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
3 Terms, definitions and symbols
3.1 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 3534-1 and ISO 3534-2 and the
following apply.
3.1.1
prediction interval
interval determined from a random sample from a population in such a way that one may have a specified
level of confidence that no fewer than a given number of values in a further random sample of a given size
from the same population will fall
NOTE In this context, the confidence level is the long-run proportion of intervals constructed in this manner that will
have this property.
3.1.2
order statistics
sample values identified by their position after ranking in non-decreasing order of magnitude
NOTE The sample values in order of selection are denoted in this part of ISO 16269 by x , x , …, x . After arranging
1 2 n
in non-decreasing order, they are denoted by x , x , …, x , where x u x u … u x . The word “non-decreasing” is
[1] [2] [n] [1] [2] [n]
used in preference to “increasing” to include the case where two or more values are equal, at least to within measurement
error. Sample values that are equal to one another are assigned distinct, contiguous integer subscripts in square brackets
when represented as order statistics.
3.2 Symbols
a lower limit to the values of the variable in the population
α nominal maximum probability that more than r observations from the further random sample of size m
will lie outside the prediction interval
b upper limit to the values of the variable in the population
C confidence level expressed as a percentage: C = 100 (1 – α)
k prediction interval factor
m size of further random sample to which the prediction applies
n size of random sample from which the prediction interval is derived
n
2
s sample standard deviation: sx=−x n−1
() ( )
i

i = 1
r specified maximum number of observations from the further random sample of size m that will not lie in
the prediction interval
T lower prediction limit
1
T upper prediction limit
2
x ith observation in a random sample
i
x ith order statistic
[i]
2 © ISO 2004 – All rights reserved

---------------------- Page: 10 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
n
x sample mean: xx= n
i

i = 1
4 Prediction intervals
4.1 General
A two-sided prediction interval is an interval of the form (T , T ), where T < T ; T and T are derived from a
1 2 1 2 1 2
random sample of size n and are called the lower and upper prediction limits, respectively.
If a and b are respectively the lower and upper limits of the variable in the population, a one-sided prediction
interval will be of the form (T , b) or (a, T ).
1 2
NOTE 1 For practical purposes a is often taken to be zero for variables that cannot be negative, and b is often taken to
be infinity for variables with no natural upper limit.
NOTE 2 Sometimes a population is treated as normal for the purpose of determining a prediction interval, even when it
has a finite limit. This may seem incongruous, as the normal distribution ranges from minus infinity to plus infinity.
However, in practice, many populations with a finite limit are closely approximated by a normal distribution.
The practical meaning of a prediction interval relating to individual sample values is that the experimenter
claims that a further random sample of m values from the same population will have at most r values not lying
in the interval, while admitting a small nominal probability that this assertion may be wrong. The nominal
probability that an interval constructed in such a way satisfies the claim is called the confidence level.
The practical meaning of a prediction interval relating to a sample mean is that the experimenter claims that
the mean of a further random sample of m values from the same population will lie in the interval, while
admitting a small nominal probability that this assertion may be wrong. Again, the nominal probability that an
interval constructed in such a way satisfies the claim is called the confidence level.
This part of ISO 16269 presents procedures applicable to a normally distributed population for r = 0 and
procedures applicable to the mean of a further sample from a normally distributed population. It also provides
procedures applicable to populations of unknown distributional form for r = 0, 1, …, 10 or 0 to m – 1,
whichever range is smaller. In all cases, the tables present prediction interval factors or sample sizes that
provide at least the stated level of confidence. In general, the actual confidence level is marginally greater
than the stated level.
The limits of the prediction intervals for normally distributed populations are at a distance of k times the
sample standard deviation (or, where known, the population standard deviation) from the sample mean, where
k is the prediction interval factor. In the case of unknown population standard deviation, the value of k
becomes very large for small values of n in combination with large values of m and high levels of confidence.
Use of large values of k, for example in excess of 10 or 15, should be avoided whenever possible, as the
resulting prediction intervals are likely to be too wide to be of any practical use, other than to indicate that the
initial sample was too small to yield any useful information about future values. Moreover, for large values of k
the integrity of the resulting prediction intervals could be badly compromised by even small departures from
normality. Values of k up to 250 are included in the tables primarily to show how rapidly k decreases as the
initial sample size n increases.
For prediction intervals relating to the individual values in a further sample, Form A may be used to organize
the calculations for a normally distributed population and Form C when the population is of unknown
distributional form. Form B is provided to assist with the calculation of a prediction interval for the mean of a
further sample from a normally distributed population.
Annexes A to D provide tables of prediction interval factors. Annexes E and F provide tables of sample sizes
required when the population is of unknown distributional form. Annex G gives the procedure for interpolating
in the tables when the required combination of n, m and confidence level is not tabulated. Annex H presents
the statistical theory underlying the tables.
© ISO 2004 – All rights reserved 3

---------------------- Page: 11 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
4.2 Comparison with other types of statistical interval
4.2.1 Choice of type of interval
In practice, it is often the case that predictions are required for a finite number of observations based on the
results of an initial random sample. These are the circumstances under which this part of ISO 16269 is
appropriate. There is sometimes confusion with other types of statistical interval. Subclauses 4.2.2 and 4.2.3
are presented in order to clarify the distinctions.
4.2.2 Comparison with a statistical tolerance interval
A prediction interval for individual sample values is an interval, derived from a random sample from a
population, about which a confidence statement may be made concerning the maximum number of values in a
further random sample from the population that will lie outside the interval. A statistical tolerance interval (such
as that defined in ISO 16269-6) is also an interval derived from a random sample from a population for which
a confidence statement may be made; however, the statement in this case relates to the maximum proportion
of values in the population lying outside the interval (or, equivalently, to the minimum proportion of values in
the population lying inside the interval).
NOTE 1 A statistical tolerance interval constant is the limit of a prediction interval constant as the future sample size, m,
tends to infinity while the number, r, of items in the future sample falling outside the interval remains a constant fraction
of m, provided r > 0. This is illustrated in Table 1 for a 95 % confidence level for one-sided and two-sided intervals when
r/m = 0,1.
However, there is no such analogy between statistical tolerance interval constants and prediction interval constants for
r = 0, the case on which this part of ISO 16269 is primarily focussed.
Table 1 — Example of prediction interval constants
r 1 2 5 10 20 50 100 1 000 Statistical tolerance
interval constants for
m 10 20 50 100 200 500 1 000 10 000
a minimum proportion
of 0,9 of the population
Prediction interval constants covered
One-sided
1,887 1,846 1,767 1,718 1,686 1,663 1,655 1,647 1,646
intervals
Two-sided
2,208 2,172 2,103 2,061 2,034 2,014 2,007 2,000 2,000
intervals
NOTE 2 The case r = 0 is particularly important in applications related to safety.
4.2.3 Comparison with a confidence interval for the mean
A prediction interval for a mean is an interval, derived from a random sample from a population, for which it
may be asserted with a given level of confidence that the mean of a further random sample of specified size
will lie. A confidence interval for a mean (such as that defined in ISO 2602) is also an interval derived from a
random sample from a population for which a confidence statement may be made; however, the statement in
this case relates to the mean of the population.
5 Prediction intervals for all observations in a further sample from a normally
distributed population with unknown population standard deviation
5.1 One-sided intervals
A one-sided prediction interval relating to a normally distributed population with unknown population standard
deviation is of the form (,xk−sb) or (,ax +ks) where the values of the sample mean x and the sample
standard deviation s are determined from a random sample of size n from the population. The prediction
4 © ISO 2004 – All rights reserved

---------------------- Page: 12 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
interval factor k depends on n, on the further sample size m and on the confidence level C; values of k are
presented in Annex A.
EXAMPLE The pressures in gun barrels caused by firing artillery shells of a given type are known from past
experience to be closely approximated by a normal distribution. A sample of 20 rounds has a mean pressure of 562,3 MPa
and a standard deviation of pressure of 8,65 MPa. A batch of 5 000 further rounds in total is to be produced under
identical manufacturing conditions. What barrel pressure can one be 95 % confident will not be exceeded by any of the
5 000 shells fired under identical conditions ?
Table A.2 provides prediction interval factors at the 95 % confidence level. From Table A.2 it is found that the appropriate
prediction interval factor is k = 5,251. The upper limit to a one-sided prediction interval at 95 % confidence is therefore
xk+=s 562,3+ 5,251× 8,65= 607,7 MPa
Hence one may be 95 % confident that none of the batch of 5 000 rounds will produce a barrel pressure in excess of
607,7 MPa.
This example is also used to illustrate the use of Form A.
5.2 Symmetric two-sided intervals
A symmetric two-sided prediction interval for a normally distributed population with unknown population
standard deviation is of the form (,xk−+sx ks). The prediction interval factor k depends on n, on the further
sample size m and on the confidence level C; values of k are presented in Annex B.
EXAMPLE The time to detonation of a particular type of hand grenade after the pin has been removed is known to
have an approximate normal distribution. A random sample of size 30 is drawn and tested, and the times to detonation are
recorded. The sample mean time is 5,140 s and the sample standard deviation is 0,241 s. A symmetric two-sided
prediction interval is required for all of the next lot of 10 000 grenades at 99 % confidence.
Table B.4 provides prediction interval factors at the 99 % confidence level. Entering Table B.4 with n = 30 and m = 10 000
yields the value k = 6,059. The symmetric prediction interval is
(xk−+s,x ks)= (5,140− 6,059× 0,241, 5,140+ 6,059× 0,241)= (3,68, 6,60)
One may therefore be 99 % confident that none of the next lot of 10 000 grenades will have a time to detonation outside
the range 3,68 s to 6,60 s.
5.3 Prediction intervals for non-normally distributed populations that can be transformed
to normality
For non-normally distributed populations that can be transformed to normality, first the procedures for normally
distributed populations are applied to the transformed data; the prediction interval is then found by applying
the inverse transformation to the resulting prediction limits.
EXAMPLE Suppose that for the data of the example in 5.2 it is known instead that times to detonation are
approximately log-normally distributed, i.e. the logarithm of the time to detonation is approximately normally distributed.
The sample times x , x , …, x are accordingly transformed to normality by taking their natural logarithms, namely y = In x
1 2 n i i
for i = 1, 2, …, 30. Suppose that the sample mean of the transformed data is y = 1,60 and the sample standard deviation
is s = 0,05. The prediction interval factor for 99 % confidence that none of the next 10 000 times falls outside a two-sided
y
interval is, of course, unchanged at k = 6,059. The symmetric prediction interval for the transformed data is
(yk−+s , y ks )= (1,60− 6,059×0,05, 1,60+ 6,059×0,05)= (1,297, 1,903)
yy
The units of measurement of y are log-seconds. The inverse transformation to convert the units back to seconds is
exponentiation. The prediction interval at 99 % confidence for the time to detonation of all of the next ten thousand
grenades is therefore
1,297 1,903
e , e = (3,66, 6,71) s
()
NOTE 1 The same result would have been obtained using logarithms to any other base, provided that the antilogarithm
to the same base is used when converting back to the original units.
© ISO 2004 – All rights reserved 5

---------------------- Page: 13 ----------------------

SIST ISO 16269-8:2010
ISO 16269-8:2004(E)
NOTE 2 When a two-sided prediction interval is determined in accordance with 5.2 or 6.2, its limits for normally
distributed populations are symmetric about (i.e. equidistant from) the estimated median of the population. This symmetry
is lost for non-normally distributed populations that are transformed to normality in accordance with 5.3 or 6.3.
5.4 Determination of a suitable initial sample size, n, for a given maximum value of
the prediction interval factor, k
Sometimes the confidence level, future sample size m and approximate desired value of the prediction interval
factor are given and it is required to determine the initial sample size n. Locate the table for the given
confidence level and the sidedness of the prediction interval (i.e. one of the tables in Annex A for a one-sided
interval or one of the tables in Annex B for two-sided intervals) and
...

NORME ISO
INTERNATIONALE 16269-8
Première édition
2004-09-15


Interprétation statistique des données —
Partie 8:
Détermination des intervalles de
prédiction
Statistical interpretation of data —
Part 8: Determination of prediction intervals




Numéro de référence
ISO 16269-8:2004(F)
©
ISO 2004

---------------------- Page: 1 ----------------------
ISO 16269-8:2004(F)
PDF – Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info
du fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir
l'exploitation de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation,
veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.


©  ISO 2004
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l'accord écrit
de l'ISO à l'adresse ci-après ou du comité membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax. + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse

ii © ISO 2004 – Tous droits réservés

---------------------- Page: 2 ----------------------
ISO 16269-8:2004(F)
Sommaire Page
Avant-propos. v
Introduction . vi
1 Domaine d'application. 1
2 Références normatives. 1
3 Termes, définitions et symboles . 2
3.1 Termes et définitions . 2
3.2 Symboles . 2
4 Intervalles de prédiction. 3
4.1 Généralités. 3
4.2 Comparaison avec d'autres types d'intervalles statistiques. 4
4.2.1 Choix du type d'intervalle . 4
4.2.2 Comparaison avec un intervalle statistique de tolérance . 4
4.2.3 Comparaison avec un intervalle de confiance relatif à la moyenne. 4
5 Intervalles de prédiction relatifs à toutes les observations d'un nouvel échantillon d'une
population de distribution normale dont l'écart-type est inconnu . 5
5.1 Intervalles unilatéraux . 5
5.2 Intervalles bilatéraux symétriques . 5
5.3 Intervalles de prédiction relatifs à des populations non normales qui peuvent être
transformées à la normalité . 5
5.4 Détermination d'un effectif approprié, n, de l'échantillon initial, pour une valeur maximale
donnée du coefficient d'intervalle de prédiction, k. 6
5.5 Détermination de l'intervalle de confiance correspondant à un intervalle de prédiction
donné. 6
6 Intervalles de prédiction pour toutes les observations d'un nouvel échantillon d'une
population de distribution normale dont l'écart-type est connu . 7
6.1 Intervalles unilatéraux . 7
6.2 Intervalles bilatéraux symétriques . 7
6.3 Intervalles de prédiction pour des populations non normales qui peuvent être
transformées à la normalité . 7
6.4 Détermination d'un effectif approprié, n, de l'échantillon initial pour une valeur donnée
de k. 8
6.5 Détermination du niveau de confiance correspondant à un intervalle de prédiction donné. 8
7 Intervalles de prédiction relatifs à la moyenne d'un nouvel échantillon d'une population
de distribution normale . 8
8 Intervalles de prédiction non paramétriques .8
8.1 Généralités. 8
8.2 Intervalles unilatéraux . 9
8.3 Intervalles bilatéraux . 9
Annexe A (normative) Tableaux des coefficients d'intervalles de prédiction unilatéraux, k, pour un
écart-type inconnu de la population . 13
Annexe B (normative) Tableaux des coefficients d'intervalles de prédiction bilatéraux, k, pour un
écart-type inconnu de la population . 31
Annexe C (normative) Tableaux de coefficients d'intervalles de prédiction unilatéraux, k, pour un
écart-type connu de la population . 49
Annexe D (normative) Tableaux de coefficients d'intervalles de prédiction bilatéraux, k,
pour un écart-type connu de la population. 67
© ISO 2004 – Tous droits réservés iii

---------------------- Page: 3 ----------------------
ISO 16269-8:2004(F)
Annexe E (normative) Tableaux d'effectifs d'échantillon pour les intervalles de prédiction
non paramétriques unilatéraux.85
Annexe F (normative) Tableaux d'effectifs d'échantillon pour les intervalles de prédiction
non paramétriques bilatéraux .91
Annexe G (normative) Interpolation dans les tableaux .97
Annexe H (informative) Théorie statistique sous-jacente aux tableaux.101
Bibliographie.108

iv © ISO 2004 – Tous droits réservés

---------------------- Page: 4 ----------------------
ISO 16269-8:2004(F)
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de
normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée
aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du
comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec
la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur
publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres
votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne
pas avoir identifié de tels droits de propriété et averti de leur existence.
L'ISO 16269-8 a été élaborée par le comité technique ISO/TC 69, Application des méthodes statistiques.
L'ISO 16269 comprend les parties suivantes, présentées sous le titre général Interprétation statistique des
données:
 Partie 6: Détermination des intervalles statistiques de tolérance
 Partie 7: Médiane — Estimation et intervalles de confiance
 Partie 8: Détermination des intervalles de prédiction

© ISO 2004 – Tous droits réservés v

---------------------- Page: 5 ----------------------
ISO 16269-8:2004(F)
Introduction
Les intervalles de prédiction sont précieux lorsqu'il est souhaité ou exigé de prédire les résultats sur un
échantillon futur d'un nombre donné d'éléments discrets, à partir des résultats obtenus sur un échantillon
antérieur d'éléments produits dans des conditions identiques. Ils sont particulièrement utiles pour les
ingénieurs qui doivent pouvoir établir des limites sur la performance d'un nombre relativement petit d'éléments
manufacturés. Cet aspect revêt une importance croissante compte tenu du passage récent, dans certaines
industries, à la production à petite échelle.
Bien que le premier compte rendu sur les intervalles de prédiction et leurs applications remonte à 1973, un
manque de conscience quant à leur valeur subsiste, ce qui est peut être dû en partie au fait que les travaux
de recherche sont difficiles d'accès pour l'utilisateur potentiel et en partie à une confusion avec les intervalles
de confiance et les intervalles statistiques de tolérance. L'objectif de la présente partie de l'ISO 16269 est
donc double:
 préciser les différences entre intervalles de prédiction, intervalles de confiance et intervalles statistiques
de tolérance;
 définir des procédures pour certain des types les plus utiles d'intervalles de prédiction, avec l'appui de
tables détaillées qui ont été récemment calculées.
Pour des informations sur les intervalles de prédiction n’entrant pas dans le domaine d'application de la
présente partie de l'ISO 16269, le lecteur peut se référer à la Bibliographie.

vi © ISO 2004 – Tous droits réservés

---------------------- Page: 6 ----------------------
NORME INTERNATIONALE ISO 16269-8:2004(F)

Interprétation statistique des données —
Partie 8:
Détermination des intervalles de prédiction
1 Domaine d'application
La présente partie de l'ISO 16269 spécifie des méthodes pour déterminer des intervalles de prédiction pour
une variable unique dont la loi est continue. Ces intervalles sont des étendues de valeurs de la variable,
calculées à partir d'un échantillon aléatoire d'effectif n, pour lesquelles une prédiction se rapportant à un
nouvel échantillon aléatoire d'effectif m de la même population peut être faite avec une confiance spécifiée.
Trois différents types de population sont considérés, à savoir:
a) à loi normale avec écart-type inconnu;
b) à loi normale avec écart-type connu;
c) à loi continue mais de forme inconnue.
Pour chacun de ces trois types de population, deux méthodes sont présentées, l'une pour les intervalles de
prédiction unilatéraux, l'autre pour les intervalles de prédiction bilatéraux symétriques. Tous les cas
présentent un choix entre six niveaux de confiance.
Les méthodes présentées pour les cas a) et b) peuvent aussi être utilisées pour des populations distribuées
selon des lois non normales qu'il est possible de transformer à la normalité.
Pour les cas a) et b), les tableaux présentés dans la présente partie de l’ISO 16269 sont limités aux
intervalles de prédiction contenant toutes les nouvelles valeurs échantillonnées m de la variable. Pour le
cas c), les tableaux se rapportent à des intervalles de prédiction qui contiennent au moins m – r valeurs sur
les m valeurs suivantes, où r prend les valeurs de 0 à 10 ou de 0 à m – 1, la plus petite étendue étant retenue.
Pour les populations à loi normale, une procédure est également donnée pour calculer les intervalles de
prédiction relatifs à la moyenne de m nouvelles observations.
2 Références normatives
Les documents de référence suivants sont indispensables pour l'application du présent document. Pour les
références datées, seule l'édition citée s'applique. Pour les références non datées, la dernière édition du
document de référence s'applique (y compris les éventuels amendements).
ISO 3534-1, Statistique — Vocabulaire et symboles — Partie 1: Probabilité et termes statistiques généraux
ISO 3534-2, Statistique — Vocabulaire et symboles — Partie 2: Maîtrise statistique de la qualité
© ISO 2004 – Tous droits réservés 1

---------------------- Page: 7 ----------------------
ISO 16269-8:2004(F)
3 Termes, définitions et symboles
3.1 Termes et définitions
Pour les besoins du présent document, les termes et définitions donnés dans l'ISO 3534-1 et l'ISO 3534-2
ainsi que les suivants s'appliquent.
3.1.1
intervalle de prédiction
étendue de valeurs d'une variable, déterminée à partir d'un échantillon aléatoire d'une population, de façon à
pouvoir avoir un niveau de confiance spécifié tel que pas moins d'un nombre donné de valeurs d'un nouvel
échantillon aléatoire de taille donnée de la même population y appartiendra
NOTE Dans ce contexte, le niveau de confiance est la proportion à long terme des intervalles construits de manière
à avoir cette propriété.
3.1.2
statistiques d'ordre
valeurs d'un échantillon identifiées par leur position après avoir été rangées par ordre de grandeur non
décroissant
NOTE Dans la présente partie de l’ISO 16269, les valeurs de l'échantillon données dans leur ordre de sélection sont
notées x , x , …, x . Après avoir été rangées par ordre non décroissant, elles sont notées x , x , …, x , où
1 2 n [1] [2] [n]
x u x u … u x . Le terme «non décroissant» est utilisé de préférence à «croissant» afin d'inclure le cas où deux
[1] [2] [n]
valeurs ou plus sont égales, au moins dans l’intervalle de l'erreur de mesure. Des entiers distincts et contigus sont
assignés en indice aux valeurs de l'échantillon qui sont égales les unes aux autres lorsqu'elles sont représentées comme
des statistiques d'ordre.
3.2 Symboles
a limite inférieure des valeurs de la variable dans la population
α probabilité maximale nominale que plus de r observations du nouvel échantillon aléatoire d'effectif m
seront hors de l'intervalle de prédiction
b limite supérieure des valeurs de la variable dans la population
C niveau de confiance, exprimé en pourcentage: C = 100 (1 – α)
k coefficient d'intervalle de prédiction
m effectif du nouvel échantillon aléatoire auquel la prédiction s'applique
n effectif de l'échantillon aléatoire à partir duquel l'intervalle de prédiction est calculé
n
2
s écart-type de l'échantillon: sx= −−x n 1
() ( )
i

i = 1
r nombre maximal spécifié d'observations du nouvel échantillon aléatoire d'effectif m qui seront hors de
l'intervalle de prédiction
T limite inférieure de prédiction
1
T limite supérieure de prédiction
2
ème
x i observation dans un échantillon aléatoire
i
2 © ISO 2004 – Tous droits réservés

---------------------- Page: 8 ----------------------
ISO 16269-8:2004(F)
ème
x statistique de i ordre
[i]
n
x moyenne de l'échantillon: xx= n
i

i = 1
4 Intervalles de prédiction
4.1 Généralités
Un intervalle de prédiction bilatéral est un intervalle de la forme (T , T ), où T < T ; T et T sont calculées à
1 2 1 2 1 2
partir d'un échantillon aléatoire d'effectif n et sont appelées respectivement limite inférieure de prédiction et
limite supérieure de prédiction.
Si a et b sont respectivement les limites inférieure et supérieure de la variable dans la population, un intervalle
de prédiction unilatéral sera de la forme (T , b) ou (a, T ).
1 2
NOTE 1 Pour des raisons pratiques, a est souvent pris égal à zéro pour les variables qui ne peuvent être négatives et
b est souvent pris égal à l'infini pour les variables n'ayant pas de limite supérieure naturelle.
NOTE 2 Parfois, une population est traitée comme normale dans le but de déterminer un intervalle de prédiction,
même si elle a une limite finie. Cela peut paraître incohérent, car la loi normale s'étend de l'infini négatif à l'infini positif.
Toutefois, dans la pratique, beaucoup de populations ayant une limite finie sont approximées par une distribution normale.
La signification pratique d'un intervalle de prédiction se rapportant à des valeurs d'un échantillon individuel est
la suivante: l'expérimentateur déclare qu'un nouvel échantillon de m valeurs prélevé au hasard dans la même
population aura au plus r valeurs hors de l'intervalle, tout en admettant une petite probabilité nominale que
cette assertion puisse être erronée. La probabilité nominale qu'un intervalle construit de la sorte satisfasse à
l'assertion est appelée niveau de confiance.
La signification pratique d'un intervalle de prédiction se rapportant à la moyenne d'un échantillon est la
suivante: l'expérimentateur déclare que la moyenne d'un nouvel échantillon de m valeurs prélevé au hasard
dans la même population sera comprise dans l'intervalle, tout en admettant une petite probabilité nominale
que cette assertion puisse être erronée. De nouveau, la probabilité nominale qu'un intervalle construit de la
sorte satisfasse à l'assertion est appelée niveau de confiance.
La présente partie de l’ISO 16269 présente des procédures applicables à une population de distribution
normale pour r = 0 et des procédures applicables à la moyenne d'un nouvel échantillon d'une population de
distribution normale. Elle fournit aussi des procédures applicables à des populations dont la loi est de forme
inconnue pour r = 0, 1, …, 10 ou r = 0 à m – 1, la plus petite étendue étant retenue. Dans tous les cas, les
tableaux présentent des coefficients d'intervalle de prédiction ou des effectifs d'échantillon qui donnent au
moins le niveau déclaré de confiance. En général, le niveau de confiance réel est légèrement supérieur au
niveau déclaré.
Les limites des intervalles de prédiction pour des populations de distribution normale sont situées à k fois
l'écart-type de l'échantillon (ou l'écart-type de la population lorsque ce dernier est connu) à partir de la
moyenne de l'échantillon, k étant le coefficient d'intervalle de prédiction. Dans le cas où l'écart-type de la
population n'est pas connu, la valeur de k devient très importante pour de petites valeurs de n en combinaison
avec de grandes valeurs de m et des niveaux de confiance élevés. Il convient d'éviter chaque fois que
possible d'utiliser de grandes valeurs de k, par exemple supérieures à 10 ou à 15, car les intervalles de
prédiction résultants seront probablement trop étendus pour être d'une quelconque utilité, autre que d'indiquer
que l'échantillon initial était trop petit pour donner une information utile sur des valeurs futures. De plus, pour
de grandes valeurs de k, il se peut que l'intégrité des intervalles de prédiction résultants soit fortement
compromise par des écarts, même minimes, par rapport à la normalité. Les valeurs de k jusqu'à 250 sont
incluses dans les tableaux principalement pour montrer avec quelle rapidité k décroît à mesure que l'effectif n
de l'échantillon initial croît.
© ISO 2004 – Tous droits réservés 3

---------------------- Page: 9 ----------------------
ISO 16269-8:2004(F)
Pour les intervalles de prédiction se rapportant aux valeurs individuelles dans un nouvel échantillon, il est
possible d'utiliser le Formulaire A pour organiser les calculs relatifs à une population de distribution normale,
et le Formulaire C lorsque la population a une loi de forme inconnue. Le Formulaire B est donné pour aider à
calculer un intervalle de prédiction relatif à la moyenne d'un nouvel échantillon d'une population de distribution
normale.
Les Annexes A à D fournissent des tableaux de coefficients d'intervalle de prédiction. Les Annexes E et F
fournissent des tableaux d’effectifs d’échantillon quand la population est d'une forme de distribution non
connue. L'Annexe G donne la procédure d'interpolation dans les tableaux, lorsque la combinaison requise de
n, de m et du niveau de confiance n'est pas représentée dans les tableaux. L'Annexe H présente la théorie
statistique sous-jacente aux tableaux.
4.2 Comparaison avec d'autres types d'intervalles statistiques
4.2.1 Choix du type d'intervalle
Dans la pratique, des prédictions sont souvent exigées pour un nombre fini d'observations sur la base des
résultats obtenus sur un échantillon aléatoire initial. Telles sont les circonstances dans lesquelles la présente
partie de l’ISO 16269 est appropriée. Il existe parfois une confusion avec d'autres types d'intervalles
statistiques. Les paragraphes 4.2.2 et 4.2.3 sont présentés pour préciser les distinctions.
4.2.2 Comparaison avec un intervalle statistique de tolérance
Un intervalle de prédiction pour des valeurs d'un échantillon individuel est un intervalle, calculé à partir d'un
échantillon aléatoire d'une population, pour lequel un énoncé de confiance est possible concernant le nombre
maximal de valeurs dans un nouvel échantillon aléatoire de la population qui seront hors de l'intervalle. Un
intervalle statistique de tolérance (tel que défini dans l'ISO 16269-6) est aussi un intervalle calculé à partir
d'un échantillon aléatoire d'une population pour lequel un énoncé de confiance est possible; toutefois,
l'énoncé se rapporte dans ce cas à la proportion maximale de valeurs de la population situées hors de
l'intervalle (ou, de façon équivalente, à la proportion minimale de valeurs de la population situées dans
l'intervalle).
NOTE 1 Une constante d'intervalle statistique de tolérance est la limite d'une constante d'intervalle de prédiction,
puisque l'effectif m de l'échantillon futur tend vers l'infini, tandis que le nombre, r, d'individus dans l'échantillon futur en
dehors de l'intervalle reste une proportion constante de m, fourni par r > 0. Cela est illustré dans le Tableau 1 pour un
niveau de confiance de 95 % pour des intervalles unilatéraux et bilatéraux quand r/m = 0,1.
Cependant, il n'y a pas une telle analogie entre les constantes d'intervalle statistique de tolérance et les constantes
d'intervalle de prédiction pour r = 0, cas sur lequel se focalise principalement la présente partie de l'ISO 16269.
Tableau 1 — Exemples de constantes d'intervalles de prédiction
r 1 2 5 10 20 50 100 1 000 Constantes d'intervalle
statistique de tolérance
m 10 20 50 100 200 500 1 000 10 000
pour une proportion
minimale de 0,9 pour
Constantes d'intervalle de prédiction
la population couverte
Intervalles
1,887 1,846 1,767 1,718 1,686 1,663 1,655 1,647 1,646
unilatéraux
Intervalles
2,208 2,172 2,103 2,061 2,034 2,014 2,007 2,000 2,000
bilatéraux
NOTE 2 Le cas r = 0 est particulièrement important dans les applications relatives à la sécurité.
4.2.3 Comparaison avec un intervalle de confiance relatif à la moyenne
L'intervalle de prédiction relatif à une moyenne est un intervalle, calculé à partir d'un échantillon aléatoire
d'une population, pour lequel il peut être affirmé avec un niveau donné de confiance que la moyenne d'un
nouvel échantillon aléatoire d'effectif spécifié sera comprise dans cet intervalle. Un intervalle de confiance
relatif à une moyenne (tel que défini dans l'ISO 2602) est aussi un intervalle calculé à partir d'un échantillon
4 © ISO 2004 – Tous droits réservés

---------------------- Page: 10 ----------------------
ISO 16269-8:2004(F)
aléatoire d'une population pour lequel un énoncé de confiance est possible; toutefois, l'énoncé se rapporte
dans ce cas à la moyenne de la population.
5 Intervalles de prédiction relatifs à toutes les observations d'un nouvel échantillon
d'une population de distribution normale dont l'écart-type est inconnu
5.1 Intervalles unilatéraux
Un intervalle de prédiction unilatéral se rapportant à une population de distribution normale dont l'écart-type
est inconnu est de la forme (,xk−sb) ou (,ax −ks), où les valeurs de la moyenne de l'échantillon, x , et de
l'écart-type de l'échantillon, s, sont déterminées à partir d'un échantillon d'effectif n prélevé au hasard dans la
population. Le coefficient d'intervalle de prédiction, k, dépend de n, de l'effectif du nouvel échantillon, de m, et
du niveau de confiance, C; les valeurs de k sont présentées dans l’Annexe A.
EXEMPLE On sait par l'expérience qu'une loi normale est une approximation étroite des pressions causées dans les
tubes de canons par des obus d'artillerie d'un type donné. Un échantillon de 20 unités a une pression moyenne de
562,3 MPa et l'écart-type de la pression est de 8,65 MPa. Un lot de 5 000 nouvelles unités au total doit être produit dans
des conditions de fabrication identiques. Quelle pression de tube de canon ne sera, à un niveau de confiance de 95 %,
dépassée par aucun des 5 000 obus tirés dans des conditions identiques?
Le Tableau A.2 donne des coefficients d'intervalle de prédiction au niveau de confiance de 95 %. Dans ce tableau, le
coefficient d'intervalle de prédiction correspondant est k = 5,251. La limite supérieure d'un intervalle de prédiction
unilatéral à un niveau de confiance de 95 % est donc
xk+=s 562,3+ 5,251× 8,65= 607,7 MPa
Il peut donc y avoir confiance à 95 % qu'aucune des 5 000 unités du lot ne produira une pression dans le tube de canon
supérieure à 607,7 MPa.
Cet exemple sert aussi à illustrer l'utilisation du Formulaire A.
5.2 Intervalles bilatéraux symétriques
Un intervalle de prédiction bilatéral symétrique pour une population de distribution normale dont l'écart-type
est inconnu est de la forme (,xk−+sx ks). Le coefficient d'intervalle de prédiction, k, dépend de n, de
l'effectif m du nouvel échantillon et du niveau de confiance, C; les valeurs de k sont présentées dans
l'Annexe B.
EXEMPLE On sait par l'expérience que les temps jusqu'à détonation des grenades à main dégoupillées d'un type
particulier suivent une loi normale approximative. Un échantillon aléatoire d'effectif 30 est prélevé et testé et les temps
jusqu'à détonation sont enregistrés. Le temps jusqu'à détonation moyen de l'échantillon est de 5,140 s et l'écart-type de
l'échantillon est de 0,241 s. Un intervalle de prédiction bilatéral symétrique est exigé pour l'ensemble du lot suivant de
10 000 grenades à un niveau de confiance de 99 %.
Le Tableau B.4 donne les coefficients d'intervalle de prédiction au niveau de confiance 99 %. Dans ce tableau, les entrées
n = 30 et m = 10 000 donnent la valeur k = 6,059. L'intervalle de prédiction symétrique est le suivant:
(xk−+s,x ks)= (5,140− 6,059× 0,241, 5,140+ 6,059× 0,241)= (3,68, 6,60)
Il peut donc y avoir confiance à 99 % qu'aucune des 10 000 grenades suivantes n'aura un temps jusqu'à détonation hors
de l'étendue comprise entre 3,68 s et 6,60 s.
5.3 Intervalles de prédiction relatifs à des populations non normales qui peuvent être
transformées à la normalité
Pour les populations non normales qui peuvent être transformées à la normalité, les procédures relatives aux
populations normales sont d'abord appliquées aux données transformées; l'intervalle de prédiction est ensuite
établi en appliquant la transformation inverse a
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.