ISO 8253-3:2012
(Main)Acoustics - Audiometric test methods - Part 3: Speech audiometry
Acoustics - Audiometric test methods - Part 3: Speech audiometry
ISO 8253-3:2012 specifies basic methods for speech recognition tests for audiological applications. In order to ensure minimum requirements of precision and comparability between different test procedures including speech recognition tests in different languages, ISO 8253-3:2012 specifies requirements for the composition, validation and evaluation of speech test materials, and the realization of speech recognition tests. ISO 8253-3:2012 does not specify the contents of the speech material because of the variety of languages. Furthermore, ISO 8253-3:2012 also specifies the determination of reference values and fulfilment requirements for the realization and manner of presentation. ISO 8253-3:2012 specifies procedures and requirements for speech audiometry with the recorded test material being presented by air conduction through an earphone, or from a loudspeaker for sound field audiometry. Methods for using noise either for masking the non-test ear or as a competing sound are described. Some test subjects, for example children, can require amended test procedures not specified in ISO 8253-3:2012. Specialized tests such as those used for evaluating directional hearing and dichotic hearing are outside the scope of ISO 8253-3:2012.
Acoustique — Méthodes d'essais audiométriques — Partie 3: Audiométrie vocale
General Information
Relations
Frequently Asked Questions
ISO 8253-3:2012 is a standard published by the International Organization for Standardization (ISO). Its full title is "Acoustics - Audiometric test methods - Part 3: Speech audiometry". This standard covers: ISO 8253-3:2012 specifies basic methods for speech recognition tests for audiological applications. In order to ensure minimum requirements of precision and comparability between different test procedures including speech recognition tests in different languages, ISO 8253-3:2012 specifies requirements for the composition, validation and evaluation of speech test materials, and the realization of speech recognition tests. ISO 8253-3:2012 does not specify the contents of the speech material because of the variety of languages. Furthermore, ISO 8253-3:2012 also specifies the determination of reference values and fulfilment requirements for the realization and manner of presentation. ISO 8253-3:2012 specifies procedures and requirements for speech audiometry with the recorded test material being presented by air conduction through an earphone, or from a loudspeaker for sound field audiometry. Methods for using noise either for masking the non-test ear or as a competing sound are described. Some test subjects, for example children, can require amended test procedures not specified in ISO 8253-3:2012. Specialized tests such as those used for evaluating directional hearing and dichotic hearing are outside the scope of ISO 8253-3:2012.
ISO 8253-3:2012 specifies basic methods for speech recognition tests for audiological applications. In order to ensure minimum requirements of precision and comparability between different test procedures including speech recognition tests in different languages, ISO 8253-3:2012 specifies requirements for the composition, validation and evaluation of speech test materials, and the realization of speech recognition tests. ISO 8253-3:2012 does not specify the contents of the speech material because of the variety of languages. Furthermore, ISO 8253-3:2012 also specifies the determination of reference values and fulfilment requirements for the realization and manner of presentation. ISO 8253-3:2012 specifies procedures and requirements for speech audiometry with the recorded test material being presented by air conduction through an earphone, or from a loudspeaker for sound field audiometry. Methods for using noise either for masking the non-test ear or as a competing sound are described. Some test subjects, for example children, can require amended test procedures not specified in ISO 8253-3:2012. Specialized tests such as those used for evaluating directional hearing and dichotic hearing are outside the scope of ISO 8253-3:2012.
ISO 8253-3:2012 is classified under the following ICS (International Classification for Standards) categories: 13.140 - Noise with respect to human beings. The ICS classification helps identify the subject area and facilitates finding related standards.
ISO 8253-3:2012 has the following relationships with other standards: It is inter standard links to ISO 8253-3:2022, ISO 8253-3:1996. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.
You can purchase ISO 8253-3:2012 directly from iTeh Standards. The document is available in PDF format and is delivered instantly after payment. Add the standard to your cart and complete the secure checkout process. iTeh Standards is an authorized distributor of ISO standards.
Standards Content (Sample)
INTERNATIONAL ISO
STANDARD 8253-3
Second edition
2012-03-01
Acoustics — Audiometric test methods —
Part 3:
Speech audiometry
Acoustique — Méthodes d’essais audiométriques —
Partie 3: Audiométrie vocale
Reference number
©
ISO 2012
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or ISO’s
member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland
ii © ISO 2012 – All rights reserved
Contents Page
Foreword . v
Introduction .vi
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Requirements for recording of speech material . 5
4.1 General requirements . 5
4.2 Reference recording . 5
4.3 Recording environment . 6
4.4 Frequency response of recording equipment . 6
4.5 Interval between successive test items . 6
4.6 Levels . 6
4.7 Signal-to-noise ratio . 6
4.8 Phonemic balance across test lists . 6
4.9 Perceptual balance across test lists . 7
5 Validation of speech material recordings . 7
5.1 General . 7
5.2 Determination of reference speech recognition curve . 7
5.3 Determination of perceptual equivalence of test lists . 8
5.4 Determination of repeatability of results (average test-retest reliability) . 8
5.5 Documentation . 9
6 Requirements for speech audiometry . 9
7 Ambient sound pressure levels in test room for speech audiometry . 9
8 Sound field speech audiometry . 9
9 Preparation and instruction of test subject .10
9.1 General .10
9.2 Preparation of test subject .10
9.3 Instruction of test subject .10
10 Subject’s response mode .10
11 Determination of speech detection threshold level . 11
12 Determination of speech recognition threshold level . 11
12.1 General . 11
12.2 Descending procedure using 5 dB steps .12
12.3 Alternative descending procedure .12
12.4 Adaptive procedure using fixed step sizes .13
12.5 Other adaptive procedure .14
13 Determination of speech recognition scores .14
14 Contralateral masking .14
15 Speech audiometry with competing sound .15
15.1 Type of competing sound .15
15.2 Presentation of competing sound .15
15.3 Speech and competing sound levels .15
15.4 Test procedure .15
16 Format of speech audiogram .17
17 Measurement uncertainty .17
18 Maintenance and calibration of equipment .18
18.1 General .18
18.2 Intervals between tests .18
18.3 Stage A: Routine checking and listening tests .18
18.4 Stage B: Periodic electroacoustic tests .19
18.5 Stage C: Basic calibration tests .19
Annex A (informative) Example of speech materials .20
Annex B (informative) Examples of competing sound conditions .21
Annex C (informative) Typical results .22
Annex D (informative) Optimization of perceptual balance of test lists .24
Annex E (informative) Measurement uncertainty .25
Bibliography .30
iv © ISO 2012 – All rights reserved
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the International
Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 8253-3 was prepared by Technical Committee ISO/TC 43, Acoustics.
This second edition cancels and replaces the first edition (ISO 8253-3:1996), which has been technically revised.
ISO 8253 consists of the following parts, under the general title Acoustics — Audiometric test methods:
— Part 1: Pure-tone air and bone conduction threshold audiometry
— Part 2: Sound field audiometry with pure-tone and narrow-band test signals
— Part 3: Speech audiometry
Introduction
Speech audiometry is used for the assessment of hearing in connection with diagnostic evaluation and
audiological rehabilitation.
The results of speech audiometry depend on the speech material and test method used. This part of ISO 8253
sets conditions for speech materials in order to assure minimum requirements of precision and comparability
between different tests using different speech materials including materials in different languages. It also
specifies procedures to be used when testing speech recognition.
vi © ISO 2012 – All rights reserved
INTERNATIONAL STANDARD ISO 8253-3:2012(E)
Acoustics — Audiometric test methods —
Part 3:
Speech audiometry
1 Scope
This part of ISO 8253 specifies basic methods for speech recognition tests for audiological applications.
In order to ensure minimum requirements of precision and comparability between different test procedures
including speech recognition tests in different languages, this part of ISO 8253 specifies requirements for the
composition, validation and evaluation of speech test materials, and the realization of speech recognition tests.
This part of ISO 8253 does not specify the contents of the speech material because of the variety of languages.
Furthermore, this part of ISO 8253 also specifies the determination of reference values and fulfilment
requirements for the realization and manner of presentation.
This part of ISO 8253 specifies procedures and requirements for speech audiometry with the recorded
test material being presented by air conduction through an earphone, or from a loudspeaker for sound field
audiometry. Methods for using noise either for masking the non-test ear or as a competing sound are described.
Some test subjects, for example children, can require amended test procedures not specified in this part of ISO 8253.
Specialized tests such as those used for evaluating directional hearing and dichotic hearing are outside the
scope of this part of ISO 8253.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced document
(including any amendments) applies.
ISO 266, Acoustics — Preferred frequencies
ISO 8253-1, Acoustics — Audiometric test methods — Part 1: Pure-tone air and bone conduction audiometry
ISO 8253-2, Acoustics — Audiometric test methods — Part 2: Sound field audiometry with pure-tone and
narrow-band test signals
ISO/IEC Guide 98-3, Uncertainty of measurement — Part 3: Guide to the expression of uncertainty in
measurement (GUM:1995)
IEC 60645-1, Electroacoustics — Audiological equipment — Part 1: Pure-tone audiometers
IEC 60645-2:1993, Audiometers — Part 2: Equipment for speech audiometry
IEC 61672-1, Electroacoustics — Sound level meters — Part 1: Specifications
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 8253-1 and ISO 8253-2 and the
following apply.
3.1
speech signal
acoustic signal which carries information in a given language
NOTE A speech signal may be a voice signal or an acoustic signal simulating a voice signal.
3.2
test item
particular monosyllabic or polysyllabic word or logatom, or sentence, or time-limited segment of connected
speech, used in accordance with defined rules of presentation and scoring in a speech audiometric procedure
NOTE Scoring may be based on a complete test item or parts thereof being correctly recognized.
3.3
speech material
entire set of test items which is used for speech recognition tests
NOTE Usually the speech material is subdivided into several test lists.
3.4
open-set test material
set of test items in which the number of alternative responses to each test item is unlimited
3.5
closed-set test material
set of test items in which the number of alternative responses to each test item is limited
3.6
phoneme
smallest recognizable unit of speech in a given natural language
3.7
phoneme class
subdivision of phonemes that show characteristic similarities in vocal production mode as well as in acoustical
signal properties
3.8
syllable
segment of speech which consists of a vowel with or without one or more accompanying consonants immediately
preceding or following
3.9
spondee
two-syllable word with equal stress on each syllable
3.10
logatom
syllabic unit that has no verbal meaning to the listener
NOTE A logatom is sometimes called a “nonsense syllable”.
3.11
test list
number of selected test items, presented and scored as a single unit
3.12
set of test items
selected number of test items from a test list
2 © ISO 2012 – All rights reserved
3.13
phonemically balanced test list
test list which contains approximately the same proportions of the various phonemes as are present in typical
speech communication within a given language
3.14
perceptually balanced test list
test list which yield equivalent speech recognition score with minimized variance at a specified speech level
under equivalent conditions (specified manner of presentation and specified group of listeners)
NOTE Usually the specified group of listeners consists of otologically normal persons with an age from 18 years to
25 years inclusive. For special tests, different groups (e.g. otologically normal children within a specified age range) may
be used as well.
3.15
carrier phrase
sentence or phrase in which a test item is embedded such that the correct recognition of the test item is not
dependent upon the context or meaning of the sentence or phrase
3.16
reference recording of speech material
master recording
well-defined recording that represents the speech material and that is used for validation and application of the
speech material
3.17
speech level
equivalent continuous sound pressure level of the speech material as measured in an appropriate coupler, ear
simulator or in a sound field, with frequency weighting C according to IEC 61672-1
NOTE For speech test lists based on single test items separated by silent intervals, the integration does not include
these intervals. For test lists based on single test items with a carrier phrase, the integration includes the test items only. In
a digital recording, the silent intervals can be removed by editing. Numerical correction may also be made by determination
of the total duration of the test items and the total duration of the silent intervals.
3.18
equivalent continuous sound pressure level
L
p,eqT
ten times the logarithm to the base 10 of the ratio of the time average of the square of the sound pressure, p,
during a stated time interval of duration, T (starting at t and ending at t ), to the square of a reference value,
1 2
p , expressed in decibels
t
2
pt()dt
∫
T
t
1
L =10 lg dB
pT,eq
p
where the reference value, p , is 20 µPa
NOTE Because of practical limitations of the measuring instruments, p is always understood to denote the square
of a frequency-weighted and frequency-band-limited sound pressure. If a specific frequency weighting as specified in
IEC 61672-1 and/or specific frequency bands are applied, this should be indicated by appropriate subscripts; e.g. L
p,A,10 s
denotes the A-weighted time-averaged sound pressure level over 10 s.
[3]
[ISO/TR 25417 , 2.3]
3.19
speech detection threshold level
for a given test subject, for specified speech material and a specified manner of signal presentation, the speech
level at which it is detected (not necessarily understood) in 50 % of the trials
3.20
speech recognition score
for a given test subject, for specified speech material, a specified manner of signal presentation and at a
specified speech level, the percentage of correctly recognized test items or scorable items if the scoring
method is not based on whole test items
3.21
maximum speech recognition score
for a given test subject, for specified speech material and a specified manner of signal presentation, the
maximum speech recognition score obtained regardless of speech level
3.22
speech recognition threshold level
for a given test subject, for specified speech material and a specified manner of signal presentation, the lowest
speech level or speech-to-noise ratio at which the speech recognition score is equal to 50 %
NOTE Speech recognition threshold has been called “speech reception threshold”.
3.23
reference speech recognition threshold level
for specified speech material and a specified manner of signal presentation, the median value of the speech
recognition threshold levels of a sufficiently large number of otologically normal persons, of both sexes, between
18 years and 25 years inclusive for whom the test material is appropriate
3.24
optimum speech level
for a given test subject, for specified speech material and a specified manner of signal presentation, the speech
level or range of speech levels at which maximum speech recognition score is obtained
3.25
half-optimum speech level
for a given test subject, for specified speech material and a specified manner of signal presentation, the speech
level at which half of the maximum speech recognition score is obtained
3.26
speech recognition curve
for a given test subject, for specified speech material and a specified manner of signal presentation, a curve
that describes the speech recognition score as a function of speech level
3.27
reference speech recognition curve
for specified speech material and a specified manner of presentation, a curve that describes the median speech
recognition score as a function of speech level for a sufficiently large number of otologically normal persons of
both sexes, aged between 18 years and 25 years inclusive and for whom the test material is appropriate
3.28
hearing level for speech
for specified speech material and a specified manner of signal presentation, the speech level minus the
appropriate reference speech recognition threshold level
3.29
competing sound
additional sound that is presented during speech recognition tests
3.30
competing sound pressure level
equivalent continuous sound pressure level of a competing sound as measured in an appropriate coupler, ear
simulator or in a sound field, with frequency weighting C according to IEC 61672-1
4 © ISO 2012 – All rights reserved
3.31
speech-to-noise level difference
speech-to-noise ratio
SNR
difference between the speech level and the competing sound level
3.32
effective masking level for speech
level of a specified masking sound which is numerically equal to that hearing level for speech to which the
speech recognition threshold level for a specified speech signal would be raised by the presence of that
masking sound
3.33
most comfortable level for speech
for a given test subject and a specified manner of presentation, the speech level at which the loudness of the
speech signal is judged by the test subject to be the most comfortable
3.34
connected speech
running speech
continuous speech with natural intonation, consisting of consecutive sentences with logical connections
4 Requirements for recording of speech material
4.1 General requirements
Each copy of the recording shall contain the following signals:
a) the speech material;
b) a signal for the calibration of the equipment for speech audiometry, of a duration not less than 60 s; the
calibration signal shall be a weighted random noise, e.g. as specified in IEC 60645-2:1993, 13.1, a band
of noise centred at 1 kHz and having a bandwidth of one-third octave, or a frequency-modulated tone at
1 kHz having a bandwidth of at least one-third octave — the modulating signal shall be either sinusoidal or
triangular with a repetition rate in the range from 4 Hz to 20 Hz;
c) signals for testing the frequency response of the equipment to be used for speech audiometry including
the playback equipment and the recording — such signals shall have a duration of not less than 15 s and
consist of one-third-octave bands of white noise centred at the preferred one-third-octave frequencies in
accordance with ISO 266 in the frequency range 125 Hz to 8 000 Hz.
NOTE For speech material based on other time and/or frequency weightings than C-weighted equivalent sound
pressure level, correction factors can be determined describing the difference related to C-weighted equivalent sound
pressure level for speech level, calibration signal level and competing noise level.
4.2 Reference recording
A suitable speaker, either male or female, should have a normal and clear articulation without pronounced
dialect. The speaker should be instructed to maintain clarity, natural pace, and vocal effort and avoid emphasis
on key words.
A reference recording mainly consists of the elements specified in 4.1. The reference recording shall not be
modified. All copies shall be made from the reference recording. Any changes of the reference recording (e.g.
a new recording or changes of levels or frequency content) require a new validation (see Clause 5).
For speech audiometry intended to be performed in noise the reference recording shall also include the
associated competing noise or noises, either on the same or on separate channels.
4.3 Recording environment
The room in which the speech is recorded shall be sufficiently quiet to provide a signal-to-noise ratio of at least
40 dB and shall have a reverberation time of less than 0,5 s at any frequency in the range from 125 Hz to 8 000 Hz.
4.4 Frequency response of recording equipment
The frequency response of the recording equipment including the microphone used shall be flat within 2 dB in
the frequency range from 125 Hz to 8 000 Hz.
NOTE The quality of the recording and negligible loss of quality after repeated use make digital recordings superior.
4.5 Interval between successive test items
The intervals between the successive test items of the recording should be specified and constant within ±10 %.
For single test words, an interval of not less than 4 s is suggested.
4.6 Levels
4.6.1 Speech material
The average reference speech recognition threshold level of the smallest set of test items to be used at a
predetermined sound pressure level shall not deviate by more than ±1 dB from the average of all test items
within the list. The reference speech recognition threshold level of any single test item shall not deviate by
more than ±3 dB from the average reference speech recognition threshold level of all test items of the list.
The average speech recognition threshold level of test lists shall not differ from the average reference speech
recognition threshold level of all test items recorded by more than ±1 dB, see Annex D.
4.6.2 Calibration signal
The level of the calibration signal shall not deviate by more than ±0,5 dB from the average speech level of all
test items of the specific speech material. The level of the calibration signal shall be measured using the same
frequency weighting as when measuring the speech level.
4.7 Signal-to-noise ratio
The level of any inherent background noise on the recording shall be at least 40 dB below the level of the
calibration signal in accordance with 4.6.2 as measured using the same frequency weighting as when measuring
the speech level.
4.8 Phonemic balance across test lists
All test lists of a specific speech material shall be phonemically balanced.
In some cases, it may not be possible to achieve perfect phonemic balance. In such cases, the test lists shall
be phonemically balanced based on phoneme classes, i.e. voiced and unvoiced plosives and fricatives, nasals,
long and short vowels.
The distribution of phonemes of the speech material should approximate the phoneme distribution of the
test language as closely as possible. Speech materials consisting of a large amount of items allow a closer
approximation than smaller speech materials. In some cases, the possibility of achieving a close approximation
to the phoneme distribution is limited, e.g. in screening tests or tests for children, because the speech material
has to be limited to a relatively small number of test items.
6 © ISO 2012 – All rights reserved
4.9 Perceptual balance across test lists
All test lists of a specific speech material shall be perceptually balanced, i.e. the result of the speech recognition
test shall be independent of the choice of test list.
Perceptually balanced test lists shall fulfil the requirements given in 4.6.1. Additional requirements for
perceptually balanced test lists are given in the following.
The speech recognition curves for all test lists shall have been determined in such a way that the speech
recognition threshold level can be determined with an expanded uncertainty not exceeding 1 dB (the width
of the 95 % confidence interval shall not exceed 2 dB); see Annex E. To achieve this, speech recognition
measurements at different presentation levels (or speech-to-noise ratios in case of a speech recognition test
in noise) shall be performed with at least 10 otologically normal persons whose native language is the same
as the language of the speech material. The speech recognition measurements shall be performed within
the normal context of the speech stimulus (e.g. presentation of sentences when using a sentence test). The
speech recognition of each particular test item shall then be scored and analysed independently (e.g. scoring
of particular words of the sentences).
In order to achieve an expanded uncertainty not exceeding 1 dB, extreme care is necessary to reduce the
potential uncertainty sources.
In order to increase the perceptual homogeneity of the speech material, speech recognition differences
between the particular speech items may be minimized (see Annex D).
5 Validation of speech material recordings
5.1 General
For the validation, equipment fulfilling the requirements of IEC 60645-2:1993, Clauses 6 to 17, type A, A-E,
B or B-E shall be used. Testing shall be performed monaurally. If equipment of type A-E or B-E is used, the
evaluation shall include using both uncorrected earphone and earphone corrected for free-field equivalent
output. Only complete test lists shall be used.
NOTE It can be expected that the use of equipment of Type A-E or B-E gives identical results for both binaural
earphone and loudspeaker listening due to their free-field equivalent frequency response.
5.2 Determination of reference speech recognition curve
The reference speech recognition curve for each speech material and manner of presentation shall be
determined by performing speech recognition tests using a sufficiently large group (at least 25) of otologically
normal persons whose first language is the language of the speech material. The minimum requirements for the
pure-tone hearing threshold levels of test subjects shall be specified by the laboratory carrying out the validation.
It is recommended that the following criterion based on the pure-tone audiogram be used: the hearing threshold
levels of the test subjects should be at or below 10 dB at the frequencies 250 Hz, 500 Hz, 750 Hz, 1 000 Hz,
1 500 Hz, 2 000 Hz, 3 000 Hz, 4 000 Hz, 6 000 Hz, and 8 000 Hz. At a maximum of two frequencies the hearing
threshold level may be 15 dB.
If the speech recognition test is intended to be performed with children, the reference speech recognition curve
shall be determined using a sufficiently large group (at least 25) of otologically normal children of the same age
range as the speech material is intended to be used for.
If the speech recognition test is intended to be used in silence, the reference speech recognition curve shall
be determined in silence.
If the speech recognition test is intended to be used with a competing noise, the reference speech recognition
curve shall be determined using this noise. If the test is intended to be used with different noises, the reference
speech recognition curve shall determined using each particular noise.
The reference speech recognition curve shall be given as a table which describes the relation between speech
level (or speech-to-noise level difference) and speech recognition score. The speech levels (or speech-to-
noise level differences) which are required to achieve the speech recognition scores 30 %, 40 %, 50 %, 60 %,
70 %, 80 %, and 90 % shall be specified. These values can be calculated using an adequate interpolation
between the measured data.
If persons show a large variability of speech recognition results (e.g. children), it can prove necessary to
measure the reference speech recognition curve using a larger number of persons.
If it is difficult to determine the whole reference speech recognition curve from 0 % to 100 %, ensure that the
speech recognition curve is determined in the range of interest. If the speech recognition test is intended to
be used for the determination of speech recognition threshold levels, the reference speech recognition curve
should be measured at values near the speech recognition threshold level (including values above and below
this value) using a sufficient number of measurements. If the speech recognition test is intended to be used for
the determination of the optimum speech level, the reference speech recognition curve should be measured at
values from 50 % (or less) to values near to 100 % using a sufficient number of measurements.
5.3 Determination of perceptual equivalence of test lists
The perceptual equivalence of test lists of speech materials fulfilling the requirements specified in 4.9 shall be
determined by performing speech recognition tests using a sufficiently large group (at least 10) of otologically
normal persons as described in 5.2.
If the speech recognition test is intended to be used in silence, the perceptual equivalence of test lists shall be
determined in silence.
If the speech recognition test is intended to be performed with a competing noise, the perceptual equivalence
of test lists shall be determined using this noise. If the test is intended to be performed with different noises, the
perceptual equivalence of test lists shall be determined using each particular noise.
If persons show a large variability of speech recognition results (e.g. children), it may be necessary to determine
the perceptual equivalence of test lists curve using a larger number of persons.
The perceptual equivalence of test lists shall be specified by the average 95 % confidence intervals of the test
lists. If the speech recognition test is intended for the determination of speech recognition threshold levels, the
equality of test lists shall be specified as the average 95 % confidence interval for the test lists of the speech
recognition threshold level when using different test lists with the same group of test subjects. If the speech
recognition test is intended for the determination of the optimum speech level, the equality of test lists shall be
specified as the average 95 % confidence intervals for the test lists of the speech recognition scores 50 %,
60 %, 70 %, 80 %, and 90 % when using different test lists with the same group of test subjects.
That means that the squared differences between the results using the different test lists should be averaged
across listeners. The square root of this value multiplied by 2 gives the desired value.
5.4 Determination of repeatability of results (average test-retest reliability)
The repeatability of a speech recognition test result is quantified by the average test-retest reliability within one
subject. Generally, different test lists shall be used in test and retest because the responses of the initial test
may be memorized by the subject which may influence the result of the retest.
If the speech recognition test is intended to be performed in silence, the average test-retest reliability shall be
determined in silence.
If the speech recognition test is intended to be performed with a competing noise, the average test-retest
reliability shall be determined using this noise. If the speech recognition test is intended to be performed with
different noises, the average test-retest reliability shall be determined using each particular noise.
The average reliability (test versus retest) shall be specified by the average 95 % confidence intervals across subjects.
That means that the squared differences between the results of the test and the retest measurements should
be averaged across listeners. The square root of this value multiplied by 2 gives the desired value.
8 © ISO 2012 – All rights reserved
If the speech recognition test is intended for the determination of speech recognition threshold levels, the test-
retest reliability shall be assessed for the speech recognition threshold level. If the speech recognition test is
intended for the determination of the optimum speech level, the test-retest reliability shall be specified for the
speech recognition scores 50 %, 60 %, 70 %, 80 %, and 90 %.
5.5 Documentation
Each copy of the recording shall be supplied with documentation containing the following information:
a) a printed version of the recorded speech material;
b) the method(s) of scoring, e.g. by sentence, word, key word, or phoneme;
c) the reference speech recognition curves as specified in 5.2 for each method of scoring, the origin of
the reference curves and details of measuring conditions (e.g. number, age range and range of hearing
threshold levels of test subjects and type of equipment for speech audiometry used as well as the
arrangement of loudspeakers for competing noise, if applicable);
d) the repeatability of results as specified in 5.4;
e) the durations, frequency spectra and levels relative to speech level of the calibration signal and other
recorded signals for the purpose of testing performance specifications in accordance with 4.1 b) and c);
f) the level of the calibration signal and its relationship to the reference speech recognition threshold level;
g) the intervals between successive test items;
h) the characteristics of any accompanying competing noise signal.
6 Requirements for speech audiometry
Speech audiometry shall be performed using equipment fulfilling the requirements of IEC 60645-2. Testing
may be performed either by earphones monaurally or binaurally, by bone vibrator, or in a sound field. The
level of a speech signal shall be expressed in terms of either speech level or hearing level for speech for the
particular test material being used.
7 Ambient sound pressure levels in test room for speech audiometry
The ambient sound pressure levels in the test room shall not mask the speech signals. The requirements for
the ambient sound pressure levels in the test room depend on the mode of presentation of the speech signal,
i.e. through an earphone, bone vibrator or loudspeaker.
NOTE Requirements for ambient noise during speech audiometry can be less stringent than those for pure-tone
threshold audiometry. If a test room is appropriate for pure-tone threshold audiometry down to a certain hearing level value
over the whole frequency range, the room can also serve for speech audiometry for the same mode of presentation of test
signals for signal levels down to the same hearing level values. Maximum permissible ambient sound pressure levels for
pure-tone audiometry in the frequency range from 125 Hz to 8 000 Hz, are specified in ISO 8253-1 using earphones and
bone vibrators and in ISO 8253-2 for sound field audiometry.
8 Sound field speech audiometry
Sound field speech audiometry can be performed with and without competing sound reproduced especially for
the purpose of the test.
The recommended position of the speech loudspeaker is frontal to the listener at an angle of incidence of 0°.
If the speech audiometric results from an individual test subject are to be compared with the reference speech
recognition threshold level or the reference speech recognition curve, the position of the speech loudspeaker
shall be identical to that used for the determination of the reference values.
If noise is to be presented as a competing sound to the speech signal, the recommended positions of the noise
loudspeakers are given in 15.2.
The type of sound field (free, quasi-free or diffuse), as specified in ISO 8253-2, and the position of the reference
point shall be recorded.
9 Preparation and instruction of test subject
9.1 General
It is generally assumed that pure-tone audiometry has been performed prior to speech audiometry.
9.2 Preparation of test subject
Recent exposure to noise may cause a temporary elevation of the hearing threshold levels. Therefore, significant
noise exposure should be avoided before audiometric testing or it shall be noted. In order to avoid errors due
to excessive physical exertion, the subject should be present at least 5 min prior to testing.
Normally, the audiometric test is preceded by an otoscopic examination carried out by a qualified person. If
obstructing wax is found in the ear canals, remove it and delay audiometry for a suitable period. Also check the
ears for the possibility of collapsing ear canals when earphones are to be used and take appropriate action.
NOTE It is possible that requirements for a qualified person are specified by national authorities or other suitable
organizations.
The ability of the test subject to understand the test material shall be established prior to testing. If the response
to the test material is to be spoken, it shall be established that the test subject can reproduce the test material.
9.3 Instruction of test subject
In order to achieve reliable results, it is essential that relevant instructions in the test procedure be given
unambiguously and that they are fully understood by the test subject.
The instructions shall be phrased in language appropriate to the test subject. They depend upon the type of
speech test to be carried out. Instructions shall normally indicate:
a) which ear shall be tested first;
b) the type of test items and the response task;
c) the need to respond whenever the speech is heard in either ear, no matter how faint it may be;
d) the need to respond as soon as each test item has been heard;
e) if the response is spoken, to repeat clearly the test item heard, even when not certain that the test item has
been heard correctly; only one response to each test item is permitted.
Test subjects shall also be instructed to avoid unnecessary movements so as to obviate extraneous noise.
After the instructions have been given, the tester shall establish that they have been understood. If there is any
doubt, the instructions should be repeated. The test subject shall be informed that the test may be interrupted
in case of any discomfort.
10 Subject’s response mode
The test subject’s response is normally spoken but may be written or indicated by means of a keyboard. When
the tester is not in the same room as the test subject and the test subject’s response to the speech signal is
spoken, a talk-back system shall be used.
10 © ISO 2012 – All rights reserved
The spoken response of the test subject shall be clearly understandable by the tester. If not, an alternative
response mode shall be used. The tester shall be familiar with the language and have hearing appropriate for
understanding the spoken responses of the test subject.
The interval between the test items depends upon the speech test material, the purpose of the speech test and
the subject’s response mode and shall be stated.
The speech recognition score of a test subject may depend on the intervals between the test items. To make
test results comparable to corresponding reference values, use intervals identical to those employed during the
determination of reference values.
11 Determination of speech detection threshold level
11.1 In monaural testing, start with the ear considered to be more sensitive.
11.2 When determining speech detection threshold, connected speech is preferred as the speech signal.
Let each test item be a segment of 1 s to 2 s duration, controlled by means
...
NORME ISO
INTERNATIONALE 8253-3
Deuxième édition
2012-03-01
Acoustique — Méthodes d’essais
audiométriques —
Partie 3:
Audiométrie vocale
Acoustics — Audiometric test methods —
Part 3: Speech audiometry
Numéro de référence
©
ISO 2012
DOCUMENT PROTÉGÉ PAR COPYRIGHT
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l’accord écrit
de l’ISO à l’adresse ci-après ou du comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse
ii © ISO 2012 – Tous droits réservés
Sommaire Page
Avant-propos . v
Introduction .vi
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 2
4 Exigences relatives à l’enregistrement d’un message vocal . 5
4.1 Exigences générales . 5
4.2 Enregistrement de référence . 6
4.3 Environnement d’enregistrement . 6
4.4 Réponse en fréquence du matériel d’enregistrement . 6
4.5 Intervalle séparant les items successifs . 6
4.6 Niveaux . 6
4.7 Rapport signal/bruit . 6
4.8 Listes d’items phonémiquement équilibrées . 7
4.9 Listes d’items perceptuellement équilibrées . 7
5 Validation des enregistrements des messages vocaux . 7
5.1 Généralités . 7
5.2 Détermination de la courbe d’intelligibilité vocale de référence . 7
5.3 Détermination de l’équivalence perceptuelle des listes d’items . 8
5.4 Détermination de la répétabilité des résultats [fiabilité moyenne «test-retest» (essai/contre-
essai)] . 9
5.5 Documentation . 9
6 Exigences relatives à l’audiométrie vocale .10
7 Niveaux de pression acoustique du bruit ambiant dans la salle d’essai d’audiométrie vocale .10
8 Audiométrie vocale en champ acoustique .10
9 Préparation et instruction du sujet .10
9.1 Généralités .10
9.2 Préparation du sujet .10
9.3 Instruction du sujet . 11
10 Mode de réponse du sujet . 11
11 Détermination du niveau liminaire de perception vocale . 11
12 Détermination du niveau liminaire d’intelligibilité vocale .12
12.1 Généralités .12
12.2 Mode opératoire de la méthode descendante de 5 dB en 5 dB .12
12.3 Mode opératoire de la méthode descendante alternative .13
12.4 Mode opératoire adaptatif à valeur de pas fixe .13
12.5 Autre mode opératoire adaptatif .14
13 Détermination des scores de reconnaissance vocale .14
14 Masquage controlatéral .15
15 Audiométrie vocale en présence d’un bruit de fond .16
15.1 Nature du bruit de fond .16
15.2 Présentation du bruit de fond .16
15.3 Niveaux sonores des signaux vocaux et du bruit de fond .16
15.4 Mode opératoire d’essai .16
16 Présentation de l’audiogramme vocal .18
17 Incertitude de mesure .18
18 Entretien et étalonnage de la chaîne audiométrique .19
18.1 Généralités .19
18.2 Intervalles entre les contrôles .19
18.3 Type A: contrôles de routine et essais d’écoute .19
18.4 Type B: contrôles électroacoustiques périodiques .20
18.5 Type C: contrôles d’étalonnage de base .20
Annexe A (informative) Exemple de messages vocaux .21
Annexe B (informative) Exemples de conditions de bruit de fond .22
Annexe C (informative) Résultats caractéristiques .23
Annexe D (informative) Optimisation de l’équilibre perceptuel des listes d’items .26
Annexe E (informative) Incertitude de mesure .27
Bibliographie .32
iv © ISO 2012 – Tous droits réservés
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux de
normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général confiée aux
comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du comité
technique créé à cet effet. Les organisations internationales, gouvernementales et non gouvernementales,
en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec la Commission
électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI, Partie 2.
La tâche principale des comités techniques est d’élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur publication
comme Normes internationales requiert l’approbation de 75 % au moins des comités membres votants.
L’attention est appelée sur le fait que certains des éléments du présent document peuvent faire l’objet de droits
de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable de ne pas avoir
identifié de tels droits de propriété et averti de leur existence.
L’ISO 8253-3 a été élaborée par le comité technique ISO/TC 43, Acoustique.
Cette deuxième édition annule et remplace la première édition (ISO 8253-3:1996), qui a fait l’objet d’une
révision technique.
L’ISO 8253 comprend les parties suivantes, présentées sous le titre général Acoustique — Méthodes d’essais
audiométriques:
— Partie 1: Audiométrie à sons purs en conduction aérienne et en conduction osseuse
— Partie 2: Audiométrie en champ acoustique avec des sons purs et des bruits à bande étroite comme
signaux d’essai
— Partie 3: Audiométrie vocale
Introduction
L’audiométrie vocale est utilisée pour l’évaluation de l’audition dans le cadre du diagnostic et de la réhabilitation
audiologique.
Les résultats de l’audiométrie vocale dépendent des messages vocaux et de la méthode d’essai utilisés. La
présente partie de l’ISO 8253 définit les conditions concernant les messages vocaux utilisés afin d’assurer
l’existence d’exigences minimales de précision et de comparabilité entre différents essais utilisant différents
messages vocaux, y compris des messages vocaux dans différentes langues. Elle spécifie également les
modes opératoires à utiliser lors des essais de reconnaissance vocale.
vi © ISO 2012 – Tous droits réservés
NORME INTERNATIONALE ISO 8253-3:2012(F)
Acoustique — Méthodes d’essais audiométriques —
Partie 3:
Audiométrie vocale
1 Domaine d’application
La présente partie de l’ISO 8253 spécifie les méthodes fondamentales d’essais de reconnaissance vocale
pour les applications audiologiques.
Afin d’assurer l’existence d’exigences minimales de précision et de comparabilité entre différents modes
opératoires d’essai, y compris pour des essais de reconnaissance vocale dans différentes langues, la présente
partie de l’ISO 8253 spécifie les exigences relatives à la composition, à la validation et à l’évaluation des
messages vocaux et à la réalisation des essais de reconnaissance vocale. La présente partie de l’ISO 8253
ne spécifie pas le contenu des messages vocaux, en raison de la multiplicité des langues.
De plus, la présente partie de l’ISO 8253 spécifie également la détermination de valeurs de référence et les
exigences à remplir pour ce faire, ainsi que le mode de présentation.
La présente partie de l’ISO 8253 spécifie les modes opératoires et les exigences applicables à l’audiométrie
vocale, la présentation des messages vocaux enregistrés s’effectuant par conduction aérienne au moyen d’un
écouteur ou en champ acoustique à l’aide d’un haut-parleur. Elle décrit des méthodes d’utilisation de bruits, soit
comme bruits de masquage appliqués à l’oreille non testée, soit comme bruits de fond.
Pour certains sujets, par exemple les enfants, il peut être nécessaire de recourir à des modes opératoires
d’essai modifiés, qui ne sont pas spécifiés dans la présente partie de l’ISO 8253.
La présente partie de l’ISO 8253 ne traite pas des essais spécialisés tels que ceux qui servent à évaluer
l’audition directionnelle et l’audition dichotique.
2 Références normatives
Les documents de référence suivants sont indispensables pour l’application du présent document. Pour les
références datées, seule l’édition citée s’applique. Pour les références non datées, la dernière édition du
document de référence s’applique (y compris les éventuels amendements).
ISO 266, Acoustique — Fréquences normales
ISO 8253-1, Acoustique — Méthodes d´essais audiométriques — Partie 1: Audiométrie à sons purs en
conduction aérienne et en conduction osseuse
ISO 8253-2, Acoustique — Méthodes d’essais audiométriques — Partie 2: Audiométrie en champ acoustique
avec des sons purs et des bruits à bande étroite comme signaux d’essai
Guide ISO/CEI 98-3, Incertitude de mesure — Partie 3: Guide pour l’expression de l’incertitude de mesure
(GUM:1995)
CEI 60645-1, Électroacoustique — Appareils d’audiologie — Partie 1: Audiomètres tonaux
CEI 60645-2:1993, Audiomètres — Partie 2: Appareils pour l’audiométrie vocale
CEI 61672-1, Électroacoustique — Sonomètres — Partie 1: Spécifications
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions donnés dans l’ISO 8253-1 et dans l’ISO 8253-2
ainsi que les suivants s’appliquent.
3.1
signal vocal
signal acoustique porteur d’information dans une langue donnée
NOTE Un signal vocal peut être un signal de voix ou un signal acoustique simulant un signal de voix.
3.2
item
mot ou logatome monosyllabique ou polysyllabique particulier, ou phrase, ou fragment de parole enchaînée
limité dans le temps, utilisé lors d’un essai d’audiométrie vocale selon des règles définies de présentation et
de comptabilisation
NOTE La comptabilisation peut être basée sur un item complet ou des parties d’item correctement identifiées.
3.3
message vocal
série complète d’items utilisée pour des essais de reconnaissance vocale
NOTE Le message vocal est normalement subdivisé en plusieurs listes d’items.
3.4
message vocal ouvert
série d’items dans laquelle le nombre de réponses alternatives pour chaque item est illimité
3.5
message vocal fermé
série d’items dans laquelle le nombre de réponses alternatives pour chaque item est limité
3.6
phonème
plus petite unité sonore identifiable dans une langue naturelle donnée
3.7
classe de phonèmes
sous-groupe de phonèmes présentant de fortes similitudes du point de vue du mode de production vocale et
des propriétés des signaux acoustiques
3.8
syllabe
segment de parole constitué d’une voyelle, accompagnée ou non d’une ou plusieurs consonnes la précédant
ou la suivant immédiatement
3.9
spondée
mot composé de deux syllabes également accentuées
3.10
logatome
unité syllabique n’ayant pas de signification pour l’auditeur
NOTE Un logatome est parfois appelé «syllabe vide de sens».
3.11
liste d’items
groupe d’items sélectionnés, présenté et comptabilisé comme un essai élémentaire
2 © ISO 2012 – Tous droits réservés
3.12
série d’items
groupe d’items sélectionné dans une liste d’items
3.13
liste d’items phonémiquement équilibrée
liste d’items contenant les différents phonèmes en proportion sensiblement égale à celle dans laquelle ils sont
présents dans une conversation type dans une langue donnée
3.14
liste d’items perceptuellement équilibrée
liste d’items fournissant des résultats équivalents en termes de reconnaissance vocale, avec une variance très
réduite, pour un niveau vocal spécifié et dans des conditions équivalentes (mode de présentation spécifié et
groupe d’auditeurs spécifié)
NOTE Le groupe d’auditeurs spécifié est habituellement composé de sujets otologiquement normaux âgés de 18 ans
à 25 ans inclus. Pour les essais spéciaux, il est admis d’avoir recours également à des groupes différents (par exemple
des enfants otologiquement normaux appartenant à un groupe d’âge spécifié).
3.15
phrase porteuse
phrase ou segment de phrase contenant un item dont la reconnaissance correcte est indépendante du contexte
ou de la signification de la phrase ou du segment de phrase
3.16
enregistrement de référence d’un message vocal
enregistrement maître
enregistrement parfaitement défini qui représente le message vocal et qui sert à sa validation et à son application
3.17
niveau vocal
niveau de pression acoustique continu équivalent du message vocal, mesuré dans un coupleur ou un simulateur
d’oreille approprié ou dans un champ acoustique en utilisant la pondération fréquentielle C selon la CEI 61672-1
NOTE Pour les listes d’items vocaux basées sur des items isolés séparés par des intervalles de silence, l’intégration
ne comprend pas les intervalles en question. Pour les listes d’items basées sur des items isolés comportant une phrase
porteuse, l’intégration comprend uniquement les items. Dans un enregistrement numérique, les intervalles de silence
peuvent être supprimés lors de la lecture. On peut également procéder à une correction numérique en déterminant la
durée totale des items et la durée totale des intervalles de silence.
3.18
niveau de pression acoustique continu équivalent
L
p,eqT
dix fois le logarithme décimal du rapport de la moyenne temporelle du carré de la pression acoustique, p,
pendant un intervalle de temps spécifié de durée T (commençant à t et se terminant à t ), au carré d’une
1 2
valeur de référence, p , exprimé en décibels
t
2
pt dt
()
∫
T
t
1
L =10lg dB
pT,eq
p
où la valeur de référence, p , est 20 µPa
NOTE En raison des limites pratiques imposées par les instruments de mesure, on considère toujours que p désigne
le carré d’une pression acoustique pondérée en fréquence et à bande de fréquences limitée. Il convient d’indiquer, le cas
échéant, l’application d’une pondération fréquentielle spécifique, telle que spécifiée dans la CEI 61672-1, et/ou l’utilisation
de bandes de fréquence spécifiques en utilisant des indices appropriés; par exemple, L désigne le niveau de
p,A,10 s
pression acoustique moyenné dans le temps et à pondération A pendant 10 s.
[3]
[ISO/TR 25417 , 2.3]
3.19
niveau liminaire de perception vocale
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal auquel
le message vocal est perçu (mais pas forcément compris) dans 50 % des essais
3.20
score de reconnaissance vocale
pour un sujet donné et pour un signal vocal, un mode de présentation du signal et un niveau vocal spécifiés,
pourcentage d’items correctement reconnus ou d’items susceptibles d’être comptabilisés si la méthode de
comptabilisation n’est pas basée sur l’ensemble des items
3.21
score maximal de reconnaissance vocale
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, valeur maximale
du score de reconnaissance vocale obtenue indépendamment du niveau vocal
3.22
niveau liminaire d’intelligibilité vocale
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal ou
rapport parole/bruit le plus faible pour lequel le score de reconnaissance vocale est égal à 50 %
NOTE Le niveau d’intelligibilité vocale était autrefois dénommé «seuil de réception vocale».
3.23
niveau liminaire d’intelligibilité vocale de référence
pour un signal vocal et un mode de présentation du signal spécifiés, valeur médiane des niveaux liminaires
d’intelligibilité vocale d’un nombre suffisamment grand de sujets otologiquement normaux des deux sexes,
âgés de 18 ans à 25 ans inclus, pour lesquels les messages vocaux utilisés sont appropriés
3.24
niveau vocal optimal
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal ou
gamme de niveaux vocaux auxquels le score maximal de reconnaissance vocale est obtenu
3.25
niveau vocal demi-optimal
pour un sujet donné et pour un signal vocal et un mode de présentation du signal spécifiés, niveau vocal auquel
la moitié du score maximal de reconnaissance vocale est obtenue
3.26
courbe d’intelligibilité vocale
pour un sujet donné et pour un signal vocal et un mode de présentation spécifiés, courbe de variation du score
de reconnaissance vocale en fonction du niveau vocal
3.27
courbe d’intelligibilité vocale de référence
pour un signal vocal et un mode de présentation du signal spécifiés, courbe de variation, en fonction du niveau vocal,
du score de reconnaissance vocale médian d’un nombre suffisamment élevé de sujets otologiquement normaux
des deux sexes, âgés de 18 ans à 25 ans inclus, pour lesquels les messages vocaux utilisés sont appropriés
4 © ISO 2012 – Tous droits réservés
3.28
niveau d’audition de la parole
pour un signal vocal et un mode de présentation du signal spécifiés, différence entre le niveau vocal et le
niveau liminaire d’intelligibilité vocale de référence approprié
3.29
bruit de fond
son supplémentaire présenté au cours des essais de reconnaissance vocale
3.30
niveau de pression acoustique du bruit de fond
niveau de pression acoustique continu équivalent d’un bruit de fond, mesuré dans un coupleur ou un simulateur
d’oreille approprié ou dans un champ acoustique en utilisant la pondération fréquentielle C selon la CEI 61672-1
3.31
différence de niveau parole/bruit
rapport parole/bruit
RPB
différence entre le niveau vocal et le niveau de bruit de fond
3.32
niveau de masquage effectif de la parole
niveau d’un son masquant spécifié, numériquement égal au niveau d’audition de la parole auquel s’élèverait
le niveau liminaire d’intelligibilité vocale pour un signal vocal donné du fait de la présence du son masquant
3.33
niveau de confort optimal pour la parole
pour un sujet donné et un mode de présentation du signal spécifié, niveau vocal auquel la sonie du signal vocal
est considérée par le sujet comme correspondant au niveau de confort optimal
3.34
parole enchaînée
paroles enchaînées
message émis en continu avec une intonation naturelle, composé de phrases consécutives reliées par des
connexions logiques
4 Exigences relatives à l’enregistrement d’un message vocal
4.1 Exigences générales
Chaque copie de l’enregistrement doit contenir les signaux suivants:
a) le message vocal;
b) un signal d’étalonnage de l’audiomètre vocal, de durée supérieure ou égale à 60 s; ce signal doit être
constitué par un bruit aléatoire pondéré, par exemple tel que spécifié dans la CEI 60645-2:1993, 13.1,
une bande de bruit d’un tiers d’octave centrée sur 1 kHz ou un son modulé en fréquence à 1 kHz ayant
une largeur de bande d’au moins un tiers d’octave; le signal de modulation doit être soit sinusoïdal, soit
triangulaire, avec un taux de répétition compris dans la gamme entre 4 Hz et 20 Hz;
c) des signaux permettant de contrôler la réponse en fréquence de l’audiomètre devant être utilisé, y compris
le matériel de lecture et l’enregistrement; ces signaux doivent avoir une durée supérieure ou égale à 15 s
et se composer de bandes de bruit blanc d’un tiers d’octave centrées sur les fréquences de tiers d’octave
recommandées selon l’ISO 266 pour la gamme de fréquences comprise entre 125 Hz et 8 000 Hz.
NOTE Pour les messages vocaux auxquels sont appliquées d’autres pondérations temporelles et/ou fréquentielles
que le niveau de pression acoustique équivalent pondéré C, il est admis de déterminer des facteurs de correction rendant
compte des différences de niveau vocal, de niveau du signal d’étalonnage et de niveau du bruit de fond liées au niveau de
pression acoustique équivalent pondéré C.
4.2 Enregistrement de référence
Il convient que le locuteur ou la locutrice prononce le message vocal de façon naturelle, en articulant
distinctement et sans accent prononcé. Il convient d’inviter le locuteur ou la locutrice à parler distinctement, à
un rythme normal, en fournissant un effort vocal constant et sans insister sur les mots clés.
Un enregistrement de référence se compose principalement des éléments spécifiés en 4.1. L’enregistrement
de référence ne doit pas être modifié. Toutes les copies doivent être réalisées à partir de l’enregistrement de
référence. Toute modification de l’enregistrement de référence (par exemple un nouvel enregistrement ou des
changements de niveau ou de contenu fréquentiel) nécessite une nouvelle validation (voir Article 5).
Pour l’audiométrie vocale destinée à être réalisée dans le bruit, l’enregistrement de référence doit inclure
également le ou les bruits de fond associés, sur les mêmes canaux ou sur des canaux séparés.
4.3 Environnement d’enregistrement
La salle dans laquelle le message est enregistré doit être suffisamment silencieuse pour permettre l’obtention
d’un rapport signal/bruit d’au moins 40 dB et doit avoir une durée de réverbération inférieure à 0,5 s pour toute
fréquence située dans la gamme comprise entre 125 Hz et 8 000 Hz.
4.4 Réponse en fréquence du matériel d’enregistrement
La réponse en fréquence du matériel d’enregistrement utilisé, microphone compris, doit être plate, à 2 dB, dans
la gamme de fréquences comprise entre 125 Hz et 8 000 Hz.
NOTE Les enregistrements numériques présentent le double avantage d’être de meilleure qualité et de subir une
baisse de qualité négligeable après de multiples utilisations.
4.5 Intervalle séparant les items successifs
Il convient que l’intervalle séparant les items successifs de l’enregistrement soit fixé et constant, à ±10 %.
Pour les mots isolés, il est suggéré de prendre un intervalle au moins égal à 4 s.
4.6 Niveaux
4.6.1 Message vocal
Le niveau liminaire d’intelligibilité vocale de référence moyen de la plus petite série d’items à utiliser à un niveau
de pression acoustique prédéterminé ne doit pas différer de plus de ±1 dB du niveau moyen de l’ensemble des
items de la liste. Le niveau liminaire d’intelligibilité vocale de référence de n’importe quel item individuel ne doit
pas différer de plus de ±3 dB du niveau liminaire d’intelligibilité vocale de référence moyen de l’ensemble des
items de la liste. Le niveau liminaire d’intelligibilité vocale moyen des listes d’items ne doit pas différer de ±1 dB du
niveau liminaire d’intelligibilité vocale de référence moyen de l’ensemble des items enregistrés (voir Annexe D).
4.6.2 Signal d’étalonnage
Le niveau du signal d’étalonnage ne doit pas différer de plus de ±0,5 dB du niveau vocal moyen de l’ensemble
des items du message vocal spécifique. Le niveau du signal d’étalonnage doit être mesuré en utilisant les
mêmes pondérations fréquentielles que lors du mesurage du niveau vocal.
4.7 Rapport signal/bruit
Le niveau de tout bruit de fond présent dans l’enregistrement doit être inférieur d’au moins 40 dB au niveau
du signal d’étalonnage prescrit en 4.6.2 lorsque le mesurage a été effectué en utilisant la même pondération
fréquentielle que lors du mesurage du niveau vocal.
6 © ISO 2012 – Tous droits réservés
4.8 Listes d’items phonémiquement équilibrées
Toutes les listes d’items d’un message vocal spécifique doivent être phonémiquement équilibrées.
Dans certains cas, un équilibrage phonémique parfait peut s’avérer impossible à obtenir. L’équilibrage
phonémique des listes d’items doit alors être réalisé sur la base des classes de phonèmes, c’est-à-dire des
plosives et fricatives voisées et non voisées et des voyelles nasales, longues et courtes.
Il convient que la distribution phonémique du message vocal corresponde à peu près, dans la mesure du
possible, à la distribution phonémique de la langue soumise à essai. Les messages vocaux composés de
nombreux items permettent une meilleure approximation que les messages vocaux de petite taille. Dans
certains cas, la possibilité d’obtention d’une approximation proche de la distribution phonémique est limitée,
par exemple dans le cas des essais de repérage ou des essais destinés aux enfants, car le message vocal doit
alors être limité à un nombre d’items relativement faible.
4.9 Listes d’items perceptuellement équilibrées
Toutes les listes d’items d’un message vocal spécifique doivent être perceptuellement équilibrées, c’est-à-dire
que le résultat de l’essai de reconnaissance vocale doit être indépendant du choix de la liste d’items.
Les listes d’items perceptuellement équilibrées doivent satisfaire aux exigences données en 4.6.1. D’autres
exigences relatives aux listes d’items perceptuellement équilibrées sont données dans ce qui suit.
Les courbes d’intelligibilité vocale de toutes les listes d’items doivent avoir été déterminées de manière que
le niveau liminaire d’intelligibilité vocale puisse être déterminé avec une incertitude élargie ne dépassant pas
1 dB (la largeur de l’intervalle de confiance de 95 % ne doit pas dépasser 2 dB); voir Annexe E. Pour ce
faire, les mesurages de reconnaissance vocale à différents niveaux de présentation (ou avec des rapports
signal/bruit différents dans le cas d’un essai de reconnaissance vocale dans le bruit) doivent être réalisés avec
au moins 10 sujets otologiquement normaux de même langue maternelle que la langue du message vocal.
Les mesurages de reconnaissance vocale doivent être réalisés dans le contexte normal du stimulus vocal
(par exemple présentation de phrases lors de l’utilisation d’un essai de phrases). La reconnaissance vocale
de chaque item particulier doit alors être l’objet d’une comptabilisation et d’une analyse indépendantes (par
exemple comptabilisation de mots particuliers des phrases).
Pour obtenir une incertitude élargie ne dépassant pas 1 dB, il faut être extrêmement attentif à réduire les
sources d’incertitude potentielles.
Pour augmenter l’homogénéité perceptuelle du message vocal, les différences de reconnaissance vocale
entre les items particuliers peuvent être minimisées (voir Annexe D).
5 Validation des enregistrements des messages vocaux
5.1 Généralités
Un appareil satisfaisant aux exigences de la CEI 60645-2:1993, Articles 6 à 17, classe A, A-E, B ou B-E, doit être
utilisé pour la validation. Les essais doivent être réalisés en écoute monaurale. En cas d’utilisation d’un appareil
de classe A-E ou B-E, l’évaluation doit être menée en utilisant un écouteur non corrigé et un écouteur à niveau
de sortie corrigé pour l’équivalence au champ libre. Seules des listes d’items complètes doivent être utilisées.
NOTE En utilisant un appareil de classe A-E ou B-E, on peut s’attendre à obtenir des résultats identiques à la fois
pour l’écoute binaurale avec écouteur et pour l’écoute avec haut-parleur, en raison de leur réponse fréquentielle corrigée
pour l’équivalence au champ libre.
5.2 Détermination de la courbe d’intelligibilité vocale de référence
La courbe d’intelligibilité vocale de référence pour chaque message vocal et chaque mode de présentation doit
être déterminée au moyen d’essais de reconnaissance vocale sur un groupe suffisamment large (au moins 25)
de sujets otologiquement normaux dont la langue maternelle est la langue du message vocal. Les exigences
minimales relatives aux niveaux liminaires d’audition tonale des sujets doivent être spécifiées par le laboratoire
chargé de la validation.
Il est recommandé d’utiliser les critères suivants, basés sur l’audiogramme tonal: il convient que les niveaux
liminaires d’audition des sujets soient inférieurs ou égaux à 10 dB aux fréquences de 250 Hz, 500 Hz, 750 Hz,
1 000 Hz, 1 500 Hz, 2 000 Hz, 3 000 Hz, 4 000 Hz, 6 000 Hz et 8 000 Hz. Pour deux fréquences au maximum,
le niveau liminaire d’audition peut être de 15 dB.
Si l’essai de reconnaissance vocale est destiné à être réalisé avec des enfants, la courbe d’intelligibilité vocale
de référence doit être déterminée avec un groupe suffisamment large (au moins 25) d’enfants otologiquement
normaux de la même classe d’âge que celle à laquelle le message vocal est destiné.
Si l’essai de reconnaissance vocale est destiné à être réalisé dans le silence, la courbe d’intelligibilité vocale
de référence doit être déterminée dans le silence.
Si l’essai de reconnaissance vocale est destiné à être réalisé avec un bruit de fond, la courbe d’intelligibilité
vocale de référence doit être déterminée avec ce bruit de fond. Si l’essai est destiné à être réalisé avec
différents bruits, la courbe d’intelligibilité vocale de référence doit être déterminée avec chaque bruit particulier.
La courbe d’intelligibilité vocale de référence doit être donnée sous forme de tableau décrivant la relation entre
le niveau vocal (ou la différence de niveau parole/bruit) et le score de reconnaissance vocale. Les niveaux
vocaux (ou les différences de niveau parole/bruit) qui sont requis pour obtenir des scores de reconnaissance
vocale de 30 %, 40 %, 50 %, 60 %, 70 %, 80 % et 90 % doivent être spécifiés. Ces valeurs peuvent être
calculées au moyen d’une interpolation appropriée entre les données mesurées.
Si les résultats d’essais de reconnaissance vocale présentent une grande variabilité avec certains sujets (par
exemple des enfants), il peut s’avérer nécessaire de mesurer la courbe d’intelligibilité vocale de référence avec
un plus grand nombre de personnes.
En cas de difficulté à déterminer la courbe d’intelligibilité vocale de référence dans son intégralité, de 0 %
à 100 %, s’assurer que la courbe d’intelligibilité vocale est déterminée dans le domaine étudié. Si l’essai de
reconnaissance vocale doit servir à déterminer des niveaux liminaires de reconnaissance vocale, il convient de
mesurer la courbe d’intelligibilité vocale de référence pour des valeurs proches du niveau liminaire d’intelligibilité
vocale (y compris des valeurs supérieures et inférieures à ce niveau) en utilisant un nombre de mesurages
suffisant. Si l’essai de reconnaissance vocale doit servir à déterminer le niveau vocal optimal, il convient de
mesurer la courbe d’intelligibilité vocale de référence pour des valeurs allant de 50 % (ou moins) à des valeurs
proches de 100 %, en utilisant un nombre de mesurages suffisant.
5.3 Détermination de l’équivalence perceptuelle des listes d’items
L’équivalence perceptuelle des listes d’items de messages vocaux satisfaisant aux exigences spécifiées en 4.9
doit être déterminée en réalisant des essais de reconnaissance vocale sur un groupe suffisamment large (au
moins 10) de sujets otologiquement normaux, tel que décrit en 5.2.
Si l’essai de reconnaissance vocale est destiné à être réalisé dans le silence, l’équivalence perceptuelle des
listes d’items doit être déterminée dans le silence.
Si l’essai de reconnaissance vocale est destiné à être réalisé avec un bruit de fond, l’équivalence perceptuelle
des listes d’items doit être déterminée en utilisant ce bruit. Si l’essai est destiné à être réalisé avec différents
bruits, l’équivalence perceptuelle des listes d’items doit être déterminée en utilisant chaque bruit particulier.
Si, avec certains sujets (par exemple des enfants), les résultats d’essais de reconnaissance vocale présentent
une grande variabilité, il peut être nécessaire de déterminer l’équivalence perceptuelle des listes d’items avec
un nombre plus large de personnes.
L’équivalence perceptuelle des listes d’items doit être spécifiée par les intervalles de confiance moyens de
95 % entre listes d’items. Si l’essai de reconnaissance vocale doit servir à déterminer les niveaux liminaires
d’intelligibilité vocale, l’égalité des listes d’items doit être spécifiée comme étant l’intervalle de confiance moyen
de 95 % entre listes d’items du niveau liminaire d’intelligibilité vocale lors de l’utilisation de différentes listes
d’items avec le même groupe de sujets. Si l’essai de reconnaissance vocale doit servir à déterminer le niveau
vocal optimal, l’égalité des listes d’items doit être spécifiée comme les intervalles de confiance moyens de
8 © ISO 2012 – Tous droits réservés
95 % entre listes d’items des scores de reconnaissance vocale de 50 %, 60 %, 70 %, 80 % et 90 % lors de
l’utilisation de différentes listes d’items avec le même groupe de sujets.
Cela signifie qu’il convient de calculer la moyenne des carrés des différences pour les résultats obtenus entre
les auditeurs avec les différentes listes d’items. La racine carrée de cette valeur multipliée par 2 donne la
valeur souhaitée.
5.4 Détermination de la répétabilité des résultats [fiabilité moyenne «test-retest»
(essai/contre-essai)]
La répétabilité du résultat d’un essai de reconnaissance vocale est quantifiée par la fiabilité moyenne «test-
retest» (essai/contre-essai) chez un sujet. De manière générale, des listes d’items différentes doivent être
utilisées pour l’essai et le contre-essai car les réponses de l’essai initial peuvent être mémorisées par le sujet,
ce qui risque d’influencer le résultat du contre-essai.
Si l’essai de reconnaissance vocale est destiné à être réalisé dans le silence, la fiabilité moyenne «test-retest»
doit être déterminée dans le silence.
Si l’essai de reconnaissance vocale est destiné à être réalisé avec un bruit de fond, la fiabilité moyenne «test-
retest» doit être déterminée en utilisant ce bruit. Si l’essai de reconnaissance vocale est destiné à être réalisé
avec différents bruits, la fiabilité moyenne «test-retest» doit être déterminée en utilisant chaque bruit particulier.
La fiabilité moyenne (comparaison essai/contre-essai) doit être spécifiée par les intervalles de confiance
moyens de 95 % entre les sujets.
Cela signifie qu’il convient de calculer la moyenne des carrés des différences entre les résultats de l’essai et
les mesurages de contre-essai entre les auditeurs. La racine carrée de cette valeur multipliée par 2 donne la
valeur souhaitée.
Si l’essai de reconnaissance vocale est destiné à déterminer les niveaux liminaires d’intelligibilité vocale, la
fiabilité «test-retest» doit être évaluée pour le niveau liminaire d’intelligibilité vocale. Si l’essai de reconnaissance
vocale est destiné à déterminer le niveau vocal optimal, la fiabilité «test-retest» doit être spécifiée pour les
scores de reconnaissance vocale de 50 %, 60 %, 70 %, 80 % et 90 %.
5.5 Documentation
Chaque copie de l’enregistrement doit être accompagnée de documents contenant les informations suivantes:
a) une transcription écrite du message vocal enregistré;
b) la ou les méthodes de comptabilisation, par exemple, sur la base de la phrase, du mot, du mot clé ou du
phonème;
c) les courbes d’intelligibilité vocale de référence, établies comme spécifié en 5.2 pour chaque méthode de
comptabilisation, l’origine des courbes de référence et la description détaillée des conditions de mesurage
(par exemple le nombre, l’âge et les niveaux liminaires d’audition des sujets, ainsi que le type d’audiomètre
vocal utilisé et la disposition des haut-parleurs pour le bruit de fond, le cas échéant);
d) la répétabilité des résultats, telle que spécifiée en 5.4;
e) les durées, les spectres fréquentiels et les niveaux relatifs, par rapport à un message vocal, du signal
d’étalonnage et des autres signaux enregistrés destinés à l’évaluation des performances conformément à
4.1 b) et c);
f) le niveau du signal d’étalonnage et sa relation au niveau liminaire d’intelligibilité vocale de référence;
g) les intervalles entre items successifs;
h) les caractéristiques de tout signal de bruit de fond associé.
6 Exigences relatives à l’audiométrie vocale
L’audiométrie vocale doit être réalisée avec un audiomètre satisfaisant aux exigences de la CEI 60645-2. Les
essais peuvent être réalisés en écoute monaurale ou binaurale avec écouteur, en utilisant un ossivibrateur ou
dans un champ acoustique. Le niveau d’un signal vocal doit être exprimé sous la forme du niveau vocal ou du
niveau d’audition de la parole pour le message vocal spécifique utilisé.
7 Niveaux de pression acoustique du bruit ambiant dans la salle d’essai
d’audiométrie vocale
Les niveaux de pression acoustique du bruit ambiant dans la salle d’essai ne doivent pas masquer les signaux
vocaux. Les exigences relatives aux niveaux de pression acoustique du bruit ambiant dans la salle d’essai sont
fonction du mode de présentation des signaux vocaux, c’est-à-dire par écouteur, ossivibrateur ou haut-parleur.
NOTE Les exigences relatives au bruit ambiant au cours des essais audiométriques sont moins strictes pour
l’audiométrie vocale que pour l’audiométrie liminaire tonale. Si une salle d’essai est qualifiée pour l’audiométrie liminaire
tonale jusqu’à un niveau d’audition donné sur toute la gamme de fréquences, elle peut également servir à l’audiométrie
vocale pour le même mode de présentation des signaux d’essai et pour des niveaux de signaux atteignant les mêmes
valeurs que le niveau d’audition. Les valeurs maximales admissibles du niveau de pression acoustique du bruit ambiant
pour l’audiométrie tonale, dans la gamme de fréquences comprise entre 125 Hz et 8 000 Hz, sont spécifiées dans
l’ISO 8253-1 pour les essais avec écouteur et ossivibrateur et dans l’ISO 8253-2 pour les essais en champ acoustique.
8 Audiométrie vocale en champ acoustique
L’audiométrie vocale en champ acoustique peut être conduite avec ou sans bruit de fond spécialement reproduit
pour les besoins de l’essai.
Il est recommandé d’installer le haut-parleur d’essai en position frontale par rapport à l’auditeur, avec un angle
d’incidence de 0°. Si les résultats audiométriques vocaux d’un seul sujet doivent être comparés avec le niveau
liminaire d’intelligibilité vocale de référence ou avec la courbe d’intelligibilité vocale de référence, la position du
haut-parleur doit être identique à celle utilisée pour la détermination des valeurs de référence.
Les positions recommandées des haut-parleurs émettant un bruit de fond se superposant au signal vocal, le
cas échéant, sont données en 15.2.
Le type de champ acoustique (libre, quasi libre ou diffus), tel que spécifié dans l’ISO 8253-2, doit
...










Questions, Comments and Discussion
Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.
Loading comments...