ISO 10399:2026
(Main)Sensory analysis — Methodology — Duo-trio test
Sensory analysis — Methodology — Duo-trio test
This document specifies a procedure for determining whether a perceptible sensory difference or similarity exists between samples of two products. The method is a forced-choice procedure. The method is applicable whether a difference exists in a single sensory attribute or in several attributes. The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform by the assessors. The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible for the difference). The method is applicable only if the products are fairly homogeneous. The method is effective for: determining that either: a perceptible difference results (duo-trio testing for difference); or a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for example, a change is made in ingredients, processing, packaging, handling or storage; selecting, training and monitoring assessors. Two forms of the method are described: the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from regular production); the balanced-reference technique, used when one product is not more familiar than the other.
Analyse sensorielle — Méthodologie — Essai duo-trio
Le présent document spécifie un mode opératoire permettant de déterminer s’il existe une différence sensorielle perceptible ou une similitude entre les échantillons de deux produits. La méthode est une procédure à choix forcé. Elle s’applique s’il existe une différence pour une seule propriété sensorielle ou pour plusieurs. La méthode est statistiquement moins efficace que l’essai triangulaire (décrit dans l’ISO 4120), mais elle est plus facile à réaliser par les sujets. La méthode est applicable même lorsque la nature de la différence est inconnue (ce qui signifie qu’elle ne détermine ni la taille ni le sens de la différence entre des échantillons et qu’elle ne donne pas non plus d’indications sur l’attribut/les attributs à l’origine de cette différence). La présente méthode n’est applicable que si les produits sont relativement homogènes. La méthode est efficace dans les cas suivants: déterminer: qu’il existe une différence perceptible (essai duo-trio de différence); ou qu’il n’existe pas de différence perceptible significative (essai duo-trio de similitude), quand, par exemple, des modifications sont apportées aux ingrédients, à la transformation, à l’emballage, aux opérations de manutention ou de stockage; sélectionner, entraîner et contrôler les sujets. Deux formes de cette méthode sont décrites: la technique de la référence constante, utilisée lorsque les sujets connaissent bien un produit (un échantillon de fabrication courante par exemple); et la technique de la référence équilibrée, utilisée quand aucun des produits n’est plus connu que l’autre.
General Information
- Status
- Published
- Publication Date
- 14-May-2026
- Technical Committee
- ISO/TC 34/SC 12 - Sensory analysis
- Drafting Committee
- ISO/TC 34/SC 12 - Sensory analysis
- Current Stage
- 6060 - International Standard published
- Start Date
- 15-May-2026
- Due Date
- 08-Nov-2026
- Completion Date
- 15-May-2026
Relations
- Effective Date
- 12-Feb-2026
- Effective Date
- 25-Nov-2023
- Effective Date
- 11-Nov-2023
Overview
ISO 10399:2026 sets out the internationally recognized methodology for conducting the duo-trio test in sensory analysis. Developed by the International Organization for Standardization (ISO), this standard provides a systematic procedure to determine whether a perceptible sensory difference or similarity exists between samples of two products. As a forced-choice test, the duo-trio method is valued for its simplicity and effectiveness in both food and non-food sensory product evaluations. While it is statistically less efficient than the triangle test, it requires less cognitive load for assessors and is versatile across a range of sensory attributes.
Key Topics
- Duo-trio test method: Involves presenting assessors with a reference sample and two coded samples-one matching the reference and the other being different. Assessors must identify the sample that matches (or differs from) the reference.
- Types of duo-trio techniques:
- Constant-reference: Used when one product is familiar (e.g., a control or regular production sample).
- Balanced-reference: Applied when neither product has assessor familiarity.
- Applications across attributes: The method applies whether differences exist in a single attribute (e.g., taste, texture) or several.
- Statistical interpretation: Guides users in determining significance or similarity between products using provided tables and statistical models.
- Assessor qualification and training: Recommends panel selection, training requirements, and number of assessors needed for valid results.
- Operational requirements: Addresses test environment, sample preparation, coding, serving conditions, and unbiased presentation practices.
Applications
The ISO 10399:2026 duo-trio test is widely used in sensory analysis for:
- Product development & reformulation: Assessing whether ingredient, processing, packaging, handling, or storage changes have resulted in a perceptible difference or practical similarity.
- Quality control: Routine sensory checks to confirm product consistency or detect deviations.
- Selecting and training sensory panels: Facilitating the selection and monitoring of assessors based on their ability to perceive differences.
- Market research: Supporting claims of similarity (e.g., when launching a new variant) or differentiation in competitive benchmarking.
- Research studies: Academic and industrial research in sensory science applicable to food, beverages, cosmetics, fragrances, pharmaceuticals, and more, provided the test samples are homogeneous.
Related Standards
- ISO 4120: Sensory analysis - Methodology - Triangle test (statistically more efficient alternative)
- ISO 5492: Sensory analysis - Vocabulary (for definitions of sensory terms)
- ISO 8589: Sensory analysis - General guidance for the design of test rooms (facility and environment requirements)
- ISO 8586: Sensory analysis - General guidelines for the selection, training and monitoring of assessors (relevant for panel management)
- ISO 6658: Sensory analysis - Methodology - General guidance (complementary procedures)
By adopting ISO 10399:2026, organizations ensure robust, comparable, and internationally accepted sensory test results. The standard promotes consistent methodology, reliable data analysis, and improved decision-making in product innovation and quality assurance. Integrating this standard with other ISO sensory analysis documents builds a strong foundation for sensory evaluation processes, supporting compliance and global market access.
Buy Documents
ISO 10399:2026 - Sensory analysis — Methodology — Duo-trio test
ISO 10399:2026 - Analyse sensorielle — Méthodologie — Essai duo-trio
Get Certified
Connect with accredited certification bodies for this standard

BSI Group
BSI (British Standards Institution) is the business standards company that helps organizations make excellence a habit.

Bureau Veritas
Bureau Veritas is a world leader in laboratory testing, inspection and certification services.

DNV
DNV is an independent assurance and risk management provider.
Sponsored listings
Frequently Asked Questions
ISO 10399:2026 is a standard published by the International Organization for Standardization (ISO). Its full title is "Sensory analysis — Methodology — Duo-trio test". This standard covers: This document specifies a procedure for determining whether a perceptible sensory difference or similarity exists between samples of two products. The method is a forced-choice procedure. The method is applicable whether a difference exists in a single sensory attribute or in several attributes. The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform by the assessors. The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible for the difference). The method is applicable only if the products are fairly homogeneous. The method is effective for: determining that either: a perceptible difference results (duo-trio testing for difference); or a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for example, a change is made in ingredients, processing, packaging, handling or storage; selecting, training and monitoring assessors. Two forms of the method are described: the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from regular production); the balanced-reference technique, used when one product is not more familiar than the other.
This document specifies a procedure for determining whether a perceptible sensory difference or similarity exists between samples of two products. The method is a forced-choice procedure. The method is applicable whether a difference exists in a single sensory attribute or in several attributes. The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform by the assessors. The method is applicable even when the nature of the difference is unknown (i.e. it determines neither the size nor the direction of difference between samples, nor is there any indication of the attribute(s) responsible for the difference). The method is applicable only if the products are fairly homogeneous. The method is effective for: determining that either: a perceptible difference results (duo-trio testing for difference); or a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for example, a change is made in ingredients, processing, packaging, handling or storage; selecting, training and monitoring assessors. Two forms of the method are described: the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from regular production); the balanced-reference technique, used when one product is not more familiar than the other.
ISO 10399:2026 is classified under the following ICS (International Classification for Standards) categories: 67.240 - Sensory analysis. The ICS classification helps identify the subject area and facilitates finding related standards.
ISO 10399:2026 has the following relationships with other standards: It is inter standard links to FprEN ISO 10399, ISO/TS 15926-11:2023, ISO 10399:2017. Understanding these relationships helps ensure you are using the most current and applicable version of the standard.
ISO 10399:2026 is available in PDF format for immediate download after purchase. The document can be added to your cart and obtained through the secure checkout process. Digital delivery ensures instant access to the complete standard document.
Standards Content (Sample)
International
Standard
ISO 10399
Fourth edition
Sensory analysis — Methodology —
2026-05
Duo-trio test
Analyse sensorielle — Méthodologie — Essai duo-trio
Reference number
© ISO 2026
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii
Contents Page
Foreword .iv
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Principle . 3
5 General test conditions and requirements . 3
6 Assessors . 4
6.1 Qualification .4
6.2 Number of assessors . .4
7 Procedure . 5
8 Analysis and interpretation of results . 6
8.1 When testing for a difference .6
8.2 When testing for similarity .6
9 Precision and bias . 6
10 Test report . 6
Annex A (normative) Tables . 8
Annex B (informative) Examples . 16
Bibliography .22
iii
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out through
ISO technical committees. Each member body interested in a subject for which a technical committee
has been established has the right to be represented on that committee. International organizations,
governmental and non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely
with the International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are described
in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the different types
of ISO document should be noted. This document was drafted in accordance with the editorial rules of the
ISO/IEC Directives, Part 2 (see www.iso.org/directives).
ISO draws attention to the possibility that the implementation of this document may involve the use of (a)
patent(s). ISO takes no position concerning the evidence, validity or applicability of any claimed patent
rights in respect thereof. As of the date of publication of this document, ISO had not received notice of (a)
patent(s) which may be required to implement this document. However, implementers are cautioned that
this may not represent the latest information, which may be obtained from the patent database available at
www.iso.org/patents. ISO shall not be held responsible for identifying any or all such patent rights.
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and expressions
related to conformity assessment, as well as information about ISO’s adherence to the World Trade
Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 34, Food products, Subcommittee SC 12,
Sensory analysis, in collaboration with the European Committee for Standardization (CEN), in accordance
with the Agreement on technical cooperation between ISO and CEN (Vienna Agreement).
This fourth edition cancels and replaces the third edition (ISO 10399:2017), which has been technically
revised.
The main changes are as follows:
— the document has been generalized beyond food and beverage applications;
— the description of how to test for similarity has been updated to best practices and some definitions and
descriptions have been amended to also encompass this scenario;
— basic information on how to use the Thurstonian model in addition to the previously emphasized
guessing model has been added;
— the principle has been expanded slightly to enhance clarity;
— R code has been provided in the tables of Annex A as one alternative option to derive exact results, which
is exemplified in the examples in Annex B;
— the example in Clause B.2 has been modified to reflect state-of-the-art testing for similarity, whereas the
example in Clause B.3 has been dropped as the confidence interval approach is now embedded into the
earlier examples;
— the references have been updated.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.
iv
International Standard ISO 10399:2026(en)
Sensory analysis — Methodology — Duo-trio test
1 Scope
This document specifies a procedure for determining whether a perceptible sensory difference or similarity
exists between samples of two products. The method is a forced-choice procedure. The method is applicable
whether a difference exists in a single sensory attribute or in several attributes.
The method is statistically less efficient than the triangle test (described in ISO 4120) but is easier to perform
by the assessors.
The method is applicable even when the nature of the difference is unknown (i.e. it determines neither
the size nor the direction of difference between samples, nor is there any indication of the attribute(s)
responsible for the difference). The method is applicable only if the products are fairly homogeneous.
The method is effective for:
a) determining that either:
1) a perceptible difference results (duo-trio testing for difference); or
2) a meaningful perceptible difference does not result (duo-trio testing for similarity) when, for
example, a change is made in ingredients, processing, packaging, handling or storage;
b) selecting, training and monitoring assessors.
Two forms of the method are described:
— the constant-reference technique, used when one product is familiar to the assessors (e.g. a sample from
regular production);
— the balanced-reference technique, used when one product is not more familiar than the other.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content constitutes
requirements of this document. For dated references, only the edition cited applies. For undated references,
the latest edition of the referenced document (including any amendments) applies.
ISO 5492, Sensory analysis — Vocabulary
ISO 8589, Sensory analysis — General guidance for the design of test rooms
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 5492 and the following apply.
ISO and IEC maintain terminology databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
3.1
alpha-risk
α-risk
Type I error rate
significance level
false positive rate
α
probability of rejecting the null hypothesis by a statistical test when, in fact, the null hypothesis is true
Note 1 to entry: When testing for product (3.5) differences (3.3), the α-risk is the probability of erroneously concluding
that a perceptible difference exists when, in fact, it does not. When testing for similarity (3.8), the α-risk is the
probability of erroneously concluding that the products are perceptibly similar when, in fact, they are not.
3.2
beta-risk
β-risk
Type II error rate
false negative rate
β
probability of failing to reject the null hypothesis by a statistical test when, in fact, the null hypothesis is not
true
Note 1 to entry: 1 – β is also known as the power of the test.
Note 2 to entry: When testing for product (3.5) differences (3.3), the β-risk is the probability of failing to conclude that
a perceptible difference exists when, in fact, the products are perceptually different. When testing for similarity (3.8),
the β-risk is the probability of failing to conclude that the products are perceptibly similar when, in fact, they are.
3.3
difference
situation in which samples (3.6) can be distinguished based on their sensory properties
3.4
p
d
proportion of assessments in which a perceptible difference (3.3) is detected between the two products (3.5)
3.5
product
material to be evaluated
3.6
sample
unit of product (3.5) prepared, presented and evaluated in the test
3.7
sensitivity
< statistic> statistical parameters that measure the performance characteristics of the test
Note 1 to entry: In statistical terms, the sensitivity of the test is defined by the values of α, β and p (3.4) (or δ (3.9)).
d
3.8
similarity
situation in which any perceptible differences (3.3) between the samples (3.6) are so small that the products
(3.5) can be used interchangeably
3.9
Thurstonian δ
δ
measure of the magnitude of the sensory difference (3.3) between two products (3.5)
Note 1 to entry: The true perceptual difference between two products is denoted δ. The estimate of δ from the data is
denoted d′ (“d-prime”).
Note 2 to entry: For a given protocol, any value of δ is equivalent to a value p (3.4) so they can be used interchangeably,
d
[4][6]
but the relationship changes with the test protocol.
3.10
triad
three samples (3.6) given to an assessor in the duo-trio test
Note 1 to entry: In the duo-trio test, one sample is labelled as the reference, the other two are marked with different
codes. One of the coded samples is the same product (3.5) as the reference; the other coded sample is the other product
in the test.
4 Principle
The number of assessors is chosen based on the sensitivity desired for the test (see 6.2 and the discussion in
Clause A.3).
Assessors receive a set of three samples (i.e. a triad), one sample of which is labelled as a reference and
the other two samples have different codes. The two coded samples comprise one sample that is the same
product as the labelled reference sample (i.e. the hidden reference) and one sample that is a different product
than the labelled reference sample (i.e. the test sample). The presentation order of the coded samples is
assigned to assessors based on balanced random schemes (see 7.1). The assessors are informed that one
of the coded samples is the same as the reference and that one is different. Based on their training and the
instructions given prior to the test, the assessors report either which of the coded samples they believe to be
same as the reference, or which of the coded samples they believe to be different from the reference.
The number of correct responses is counted, and the significance is determined by reference to a statistical
table or an applicable computer program or app.
5 General test conditions and requirements
5.1 Clearly state the test objective in writing.
5.2 Carry out the test under conditions that prevent communication among assessors until all the
evaluations have been completed using facilities and booths that conform with ISO 8589.
5.3 Prepare the samples out of sight of the assessors and in an identical manner (i.e. same apparatus, same
vessels, same quantity of product).
5.4 Assessors shall not be able to identify the samples from the way in which they are presented. For
example, in a taste test, avoid any differences in appearance. Mask any irrelevant colour differences using
light filters and/or subdued illumination.
5.5 Code the test samples in a uniform manner, preferably using three-digit numbers, chosen at random
for each test. Each triad is composed of three samples, one labelled as the reference and two labelled with
different codes. Preferably, different codes should be used for each assessor during a session. However,
the same two codes may be used for all assessors within a test, provided that each code is used only once
per assessor during a test session (e.g. if several duo-trio tests on the same or different products are being
conducted in the same session).
5.6 The samples should be presented under the conditions at which the product is generally used (e.g.
when tasting, present the samples at the temperature at which the product is generally consumed). The
serving conditions of the three samples in each triad shall be identical, just as that of all the other samples in
a series of tests on a given type of product.
5.7 The size, quantity or volume presented shall be identical for the three samples in each triad, just as
that of all the other samples in a series of tests on a given type of product. The size, quantity or volume to be
evaluated may be imposed. If it is not, the assessors should be told to take sizes, quantities or volumes that
are always similar whatever the sample.
5.8 Depending on the products and test objectives, re-tasting (of the reference or all samples) may be
accepted. The assessors shall be instructed accordingly.
5.9 When tasting, the assessors shall be told whether or not they are to swallow the samples or whether
they are free to do as they please. In this latter case, they shall be requested to proceed in the same manner
for all samples. Depending on project objectives and test products, suitable neutralizing agents may be used
between or even within individual trials. Assessors shall be instructed accordingly.
5.10 During the test sessions, avoid giving information about product identity, expected treatment effects,
or individual performance until all testing is completed.
6 Assessors
6.1 Qualification
All assessors should possess the same level of qualification and training; this level should be chosen based
on the test objective (see ISO 8586 for guidance). Experience and familiarity with the product can improve
the performance of an assessor and, therefore, can increase the likelihood of a correct result, which will
then increase the probability of finding a significant difference but would decrease the likelihood to find
significant similarity. Monitoring the performance of assessors over time may be useful for increased
sensitivity.
All assessors shall be familiar with the mechanics of the duo-trio test (i.e. the format, task and evaluation
procedure).
6.2 Number of assessors
Choose the number of assessors so as to obtain the sensitivity required for the test (see the discussion
in Clause A.3). Using large numbers of assessors increases the probability of detecting small differences
between the products. However, in practice, the number of assessors often is determined by material
conditions (e.g. duration of the experiment, number of available assessors, quantity of product).
As examples, first consider testing for product differences, in which the null hypothesis assumes p = 0 %
d
and the desired power is 80 %. If the alternative hypothesis assumes the true p = 30 %, then a test at the
d
10 %-significance level requires 53 assessors. A test at the 5 %-significance level for the smaller effect size
of p = 25 % requires 102 assessors.
d
Next, consider testing for product similarity, in which the alternative hypothesis assumes p = 0 % and the
d
desired power is 80 %. If similarity is evaluated using the equivalence margin of p = 30 %, i.e. the null
d
hypothesis assumes p = 30 %, then a test at the 10 %-significance level requires 49 assessors. A test at the
d
5 %-significance level using the more conservative equivalence margin p = 25 % requires 102 assessors.
d
As these examples show, a test for product differences at a specific α-risk, β-risk, and values for p under
d
the null and alternative hypotheses requires a particular sample size that is nearly the same as, and often
identical to, the sample size needed to test for equivalence given these same parameter values, but where
the p values under the null and alternative hypotheses have been reversed.
d
Avoid replicate evaluations by the same assessor whenever possible. However, if replicate evaluations
are needed to produce a sufficient number of total evaluations, every effort should be made to have each
assessor perform the same number of replicate evaluations. For example, if only 12 assessors are available,
have each assessor evaluate 3 triads to obtain a total of 36 evaluations.
NOTE Treating 3 evaluations performed by 12 assessors as 36 independent evaluations is not statistically valid
when testing for similarity using Table A.2. However, the test for difference using Table A.1 is statistically valid
[7][8]
even when replicate evaluations are performed. Recent publications on replicated discrimination tests suggest
[5]
alternative, model-based approaches for analysing replicated evaluations in discrimination tests, or for analysing
[10]
replicated evaluations in discrimination tests with the purpose of showing similarity.
7 Procedure
7.1 If the product is familiar to the assessors (e.g. a control sample from the production line), use the
constant reference technique (see 7.2). If neither product is more familiar than the other, use the balanced-
reference technique (see 7.3).
7.2 Constant-reference technique: Prepare worksheets and scoresheets (see Clause B.2) in advance of the
test so as to utilize an equal number of the two possible sequences of two products, A and B:
A-REF A B A-REF B A
Distribute these at random in groups of two among the assessors (i.e. use each sequence once among the
first two assessors; use each sequence once again among the next two assessors, etc.). This will minimize
the imbalance that results if the total number of assessors is not an even number.
7.3 Balanced-reference technique: Prepare worksheets and scoresheets (see Clause B.1) in advance of the
test so as to utilize an equal number of the four possible sequences of two products, A and B:
A-REF A B A-REF B A
B-REF A B B-REF B A
where the first two triads contain product A as the reference (i.e. A-REF) and the last two triads contain
product B as the reference (i.e. B-REF). Distribute these at random in groups of four among the assessors
(i.e. use each sequence once among the first group of four assessors; use each sequence once again among
the next group of four assessors, etc.). This will minimize the imbalance that results if the total number of
assessors is not a multiple of four.
7.4 Present the three samples of each triad simultaneously if possible, following the same spatial
arrangement for each assessor (e.g. on a line to be sampled always from left to right, in a triangular array).
Within the triad, assessors are generally allowed to make repeated evaluations of each sample as desired (if,
of course, the nature of the product allows for repeated evaluations).
7.5 Instruct the assessors to evaluate the reference sample first, then evaluate the two coded samples in
the order in which they were presented. Inform the assessors that one of the coded samples is the same as
the reference and that one is different from the reference. Instruct the assessors to indicate either which of
the two coded samples is the same as the reference, or which of the two coded samples is different from the
reference.
NOTE When deciding whether to instruct the assessors to select the sample that is the same as the reference or
to select the sample that is different from the reference, consideration is given to whether or not the panel routinely
uses other discrimination test methods. Many discrimination test methods such as the triangle test, for example, focus
on identifying the “odd” or “different” sample in the test. Instructing the assessors to identify the “different” sample
in one method and to identify the “same” sample in another method can cause confusion and lead to higher levels of
incorrect responses.
7.6 Each scoresheet should provide for a single triad of samples. If an assessor is to carry out more than
one test in a session, collect the completed scoresheet and unused samples prior to serving the subsequent
triad. The assessor shall not go back to any samples from previous triads or change the verdict on any
previous test.
7.7 Do not ask questions about preference, acceptance or degree of difference after the assessor has
made a selection. The selection the assessor has just made can bias the reply to any additional questions.
Responses to such questions may be obtained through separate tests for preference, acceptance, degree of
difference, etc., see ISO 6658. A comment section asking why the choice was made may be included for the
assessor’s remarks.
7.8 The duo-trio test is a forced-choice procedure; assessors are not allowed the option of reporting “no
difference”. An assessor who detects no difference between the samples should be instructed to randomly
select one of the samples and to indicate that the selection was only a guess in the comments section of the
scoresheet.
8 Analysis and interpretation of results
8.1 When testing for a difference
Use Table A.1 to analyse the data obtained from a duo-trio test. If the number of correct responses is greater
than or equal to the number given in Table A.1 (corresponding to the number of assessors and the α-risk
level chosen for the test), conclude that a perceptible differ
...
Norme
internationale
ISO 10399
Quatrième édition
Analyse sensorielle — Méthodologie
2026-05
— Essai duo-trio
Sensory analysis — Methodology — Duo-trio test
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2026
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii
Sommaire Page
Avant-propos .iv
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Principe. 3
5 Conditions générales d’essai et exigences . 3
6 Sujets . 4
6.1 Qualification .4
6.2 Nombre de sujets .4
7 Mode opératoire . 5
8 Analyse et interprétation des résultats . 6
8.1 Lors d’un essai de différence .6
8.2 Lors d’un essai de similitude .6
9 Fidélité et erreurs systématiques . . 7
10 Rapport d’essai . 7
Annexe A (normative) Tableaux . 8
Annexe B (informative) Exemples .16
Bibliographie .22
iii
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes nationaux
de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est en général
confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude a le droit de faire
partie du comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l’ISO participent également aux travaux. L’ISO collabore étroitement avec
la Commission électrotechnique internationale (IEC) en ce qui concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a
été rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir
www.iso.org/directives).
L’ISO attire l’attention sur le fait que la mise en application du présent document peut entraîner l’utilisation
d’un ou de plusieurs brevets. L’ISO ne prend pas position quant à la preuve, à la validité et à l’applicabilité de
tout droit de brevet revendiqué à cet égard. À la date de publication du présent document, l’ISO n’avait pas
reçu notification qu’un ou plusieurs brevets pouvaient être nécessaires à sa mise en application. Toutefois,
il y a lieu d’avertir les responsables de la mise en application du présent document que des informations
plus récentes sont susceptibles de figurer dans la base de données de brevets, disponible à l’adresse
www.iso.org/brevets. L’ISO ne saurait être tenue pour responsable de ne pas avoir identifié tout ou partie de
tels droits de propriété.
Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour
information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion de
l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles techniques au
commerce (OTC), voir www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 34, Produits alimentaires, sous-comité
SC 12, Analyse sensorielle, en collaboration avec le Comité européen de normalisation (CEN) conformément à
l’Accord de coopération technique entre l’ISO et le CEN (Accord de Vienne).
Cette quatrième édition annule et remplace la troisième édition (ISO 10399:2017), qui a fait l’objet d’une
révision technique.
Les principales modifications sont les suivantes:
— le document a été généralisé au-delà des applications pour les aliments et boissons;
— la description de la méthode d’essai de similitude a été mise à jour pour intégrer les meilleures pratiques
et certaines définitions et descriptions ont été modifiées pour englober aussi ce scénario;
— des informations de base sur la façon d’utiliser le modèle thurstonien en complément du modèle de
supposition précédemment décrit ont été ajoutées;
— le principe a été quelque peu développé pour plus de clarté;
— un code R a été fourni dans les tableaux de l’Annexe A à titre d’alternative pour obtenir des résultats
exacts, lequel est explicité dans les exemples de l’Annexe B;
— l’exemple de l’Article B.2 a été modifié pour refléter les essais de similitude de l’état de l’art, tandis que
l’exemple de l’Article B.3 a été supprimé car l’approche de l’intervalle de confiance est désormais intégrée
dans les exemples précédents;
— les références ont été mises à jour.
iv
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes se
trouve à l’adresse www.iso.org/fr/members.html.
v
Norme internationale ISO 10399:2026(fr)
Analyse sensorielle — Méthodologie — Essai duo-trio
1 Domaine d’application
Le présent document spécifie un mode opératoire permettant de déterminer s’il existe une différence
sensorielle perceptible ou une similitude entre les échantillons de deux produits. La méthode est une
procédure à choix forcé. Elle s’applique s’il existe une différence pour une seule propriété sensorielle ou pour
plusieurs.
La méthode est statistiquement moins efficace que l’essai triangulaire (décrit dans l’ISO 4120), mais elle est
plus facile à réaliser par les sujets.
La méthode est applicable même lorsque la nature de la différence est inconnue (ce qui signifie qu’elle
ne détermine ni la taille ni le sens de la différence entre des échantillons et qu’elle ne donne pas non plus
d’indications sur l’attribut/les attributs à l’origine de cette différence). La présente méthode n’est applicable
que si les produits sont relativement homogènes.
La méthode est efficace dans les cas suivants:
a) déterminer:
1) qu’il existe une différence perceptible (essai duo-trio de différence); ou
2) qu’il n’existe pas de différence perceptible significative (essai duo-trio de similitude), quand, par
exemple, des modifications sont apportées aux ingrédients, à la transformation, à l’emballage, aux
opérations de manutention ou de stockage;
b) sélectionner, entraîner et contrôler les sujets.
Deux formes de cette méthode sont décrites:
— la technique de la référence constante, utilisée lorsque les sujets connaissent bien un produit
(un échantillon de fabrication courante par exemple); et
— la technique de la référence équilibrée, utilisée quand aucun des produits n’est plus connu que l’autre.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique. Pour
les références non datées, la dernière édition du document de référence s’applique (y compris les éventuels
amendements).
ISO 5492, Analyse sensorielle — Vocabulaire
ISO 8589, Analyse sensorielle — Directives générales pour la conception de locaux destinés à l’analyse
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO 5492 ainsi que les suivants
s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en normalisation,
consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
3.1
risque alpha
risque α
taux d’erreur de type I
niveau de significativité
taux de faux positifs
α
probabilité de rejeter l’hypothèse nulle d’un test statistique alors qu’en réalité l’hypothèse nulle est vraie
Note 1 à l'article: Dans le cadre des essais de différence (3.3) de produits (3.5), le risque α est la probabilité de conclure
à tort qu’une différence perceptible existe lorsqu’en réalité il n’en existe pas. Dans le cadre des essais de similitude
(3.8), le risque α est la probabilité de conclure à tort que les produits sont perceptiblement similaires lorsqu’en réalité
ils ne le sont pas.
3.2
risque bêta
risque β
taux d’erreur de type II
taux de faux négatifs
β
probabilité de ne pas rejeter l’hypothèse nulle d’un test statistique lorsqu’en réalité l’hypothèse nulle n’est
pas vraie
Note 1 à l'article: 1 – β est également appelé la puissance du test.
Note 2 à l'article: Dans le cadre des essais de différence (3.3) de produits (3.5), le risque β est la probabilité de ne
pas conclure qu’une différence perceptible existe lorsqu’en réalité les produits sont perceptiblement différents.
Dans le cadre des essais de similitude (3.8), le risque β est la probabilité de ne pas conclure que les produits sont
perceptiblement similaires lorsqu’en réalité ils le sont.
3.3
différence
situation dans laquelle les échantillons (3.6) peuvent être distingués sur la base de leurs propriétés
sensorielles
3.4
p
d
proportion d’évaluations au cours desquelles une différence perceptible (3.3) est détectée entre les deux
produits (3.5)
3.5
produit
matériau à évaluer
3.6
échantillon
unité de produit (3.5) préparée, présentée et évaluée au cours de l’essai
3.7
sensibilité
paramètres statistiques qui mesurent les caractéristiques de performance de l’analyse
Note 1 à l'article: En termes statistiques, la sensibilité de l’essai est définie par les valeurs de α, β et p (3.4) (ou δ (3.7)).
d
3.8
similitude
situation dans laquelle les différences (3.3) perceptibles entre les échantillons (3.6) sont si petites que les
produits (3.5) peuvent être utilisés de manière interchangeable
3.9
δ thurstonien
δ
mesure de l’ampleur de la différence (3.3) sensorielle entre deux produits (3.5)
Note 1 à l'article: La différence perceptuelle vraie entre deux produits est notée δ. L’estimation de δ à partir des
données est notée d’ ("d prime").
Note 2 à l'article: Pour un protocole donné, toute valeur de δ est équivalente à une valeur p (3.4) de sorte qu’elles
d
[4][6]
peuvent être utilisées de manière interchangeable, mais la relation change avec le protocole d’essai.
3.10
triade
trois échantillons (3.6) fournis à un sujet au cours de l’essai duo-trio
Note 1 à l'article: Dans l’essai duo-trio, un échantillon est étiqueté comme référence, les deux autres portent des codes
différents. L’un des échantillons codés est le même produit (3.5) que la référence; l’autre échantillon codé est l’autre
produit de l’essai.
4 Principe
Le nombre de sujets est choisi en fonction de la sensibilité souhaitée pour l’essai (voir 6.2 et la discussion à
l’Article A.3).
Les sujets reçoivent un ensemble de trois échantillons (c’est-à-dire une triade), dont l’un est étiqueté comme
étant l’échantillon de référence et les deux autres portent des codes différents. Les deux échantillons codés
se composent d’un échantillon qui est le même produit que l’échantillon de référence étiqueté (c’est-à-dire
la référence cachée) et d’un échantillon qui est un produit différent de l’échantillon de référence étiqueté
(c’est-à-dire l’échantillon d’essai). L’ordre de présentation des échantillons codés est attribué aux sujets sur
la base de schémas équilibrés aléatoires (voir 7.1). Les sujets sont informés que l’un des échantillons codés
est identique à l’échantillon de référence et que l’autre est différent. Sur la base de leur entraînement et des
instructions données avant l’essai, les sujets identifient l’échantillon codé dont ils pensent qu’il est le même
que l’échantillon de référence, ou celui dont ils pensent qu’il diffère de l’échantillon de référence.
Le nombre de réponses correctes est compté et sa significativité déterminée par référence à une table
statistique ou à un programme ou à une application informatique applicable.
5 Conditions générales d’essai et exigences
5.1 Indiquer l’objectif de l’essai par écrit de manière claire.
5.2 Effectuer l’essai dans des conditions empêchant toute communication entre les sujets jusqu’à ce que
toutes les évaluations aient été terminées, en utilisant des installations et des cabines conformes à l’ISO 8589.
5.3 Préparer les échantillons à l’abri du regard des sujets et de manière identique (c’est-à-dire même
appareillage, mêmes récipients, mêmes quantités de produit).
5.4 Les sujets ne doivent pas être capables d’identifier les échantillons d’après la manière dont ils sont
présentés. Par exemple, lors d’un essai portant sur le goût, éviter toute différence d’aspect. Masquer toutes
les différences de couleur non pertinentes en utilisant des filtres à lumière et/ou une lumière tamisée.
5.5 Coder les échantillons d’essai de façon uniforme, en utilisant de préférence des nombres à trois chiffres,
choisis au hasard pour chaque essai. Chaque triade est composée de trois échantillons, un étiqueté comme
échantillon de référence et deux étiquetés avec des codes différents. De préférence, il convient d’utiliser des
codes différents pour chaque sujet au cours d’une session. Cependant, les deux mêmes codes peuvent être
utilisés pour tous les sujets au sein d’un essai, à condition que chaque code ne soit utilisé qu’une fois par
sujet au cours d’une session (par exemple, si plusieurs essais duo-trio portant sur le même produit ou sur
différents produits sont conduits au cours de la même session).
5.6 Il convient de présenter les échantillons dans les conditions dans lesquelles le produit est généralement
utilisé (par exemple, lors de la dégustation, présenter les échantillons à la température à laquelle le produit
est généralement consommé). Les conditions de présentation des trois échantillons de chaque triade doivent
être identiques, de même que celles de tous les autres échantillons d’une série d’essais effectués sur un type
donné de produit.
5.7 La taille, la quantité ou le volume présenté(e) doit être identique pour les trois échantillons de chaque
triade, de même que la taille, la quantité ou le volume de tous les autres échantillons d’une série d’essais
effectués sur un type donné de produit. La taille, la quantité ou le volume à évaluer peut être imposée. Sinon,
il convient cependant de spécifier aux sujets de prendre des tailles, des quantités ou des volumes toujours
similaires quel que soit l’échantillon.
5.8 Selon les produits et les objectifs de l’essai, une nouvelle dégustation (de la référence ou de tous les
échantillons) peut être acceptée. Les sujets doivent recevoir des instructions en conséquence.
5.9 Dans le cadre d’une dégustation, il doit être indiqué aux sujets s’ils doivent ou non avaler les
échantillons ou s’ils sont libres de procéder comme ils le veulent. Dans ce dernier cas, il doit leur être
demandé de procéder de la même manière pour tous les échantillons. En fonction des objectifs du projet et
des produits d’essai, des agents neutralisants appropriés peuvent être utilisés entre les essais individuels ou
même au cours de ceux-ci. Les sujets doivent recevoir des instructions en conséquence.
5.10 Pendant les sessions d’essai, éviter de donner des informations sur l’identité du produit, les effets
attendus du traitement ou les performances individuelles jusqu’à la fin de tous les essais.
6 Sujets
6.1 Qualification
Il convient que tous les sujets possèdent le même niveau de qualification et de formation et que ce niveau soit
choisi selon l’objectif de l’essai (voir l’ISO 8586 à titre de document d’orientation). L’expérience et l’habitude
du produit peuvent améliorer les performances d’un sujet et peuvent de ce fait augmenter les chances
d’aboutir à un résultat correct, ce qui augmentera alors la probabilité de trouver une différence significative
mais diminuera la probabilité de trouver une similitude significative. La mesure des performances des sujets
en fonction du temps peut se révéler utile pour suivre l’augmentation de la sensibilité.
Tous les sujets doivent bien connaître les mécanismes de l’essai duo-trio (c’est-à-dire le format, la tâche et le
mode opératoire d’évaluation).
6.2 Nombre de sujets
Choisir le nombre de sujets de manière à obtenir la sensibilité requise pour l’essai (voir la discussion à
l’Article A.3). L’utilisation de grands nombres de sujets accroît les chances de détecter de petites différences
entre les produits. Toutefois, dans la pratique, le nombre de sujets est souvent déterminé par des conditions
matérielles (par exemple, la durée de l’expérience, le nombre de sujets disponibles, la quantité de produit).
À titre d’exemples, dans le cas d’essais de différence de produits tout d’abord, où p = 0 % est posé pour
d
l’hypothèse nulle et pour une puissance souhaitée de 80 %, s’il est posé pour l’hypothèse alternative que le
vrai p = 30 %, alors un essai au niveau de significativité de 10 % nécessite 53 sujets. Un essai au niveau de
d
significativité de 5 % pour une plus petite valeur d’effet de p = 25 % nécessite 102 sujets.
d
Dans le cas d’essais de similitude à présent, où p = 0 % est posé pour l’hypothèse alternative et pour
d
une puissance souhaitée de 80 %, si la similitude est évaluée avec une marge d’équivalence de p = 30 %,
d
c’est-à-dire que p = 30 % est posé pour l’hypothèse nulle, alors un essai au niveau de significativité de
d
10 % nécessite 49 sujets. Un essai au niveau de significativité de 5 % avec une marge d’équivalence plus
conservatrice de p = 25 % nécessite 102 sujets.
d
Comme le montrent ces exemples, un essai de différence de produits à un risque α, un risque β et pour les
valeurs de p posées pour les hypothèses nulle et alternative nécessite un certain nombre de sujets qui
d
est quasi identique, et souvent identique, au nombre de sujets nécessaire à un essai d’équivalence avec ces
mêmes valeurs de paramètres, mais où les valeurs de p posées pour les hypothèses nulle et alternative ont
d
été inversées.
Éviter, autant que possible, les évaluations répétées par un même sujet. Cependant, si des évaluations
répétées sont nécessaires pour réaliser un nombre total d’évaluations suffisant, il convient de s’efforcer
que chaque sujet réalise le même nombre d’évaluations répétées. Par exemple, si seulement 12 sujets sont
disponibles, faire évaluer à chaque sujet 3 triades pour obtenir un nombre total de 36 évaluations.
NOTE Analyser 3 évaluations réalisées par 12 sujets comme 36 évaluations indépendantes n’est pas
statistiquement valide pour un essai de similitude en utilisant le Tableau A.2. En revanche, l’essai de différence en
[7][8]
utilisant le Tableau A.1 est statistiquement valide même lorsque des évaluations répétées sont réalisées. Des
publications récentes sur des essais de discrimination avec répétitions suggèrent des approches alternatives, basées
[5]
sur des modèles, pour analyser les évaluations répétées dans les essais de discrimination, ou pour analyser les
[10]
évaluations répétées dans les essais de discrimination visant à montrer la similitude.
7 Mode opératoire
7.1 Si les sujets connaissent bien le produit (par exemple un échantillon de contrôle de la ligne de
production), employer la technique de la référence constante (voir 7.2). Si aucun des deux produits ne leur
est plus familier l’un que l’autre, employer la technique de la référence équilibrée (voir 7.3).
7.2 Technique de la référence constante: avant l’essai, préparer des feuilles de protocole et des formulaires
de réponse (voir l’Article B.2), de manière à utiliser un nombre égal des deux jeux possibles de deux produits,
A et B:
A-REF A B A-REF B A
Distribuer ces jeux au hasard par groupe de deux parmi les sujets (en d’autres termes, utiliser chaque jeu
une fois parmi les deux premiers sujets; utiliser chaque jeu une seconde fois parmi les deux sujets suivants,
etc.). Le fait de procéder ainsi réduit le déséquilibre survenant lorsque le nombre total de sujets n’est pas un
nombre pair.
7.3 Technique de la référence équilibrée: avant l’essai, préparer des feuilles de protocole et des formulaires
de réponse (voir l’Article B.1), de manière à utiliser un nombre égal des quatre jeux possibles de deux
produits, A et B:
A-REF A B A-REF B A
B-REF A B B-REF B A
où les deux premières triades comprennent le produit A comme échantillon de référence (c’est-à-dire A-REF)
et les deux dernières triades comprennent le produit B comme échantillon de référence (c’est-à-dire B-REF).
Distribuer ces jeux au hasard par groupe de quatre parmi les sujets (en d’autres termes, utiliser chaque
jeu une fois parmi le premier groupe de quatre sujets; utiliser chaque jeu une seconde fois parmi le groupe
de quatre sujets suivants, etc.). Procéder ainsi réduit le déséquilibre survenant lorsque le nombre total de
sujets n’est pas un multiple de quatre.
7.4 Présenter les trois échantillons de chaque triade simultanément si possible, en suivant la même
disposition spatiale pour chaque sujet (par exemple, en ligne devant toujours être examinée de gauche à
droite, en triangle). Au sein de la triade, les sujets sont généralement autorisés à faire des évaluations
répétées de chaque échantillon autant de fois qu’ils le désirent (si, bien sûr, la nature du produit permet des
évaluations répétées).
7.5 Demander aux sujets d’évaluer tout d’abord l’échantillon de référence, et ensuite d’évaluer les deux
échantillons codés dans l’ordre dans lequel ils leur ont été présentés. Informer les sujets que l’un des
échantillons codés est le même que l’échantillon de référence, et que l’autre est différent de l’échantillon de
référence. Demander aux sujets d’indiquer l’échantillon codé qui est le même que l’échantillon de référence,
ou bien l’échantillon codé qui diffère de l’échantillon de référence.
NOTE Quand on décide de demander aux sujets de sélectionner l’échantillon qui est le même que l’échantillon de
référence ou de sélectionner l’échantillon qui est différent de l’échantillon de référence, il y a lieu de se demander si le
jury utilise, ou non, systématiquement d’autres méthodes d’essais de discrimination. Un grand nombre de méthodes
d’essais de discrimination tels que l’essai triangulaire, par exemple, se concentrent sur l’identification de l’échantillon
"intrus" ou "différent". Le fait de demander aux sujets d’identifier l’échantillon "différent" dans une méthode et
d’identifier l’échantillon qui est "le même" dans une autre méthode peut être source de confusion et mener à de hauts
niveaux de réponses incorrectes.
7.6 Il convient que chaque formulaire de réponse ne concerne qu’une seule triade d’échantillons. Si un
sujet doit effectuer plusieurs essais au cours d’une session, collecter le formulaire de réponse complété et
les échantillons inutilisés avant de présenter la triade suivante. Le sujet ne doit pas revenir sur l’un des
échantillons des triades précédentes, ni modifier son verdict sur l’un des essais précédents.
7.7 Ne pas poser de questions sur la préférence, l’acceptabilité ou le degré de différence après que
le sujet a fait un choix. Le choix que le sujet vient juste de faire peut biaiser la réponse à toute question
supplémentaire. Les réponses à de telles questions peuvent être obtenues au moyen d’essais distincts portant
sur la préférence, l’acceptabilité, le degré de différence, etc. (voir l’ISO 6658). Une section "Commentaires"
demandant les raisons du choix peut être incorporée pour recueillir les remarques du sujet.
7.8 L’essai duo-trio est une procédure à choix forcé; les sujets ne sont pas autorisés à choisir l’option "pas
de différence". Il convient de demander à un sujet qui ne trouve pas de différence entre les échantillons
de choisir au hasard l’un des échantillons et d’indiquer dans la section "Commentaires" du formulaire de
réponse que ce choix n’est qu’une supposition.
...







