Molecular biomarker analysis — Methods of analysis for the detection and identification of animal species in food and feed products (nucleotide sequencing-based methods) — Part 1: General requirements

This document specifies general requirements for DNA sequencing method performance in the detection and identification of animal species in food and feed products. Performance requirements are limited to Sanger and next generation sequencing (NGS), including second and third generation sequencing, for analysis of single species products and multispecies products. This document is applicable to DNA sequences for mammals, birds, fish, molluscs, crustaceans, amphibians, reptiles and insects, and to the validation of the applicable methods. Methods for DNA species quantification are not considered under the scope of this document.

Analyse moléculaire de biomarqueurs — Méthodes d’analyse pour la détection et l’identification d’espèces animales dans les aliments et les aliments pour animaux (méthodes basées sur le séquençage des nucléotides) — Partie 1: Exigences générales

Le présent document spécifie les exigences générales relatives à la performance de la méthode de séquençage de l’ADN pour la détection et l’identification d’espèces animales dans les aliments et les produits alimentaires. Les exigences de performance se limitent au séquençage Sanger et au séquençage de nouvelle génération (NGS), y compris les séquençages de deuxième et troisième générations, pour l’analyse de produits mono-espèces et de produits multi-espèces. Le présent document est applicable aux séquences d’ADN de mammifères, oiseaux, poissons, mollusques, crustacés, amphibiens, reptiles et insectes, ainsi qu’à la validation des méthodes correspondantes. Les méthodes de quantification de l’espèce d’ADN ne font pas partie du domaine d’application du présent document.

General Information

Status
Published
Publication Date
24-Oct-2021
Current Stage
6060 - International Standard published
Start Date
25-Oct-2021
Due Date
18-Jul-2022
Completion Date
25-Oct-2021
Ref Project
Standard
ISO 22949-1:2021 - Molecular biomarker analysis — Methods of analysis for the detection and identification of animal species in food and feed products (nucleotide sequencing-based methods) — Part 1: General requirements Released:10/25/2021
English language
21 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 22949-1:2021 - Analyse moléculaire de biomarqueurs — Méthodes d’analyse pour la détection et l’identification d’espèces animales dans les aliments et les aliments pour animaux (méthodes basées sur le séquençage des nucléotides) — Partie 1: Exigences générales Released:10/25/2021
French language
21 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (Sample)


INTERNATIONAL ISO
STANDARD 22949-1
First edition
2021-10
Molecular biomarker analysis —
Methods of analysis for the detection
and identification of animal species
in food and feed products (nucleotide
sequencing-based methods) —
Part 1:
General requirements
Analyse moléculaire de biomarqueurs — Méthodes d’analyse pour la
détection et l’identification d’espèces animales dans les aliments et
les aliments pour animaux (méthodes basées sur le séquençage des
nucléotides) —
Partie 1: Exigences générales
Reference number
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on
the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below
or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii
Contents Page
Foreword .v
Introduction . vi
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Performance characteristics of the methods . 1
4.1 General . 1
4.2 Fitness for purpose of the method . 2
4.3 Scientific basis . 2
4.3.1 General . 2
4.3.2 Sanger sequencing . 2
4.3.3 Next generation sequencing . 2
4.4 Units of measurement . 3
4.5 Applicability . 3
4.5.1 Meat or food product considerations . 3
4.5.2 Sampling plan . 3
4.5.3 Genomic considerations . 3
4.5.4 Method testing . 3
4.6 Primer selection and evaluation . 4
4.7 Database construction and evaluation . 4
4.8 Selectivity and nucleotide sequence specificity . 5
4.8.1 General . 5
4.8.2 Requirements for inclusivity testing . 5
4.8.3 Evaluation of non-targeted DNA interference . 5
4.9 Sensitivity . 6
4.9.1 General . 6
4.9.2 Limit of detection . 6
4.10 Robustness . 6
4.10.1 General . 6
4.10.2 Robustness determination by inter-laboratory study . 6
4.10.3 Robustness determination by a multifactorial orthogonal test design . 7
5 Single-laboratory validation . 7
6 Interlaboratory study (collaborative study) . 7
7 General laboratory and procedural requirements . 7
7.1 General . 7
7.2 Facilities, materials and equipment . 8
7.3 Sample preparation . 8
7.3.1 General . 8
7.3.2 Category A: single species sample consisting of a single piece . 8
7.3.3 Category B: single species product composed by several pieces or units of
the same type of tissue . 9
7.3.4 Category C: multiple mixed species processed product including those of
non-meat origin or different types of tissues as ingredients . 9
7.4 DNA extraction . 9
7.5 DNA sequencing workflow. 10
7.5.1 General . 10
7.5.2 Sanger sequencing method . 10
7.5.3 Next generation sequencing method . 11
7.6 DNA sequence data analysis and interpretation . 14
7.7 Expression of results . . 14
8 Validation of the NGS bioinformatics pipeline .14
iii
8.1 General . 14
8.2 Quality metrics . 14
9 Test report .15
Annex A (informative) General workflow of the laboratory analytical procedure .16
Annex B (informative) Comparison between Sanger sequencing and next generation
sequencing .17
Annex C (informative) In silico workflow for primer set selection .18
Bibliography .20
iv
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www.iso.org/patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO’s adherence to
the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see
www.iso.org/iso/foreword.html.
This document was prepared by Technical Committee ISO/TC 34, Food products, Subcommittee SC 16,
Horizontal methods for molecular biomarker analysis.
A list of all parts in the ISO 22949 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www.iso.org/members.html.
v
Introduction
This document provides general guidance for deoxyribonucleic acid (DNA) sequencing for animal
species detection or identification, or both, in food and feed products. DNA sequencing is the process of
determining the order of the four nucleotide bases (adenine, guanine, cytosine and thymine) in a nucleic
acid polymer. Nucleic acid polymers can range in length from a few nucleotides to hundreds of millions
of bases.
Rapid DNA sequencing methods have been successfully validated and verified for detection and
[1]
identification of animal species in food products . Within the food industry, rapid, economical and
high throughput access to whole genome sequences in foods has improved the control of both food
[2]
quality and safety . Two types of DNA sequencing methods are most widely used for food products:
[3][4][5][6][7][8]
chain termination and high throughput sequencing .
Chain termination developed in 1977 by Frederick Sanger still bears his name. Sanger sequencing
reactions can be prepared manually and electropherograms can be read directly by the user. Automated
base calling capillary electrophoresis systems have mostly replaced manually read gels and rapid
Sanger applications are being developed.
High throughput or next generation sequencing (NGS), including next generation short-read and third
generation long-read methods, has reduced the cost of DNA sequencing, improved sequence readability
and automated most of the steps from preparatory to bioinformatics. High throughput automated DNA
sequencing applies base/wavelength specific fluorescence or ionic detection to determine the real-time
enzymatic addition of nucleotides to a DNA template.
Sanger sequencing (dideoxy chain termination) generates high quality data for determining a single
DNA sequence of an individual target. NGS, by contrast, can be used to assess millions of individual DNA
fragments of mixed markers and targets at the same time.
Sanger sequencing and NGS can both be used to verify animal species composition in a food sample or
[9]
compare DNA sequence results to previously defined databases to identify its animal origin, or both .
vi
INTERNATIONAL STANDARD ISO 22949-1:2021(E)
Molecular biomarker analysis — Methods of analysis
for the detection and identification of animal species in
food and feed products (nucleotide sequencing-based
methods) —
Part 1:
General requirements
1 Scope
This document specifies general requirements for DNA sequencing method performance in the
detection and identification of animal species in food and feed products. Performance requirements
are limited to Sanger and next generation sequencing (NGS), including second and third generation
sequencing, for analysis of single species products and multispecies products.
This document is applicable to DNA sequences for mammals, birds, fish, molluscs, crustaceans,
amphibians, reptiles and insects, and to the validation of the applicable methods.
Methods for DNA species quantification are not considered under the scope of this document.
2 Normative references
The following documents are referred to in the text in such a way that some or all of their content
constitutes requirements of this document. For dated references, only the edition cited applies. For
undated references, the latest edition of the referenced document (including any amendments) applies.
ISO 16577, Molecular biomarker analysis — Terms and definitions
ISO 20813, Molecular biomarker analysis — Methods of analysis for the detection and identification
of animal species in foods and food products (nucleic acid-based methods) — General requirements and
definitions
ISO 21571, Foodstuffs — Methods of analysis for the detection of genetically modified organisms and
derived products — Nucleic acid extraction
3 Terms and definitions
For the purposes of this document, the terms and definitions given in ISO 16577 apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
4 Performance characteristics of the methods
4.1 General
The identity of an organism at the species level is established by DNA sequencing through the
comparison of DNA sequences obtained from samples with known reference sequences. Results can
also be obtained at multiple taxonomic levels (e.g. order, species, genus, family), depending on the type
of database and DNA data analysis performed.
Methods used for animal species identification by DNA sequencing shall meet the performance guidance
provided in this document. The method validation process described in this document, interlaboratory
collaborative or single-laboratory studies or both shall be used to determine and elucidate sequencing
method performance characteristics.
Single species products that have been produced from one piece of meat (e.g. fish fillet, beef tenderloin)
are most appropriately analysed by Sanger sequencing, while NGS is the appropriate method for
simultaneous multispecies identification.
4.2 Fitness for purpose of the method
The method shall be fit for purpose for the identification of organisms and their taxonomic relationship
with other organisms. Identification at the sub-specific levels (e.g. breeds) can be included provided
that the databases and bioinformatic analyses are available. Information regarding the applicability
and limitations of the method shall be documented sufficiently to fulfil the criteria described in this
document. The appropriate commercial DNA sequencing platform(s) suitable for use in all method
procedures should be determined and identified. The target DNA can be located on the nuclear genome,
but also on the mitochondrial genomes. A DNA barcoding or metabarcoding approach can be used
[10][11]
based on one or more allelic regions to be sequenced .
4.3 Scientific basis
4.3.1 General
A general workflow of the laboratory analytical procedure is provided in Annex A.
4.3.2 Sanger sequencing
Sanger sequencing is based on a chain termination method for determining the nucleotide sequence of
DNA. Elongation of the replicated strand of DNA by DNA polymerase is interrupted by the incorporation
of non-elongatable nucleotides that terminate replication successively at each position of the sequenced
fragment. Labelling the four non-elongatable nucleotides (dideoxy-A, G, C and T) permits determination
of the molecular size of the replicated fragment by electrophoresis.
NOTE 1 Sanger sequencing can only be used when a sample contains tissue from a unique single species (e.g.
one fish fillet, one steak, one shrimp), because multiple DNA target sequences in the same sample from more than
one species can produce more than one end labelled chain terminated product of the same chain length. Multiple
chain terminated fragments of the same chain length can present two or more terminated bases at each position
and appear electrophoretically as convoluted or overlapping sequences. The electropherogram for the reaction is
unlikely to be readable and the identification will be compromised.
Automated Sanger sequencing platforms have been available for many years and have appropriately
[12][13][14]
been used for DNA barcoding to identify a single species, e.g. for fish species identification .
[15]
NOTE 2 For an example, see CEN/TS 17303:2019 .
4.3.3 Next generation sequencing
NGS in combination with DNA metabarcoding enables the robust and reliable identification of species
in complex food products (containing multiple species). NGS is a commercial term used to reference
[16]
high throughput DNA sequencing methods (see Annex B) . It is alternatively referred to as "massively
parallel sequencing". Results usually take the form of a text file with millions of individual sequence
reads. Commercially available platforms support second and third generation NGS sequencing methods.
Second generation sequencing is based on the analysis of short DNA fragments generated by a
polymerase chain reaction (PCR) or a fragmentation process to produce fragments of up to 600 bp in
size. Third generation sequencing is capable of analysing much longer DNA fragments (e.g. bacterial
genomes) and consequently is sometimes referred to as "long-read DNA sequencing".
4.4 Units of measurement
Sequence reads generated by Sanger sequencing or NGS methods are compared bioinformatically
to previously determined and identified reference sequences in DNA databases. Percent similarity
between the sample and reference sequences is calculated. Two sequences are homologous if they share
more similarity than would be expected by chance (p ≤ 0,01).
NOTE A percent similarity greater than 98 % is usually sufficient to identify sequences as the same species.
Identification data shall be provided as a qualitative result, in the form of list of appropriate taxa, their
respective percent similarity and, as appropriate, the expected value.
4.5 Applicability
4.5.1 Meat or food product considerations
The method should contain a definition of the food or food product(s) that will be sequenced and, where
appropriate, the raw materials from which it is derived and any necessary references to manufacturing
processes. In addition, whether the sample(s) will be composed of a single species or mixed species or
both.
4.5.2 Sampling plan
Representative samples taken through an applicable sampling plan should be provided to the
sequencing laboratory. Appropriate methods for subsampling laboratory samples should continue to
ensure the representativeness of the sequencing result. If applicable, statistical criteria for acceptance
or rejection of the analytical result should include the sampling plan and subsampling. Requirements
and limitations for the laboratory sample size and number of individual items forming the sample, and
the handling of the sample and its storage, should be evaluated and described based upon:
— the degree of processing of the sample constituents;
— the different species and animal tissue types involved;
— the nature of the sample matrices;
— the preparation of the sample matrix for analysis.
4.5.3 Genomic considerations
When assessing whether a method is fit for purpose, the following aspects regarding the nature of the
genomic region to be sequenced should be considered:
— the cellular and genomic disposition of the sequence, i.e. cellular: nuclear or mitochondrial, or
genomic: allelic or gene specific;
— the length of the sequence that will be determined;
— the types and design of primer sequences used for sample and library preparation and sequencing.
4.5.4 Method testing
Applicability shall be tested by extracting DNA from matrix-matched test samples representative of the
analytical scope of the method.
Highly processed food products can have fragmented DNA or low DNA concentration or both, making
them difficult to sequence. To compensate, some strategies can be employed, e.g. process more samples,
concentrate DNA extracts, work with smaller targeted genomic regions.
4.6 Primer selection and evaluation
Primer selection and evaluation is the first and most important step in the nucleotide sequencing
analytical workflow when a PCR-based DNA sequencing technology is used. The design of new primers
is a bioinformatics task performed using applicable software. There are many commercial and freely
available primer selection tools, e.g. Primer-BLAST and Primer 3. The following primer design factors
affect primer performance: secondary structures, partial sequence matches, hairpins, GC content, etc.
NOTE 1 Primer design and selection is not considered as part of the workflow to select genomic regions to be
sequenced in third generation NGS technology and the DNA fragmentation strategy, e.g. second generation based
NGS, shotgun sequencing.
Universal (consensus) primers can be defined for any taxonomic level (species, genus, family, order,
class, domain, etc). The design of these primers is based on DNA sequence alignments and identification
of consensus regions that are almost identical amongst the taxa to be identified. Degenerate primers
can be designed to increase the universality of the primers. Determining the number of degenerations
included in a single primer to avoid non-specific binding requires evaluation of unspecific annealing.
Primers should be evaluated in silico irrespective of their use in the laboratory workflow. They shall be
assessed using appropriate bioinformatics tools for their match with the species (taxon) to be detected/
identified.
NOTE 2 An example of an in silico workflow for primer set selection is shown in Annex C.
The final evaluation of the performance of each set of primers should be done by applying the laboratory
workflow using reference DNA or tissue material (whenever it is available) representative of the
identifiable group of species (taxa).
4.7 Database construction and evaluation
The DNA database used for species detection or identification or both will determine the number of
different species identifiable by the laboratory workflow. Database construction and evaluation is a
bioinformatics task and many different tools can be used, including in-house developed software.
Publicly available databases can also be used, e.g. GenBank. The databases should have the following
information available:
— the species list;
— the number of different entries for each species;
— the DNA region(s), gene(s) and length of DNA sequences;
— a measure of the validation quality of the sequence entry(ies).
The final performance evaluation of a bioinformatics search of a database shall be done by applying the
laboratory workflow using reference material (whenever possible) that is representative of the species
included in the database (vouchered). The use of higher taxonomic levels is appropriate when the
identification at the species is inconclusive, i.e. when the sample is not differentiable by a more targeted
search. In GenBank, the designation "Bos sp." can be used as the search term for all of the species of the
genus Bos.
4.8 Selectivity and nucleotide sequence specificity
4.8.1 General
Excessive amplification of non-targeted species DNA can interfere with the detection of targeted
species DNA, e.g. increased limit of detection (LOD) or critical value or both. Targeted (PCR-based) NGS
and Sanger sequencing methods should provide experimental evidence for nucleotide specificity with
non-targeted species (see ISO 20813). The degree of interference (selectivity) from non-targeted DNA
should be determined. The nucleotide sequence specificity should be assessed in a two-step procedure:
theoretical and experimental evaluation of the inclusivity and exclusivity. Experimental evaluation is
done by PCR with the selected primers. For NGS, the performance of each set of primers should also be
evaluated with adapters or barcodes or both. The minimum concentration of DNA required for specific
sequence identity analysis can be determined as the probability of detection (POD) (see ISO/TS 16393)
[17]
. Because sequence data are used for the verification of animal speciation results, these data should
be based on evaluated databases with due consideration of the timing of submission of individual
entries and any subsequent changes in taxonomic classification or naming (i.e. provenance). In cases of
unexpected results, further investigation should be carried out to confirm reference material identity.
DNA amplification is not required when using a non-PCR based sequencing analysis, e.g. shotgun
sequencing.
4.8.2 Requirements for inclusivity testing
Experimental results from testing a method with a target animal taxon should be provided. This
testing should include relevant species for the scope of the method and the taxonomic level covered
by the primers to be used. An appropriate number of different species should be used (see ISO 20813).
For primers with less than 100 % sequence homology with target DNA species (based on in silico
evaluation), the amplifiability of those species should be tested in the laboratory to define the limits of
acceptable mismatches. The user shall define a theoretical list of species that can be identified and the
list of species that were tested in the laboratory. It is known that depending on the DNA region that is
targeted by the primers there can be very different conservation levels. Different genes have different
rates of intraspecific DNA sequence variability. Appropriate numbers of individuals from each species
should be tested accordingly.
Material for experimental inclusivity testing should contain sufficient DNA concentration for PCR and
DNA sequencing, as described in ISO 20813. Replicates of each sample material shall be tested with
controls appropriate to the different workflow steps, e.g. PCR. If present, sequence variants of the
target animal species should be identified with comparable amplification efficiency.
4.8.3 Evaluation of non-targeted DNA interference
Experimental results from testing the sequencing method with non-target animal species shall be
provided. This testing should include both taxonomically close and not-closely-related animal species.
Animal species or taxonomic groups relevant to the scope of the method should be tested, e.g. species
commonly used in food in general and particularly in matrices considered in the scope of the method.
The method should clearly distinguish between target and non-target animal species. In silico analysis
should be performed with the appropriate non-target taxa to theoretically evaluate the sequence
homology of the universal primers. Sequence mismatches are good indicators of specificity. They
indicate the degree to which a set of primers and probe will bind to unintended sequences to produce
a false-positive result. A minimum number of mismatches should be defined as acceptable for in silico
analysis. Exclusivity is determined more effectively when a higher number of mismatches is permitted
in the analysis. Select an appropriate number of species that can cause interference with the target
animal species present in the food test material (as described in ISO 20813). Examples of suitable
organisms are listed in ISO 20813:2019, Annex A. Other species should be included if relevant, e.g. if
there are sequence homologies of oligonucleotides to nucleic acid sequences. The suitability of the DNA
used for amplification should be confirmed by using appropriate controls. Sufficient DNA should be
used for experimental PCR exclusivity testing.
4.9 Sensitivity
4.9.1 General
Experimental results from testing the method at different DNA concentrations to evaluate the range of
use of the method shall be documented and described in the validation report. Animal species should
be detected at levels relevant for the interested party, e.g. the consumer.
4.9.2 Limit of detection
4.9.2.1 General
[17]
The LOD (see ISO 21569 and ISO 20813) and the POD (see ISO/TS 16393 ) can vary significantly
between matrices. Animal constituents at different processing steps in the same product can exhibit
different levels of DNA degradation and possible DNA quality differences among ingredients and can
contribute to sequence uncertainty. As an example, a product can be composed of different types of
animal tissue containing different amounts of DNA. This imbalance can be further exacerbated if some
ingredients have undergone pre-processing. Cooking or acid treatment of some ingredients will lower
DNA quality compared to other ingredients that can be added in raw form or from a different process.
Depending on the target gene used for identification, the number of copies of that gene can be very
different. The determination of the LOD can be performed as described in ISO 20813:2019, 4.7.2.
4.9.2.2 Limit of detection for Sanger sequencing
The LOD determination should be performed as described for a PCR-based method in accordance with
ISO 20813. The data resulting from Sanger sequencing is a DNA sequence obtained from a previously
amplified PCR product. The LOD for this method is equivalent to the LOD obtained for the PCR reaction
by using the universal primers defined for the specific taxon. It should be noted that LOD determination
for Sanger sequencing is of particular importance when dealing with products containing processed
ingredients, due to the potential for much lower DNA quality and quantity from those components.
4.9.2.3 Limit of detection for NGS
For PCR-based NGS, LOD is based on the LOD of the PCR system used (see ISO 20813). It is calculated as
described for Sanger sequencing.
When no PCR is performed, e.g. shotgun sequencing, the LOD is based on the integrity (sequenceability)
of the input DNA and the NGS system used.
In all NGS methods, an additional LOD should be defined based on the lowest number of reads required
to find a species match from the database used.
4.10 Robustness
4.10.1 General
The capacity of a sequencing method to remain unaffected by small variations in method parameters
(e.g. variation in concentration of kit components, variation in apparatus) shall be verified. The
evaluation of robustness can be empirically performed.
4.10.2 Robustness determination by inter-laboratory study
[18]
Robustness can be determined by performing an interlaboratory study . A robust method is one
where the results from different laboratories do not vary significantly. Robust methods should be
selected for use wherever possible.
4.10.3 Robustness determination by a multifactorial orthogonal test design
The test method should be carried out using an orthogonal multifactorial approach where several
alterations are assessed (see ISO 20813) including, but not limited to, variations in mastermix
component concentration, reaction volume, primer concentrations, annealing temperature and
thermocycler platform.
5 Single-laboratory validation
An analysis method should have been sufficiently tested within a laboratory to disclose the required
[19] [20] [21]
specification prior to an interlaboratory study . See ISO 13495 and CEN/TS 17329-1 for
guidance. Reference materials or certified reference materials (CRMs) should be used when available
for the validation of DNA sequencing methods for nucleic acids.
6 Interlaboratory study (collaborative study)
Information about the collaborative study (organizer, protocol, number of participating laboratories,
etc.) and the performance data obtained by the study shall be reported with appropriate references
[19]
to the relevant documents . Collaborative studies for the validation of PCR methods for detection,
identification and quantification of specific DNA sequences can be performed in accordance with other
[22] [23]
relevant documents, e.g. Codex Alimentarius CAC/GL 74-2010 and CEN/TS 17329-2 .
NOTE 1 A small-scale collaborative study (pre-validation study involving, for example, two to four
laboratories) can be performed to test the general transferability of the method before the expense of organizing
a large-scale study is incurred.
For precise validation, data shall be collected from multiple laboratories having facilities and
competence in molecular biology. ISO 13495:2013 requires eight and four participating laboratories for
international and national levels of validation, respectively. CEN/TS 17329-2 specifies a minimum of
[24]
12 laboratories. In accordance with AOAC International , the required number is eight laboratories.
[25]
Statistical analysis for accuracy should be calculated based on ISO 5725-1:1994 .
NOTE 2 Traditional nonparametric 5 % false positive and 5 % false negative rates reflect PODs of 5 % and
95 %.
7 General laboratory and procedural requirements
7.1 General
The procedure shall be documented to include the following steps:
— ensuring a representative sample;
— preparation of the test samples and subsamples;
NOTE If the test sample is not the whole laboratory sample, the laboratory sample is homogenized
and test samples are obtained in accordance with relevant International Standards, including grinding,
homogenization and preparation of test portions
— extraction of DNA (if necessary, determination of DNA concentration and purity by appropriate
[26]
methods) ;
— DNA sequencing;
— interpretation and reporting of results.
The manufacturers’ safety recommendations shall be followed.
7.2 Facilities, materials and equipment
The work area in the laboratory should be designed to prevent accidental DNA contamination
originating from dust, human material and spreading aerosols. Consideration shall be given to:
— the systematic containment of the method steps involved in the production of the results;
— a forward flow principle for sample handling.
Separation (temporal and/or physical) of work is required to prevent contamination. Designated
contained or dedicated work areas or both with their own apparatus are recommended, as follows:
a) a work area for grinding and homogenization;
b) a work area for extraction of the nucleic acid from the test material;
c) a work area dedicated to the setup of PCR amplification reactions;
d) a work area dedicated to DNA sequencing.
If contamination from human DNA is detected by the method, additional prevention measures (e.g.
the use of masks, gloves and disposable coats) should be taken to prevent false-positive results during
analysis.
Physical separation or using different rooms or both is the most effective and preferable way of
preventing carryover contamination, but other methods can be used provided the effectiveness is
comparable. Air flow for the laboratory should be directed to prevent intrusion of dust and amplicons
from work areas with higher contamination risk to work areas with lower contamination risk, i.e.
forward flow.
Unless otherwise stated, only analytical grade reagents suitable for molecular biology, free from
DNA and DNases should be used. Reagents and solutions should be stored at room temperature,
unless otherwise specified. PCR reagents should be stored in small aliquots to minimize the risk of
contamination. Water for analysis shall be double-distilled, deionized (≥ 18 MΩ) or of comparable
quality. Solutions should be prepared by dissolving the appropriate reagents in water and autoclaving,
unless specified differently. Sterile filtration devices (possibly 0,22 μm pore size) can be used when
autoclaving is not possible.
To avoid contamination, sterile techniques should be adopted in the PCR set-up area, e.g. powder-free
gloves, sterilized plasticware, autoclaved reagents, disposable plasticware and aerosol-protected,
DNA/RNA free and DNase/RNase free filtered pipette tips should be used.
Materials and all containers and disposables containing reagents shall be protected from any
contaminating agent, e.g. dust.
The manufacturers’ recommendations for the use of reagents should be followed. Appropriate controls
can be used to assess the integrity of reagents and the absence of DNase.
No unintended enzyme activities (e.g. exonuclease) that can interfere with PCR and DNA sequencing
shall be present in the preparations.
7.3 Sample preparation
7.3.1 General
The requirements for sample preparation depend on the type of sample that is analysed. Samples can
be divided into three different categories (A, B and C) as shown in 7.3.2 to 7.3.4.
7.3.2 Category A: single species sample consisting of a single piece
EXAMPLE One sample = one fish fillet or one beef steak.
A portion of the laboratory sample (single piece) can be taken for analysis by Sanger sequencing or NGS.
To minimize the risk of detecting adhering contaminants, test sample material shall not be taken from
the surface of the laboratory sample.
7.3.3 Category B: single species product composed by several pieces or units of the same type
of tissue
7.3.3.1 General
EXAMPLE One sample = package with 10 fish fillets or 20 meat pieces.
Depending on the sample preparation, either NGS or Sanger sequencing can be used as described in
7.3.3.2 and 7.3.3.3.
A portion of the laboratory sample (piece or unit) can be taken for analysis or all pieces or units can be
collected and mixed to produce a composite sample. The composite sample should be homogenized as
described to guarantee the representativeness of each portion collected.
7.3.3.2 Preparation of a representative test sample for NGS
There are two options:
— Take at least one equivalent sized portion of each fish fillet/meat piece (same type of tissue and
portion size). All portions collected are mixed to produce a composite sample of the food product
received. The composite sample should be homogenized to uniformity to ensure representativeness
of each portion collected.
— Homogenize the entire laboratory sample to uniformity.
7.3.3.3 Preparation of a test sample for Sanger sequencing
Proceed as described in 7.3.2 for each individual piece composing the laboratory sample.
7.3.4 Category C: multiple mixed species processed product including those of non-meat origin
or different types of tissues as ingredients
EXAMPLE Lasagne, pizza, seafood cocktail, minced meat or as unwanted contamination (
...


NORME ISO
INTERNATIONALE 22949-1
Première édition
2021-10
Analyse moléculaire de
biomarqueurs — Méthodes d’analyse
pour la détection et l’identification
d’espèces animales dans les aliments
et les aliments pour animaux
(méthodes basées sur le séquençage
des nucléotides) —
Partie 1:
Exigences générales
Molecular biomarker analysis — Methods of analysis for the detection
and identification of animal species in food and feed products
(nucleotide sequencing-based methods) —
Part 1: General requirements
Numéro de référence
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii
Sommaire Page
Avant-propos .v
Introduction . vi
1 Domaine d’application . 1
2 Références normatives .1
3 Termes et définitions . 1
4 Caractéristiques de performance des méthodes . 2
4.1 Généralités . 2
4.2 Adéquation à un but de la méthode . 2
4.3 Base scientifique . 2
4.3.1 Généralités . 2
4.3.2 Séquençage Sanger . 2
4.3.3 Séquençage de nouvelle génération. 3
4.4 Unités de mesure . 3
4.5 Applicabilité . 3
4.5.1 Considérations relatives au produit carné ou au produit alimentaire . 3
4.5.2 Plan d’échantillonnage . 3
4.5.3 Considérations génomiques . 4
4.5.4 Évaluation de la méthode . 4
4.6 Sélection et évaluation des amorces . 4
4.7 Construction et évaluation de la base de données . 4
4.8 Sélectivité et spécificité de la séquence nucléotidique . 5
4.8.1 Généralités . 5
4.8.2 Exigences relatives aux essais d’inclusivité . 5
4.8.3 Évaluation des interférences de l’ADN non-cible . 6
4.9 Sensibilité . 6
4.9.1 Généralités . 6
4.9.2 Limite de détection . 6
4.10 Robustesse . 7
4.10.1 Généralités . 7
4.10.2 Détermination de la robustesse par une étude interlaboratoires. 7
4.10.3 Détermination de la robustesse par un essai orthogonal multifactoriel . 7
5 Validation intralaboratoire .7
6 Étude comparative interlaboratoires . 7
7 Exigences générales du laboratoire et du mode opératoire . 8
7.1 Généralités . 8
7.2 Installations, matériaux et équipement . 8
7.3 Préparation de l’échantillon . 9
7.3.1 Généralités . 9
7.3.2 Catégorie A: échantillon mono-espèce constitué d’un seul morceau . 9
7.3.3 Catégorie B: produit mono-espèce constitué de plusieurs morceaux ou
unités du même type de tissu . 9
7.3.4 Catégorie C: produit traité contenant plusieurs espèces mélangées,
notamment produit d’origine non carnée, ou différents types de tissus
comme ingrédients . . 10
7.4 Extraction de l’ADN . 10
7.5 Processus de séquençage de l’ADN . 10
7.5.1 Généralités . 10
7.5.2 Méthode de séquençage Sanger . 11
7.5.3 Méthode de séquence de nouvelle génération .12
7.6 Analyse et interprétation des données de séquences d’ADN . 15
7.7 Expression des résultats . 15
iii
8 Validation du pipeline bio-informatique du NGS .15
8.1 Généralités . 15
8.2 Mesures de qualité . 15
9 Rapport d’essai .16
Annexe A (informative) Logigramme général du mode opératoire analytique du laboratoire .17
Annexe B (informative) Comparaison entre le séquençage Sanger et le séquençagede
nouvelle génération .18
Annexe C (informative) Processus in silico pour la sélection d’une combinaison d’amorces .19
Bibliographie .20
iv
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir
www.iso.org/directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www.iso.org/brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir www.iso.org/avant-propos.
Le présent document a été élaboré par le comité technique ISO/TC 34, Produits alimentaires, sous-
comité SC 16, Méthodes horizontales pour l’analyse moléculaire de biomarqueurs.
Une liste de toutes les parties de la série ISO 22949 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www.iso.org/fr/members.html.
v
Introduction
Le présent document fournit des recommandations générales relatives au séquençage de l’acide
désoxyribonucléique (ADN) pour la détection ou l’identification d’espèces animales dans les aliments
et les aliments pour animaux. Le séquençage de l’ADN est le processus consistant à déterminer l’ordre
des quatre bases nucléotidiques (adénine, guanine, cytosine et thymine) dans un polymère d’acides
nucléiques. Les polymères d’acides nucléiques peuvent avoir une longueur variable, allant de quelques
nucléotides à plusieurs centaines de millions de bases.
Les techniques de séquençage rapide de l’ADN ont été validées et vérifiées avec succès pour détecter
[1]
et identifier les espèces animales dans les produits alimentaires. Dans l’industrie agroalimentaire,
l’accès rapide, économique et à haut débit aux séquences du génome entier dans les aliments a permis
[2]
d’améliorer le contrôle de la qualité et de la sécurité des aliments. Deux types de techniques de
séquençage de l’ADN sont couramment utilisées pour les produits alimentaires: le séquençage par
[3][4][5][6][7][8]
terminaison de chaîne et le séquençage à haut débit .
La terminaison de chaîne, mise au point par Frederick Sanger en 1977, porte encore son nom.
Les réactions de séquençage Sanger peuvent être préparées manuellement et les électrophérogrammes
peuvent être directement lus par l’utilisateur. Les systèmes d’électrophorèse capillaire avec détection
automatique de bases ont surtout remplacé les gels à lecture manuelle et des applications Sanger
rapides sont en cours de développement.
Le séquençage à haut débit ou de nouvelle génération (NGS), y compris les méthodes de nouvelle
génération à lecture courte et de troisième génération à lecture longue, ont permis de réduire le coût
de séquençage de l’ADN, d’améliorer la lisibilité des séquences et d’automatiser la plupart des étapes,
de la préparation à la bio-informatique. Le séquençage automatique à haut débit de l’ADN applique la
fluorescence spécifique à la base/longueur d’onde ou la détection ionique pour déterminer l’addition
enzymatique en temps réel de nucléotides à une matrice d’ADN.
Le séquençage Sanger (terminaison de chaîne didésoxy) génère des données de haute qualité pour
déterminer une seule séquence d’ADN d’une cible individuelle. En revanche, le NGS peut être utilisé pour
évaluer simultanément des millions de fragments d’ADN individuels de marqueurs et cibles mélangés.
Le séquençage Sanger et le NGS peuvent tous deux être utilisés pour vérifier la composition de l’espèce
animale dans un échantillon d’aliment et/ou pour comparer les résultats de séquençage de l’ADN avec
[9]
les bases de données précédemment définies afin d’identifier son origine animale .
vi
NORME INTERNATIONALE ISO 22949-1:2021(F)
Analyse moléculaire de biomarqueurs — Méthodes
d’analyse pour la détection et l’identification d’espèces
animales dans les aliments et les aliments pour animaux
(méthodes basées sur le séquençage des nucléotides) —
Partie 1:
Exigences générales
1 Domaine d’application
Le présent document spécifie les exigences générales relatives à la performance de la méthode
de séquençage de l’ADN pour la détection et l’identification d’espèces animales dans les aliments
et les aliments pour animaux. Les exigences de performance se limitent au séquençage Sanger et
au séquençage de nouvelle génération (NGS), y compris les séquençages de deuxième et troisième
générations, pour l’analyse de produits mono-espèces et de produits multi-espèces.
Le présent document est applicable aux séquences d’ADN de mammifères, oiseaux, poissons, mollusques,
crustacés, amphibiens, reptiles et insectes, ainsi qu’à la validation des méthodes correspondantes.
Les méthodes de quantification de l’espèce d’ADN ne font pas partie du domaine d’application du présent
document.
2 Références normatives
Les documents suivants sont cités dans le texte de sorte qu’ils constituent, pour tout ou partie de leur
contenu, des exigences du présent document. Pour les références datées, seule l’édition citée s’applique.
Pour les références non datées, la dernière édition du document de référence s’applique (y compris les
éventuels amendements).
ISO 16577, Analyse moléculaire de biomarqueurs — Termes et définitions
ISO 20813, Analyse moléculaire de biomarqueurs — Méthodes d’analyse pour la détection et l’identification
des espèces animales dans les aliments et les produits alimentaires (méthodes basées sur l’utilisation des
acides nucléiques) — Exigences générales et définitions
ISO 21571, Produits alimentaires — Méthodes d’analyse pour la détection des organismes génétiquement
modifiés et des produits dérivés — Extraction des acides nucléiques
3 Termes et définitions
Pour les besoins du présent document, les termes et les définitions de l’ISO 16577 s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes:
— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
4 Caractéristiques de performance des méthodes
4.1 Généralités
L’identité d’un organisme au niveau de l’espèce est établie par séquençage de l’ADN en comparant
les séquences d’ADN obtenues à partir d’échantillons ayant des séquences de référence connues.
Des résultats peuvent également être obtenus à plusieurs niveaux taxonomiques (par exemple l’ordre,
l’espèce, le genre, la famille), en fonction du type de base de données et de l’analyse de données ADN
effectuée.
Les méthodes utilisées pour identifier l’espèce animale par séquençage de l’ADN doivent être conformes
aux recommandations de performance fournies dans le présent document. Le processus de validation
de la méthode décrit dans le présent document, les études interlaboratoires et/ou intralaboratoires
doivent être utilisés pour déterminer et expliciter les caractéristiques de performance de la méthode
de séquençage.
Les produits mono-espèce qui ont été obtenus à partir d’un seul morceau de viande (par exemple le filet
de poisson, le filet de bœuf) sont analysés de façon optimale par séquençage Sanger, tandis que le NGS
est la méthode appropriée pour l’identification multi-espèces simultanée.
4.2 Adéquation à un but de la méthode
La méthode doit être adéquate pour l’identification d’organismes et de leur lien taxonomique avec
d’autres organismes. L’identification à des niveaux subspécifiques (par exemple la race) est possible
à condition que les bases de données et les analyses bio-informatiques soient disponibles. Les
informations concernant l’applicabilité et les limites de la méthode doivent être suffisamment étayées
pour répondre aux critères décrits dans le présent document. Il convient de déterminer et d’identifier
la/les plateforme(s) commerciale(s) de séquençage d’ADN convenant à tous les modes opératoires de
la méthode. L’ADN cible peut être localisé sur le génome nucléaire, mais également sur les génomes
mitochondriaux. Une technique de codage ou de métacodage à barres de l’ADN peut être utilisée en
[10][11]
fonction de la ou des région(s) allélique(s) à séquencer .
4.3 Base scientifique
4.3.1 Généralités
Un logigramme général du mode opératoire analytique de laboratoire est fourni à l’Annexe A.
4.3.2 Séquençage Sanger
Le séquençage Sanger repose sur une méthode par terminaison de chaîne pour déterminer la séquence
nucléotidique de l’ADN. L’allongement du brin répliqué d’ADN par l’ADN polymérase est interrompu par
l’incorporation de nucléotides non étirables qui mettent fin à la réplication successivement à chaque
position du fragment séquencé. Le marquage des quatre nucléotides non étirables (didésoxy-A, G, C et
T) permet de déterminer la taille moléculaire du fragment répliqué par électrophorèse.
NOTE 1 Le séquençage Sanger ne peut être utilisé que lorsqu’un échantillon contient du tissu d’une seule
espèce (par exemple un filet de poisson, un steak, une crevette), car plusieurs séquences cibles d’ADN dans un
même échantillon provenant de plusieurs espèces peuvent produire plusieurs produits de terminaison de chaîne
marqués à une extrémité de même longueur de chaîne. Plusieurs fragments de terminaison de chaîne de même
longueur de chaîne peuvent présenter deux bases terminées ou plus à chaque position et apparaissent par
électrophorèse sous forme de séquences convoluées ou chevauchantes. L’électrophérogramme de la réaction sera
probablement illisible et l’identification sera compromise.
Les plateformes de séquençage automatique Sanger sont disponibles depuis de nombreuses années
et sont utilisées pour le codage à barres de l’ADN afin d’identifier une seule espèce, par exemple pour
[12][13][14]
identifier une espèce de poisson .
[15]
NOTE 2 Par exemple, voir la CEN/TS 17303:2019 .
4.3.3 Séquençage de nouvelle génération
Le NGS, associé au métacodage à barres de l’ADN, permet une identification robuste et fiable des
espèces présentes dans les produits alimentaires complexes (contenant plusieurs espèces). Le NGS est
un terme commercial utilisé pour faire référence à des méthodes de séquençage de l’ADN à haut débit
[16]
(voir Annexe B). Il est aussi appelé «séquençage massivement parallèle». Les résultats prennent
généralement la forme d’un fichier texte contenant des millions de lectures de séquences individuelles.
Les plateformes disponibles dans le commerce prennent en charge les méthodes de séquençage NGS de
deuxième et troisième générations.
Le séquençage de deuxième génération repose sur l’analyse de fragments d’ADN courts générés par
réaction de polymérisation en chaîne (PCR) ou par un processus de fragmentation pour produire des
fragments pouvant atteindre une taille de 600 pb. Le séquençage de troisième génération est capable
d’analyser des fragments d’ADN bien plus longs, par exemple des génomes bactériens. Il est donc parfois
appelé «séquençage d’ADN à lecture longue».
4.4 Unités de mesure
Les lectures de séquences générées par séquençage Sanger ou par NGS sont comparées de manière
bio-informatique avec des séquences de référence préalablement déterminées et identifiées dans des
bases de données d’ADN. Le pourcentage de similarité entre la séquence de l’échantillon et la séquence
de référence est calculé. Deux séquences sont homologues si elles partagent une similarité supérieure
à celle qui pourrait être attribuée au simple hasard (p ≤ 0,01).
NOTE Un pourcentage de similarité supérieur à 98 % est généralement suffisant pour identifier des
séquences comme appartenant à la même espèce.
Les données d’identification doivent être fournies en tant que résultat qualitatif, sous la forme d’une
liste de taxons appropriés, avec les pourcentages de similarité correspondants et, suivant le cas, la
valeur attendue.
4.5 Applicabilité
4.5.1 Considérations relatives au produit carné ou au produit alimentaire
Il convient que la méthode contienne une définition de l’aliment ou du/des produit(s) alimentaire(s) qui
seront séquencés et, le cas échéant, des matières premières dont ils sont originaires, ainsi que toute
référence nécessaire aux processus de fabrication. Il sera également indiqué si l’échantillon ou les
échantillon(s) sera/seront composé(s) d’une seule espèce et/ou d’espèces mélangées.
4.5.2 Plan d’échantillonnage
Il convient que des échantillons représentatifs prélevés lors d’un plan d’échantillonnage approprié soient
fournis au laboratoire de séquençage. Il convient que des méthodes appropriées de sous-échantillonnage
d’échantillons pour laboratoire assurent la représentativité du résultat de séquençage. Le cas échéant,
il convient que les critères statistiques d’acceptation ou de rejet du résultat analytique incluent le plan
d’échantillonnage et le sous-échantillonnage. Il convient que les exigences et les limitations relatives à
la taille de l’échantillon pour laboratoire et au nombre d’éléments individuels composant l’échantillon,
ainsi qu’à la manipulation et au stockage de l’échantillon, soient évaluées et décrites en fonction:
— du degré de traitement des constituants de l’échantillon;
— des différentes espèces et des différents types de tissus animaux impliqués;
— de la nature des matrices d’échantillon;
— de la préparation de la matrice d’échantillon destinée à l’analyse.
4.5.3 Considérations génomiques
Lors de l’évaluation de l’adéquation d’une méthode, il convient de tenir compte des aspects suivants
concernant la nature de la région génomique à séquencer:
— la disposition cellulaire et génomique de la séquence, à savoir cellulaire (nucléaire ou mitochondriale)
ou génomique (allélique ou spécifique du gène);
— la longueur de la séquence qui sera déterminée;
— les types et la conception des séquences d’amorces utilisées pour la préparation et le séquençage de
l’échantillon et de la banque.
4.5.4 Évaluation de la méthode
L’applicabilité doit être soumise à essai en extrayant l’ADN des échantillons pour essai de matrices
représentatifs du domaine analytique de la méthode.
Les produits alimentaires hautement transformés peuvent contenir de l’ADN fragmenté et/ou
présenter une faible teneur en ADN, ce qui rend leur séquençage difficile. Pour compenser cela, des
stratégies peuvent être utilisées, par exemple le traitement d’une plus grande quantité d’échantillons,
la concentration d’extraits d’ADN, le travail avec de plus petites régions génomiques ciblées.
4.6 Sélection et évaluation des amorces
La sélection et l’évaluation des amorces sont les premières et principales étapes du processus
analytique de séquençage nucléotidique lorsqu’une technique de séquençage d’ADN par PCR est utilisée.
La conception de nouvelles amorces est une tâche bio-informatique effectuée à l’aide d’un logiciel dédié.
Il existe de nombreux outils de sélection des amorces dans le commerce et disponibles gratuitement,
par exemple Primer-BLAST et Primer 3. Les facteurs de conception d’amorces suivants influencent
la performance des amorces: structures secondaires, appariements partiels de séquences, épingles à
cheveux, pourcentage de GC, etc.
NOTE 1 La conception et la sélection des amorces ne sont pas considérées comme faisant partie du processus
de sélection des régions génomiques à séquencer dans la technique NGS de troisième génération et dans la
stratégie de fragmentation de l’ADN, par exemple le NGS de deuxième génération et le séquençage shotgun.
Des amorces universelles (consensus) peuvent être définies pour n’importe quel niveau taxonomique
(espèce, genre, famille, ordre, classe, domaine, etc.). La conception de ces amorces repose sur les
alignements de séquences d’ADN et sur l’identification de régions consensus qui sont pratiquement
identiques parmi les taxons à identifier. Des amorces dégénérées peuvent être conçues pour augmenter
l’universalité des amorces. Il est nécessaire d’évaluer toute hybridation non spécifique pour déterminer
le nombre de dégénérescences incluses dans une seule amorce pour éviter toute liaison non spécifique.
Il convient d’évaluer les amorces in silico, quelle que soit leur utilisation dans le processus de laboratoire.
Il doit être estimé, à l’aide d’outils bio-informatiques appropriés, si elles correspondent à l’espèce
(au taxon) à détecter/identifier.
NOTE 2 Un exemple de processus in silico pour la sélection d’une combinaison d’amorces est indiqué
à l’Annexe C.
Il convient que l’évaluation finale de la performance de chaque combinaison d’amorces soit effectuée en
appliquant le processus de laboratoire utilisant l’ADN de référence ou le matériel tissulaire (chaque fois
que cela est possible) représentatif du groupe identifiable d’espèces (de taxons).
4.7 Construction et évaluation de la base de données
La base de données d’ADN utilisée pour la détection et/ou l’identification des espèces déterminera
le nombre d’espèces différentes identifiables par le processus de laboratoire. La construction et
l’évaluation de la base de données est une tâche bio-informatique et divers outils peuvent être utilisés, y
compris un logiciel développé en interne. Les bases de données accessibles au public peuvent également
être utilisées, par exemple GenBank. Il convient que les bases de données contiennent les informations
suivantes:
— la liste des espèces;
— le nombre d’entrées différentes pour chaque espèce;
— la/les région(s) de l’ADN, le(s) gène(s) et la longueur des séquences d’ADN;
— une mesure de la qualité de validation de l’/des entrée(s) des séquences.
L’évaluation finale de la performance d’une recherche bio-informatique dans une base de données doit
être effectuée en appliquant le processus de laboratoire utilisant le matériau de référence (chaque fois
que cela est possible) représentatif de l’espèce incluse dans la base de données (classée). L’utilisation
de niveaux taxonomiques supérieurs est appropriée lorsque l’identification au niveau de l’espèce n’est
pas concluante, c’est-à-dire lorsque l’échantillon n’est pas différentiable par une recherche plus ciblée.
Dans GenBank, la dénomination «Bos sp.» peut être utilisée comme terme de recherche pour toutes les
espèces du genre Bos.
4.8 Sélectivité et spécificité de la séquence nucléotidique
4.8.1 Généralités
L’amplification excessive de l’ADN d’espèces non-cibles peut interférer avec la détection de l’ADN
d’espèces cibles, par exemple, une limite de détection (LOD) et/ou une valeur critique plus élevée.
Il convient que les méthodes de séquençage Sanger et NGS (par PCR) ciblé fournissent des preuves
expérimentales de la spécificité nucléotidique avec des espèces non-cibles (voir l’ISO 20813). Il
convient de déterminer le degré d’interférence (sélectivité) de l’ADN non cible. Il convient d’évaluer
la spécificité de la séquence nucléotidique selon un mode opératoire en deux étapes: évaluation
théorique et évaluation expérimentales de l’inclusivité et de l’exclusivité. L’évaluation expérimentale
est effectuée par PCR avec les amorces sélectionnées. Pour le NGS, il convient d’évaluer également les
performances de chaque combinaison d’amorces avec des adaptateurs ou des codes-barres, ou les deux.
La concentration minimale en ADN requise pour analyser l’identité des séquences spécifiques peut être
[17]
déterminée en tant que probabilité de détection (POD) (voir l’ISO/TS 16393). Étant donné que les
données de séquences sont utilisées pour vérifier les résultats de la spéciation animale, il convient que
ces données reposent sur des bases de données évaluées, en tenant compte de manière appropriée du
moment de soumission des entrées individuelles et de toute modification ultérieure de la classification
taxonomique ou de la dénomination (c’est-à-dire, provenance). En cas de résultats inattendus, il convient
d’approfondir les recherches pour confirmer l’identité du matériau de référence. L’amplification de
l’ADN n’est pas requise en cas d’analyse de séquençage non-PCR, par exemple le séquençage shotgun.
4.8.2 Exigences relatives aux essais d’inclusivité
Il convient de fournir les résultats expérimentaux fournis par les essais d’une méthode avec un taxon
animal cible. Il convient que ces essais incluent les espèces pertinentes pour le domaine d’application de
la méthode et le niveau taxonomique couvert par les amorces à utiliser. Il convient d’utiliser un nombre
approprié d’espèces différentes (voir l’ISO 20813). Pour les amorces ayant moins de 100 % d’homologie
de séquence avec l’espèce d’ADN cible (d’après une évaluation in silico), il convient de soumettre à
essai l’amplificabilité de ces espèces en laboratoire afin de définir les limites des mésappariements
acceptables. L’utilisateur doit définir une liste théorique d’espèces identifiables et la liste d’espèces
soumises à essai en laboratoire. On sait que, selon la région d’ADN ciblée par les amorces, les niveaux de
conservation peuvent être très différents. Différents gènes ont divers taux de variabilité intraspécifique
des séquences d’ADN. Il convient donc de soumettre à essai un nombre approprié d’individus de chaque
espèce.
Il convient que le matériau nécessaire aux essais d’inclusivité expérimentaux contienne une
concentration en ADN suffisante pour la PCR et le séquençage de l’ADN, comme décrit dans l’ISO 20813.
Les réplicats de chaque matériau d’échantillon doivent être soumis à essai avec des témoins adaptés aux
différentes étapes du processus, par exemple la PCR. Si des variants de séquence de l’espèce animale
cible sont présents, il convient de les identifier avec une efficacité d’amplification comparable.
4.8.3 Évaluation des interférences de l’ADN non-cible
Les résultats expérimentaux fournis par les essais de la méthode de séquençage avec des espèces
animales non-cibles doivent être fournis. Il convient que ces essais incluent à la fois des espèces
animales étroitement et non étroitement liées sur le plan taxonomique. Il convient de soumettre à
essai des espèces animales ou groupes taxonomiques pertinents au vu du domaine d’application de la
méthode, par exemple des espèces couramment utilisées dans les aliments en général et en particulier
dans les matrices considérées dans le domaine d’application de la méthode. Il convient que la méthode
fasse clairement la distinction entre les espèces animales cibles et non cibles. Il convient d’effectuer
une analyse in silico avec les taxons non-cibles appropriés pour évaluer théoriquement l’homologie
de séquence des amorces universelles. Les mésappariements de séquence sont de bons indicateurs de
spécificité. Ils indiquent le degré selon lequel une combinaison d’amorces et de sondes se liera à des
séquences non intentionnelles pour produire un faux positif. Il convient de définir un nombre minimal
acceptable de mésappariements pour l’analyse in silico. L’exclusivité est déterminée plus efficacement
lorsqu’un nombre supérieur de mésappariements est autorisé lors de l’analyse. Sélectionner un nombre
approprié d’espèces pouvant provoquer des interférences avec les espèces animales cibles présentes
dans le matériau d’essai alimentaire (comme décrit dans l’ISO 20813). Des exemples d’organismes
adaptés sont donnés à l’Annexe A de l’ISO 20813:2019. Il convient d’inclure d’autres espèces si elles
sont pertinentes, par exemple en cas d’homologies de séquences d’oligonucléotides avec les séquences
d’acides nucléiques. Il convient de confirmer l’adéquation de l’ADN employé pour l’amplification en
utilisant des témoins appropriés. Il convient d’utiliser une quantité suffisante d’ADN pour les essais
d’exclusivité expérimentale par PCR.
4.9 Sensibilité
4.9.1 Généralités
Les résultats expérimentaux fournis par les essais de la méthode à différentes concentrations en ADN
pour évaluer la plage d’utilisation de la méthode doivent être consignés et décrits dans le rapport de
validation. Il convient de détecter les espèces animales aux niveaux pertinents pour la partie intéressée,
par exemple le consommateur.
4.9.2 Limite de détection
4.9.2.1 Généralités
[17]
La LOD (voir l’ISO 21569 et l’ISO 20813) et la POD (voir l’ISO/TS 16393 ) peuvent varier
significativement selon les matrices. Les constituants animaux à différentes étapes de traitement dans
le même produit peuvent présenter divers niveaux de dégradation de l’ADN et d’éventuelles différences
de qualité de l’ADN entre les ingrédients, et peuvent contribuer à l’incertitude de la séquence. Par
exemple, un produit peut être composé de différents types de tissus animaux contenant différentes
quantités d’ADN. Ce déséquilibre peut en outre être intensifié si certains ingrédients ont subi un
prétraitement. Une cuisson ou un traitement acide de certains ingrédients abaissera la qualité de
l’ADN, comparativement à d’autres ingrédients qui peuvent être ajoutés bruts ou traités différemment.
Selon le gène cible utilisé pour l’identification, le nombre de copies de ce gène peut être très différent.
La détermination de la LOD peut être effectuée comme décrit dans l’ISO 20813:2019, 4.7.2.
4.9.2.2 Limite de détection pour le séquençage Sanger
Il convient d’effectuer la détermination de la LOD comme décrit pour une méthode PCR conformément
à l’ISO 20813. Les données fournies par le séquençage Sanger sont une séquence d’ADN obtenue à
partir d’un produit PCR préalablement amplifié. La LOD pour cette méthode est équivalente à la LOD
obtenue pour la réaction PCR en utilisant les amorces universelles définies pour le taxon spécifique.
Il convient de noter que la détermination de la LOD pour le séquençage Sanger est particulièrement
importante lorsqu’il s’agit de produits contenant des ingrédients traités, en raison du risque de qualité
et de quantité nettement moins élevées d’ADN de ces composants.
4.9.2.3 Limite de détection pour le NGS
Pour le NGS par PCR, la LOD dépend de la LOD du système de PCR utilisé (voir l’ISO 20813). Elle est
calculée comme décrit pour le séquençage Sanger.
En l’absence de PCR (par exemple, séquençage shotgun), la LOD dépend de l’intégrité (fragmentation)
de l’ADN d’entrée et du système NGS utilisé.
Dans toutes les méthodes de NGS, il convient de définir une LOD supplémentaire d’après le nombre
minimal de lectures requis pour trouver une concordance des espèces à partir de la base de données
utilisée.
4.10 Robustesse
4.10.1 Généralités
La capacité d’une méthode de séquençage à ne pas être affectée par des variations faibles des
paramètres de la méthode (par exemple, variation de concentration des composants du kit, variation de
l’appareillage) doit être vérifiée. La robustesse peut être évaluée de manière empirique.
4.10.2 Détermination de la robustesse par une étude interlaboratoires
[18]
La robustesse peut être déterminée en effectuant une étude interlaboratoires. Une méthode
robuste est une méthode dans laquelle les résultats de différents laboratoires ne varient pas de façon
significative. Il convient d’utiliser des méthodes robustes à chaque fois que cela est possible.
4.10.3 Détermination de la robustesse par un essai orthogonal multifactoriel
Il convient que la méthode d’essai soit réalisée selon une approche orthogonale multifactorielle, dans
laquelle plusieurs altérations sont évaluées (voir l’ISO 20813), notamment, entre autres, les variations
de la concentration en mélange maître, du volume réactionnel, des concentrations en amorce, de la
température d’hybridation et de la plateforme du thermocycleur.
5 Validation intralaboratoire
Il convient qu’une méthode d’analyse ait été suffisamment soumise à essai au sein d’un laboratoire pour
[19] [20]
fournir les spécifications requises avant une étude interlaboratoires. Voir l’ISO 13495 et la CEN/
[21]
TS 17329-1 pour des recommandations. Il convient d’utiliser des matériaux de référence ou des
matériaux de référence certifiés (MRC) pour la validation des méthodes de séquençage de l’ADN des
acides nucléiques.
6 Étude comparative interlaboratoires
Les informations concernant l’étude interlaboratoires (organisateur, protocole, nombre de laboratoires
participants, etc.) et les données de performances obtenues par l’étude doivent être consignées avec des
[19]
références appropriées aux documents pertinents. Les études interlaboratoires pour la validation
des méthodes de PCR pour la détection, l’identification et la quantification de séquences d’ADN
spécifiques peuvent être réalisées conformément à d’autres documents pertinents (par exemple, Codex
[22] [23]
Alimentarius CAC/GL 74-2010 et CEN/TS 17329-2 .
NOTE 1 Une étude interlaboratoires à petite échelle (étude de prévalidation impliquant, par exemple, de deux
à quatre laboratoires) peut être réalisée pour soumettre à essai la transférabilité générale de la méthode avant
l’organisation d’une étude à grande échelle.
Pour une validation précise, les données doivent être recueillies à partir de nombreux laboratoires
disposant des installations et des compétences requises dans le domaine de la biologie moléculaire.
Dans l’ISO 13495:2013, les nombres requis de laboratoires sont de respectivement huit et quatre
pour les niveaux international et national de validation. CEN/TS 17329-2 spécifie un minimum de
[24]
douze laboratoires. Selon l’AOAC International, le nombre requis est de huit laboratoires. Il convient
[25]
que l’analyse statistique de l’exactitude soit calculée sur la base de l’ISO 5725-1:1994 .
NOTE 2 Les taux traditionnels non paramétriques de 5 % de faux positifs et de 5 % de faux négatifs reflètent
des POD de 5 % et de 95 %.
7 Exigences générales du laboratoire et du mode opératoire
7.1 Généralités
Le mode opératoire doit être documenté, de manière à inclure les étapes suivantes:
— obtention d’un échantillon représentatif;
— préparation des échantillons pour essai et des sous-échantillons;
NOTE Si l’échantillon pour essai n’est pas l’échantillon entier pour laboratoire, l’échantillon pour
laboratoire est homogénéisé et des échantillons pour essai sont obtenus conformément aux Normes
internationales pertinentes, notamment broyage, homogénéisation et préparation des prises d’essai;
— extraction de l’ADN (si nécessaire, détermination de la concentration en ADN et de la p
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.

Loading comments...