Microbiology of the food chain — Whole genome sequencing for typing and genomic characterization of bacteria — General requirements and guidance

This document specifies the minimum requirements for generating and analysing whole genome sequencing (WGS) data of bacteria obtained from the food chain. This process can include the following stages: a) handling of bacterial cultures; b) axenic genomic DNA isolation; c) library preparation, sequencing, and assessment of raw DNA sequence read quality and storage; d) bioinformatics analysis for determining genetic relatedness, genetic content and predicting phenotype, and bioinformatics pipeline validation; e) metadata capture and sequence repository deposition; f) validation of the end-to-end WGS workflow (fit for purpose for intended application). This document is applicable to bacteria isolated from: — products intended for human consumption; — products intended for animal feed; — environmental samples from food and feed handling and production areas; — samples from the primary production stage.

Microbiologie de la chaîne alimentaire — Séquençage de génome entier pour le typage et la caractérisation génomique des bactéries — Exigences générales et recommandations

Le présent document spécifie les exigences minimales pour générer et analyser des données de séquençage de génome entier (WGS) de bactéries provenant de la chaîne alimentaire. Ce processus peut comprendre les étapes suivantes: a) manipulation des cultures bactériennes; b) isolement de l’ADN génomique axène; c) préparation de la librairie, séquençage et évaluation de la qualité et du stockage des lectures de séquences brutes d’ADN; d) analyse bioinformatique visant à déterminer la parenté génétique et le contenu génétique, à prédire le phénotype et à valider le pipeline bioinformatique; e) capture des métadonnées et dépôt dans des bases de données de séquences; f) validation du processus de WGS de bout en bout (adapté à l’application prévue). Le présent document est applicable aux bactéries isolées à partir de ce qui suit: — des produits destinés à la consommation humaine; — des produits destinés à l’alimentation animale; — des échantillons environnementaux prélevés dans des zones de production et de manipulation de produits alimentaires et d’aliments pour animaux; — des échantillons de production primaire.

General Information

Status
Published
Publication Date
08-Jun-2022
Current Stage
6060 - International Standard published
Due Date
03-Jul-2021
Completion Date
09-Jun-2022
Ref Project

RELATIONS

Buy Standard

Standard
ISO 23418:2022 - Microbiology of the food chain — Whole genome sequencing for typing and genomic characterization of bacteria — General requirements and guidance Released:9. 06. 2022
English language
45 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 23418:2022 - Microbiology of the food chain — Whole genome sequencing for typing and genomic characterization of bacteria — General requirements and guidance Released:9. 06. 2022
French language
50 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (sample)

INTERNATIONAL ISO
STANDARD 23418
First edition
2022-06
Microbiology of the food chain —
Whole genome sequencing for typing
and genomic characterization of
bacteria — General requirements and
guidance
Microbiologie de la chaîne alimentaire — Séquençage de génome
entier pour le typage et la caractérisation génomique des bactéries —
Exigences générales et recommandations
Reference number
ISO 23418:2022(E)
© ISO 2022
---------------------- Page: 1 ----------------------
ISO 23418:2022(E)
COPYRIGHT PROTECTED DOCUMENT
© ISO 2022

All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may

be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting on

the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address below

or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
© ISO 2022 – All rights reserved
---------------------- Page: 2 ----------------------
ISO 23418:2022(E)
Contents Page

Foreword ..........................................................................................................................................................................................................................................v

Introduction .............................................................................................................................................................................................................................. vi

1 Scope ................................................................................................................................................................................................................................. 1

2 Normative references ..................................................................................................................................................................................... 1

3 Terms and definitions .................................................................................................................................................................................... 1

4 Principle ........................................................................................................................................................................................................................ 6

4.1 General ........................................................................................................................................................................................................... 6

4.2 Laboratory operation: sample preparation and sequencing ......................................................................... 6

4.3 Bioinformatics analysis .................................................................................................................................................................. 7

4.3.1 General ........................................................................................................................................................................................ 7

4.3.2 SNP analyses .......................................................................................................................................................................... 7

4.3.3 MLST analyses ...................................................................................................................................................................... 7

4.3.4 Kmer distance analysis ................................................................................................................................................ 7

4.4 Metadata formats and sequence repository deposition .................................................................................... 7

4.5 Validation and verification of WGS workflow ............................................................................................................. 8

5 General laboratory guidance .................................................................................................................................................................. 8

5.1 Bacterial isolation and DNA extraction ............................................................................................................................ 8

5.2 Laboratory environment ............................................................................................................................................................... 8

5.3 Standard operating procedures and nonconforming work ............................................................................ 8

5.4 Laboratory information management system ........................................................................................................... 8

5.5 Laboratory competence.................................................................................................................................................................. 8

6 Laboratory operations ........................................................................................................................................... ........................................9

6.1 Sample preparation and storage ............................................................................................................................................ 9

6.2 Bacterial isolates .................................................................................................................................................................................. 9

6.3 DNA isolation ........................................................................................................................................................................................... 9

6.4 Library preparation and sequencing .................................................................................................................................. 9

6.4.1 Library preparation ......................................................................................................................................................... 9

6.4.2 DNA sequencing ............................................................................................................................................................... 10

6.4.3 Use of controls ................................................................................................................................................................... 10

6.4.4 Assessing raw read data quality ....................................................................................................................... 10

6.4.5 Sample and data storage and retention ...................................................................................................... 10

7 Bioinformatic data analysis ..................................................................................................................................................................11

7.1 Requirements for software and bioinformatic pipelines used for data analysis ..................... 11

7.2 Logging and documentation .................................................................................................................................................... 11

7.3 Quality assessments ....................................................................................................................................................................... 11

7.4 SNP analyses ..........................................................................................................................................................................................12

7.5 MLST analyses (cgMLST and wgMLST) ........................................................................................................................12

7.6 Target gene detection ....................................................................................................................................................................13

7.7 Phylogenetic tree or dendrogram generation.......................................................................................................... 13

7.8 Metrics and log files ........................................................................................................................................................................13

7.9 Interpreting and reporting the results of bioinformatics analyses .....................................................13

7.9.1 Interpreting results from bioinformatics pipelines .........................................................................13

7.9.2 Reporting genomic analysis results ............................................................................................................... 14

8 Metadata ....................................................................................................................................................................................................................14

8.1 General ........................................................................................................................................................................................................ 14

8.2 Metadata interoperability and future-proofing .................................................................................................... 14

8.2.1 General ..................................................................................................................................................................................... 14

8.2.2 Ontologies .............................................................................................................................................................................. 14

8.2.3 ISO WGS Slim ...................................................................................................................................................................... 14

8.3 Formatting metadata using this document ............................................................................................................... 15

8.4 Metadata associated with sample collection ............................................................................................................ 15

iii
© ISO 2022 – All rights reserved
---------------------- Page: 3 ----------------------
ISO 23418:2022(E)

8.5 Metadata associated with the isolate .............................................................................................................................. 16

8.6 Metadata associated with the sequence ....................................................................................................................... 17

9 Sequence repositories .................................................................................................................................................................................19

10 Validation and verification ....................................................................................................................................................................20

10.1 Validation ................................................................................................................................................................................................. 20

10.1.1 General .....................................................................................................................................................................................20

10.1.2 Validation of laboratory operations ............................................................................................................... 21

10.1.3 Validation of the bioinformatics pipeline .................................................................................................. 21

10.1.4 Validation of the end-to-end workflow ....................................................................................................... 22

10.2 Verification ...................................................................... ........................................................................................................................ 22

10.2.1 General .....................................................................................................................................................................................22

10.2.2 Verification of laboratory operations ........................................................................................................... 22

10.2.3 Verification of the bioinformatics pipeline ..............................................................................................22

Annex A (informative) Development of quality metrics and use of controls .........................................................24

Annex B (informative) Laboratory contact information fields ............................................................................................29

Annex C (informative) Geographic location of sample collection fields .....................................................................31

Annex D (informative) Isolate passage history fields ....................................................................................................................32

Annex E (informative) Antibiogram results and methods fields .......................................................................................33

Annex F (informative) Virulence factor detection and methods fields .......................................................................35

Annex G (informative) Sequence quality control metrics ..........................................................................................................36

Annex H (informative) Metadata specification .....................................................................................................................................37

Annex I (informative) Instructions for ontology slim integration by software developers ..................40

Bibliography ............................................................................................................................................................................................................................ 44

© ISO 2022 – All rights reserved
---------------------- Page: 4 ----------------------
ISO 23418:2022(E)
Foreword

ISO (the International Organization for Standardization) is a worldwide federation of national standards

bodies (ISO member bodies). The work of preparing International Standards is normally carried out

through ISO technical committees. Each member body interested in a subject for which a technical

committee has been established has the right to be represented on that committee. International

organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.

ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of

electrotechnical standardization.

The procedures used to develop this document and those intended for its further maintenance are

described in the ISO/IEC Directives, Part 1. In particular, the different approval criteria needed for the

different types of ISO documents should be noted. This document was drafted in accordance with the

editorial rules of the ISO/IEC Directives, Part 2 (see www.iso.org/directives).

Attention is drawn to the possibility that some of the elements of this document may be the subject of

patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of

any patent rights identified during the development of the document will be in the Introduction and/or

on the ISO list of patent declarations received (see www.iso.org/patents).

Any trade name used in this document is information given for the convenience of users and does not

constitute an endorsement.

For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and

expressions related to conformity assessment, as well as information about ISO’s adherence to

the World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see

www.iso.org/iso/foreword.html.

This document was prepared by Technical Committee ISO/TC 34, Food products, Subcommittee SC 9,

Microbiology, in collaboration with the European Committee for Standardization (CEN) Technical

Committee CEN/TC 463, Microbiology of the food chain, in accordance with the Agreement on technical

cooperation between ISO and CEN (Vienna Agreement).

Any feedback or questions on this document should be directed to the user’s national standards body. A

complete listing of these bodies can be found at www.iso.org/members.html.
© ISO 2022 – All rights reserved
---------------------- Page: 5 ----------------------
ISO 23418:2022(E)
Introduction

Next generation sequencing (NGS) provides rapid, economical and high-throughput access to

microbial whole genome sequences and is being applied to an expanding number of problems in food

microbiology. Whole genome sequences are representations of the biological potential of the sequenced

organism at single base resolution. Whole genome sequencing (WGS) offers significant advantages over

existing technologies (e.g. serotyping, pulsed field gel electrophoresis, antibiotic resistance phenotype)

for many applications. WGS-based analyses are used by public health laboratories to detect outbreaks,

and to detect mutations, genes and other genetic features to characterize virulence and survival

potential. Within the food industry, there is interest in using whole genome sequences to characterize

bacterial isolates from ingredients and environmental surfaces, to better understand their origin and

ecology, and to update procedures to reduce risk. Some companies have developed, or are developing,

the capacity to collect and analyse whole genome sequence data. Others are turning to third-party

laboratories to perform these services, as they have done for other microbiological analyses.

This document provides guidance for both the laboratory and bioinformatic components of whole

genome sequences and associated metadata for bacterial foodborne microorganisms sampled along

the food chain (e.g. ingredients, food, feed, production environment). Although microbiology of the

food chain includes viruses and fungi, this document is only intended for bacteria. This document is

intended to be applicable to all currently available next generation DNA sequencing technologies. It

may be applied to analysis of whole genome sequence data with proprietary, open-source or custom

software. It is not intended to specify sequencing chemistries, analytical methods or software. This

document defines laboratory, data and metadata stewardship practices to ensure that analyses are

clearly reported, transparent and open to inquiry. This document is for use by laboratories to develop

their management systems for quality and technical operations. Laboratory customers and regulatory

authorities can also use it in confirming or recognizing the competence of laboratories. This document

can also be applied in other domains (e.g. environment, human health, animal health).

© ISO 2022 – All rights reserved
---------------------- Page: 6 ----------------------
INTERNATIONAL STANDARD ISO 23418:2022(E)
Microbiology of the food chain — Whole genome
sequencing for typing and genomic characterization of
bacteria — General requirements and guidance

WARNING — In order to safeguard the health of laboratory personnel, it is essential that

handling of bacterial cultures is only undertaken in properly equipped laboratories, under the

control of a skilled microbiologist, and that great care is taken in the disposal of all incubated

materials. Persons using this document should be familiar with normal laboratory practice.

This document does not purport to address all safety aspects, if any, associated with its use. It is

the responsibility of the user to establish appropriate safety and health practices.

1 Scope

This document specifies the minimum requirements for generating and analysing whole genome

sequencing (WGS) data of bacteria obtained from the food chain. This process can include the following

stages:
a) handling of bacterial cultures;
b) axenic genomic DNA isolation;

c) library preparation, sequencing, and assessment of raw DNA sequence read quality and storage;

d) bioinformatics analysis for determining genetic relatedness, genetic content and predicting

phenotype, and bioinformatics pipeline validation;
e) metadata capture and sequence repository deposition;

f) validation of the end-to-end WGS workflow (fit for purpose for intended application).

This document is applicable to bacteria isolated from:
— products intended for human consumption;
— products intended for animal feed;
— environmental samples from food and feed handling and production areas;
— samples from the primary production stage.
2 Normative references
There are no normative references in this document.
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.

ISO and IEC maintain terminology databases for use in standardization at the following addresses:

— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at https:// www .electropedia .org/
© ISO 2022 – All rights reserved
---------------------- Page: 7 ----------------------
ISO 23418:2022(E)
3.1
adapter sequence

DNA with a known sequence that is added to the end of a DNA library fragment to facilitate the

sequencing process (e.g. annealing to a flow cell)
3.2
annotation
process of identifying genes and other features on genome assemblies (3.4)
3.3
antibiogram

summary of antimicrobial susceptibility testing results performed for a specific microorganism,

usually represented in tabular form
3.4
assembly

output from process of aligning and merging sequencing reads (3.38) into larger contiguous sequences

(contigs (3.10))
3.5
base calling

process of assigning nucleotides and quality scores to positions in sequencing reads (3.38)

3.6
bioinformatics
collection, storage and analysis of biological data including sequences
3.7
bioinformatics pipeline

individual programs, scripts or pieces of software linked together, where output from one program is

used as input for the next step in data processing
3.8
carryover-contamination

sample contamination linked to previous experiments, transferred to the current analysis (e.g.

carryover-contamination from amplification products in prior polymerase chain reaction (PCR)

experiments to the current PCR analysis, or carryover-contamination of previously sequenced samples

from one sequencing run to another)
3.9
Chemical Entities of Biological Interest Ontology
ChEBI
ontology (3.35) for describing small chemical compounds
3.10
contig

contiguous stretch of DNA sequence that results from the assembly (3.4) of smaller, overlapping DNA

sequence reads (3.38)
3.11
controlled vocabulary
finite set of values that represent the only allowed values for a data item
[SOURCE: ISO 11238:2018, 3.18, modified — Note 1 to entry deleted.]
3.12
coverage
number of times that a given base position is read in a sequencing run
Note 1 to entry: The number of reads (3.38) that cover a particular position.
© ISO 2022 – All rights reserved
---------------------- Page: 8 ----------------------
ISO 23418:2022(E)

[SOURCE: ISO 20397-2:2021, 3.6, modified — Admitted term “coverage depth” deleted.]

3.13
cross-contamination

contamination of a sample (bacterial isolate (3.23) or DNA) with other samples during the preparation

of a sequencing run
3.14
DNA sample
portion of DNA extracted from the processed sample
3.15
draft assembly

de novo genome assembly (3.4) consisting of contigs (3.10) with no implied order, typically generated

using whole genome shotgun sequencing with a short-read technology
3.16
Environment Ontology
EnvO
ontology (3.35) for describing environmental features and habitats
3.17
FoodEx2 Ontology
FoodEx2

standardized food classification and description system developed by the European Food Safety

Authority (EFSA)
3.18
Food Ontology
FoodOn
ontology (3.35) for describing food products, animal feed and food processing
3.19
Gazetteer Ontology
GAZ
ontology (3.35) for describing geographical locations
3.20
index

oligonucleotide sequences used in the process of library preparation to tag or barcode DNA from

specific samples, so that multiple samples (i.e. multiple libraries (3.25)) can be combined (multiplexed)

in a pool of libraries and analysed in a single sequencing reaction
3.21
International Nucleotide Sequence Database Collaboration
INSDC

initiative operated by the DNA Database of Japan (DDBJ), the European Molecular Biology Laboratory,

European Bioinformatics Institute (EMBL-EBI) and the National Center for Biotechnology Information

(NCBI)
3.22
International Organization for Standardization whole genome sequencing slim
ISO WGS Slim

ontology (3.35) slim containing interoperable fields and terms pertaining to the use of WGS (3.49) for

microbiology of the food chain
3.23
isolate

population of bacterial cells in pure culture derived from a single strain (3.45)

© ISO 2022 – All rights reserved
---------------------- Page: 9 ----------------------
ISO 23418:2022(E)
3.24
kmer
possible sequence of length k that is contained in a whole genome sequence
3.25
library

collection of genomic DNA fragments from a single isolate (3.23) intended for determining genome

sequence(s)

Note 1 to entry: A collection of libraries, each of a single isolate, is called a “pool of libraries” and is loaded on a

sequencer to be analysed. This multiplexing of libraries would still provide the result for a single isolate if unique

indices are used for each individual single isolate’s library preparation.

Note 2 to entry: A library of mixed DNA, i.e. originating from a mixture of multiple species, can be made. However,

this is not within the scope of this document as this refers to metagenomics sequencing.

3.26
management system

quality, administrative and technical systems that govern the operations of an organization

Note 1 to entry: For the purposes of this document, “organization” refers to the laboratory.

3.27
mapping
use of software to align sequencing reads (3.38) to reference sequences
3.28
metadata
data that defines and describes other data
[SOURCE: ISO/IEC 11179-1:2015, 3.2.16]
3.29
minimal data for matching
MDM

information required to describe the sample source and provenance of a genomic sequence, as defined

[1]

by the Global Microbial Identifier , and implemented by the International Nucleotide Sequence Database

Collaboration (3.21)
3.30
multi-locus sequence typing
MLST

method of genomic analysis that identifies nucleotide variants within predefined sets of loci

Note 1 to entry: Originally used for seven loci, it is now also applied to either core genome loci for cgMLST or

whole genome loci for wgMLST.
3.31
N50

length (N) such that sequence contigs (3.10) of N or longer include half the bases in the assembly (3.4)

3.32
NCBITaxon

automatic translation of the National Center for Biotechnology Information (NCBI) taxonomy database

into obo/owl
3.33
NG50

length (N) of DNA such that sequence contigs (3.10) of N or longer include half the bases in the genome

© ISO 2022 – All rights reserved
---------------------- Page: 10 ----------------------
ISO 23418:2022(E)
3.34
Open Biological and Biomedical Ontology Foundry
OBO Foundry

collection of ontologies (3.35) created by a collective of ontology developers that are committed to

collaboration and adherence to shared principles
3.35
ontology

controlled vocabulary (3.11) arranged in a hierarchy, where the terms are connected by logical

relationships
3.36
ontology slim

set of ontology fields and terms annotated as part of a particular collection, often for a specific purpose,

which may be extracted to create a file distinct from the original ontology (3.35)

3.37
Phred sequence quality score

measure of the probability (P) that a base is incorrectly assigned at a given position in the sequence

expressed as:
QP=−10 lg

Note 1 to entry: A score of Q30 indicates that there is a 1 in 1 000 chance that a base is incorrectly assigned (i.e.

the base call is 99,9 % accurate).
3.38
read
nucleotide sequence inferred from a fragment of DNA or RNA
3.39
sequence repository
database in which whole genome sequencing (3.49) datasets are stored and managed

Note 1 to entry: A public repository allows unrestricted access to the data, while a private or federated repository

restricts access to the data.
3.40
sequencing replicate

sequencing a different colony from the same isolate (3.23) obtained from the same sample

material, to assess biological variation
3.41
sequencing replicate

resequencing of the same biological sample or library (3.25) to assess sequence variation

due to instrumentation and protocol
3.42
serotype

classification scheme based on the antigenic protein detection or sequence-based detection of genes

encoding bacterial surface molecules
3.43
single nucleotide polymorphism
SNP

single nucleotide variant (3.44) that passes a particular quality or frequency threshold

© ISO 2022 – All rights reserved
---------------------- Page: 11 ----------------------
ISO 23418:2022(E)
3.44
single nucleotide variant
SNV
differences between the nucleotides at the same g
...

NORME ISO
INTERNATIONALE 23418
Première édition
2022-06
Microbiologie de la chaîne
alimentaire — Séquençage de
génome entier pour le typage et
la caractérisation génomique des
bactéries — Exigences générales et
recommandations
Microbiology of the food chain — Whole genome sequencing
for typing and genomic characterization of bacteria — General
requirements and guidance
Numéro de référence
ISO 23418:2022(F)
© ISO 2022
---------------------- Page: 1 ----------------------
ISO 23418:2022(F)
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2022

Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette

publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,

y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut

être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.

ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
© ISO 2022 – Tous droits réservés
---------------------- Page: 2 ----------------------
ISO 23418:2022(F)
Sommaire Page

Avant-propos ...............................................................................................................................................................................................................................v

Introduction .............................................................................................................................................................................................................................. vi

1 Domaine d’application ................................................................................................................................................................................... 1

2 Références normatives ..................................................................................................................................................................................1

3 Termes et définitions ...................................................................................................................................................................................... 1

4 Principe.......................................................................................................................................................................................................................... 7

4.1 Généralités ................................................................................................................................................................................................. 7

4.2 Opérations réalisées en laboratoire: préparation et séquençage de l’échantillon ..................... 7

4.3 Analyse bioinformatique ............................................................................................................................................................... 7

4.3.1 Généralités ............................................................................................................................................................................... 7

4.3.2 Analyses des SNP ............................................................................................................................................................... 8

4.3.3 Analyses des MLST ........................................................................................................................................................... 8

4.3.4 Analyse de la distance k-mer ................................................................................................................................... 8

4.4 Formats de métadonnées et dépôt dans la base de données de séquences ..................................... 8

4.5 Validation et vérification du processus de WGS ....................................................................................................... 8

5 Recommandations générales pour le laboratoire ............................................................................................................ 9

5.1 Isolement bactérien et extraction de l’ADN .................................................................................................................. 9

5.2 Environnement du laboratoire ................................................................................................................................................. 9

5.3 Procédure opérationnelles normalisées et travaux non conformes ...................................................... 9

5.4 Système de management de l’information des laboratoires .......................................................................... 9

5.5 Compétence du laboratoire ......................................................................................................................................................... 9

6 Opérations du laboratoire ......................................................................................................................................................................10

6.1 Préparation et stockage des échantillons ................................................................................................................... 10

6.2 Isolats bactériens .............................................................................................................................................................................. 10

6.3 Isolement de l’ADN ........................................................................................................................................................................... 10

6.4 Préparation de la librairie et séquençage .................................................................................................................... 10

6.4.1 Préparation de la librairie ....................................................................................................................................... 10

6.4.2 Séquençage de l’ADN .................................................................................................................................................... 11

6.4.3 Utilisation de contrôles ............................................................................................................................................. 11

6.4.4 Évaluation de la qualité des données de lectures brutes ............................................................ 11

6.4.5 Stockage et rétention des échantillons et des données ................................................................12

7 Analyse bioinformatique des données ......................................................................................................................................12

7.1 Exigences relatives aux pipelines et logiciels bioinformatiques utilisés pour

l’analyse des données.....................................................................................................................................................................12

7.2 Connexion et documentation ..................................................................................................................................................12

7.3 Évaluations de qualité ........................................................................................................................................... ........................12

7.4 Analyses des SNP ............................................................................................................................................................................... 14

7.5 Analyses des MLST (cgMLST et wgMLST) .................................................................................................................. 14

7.6 Détection de gènes cibles ........................................................................................................................................................... 14

7.7 Génération d’arbre phylogénétique ou de dendrogramme .......................................................................... 14

7.8 Métriques et fichiers journaux .............................................................................................................................................. 15

7.9 Interprétation et consignation des résultats des analyses bioinformatiques ............................15

7.9.1 Interprétation des résultats des pipelines bioinformatiques .................................................15

7.9.2 Consignation des résultats des analyses génomiques ...................................................................15

8 Métadonnées .........................................................................................................................................................................................................16

8.1 Généralités .............................................................................................................................................................................................. 16

8.2 Interopérabilité et pérennité des métadonnées .................................................................................................... 16

8.2.1 Généralités ............................................................................................................................................................................ 16

8.2.2 Ontologies .............................................................................................................................................................................. 16

8.2.3 ISO WGS Slim ...................................................................................................................................................................... 16

8.3 Formatage des métadonnées au moyen du présent document ................................................................ 17

iii
© ISO 2022 – Tous droits réservés
---------------------- Page: 3 ----------------------
ISO 23418:2022(F)

8.4 Métadonnées associées à la collecte d’échantillons ........................................................................................... 17

8.5 Métadonnées associées à l’isolat ......................................................................................................................................... 18

8.6 Métadonnées associées à la séquence ............................................................................................................................. 20

9 Bases de données de séquences ........................................................................................................................................................22

10 Validation et vérification .........................................................................................................................................................................22

10.1 Validation .................................................................................................................................................................................................22

10.1.1 Généralités ............................................................................................................................................................................22

10.1.2 Validation des opérations de laboratoire .................................................................................................. 24

10.1.3 Validation du pipeline bioinformatique ...................................................................................................... 24

10.1.4 Validation du processus de bout en bout ................................................................................................... 25

10.2 Vérification ...................................................................... ........................................................................................................................ 26

10.2.1 Généralités ............................................................................................................................................................................ 26

10.2.2 Vérification des opérations de laboratoire .............................................................................................. 26

10.2.3 Vérification du pipeline bioinformatique .................................................................................................. 26

Annexe A (informative) Élaboration de métriques de qualité et utilisation de contrôles ......................27

Annexe B (informative) Champs de coordonnées du laboratoire .....................................................................................33

Annexe C (informative) Champs de localisation géographique de la collecte d’échantillon ................35

Annexe D (informative) Champs d’historique de repiquage de l’isolat .......................................................................36

Annexe E (informative) Champs de méthodes et de résultats pour l’antibiogramme .................................37

Annexe F (informative) Champs de détection des facteurs de virulence et de méthodes .......................39

Annexe G (informative) Métriques de contrôle qualité des séquences .......................................................................40

Annexe H (informative) Spécifications des métadonnées .........................................................................................................41

Annexe I (informative) Instructions pour l’intégration de l’ontologie Slim

par les développeurs de logiciels ................................................................................................................................................... 44

Bibliographie ...........................................................................................................................................................................................................................49

© ISO 2022 – Tous droits réservés
---------------------- Page: 4 ----------------------
ISO 23418:2022(F)
Avant-propos

L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes

nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est

en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude

a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,

gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.

L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui

concerne la normalisation électrotechnique.

Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont

décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents

critères d’approbation requis pour les différents types de documents ISO. Le présent document a été

rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir

www.iso.org/directives).

L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de

droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable

de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant

les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de

l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de

brevets reçues par l’ISO (voir www.iso.org/brevets).

Les appellations commerciales éventuellement mentionnées dans le présent document sont données

pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un

engagement.

Pour une explication de la nature volontaire des normes, la signification des termes et expressions

spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion

de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles

techniques au commerce (OTC), voir www.iso.org/avant-propos.

Le présent document a été élaboré par le comité technique ISO/TC 34, Produits alimentaires, sous-comité

SC 9, Microbiologie, en collaboration avec le comité technique CEN/TC 463, Microbiologie de la chaîne

alimentaire, du Comité européen de normalisation (CEN) conformément à l’Accord de coopération

technique entre l’ISO et le CEN (Accord de Vienne).

Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent

document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes

se trouve à l’adresse www.iso.org/fr/members.html.
© ISO 2022 – Tous droits réservés
---------------------- Page: 5 ----------------------
ISO 23418:2022(F)
Introduction

Le séquençage à haut débit (NGS, next generation sequencing) permet un accès rapide, économique, et

à haut débit à des séquences de génomes microbiens entiers et est appliqué en réponse à un nombre

croissant de problèmes dans le secteur de la microbiologie des aliments. Les séquences de génomes

entiers sont des représentations du potentiel biologique de l’organisme séquencé avec une résolution

à la base. Le séquençage de génomes entiers (WGS) offre des avantages significatifs par rapport aux

technologies existantes (par exemple, sérotypage, électrophorèse sur gel en champ pulsé, phénotype

de résistance aux antibiotiques) dans de nombreuses applications. Les analyses basées sur le WGS

sont utilisées par les laboratoires de santé publique pour détecter les épidémies, ainsi que pour

détecter les mutations, gènes et autres éléments génétiques caractérisant la virulence et le potentiel

de survie. L’industrie alimentaire s’intéresse à l’utilisation de séquences de génomes entiers pour

caractériser des isolats bactériens provenant d’ingrédients et de surfaces environnementales, afin de

mieux comprendre leur origine et leur écologie, et d’actualiser les modes opératoires dans le but de

réduire le risque. Des sociétés ont développé ou développent actuellement leur capacité de collecte et

d’analyse de données de séquences de génomes entiers. D’autres confient ces opérations techniques à

des laboratoires tiers, comme elles le font pour d’autres analyses microbiologiques.

Le présent document fournit des recommandations pour les parties à la fois de laboratoire et de

bioinformatique des séquences de génomes entiers, ainsi que pour les métadonnées associées relatives

aux micro-organismes bactériens d’origine alimentaire échantillonnés tout au long de la chaîne

alimentaire (par exemple, ingrédients, produits alimentaires, aliments pour animaux, environnement

de production). Bien que la microbiologie de la chaîne alimentaire comprenne les virus et les

champignons, le présent document concerne uniquement les bactéries. Le présent document est destiné

à être applicable à toutes les technologies disponibles actuellement de séquençage d’ADN. Il peut être

appliqué à l’analyse des données de séquences de génomes entiers au moyen d’un logiciel commercial,

libre de droits ou personnalisé. Il n’a pas vocation à spécifier les chimies de séquençage, les méthodes

analytiques, ni le logiciel d’analyse. Le présent document définit les bonnes pratiques de laboratoire,

de gestion des données et des métadonnées, afin de s’assurer que les analyses sont transparentes,

clairement consignées dans un rapport et utilisables dans des investigations. Le présent document est

destiné à être utilisé par les laboratoires pour le développement de leurs systèmes de management de

la qualité et de leurs opérations techniques. Les clients des laboratoires et les autorités réglementaires

peuvent également l’utiliser pour confirmer ou reconnaître la compétence des laboratoires. Le présent

document peut aussi être appliqué à d’autres domaines (par exemple, environnement, santé humaine,

santé animale).
© ISO 2022 – Tous droits réservés
---------------------- Page: 6 ----------------------
NORME INTERNATIONALE ISO 23418:2022(F)
Microbiologie de la chaîne alimentaire — Séquençage
de génome entier pour le typage et la caractérisation
génomique des bactéries — Exigences générales et
recommandations

AVERTISSEMENT — Afin de protéger la santé du personnel de laboratoire, il est essentiel que

la manipulation des cultures bactériennes soit effectuée uniquement dans des laboratoires

dotés d’un équipement approprié, sous le contrôle d’un microbiologiste expérimenté, et qu’un

grand soin soit apporté à l’élimination de l’ensemble des matériaux ayant servi à l’incubation.

Il convient que les utilisateurs du présent document connaissent les pratiques courantes de

laboratoire. Le présent document ne prétend pas couvrir tous les aspects de sécurité liés, le cas

échéant, à son utilisation. Il incombe à l’utilisateur de mettre en place des pratiques de santé et

de sécurité appropriées.
1 Domaine d’application

Le présent document spécifie les exigences minimales pour générer et analyser des données de

séquençage de génome entier (WGS) de bactéries provenant de la chaîne alimentaire. Ce processus peut

comprendre les étapes suivantes:
a) manipulation des cultures bactériennes;
b) isolement de l’ADN génomique axène;

c) préparation de la librairie, séquençage et évaluation de la qualité et du stockage des lectures de

séquences brutes d’ADN;

d) analyse bioinformatique visant à déterminer la parenté génétique et le contenu génétique, à prédire

le phénotype et à valider le pipeline bioinformatique;
e) capture des métadonnées et dépôt dans des bases de données de séquences;

f) validation du processus de WGS de bout en bout (adapté à l’application prévue).

Le présent document est applicable aux bactéries isolées à partir de ce qui suit:

— des produits destinés à la consommation humaine;
— des produits destinés à l’alimentation animale;

— des échantillons environnementaux prélevés dans des zones de production et de manipulation de

produits alimentaires et d’aliments pour animaux;
— des échantillons de production primaire.
2 Références normatives
Le présent document ne contient aucune référence normative.
3 Termes et définitions

Pour les besoins du présent document, les termes et définitions suivants s’appliquent.

© ISO 2022 – Tous droits réservés
---------------------- Page: 7 ----------------------
ISO 23418:2022(F)

L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en

normalisation, consultables aux adresses suivantes:

— ISO Online browsing platform: disponible à l’adresse https:// www .iso .org/ obp

— IEC Electropedia: disponible à l’adresse https:// www .electropedia .org/
3.1
adaptateur

ADN possédant une séquence connue, qui est ajouté à l’extrémité d’un fragment de la librairie d’ADN afin

de faciliter le procédé de séquençage (par exemple, appariement sur la cellule en flux de séquençage)

3.2
annotation

procédé d’identification des gènes et autres caractéristiques sur des assemblages (3.4) génomiques

3.3
antibiogramme

synthèse des résultats des essais de sensibilité aux agents antimicrobiens réalisés pour un micro-

organisme spécifique, généralement représenté sous forme de tableau
3.4
assemblage

produit du procédé d’alignement et de fusion des séquences nucléotidiques lues ou lectures (3.38) en

séquences contiguës plus longues (contigs (3.10))
3.5
attribution des bases
base calling

procédé consistant à affecter des nucléotides et des scores de qualité à des emplacements dans les

lectures (3.38)
3.6
bioinformatique
collecte, stockage et analyse de données biologiques, y compris des séquences
3.7
pipeline bioinformatique

programmes individuels, scripts ou éléments de logiciels liés ensemble, dans lesquels le produit d’un

programme est utilisé comme entrée pour l’étape suivante de traitement des données

3.8
intercontamination

contamination des échantillons due à de précédentes analyses, transférée à l’analyse en cours

(par exemple, intercontamination de produits d’amplification de précédentes analyses de réaction

de polymérisation en chaîne (PCR) à l’analyse PCR en cours, ou intercontamination d’échantillons

séquencés précédemment d’un cycle de séquençage à un autre)
3.9
Chemical Entities of Biological Interest (ontologie)
ChEBI
ontologie (3.35) utilisée pour la description de petits composés chimiques
3.10
contig

fragment contigu de séquence d’ADN résultant de l’assemblage (3.4) de lectures (3.38) de séquences

d’ADN plus petites se chevauchant
© ISO 2022 – Tous droits réservés
---------------------- Page: 8 ----------------------
ISO 23418:2022(F)
3.11
vocabulaire contrôlé

jeu fini de valeurs qui correspondent aux seules valeurs admises pour un élément de données

[SOURCE: ISO 11238:2018, 3.18, modifié — La Note 1 à l’article a été supprimée.]
3.12
couverture

nombre de fois qu’une position de base donnée est lue dans un cycle de séquençage

Note 1 à l'article: Nombre de lectures (3.38) qui couvrent une position particulière.

[SOURCE: ISO 20397‑2:2021, 3.6, modifié — Le terme admis «profondeur de couverture» a été

supprimé.]
3.13
contamination croisée

contamination d’un échantillon (isolat (3.23) bactérien ou ADN) avec d’autres échantillons au cours de

la préparation d’une série d’échantillons d’ADN en vue de leur séquençage
3.14
échantillon d’ADN
portion d’ADN extraite de l’échantillon traité
3.15
assemblage préliminaire

assemblage (3.4) de génome de novo composé de contigs (3.10) sans ordre implicite, généralement

obtenu par séquençage tronqué de génome entier avec une technologie de séquençage générant des

lectures courtes
3.16
Environment Ontology
EnvO

ontologie (3.35) utilisée pour la description des caractéristiques environnementales et des habitats

3.17
FoodEx2 (ontologie)
FoodEx2

classification alimentaire normalisée et système de description développé par l’Autorité européenne de

sécurité des aliments (EFSA)
3.18
Food Ontology
FoodOn

ontologie (3.35) utilisée pour la description des produits alimentaires, des aliments pour animaux et de

la transformation des aliments
3.19
Gazetteer (ontologie)
GAZ
ontologie (3.35) utilisée pour la description des localisations géographiques
3.20
index

séquences oligonucléotidiques utilisées dans le procédé de préparation de librairies pour étiqueter

ou marquer par code‑barres l’ADN d’échantillons spécifiques afin de pouvoir combiner (multiplexer)

plusieurs échantillons (c’est-à-dire plusieurs librairies (3.25)) dans un groupe de librairies et de les

analyser au cours d’une seule réaction de séquençage
© ISO 2022 – Tous droits réservés
---------------------- Page: 9 ----------------------
ISO 23418:2022(F)
3.21
International Nucleotide Sequence Database Collaboration
INSDC

initiative conduite par la Base de données d’acides nucléiques du Japon (DDBJ), l’Institut européen de

bioinformatique du Laboratoire européen de biologie moléculaire (EMBL-EBI) et le National Center for

Biotechnology Information (NCBI)
3.22

séquençage de génome entier slim de l’Organisation internationale de normalisation

ISO WGS Slim

ontologie (3.35) slim contenant des champs interopérables et des termes relatifs à l’utilisation du WGS

(3.49) dans le secteur de la microbiologie de la chaîne alimentaire
3.23
isolat

population de cellules bactériennes en culture pure dérivée d’une souche (3.45) unique

3.24
k-mer
séquence possible de longueur k contenue dans une séquence de génome entier
3.25
librairie

collection de fragments d’ADN génomique provenant d’un isolat (3.23) unique, destinée à déterminer la

ou les séquences du génome

Note 1 à l'article: Une collection de librairies, chacune d’elle provenant d’un isolat unique, est appelée «groupe de

librairies» et est transférée dans un séquenceur en vue d’être analysée. Ce multiplexage de librairies permettrait

tout de même d’obtenir le résultat correspondant à un seul isolat si des index uniques étaient utilisés pour la

préparation de la librairie de chaque isolat unique.

Note 2 à l'article: Une librairie d’ADN mixte, c’est-à-dire provenant d’un mélange de plusieurs espèces, peut être

constituée. Cependant, ce type de librairie fait référence au séquençage métagénomique et est donc exclu du

domaine d’application du présent document.
3.26
système de management

systèmes qualité, administratifs et techniques qui gouvernent les opérations d’un organisme

Note 1 à l'article: Pour les besoins du présent document, l’« organisme » désigne le laboratoire.

3.27
alignement

utilisation d’un logiciel pour aligner les lectures (3.38) sur des séquences de référence

3.28
métadonnées
données qui définissent et décrivent d’autres données
[SOURCE: ISO/IEC 11179‑1:2015, 3.2.16]
3.29
données minimales pour appariement
MDM

informations nécessaires pour décrire la source de l’échantillon et la provenance d’une séquence

[1]

génomique, comme défini par le Global Microbial Identifier, mises en œuvre par l’International

Nucleotide Sequence Database Collaboration (3.21)
© ISO 2022 – Tous droits réservés
---------------------- Page: 10 ----------------------
ISO 23418:2022(F)
3.30
typage par séquençage multilocus
MLST

méthode d’analyse génomique visant à identifier les variants nucléotidiques au sein d’ensembles

prédéfinis de loci

Note 1 à l'article: Utilisé à l’origine pour sept loci, il est désormais appliqué à d’autres loci de la partie commune

du génome des souches pour la cgMLST ou aux loci du gén
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.