Language resource management — Comprehensive Annotation Framework (ComAF) — Part 3: Diagrammatic semantic authoring (DSA)

This document specifies how to represent (not visualize) documents (instance data, not data schemas) as graphs. It does not specify how to visualize or operate on document data, but it aims at making documents easier for people to compose and comprehend by allowing for various graph-based flexible user interfaces, possibly incorporating document-visualization practices (see Introduction). In this connection, this document does not specify annotations to existing documents either, but rather it specifies a schema of documents with explicit logical structures.

Gestion des ressources linguistiques — Cadre global d’annotation (ComAF) — Partie 3: Création sémantique diagrammatique (DSA)

ISO/TC 37/SC 4 Date: 2021-02 ISO 24627-3:2021(F) ISO/TC 37/SC 4/GT 5 Secrétariat: KATS Gestion des ressources linguistiques — Cadre global d'annotation (ComAF) — Partie 3: Création sémantique diagrammatique (DSA) Language Resource management — Comprehensive annotation framework (ComAF) — Part 3: Diagrammatic semantic authoring (DSA) DOCUMENT PROTÉGÉ PAR COPYRIGHT Droits de reproduction réservés. Sauf indication contraire, aucune partie de cette publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie, l'affichage sur l'internet ou sur un Intranet, sans autorisation écrite préalable. Les demandes d'autorisation peuvent être adressées à l'ISO à l'adresse ci-après ou au comité membre de l'ISO dans le pays du demandeur. ISO copyright office Ch. de Blandonnet 8 ? CP 401 CH-1214 Vernier, Geneva, Switzerland Tel. + 41 22 749 01 11 Fax + 41 22 749 09 47 copyright@iso.org www.iso.org Sommaire Page Avant-propos........................................................................................................................................ 4 Introduction.......................................................................................................................................... 5 1 Domaine d'application........................................................................................................... 1 2 Références normatives........................................................................................................... 1 3 Termes et définitions............................................................................................................... 1 4 Spécification............................................................................................................................. 2 Annexe A (informative) Exemples...................................................................................................... 4 Bibliographie...................................................................................................................................... 10 Avant-propos L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales, gouvernementales et non gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui concerne la normalisation électrotechnique. Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents critères d'approbation requis pour les différents types de documents ISO. Le présent document a été rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www.iso.org/directives). L'attention est attirée sur le fait que certains des éléments du présent document peuvent faire l'objet de droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de l'élaboration du document sont indiqués dans l'Introduction et/ou dans la liste des déclarations de brevets reçues par l'ISO (voir www.iso.org/brevets). Les appellations commerciales éventuellement mentionnées dans le présent document sont données pour information, par souci de commodité, à l'intention des utilisateurs et ne sauraient constituer

Upravljanje jezikovnih virov - Ogrodje za celovito označevanje (ComAF) - 3. del: Diagramsko semantično avtorstvo (DSA)

General Information

Status
Published
Publication Date
07-Feb-2021
Current Stage
6060 - International Standard published
Start Date
08-Feb-2021
Due Date
16-Nov-2020
Completion Date
08-Feb-2021

Buy Standard

Standard
ISO 24627-3:2021 - BARVE
English language
14 pages
sale 10% off
Preview
sale 10% off
Preview
e-Library read for
1 day
Standard
ISO 24627-3:2021 - Language resource management -- Comprehensive Annotation Framework (ComAF)
English language
8 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24627-3:2021 - Language resource management — Comprehensive Annotation Framework (ComAF) — Part 3: Diagrammatic semantic authoring (DSA) Released:2/8/2021
English language
8 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24627-3:2021 - Gestion des ressources linguistiques -- Cadre global d’annotation (ComAF)
French language
9 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 24627-3:2021 - Gestion des ressources linguistiques — Cadre global d’annotation (ComAF) — Partie 3: Création sémantique diagrammatique (DSA) Released:2/8/2021
French language
9 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (Sample)


SLOVENSKI STANDARD
01-junij-2021
Upravljanje jezikovnih virov - Ogrodje za celovito označevanje (ComAF) - 3. del:
Diagramsko semantično avtorstvo (DSA)
Language resource management -- Comprehensive Annotation Framework (ComAF) -
Part 3: Diagrammatic semantic authoring (DSA)
Gestion des ressources linguistiques -- Cadre global d’annotation (ComAF) - Partie 3:
Création sémantique diagrammatique (DSA)
Ta slovenski standard je istoveten z: ISO 24627-3:2021
ICS:
01.020 Terminologija (načela in Terminology (principles and
koordinacija) coordination)
01.140.20 Informacijske vede Information sciences
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

INTERNATIONAL ISO
STANDARD 24627-3
First edition
2021-02
Language resource management —
Comprehensive Annotation
Framework (ComAF) —
Part 3:
Diagrammatic semantic authoring
(DSA)
Gestion des ressources linguistiques — Cadre global d’annotation
(ComAF) —
Partie 3: Création sémantique diagrammatique (DSA)
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved

Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Specification . 1
Annex A (informative) Examples . 3
Bibliography . 8
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the
World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www .iso .org/
iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
A list of all parts in the ISO 24627 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
iv © ISO 2021 – All rights reserved

Introduction
Graphs (diagrams consisting of nodes and links) have been used for decades to represent and visualize
both documents (instance data) and data schemas. This document concerns graph-based representation
(not visualization) of documents (not data schemas).
[15]
Graph-based representation and visualization of documents are addressed by concept maps, mind
maps, argument maps, and so on. Theoretical linguistics and artificial intelligence have also used
[10]
graph-based content visualization associated with semantic network, mental space, discourse
[13]
representation structure, and so forth.
Graph-based visualization of data schemas (or ontologies, terminologies, metamodels, etc.) is a more
usual practice. Ontologies are often visualized as graphs in which nodes are classes (and datatypes) and
links are properties (relations). ISO 24156-1 specifies a UML-based visualization of concept modelling.
Other metamodels are usually represented as similar diagrams, too.
This document gives a data schema of graph documents to facilitate composition and comprehension by
making logical document structure explicit. It neither covers visualizations or manipulations of graphs
nor does it define annotations to existing documents, but rather it addresses graphical/diagrammatic
representation of documents for the sake of semantic authoring: i.e., for people to directly view and
manipulate syntactic/semantic structures on computer displays or their future alternatives. The
linearity of traditional text documents is due to the linearity of speech languages, which constrains the
interaction between people and documents, making it hard for people to read and write. DSA defines
graphical/diagrammatic documents with more explicit structures than in text in order to make it easier
for people to read and write. Documents based on DSA, together with some user interfaces involving
appropriate visualizations and easy operations, can enhance collaborations among people and between
people and machines.
DSA mainly deals with syntactic or document structures. It addresses some fragmentary semantic
structures as well, but more systematic semantics (formal mapping between documents and
their meanings or logical forms) can be provided by another specification so that machines better
‘understand’ DSA-based documents and thereby better assist information sharing and consensus
building among people.
Figure 1 shows a workflow involving DSA and other types of documents. The DSA-based documents
in the upper half can be automatically converted (while preserving propositional content) to and from
machine-understandable documents based on appropriate standards on semantic representations
and annotations. It is possible to automatically generate traditional text documents from these
machine-understandable documents (while preserving the propositional content, too), though the
inverse conversion cannot generally be automated. Since DSA-based documents (together with some
appropriate user interfaces) are easier for people to compose and interpret than text documents,
people can usually touch and see DSA-based documents whereas traditional documents could be used
for legacy procedures (such as patent applications) and oral presentations.
Figure 1 — Document workflow involving DSA
DSA is a minimal metamodel for ISO TS 24617-5 (SemAF-DS), which in turn is based on ISO/IEC 15938.5/
Amd.1 (MPEG-7 MDS AMD1 ― Linguistic description scheme). The machine-understandable documents
in Figure 1 are assumed to use other standards including ISO 24615 (SynAF), ISO 24612 (LAF) and
[1][8][9][10][11][12][13]
ISO 24617 (SemAF) while also incorporating insights from other relevant literature
[14][15][16][17][18]
.
vi © ISO 2021 – All rights reserved

INTERNATIONAL STANDARD ISO 24627-3:2021(E)
Language resource management — Comprehensive
Annotation Framework (ComAF) —
Part 3:
Diagrammatic semantic authoring (DSA)
1 Scope
This document specifies how to represent (not visualize) documents (instance data, not data schemas)
as graphs. It does not specify how to visualize or operate on document data, but it aims at making
documents easier for people to compose and comprehend by allowing for various graph-based flexible
user interfaces, possibly incorporating document-visualization practices (see Introduction). In this
connection, this document does not specify annotations to existing documents either, but rather it
specifies a schema of documents with explicit logical structures.
2 Normative references
There are no normative references in this document.
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
3.1
hypernode
node which is a graph segment
3.2
segment
referenceable part of a DSA-based document, which is either a graph segment or a data segment (text,
image, audio, video, etc.)
3.3
semantic authoring
composition of documents while making their logical structures explicit
4 Specification
Figure 2 illustrates DSA, which is a metamodel (ontology) of graph documents. Each markable
(referenceable) part of a DSA-based document is called a segment. Each DSA-based document itself is a
segment, too.
Figure 2 — DSA metamodel (ontology)
A graph segment shall be a labelled directed graph comprising nodes and links. A node shall be a
segment and a link shall be a relation between two endnodes (source and destination segments).
A node in a graph segment can be another graph segment. A node which is a graph segment is called a
hypernode. So a graph segment can embed other graph segments as hypernodes, which are rarely used
in concept maps. Arbitrarily large DSA-based documents can hence be made of small graph segments
which are hypernodes of each other.
A data segment can embed smaller data segments as constituents. For instance, a discourse can be a
text/audio/video segment embedding sentence utterances as smaller text/audio/video segments,
which can further embed still smaller text/audio/video segments such as phrases, and so forth.
DSA is exactly the metamodel in Figure 2, which formally specifies multimodal graph documents
involving hypernodes, but does not specify how to visualize or operate on them. The diagrammatic
visualizations in Annex A are not part of DSA, they are informative examples. DSA users can adopt any
sorts of diagrammatic visualization as far as the logical document structures are made explicit enough
to meet their purposes.
2 © ISO 2021 – All rights reserved

Annex A
(informative)
Examples
A.1 Graph segments
In Figure A.1, graph segments are visualized as rounded boxes. The smaller graph segment is a
hypernode in the larger one. Most nodes in Figure A.1 are text segments, but nodes can be other types of
segments as well. Links in this example represent discourse relations and thematic roles. For instance,
a ‘core’ and an ‘axis’ are constituents of a ‘pencil’ and a function of an ‘eraser’ is to ‘erase mainly pencil
writings.’
Figure A.1 — Graph segment representing part of a patent document
Throughout this document, anaphors are underlined and their antecedents are in boldface characters.
Anaphoric relations can be explicitly visualized as links as shown in Figure A.2. Some endnodes of these
anaphoric links are text segments embedded in larger graph/text segments and thus those endnodes do
not belong to the graphs to which the anaphoric relations belong. A problem is that a graph visualizing
too many such anaphoric relations is hard for people to understand and compose. This problem is
partially addressed by visualizing graphs as trees.
SIST IS
...


INTERNATIONAL ISO
STANDARD 24627-3
First edition
2021-02
Language resource management —
Comprehensive Annotation
Framework (ComAF) —
Part 3:
Diagrammatic semantic authoring
(DSA)
Gestion des ressources linguistiques — Cadre global d’annotation
(ComAF) —
Partie 3: Création sémantique diagrammatique (DSA)
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved

Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Specification . 1
Annex A (informative) Examples . 3
Bibliography . 8
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the
World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www .iso .org/
iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
A list of all parts in the ISO 24627 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
iv © ISO 2021 – All rights reserved

Introduction
Graphs (diagrams consisting of nodes and links) have been used for decades to represent and visualize
both documents (instance data) and data schemas. This document concerns graph-based representation
(not visualization) of documents (not data schemas).
[15]
Graph-based representation and visualization of documents are addressed by concept maps, mind
maps, argument maps, and so on. Theoretical linguistics and artificial intelligence have also used
[10]
graph-based content visualization associated with semantic network, mental space, discourse
[13]
representation structure, and so forth.
Graph-based visualization of data schemas (or ontologies, terminologies, metamodels, etc.) is a more
usual practice. Ontologies are often visualized as graphs in which nodes are classes (and datatypes) and
links are properties (relations). ISO 24156-1 specifies a UML-based visualization of concept modelling.
Other metamodels are usually represented as similar diagrams, too.
This document gives a data schema of graph documents to facilitate composition and comprehension by
making logical document structure explicit. It neither covers visualizations or manipulations of graphs
nor does it define annotations to existing documents, but rather it addresses graphical/diagrammatic
representation of documents for the sake of semantic authoring: i.e., for people to directly view and
manipulate syntactic/semantic structures on computer displays or their future alternatives. The
linearity of traditional text documents is due to the linearity of speech languages, which constrains the
interaction between people and documents, making it hard for people to read and write. DSA defines
graphical/diagrammatic documents with more explicit structures than in text in order to make it easier
for people to read and write. Documents based on DSA, together with some user interfaces involving
appropriate visualizations and easy operations, can enhance collaborations among people and between
people and machines.
DSA mainly deals with syntactic or document structures. It addresses some fragmentary semantic
structures as well, but more systematic semantics (formal mapping between documents and
their meanings or logical forms) can be provided by another specification so that machines better
‘understand’ DSA-based documents and thereby better assist information sharing and consensus
building among people.
Figure 1 shows a workflow involving DSA and other types of documents. The DSA-based documents
in the upper half can be automatically converted (while preserving propositional content) to and from
machine-understandable documents based on appropriate standards on semantic representations
and annotations. It is possible to automatically generate traditional text documents from these
machine-understandable documents (while preserving the propositional content, too), though the
inverse conversion cannot generally be automated. Since DSA-based documents (together with some
appropriate user interfaces) are easier for people to compose and interpret than text documents,
people can usually touch and see DSA-based documents whereas traditional documents could be used
for legacy procedures (such as patent applications) and oral presentations.
Figure 1 — Document workflow involving DSA
DSA is a minimal metamodel for ISO TS 24617-5 (SemAF-DS), which in turn is based on ISO/IEC 15938.5/
Amd.1 (MPEG-7 MDS AMD1 ― Linguistic description scheme). The machine-understandable documents
in Figure 1 are assumed to use other standards including ISO 24615 (SynAF), ISO 24612 (LAF) and
[1][8][9][10][11][12][13]
ISO 24617 (SemAF) while also incorporating insights from other relevant literature
[14][15][16][17][18]
.
vi © ISO 2021 – All rights reserved

INTERNATIONAL STANDARD ISO 24627-3:2021(E)
Language resource management — Comprehensive
Annotation Framework (ComAF) —
Part 3:
Diagrammatic semantic authoring (DSA)
1 Scope
This document specifies how to represent (not visualize) documents (instance data, not data schemas)
as graphs. It does not specify how to visualize or operate on document data, but it aims at making
documents easier for people to compose and comprehend by allowing for various graph-based flexible
user interfaces, possibly incorporating document-visualization practices (see Introduction). In this
connection, this document does not specify annotations to existing documents either, but rather it
specifies a schema of documents with explicit logical structures.
2 Normative references
There are no normative references in this document.
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
3.1
hypernode
node which is a graph segment
3.2
segment
referenceable part of a DSA-based document, which is either a graph segment or a data segment (text,
image, audio, video, etc.)
3.3
semantic authoring
composition of documents while making their logical structures explicit
4 Specification
Figure 2 illustrates DSA, which is a metamodel (ontology) of graph documents. Each markable
(referenceable) part of a DSA-based document is called a segment. Each DSA-based document itself is a
segment, too.
Figure 2 — DSA metamodel (ontology)
A graph segment shall be a labelled directed graph comprising nodes and links. A node shall be a
segment and a link shall be a relation between two endnodes (source and destination segments).
A node in a graph segment can be another graph segment. A node which is a graph segment is called a
hypernode. So a graph segment can embed other graph segments as hypernodes, which are rarely used
in concept maps. Arbitrarily large DSA-based documents can hence be made of small graph segments
which are hypernodes of each other.
A data segment can embed smaller data segments as constituents. For instance, a discourse can be a
text/audio/video segment embedding sentence utterances as smaller text/audio/video segments,
which can further embed still smaller text/audio/video segments such as phrases, and so forth.
DSA is exactly the metamodel in Figure 2, which formally specifies multimodal graph documents
involving hypernodes, but does not specify how to visualize or operate on them. The diagrammatic
visualizations in Annex A are not part of DSA, they are informative examples. DSA users can adopt any
sorts of diagrammatic visualization as far as the logical document structures are made explicit enough
to meet their purposes.
2 © ISO 2021 – All rights reserved

Annex A
(informative)
Examples
A.1 Graph segments
In Figure A.1, graph segments are visualized as rounded boxes. The smaller graph segment is a
hypernode in the larger one. Most nodes in Figure A.1 are text segments, but nodes can be other types of
segments as well. Links in this example represent discourse relations and thematic roles. For instance,
a ‘core’ and an ‘axis’ are constituents of a ‘pencil’ and a function of an ‘eraser’ is to ‘erase mainly pencil
writings.’
Figure A.1 — Graph segment representing part of a patent document
Throughout this document, anaphors are underlined and their antecedents are in boldface characters.
Anaphoric relations can be explicitly visualized as links as shown in Figure A.2. Some endnodes of these
anaphoric links are text segments embedded in larger graph/text segments and thus those endnodes do
not belong to the graphs to which the anaphoric relations belong. A problem is that a graph visualizing
too many such anaphoric relations is hard for people to understand and compose. This problem is
partially addressed by visualizing graphs as trees.
Figure A.2 — Anaphoric links in graph segment
Some graph segments can be visually presented as trees. In this document, such a tree is enclosed in
a box and contains tree nodes headed by bullets, except that the root node lacks a bullet. In the tree
shown in Figure A.3, all the bullets represent some sort of elaboration; i.e., the child node elaborates the
parent node by describing details (such as parts) of the parent node’s referent. One needs to choose the
right root node of the tree to enjoy such a uniform interpretation of the bullets. A more specific relation
label should be used instead of a simple bullet if a node does not elaborate its parent. In this document,
text segments are enclosed in boxes, such as in Figure A.2, but such boxes are omitted when the text
segments are nodes of trees, such as in Figure A.3.
Figure A.3 — A tree representing a pathology report
4 © ISO 2021 – All rights reserved

Trees can simplify visual presentations of documents also because anaphora res
...


INTERNATIONAL ISO
STANDARD 24627-3
First edition
2021-02
Language resource management —
Comprehensive Annotation
Framework (ComAF) —
Part 3:
Diagrammatic semantic authoring
(DSA)
Gestion des ressources linguistiques — Cadre global d’annotation
(ComAF) —
Partie 3: Création sémantique diagrammatique (DSA)
Reference number
©
ISO 2021
© ISO 2021
All rights reserved. Unless otherwise specified, or required in the context of its implementation, no part of this publication may
be reproduced or utilized otherwise in any form or by any means, electronic or mechanical, including photocopying, or posting
on the internet or an intranet, without prior written permission. Permission can be requested from either ISO at the address
below or ISO’s member body in the country of the requester.
ISO copyright office
CP 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Geneva
Phone: +41 22 749 01 11
Email: copyright@iso.org
Website: www.iso.org
Published in Switzerland
ii © ISO 2021 – All rights reserved

Contents Page
Foreword .iv
Introduction .v
1 Scope . 1
2 Normative references . 1
3 Terms and definitions . 1
4 Specification . 1
Annex A (informative) Examples . 3
Bibliography . 8
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards
bodies (ISO member bodies). The work of preparing International Standards is normally carried out
through ISO technical committees. Each member body interested in a subject for which a technical
committee has been established has the right to be represented on that committee. International
organizations, governmental and non-governmental, in liaison with ISO, also take part in the work.
ISO collaborates closely with the International Electrotechnical Commission (IEC) on all matters of
electrotechnical standardization.
The procedures used to develop this document and those intended for its further maintenance are
described in the ISO/IEC Directives, Part 1. In particular the different approval criteria needed for the
different types of ISO documents should be noted. This document was drafted in accordance with the
editorial rules of the ISO/IEC Directives, Part 2 (see www .iso .org/ directives).
Attention is drawn to the possibility that some of the elements of this document may be the subject of
patent rights. ISO shall not be held responsible for identifying any or all such patent rights. Details of
any patent rights identified during the development of the document will be in the Introduction and/or
on the ISO list of patent declarations received (see www .iso .org/ patents).
Any trade name used in this document is information given for the convenience of users and does not
constitute an endorsement.
For an explanation of the voluntary nature of standards, the meaning of ISO specific terms and
expressions related to conformity assessment, as well as information about ISO's adherence to the
World Trade Organization (WTO) principles in the Technical Barriers to Trade (TBT), see www .iso .org/
iso/ foreword .html.
This document was prepared by Technical Committee ISO/TC 37, Language and terminology,
Subcommittee SC 4, Language resource management.
A list of all parts in the ISO 24627 series can be found on the ISO website.
Any feedback or questions on this document should be directed to the user’s national standards body. A
complete listing of these bodies can be found at www .iso .org/ members .html.
iv © ISO 2021 – All rights reserved

Introduction
Graphs (diagrams consisting of nodes and links) have been used for decades to represent and visualize
both documents (instance data) and data schemas. This document concerns graph-based representation
(not visualization) of documents (not data schemas).
[15]
Graph-based representation and visualization of documents are addressed by concept maps, mind
maps, argument maps, and so on. Theoretical linguistics and artificial intelligence have also used
[10]
graph-based content visualization associated with semantic network, mental space, discourse
[13]
representation structure, and so forth.
Graph-based visualization of data schemas (or ontologies, terminologies, metamodels, etc.) is a more
usual practice. Ontologies are often visualized as graphs in which nodes are classes (and datatypes) and
links are properties (relations). ISO 24156-1 specifies a UML-based visualization of concept modelling.
Other metamodels are usually represented as similar diagrams, too.
This document gives a data schema of graph documents to facilitate composition and comprehension by
making logical document structure explicit. It neither covers visualizations or manipulations of graphs
nor does it define annotations to existing documents, but rather it addresses graphical/diagrammatic
representation of documents for the sake of semantic authoring: i.e., for people to directly view and
manipulate syntactic/semantic structures on computer displays or their future alternatives. The
linearity of traditional text documents is due to the linearity of speech languages, which constrains the
interaction between people and documents, making it hard for people to read and write. DSA defines
graphical/diagrammatic documents with more explicit structures than in text in order to make it easier
for people to read and write. Documents based on DSA, together with some user interfaces involving
appropriate visualizations and easy operations, can enhance collaborations among people and between
people and machines.
DSA mainly deals with syntactic or document structures. It addresses some fragmentary semantic
structures as well, but more systematic semantics (formal mapping between documents and
their meanings or logical forms) can be provided by another specification so that machines better
‘understand’ DSA-based documents and thereby better assist information sharing and consensus
building among people.
Figure 1 shows a workflow involving DSA and other types of documents. The DSA-based documents
in the upper half can be automatically converted (while preserving propositional content) to and from
machine-understandable documents based on appropriate standards on semantic representations
and annotations. It is possible to automatically generate traditional text documents from these
machine-understandable documents (while preserving the propositional content, too), though the
inverse conversion cannot generally be automated. Since DSA-based documents (together with some
appropriate user interfaces) are easier for people to compose and interpret than text documents,
people can usually touch and see DSA-based documents whereas traditional documents could be used
for legacy procedures (such as patent applications) and oral presentations.
Figure 1 — Document workflow involving DSA
DSA is a minimal metamodel for ISO TS 24617-5 (SemAF-DS), which in turn is based on ISO/IEC 15938.5/
Amd.1 (MPEG-7 MDS AMD1 ― Linguistic description scheme). The machine-understandable documents
in Figure 1 are assumed to use other standards including ISO 24615 (SynAF), ISO 24612 (LAF) and
[1][8][9][10][11][12][13]
ISO 24617 (SemAF) while also incorporating insights from other relevant literature
[14][15][16][17][18]
.
vi © ISO 2021 – All rights reserved

INTERNATIONAL STANDARD ISO 24627-3:2021(E)
Language resource management — Comprehensive
Annotation Framework (ComAF) —
Part 3:
Diagrammatic semantic authoring (DSA)
1 Scope
This document specifies how to represent (not visualize) documents (instance data, not data schemas)
as graphs. It does not specify how to visualize or operate on document data, but it aims at making
documents easier for people to compose and comprehend by allowing for various graph-based flexible
user interfaces, possibly incorporating document-visualization practices (see Introduction). In this
connection, this document does not specify annotations to existing documents either, but rather it
specifies a schema of documents with explicit logical structures.
2 Normative references
There are no normative references in this document.
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
ISO and IEC maintain terminological databases for use in standardization at the following addresses:
— ISO Online browsing platform: available at https:// www .iso .org/ obp
— IEC Electropedia: available at http:// www .electropedia .org/
3.1
hypernode
node which is a graph segment
3.2
segment
referenceable part of a DSA-based document, which is either a graph segment or a data segment (text,
image, audio, video, etc.)
3.3
semantic authoring
composition of documents while making their logical structures explicit
4 Specification
Figure 2 illustrates DSA, which is a metamodel (ontology) of graph documents. Each markable
(referenceable) part of a DSA-based document is called a segment. Each DSA-based document itself is a
segment, too.
Figure 2 — DSA metamodel (ontology)
A graph segment shall be a labelled directed graph comprising nodes and links. A node shall be a
segment and a link shall be a relation between two endnodes (source and destination segments).
A node in a graph segment can be another graph segment. A node which is a graph segment is called a
hypernode. So a graph segment can embed other graph segments as hypernodes, which are rarely used
in concept maps. Arbitrarily large DSA-based documents can hence be made of small graph segments
which are hypernodes of each other.
A data segment can embed smaller data segments as constituents. For instance, a discourse can be a
text/audio/video segment embedding sentence utterances as smaller text/audio/video segments,
which can further embed still smaller text/audio/video segments such as phrases, and so forth.
DSA is exactly the metamodel in Figure 2, which formally specifies multimodal graph documents
involving hypernodes, but does not specify how to visualize or operate on them. The diagrammatic
visualizations in Annex A are not part of DSA, they are informative examples. DSA users can adopt any
sorts of diagrammatic visualization as far as the logical document structures are made explicit enough
to meet their purposes.
2 © ISO 2021 – All rights reserved

Annex A
(informative)
Examples
A.1 Graph segments
In Figure A.1, graph segments are visualized as rounded boxes. The smaller graph segment is a
hypernode in the larger one. Most nodes in Figure A.1 are text segments, but nodes can be other types of
segments as well. Links in this example represent discourse relations and thematic roles. For instance,
a ‘core’ and an ‘axis’ are constituents of a ‘pencil’ and a function of an ‘eraser’ is to ‘erase mainly pencil
writings.’
Figure A.1 — Graph segment representing part of a patent document
Throughout this document, anaphors are underlined and their antecedents are in boldface characters.
Anaphoric relations can be explicitly visualized as links as shown in Figure A.2. Some endnodes of these
anaphoric links are text segments embedded in larger graph/text segments and thus those endnodes do
not belong to the graphs to which the anaphoric relations belong. A problem is that a graph visualizing
too many such anaphoric relations is hard for people to understand and compose. This problem is
partially addressed by visualizing graphs as trees.
Figure A.2 — Anaphoric links in graph segment
Some graph segments can be visually presented as trees. In this document, such a tree is enclosed in
a box and contains tree nodes headed by bullets, except that the root node lacks a bullet. In the tree
shown in Figure A.3, all the bullets represent some sort of elaboration; i.e., the child node elaborates the
parent node by describing details (such as parts) of the parent node’s referent. One needs to choose the
right root node of the tree to enjoy such a uniform interpretation of the bullets. A more specific relation
label should be used instead of a simple bullet if a node does not elaborate its parent. In this document,
text segments are enclosed in boxes, such as in Figure A.2, but such boxes are omitted when the text
segments are nodes of trees, such as in Figure A.3.
Figure A.3 — A tree representing a pathology report
4 © ISO 2021 – All rights reserved

Trees can simplify visual presentations of documents also because anaphora res
...


NORME ISO
INTERNATIONALE 24627-3
Première édition
2021-02
Gestion des ressources
linguistiques — Cadre global
d’annotation (ComAF) —
Partie 3:
Création sémantique
diagrammatique (DSA)
Language resource management — Comprehensive Annotation
Framework (ComAF) —
Part 3: Diagrammatic semantic authoring (DSA)
Numéro de référence
©
ISO 2021
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés

Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Spécification . 1
Annexe A (informative) Exemples . 3
Bibliographie . 9
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant : www .iso .org/ iso/ fr/ avant -propos .html.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-
comité SC 4, Gestion des ressources linguistiques.
Une liste de toutes les parties de la série ISO 24627 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
iv © ISO 2021 – Tous droits réservés

Introduction
Les graphes (diagrammes composés de nœuds et de liens) sont utilisés depuis des décennies pour
représenter et visualiser à la fois des documents (données d’instance) et des schémas de données. Le
présent document concerne la représentation (et non la visualisation) de documents (et non de schémas
de données) basée sur des graphes.
La représentation et la visualisation de documents basées sur des graphes sont traitées par des
[15]
cartes conceptuelles , des cartes mentales, des cartes d’arguments, etc. La linguistique théorique et
l’intelligence artificielle utilisent aussi une visualisation du contenu basée sur des graphes, associée à
[10] [13]
un réseau sémantique, un espace mental , une structure de représentation du discours , etc.
La visualisation des schémas de données (ou ontologies, terminologies, métamodèles, etc.) basée sur des
graphes est une pratique plus courante. Les ontologies sont souvent visualisées sous forme de graphes
dans lesquels les nœuds sont des classes (et des types de données) et les liens des propriétés (relations).
L’ISO 24156-1 spécifie une visualisation de la modélisation conceptuelle basée sur le langage UML.
D’autres métamodèles sont généralement aussi représentés sous forme de diagrammes similaires.
Le présent document fournit un schéma de données pour les documents de graphes, afin de faciliter la
composition et la compréhension en rendant la structure logique du document explicite. Il ne concerne
pas les visualisations ou les manipulations des graphes et il ne définit pas non plus les annotations
de documents existants, mais il traite plutôt de la représentation graphique/diagrammatique des
documents pour les besoins de la création sémantique, c’est-à-dire pour que les personnes visualisent
et manipulent directement des structures syntactiques/sémantiques sur des écrans d’ordinateur ou
leurs futures alternatives. La linéarité des documents textuels traditionnels est due à la linéarité des
langages parlés, qui contraint l’interaction entre les personnes et les documents, et qui rend difficiles
la lecture et l’écriture. La DSA définit des documents graphiques/diagrammatiques avec des structures
plus explicites que dans le texte, afin de faciliter leur lecture et écriture. Les documents basés sur la
DSA, associés à des interfaces utilisateur impliquant des visualisations appropriées et des opérations
simples, peuvent améliorer la collaboration entre les personnes, et entre les personnes et les machines.
La DSA traite principalement des structures syntactiques ou documentaires. Elle traite aussi de
certaines structures sémantiques fragmentaires, mais une autre spécification peut fournir une
sémantique plus systématique (mappage formel entre documents et leurs significations ou formes
logiques), pour que les machines puissent mieux « comprendre » les documents basés sur la DSA et donc
mieux assister le partage d’informations et l’obtention d’un consensus entre les personnes.
La Figure 1 illustre un flux de travail impliquant la DSA et d’autres types de documents. Les documents
basés sur la DSA dans la moitié supérieure peuvent être convertis automatiquement (tout en préservant
le contenu propositionnel) à partir de et vers des documents compréhensibles par les machines, sur
la base de normes appropriées concernant les représentations et annotations sémantiques. Il est
possible de générer automatiquement des documents textuels traditionnels à partir de ces documents
compréhensibles par les machines (tout en préservant également le contenu propositionnel), bien que
la conversion inverse ne puisse généralement pas être automatisée. Comme les documents basés sur
la DSA (associés à des interfaces utilisateur appropriées) sont plus faciles à composer et à interpréter
par les personnes que les documents textuels, les personnes peuvent généralement toucher et voir
les documents basés sur la DSA, tandis que les documents traditionnels peuvent être utilisés pour les
procédures métiers (telles que les demandes de brevets) et les présentations orales.
Figure 1 — Flux de travail d’un document impliquant la DSA
La DSA est un métamodèle minimal pour l’ISO/TS 24617-5 (SemAF-DS), qui repose à son tour sur
l’ISO/IEC 15938.5/Amd.1 (MPEG-7 MDS AMD1 ― Schème descriptif linguistique). Les documents
compréhensibles par les machines sur la Figure 1 sont supposés utiliser d’autres normes, notamment
l’ISO 24615 (SynAF), l’ISO 24612 (LAF) et l’ISO 24617 (SemAF), tout en incorporant des aperçus tirés
[1][8][9][10][11][12][13][14][15][16][17][18]
d’autres littératures pertinentes .
vi © ISO 2021 – Tous droits réservés

NORME INTERNATIONALE ISO 24627-3:2021(F)
Gestion des ressources linguistiques — Cadre global
d’annotation (ComAF) —
Partie 3:
Création sémantique diagrammatique (DSA)
1 Domaine d’application
Le présent document spécifie comment représenter (et non visualiser) des documents (données
d’instance et non schémas de données) sous forme de graphes. Il ne spécifie pas comment visualiser
ou utiliser des données documentaires, mais il vise à rendre les documents plus faciles à composer
et à comprendre par les personnes en offrant diverses interfaces utilisateur flexibles incorporant
éventuellement les pratiques de visualisation de documents (voir l’Introduction). À cet égard, le présent
document ne spécifie pas non plus les annotations de documents existants, mais il spécifie plutôt un
schéma de documents avec des structures logiques explicites.
2 Références normatives
Le présent document ne contient aucune référence normative.
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes :
— ISO Online browsing platform : disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia : disponible à l’adresse http:// www .electropedia .org/
3.1
hypernœud
nœud qui est un segment de graphe
3.2
segment
partie référençable d’un document basé sur la DSA, qui est soit un segment de graphe, soit un segment
de données (texte, image, audio, vidéo, etc.)
3.3
création sémantique
composition de documents rendant leurs structures logiques explicites
4 Spécification
La Figure 2 illustre la DSA, qui est un métamodèle (ontologie) de documents de graphes. Chaque partie
marquable (référençable) d’un document basé sur la DSA est appelée un segment. Chaque document
basé sur la DSA proprement dit est aussi un segment.
Figure 2 — Métamodèle DSA (ontologie)
Un segment de graphe doit être un graphe orienté étiqueté comprenant des nœuds et des liens. Un nœud
doit être un segment, et un lien doit être une relation entre deux nœuds terminaux (segments source et
destination).
Un nœud dans un segment de graphe peut être un autre segment de graphe. Un nœud qui est un segment
de graphe est appelé un hypernœud. Un segment de graphe peut donc intégrer d’autres segments de
graphes sous forme d’hypernœuds, ceux-ci étant rarement utilisés dans les cartes conceptuelles.
Arbitrairement, les gros documents basés sur la DSA peuvent donc être constitués de petits segments
de graphes qui sont des hypernœuds les uns des autres.
Un segment de données peut intégrer de plus petits segments de donnée en tant que constituants. Par
exemple, un discours peut être un segment de texte/audio/vidéo intégrant des énoncés de phrases en
tant que plus petits segments de textes/audio/vidéo, qui peuvent à leur tour intégrer des segments de
textes/audio/vidéo encore plus petits, tels que des expressions, et ainsi de suite.
La DSA est exactement le métamodèle de la Figure 2, qui spécifie formellement des documents de
graphes multimodaux impliquant des hypernœuds, mais qui ne spécifie pas comment les visualiser
ou les utiliser. Les visualisations diagrammatiques dans l’Annexe A ne font pas partie de la DSA, elles
sont fournies à titre d’exemples informatifs. Les utilisateurs de la DSA peuvent adopter toutes sortes de
visualisations diagrammatiques dans la mesure où les structures logiques des documents sont rendues
assez explicites.
2 © ISO 2021 – Tous droits réservés

Annexe A
(informative)
Exemples
A.1 Segments de graphe
Sur la Figure A.1, les segments de graphes sont visualisés sous forme de cadres à bords arrondis.
Le segment de graphe plus petit est un hypernœud dans le plus grand. La plupart des nœuds sur la
Figure A.1 sont des segments de textes, mais les nœuds
...


NORME ISO
INTERNATIONALE 24627-3
Première édition
2021-02
Gestion des ressources
linguistiques — Cadre global
d’annotation (ComAF) —
Partie 3:
Création sémantique
diagrammatique (DSA)
Language resource management — Comprehensive Annotation
Framework (ComAF) —
Part 3: Diagrammatic semantic authoring (DSA)
Numéro de référence
©
ISO 2021
DOCUMENT PROTÉGÉ PAR COPYRIGHT
© ISO 2021
Tous droits réservés. Sauf prescription différente ou nécessité dans le contexte de sa mise en œuvre, aucune partie de cette
publication ne peut être reproduite ni utilisée sous quelque forme que ce soit et par aucun procédé, électronique ou mécanique,
y compris la photocopie, ou la diffusion sur l’internet ou sur un intranet, sans autorisation écrite préalable. Une autorisation peut
être demandée à l’ISO à l’adresse ci-après ou au comité membre de l’ISO dans le pays du demandeur.
ISO copyright office
Case postale 401 • Ch. de Blandonnet 8
CH-1214 Vernier, Genève
Tél.: +41 22 749 01 11
E-mail: copyright@iso.org
Web: www.iso.org
Publié en Suisse
ii © ISO 2021 – Tous droits réservés

Sommaire Page
Avant-propos .iv
Introduction .v
1 Domaine d’application . 1
2 Références normatives . 1
3 Termes et définitions . 1
4 Spécification . 1
Annexe A (informative) Exemples . 3
Bibliographie . 9
Avant-propos
L’ISO (Organisation internationale de normalisation) est une fédération mondiale d’organismes
nationaux de normalisation (comités membres de l’ISO). L’élaboration des Normes internationales est
en général confiée aux comités techniques de l’ISO. Chaque comité membre intéressé par une étude
a le droit de faire partie du comité technique créé à cet effet. Les organisations internationales,
gouvernementales et non gouvernementales, en liaison avec l’ISO participent également aux travaux.
L’ISO collabore étroitement avec la Commission électrotechnique internationale (IEC) en ce qui
concerne la normalisation électrotechnique.
Les procédures utilisées pour élaborer le présent document et celles destinées à sa mise à jour sont
décrites dans les Directives ISO/IEC, Partie 1. Il convient, en particulier, de prendre note des différents
critères d’approbation requis pour les différents types de documents ISO. Le présent document a été
rédigé conformément aux règles de rédaction données dans les Directives ISO/IEC, Partie 2 (voir www
.iso .org/ directives).
L’attention est attirée sur le fait que certains des éléments du présent document peuvent faire l’objet de
droits de propriété intellectuelle ou de droits analogues. L’ISO ne saurait être tenue pour responsable
de ne pas avoir identifié de tels droits de propriété et averti de leur existence. Les détails concernant
les références aux droits de propriété intellectuelle ou autres droits analogues identifiés lors de
l’élaboration du document sont indiqués dans l’Introduction et/ou dans la liste des déclarations de
brevets reçues par l’ISO (voir www .iso .org/ brevets).
Les appellations commerciales éventuellement mentionnées dans le présent document sont données
pour information, par souci de commodité, à l’intention des utilisateurs et ne sauraient constituer un
engagement.
Pour une explication de la nature volontaire des normes, la signification des termes et expressions
spécifiques de l’ISO liés à l’évaluation de la conformité, ou pour toute information au sujet de l’adhésion
de l’ISO aux principes de l’Organisation mondiale du commerce (OMC) concernant les obstacles
techniques au commerce (OTC), voir le lien suivant : www .iso .org/ iso/ fr/ avant -propos .html.
Le présent document a été élaboré par le comité technique ISO/TC 37, Langage et terminologie, sous-
comité SC 4, Gestion des ressources linguistiques.
Une liste de toutes les parties de la série ISO 24627 se trouve sur le site web de l’ISO.
Il convient que l’utilisateur adresse tout retour d’information ou toute question concernant le présent
document à l’organisme national de normalisation de son pays. Une liste exhaustive desdits organismes
se trouve à l’adresse www .iso .org/ fr/ members .html.
iv © ISO 2021 – Tous droits réservés

Introduction
Les graphes (diagrammes composés de nœuds et de liens) sont utilisés depuis des décennies pour
représenter et visualiser à la fois des documents (données d’instance) et des schémas de données. Le
présent document concerne la représentation (et non la visualisation) de documents (et non de schémas
de données) basée sur des graphes.
La représentation et la visualisation de documents basées sur des graphes sont traitées par des
[15]
cartes conceptuelles , des cartes mentales, des cartes d’arguments, etc. La linguistique théorique et
l’intelligence artificielle utilisent aussi une visualisation du contenu basée sur des graphes, associée à
[10] [13]
un réseau sémantique, un espace mental , une structure de représentation du discours , etc.
La visualisation des schémas de données (ou ontologies, terminologies, métamodèles, etc.) basée sur des
graphes est une pratique plus courante. Les ontologies sont souvent visualisées sous forme de graphes
dans lesquels les nœuds sont des classes (et des types de données) et les liens des propriétés (relations).
L’ISO 24156-1 spécifie une visualisation de la modélisation conceptuelle basée sur le langage UML.
D’autres métamodèles sont généralement aussi représentés sous forme de diagrammes similaires.
Le présent document fournit un schéma de données pour les documents de graphes, afin de faciliter la
composition et la compréhension en rendant la structure logique du document explicite. Il ne concerne
pas les visualisations ou les manipulations des graphes et il ne définit pas non plus les annotations
de documents existants, mais il traite plutôt de la représentation graphique/diagrammatique des
documents pour les besoins de la création sémantique, c’est-à-dire pour que les personnes visualisent
et manipulent directement des structures syntactiques/sémantiques sur des écrans d’ordinateur ou
leurs futures alternatives. La linéarité des documents textuels traditionnels est due à la linéarité des
langages parlés, qui contraint l’interaction entre les personnes et les documents, et qui rend difficiles
la lecture et l’écriture. La DSA définit des documents graphiques/diagrammatiques avec des structures
plus explicites que dans le texte, afin de faciliter leur lecture et écriture. Les documents basés sur la
DSA, associés à des interfaces utilisateur impliquant des visualisations appropriées et des opérations
simples, peuvent améliorer la collaboration entre les personnes, et entre les personnes et les machines.
La DSA traite principalement des structures syntactiques ou documentaires. Elle traite aussi de
certaines structures sémantiques fragmentaires, mais une autre spécification peut fournir une
sémantique plus systématique (mappage formel entre documents et leurs significations ou formes
logiques), pour que les machines puissent mieux « comprendre » les documents basés sur la DSA et donc
mieux assister le partage d’informations et l’obtention d’un consensus entre les personnes.
La Figure 1 illustre un flux de travail impliquant la DSA et d’autres types de documents. Les documents
basés sur la DSA dans la moitié supérieure peuvent être convertis automatiquement (tout en préservant
le contenu propositionnel) à partir de et vers des documents compréhensibles par les machines, sur
la base de normes appropriées concernant les représentations et annotations sémantiques. Il est
possible de générer automatiquement des documents textuels traditionnels à partir de ces documents
compréhensibles par les machines (tout en préservant également le contenu propositionnel), bien que
la conversion inverse ne puisse généralement pas être automatisée. Comme les documents basés sur
la DSA (associés à des interfaces utilisateur appropriées) sont plus faciles à composer et à interpréter
par les personnes que les documents textuels, les personnes peuvent généralement toucher et voir
les documents basés sur la DSA, tandis que les documents traditionnels peuvent être utilisés pour les
procédures métiers (telles que les demandes de brevets) et les présentations orales.
Figure 1 — Flux de travail d’un document impliquant la DSA
La DSA est un métamodèle minimal pour l’ISO/TS 24617-5 (SemAF-DS), qui repose à son tour sur
l’ISO/IEC 15938.5/Amd.1 (MPEG-7 MDS AMD1 ― Schème descriptif linguistique). Les documents
compréhensibles par les machines sur la Figure 1 sont supposés utiliser d’autres normes, notamment
l’ISO 24615 (SynAF), l’ISO 24612 (LAF) et l’ISO 24617 (SemAF), tout en incorporant des aperçus tirés
[1][8][9][10][11][12][13][14][15][16][17][18]
d’autres littératures pertinentes .
vi © ISO 2021 – Tous droits réservés

NORME INTERNATIONALE ISO 24627-3:2021(F)
Gestion des ressources linguistiques — Cadre global
d’annotation (ComAF) —
Partie 3:
Création sémantique diagrammatique (DSA)
1 Domaine d’application
Le présent document spécifie comment représenter (et non visualiser) des documents (données
d’instance et non schémas de données) sous forme de graphes. Il ne spécifie pas comment visualiser
ou utiliser des données documentaires, mais il vise à rendre les documents plus faciles à composer
et à comprendre par les personnes en offrant diverses interfaces utilisateur flexibles incorporant
éventuellement les pratiques de visualisation de documents (voir l’Introduction). À cet égard, le présent
document ne spécifie pas non plus les annotations de documents existants, mais il spécifie plutôt un
schéma de documents avec des structures logiques explicites.
2 Références normatives
Le présent document ne contient aucune référence normative.
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s’appliquent.
L’ISO et l’IEC tiennent à jour des bases de données terminologiques destinées à être utilisées en
normalisation, consultables aux adresses suivantes :
— ISO Online browsing platform : disponible à l’adresse https:// www .iso .org/ obp
— IEC Electropedia : disponible à l’adresse http:// www .electropedia .org/
3.1
hypernœud
nœud qui est un segment de graphe
3.2
segment
partie référençable d’un document basé sur la DSA, qui est soit un segment de graphe, soit un segment
de données (texte, image, audio, vidéo, etc.)
3.3
création sémantique
composition de documents rendant leurs structures logiques explicites
4 Spécification
La Figure 2 illustre la DSA, qui est un métamodèle (ontologie) de documents de graphes. Chaque partie
marquable (référençable) d’un document basé sur la DSA est appelée un segment. Chaque document
basé sur la DSA proprement dit est aussi un segment.
Figure 2 — Métamodèle DSA (ontologie)
Un segment de graphe doit être un graphe orienté étiqueté comprenant des nœuds et des liens. Un nœud
doit être un segment, et un lien doit être une relation entre deux nœuds terminaux (segments source et
destination).
Un nœud dans un segment de graphe peut être un autre segment de graphe. Un nœud qui est un segment
de graphe est appelé un hypernœud. Un segment de graphe peut donc intégrer d’autres segments de
graphes sous forme d’hypernœuds, ceux-ci étant rarement utilisés dans les cartes conceptuelles.
Arbitrairement, les gros documents basés sur la DSA peuvent donc être constitués de petits segments
de graphes qui sont des hypernœuds les uns des autres.
Un segment de données peut intégrer de plus petits segments de donnée en tant que constituants. Par
exemple, un discours peut être un segment de texte/audio/vidéo intégrant des énoncés de phrases en
tant que plus petits segments de textes/audio/vidéo, qui peuvent à leur tour intégrer des segments de
textes/audio/vidéo encore plus petits, tels que des expressions, et ainsi de suite.
La DSA est exactement le métamodèle de la Figure 2, qui spécifie formellement des documents de
graphes multimodaux impliquant des hypernœuds, mais qui ne spécifie pas comment les visualiser
ou les utiliser. Les visualisations diagrammatiques dans l’Annexe A ne font pas partie de la DSA, elles
sont fournies à titre d’exemples informatifs. Les utilisateurs de la DSA peuvent adopter toutes sortes de
visualisations diagrammatiques dans la mesure où les structures logiques des documents sont rendues
assez explicites.
2 © ISO 2021 – Tous droits réservés

Annexe A
(informative)
Exemples
A.1 Segments de graphe
Sur la Figure A.1, les segments de graphes sont visualisés sous forme de cadres à bords arrondis.
Le segment de graphe plus petit est un hypernœud dans le plus grand. La plupart des nœuds sur la
Figure A.1 sont des segments de textes, mais les nœuds
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.