Guide des pratiques exemplaires du FIC - Métadonnées

 

Exigences du FIC - 6.1 Métadonnées Dublin Core

a) Les six éléments Dublin Core obligatoires suivants doivent être appliqués pour décrire les pages les plus importantes du site Web, telles que la page d'accueil, chaque page principale des sections et les pages présentant des ressources dont le contexte et la signification sont suffisants, et qui valent aussi la peine d'être listées dans un moteur de recherche :

  • Titre (dc.title)
  • Créateur (dc.creator)
  • Sujet (dc.subject)
  • Date de création (dcterms.created)
  • Langue (le cas échéant) (dc.language)
  • Identificateur (dc.identifier)


b) Les métadonnées doivent être incorporées dans la section <head> de la page (X)HTML.



c) Chaque page décrite doit présenter un ensemble unique de métadonnées.

Note : Copier et coller le même contenu de métadonnées est une pratique à éviter, car les pages se concurrencent dans l'extraction. Au minimum, il ne devrait pas y avoir deux pages ayant les mêmes identificateur, titre et liste de sujets.



d) Le contenu des métadonnées doit être dans la langue de la page.

Note: Cela signifie qu'une page en anglais doit être associée à un contenu de métadonnées en anglais et qu'une page en français, doit l'être à un contenu de métadonnées en français. La syntaxe, par exemple, <meta name="dc.title" content="" /> n'est jamais traduite. Si une page est bilingue ou multilingue, les éléments de métadonnées Creator, Title, Subject et Language doivent être répétés pour toutes les langues. Toutefois, dans de tels cas, il n'est pas nécessaire de répéter les éléments Date Created et Identifier.

Définitions des éléments obligatoires

Les définitions ci-dessous sont tirées du document « Using Dublin Core », que l'on peut consulter à l'adresse http://www.dublincore.org/documents/usageguide/. Dans toutes les définitions, le mot « ressource » peut signifier une page Web ou un site Web.

Les commentaires ont pour but de clarifier les définitions ou de constituer des conseils utiles sur la saisie du contenu d'un élément.

La syntaxe dans les exemples ci-dessous est fournie pour le XHTML. En HTML, l'oblique de fin (« / ») n'est pas requise avant le crochet fermant (« > »).

Titre

Définition : Nom donné à la ressource. En règle générale, le titre est le nom sous lequel la ressource sera officiellement connue.

Commentaire : Dans une page (X)HTML, le contenu de l'élément <title> (X)HTML et l'élément Dublin Core Title devraient être identiques. Assurez-vous que le titre de votre page est porteur de sens et descriptif, afin que l'utilisateur se fasse immédiatement une idée du contenu de la page. En outre, les moteurs de recherche ont tendance à donner plus d'importance aux mots figurant dans le titre lors de l'indexation des pages.

Syntaxe : <meta name="dc.title" content="insérez le titre de la page Web décrite" />

Créateur

Définition : Entité principalement responsable de la production du contenu de la ressource. Il peut s'agir d'une personne, d'une organisation ou d'un service. En règle générale, le nom du créateur devrait être utilisé pour indiquer l'entité.

Commentaire : Les noms de personne devraient être introduits avec le nom de famille en premier, suivi d'une virgule et du prénom. S'il y a plus qu'un seul créateur pour une page Web, l'élément doit être répété aussi souvent que nécessaire.

Syntaxe : <meta name="dc.creator" content="insérez le nom de l’organisme financé par le Fonds" />

Sujet

Définition : Sujet du contenu de la ressource. En règle générale, le sujet est exprimé au moyen de mots clés, de phrases clés ou de codes de classification décrivant le sujet de la ressource. La pratique exemplaire recommandée consiste à sélectionner une valeur dans un vocabulaire contrôlé ou un système de classification systématique.

Commentaire : Il est conseillé d'utiliser des mots clés à la fois significatifs et uniques, dont le sens n'est ni trop vaste ni trop général. On doit se demander comment le public cible décrirait la page recherchée. Les mots clés peuvent être tirés du texte de la page ou d'une source officielle, par exemple l'Art and Architecture Thesaurus ou le Canadian Subject Headings. On peut séparer les mots clés multiples en utilisant systématiquement des virgules ou des points-virgules, mais pas les deux. Une bonne pratique consiste à inclure de cinq à sept mots clés.

Syntaxe : <meta name="dc.subject" content="insérez des mots clés décrivant la page Web, en les séparant par des virgules" />

Il est préférable de limiter le nombre de mots clés à entre cinq et sept. Bien qu'il n'y ait pas de limite officielle au nombre de mots qu'un élément Dublin Core peut contenir, les moteurs de recherche et les récolteurs ont tendance à interpréter les longues listes de mots clés comme s'il s'agissait de pollupostage. En règle générale, une page Web bien conçue ne traite pas une vaste gamme de sujets. Si une page traite de nombreux sujets, il est normalement préférable de la diviser en plusieurs pages, chacune d'entre elles traitant d'une seule question ou idée.

Date de création

Définition : Date de création de la ressource.

Commentaire : L'élément de donnée ne devrait pas être utilisé seul mais plutôt avec un de ses raffinements d'élément. Le raffinement, soit la date de création, est obligatoire. D'autres raffinements sont la date de modification et la date de publication. Il est fortement recommandé d'indiquer la date dans le format international AAAA-MM-JJ, par exemple 2006-12-20. Si le mois ou le jour n'est pas connu, la valeur « 01 » est utilisée, comme dans les exemples suivants : 2006-12-01 ou 2006-01-01.

Syntaxe : <meta name="dcterms.created" content="insérez la date de création de la page Web décrite, dans le format AAAA-MM-JJ" />

Langue

Définition : Langue du contenu intellectuel de la ressource.

Commentaire : Le nom d'une langue ou un code la représentant peut être utilisé ici. Une pratique recommandée consiste à utiliser les codes de deux ou trois lettres définis dans la norme ISO 639, « Codes pour la représentation des noms de langue ». Un grand nombre de langues autochtones canadiennes sont incluses dans la section des codes de trois lettres. Les codes sont disponibles à l'adresse http://www.loc.gov/standards/iso639-2/. Si une page Web contient des textes dans plus d'une langue, l'élément doit être répété aussi souvent que nécessaire.

Syntaxe : <meta name="dc.language" content="insérez le code ou le nom de la langue de la page Web décrite" />

Identificateur

Définition : Référence non ambiguë à la ressource à l'intérieur d'un contexte donné. La pratique exemplaire recommandée consiste à identifier la ressource au moyen d'une chaîne ou d'un nombre conforme à un système d'identification officiel. Des exemples d'identificateur officiel sont l'identificateur URI (qui inclut l'adresse URL), l'identificateur DOI et le numéro international normalisé du livre (ISBN).

Commentaire : Il est également possible d'employer des identificateurs locaux attribués par le créateur de la page Web ou un ID d'entrée de base de données.

Syntaxe : <meta name="dc.identifier" content="un identificateur peut être l’URL de la page Web décrite" />

Codage

Pour faciliter la conformité aux exigences, le modèle ci-dessous peut être directement incorporé dans l'élément <head> d'une page (X)HTML. Introduisez tout simplement les métadonnées qui décrivent le mieux possible la page Web.

Figure 1 : Exemple de code de métadonnées d'une page unilingue

<link rel="schema.dc" href="http://purl.org/dc/elements/1.1/" />
<link rel="schema.dcterms" href="http://purl.org/dc/terms/" />
<meta name="dc.title" content="insérez le titre de la page Web décrite" />
<meta name="dc.creator" content="insérez le nom de l’organisme financé par le Fonds" />
<meta name="dc.subject" content="insérez des mots clés décrivant la page Web, en les séparant par des virgules" />
<meta name="dcterms.created" content="insérez la date de création de la page Web décrite, dans le format AAAA-MM-JJ" />
<meta name="dc.language" content="insérez le code ou le nom de la langue de la page Web décrite" />
<meta name="dc.identifier" content="un identificateur peut être l’URL de la page Web décrite" />

Le modèle ci-dessus est fourni pour le XHTML. En HTML, l'oblique de fin (« / ») n'est pas requise avant le crochet fermant (« > »), comme on peut le voir dans l'exemple suivant.

<meta name="dc.creator" content="insérez le nom de l’organisme financé par le Fonds">

Les bénéficiaires des fonds doivent décrire les pages les plus significatives du site Web, notamment la page d'accueil, chaque page principale de section et les pages qui mettent en valeur le site. Chaque page décrite doit présenter un ensemble unique de contenu de métadonnées.

Une page en anglais doit être associée à un contenu de métadonnées en anglais. Une page en français doit être associée à un contenu de métadonnées en français. La syntaxe (par exemple <meta name="dc.title" content="" />) n'est jamais traduite. Si une page est bilingue ou multilingue, les éléments de métadonnées créateur, titre, sujet et langue doivent être répétés pour toutes les langues. Toutefois, dans de tels cas, il n'est pas nécessaire de répéter les éléments date de création et identificateur. L'ordre des éléments est sans importance.

Figure 2 : Exemple de code de métadonnées pour une page bilingue (anglaise et française)

<link rel="schema.dc" href="http://purl.org/dc/elements/1.1/" />
<link rel="schema.dcterms" href="http://purl.org/dc/terms/" />
<meta name="dc.title" content="insérez le titre en Anglais de la page Web décrite" />
<meta name="dc.title" content="insérez le titre en Français de la page Web décrite" />
<meta name="dc.creator" content="insérez le nom de l’organisme financé par le Fonds en Anglais" />
<meta name="dc.creator" content="insérez le nom de l’organisme financé par le Fonds en Français" />
<meta name="dc.subject" content="insérez des mots clés en Anglais décrivant la page Web, en les séparant par des virgules" />
<meta name="dc.subject" content="insérez des mots clés en Français décrivant la page Web, en les séparant par des virgules" />
<meta name="dcterms.created" content="insérez la date de création de la page Web décrite, dans le format AAAA-MM-JJ" />
<meta name="dc.language" content=" English" />
<meta name="dc.language" content=" Français" />
<meta name="dc.identifier" content="un identificateur peut être l’URL de la page Web décrite" />

Éléments facultatifs Dublin Core

L'ensemble d'éléments de métadonnées Dublin Core (DCMES) se compose de 15 éléments et de divers raffinements d'éléments. Certains d'entre eux peuvent être utiles pour décrire avec plus de précision des pages Web et des sections spéciales d'un site Web, notamment des plans de leçon, des collections d'images et des documents audiovisuels. On trouvera ci-dessous un aperçu de quelques éléments supplémentaires.

Les définitions sont tirées du document « Using Dublin Core », que l'on peut consulter à l'adresse http://www.dublincore.org/documents/usageguide/. Dans toutes les définitions, le mot « resource » peut tout aussi bien signifier une page Web qu'un site Web.

Les commentaires visent à clarifier les définitions ou à fournir des conseils utiles sur l'introduction d'informations dans le contenu des éléments.

La syntaxe est fournie pour le XHTML. En HTML, l'oblique de fin (« / ») n'est pas requise avant le crochet fermant (« > »).

Public cible (audience)

Définition : Classe d'entité à laquelle la ressource est destinée ou est utile. La classe d'entité peut être déterminée par le créateur ou l'éditeur ou encore par un tiers.

Commentaire : Cet élément sert à décrire le public visé par la page Web. Il est particulièrement utile pour décrire des plans de leçon et d'autres matériels d'apprentissage. Des valeurs comme « étudiants », « enseignants », « soignants » et « grand public » peuvent être utilisées. Il est recommandé de tirer ces termes d'une source contrôlée, ou encore d'établir une liste de mots décrivant le public cible du site Web et de les utiliser systématiquement. Si une page Web cible plus qu'un seul public, l'élément doit être répété aussi souvent que nécessaire.

Syntaxe : <meta name="dcterms.audience" content="inséréz des mots clés décrivant le public visé de la page Web décrite" />

Description

Définition : Exposé du contenu de la ressource. La description peut inclure, sans toutefois y être limitée : un résumé, une table des matières, une référence à une représentation graphique de contenu ou un exposé du contenu en texte libre.

Commentaire : Des mots significatifs sont habituellement utilisés dans la description, afin que le contenu de l'élément présente un intérêt élevé pour les moteurs de recherche. Il est bon d'avoir le même contenu dans l'élément Dublin Core Description et dans l'élément (X)HTML <meta> « description ».

Syntaxe : <meta name="dc.description" content="insérez une description du contenu de la page Web décrite" />

Format

Definition : Manifestation physique ou numérique de la ressource. En règle générale, le format peut inclure le type de média ou les dimensions de la ressource. Des exemples de dimensions seraient la taille et la durée. Le format peut être utilisé pour déterminer le logiciel, le matériel ou l'équipement nécessaire pour afficher ou utiliser la ressource.

Commentaire : La pratique recommandée est de tirer un terme d'une source contrôlée, telle que la liste des types de médias Internet, qui décrit les formats de fichier. Cette liste est disponible à l'adresse http://www.iana.org/assignments/media-types/. Des formats courants utilisés dans les pages Web sont html, jpeg, png, mpeg, etc. Les formats peuvent être utilisés pour exprimer la taille et la durée (par exemple 400 x 600 pixels; 4 Ko; 10 min 23 s). Si une page Web comprend plus qu'un seul format, l'élément doit être répété aussi souvent que nécessaire.

Syntaxe : <meta name="dc.format" content="insérez le format de fichier du contenu de la page Web décrite" />

Droits

Définition : Information sur les droits détenus dans et sur la ressource. En règle générale, un élément de droits contient un énoncé de gestion des droits de la ressource ou un renvoi à un service fournissant de tels renseignements. Les données sur les droits comprennent souvent les droits de propriété intellectuelle (DPI), le droit d'auteur et divers droits de propriété. Si l'élément de droits est absent, aucune hypothèse ne peut être faite en ce qui concerne ces droits et d'autres droits concernant la ressource.

Commentaire : L'élément de droits peut inclure un énoncé textuel ou un URL pointant vers un énoncé de droits, ou une combinaison constituée d'un énoncé bref et d'un énoncé plus long.

Syntaxe : <meta name="dc.rights" content="insérez un énoncé textuel sur les droits détenus de la page Web décrite, ou l’URL pointant vers l’énoncé de droits" />

Type

Définition : Nature ou genre du contenu de la ressource. Le type inclut des termes décrivant des genres, des fonctions, des catégories générales ou des niveaux de regroupement du contenu.

Commentaire : Une page Web peut comprendre un contenu tel que des images fixes, des textes, des plans de leçon, des événements, des images en mouvement, des sons, des ressources interactives, etc. La plupart des types peuvent être trouvés dans le « Dublin Core Metadata Initiative (DCMI) Type Vocabulary », que l'on peut consulter à l'adresse http://www.dublincore.org/documents/dcmi-type-vocabulary/. Si une page comprend plus qu'un seul type, l'élément doit être répété aussi souvent que nécessaire.

Syntaxe : <meta name="dc.type" content="insérez le type de contenu de la page Web décrite" />

Figure 3: Exemple de code de métadonnées avec des éléments Dublin Core obligatoires et facultatifs

<link rel="schema.dc" href="http://purl.org/dc/elements/1.1/" />
<link rel="schema.dcterms" href="http://purl.org/dc/terms/" />
<meta name="dc.title" content="insérez le titre de la page Web décrite" />
<meta name="dc.creator" content="insérez le nom de l’organisme financé par le Fonds" />
<meta name="dc.subject" content="insérez des mots clés décrivant la page Web, en les séparant par des virgules" />
<meta name="dcterms.created" content="insérez la date de création de la page Web décrite, dans le format AAAA-MM-JJ" />
<meta name="dc.language" content="insérez le code ou le nom de la langue de la page Web décrite" />
<meta name="dc.identifier" content="un identificateur peut être l’URL de la page Web décrite" />
<meta name="dcterms.audience" content="inséréz des mots clés décrivant le public visé de la page Web décrite" />
<meta name="dc.description" content="insérez une description du contenu de la page Web décrite" />
<meta name="dc.format" content="insérez le format de fichier du contenu de la page Web décrite" />
<meta name="dc.rights" content="insérez un énoncé textuel sur les droits détenus de la page Web décrite, ou l’URL pointant vers l’énoncé de droits" />
<meta name="dc.type" content="insérez le type de contenu de la page Web décrite" />

Autres utilisations des métadonnées Dublin Core

Les éléments de métadonnées Dublin Core peuvent aussi être utilisés pour décrire des grandes collections d'images ou de sons ou pour gérer le contenu de sites Web dans des systèmes de gestion de contenu (SGC). Des bases de données sont habituellement utilisées en arrière-plan. Des champs de ces bases peuvent être appelés après les éléments Dublin Core, ou peuvent être traduits automatiquement dans le code (X)HTML incorporé, ainsi qu'on peut le voir dans les exemples ci-dessus. Comme le contenu de ces bases de données n'est pas directement exposé aux moteurs de recherche, il est bon de tirer pleinement parti des champs de métadonnées des bases de données en les utilisant dans un moteur de recherche interne du site Web.

Références

DCMI Metadata Terms. http://www.dublincore.org/documents/dcmi-terms/.

Expressing Dublin Core in XHTML and HTML. http://www.dublincore.org/documents/dcq-html/.

Lignes directrices relatives à la mise en place des métadonnées pour la découverte des ressources Web du gouvernement du Canada, 5 e édition, octobre 2006. http://publiservice.tbs-sct.gc.ca/im-gi/mwg-gtm/ts-sf/docs/2006/metaweb/metawebtb_f.asp. (Remarque: Bien que ces lignes directrices soient spécialement destinées aux organismes fédéraux, elles peuvent être utiles aux destinataires de fonds du FIC.)

Using Dublin Core. http://www.dublincore.org/documents/usageguide/.