Guide de publication sur la plateforme CKAN

v1.0

1/ Avant de publier…

Pour ajouter un jeu de données sur le portail Open Data de la Métropole, il est nécessaire d’installer le logiciel FileZilla sur votre poste de travail. Il servira à télécharger vos fichiers sur le serveur dédié de la Métro.

L’utilisation de ce logiciel sera détaillée un peu plus loin dans cette procédure.

2/ Création du compte utilisateur sur la plateforme CKAN

Le compte CKAN vous permettra d’ajouter vos jeux de données sur le portail.

  • Se rendre sur la page : https://data.metropolegrenoble.fr/ckan/user/register
  • Renseigner les champs demandés.
  • Il est préférable d’utiliser une adresse mail générique afin qu’en cas de changement d’administrateur de votre base de jeux de données, celui-ci puisse toujours y accéder.
  • Notez bien le Nom d’utilisateur. Il sera demandé à l’étape suivante.
  • Valider la création du compte en cliquant sur Créer un compte
  • Une fois le compte créé, merci de nous communiquer à l’adresse data@metropolegrenoble.fr:
  • Le Nom d’utilisateur renseigné lors de la création du compte
  • Le logo de votre organisation sous format image (.png, .jpeg, etc…). Ce dernier apparaitra sur les pages du portail présentant vos jeux de données.

Format des fichiers

Attention : Tous les fichiers doivent être codés en UTF-8  Pour cela, il vous faut installer Notepad sur PC ou TextMate sur Mac afin de les convertir  dans ce format.

D’une manière générale, les données publiées (ressources) devraient l’être dans un format ouvert.

Cependant ceci n’est pas toujours possible, compte tenu de la diversité des sources ou de l’état de qualité de recueil de la donnée.

Pour cela, on privilégiera les formats suivants :

Données tabulaires

  • csv : Format à préférer pour toutes données structurées (ex : tableur)
  • ods : Document mis en forme sur un standard ouvert, mais nécessitant un logiciel adapté (libre) pour la réutilisation
  • Json

Données textuelles

  • txt : Format de texte le + simple, lisible sur la plupart des OS. Pas de formatage possible
  • rtf : Format de texte simple, lisible sur la plupart des OS. Quelques formatages possibles
  • odt : Document mis en forme sur un standard ouvert, mais nécessitant un logiciel adapté (libre) pour la réutilisation

Spatial (Le système de projection est EPSG 4326)

  • kml : Standard ouvert développé pour Google Earth. Le format KMZ est aussi possible pour des packages de fichiers KML
  • wms : Format standardisé pour les cartes géo référencées
  • wfs : Format standardisé pour les fonctionnalités géographiques
  • GeoJSON

Autres types

  • xml : Format de données structuré non limitatif utilisé pour le développement

3/ Chargement des fichiers sur l’entrepôt des données (via un serveur FTP)

Tous les fichiers de vos jeux de données doivent être mis sur ce serveur de la Métro.

Pour cela, il faut vous connecter sur ce serveur et transférer vos fichiers.

Connexion au serveur

  • Lancer le logiciel FileZilla
  • Renseigner les champs suivants (les informations vous seront communiqués à votre inscription) :
    • Hôte :  [ url du serveur ]
    • Protocole : [ protocole utilisé ]
    • Port : [ port utilisé ]
    • Identifiant + Mot de passe : [ Identifiant ] [ Mot de passe ].

  • Se connecter via la Connexion rapide

Si vous souhaitez plus d’informations sur l’utilisation de FileZilla, vous pouvez vous rendre sur ce site

Transférer des fichiers

Après vous être connecté, vous allez arriver directement sur le dossier mont-froid–sig (nom du serveur)

  • Ouvrez ce dossier mont-froid–sig
  • Vous y trouverez par défaut un dossier exemple vide de jeu de donnée appelé « jeu »
  • Dupliquez le contenu de ce dossier et renommez le par le nom du jeu de donnée que vous allez traiter (ex : travaux)
  • Déposez les fichiers de votre jeu de donnée dans les dossiers correspondants au format (vous pouvez en créer d’autres si besoin).

Les fichiers seront ainsi accessibles à l’adresse :

https://entrepot.metropolegrenoble.fr/opendata/[codecommune]/[Dossier_jeudedonnée]/[Nom_fichier]

Ci dessous, les codes communes :

Echirolles : 38151-ECH

Eybens : 38158-EYB

Grenoble : 38185-GRE

Saint Egrève : 38382-STE

4/ Publier les données sur le portail

Création du jeu de données

Pour ajouter un jeu de donnée au catalogue, il faut tout d’abord s’identifier sur le portail avec votre compte CKAN :

https://data.metropolegrenoble.fr/ckan/user/login

Ensuite, cliquer « Jeux de données » puis sur « Ajouter un jeu de données »

Les métadonnées

Sur la première page, vous devrez renseigner les éléments suivants, nécessaires à la description des données.

ChampDescription
TitreCe champ contient le nom du jeu de données. Par exemple « Horaires des bus et tramways TAG ». C’est cette mention qui sera affichée en premier.
Description Ce champ contient des informations descriptives sur l’ensemble des données. Il est possible de rajouter toute information complémentaire sur les conditions d’utilisation ou des mises en garde quant à la donnée. Ceci est laissé à l’appréciation du publieur.
Mots-clésEnsemble de mots-clés (tags) qui décrivent la donnée. Ceci servira à l’indexation et à la recherche. Dès qu’un mot-clé a déjà été utilisé, il est sélectionnable directement. Pour la liste de mots-clés acceptés.
LicenceLicence qui régit le droit d’utilisation des données. Par défaut, sur le territoire, la licence Open Data Commons Database License (ODbL) a été adoptée et doit être sélectionnée.
OrganisationNom du l’entité en charge de la publication du jeu de donnée. Par défaut, l’organisation est associée au profil utilisateur et n’est pas modifiable.
VisibilitéPeut prendre les valeurs « Privée » ou « Publique ». Seule cette dernière rend le jeu de données visible à tous.
ProducteurNom de la Direction (≠ service)
Courriel du producteurE-mail de l’administrateur local. Cela peut être l’adresse générique crée pour l’Open Data.
FréquenceFréquence de mise à jour de la donnée

Cliquer ensuite sur le bouton en bas de page : « Suivant : Ajouter des données »

Ajouter les données (ressources)

Cette partie concerne l’enregistrement de la donnée à proprement parler. C’est ici que l’on mettra le lien permettant d’accéder à la donnée.

Les éléments à renseigner sont les suivants :

ChampDescription
Fichier

· Lien : Renseigner l’url (adresse web) qui va pointer sur les données en respectant bien le HTTPS devant

(ex : entrepot.metropolegrenoble.fr/opendata/[code_INSEE]/[votre_fichier])

· Envoi : Ne pas utiliser

Titre Permet d’identifier la ressource. Le titre du jeu de données peut être réutilisé, tout en le précisant.
DescriptionInformations descriptives de la ressource.
FormatFormat du fichier uploadé, ou format de la cible du lien. Un certain nombre de formats préexistant sont renseignés et sélectionnables à la saisie.

Cette procédure d’ajout de ressource peut être recommencée autant de fois que nécessaire en fonction du nombre (bouton « Enregistrer et ajouter un autre »).
Par exemple :

  • un jeu de donnée sur les effectifs scolaires peut avoir comme ressources différenciées les données disponibles par années.
  • un jeu de donnée peut avoir comme ressources différenciées des formats de données différents.
    Une fois les enregistrements des ressources faits, cliquer sur le bouton « Terminer »

Informations additionnelles du jeu de données

  • Affecter à un ou plusieurs groupe(s) correspondant(s) à une thématique déjà prédéfinie.

Pour cela, aller sur la page du jeu de données et cliquer sur l’onglet « Groupes », sélectionner la valeur adéquate, puis sur le bouton « Ajouter à un groupe ».

  • Ajout de la visualisation (si nécessaire)

Le portail CKAN dispose d’un outil de visualisation des données. Celle-ci est générée automatiquement mais lorsque les données sont trop lourdes, l’aperçu peut prendre un certain temps à s’afficher.

Si vous constatez un temps de chargement trop important, il est nécessaire de remplacer la visualisation par défaut par une copie d’écran (image) de votre donnée.

L’accès à la datavisualisation se fait en éditant la ressource enregistrée dans le jeu de données. La configuration se fait ensuite dans l’onglet « Vues »

Attention ! Dans le cas ou votre jeu de donnée comporte trop d’éléments à afficher en data visualisation, il est alors recommander d’afficher une copie écran. Dans ce cas, la copie écran sera stockée dans un dossier appelé « images_dataviz » à la racine de votre jeu de donnée

"Quand on a déroulé la procédure une fois jusqu’au bout, la diffusion d'un jeu de donnée se fait de manière assez simple au fond !"
Pierre MARTIN
Responsable SIG