Lignes directrices pour la publication de données ouvertes au Luxembourg

Les lignes directrices suivantes pour la publication de jeux de données en tant que données ouvertes sur ce portail sont adaptées à partir de textes provenant du Open Data Handbook, proposé par l'Open Knowledge Foundation.

Qu'est-ce que les données ouvertes ?

La Open Definition définit les données ouvertes comme des données qui peuvent être librement utilisées, réutilisées et redistribuées par quiconque - sous réserve, tout au plus, de l'obligation de les attribuer et de les partager de la même manière. Les aspects importants sont :

  • Disponibilité et accès : les données doivent être disponibles dans leur ensemble et au maximum à un coût de reproduction raisonnable, de préférence sous forme de téléchargements sur Internet. Les données doivent également être disponibles sous une forme pratique et modifiable.
  • Réutilisation et redistribution : les données doivent être fournies dans des conditions qui permettent la réutilisation et la redistribution, y compris la combinaison avec d'autres ensembles de données.
  • Participation universelle : tout le monde doit pouvoir utiliser, réutiliser et redistribuer - il ne doit pas y avoir de discrimination entre les domaines d'activité, les personnes ou les groupes. Par exemple, les restrictions qui empêcheraient l'utilisation commerciale ou certaines fins (par exemple, uniquement dans l'enseignement) ne sont pas autorisées.

L'objectif principal de cette ouverture des ensembles de données est leur interopérabilité, c'est-à-dire la possibilité de les combiner avec d'autres ensembles de données. La combinaison de différents ensembles de données permet de créer des produits et des services plus nombreux et de meilleure qualité.

Quelles sont les données qui peuvent être ouvertes ?

Les données qui ne sont pas soumises à des restrictions légales de publication, comme par exemple dans le cas de données personnelles, de propriété intellectuelle, d'aspects liés à la sécurité nationale, peuvent principalement être prises en considération pour être mises à disposition en tant que données ouvertes. Dans le cas des organismes du secteur public, la publication des données est régie par la Loi du 29 novembre 2021 sur les données ouvertes et la réutilisation des informations du secteur public. L'accent est mis sur les données non personnelles, qui ne contiennent pas d'informations sur des personnes spécifiques.

Quelle stratégie adopter pour l'ouverture des données ?

Trois principes généraux sont recommandés pour l'ouverture des données :

  • Restez simple. Commencez petit, simple et rapide. Il est préférable de commencer rapidement en ouvrant un premier ensemble de données et d'en ajouter continuellement par la suite, car on peut ainsi créer une dynamique et tirer des enseignements de l'expérience.
  • Impliquez-vous dans la relation avec les usagers, qu'il s'agisse de citoyens, d'entreprises ou de développeurs, aussi souvent que possible. Cela permettra de garantir que la prochaine itération du service sera aussi pertinente que possible. Il est essentiel de garder à l'esprit qu'une grande partie des données n'atteindront pas directement les utilisateurs finaux, mais plutôt par l'intermédiaire de personnes qui utilisent les données et les transforment ou les remixent pour les présenter à d'autres.
  • Gérez les nombreuses questions et craintes suscitées par l'ouverture des données. Il est important d'identifier les plus importantes et de les aborder le plus tôt possible. Sachez que l'utilité potentielle d'un jeu de données ne se révélera que lorsque les données sont disponibles.

Comment procéder à l'ouverture des données ?

L'ouverture des données se fait en quatre étapes principales :

Choisir le(s) jeu(x) de données

Bien qu'il ne s'agisse pas d'une obligation légale, il est utile de dresser une liste de vos jeux de données. Les organismes du secteur public doivent garder à l'esprit que la directive PSI et la Loi du 29 novembre 2021 sur les données ouvertes et la réutilisation des informations du secteur public les obligent à ouvrir leurs données.

Appliquer une licence ouverte (ouverture juridique)

Les données ouvertes doivent être accompagnées d'une licence, ce qui est important pour des raisons de clarté juridique. Il est important de déterminer quels droits de propriété intellectuelle existent dans les données et d'appliquer une licence ouverte appropriée qui concède tous ces droits et soutient la définition de l'ouverture discutée dans ces lignes directrices.

Pour le Luxembourg, l'application de la famille de licences Creative Commons est fortement recommandée, avec une nette préférence pour la licence Creative Commons Zero CC0 : il s'agit de l'option "aucun droit d'auteur réservé" de la boîte à outils Creative Commons, qui signifie effectivement l'abandon de tous les droits d'auteur et droits similaires que vous détenez sur une œuvre et l'affectation de ces droits au domaine public.

Rendre les données disponibles (ouverture technique)

Les données ouvertes doivent être disponibles en masse dans un format lisible par machine.

Disponibles : Le prix des données ne doit pas dépasser un coût raisonnable de reproduction, de préférence sous forme de téléchargement gratuit sur Internet.

Téléchargement de masse : Les données doivent être disponibles sous la forme d'un ensemble complet. Une API web ou un service similaire peuvent également être très utiles, mais ils ne remplacent pas le téléchargement de masse.

Format ouvert, lisible par machine : La réutilisation des données ne doit pas être soumise à des restrictions en matière de brevets. Les formats lisibles par machine permettent une réutilisation simple. Par exemple, les fichiers PDF sont loin d'être idéaux, car il s'agit d'un format propriétaire visant à préserver la mise en page pour l'impression, ce qui rend très difficile l'extraction des données, des informations, du texte et des images à des fins d'analyse et de réutilisation.

Faire en sorte que les données puissent être découvertes

Il est essentiel, pour le principe des données ouvertes, de s'assurer que les utilisateurs potentiels peuvent trouver le matériel source. Il existe un certain nombre d'outils en direct sur le web pour publier des données et rendre le matériel découvrable, et certains sont spécialement conçus pour différents secteurs (par exemple, la science). Le gouvernement luxembourgeois a également créé un portail national de données ouvertes et un catalogue à l'adresse https://data.public.lu, où chacun peut publier ses ensembles de données et leurs réutilisations. Il est important de rendre les ensembles de données consultables en ajoutant autant de balises que possible et en fournissant de bonnes métadonnées en général.

Méthodes en ligne

Restez simple - allez vite - soyez pragmatique : mieux vaut donner des données brutes maintenant que des données parfaites dans six mois. Il existe de nombreuses manières différentes de mettre des données à la disposition d'autres personnes. La plus naturelle à l'ère de l'Internet est la publication en ligne. À la base, les acteurs du secteur public mettent leurs données à disposition via leurs sites web et le catalogue central (https://data.public.lu) dirige les visiteurs vers la source en ligne appropriée.

Via votre site web existant

Vous pouvez facilement fournir un accès aux fichiers de données via votre site web, mais en général, il peut devenir difficile pour une personne extérieure de découvrir où trouver des informations mises à jour, ce qui constitue une charge pour les personnes qui créent des outils avec vos données. C'est pourquoi vous devriez toujours ajouter vos données au portail national de données (voir ci-dessous), avec un lien vers les ressources sur votre site web.

Via le portail national des données

Assurez-vous de vous inscrire sur le portail national de données ouvertes du Luxembourg à l'adresse https://data.public.lu, où vous pouvez créer le compte de votre organisation et publier vos ensembles de données ou vos réutilisations. Cette plateforme offre l'infrastructure nécessaire, fournit des analyses et des informations sur l'utilisation, et met en commun une communauté locale de personnes intéressées ainsi que d'autres ensembles de données.

En tant qu'API

Les données peuvent être publiées via une interface de programmation d'applications (API). Ces interfaces permettent aux programmeurs de sélectionner des parties spécifiques des données, plutôt que de fournir toutes les données en vrac dans un grand fichier. Les API sont généralement connectées à une base de données qui est mise à jour en temps réel. Cela signifie que la mise à disposition des informations via une API permet de garantir leur mise à jour.

Téléchargement de masse

La publication de données brutes en téléchargement de masse devrait être la préoccupation principale de toutes les initiatives de données ouvertes, car la fourniture d'une API entraîne des coûts considérables. L'accès aux données en téléchargement de masse garantit ce qui suit :

  • Il n'y a aucune dépendance vis-à-vis du fournisseur initial des données, ce qui signifie qu'en cas de changement de situation, les données sont toujours disponibles.
  • Toute autre personne peut en obtenir une copie et la redistribuer. Cela réduit le coût de distribution de l'agence source et signifie qu'il n'y a pas de point de défaillance unique.
  • D'autres personnes peuvent développer leurs propres services en utilisant les données, car elles ont la certitude que les données ne leur seront pas retirées.

La fourniture de données en téléchargement de masse permet à d'autres d'utiliser les données au-delà de leur objectif initial. Par exemple, cela permet de les convertir dans un nouveau format, de les relier à d'autres ressources, ou de les versionner et de les archiver à plusieurs endroits. Si la dernière version des données peut être mise à disposition via une API, les données brutes doivent être mises à disposition en masse à intervalles réguliers.