Ce billet de blog a été rédigé par Julien Raemy, Data Scientist aux Archives fédérales suisses et chargé de cours à la HEG Genève. Il fait partie d’une série de billets consacrée à l’actualité de l’Open Data dans les sciences humaines et sociales en Suisse, produite à l’occasion du colloque infoclio.ch 2025 «Historiciser l’Open Science». La série présente divers projets récents, signale des ressources accessibles en ligne et propose des réflexions sur le sujet.
Introduction to Open Data
Transmettre les enjeux de l'ouverture des données
Depuis deux ans, j'enseigne le cours Introduction to Open Data à la Haute école de gestion de Genève, et chaque semestre me conforte dans l'idée que l'ouverture des données est cruciale pour les futurs professionnels en sciences de l'information. Le cours, dispensé simultanément en français et en anglais, s'inscrit dans le cursus bilingue du Bachelor Information Science.

Les métiers de l'information – archivistes, bibliothécaires, gestionnaires de données, documentalistes – sont au cœur des transformations numériques. Tous ces métiers requièrent une expertise pointue en matière de gestion et de valorisation des données. Ils et elles doivent être capables d'accompagner les chercheur·euse·s dans la gestion de leurs données de recherche (ORD), de comprendre les dynamiques des données gouvernementales (OGD), et de repenser les cycles traditionnels de traitement de l'information. L'Open Data nous invite à reconsidérer nos pratiques : comment collecter, conserver, mettre à disposition et valoriser les données dans un écosystème ouvert et interconnecté ?
Convaincu que l'enseignement de l'Open Data doit lui-même incarner les valeurs d'ouverture et de partage, j'ai choisi de publier le cours sur un site web en utilisant Quarto. Ce choix n'est pas anodin. Je m'inspire ici d'initiatives qui m'ont précédé et inspiré, comme le cours Introduction to Digital History donné à l'Université de Bâle par Ina Serif et Nicolas Chachereau, ou Decoding Inequality enseigné à l'Université de Berne par Rachel Huber et Moritz Mähr.
Objectifs et approche pédagogique
Le cours que je dispense poursuit trois objectifs fondamentaux :
- Comprendre les principes fondamentaux : Fournir aux étudiant·e·s de premier cycle en sciences de l'information une compréhension approfondie des principes de l'Open Data.
- Développer des compétences pratiques : Permettre aux étudiant·e·s de trouver, analyser et réutiliser efficacement des jeux de données ouverts.
- Maîtriser les processus : Apprendre les mécanismes de préparation et de publication de jeux de données ouvertes.
Le cours met l'accent sur des problématiques contemporaines et concrètes liées aux données. Les étudiant·e·s sont amenés à explorer des thématiques complexes comme la disparition de données gouvernementales, les pratiques de publication de données dans différentes institutions, ou les enjeux de transparence dans des domaines variés comme la santé, les transports ou l'énergie.
Les méthodes d'apprentissage sont variées et pratiques. Chaque étudiant·e réalise un projet individuel approfondi, choisissant un sujet parmi une liste de cas d'étude ou proposant sa propre problématique. Les travaux pratiques incluent l'utilisation d'outils comme OpenRefine pour le nettoyage de données, la création de tableaux de bord ou de visualisations (par exemple sur Visualize), et l'analyse critique des pratiques de publication et de réutilisation des données ouvertes.
Sections fondamentales du cours
Chaque section du cours dispose de sa propre page web, permettant un un accès facile aux contenus détaillés. Cette approche web-native reflète les principes d'ouverture et d'accessibilité.
La structure web du cours explore un large spectre de connaissances, des mouvements fondateurs comme Open Access, Open Science et Open Source, aux principes tels que FAIR, CARE Principles for Indigenous Data Governance, Collections as Data et Linked Open Usable Data (LOUD). Chaque page constitue un point d'entrée dans un écosystème de connaissances interconnectées, offrant aux étudiant·e·s la possibilité de naviguer librement entre théorie et pratique, contextualisation et application concrète des données ouvertes.

Les sections dédiées aux plateformes et organisations d'Open Data cartographient l'écosystème global, de portails gouvernementaux aux référentiels académiques. Les pages consacrées à l'évaluation et à la qualité des données développent des compétences critiques d'analyse, tandis que les sections techniques présentent une palette d'outils et de logiciels essentiels à la manipulation des données. Les études de cas finales illustrent concrètement les principes théoriques abordés tout au long du cours.
Conclusion : Un projet en constante évolution
L'enseignement de l'Open Data est par nature un processus dynamique et collaboratif. Ce cours n'est pas un produit fini, mais un écosystème de connaissances en perpétuelle transformation. Toute la communauté est invitée à contribuer à son amélioration. Le dépôt GitHub du cours est ouvert aux suggestions, corrections et enrichissements. Toute personne intéressée peut soumettre des issues ou des pull requests pour partager leurs perspectives, corriger des erreurs ou proposer de nouvelles ressources. Cette approche collaborative incarne pleinement les valeurs d'ouverture et de partage à défendre.
À terme, ce cours pourrait trouver sa place dans un dépôt institutionnel de la HES-SO, devenant ainsi une ressource pérenne et accessible pour les futures générations d'étudiant·e·s en sciences de l'information. L'objectif est de créer un outil qui évolue avec les pratiques et les technologies dans le domaine des données ouvertes.