Ce billet de blog a été rédigé par Christina Grisot, coordinatrice scientifique des réseaux DARIAH-CH et CLARIN-CH. Il fait partie d’une série consacrée à l’actualité de l’Open Data dans les sciences humaines et sociales en Suisse, produite à l’occasion du colloque infoclio.ch 2025 «Historiciser l’Open Science». La série présente divers projets récents, signale des ressources accessibles en ligne et propose des réflexions sur le sujet.
Une journée d’étude sur la gestion des données en sciences humaines
Ces dernières années, les principes directeurs FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables) pour la gestion et l’intendance des données scientifiques (Wilkinson et al., 2016) sont devenus des mots-clés dans les arts et les humanités. Selon ces principes, une attention particulière est portée aux données et aux métadonnées, qui doivent être:
- faciles à trouver, aussi bien pour les humains que pour les machines
- stockées à long terme de manière à être facilement accessibles et utilisables par des humains et des machines, en utilisant des protocoles de communication standard
- prêtes à être échangées, interprétées et combinées de manière (semi-)automatique avec d’autres ensembles de données, par des humains et des machines
- suffisamment bien décrites pour permettre leur réutilisation dans des recherches futures, et leur intégration avec d’autres sources de données compatibles (voir l'explication des principes FAIR du FNS).
Parallèlement, en 2019, la Global Indigenous Data Alliance a publié les principes CARE (Bénéfice collectif, Autorité de contrôle, Responsabilité, Éthique) pour la gouvernance des données autochtones. Les principes CARE expliquent que l’utilisation des données autochtones doit aboutir à des bénéfices tangibles pour les communautés autochtones, à travers un développement et une innovation inclusifs, une amélioration de la gouvernance et de l'engagement citoyen, ainsi qu’une recherche d’équité (Carroll et al., 2021). Appliqués au contexte des données scientifiques, les principes CARE se réfèrent à une utilisation des données qui soit volontaire et orientée vers l’amélioration du bien-être des personnes. Une gestion des données conforme aux principes CARE est éthiquement et socialement responsable.
En 2024, Entre FAIR et CARE : défis et opportunités pour la gestion des données a été le sujet de la Journée d’étude DARIAH-CH, le rendez-vous annuel de la communauté scientifique des arts et humanités numériques en Suisse organisée autour du noeud suisse de l’infrastructure européenne Digital Research Infrastructure for the Arts and the Humanities DARIAH. L’événement a été accueilli par la Haute école des arts et du design de Bâle FHNW, membre du consortium DARIAH-CH, sous la responsabilité scientifique de Linda Ludwig.
La journée d’étude a mis en lumière d’une part des contributions de la part des chercheurs et chercheuses avancé-e-s et expert-e-s dans le domaine de la gestion des données, et d’une autre part des contributions des jeunes chercheurs et chercheuses. Ci-dessous, vous trouverez un résumé des discussions. Pour plus d’informations, découvrez l’enregistrement de l’événement.
Défis des standards FAIR et CARE pour les sciences humaines
Table ronde au sujet de FAIR et CARE, introduite et modérée par Linda Ludwig (FHNW), avec la participation de: Iolanda Pensa (SUPSI), Moritz Mähr (UNIBE, UNIBAS) et Lucie Kolb (FHNW). La discussion des principes FAIR a souligné la difficulté de définir le terme « données » dans les sciences humaines, où « source » ou « matériau » peuvent être plus adaptés. L’adoption des principes FAIR reste limitée, notamment à cause d’un manque de reconnaissance institutionnelle pour la gestion et la publication des données. Enfin, il a été rappelé que les métadonnées peuvent assurer l’ouverture et la réutilisabilité même lorsque les données elles-mêmes ne sont pas accessibles. Quant aux principes CARE, ils doivent être compris dans leur contexte d’origine et adaptés aux réalités sociales actuelles, car ils soulèvent des questions fondamentales de pouvoir, de propriété et d’éthique. Par exemple, la création de métadonnées est un acte politique : fournir des informations peut avoir un impact sur les personnes concernées, notamment si elles sont en position de vulnérabilité ou de sensibilité. Pour finir, la gestion des métadonnées n’est pas neutre: elle peut renforcer ou protéger les personnes, selon la manière dont l’information est partagée. La gestion des versions de données ou la technologie blockchain1 permet de trouver un équilibre entre une transparence totale sur le processus de création des métadonnées et le respect de la confidentialité.
Des courtes présentations par les chercheurs et chercheuses au sujet des défis et des opportunités quant à la gestion de leurs données ont démontré un fort accord entre les observations des expert-e-s lors de la Table Ronde et la réalité du terrain. Premièrement, l'application des principes FAIR est perçue comme étant plus facile d'un point de vue technique (par exemple, les archives audio et/ou vidéo) que l'application des principes CARE (par exemple, les matériaux idéologiquement problématiques, le matériel pornographique, la révélation de contenus cachés, l'éthique et l'idéologie). Deuxièmement, la cohabitation des objets historiques (machines comme les cylindres de cire et les phonographes, archives stéréoscopiques) avec la création, la gestion et l'analyse des versions numériques (2D ou 3D) (réalité virtuelle, reconstruction 3D, recoloration) est un défi. Pour finir, l'importance d'avoir des infrastructures solides et durables est essentielle pour améliorer de façon significative la réutilisabilité des données, notamment après la fin des projets de recherche.
La gouvernance des données en sciences humaines: un cadre institutionnel et juridique encore fragile
Trois projets financés par le programme Science Ouverte I de swissuniversities ont été présentés dans le cadre d’une discussion autour de la gouvernance des données de recherche (“data stewardship”).2 Les présentations ont montré que la mise en œuvre des trois projets de data stewardship s’est averée très complexe en raison du cadre juridique, du manque de pression sur les acteurs clés pour opérer le changement, du manque de compétences et de la sensibilisation à la gestion des ORD, ainsi que de la nécessité de trouver des solutions pour des ensembles de données spécifiques. Il est nécessaire de certifier la profession de data steward et d'intégrer les connaissances spécifiques aux disciplines dans la gestion des données, avec une approche ascendante (qui est lente et chronophage). La durabilité des programmes au-delà de la phase actuelle du projet est également un enjeu majeur.
Présentation du flux de travail de curation des données de DaSCH - le Swiss National Data and Service Center for the Humanities. Le flux de travail désigne l’ensemble des étapes mises en œuvre pour garantir que les données de recherche en sciences humaines soient structurées, documentées, accessibles et pérennes. La présentation a mis en lumière la complexité et le travail chronophage que représente la curation des données afin de rendre les données en sciences humaines conformes aux principes FAIR, ainsi que l'importance de la collaboration nécessaire entre les curateurs de données et les chercheurs. Pour plus d’informations, découvrez les supports de formation en accès libre disponibles sur la plateforme de services DaSCH.
Conclusion
En guise de conclusion, cette journée d’étude a démontré la nécessité d’avoir un équilibre entre les principes FAIR et CARE en ce qui concerne la collecte, le traitement et le partage des données des arts et des humanités conformément aux exigences de la science ouverte. La Journée d’étude DARIAH-CH a montré que la communauté scientifique des arts et humanités Suisse est une communauté active et vibrante, qui se sent pleinement concernée par les exigences d’une gestion de données responsable et durable3, et qui reconnaît les Principes directeurs de la Stratégie Open Research Data: le respect des principes FAIR, l’adoption d’une pratique de recherche qui inclut l’ouverture des données autant que possible (“aussi ouvert que possible, aussi protégé que nécessaire”) ainsi que des métadonnées, la reconnaissance de la valeur des données, le respect de la diversité des disciplines, et l’interopérabilité avec les écosystèmes nationaux et internationaux. La communauté scientifique a donc un agenda bien rempli, mais elle peut compter sur le soutien du consortium DARIAH-CH et tous ses partenaires.
Bibliographie:
Wilkinson, M., Dumontier, M., Aalbersberg, I. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 3, 160018 (2016). https://doi.org/10.1038/sdata.2016.18
Carroll, S.R., Herczog, E., Hudson, M. et al. Operationalizing the CARE and FAIR Principles for Indigenous data futures. Sci Data 8, 108 (2021). https://doi.org/10.1038/s41597-021-00892-0
Chiara Somajni, Erzsébet Tóth-Czifra, Chiara Barbieri, Suzanna Marazza and Iolanda Pensa, "Open Science for Arts, Design and Music: Guidelines for Researchers, Librarians and Practitioners in the Humanities", SUPSI, 2024, CC0 1.0 except were otherwise stated. DOI: 10.5281/zenodo.13896780
Notes:
1 La technologie du blockchain est une technologie de stockage et de transmission d’informations, transparente, sécurisée et fonctionnant sans organe central de contrôle, qui repose sur un système décentralisé où les données sont réparties sur un réseau d’ordinateurs, assurant une transparence des opérations visibles par tous les participants. Chaque information enregistrée est sécurisée par cryptage et rendue immuable, car liée aux autres blocs de manière à empêcher toute modification sans validation collective.
2 “Le data stewardship comprend la gestion et le contrôle des stocks de données d’une organisation dans le but de permettre l’accès aux données de recherche. En tant que tel, il fait le lien entre les chercheuses et chercheurs ainsi que les unités de tels que l’informatique, les bibliothèques et les fournisseurs d’infrastructures.” (https://www.swissuniversities.ch/fr/themes/open-science/programme-open-…)
3 Voir également les “Open Science for Arts, Design and Music - Guidelines for Researchers, Librarians and Practitioners in the Humanities” développées dans le cadre du projet Open Science for Arts, Design and Music, sous la responsabilité scientifique de Iolanda Pensa (SUPSI).