S’appuyant sur de solides bases scientifiques en ingénierie et en STS (science, technologie et société), Lauriane Gorce (M. Sc.) contribue à des innovations — ce qui est nouveau — qui apportent un véritable progrès aux êtres humains et à notre planète — ce qui est mieux. Elle a travaillé en Europe, en Asie et en Amérique du Nord, couvrant différents aspects des innovations : traitement d’image et physique appliquée, politiques publiques d’innovation et développement durable, économie circulaire et infrastructure publiques, stratégie d’affaire et jeunes pousses technologiques, interculturalisme et gestion du risque industriel. Elle se penche actuellement sur des enjeux de gouvernance des données et d’intelligence artificielle à Nord Ouvert, un organisme à but non lucratif qui œuvre pour des données et technologies au service de communautés transparentes, responsables et inclusives. Par le biais de l’histoire fictive d’Hélène, Lauriane nous plonge dans son approche de la gouvernance des données. Elle fut développée en collaboration avec ses collègues à Nord Ouvert au cours de plusieurs projets. Toute ressemblance avec des personnes ou des organisations réelles est le fruit du hasard.
Ce matin ressemble à tous les autres pour Hélène, cheffe de sa division à Villes intelligentes Inc. depuis des années. Un café et quelques étirements plus tard, elle commence sa journée de télétravail. 10 a.m.: rencontre avec la directrice générale qui souhaite lui confier une nouvelle position exigée par le conseil d’administration, sûre qu’Hélène pourra se former rapidement et relever le défi. Elle accepte, fébrile. Elle est promue responsable de la gouvernance des données.
Sa première mission consiste à élaborer un plan d’action. Hélène est à la fois enthousiaste et terrifiée. Par le passé, elle a déjà touché à des données à travers des tableurs et des logiciels d’intelligence d’affaires, appuyée par des collègues plus techniques. De plus, elle a déjà gouverné : c’est une cheffe de division appréciée. Cependant, elle ne sait pas à quoi ressemble une bonne gouvernance des données pour des projets de ville intelligente.
Commencent alors les recherches. Hélène découvre qu’en informatique, une donnée numérique est une « représentation conventionnelle d’une information en vue de son traitement informatique 1 ».
Elle comprend que la combinaison de la prolifération des capteurs qui nous entourent, des coûts faibles du stockage des données et de calculs, explique le volume et la variété immense des données créées. Côté variété, on peut la décrire de plusieurs façons. Selon le sujet qu’elles couvrent, leur nature quantitative ou qualitative, le format de fichier dans lequel elles sont stockées (texte, son, vidéo, etc.), si elles sont structurées ou non (saviez-vous que 80–90 % des données générées aujourd’hui seraient non structurées ? 2)… Et on peut de plus les distinguer selon la fonction qu’elles remplissent dans les jeux de données (maître, référence, métadonnée ou transactionnelle 3), leur degré d’ouverture (fermé, partagé ou ouvert 4), leur origine (fournies librement, observées, dérivées ou déduites 5) ou encore leur degré de sensibilité (p. ex., identifiables, pseudonymisées, pseudonymisées non liées, anonymisées ou agrégées 6).
Quant à la quantité, Hélène apprend que le volume de données créées, capturées, copiées et consommées chaque jour dans le monde, en 2020, est estimé à 61,2 Zo (zettaoctets) 7. C’était seulement 2 Zo en 2010 8 et les prédictions pour 2025 en annoncent 180 Zo 9 ! Voyons, si 1 Mo (mégaoctet) représente 1 cm, 1 Zo représente environ 10 puissance 13 mètres, soit 75 fois la distance moyenne entre la Terre et le Soleil, et 180 Zo s’approchent des distances qui séparent les étoiles de notre galaxie !
Quantité de données créées, capturées, copiées et consommées chaque jour dans le monde selon l’année (en zettaoctets). * l’année 2025 est une estimation. Sources : IDC & Statista (2020) cités par Christo Petrov (2021) et Jakes B. (2021).
Hélène découvre ensuite 35 thèmes et enjeux prioritaires dans la prolifique feuille de route du collectif canadien en matière de gouvernance des données 10. Une personne peut-elle être l’unique responsable d’une tâche aussi colossale que la gouvernance des données ?
Hélène prend une pause et décide d’appeler son ami Henri qui travaille dans la municipalité d’à côté : que sait-il, lui, sur la gouvernance des données ? Henri lui apprend qu’il a suivi certains cours en ligne de Nord Ouvert sur la ville intelligente ouverte 11, et qu’aujourd’hui, sa ville travaille sur un plan de gouvernance des données avec le soutien gratuit de leurs services de consultation 12. À cette occasion, il a compris comment cet organisme à but non lucratif approche ce concept énigmatique qu’est la gouvernance des données. Il se fera un plaisir de le lui expliquer !
Celles-ci sont l’expression ou la représentation de certains éléments d’observation, de calculs, d’expériences ou d’enregistrement du monde réel… 13. C’est pourquoi elles n’existent pas en dehors des systèmes qui les ont créées. Seules, les données sont inertes et n’ont de valeur que potentiellement. Ce sont uniquement les décisions concernant les données qui permettent de réaliser cette valeur. Des exemples : acquérir ou non les données ; choix techniques et technologiques de captation, de stockage, de traitement, d’analyse ; les utiliser, exclure certains types de réemploi ou les supprimer.
Ces décisions sont prises quotidiennement, souvent de manière implicite, par plusieurs parties prenantes qui accordent différentes valeurs aux données tandis que d’autres parties impactées sont structurellement sous-représentées dans la prise de décision.
Henri pique la curiosité d’Hélène : des parties prenantes structurellement sous-représentées ? Il lui apprend que les Premières Nations du Canada ont souhaité une stratégie coordonnée de la gouvernance des données pour incarner leur souveraineté, Nation par Nation 14. Autre exemple, la Fondation Mozilla a sélectionné 15 projets techniques guidés par des gens comme vous et moi, appelant une grande diversité d’horizons et de disciplines. Figurant dans la liste d’initiatives de la fondation, Black Communities — Data Cooperatives vise, dans leurs propres mots, à ce que les communautés noires aient plus de contrôle sur leurs données et leur utilisation dans l’intelligence artificielle 15.
La gouvernance des données englobe tous les facteurs qui influencent les décisions relatives aux données, avec ou sans approche structurée. Néanmoins, la valeur potentielle des données ne peut être atteinte que par une gouvernance cohérente des données.
Henri insiste : cette gouvernance n’est pas intrinsèquement bonne ou mauvaise. Différents groupes ou individus peuvent accorder une valeur différente à un même jeu de données en fonction de leurs principes, de leur vision du monde ou de leurs intérêts. Intriguée, Hélène s’amuse à trouver des exemples. Au quotidien, elle souhaite mieux protéger sa vie privée alors que ses données sont convoitées notamment pour l’inciter à adopter de nouveaux comportements par le biais de publicités. D’un autre côté, elle désire plus de transparence dans les décisions politiques locales. Henri lui apprend qu’une gouvernance éthique, imputable et transparente est une des caractéristiques principales de la ville intelligente ouverte 16. Enfin, son entreprise voudra obtenir des données pour s’informer sur des sujets choisis ou même en faire des sources de revenus.
Henri poursuit : ces valeurs recherchées influencent dès le départ la manière dont les données sont construites. Elles orientent quels éléments sont représentés comme des données (et lesquels ne le sont pas).
Hélène est prête. Elle saisit la complexité de la gouvernance des données.
Différentes couches d’analyse sont possibles : de l’individu à l’écosystème en passant par des organisations, seules ou en partenariat 17.
S’ajoutent des boussoles éthiques variées : les entreprises privées se cantonnent souvent à prioriser l’efficacité et les revenus financiers alors que toute organisation peut aussi prioriser ses valeurs, sa vision et sa mission.
Enfin, il existe une multitude de facteurs influençant les décisions. Par exemple, Nord Ouvert et le TIESS (Territoires innovants en économie sociale et solidaire) explorent le potentiel de la fiducie d’utilité sociale. C’est un instrument juridique québécois prometteur pour gouverner des données, car la fiducie définit une notion de contrôle sans la propriété de ces données. Elle permet aussi de placer un but précis (appelé « affectation ») au cœur de la gouvernance des données 18.
En résumé : différentes couches d’analyse, de boussoles éthiques et de facteurs influençant les décisions façonnent des interprétations très variées de la gouvernance des données. Pas étonnant qu’Hélène ait eu du mal à s’y retrouver !
Conséquence logique de cette diversité : il n’existe pas de solution clé en main. La gouvernance cohérente des données émerge au fur et à mesure des décisions qui la construisent, dans un contexte particulier. Pour cela, Villes intelligentes Inc. peut s’appuyer sur quatre éléments clés :
Quatre éléments clés de la gouvernance des données
Hélène sourit, reconnaissante des connaissances partagées par son ami Henri. Ce fut une bonne journée. Elle peut sereinement préparer son plan d’action.
Son organisation doit identifier les jeux de données qui y transitent, la spécificité de leur contexte de données et les exigences légales qui en découlent.
Pour chaque jeu de données, Villes intelligentes Inc. doit continuellement clarifier ses intérêts et ses objectifs (les valeurs recherchées dans les données). Elle doit comprendre quelles décisions impactent le jeu de données, qui les prend, comment et à quel moment du cycle de vie des données. Il est important d’identifier les parties prenantes touchées par ces décisions et de leur donner les moyens de s’impliquer dans le processus en accordant une attention particulière à celles qui sont systématiquement sous-représentées.
Complémentaire à cette cartographie des décisions, il faut assurer l’alignement des orientations stratégiques de l’organisation avec ses pratiques quotidiennes de gestion des données, les comportements individuels et le climat de travail. Le tout en permettant aux parties prenantes d’acquérir les capacités appropriées afin qu’elles puissent elles aussi, à leur échelle, devenir responsables de la gouvernance des données.
Enfin, des mécanismes doivent être déployés pour rendre visibles et imputables les décisions relatives aux données. Ceux-ci clarifient qui prend les décisions, de quelle façon elles sont prises, et de quelle manière ces personnes sont tenues responsables.
Le lendemain, Hélène retrouve Henri autour d’un café. Elle lui raconte sa prise de conscience : ils font tous les deux partie d’un tout plus grand qu’eux. Alors que les données circulent et ne sont souvent que de passage, toutes leurs décisions comptent. Un peu comme pour la crise climatique, chaque décision compte d’autant plus quand elles sont prises au nom d’organisations. Chacune et chacun peut commencer dès aujourd’hui, une décision à la fois.
À propos. L’intention de cet article est de lancer une discussion sur la gouvernance des données. Il est fait pour être partagé localement et discuté avec un regard critique. N’hésitez pas à contacter Lauriane pour lui faire part de vos impressions et retours. Lauriane Gorce travaille à Nord Ouvert* qui œuvre pour des données et technologies au service de communautés transparentes, responsables et inclusives. Nord Ouvert mise sur la recherche, le renforcement des capacités et la collaboration intersectorielle et en réseau afin de faire avancer l’utilisation responsable et efficace des données et des technologies. Elle participe activement à plusieurs projets comme soutenir la gouvernance des données de l’écosystème de Montréal en commun ainsi que l’exploration des fiducies d’utilité sociale pour la gouvernance des données.
* Nord Ouvert est une organisation à but non lucratif fondée à Montréal, en 2011. Réunissant des spécialistes de la donnée et des technologies, leur champ d’expertise couvre les villes intelligentes et ouvertes, la mutualisation et la valorisation des données, la gouvernance des données, des technologies et de l’intelligence artificielle. Animées/Animés par leurs valeurs, elles/ils collaborent avec des partenaires publics, privés, du milieu de la recherche et de la société civile à travers le monde pour favoriser l’exploitation des données et des technologies dans l’intérêt du public. Nord Ouvert est un partenaire clé du programme Montréal en commun (le Défi des villes intelligentes du Canada), où il est responsable de coconstruire et de déployer un cadre de gouvernance des données.
Tagué avec: