Cliquez sur un nœud du graphe ou dans un élément de l'index pour ouvrir une fiche.
Base de données
Base de données : Une base de données est un ensemble volumineux de données, structuré de façon logique, stocké sur des supports numériques, conçu pour répondre aux besoins d'une ou plusieurs applications, interrogeable et modifiable par un ou plusieurs utilisateurs.
Ensemble de données organisé en vue de son utilisation par des programmes correspondant à des applications distinctes et de manière à faciliter l'évolution indépendante des données et des programmes [@EnrichissementVocabulaireInformatique1981]
Carnet de bord numérique (notebook)
Les calepins électroniqut désignés sous le terme de notebooks, sont des interfaces interactives qui combinent des sections de code à des sections en langage naturel pour documenter ce code et partager les données utilisées. Très répandus en science des données, ils ont transformé la manière dont les scientifiques partagent largement leurs approches en publiant leurs idées combinées à du code exécutable et ils ont aujourd’hui intégré le monde éducatif où plusieurs initiatives visent à la mise en place de notebooks pédagogiques adaptés aux élèves et aux étudiants.
Les notebooks éducatifs embarquent une activité pédagogique contenant des instructions textuelles guidant les étudiants à travers les différentes tâches à réaliser. Ensuite, l’enseignant cherche à reproduire les résultats des étudiants en suivant un ordre le plus souvent linéaire. (Casseau, n.d.)
Bibliographie
Cartographie de données
Technique qui consiste à représenter graphiquement des données numériques et leurs relations sur une carte de manière à en obtenir une visualisation compréhensible.
Historiquement, la cartographie est une discipline scientifique et technique exercée par des spécialistes formés pour cela. Les cartes topographiques ont ainsi connu un essor important au cours des XVIIe et XVIIIe siècles, à l’image des quatre générations de Cassini qui ont travaillé à l’amélioration du relevé topographique du territoire français, et en ont proposé en 1815 une carte exhaustive. Au XIXe siècle, les spécialistes de la cartographie relèvent essentiellement de l’Armée et des corps de géomètre. Les applications civiles en dehors du cadastre demeurent assez faibles. Elles concernent principalement les cartes administratives et les plans de ville. Les usages de la carte se diversifient tout au long du XXe siècle avec l’apparition des cartes routières et touristiques à l’attention des automobilistes et les représentations cartographiques en urbanisme qui relèvent d’une activité de mise en forme graphique de l’information plus que de levers de carte sur le terrain. [@joliveau2013]
La cartographie, auparavant associée à un savoir-faire propre aux représentations graphiques de portions de l’espace terrestre, se dissout désormais dans la visualisation – ce que ne perçoivent évidemment pas les utilisateurs de logiciels d’itinéraire en ligne, ces gros consommateurs de cartes numériques. (Guichard, n.d.)
Bibliographie
Culture des données
Ensemble de connaissances, de compétences et de pratiques liées à la fabrique, la collecte, l'analyse et/ou l'utilisation de données pour s’informer et agir au quotidien de façon critique et en comprenant les enjeux des données. Le terme est parfois considéré comme une traduction française de la notion de → "littératie des données".
C’est véritablement un ensemble de représentations, un univers de sens, une capacité à se projeter, un sentiment d’appartenance qui sont en jeu, et pas seulement la capacité à manipuler des outils informatiques. Cette culture se cristallise et se transforme autour des données, comme élément de base de l’information. (Lehmans, n.d.)
L’expression anglaise « data culture » a émergé dès les années 1960 avec le boom de l’industrie informatique. Tombée en désuétude dans les années 1980 et 1990, elle tend alors à être supplantée par celle d’« information culture ». L'expression a suscité nouvel intérêt dans les années 2010 en même temps que la croissance exponentielle du phénomène de « mise en données » (datafication) de la société, avec en corollaire l’émergence de nouveaux enjeux liés à la « littératie des données ». L’étude des cultures de données avoisine ces autres notions tout en s’en distinguant. (Casemajor, n.d.)]
« Assemblage de répertoires collectifs de représentation, d’action et de justification situé dans un contexte spécifique et caractérisé par une sensibilité, un univers de sens et une rationalité construits en relation avec des ensembles de données. » (Casemajor, n.d.)
Bibliographie
Cycle de vie de la donnée
Le cycle de vie d'une donnée représente toutes les étapes qu'une donnée traverse depuis sa création jusqu'à sa destruction, en passant par le stockage, la gestion, l’utilisation, le partage, l’archivage.
Le cycle de vie des données de recherche (Research data lifecycle) décrit le processus d'utilisation des données de leur création à la publication et à leur réutilisation ultérieure. Ce modèle définit les six étapes suivantes :
Création ou collecte des données (creating data) ;
Traitement des données (processing data) ;
Analyse des données (analysing data) ;
Conservation des données (preserving data) ;
Accès aux données (giving access to data / data discovery) ;
Réutilisation des données (reusing data). (Inist, inspiré de UK Data archive) [@Inist]
Démocratisation des données
La démocratisation des données est un processus qui consiste à utiliser des données pour en faire un bien commun.
La démocratie des données fait référence à la réflexion sur où, comment et avec qui les ingénieurs et autres participants d’une organisation génèrent, utilisent et traduisent les données pour le bien social. (Cutts et al., n.d.)
La démocratisation des données est un processus de transition d’une politique autoritaire à un régime représentatif (Kauffman, 2018).” (...) Dans une organisation, cela fait référence à “un paradigme selon lequel tous les salariés ont accès aux données” (...). “Ces consommateurs de données comprennent des experts en données traditionnels (par exemple, data scientist, gestionnaires de données ou architectes de données), mais aussi tous les employés (parfois appelés des citoyens des données), qui n’ont peut-être même jamais travaillé avec des données auparavant. (Labadie, Eurich, & Legner, n.d.)]
Bibliographie
Donnée (data)
Représentation d'un fait ou d'une caractéristique d'un objet, d'une personne, d'un lieu ou d'un événement. Elle peut être exprimée sous différentes formes, telles que des chiffres, du texte, des images, des sons ou des vidéos. En informatique, la donnée est une information présentée sous une forme traitable par une machine. En sciences de l’information et de la communication, la donnée représente l’unité de base qui permet de construire une information quand on y ajoute du sens.
Toute représentation d'une information sous une forme conventionnelle destinée à faciliter son traitement. [@EnrichissementVocabulaireInformatique1981]
Élément (fait, chiffre, etc.) qui est une information de base sur laquelle peuvent s'appuyer des décisions, des raisonnements, des recherches et qui est traité par l'humain avec ou sans l'aide de l'informatique. [@OfficeQuebecoisLangueFrancaise2024]
Une information-objet, considérée comme un élément informatif, un contenu formaté, qui peut être traité par une machine. [@Buckland1991]
Une donnée numérique est la description élémentaire, représentée sous forme codée, d’une réalité (chose, évènement, mesure, transaction, etc.) en vue d’être collectée, enregistrée, traitée, manipulée, transformée, conservée, archivée, échangée, diffusée, communiquée. (Open Data France)
La donnée peut être définie comme la plus petite représentation conventionnelle et fondamentale d’une information (fait, notion, objet, nom propre, chiffre, statistique, etc.) sous une forme analogique ou digitale permettant d’en effectuer le traitement manuel ou automatique (informatique). (Rousseau & Couture, n.d.)
Mot, nombre, signal, chaîne de caractères, séquence de bits, morceau de matière ou tout autre élément brut enregistré dans un système d’information où il pourra être corrélé à d’autres objets et interprété pour constituer une information. (Chabin, n.d.)
Bibliographie
Donnée d’entrée
Une donnée d'entrée est une information qui est fournie à un système, un programme ou un processus pour qu'il puisse effectuer un traitement. La qualité et la pertinence des données d'entrée déterminent en grande partie la qualité des résultats obtenus. Des données erronées, incomplètes ou mal formatées peuvent conduire à des résultats inexacts ou aberrants.
Dans le domaine de l’intelligence artificielle, une donnée d’entrée est une donnée utilisée pour l’apprentissage automatique ou la prise de décision du système d’IA (en phase de production). [@CNIL]
Données d’entraînement
Ensemble des →données]] fournies à un modèle d’intelligence artificielle pour qu’il apprenne et effectue des tâches spécifiques. Ces données sont utilisées lors de la phase d’apprentissage. [@CNIL]
Données de l’éducation
Les données d'éducation regroupent l'ensemble des informations numériques collectées et produites par et pour le système éducatif. Elles concernent aussi bien les élèves, les enseignants, les établissements scolaires et leurs activités.
Les données de l’éducation peuvent être définies comme les données liées à la vie scolaire (depuis l’administration jusqu’à la pédagogie) et concernant les acteurs de la communauté éducative. Elles sont produites, stockées et analysées pour des objectifs spécifiques, exploitées à des fins de suivi pédagogique des élèves, d’organisation et de pilotage du service public éducatif, d’élaboration de ressources pédagogiques ainsi que de statistiques d’évaluation et de recherches [@Atal2020]].
Elles concernent, en premier lieu, les élèves avec des données administratives et de scolarité (inscriptions, emplois du temps, absences, retards, redoublements, notes…) et leurs familles, par exemple avec les données sociales. Il s’agit également des données pédagogiques produites par les enseignants dans les activités d’enseignement (contenus et supports de cours, évaluations…). Il existe également des « données d’interactions » considérées comme fondamentales par le Comité d’éthique pour les données d’éducation : celles-ci sont produites dans les interactions entre les élèves et leurs enseignants à travers des documents ou sur les dispositifs numériques utilisés au cours de travaux collaboratifs entre les élèves, par exemple lors d’échanges sur l’évaluation d’un travail, ou encore dans les messages rédigés par un enseignant à destination d’une famille. (Lehmans & Capelle, n.d.)
Bibliographie
Données massives (Big data)
Grands ensembles des données liés à la numérisation des activités humaines, caractérisés par le grand volume, la vitesse de circulation et la variété, nécessitant des outils, techniques, méthodes visant à stocker, analyser, traiter, éditorialiser les données.
Les données du big data manquent d’une définition sérieuse. (...) Des chercheurs européens décèlent en arrière plan de ce terme, une alliance de Big Brother (datafication, dataisme, dataveillance) et de Big Business (measure, manipulate, monetize) : les citoyens consommateurs ont cédé une partie de leur intimité en échange de sécurité et de gratuité. Cette alliance est exploitée par des experts, dont on observe qu’ils passent sans difficulté du monde académique, de l’industrie et au renseignement. > L’accélération des processus de calcul et le déluge de nouvelles données que favorise la digitalisation progressive de toutes les traces de la vie quotidienne se déploient dans tous les domaines : prolifération des sources d’information, digitalisation du dossier médical et des informations personnelles, modèles probabilistes de l’assurance, développement des outils de data mining dans la relation client, capture et suivi des traces de mobilité, de communication ou de navigation. ( (Delort, n.d.)
L’accélération des processus de calcul et le déluge de nouvelles données que favorise la digitalisation progressive de toutes les traces de la vie quotidienne se déploient dans tous les domaines : prolifération des sources d’information, digitalisation du dossier médical et des informations personnelles, modèles probabilistes de l’assurance, développement des outils de data mining dans la relation client, capture et suivi des traces de mobilité, de communication ou de navigation. (Cardon, n.d.)
Bibliographie
Données ouvertes (Open Data)
Les données ouvertes sont des données numériques dont l'accès et l'utilisation sont libres, accessibles et utilisables, pour tous. Elles peuvent provenir de sources diverses, mais sont souvent produites par des organismes publics (gouvernements, collectivités, etc.). L’ouverture des données nécessite une action politique et une organisation des services chargés de leur collecte et de leur diffusion (gouvernance des données).
Données librement accessibles, mises à disposition dans un format ouvert et réutilisable par toute personne. [@CNIL2019]
Données collectées par des organismes publics ou privés chargés d’un service public, ou les citoyens, et mises à disposition en format numérique sur des plateformes nationales ou locales permettant leur accès et leur réutilisation. (Lehmans, n.d.)
Bibliographie
Données personnelles
Une donnée personnelle est toute information qui permet d'identifier directement ou indirectement une personne physique. La protection des données personnelles contre les risques liées à leur stockage et leur utilisation dans des bases de données informatiques faitl’objet d’une législation depuis la loi Informatique et libertés du 6 janvier 1978, qui a créé la Commission nationale de l’informatique et des libertés (CNIL).
Une « donnée personnelle » est « toute information se rapportant à une personne physique identifiée ou identifiable ». Une personne peut être identifiée directement (exemple : nom, prénom) ou indirectement (exemple : par un identifiant (n° client), un numéro (de téléphone), une donnée biométrique, plusieurs éléments spécifiques propres à son identité physique, physiologique, génétique, psychique, économique, culturelle ou sociale, mais aussi la voix ou l’image). [@CNIL]
Données publiques
Les données publiques désignent l'ensemble des informations collectées, produites ou conservées par les administrations publiques (État, collectivités territoriales, etc.) dans le cadre de leurs missions de service public.
Les données publiques concernent les informations poursuivant un objectif d’intérêt général. Autrement dit, celles produites par les collectivités territoriales, l’État ou toutes autres institutions publiques. . [@OpenDataSoft2024]
Données sensibles
Une donnée sensible est une donnée personnelle qui, par sa nature, révèle des informations particulièrement sensibles sur une personne. Ce sont des informations qui, si elles étaient divulguées, pourraient porter atteinte à la vie privée de la personne concernée ou lui causer un préjudice. Elles font l’objet d’une protection renforcée.
Les données sensibles forment une catégorie particulière des données personnelles. Ce sont des informations qui révèlent la prétendue origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques ou l'appartenance syndicale, ainsi que le traitement des données génétiques, des données biométriques aux fins d'identifier une personne physique de manière unique, des données concernant la santé ou des données concernant la vie sexuelle ou l'orientation sexuelle d'une personne physique. (CNIL, https://www.cnil.fr/fr/definition/donnee-sensible) [@CNIL]
Éducation aux données
L’éducation aux données correspond à une activité pédagogique visant la compréhension critique et éthique des données, qui ne se résume pas à l’enseignement de compétences techniques. Elle repose sur le constat qu’il est crucial de pouvoir identifier les leviers et les biais potentiels dans les usages des données, de comprendre les implications éthiques de leur utilisation et de prendre des décisions éclairées. Elle vise également à rendre les élèves capables d’utiliser voire de produire de façon autonome des données pour leur vie personnelle et professionnelle future.
L’enseignement traditionnel de la statistique s’est principalement concentré sur des problèmes décontextualisés et des preuves mathématiques, plutôt que sur le raisonnement réel avec les données comme le font les statisticiens. La plupart des ensembles de données utilisés dans ces cours de statistiques sont petits et « propres », souvent construits pour illustrer une notion en mathématique en particulier. L’émergence et la visibilité récentes de la science des données ont permis d’attirer l’attention sur des aspects du travail avec des données qui ont été pour la plupart ignorés dans les cours de statistique. De grandes quantités de données sont désormais accessibles au grand public, ce qui accroît la possibilité – et le besoin – pour les non-statisticiens de s'engager dans un raisonnement basé sur les données. (Rubin, n.d.);
Construction d’une culture de la donnée → à travers, d’une part la production de connaissances au moyen de la documentarisation des activités réalisées à partir de données, d’autre part, la compréhension des enjeux éthiques et politiques liés aux usages des données dans les représentations de ce qui est acceptable ou pas. (Lehmans & Liquète, n.d.)
Bibliographie
Enquêtes en sources ouvertes (OSINT)
L’OSINT est une méthode de collecte et d'analyse d'informations à partir de sources publiques et librement accessibles. Cette méthode est utilisée par les journalistes, mais aussi les professionnels de la cybersécurité informatique et des militants qui ont besoin de mener des enquêtes en dehors des sources d’information strictement officielles ou issues des médias traditionnels.
Ces enquêtes en sources ouvertes, également appelées OSINT pour « open source intelligence », sont désormais une composante visuelle et médiatique reconnaissable de notre quotidien. À partir d’une collecte d’informations disponibles librement sur Internet (parfois comparées à d’autres tirées d’une expérience « de terrain », sur place), ces éléments (photos et vidéos présentes sur les médias sociaux, cartographies numériques, documents administratifs, données gouvernementales, articles scientifiques, etc.) visent désormais à documenter un large éventail d’événements. (Deneuville & Rasmi, 2024)
Recueil d’informations à partir de sources ouvertes (...) L’OSINT constitue un nouveau régime de vérité qui repose sur l’étude des traces pour établir des preuves qui viennent étayer une logique démonstrative et explicative, notamment pour répondre à la désinformation. (Le Deuff, 2021) (Le Deuff, n.d.)
Bibliographie
FAIR
FAIR (Findable, Accessible, Interoperable, Reusable) désigne un ensemble de principes appliqués dans le domaine de la gestion des données scientifiques et de la science ouverte. La retrouvabilité, l’accessibilité, l’interopérabilité et la réutilisabilité à long terme sont des principes qui permettent de s’assurer de la possibilité d’utiliser les données scientifiques dans plusieurs contextes différents. Ces principes sont également largement utilisés dans le cadre des données ouvertes.
Les principes FAIR sont un ensemble de principes directeurs élaborés pour gérer les données de la recherche visant à les rendre faciles à trouver (Findable), accessibles (Accessible), interopérables (Interoperable) et réutilisables (Re-usable) par des opérateurs mais aussi par des machines. Ces bonnes pratiques en matière de gestion de données sont suffisamment générales pour être valables dans tous les domaines. (Quimbert, Fichaut, & Maudire, n.d.)
Bibliographie
Fouille de données (Data Mining)
La fouille de données, également dénommée exploration de données ou forage de données, est un ensemble de techniques qui visent à extraire des informations pertinentes à partir de grandes quantités de données.
Processus de recherche et d'analyse qui permet de trouver des corrélations cachées ou des informations nouvelles, ou encore, de dégager certaines tendances. (Office Québécois de la Langue Française, 2024)[@OfficeQuebecoisLangueFrancaise2024]
Gouvernance des données
La gouvernance des données est un ensemble de processus, de structures et de pratiques mis en place pour gérer efficacement les données, depuis leur collecte jusqu’à leur mise à disposition, en passant par le stockage et l’organisation. Elle s’appuie sur des règles d’organisation politique, administrative et technique des différents services de l’organisation en charge des données.
Dans le rapport remis par le Secrétariat général pour la modernisation de l’action publique en 2015, la gouvernance de la donnée désigne « l’ensemble de principes et de pratiques qui visent à assurer la meilleure exploitation du potentiel des données. (Lehmans, n.d.)
Exercice de l’autorité et du contrôle sur la gestion des données par l’institution d’un système de normes et de procédures (Plotkin, 2013). (Verdi, Pinède, & Melançon, n.d.)
Bibliographie
Infographie
Souvent utilisé de manière interchangeable avec le terme “datavisualisation”, une infographie désigne une modalité de communication graphique d'un message à l'aide de données ou d’informations alors que la datavisualisation se concentre sur la représentation précise des données.
Un objet de communication construisant un discours et rassemblant en ce but des graphiques, des diagrammes, des textes, des visuels iconiques ou photographiques. Le propos d’une infographie est de rendre intelligibles le plus immédiatement possible des données complexes aussi bien quantitatives que qualitatives en les recontextualisant… des visuels plurimodaux construits par un infographiste qui joue son rôle de transformateur et de passeur d’information. (Pérès, n.d.)
Bibliographie
Intelligence artificielle (IA)
L'intelligence artificielle est un domaine de l'informatique qui vise à créer des machines capables de simuler certaines fonctions de l'intelligence humaine. Ces machines sont conçues pour apprendre, raisonner, prendre des décisions et s'adapter à de nouvelles situations, en s'appuyant sur de vastes quantités de données et sur des algorithmes pour les traiter à l’aide de modèles.
L’intelligence artificielle repose sur l’utilisation d’algorithmes et l’exploitation de corpus de données massives avec l’application de règles d’apprentissage. Elle permet ainsi de réaliser, selon un certain rendement établi en fonction de degrés de précision attendus et du temps d’apprentissage, des traitements dits « intelligents ». (Raulin, n.d.)
Bibliographie
Interopérabilité des données
L'interopérabilité des données désigne la propriété de différents systèmes informatiques d’être susceptibles d'échanger des informations et des données de manière fluide et sans entrave. Elle repose sur des processus de standardisation des outils, des protocoles de communication et des règles sémantiques.
Différents systèmes logiciels numériques travaillant tous ensemble automatiquement sans qu'il soit nécessaire de recourir à un codage personnalisé ou à des processus manuels compliqués pour importer des données d’un système à l’autre.(Ben Henda, n.d.)
Bibliographie
Jeu de données
Un jeu de données est un ensemble organisé de valeurs, souvent présentées sous forme de tableau. Chaque colonne représente une variable (comme l'âge, le sexe, le revenu) et chaque ligne représente une observation (une personne, un produit, un événement). Les jeux de données sont mis à disposition et utilisés pour produire des informations à partir des données. Ils doivent être organisés pour être utilisables le plus efficacement possible.
Un jeu de données, ou dataset, regroupe plusieurs données ayant un lien cohérent entre elles. Il se présente sous forme de tableau permettant d’analyser chaque donnée qui le compose. Chaque donnée peut être composée de texte, de chiffres, de coordonnées géographiques ou encore d’éléments multimédia (par exemple une image ou une vidéo). [@OpenDataSoft]
Littératie des données
La littératie des données désigne la capacité à trouver, collecter, organiser, analyser, interpréter et communiquer des données de manière efficace et critique.
Capacité à comprendre les enjeux de la production, de l'organisation et de l’exploitation des données, et à les utiliser efficacement et de manière critique et créative. Elle fait partie des compétences nécessaires pour évaluer et utiliser l’information. (Schield, n.d.)
La littératie des données inclut la capacité à lire, travailler, analyser, et argumenter, avec les données dans le cadre d’un processus plus large d’enquête sur le monde. (D’Ignazio & Bhargava 2016 ; Letouzé et al. 2015, cité par D’ignazio, 2017).
Capacité d’accéder, d’interpréter, d’évaluer, de gérer, de manipuler et d’utiliser de manière critique et éthique les données (Calzada-Prado et Marzal, 2013) grâce à une connaissance des caractéristiques de la donnée, de son cycle de vie et des différents impacts engendrés par son usage, notamment en termes de sécurité et de protection de la vie privée (Crusoe, 2016). (Verdi, n.d.)
Bibliographie
Médiation des données
La médiation des données est un processus d'intervention permettant de mettre en relation les données avec leurs utilisateurs, visant à garantir que les données sont accessibles,compréhensibles et exploitables. Elle peut être humaine (par l’accompagnement de médiateurs par exemple), technique (par la mise à disposition d’outils facilitant les usages des données) ou documentaire (par l’organisation et l’indexation des données). Les médiateurs de données agissent comme des intermédiaires entre les données brutes et les personnes susceptibles de les utiliser. La médiation peut porter sur des méthodes, des outils (de visualisation, de traitement…) ou des documents.
Les médiations offrent un cadre qui permet à des publics de s’impliquer, d’accéder à des données, de les traiter. (Labelle, n.d.)
Bibliographie
Métadonnées
Données sur les données, les métadonnées sont des informations structurées et normalisées qui décrivent, expliquent, localisent ou facilitent l'exploitation et la gestion des ressources d'information. Elles fonctionnent comme des étiquettes (labels) qui donnent des indications sur le contexte de fichiers, photos, vidéos ou tout autre type de contenu numérique. On trouve trois types de métadonnées : descriptives (titre, auteur, sujet), administratives (format de fichier, droits d'accès), structurelles (concernant l’organisation de la base de données). En informatique, elles permettent de structurer le traitement des données dans les systèmes.
Les métadonnées déterminent le cadre d’usage et d’échange (d’un document numérique) à travers les communautés d'utilisateurs et les réseaux de spécialistes. (...) Elles permettent d’identifier et de décrire les diverses ressources numériques d'une manière lisible et compréhensible à la fois par les machines et les humains. ((Ben Henda, n.d.)
Bibliographie
Métiers de la donnée
Les métiers de la donnée regroupent un large ensemble de professions liées à toute la chaîne de traitement qui se base sur les données. Cela peut concerner la collecte, le nettoyage et l’enrichissement, l'analyse et la valorisation, mais aussi la mise en oeuvre des solutions expertes pour la prise de décisions et l’optimisation de processus ou encore la responsabilité éthique de leur utilisation.
Ce que semble souvent oublier le débat sur les nouvelles données numériques, c’est le travail de la donnée et le rôle qu’y jouent les travailleurs de la donnée, codeurs, statisticiens, modélisateurs, designers d’algorithmes et l’ensemble des métiers, dont ceux des sciences sociales, qui se donnent pour tâche d’en extraire de la signification. (Bastard, Cardon, Fouetillou, Prieur, & Raux, n.d.)
Bibliographie
Physicalisation des données
Approche qui consiste à représenter les données sous forme d'objets physiques tangibles plutôt que sur des écrans numériques.
Mise en scène de données matérialisées par des objets tangibles. (Catoir-Brisson, n.d.)
La physicalisation de données est un champ de recherche à la croisée de l’informatique tangible et de la visualisation d’information qui a pour but de faciliter l’exploration, la compréhension et la communication de données par le biais de leurs représentations physiques et numériques. (Jansen & Dragicevic, n.d.)
Bibliographie
Pilotage par les données (Data Driven Strategy)
Le pilotage par les données consiste à baser des décisions stratégiques sur l'analyse de données pertinentes. En d'autres termes, plutôt que de se fier uniquement à l'intuition, à l'expérience ou à l’intelligence humaines, les organisations utilisent des données quantifiables pour éclairer leurs choix et optimiser leurs performances.
Data driven strategy, soit pilotage par les données, c’est-à-dire que l’organisation et la finalité de l’activité sont redessinées à partir de la donnée, notion qui devient un descripteur universel des objets. (Pène, n.d.)
Bibliographie
Protection de la vie privée dès la conception (Privacy by Design)
Le concept de Privacy by Design, en français protection de la vie privée dès la conception, désigne une approche proactive de la protection des données personnelles. Il s'agit d'intégrer la protection de la vie privée dès les premières étapes de la conception d'un produit, d'un service ou d'un système.
Le Privacy by Design, pouvant se traduire en français par l’expression « la prise en compte de la vie privée dès la conception », est problématisé comme le principe techno-juridique selon lequel toute technologie exploitant les données personnelles doit intégrer la protection de la vie privée à partir des premières phases de sa conception, et s’y conformer tout au long de son cycle de vie (Musiani, n.d.)
Bibliographie
Règlement Général sur la Protection des Données (RGPD)
Le Règlement Général sur la Protection des Données entré en vigueur le 23 mai 2018 a pour objectif de renforcer la protection des données personnelles des citoyens européens et d'harmoniser les législations nationales en matière de protection des données à travers l'Union européenne. En France, les données personnelles font l’objet d’une protection spécifique depuis la loi Informatique et libertés du 6 janvier 1978. Le RGPD renforce cette protection et pose des principes qui doivent être respectés pour toute activité concernant des données personnelles : le principe de nécessité (la collecte de données doit être justifiée), le droit à l’information (sur la collecte elle-même et sur les droits de la personne), la mise à disposition de moyens d’exercer ses droits (demandes d’accès, consultation, opposition, rectification, suppression), la limitation de la durée de conservation, la sécurisation, la continuité de la démarche de protection. C’est la CNIL, en France, qui est chargée de la mise en oeuvre de ces principes, et les délégués à la protection des données (souvent appelés DPO, data protection officer) dans les organisations.
Le règlement général de protection des données (RGPD) est un texte réglementaire européen qui encadre le traitement des données de manière égalitaire sur tout le territoire de l’Union européenne (UE). Il est entré en application le 25 mai 2018.
Le RGPD s’inscrit dans la continuité de la loi française « Informatique et Libertés » de 1978, modifiée par la loi du 20 juin 2018 relative à la protection des données personnelles, établissant des règles sur la collecte et l’utilisation des données sur le territoire français. Il a été conçu autour de trois objectifs :
renforcer les droits des personnes
responsabiliser les acteurs traitant des données
crédibiliser la régulation grâce à une coopération renforcée entre les autorités de protection des données. [@MinistèreEconomieFinances2024]
Souveraineté des données
Principe qui stipule que les individus, les organisations et les Etats ont le droit de contrôler leurs données numériques. Cela signifie qu'ils ont le pouvoir de décider de la façon dont leurs données sont collectées, stockées, utilisées et partagées, qui a accès à leurs données, des espaces de stockage et de traitement, et des conditions d’utilisation et de transfert de leurs données. Ce principe est surtout politique et concerne le souci des Etats de conserver la maîtrise des données qu’ils produisent. La souveraineté peut aussi concerner le fait que l’État garde le contrôle des données qu’il produit sans en laisser la maîtrise au secteur privé.
La souveraineté numérique est souvent analysée de deux points de vue : le régalien, car les actions des plateformes numériques s’interprètent comme une remise en cause des prérogatives régaliennes ; l’économique car les plateformes, par nature, exploitent des externalités positives de réseau (les effets de réseaux) qui ont des conséquences économiques nombreuses sur les dynamiques concurrentielles (Cremer et al., 2019). (Isaac, n.d.)
Bibliographie
Traces numériques
Une trace est toute manifestation numérique qui atteste d'une activité, d'un événement ou d'une interaction. C'est un peu comme une empreinte digitale dans le monde numérique. Les traces numériques représentent des données, souvent personnelles, qui, traitées par les algorithmes des logiciels ou des plateformes, permettent de cibler les informations, mais aussi de surveiller les activités des personnes et de les influencer.
Les empreintes que nous laissons sur les réseaux sont au cœur de ce processus qui permet aux récepteurs – destinataires ou non – de réarticuler les contenus selon leur interprétation. Utiles et signifiantes sans être encore des documents, les traces dépendent des opérations d’extraction, d’annotation et de réagencement auxquelles elles sont soumises. (Merzeau, n.d.)
Bibliographie
Visualisation de données (Datavisualisation)
La visualisation de données est une modalité, le plus souvent automatisée, de représentation graphique des données visant à les rendre faciles à comprendre et à interpréter. Elle utilise des éléments tels que des graphiques, des diagrammes, des cartes, des tableaux et des infographies pour communiquer des informations de manière claire, concise et engageante. Elle est largement utilisée dans la presse pour permettre au public de visualiser les informations statistiques par exemple. Elle peut poser des problèmes quant aux choix graphiques et à la création de biais d’interprétation possibles.
La visualisation de données désigne tous types de représentations visuelles qui facilitent l’exploitation, l’analyse et la communication de données. Le design d’information et la visualisation scientifique en constituent des sous-ensembles. (Fredriksson, n.d.)
La datavisualisation sert à présenter rapidement les données et à les rendre lisibles. Elle permet d’analyser et de faciliter la compréhension des données en les retranscrivant efficacement sous forme visuelle. (Lagnel, n.d.)
Ensemble de procédures graphiques destinées à faciliter l’interprétation de jeux de « données » trop complexes ou trop massifs pour pouvoir être rapidement compris par le chercheur ; ces procédures sollicitent de nombreux algorithmes, même si la part humaine reste importante (paramétrages, recodages, choix ultimes). Elles s’inscrivent dans une logique de « preuve graphique » : la production d’un résultat visuel (d’une image organisée par l’enquêteur ou la structure des données, à l’inverse d’une peinture) afin d’infirmer ou de confirmer une hypothèse. (Guichard, n.d.)
Bibliographie
Aide
Cliquez ici pour accéder à la documentation de Cosma
Raccourcis
Espace | Réactiver l'algorithme de dessin du graphe |
S | Déplacer le curseur dans le champ Recherche |
Alt + clic | (sur un type de fiche) Désélectionner les autres types |
R | Réinitialiser le zoom |
Alt + R | Réinitialiser l'affichage |
C | Zoomer et centrer sur le nœud sélectionné |
F | Passer en mode Focus |
Echap | Fermer la fiche sélectionnée |
Glossaire de la formation et de l’éducation aux données
Version 2.5.4 • Licence GPL-3.0-or-later
- Arthur Perret
- Guillaume Brioudes
- Olivier Le Deuff
- Clément Borel
- Programme ANR HyperOtlet
- D3 v4.13.0
- Mike Bostock (BSD 3-Clause)
- Nunjucks v3.2.3
- James Long (BSD 2-Clause)
- Js-yaml v4.1.0
- Vitaly Puzrin (MIT License)
- Markdown-it v12.3.0
- Vitaly Puzrin, Alex Kocharin (MIT License)
- Citeproc v2.4.62
- Frank Bennett (CPAL, AGPL)
- Fuse-js v6.4.6
- Kiro Risk (Apache License 2.0)