Traçabilité

De Ethique Big Data.
Aller à : Navigation, rechercher

La notion de traçabilité couvre l'ensemble des aspects permettant de connaître le contenu d'une source de données, et de retracer le processus de fabrication, depuis sa création jusqu'à sa diffusion.


Sommaire

Origine des données

S’agit-il :

  • de données primaires (créées directement par le fournisseur),
  • de données consolidées de différents fournisseurs
  • de données construites à partir de données tierces (enrichissement) ?

Dans les deux derniers cas, fournir, pour chacune des sources :

  • la charte correspondante,
  • OU les coordonnées de l'organisation d'où viennent les données, ainsi que le contact permettant d’obtenir les informations afférentes,
  • OU la mention explicite et argumentée que la charte ne s’applique pas.

Auteurs, processus de recrutement

Dans le cas de données primaires provenant de contributeurs humains, préciser :

  • la typologie des contributeurs,
  • la nature des relations contractuelles avec le fournisseur,
  • le mode de rémunération.

Dans le cas d'utilisation de crowdsourcing, préciser :

  • les critères de sélection des travailleurs,
  • la ou les plateformes utilisées,
  • le mode et le montant de la rémunération.

Si les données contiennent des données liées aux contributeurs humains, préciser :

  • si un consentement a été demandé,
  • la nature de l'information fournie afin que le consentement soit éclairé,
  • si une trace matérielle existe de ce consentement.

Processus de fabrication ou de transformation des données

Si les données dont l'origine a été spécifiée dans la section Origine des données ont subi une quelconque transformation, veuillez décrire :

  • Les processus de transformation.
    • pour les processus d'enrichissement de données, décrire la nature de l'enrichissement.
  • Préciser pour chaque processus, s'il s'agit d'un travail manuel, automatique ou semi-automatique.
    • Dans le cas où un travail manuel est impliqué, décrire :
      • la typologie des intervenants,
      • la nature des relations contractuelles,
      • le mode de rémunération.
    • Dans le cas d'utilisation de crowdsourcing, préciser :
      • les critères de sélection des travailleurs,
      • la ou les plateformes utilisées,
      • le mode et le montant de la rémunération.
    • Dans le cas où un outil informatique est impliqué, décrire :
      • la nature et la fonction de l'outil,
      • la nature de la propriété intellectuelle et la nature de la licence attachées à cet outil.
    • Dans le cas où les données contiennent des informations personnelles, préciser :
      • les moyens permettant de s'assurer que la transformation est compatible avec le consentement décrit dans la section Auteurs, processus de recrutement,
      • si une anonymisation a été effectuée, et la manière dont elle a été faite.

Processus de validation des données

Préciser si un processus de validation des données a été appliqué.

  • Dans la négative, dire pourquoi un tel processus n'a pas été nécessaire.
  • Dans l'affirmative, décrire le processus de validation, et en particulier :
    • le pourcentage des données validées,
    • le mode de sélection des données validées,
    • si la validation a été faite en interne ou en externe,
      • si la validation a été externe, la nature de l'organisme de validation.
    • si la validation a été faite à l'aide d'outils automatiques, ou a nécessité une intervention humaine,
      • décrire la nature des outils,
      • préciser le profil des validateurs.
    • décrire la méthode de validation, et en particulier :
      • les critères de validation,
      • si ces critères impliquent l'utilisation de métriques, décrire ces métriques.
    • donner le résultat (qualitatif et quantitatif) de la validation,
    • s'il s'agit de données évolutives, indiquer :
      • si la validation est identique sur les données archivées, et les données nouvelles,
      • la fréquence de validation.
Outils personnels
Espaces de noms

Variantes
Actions
Navigation
La Charte
Actus
Boîte à outils