Définitions

De Ethique Big Data.
Aller à : Navigation, rechercher

Sommaire

Quelques définitions

Big data

Données difficiles à traiter, soit du fait de leur volume, de leur hétérogénéité ou de leur complexité, soit qu'elles nécessitent une mise à jour immédiate.

Wikipédia

"expression anglophone utilisée pour désigner des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données."[1]

AAP Cloud 2012

"Avec la croissance d’internet, de l’usage des réseaux sociaux, de la téléphonie mobile, des objets connectés et communicants, les informations sont aujourd'hui plus abondantes que jamais et la croissance de leur production est chaque jour plus rapide."

Implications technologiques : "La montée en puissance du « Big data » repose sur la maturité d’autres technologies, pour partie matérielles, comme le stockage physique, logicielles, comme les systèmes de gestion de base de données ou mêlant les deux, comme le cloud computing."

[2]

Décidéo

"données dont le volume, la vitesse de constitution, la variété (formats, sources), la variabilité (constance du sens dans le temps) rendent complexes voire impossible le traitement avec les techniques et capacités habituelles." [3] [4]

Point commun aux définitions : pas de seuils fournis

Crowdsourcing

Le Crowdsourcing ou myriadisation (Sagot 2011) : "[fait référence] au fait que le travail est délocalisé (outsourced) et est effectué par un grand nombre de personnes (crowd), payées ou non. "


Microworking

Le microworking, ou myriadisation du travail parcellisé (Sagot 2011) est une forme de crowdsourcing : "Microworking fait référence au fait que le travail est segmenté en petites tâches [...] "


Références

Benoît Sagot, Karën Fort, Gilles Adda, Joseph Mariani, Bernard Lang. Un turc mécanique pour les ressources linguistiques : critique de la myriadisation du travail parcellisé. Actes de Traitement Automatique des Langues Naturelles (TALN), Montpellier, France, 2011 [5]

Données primaires

Données directement produites par le fournisseur.

Données tierces

Données fournies par le fournisseur provenant d'une autre source que le fournisseur lui-même.

Données composées

Données provenant de sources différentes (par exemple, mélangeant données tierces et données primaires).

Fournisseur

Organisme ou individu qui fournit les données qu'il a lui-même produites ou qu'il distribue. Sauf mention contraire, le terme "fournisseur" désigne, dans le présent document, le signataire de la charte.

Utilisateur

Organisme ou individu qui obtient les données pour sa propre utilisation ou pour les redistribuer.

Contributeur

Organisme ou individu qui contribue à la fabrication des données, soit en les produisant lui-même, soit en les modifiant ou les enrichissant.

Outils personnels
Espaces de noms

Variantes
Actions
Navigation
La Charte
Actus
Boîte à outils