SNT

Données Structurées - Enjeux


Données massives ou Big Data

On parle de Big Data pour les grands volumes de données collectées en temps réel. La quantité de données se mesure désormais en zetta-octets (1021 octets, ou mille milliards de gigaoctets) et même en yota-octets (1024 octets).

On parle d'infobésité pour désigner cette surabondace d'information.

En 2018 IBM a annoncé que 90% des données mondiales ont été créées au cours des deux dernières années. Chaque jour, 2,5 quintillions d’octets de données sont générés. C'est donc un enjeu économique majeur.


Source : Statista

Pour en savoir plus, vous pouvez visionner l'épisode 5 interactif de la série d'Arte Do Not Track

Enjeux économiques et sociétaux

L'exploitation du Big Data est en plein essor dans les domaines de la santé, des sciences, de l'économie...

Ces grands volumes de données deviennent un énorme enjeu économique (exploitation commerciale des données) et démocratique (surveillance de masse). Le RGPD (Règlement Général sur la Protection des Données) encadre le stockage de données personnelles pour que les usagers puissent contrôler au mieux les données qu'ils fournissent en échange de services.

Développement durable et Big Data

Cette abondance exponentielle de données sur le web est très énergivore.
Les machines et les réseaux engloutissent près de 10% de la consommation mondiale d’électricité, soit près de 4% de nos émissions de gaz à effet de serre, et ce chiffre est en constante augmentation : 5 à 7% tous les ans. La consommation globale des data centers double en moyenne tous les quatre ans.

Consommation électrique des data centers

Carte des data centers dans le monde : https://www.datacentermap.com/

Le streaming, très énergivore :


Exercice : Lire l'article suivant : https://lejournal.cnrs.fr/articles/numerique-le-grand-gachis-energetique et rédiger un résumé de quelques lignes en indiquant les principales causes de la consommation énergétique. (rédaction finale collaborative, en utilisant les outils numériques y compris les correcteurs d'orthographe et grammaire) - version pdf


Sciences des données vs infox

Arte propose une série de films d’animation conçue pour lutter contre les idées reçues et les fausses informations. Toute en datavisualisation, cette collection transforme les données en images animées, visuellement séduisantes et scientifiquement exactes.

Par ailleurs, même sans visualisation, il faut rester prudent avec des statistiques car elles peuvent être trompeuses si elles ne prennent pas en compte toutes les données et les corrélations. Dans la vidéo suivante, Mark Liddell mène l'enquète dans le paradoxe Simpson (un phénomène observé dans plusieurs groupes s'inverse lorsque les groupes sont combinés. Ce résultat qui semble impossible au premier abord est lié à des éléments qui ne sont pas pris en compte (comme la présence de variables non indépendantes ou de différences d'effectifs entre les groupes, etc.).

Pour réfléchir sur ce problème :

https://alain-michel.canoprof.fr/eleve/culture-numerique/2.Fake-news-et-manipulations-des-images-02/

http://mon-personal-mba.fr/mentir-avec-les-statistiques/

Fiches métiers

Data journaliste : https://www.studyrama.com/formations/fiches-metiers/journalisme/data-journaliste-105610

Développeur d’application : fiche métier Onisep
http://www.onisep.fr/Ressources/Univers-Metier/Metiers/developpeur-developpeuse-d-applications-mobiles

 Tous les métiers liées aux data :


Retourner en haut