On parle de Big Data pour les grands
volumes de données collectées en temps réel. La quantité de données se
mesure désormais en zetta-octets (1021 octets, ou mille
milliards de gigaoctets) et même en yota-octets (1024
octets).
On parle d'infobésité pour désigner cette surabondace d'information.
En 2018 IBM a annoncé que 90% des données mondiales ont été créées au cours des deux dernières années. Chaque jour, 2,5 quintillions d’octets de données sont générés. C'est donc un enjeu économique majeur.
Source : Statista
Pour en savoir plus, vous pouvez visionner l'épisode 5 interactif de la série d'Arte Do Not Track
L'exploitation du Big Data est en plein essor dans les domaines de la santé, des sciences, de l'économie...
Ces grands volumes de données deviennent un énorme enjeu économique (exploitation commerciale des données) et démocratique (surveillance de masse). Le RGPD (Règlement Général sur la Protection des Données) encadre le stockage de données personnelles pour que les usagers puissent contrôler au mieux les données qu'ils fournissent en échange de services.
Cette abondance exponentielle de données sur le web est très
énergivore.
Les machines et les réseaux engloutissent près de 10% de
la consommation mondiale d’électricité, soit près de
4% de nos émissions de gaz à effet de serre, et ce chiffre
est en constante augmentation : 5 à 7% tous les ans. La
consommation globale des data centers double en moyenne tous les
quatre ans.
Carte des data centers dans le monde : https://www.datacentermap.com/
Exercice : Lire l'article suivant : https://lejournal.cnrs.fr/articles/numerique-le-grand-gachis-energetique
et rédiger un résumé de quelques lignes en indiquant les principales
causes de la consommation énergétique. (rédaction finale collaborative,
en utilisant les outils numériques y compris les correcteurs
d'orthographe et grammaire) - version
pdf
Arte propose une série de films d’animation conçue pour lutter contre les idées reçues et les fausses informations. Toute en datavisualisation, cette collection transforme les données en images animées, visuellement séduisantes et scientifiquement exactes.
Par ailleurs, même sans visualisation, il faut rester prudent avec des statistiques car elles peuvent être trompeuses si elles ne prennent pas en compte toutes les données et les corrélations. Dans la vidéo suivante, Mark Liddell mène l'enquète dans le paradoxe Simpson (un phénomène observé dans plusieurs groupes s'inverse lorsque les groupes sont combinés. Ce résultat qui semble impossible au premier abord est lié à des éléments qui ne sont pas pris en compte (comme la présence de variables non indépendantes ou de différences d'effectifs entre les groupes, etc.).
Pour réfléchir sur ce problème :
https://alain-michel.canoprof.fr/eleve/culture-numerique/2.Fake-news-et-manipulations-des-images-02/
http://mon-personal-mba.fr/mentir-avec-les-statistiques/
Data journaliste : https://www.studyrama.com/formations/fiches-metiers/journalisme/data-journaliste-105610
Développeur d’application : fiche métier Onisep
http://www.onisep.fr/Ressources/Univers-Metier/Metiers/developpeur-developpeuse-d-applications-mobiles
Tous les métiers liées aux data :