Accueil > Editoriaux / Opinion > Editorial, opinion, point de vue, déclaration, paix, pertinente, monde, (...) > commentaires, divers, diversité, pluralité, création d’idée, innovation (...) > La paranoïa de l’utilisation des données conteste la Data-Science

La paranoïa de l’utilisation des données conteste la Data-Science

Le combat du Data-journalisme pour la transparence économique et politique

lundi 9 mai 2016, par N.E. Tatem

L’étude des données, communément Data-science, professe le traitement des indications antérieures comme les statistiques, les dates, les faits ou bien les personnes. Internet a rendu cette science plus que jamais pertinente. Non seulement il y a plus de données, mais aussi les sources qui les fournissent se sont multipliées. Comme la technologie progresse et nos vies économiques, sociales et civiques deviennent de plus en plus numériques, nous sommes confrontés à des questions éthiques, ayant une grande conséquence sur notre destin.

Le Data-journalisme qui a aidé les rédacteurs de Populi-Scoop d’écrire certains de leurs sujets, a le vent en poupe. Notre dernier article qui a avec ce mode raconter des histoires exposant l’actualité, a exploité les données du Ministère de la Défense Nationale d’Algérie. Nous avons utilisé les communiqués relatant les actions antiterroristes du mois de mars et d’avril 2016. Nous les avons construites en graphique ci-après.

Les environnements utilisant les données sont en croissance exponentielle. Selon plusieurs études sur l’utilisation des données, la croissance annuelle jusqu’en 2020 sera de près de 50% par an dans les Data-Sciences qui ont 3 missions essentielles : trouver des données, les piler en les organisant et les utiliser comme indicateurs de divers secteurs. Ce qui ramène essentiellement à un traitement scientifique de l’information recueillie dans les activités humaines.

Plusieurs entreprises utilisent maintenant les données pour sonder les prospections économiques qui leurs sont proprement internes. Mais aussi en accédant à ceux des concurrents, elles manient ce qui lui montre les tendances, à partir d’acteurs proches.

C’est le déverrouillage des données, c’est-à-dire l’identification et l’opération de recueillir des gigaoctets ou téraoctets de texte non structuré, de la "curation" (ramassage ou raclage) d’Internet, qui est fastidieuse. Elle prend de la valeur en l’utilisant pour prendre des décisions d’affaires, également en trouvant les points communs pour la croissance.

Pour avoir une idée, le tableau ci-dessous donne la présentation des valeurs informatiques.

Ordre de
grandeur
Système international (SI)
Unité Notation Valeur
1 bit par seconde bit/s 1 bit/s
103 kilobit par seconde kbit/s 103 bit/s
106 mégabit par seconde Mbit/s 106 bit/s
109 gigabit par seconde Gbit/s 109 bit/s
1012 térabit par seconde Tbit/s 1012 bit/s
1015 pétabit par seconde Pbit/s 1015 bit/s
1018 exabit par seconde Ebit/s 1018 bit/s
1021 zettabit par seconde Zbit/s 1021 bit/s
1024 yottabit par seconde Ybit/s 1024 bit/s

Il est aussi vrai que l’incidence de l’exploitation des données, avec les nouvelles technologies de communication, provoque la polarisation sur des données individuelles de l’internaute. Ce qui est encore plus complexe, avec la variété des goûts, centres d’intérêts, recherches et actions d’achat des citoyens.

Nombreux programmes se déchirent pour avoir les données des visiteurs de leur plateforme, ce qui provoque toutes sortes de problèmes qui se différencie d’un acteur à un autre. La gestion de données va dans une fausse logique qui entravera à terme les performances du système actuel du Web.

Déjà que la complexité des données rend difficile de les structurer, mais avec aussi tant de données disponibles, l’effort qui se traduit en coût nécessaire pour les interroger et les stocker. C’est en temps et en nombre d’opérateurs que la charge de travail est appréciée, pour organiser des données.

La prise en charge d’une matrice de données décrivant des indications provenant de deux points de vue, est simple pour une comparaison auquel on peut rajouter des exemples rapprochés. Les données peuvent être simples, diversifiés, grandes (ou nombreuses) et aussi complexes. Ces quatre approches de données sont susceptibles de se rencontrer.

Chart of Inflation Rate in Algeria
PIB algérien : étude

Croissance du PIB, données exploitées de 1981 à 1999

PIB en milliards de dollars, des prévisions qui s’inspirent de l’évolution normale, sans l’incidence de la chute du prix du pétrole, de l’été 2014.

1999-12-31 48.85
1998-12-31 48.19
1997-12-31 46.94
1996-12-31 42.07
1995-12-31 42.43
1994-12-31 50.96
1993-12-31 49.22
1992-12-31 46.67
1991-12-31 61.89
1990-12-31 52.56
1989-12-31 51.66
1988-12-31 63.30
1987-12-31 61.54
1986-12-31 61.13
1985-12-31 51.51
1984-12-31 47.53
1983-12-31 44.78
1982-12-31 44.37
1981-12-31 42.35
31/12/2019 261,19
31/12/2018 253,51
31/12/2017 246,43
31/12/2016 235,78
31/12/2015 227,63
31/12/2014 219,45
2013-12-31 206,10
2012-12-31 204,29
2011-12-31 199,30
2010-12-31 161,21
2009-12-31 137,05
2008-12-31 171,00
2007-12-31 134,98
2006-12-31 117,03
1988-12-31 51.66
1987-12-31 63.30
1986-12-31 61.54

Pour nos lecteurs qui s’intéresse à l’Algérie : Participer à notre mini-sondage de moins d’une minute ICI - MERCI

Nous organisons des sondages, merci de vous inscrire à nos panels.

Created with Raphaël 2.1.2
232
2 000
4 000
6 000
Tunisie
Arabie Saoudite
Russie
Jordanie
Turquie
France
Maroc
900
Liban
760
Allemagne
760
Royaume-Uni
700
Indonesie
600
Egypte
470
Belgique
386
Tajikistan
330
Bosnie
300
Autriche
300
Chine
300
Kazakhstan
300
Suède
232
Kosovo
Dernier bilan : décembre 2015
Partager sur les réseaux :

Voir en ligne : Notre dossier : data-science Data données

     
Pas de licence spécifique (droits par défaut)

Un message, un commentaire ?

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

ConnexionS’inscriremot de passe oublié ?