La numérisation croissante de nos activités, la capacité sans cesse accrue à stocker des données numériques, l’accumulation d’informations en tous genres qui en découle, génère un nouveau secteur d’activité qui a pour objet l’analyse de ces grandes quantités de données. Sont alors apparues de nouvelles approches, de nouvelles méthodes, de nouveaux savoirs et in fine sans doute, de nouvelles manières de penser et de travailler. Ainsi, cette très grande quantité de données –ou big data– et son traitement –ou data mining– sous-tendent de profonds bouleversements, qui touchent à l’économie, au marketing, mais aussi à la recherche et aux savoirs. Les enjeux économiques, scientifiques et éthiques de ces données sont considérables. Le fait qu’on se situe dans un secteur en évolution constante, où les changements sont fréquents et rapides, ne rend pas l’analyse aisée… Cependant, un arrêt sur image, imparfait, nécessairement incomplet et pour partie périssable, s’avère sans doute nécessaire afin de mieux comprendre ce que sont le big data et le data mining. Pour tenter d’y voir un peu plus clair, ce dossier thématique se propose de donner un éclairage à ce phénomène.
Sommaire et ressources :
1– Qu’est-ce que le data mining ? On compile dans cette première section les articles généralistes, qui donnent des définitions, exposent les grands enjeux, synthéisent les questions, etc. On y trouve donc des documents qui permettent d’entrer rapidement dans le sujet du big data et du data mining. | |
---|
| 1 – Exploration de données 2 – Les techniques de collecte automatisée 3 – Des données au savoir 4 – Vertigineux big data 5 – Données le vertige 6 – Les données, puissance du futur 7 – A qui servent les données ? 8 – Entretien avec Simon Chignard 9 – Les domaines du data mining |
2-Des données qui ont de la valeur Si les milieux de l’informatique sont les mieux à même de saisir les potentialités marchandes de l’accumulation et du traitement des données, il n’en va pas de même partout, où l’idée que les données ont de la valeur fait son chemin plus lentement qu’on aurait pu l’imaginer |
---|
| 1 – Big Data : donner de la valeur à vos données 2 – Open Data : le marché qui valait 40 milliards 3 – Entretien avec Nicolas Colin 4 – Quelles politiques publiques ? 5 – Comment générer une fiscalité numérique ? 6 – Comment protéger, traiter, valoriser les données ? 7 – Entretiens avec les chercheurs du Liris 8 – Big Data : de grandes quantités de données et des incertitudes |
3 – Le data mining et le marketing ciblé L’une des applications les plus marquantes du data mining réside sans doute dans le renouvellement du marketing, car le data mining permet de toucher très finement des consommateurs en établissant des profils précis et fiables de leurs goûts, de leurs modes d’achats, de leur niveau de vie, etc. De plus, plus n’est besoin de passer par un entretien, ou par du déclaratif : chacun des utilisateurs d’Internet laisse suffisamment de traces lorsqu’il surfe, tweete, publie sur Facebook, pour que son profilage soit possible, à son insu le plus souvent. |
---|
| 1 – Data mining et marketing 2 – Ciblage comportemental 3 – Retargeting ou reciblage publicitaire 4 – Le reciblage publicitaire selon Criteo 5 – Le data mining, l'arme secrète d'Obama pour gagner 6 – Obama expert en stratégie média innovantes 7 – La campagne numérique d'Obama 8 – Les statistiques supérieures aux sondages ? 9 – Nate Silver et les limites du Big Data 10 – Nate Silver, saint patron des "nerds"… 11 – Sites de rencontres et SHS… 12 – Les mathématiques de la beauté… |
4 – Le data mining outil de prévision Le data mining, c’est aussi un outil qui permet de démultiplier les propriétés liées au calcul de probabilité. En effet, parce qu’il permet de croiser un volume de données sans commune mesure avec celles habituellement utilisées par les probabilistes, mais surtout, parce qu’il permet d’appliquer ces calculs à de très nombreux domaines, le data mining apparaît aujourd’hui comme capable de faire des prévisions… De la prévision à la prédiction, il n’y a que quelques lettres de différence et aujourd’hui, les scientifiques n’hésitent pas à annoncer qu’ils seront bientôt capables de prévoir l’avenir… Si les deux termes semblent s’opposer –sciences versus prédiction– on doit néanmoins convenir qu’en certains domaines, les outils aujourd’hui en usage offrent des résultats très impressionnants. |
---|
| 1 – Prévoir en croisant des données 2 – Les archives du Times pour décrire l'avenir 3 – Prédire le futur en fouillant le web 4 – Analyser le web pour prévoir l'avenir 5 – Forêts Aléatoires et data mining 6 – Éviter la grippe grâce au Big Data 7 – La fiction rattrapée par le réel : Minority Report (2002) 8 – Un algorithme pour prévenir le crime 9 – Le logiciel qui prédit les délits 10 – Un logiciel pour prévoir les crimes 11 – Lutter contre la fraude aux allocations familiales 12 – Le datamining pour détecter la fraude à l’assurance 13 – Comment un téléphone peut prédire les déplacements |
5 – Data mining appliqué à la ville Le data mining est aussi mis à contribution pour améliorer la vie en ville, notamment sur les questions de déplacements. Mais cette gestion de données, compte tenu de la dimension publique, voit s’affronter des tendances contradictoires, notamment sur la question de leur ouverture (open data). Tout le problème étant finalement de définir ce qui peut être fait par des opérateurs privés et ce qui doit, notamment pour des raisons de service public, rester dans le giron public. |
---|
| 1 – Big Data : des villes plus intelligentes 2 – L'Institute for Data Science and Engineering se concentrera sur les villes intelligentes 3 – Comment les données reconfigurent la ville 4 – Se chauffer grâce à l'énergie des serveurs informatiques 5 – Villes intelligentes : les 70 villes européennes les mieux notées 6 – 33 villes décrochent la subvention du défi « Smarter cities » 7 – Toulouse analyse les sentiments des citoyens pour évaluer leurs préoccupations 8 – Des puces sur les murs : réalités et fictions 9 – Mobilité durable optimisée à Lyon 10 – La donnée, facteur d’évolution des services 11 – Mobilité et données publiques, entretien avec Jean Coldefy |
6-Recherche et formation sur le Pres Université de Lyon On présente ici un rapide repérage des principaux lieux de recherche et de formation sur le PRES Lyon Saint-Étienne dédiés au data mining. On a aussi mentionné dans cette section des colloques organisés sur cette aire géographique car ils informent sur l’actualité de la recherche. |
---|
| 1 – Laboratoire ERIC Lyon 2 – Introduction au data mining / Laboratoire Eric 3 – Présentation du LIRIS 4 – Laboratoire Hubert Curien, université de Saint-Étienne 5 – Master extraction des connaissances Lyon 2 6 – Master Data Mining & Knowledge Management (DMKM) 7 – Master en Machine Learning and Data Mining à l'UJM 8 – Plateforme universitaire d'enquête en data SHS 9 – Colloque défis de la gestion des grands volumes de données : 10 – Le Big Data, une matière en pointe dans les écoles de commerce américaines 11 – Big Data : les filières évoluent vers la double compétence : |
7 – Les enjeux stratégiques du big data Les enjeux de cette croissance exponentielle des données sont très vastes et touchent d’une manière ou d’une autre les individus comme les grandes entreprises et les États… Aussi afin de restreindre la focale, nous avons sélectionné des informations qui portent essentiellement sur la manière d’orienter, de travailler sur les données, comment on les conserve, comment on les partage… |
---|
| 1 – Les données peuvent-elles profiter à tous ? 2 – Les métiers de l'informatique en mutation 3 – Quelles orientations pour la recherche en data mining 4 – Travailler sur la durée 5 – Sortir de la tyrannie du présent 6 – Favoriser des recherches sur des périodes longues 7 – Comment protéger, traiter, valoriser les données ? 8 – Développer une philanthropie des données 9 – La philanthropie des données est bonne pour les affaires 10 – Partager les données pour améliorer leur utilisation |
8 – Enjeux épistémologiques et débats Si le big data et le data mining suscitent un enthousiasme certain, ces nouveaux outils font l’objet de mises en garde, d’alertes méthodologiques, voire de critiques parfois virulentes… Ces critiques portent sur les méthodes, sur la croyance générée par la présence de données que l’on envisage spontanément comme fiables, sur le risque de biais méthodologiques, etc. |
---|
| 1 – Big Data : la nécessité d’un débat 2 – L'explosion des données : chance ou malheur pour la connaissance ? 3 – Big data et risques d'erreurs 4 – Biais et algorithmes 5 – La pertinence des algorithmes 6 – Les algorithmes façonnent-ils le monde ? 7 – La "grande illusion" du big data 8 – Les confessions d'un blasphémateur : et si le big data ne fonctionnait pas ? |
9 – Fouille d’image et d’autres données Le data mining est maintenant en train de se développer non plus seulement vers les données chiffrées, mais aussi vers les images, les sons, etc. |
| 1 – Data-visualisation, machine learning… 2 – Les fondements de l'apprentissage automatique 3 – Initiation à l'apprentissage automatique 4 – Les outils de data visualisation 5 – Rendre visuelles des données brutes 6 – Livre blanc sur la data visualisation, le retour de 30 entreprises |