L’essor des « big data » et l’ouverture des données peuvent-elle changer la manière de modéliser les comportements ?
question
reponse
Effectivement, depuis quelques années, ce phénomène a suscité beaucoup d’espoir. Les modèles se nourrissent de plus en plus fréquemment de données. La quantité de données disponibles, par le web notamment, a laissé croire que les données pourraient se substituer aux hypothèses comportementales. Il me semble que l’engouement s’estompe un peu pour plusieurs raisons. Tout d’abord, la qualité des données est pauvre, particulièrement celle des données des réseaux sociaux (Facebook, twitter, etc.). De plus, les données disponibles se révèlent insuffisantes pour comprendre les motivations des individus. Par exemple, sur les dynamiques d’opinions, il est difficile de faire coller les données avec ce qu’on voudrait mettre dans nos modèles concernant par exemple la révision des croyances et la mise à jour des opinions. Ensuite, il y a la question du couplage des données entre elles. Comment interagissent-elles ? Les données sectorielles, thématiques sur les transports, l’énergie sont disponibles mais leurs interactions restent largement méconnues. Les hypothèses de couplage sont donc souvent un peu sorties du chapeau… Ceci dit, si le big data s’avère peu probant pour les comportements individuels, il est très porteur pour les données environnementales et les comportements collectifs. Pouvoir intégrer des données réelles et des dynamiques sur les données, même sans en connaitre les processus, permet de simuler des phénomènes intéressants. Ainsi, un modèle peut simuler des pics de pollution de l’air, soit en simulant un processus soit en utilisant une série réelle, et observer comment la population réagit, comment elle adapte ses comportements de déplacement.