(Rafraichissez la page pour une nouvelle citation)

samedi 28 mars 2015

Mirages et frayeurs du Big Data, par l'exemple

Je lis un très bon article sur le Big Data dans... Paris Worldwide un des magazines d"Aéroports de Paris, signé Nicolas Kayser-Bril. Bravo Nicolas, bien documenté ! L'article cite notamment pas mal d'exemples qui montrent tout ce qu'on peut faire de bien et de mal avec le Big Data, essentiellement en croisant des données qu'on n'a pas l'habitude de rapprocher. Comment avoir l'intuition que le rapprochement de telles données peut donner lieu à des résultats étonnants, ça je ne sais pas !
Voici un résumé des exemples cités, que je vous donne sans les avoir sourcer, je sais c'est pas bien:
- un client du supermarché Target aux Etats-Unis téléphone furieux au directeur du magasin: "Ma fille est encore au lycée et vous envoyez des pubs pour berceaux. Vous voulez qu'elle tombe enceinte ou quoi?". Quelques jours après, le père apprend que sa fille est effectivement enceinte. Le supermarché avait dressé un profil type à partir de 25 produits que les femmes nouvellement enceintes avaient tendance à commander. Et si un nouveau suivi de comportement d'achats ressemblait à ce profil, on lui envoyait des pubs pour berceaux ou pour des crèmes contre les gerçures.
- Visa a remarqué que les couples qui payaient leurs factures de plus en plus en retard avaient tendance à divorcer plus que la moyenne.
- Pire, une autre société de carte de crédit prétend que ceux qui achètent les graines pour oiseaux les plus chères ont tendance à mieux payer leurs factures que les autres!...
- Vous aimez le whisky et on vous envoie des pubs d'alcools. Mais vous vous renseignez également souvent sur Google sur les maladies cardio-vasculaires. Alors ne vous étonnez pas si le coût de votre assurance-vie augmente ! Ce ne serait pas un scénario en l'air...
- Des chercheurs de l'Université de Cambridge, en GrandeBretagne, et de Stanford, aux Etats-Unis, prétendent avoir mis au point un algorithme capable de dresser un profil très précis d'un individu à partir de ses like sur Facebook. A partir de 10 like, il vous connait aussi bien que vos collègues de bureau. A partir de 500, il vous connait mieux que votre conjoint (e)...
- Google Translate, depuis 2000, s'améliore non pas par des linguistes mais par des comparaisons de textes déjà traduits comme les dépêches des agences de presse ou les publications de l'Union Européenne; les statisticiens travaillent sur ce big data et créent des liens entre textes sources et textes cibles. Du coup les progrès de Google Translate ont été fulgurants
- Idem pour les captcha: en récupérant les images des captcha et les résultats tapés par les internautes, Google (et d'autres) valide des séquences de mots et de chiffres de manière automatique et statistique qui lui serviront à améliorer ses programmes de reconnaissance de texte.
- Dans le domaine de la santé, avec IBM (Watson? je ne sais pas), dans le service de néonatalogie d'un hôpital de Toronto, on suit tous les indicateurs des nouveaux-nés prématurés et cela permet par exemple , en repérant une anomalie du rythme cardiaque, de détecter avant tout le monde la probabilité d'une infection.
- le projet HealthMap, développé par Harvard (Etats-Unis) balaye toute la journée et toute la nuit des milliers de sites d'actualité, de médias et de blogueurs influents et il prétend pouvoir déterminer , à partir d'une analyse croisée de ce contenu, les signes avant-coureurs d'une épidémie. Récemment il aurait prévu le virus Ebola 9 jours avant l'OMS!...

Aucun commentaire:

Enregistrer un commentaire