(Rafraichissez la page pour une nouvelle citation)

vendredi 9 novembre 2012

Le MIT prédit l'avenir de Twitter, grâce à Twitter

http://www.mit.edu/~devavrat/
Deviner à l'avance quels seront les buzz, les sujets hype, les "trending topics" de Twitter, bref de quoi la planète web va causer dans quelques heures, c'est possible! C'est ce que pense et publie en tout cas un chercheur du MIT, Devavrat Shah. Il a mis au point un algorithme qui prédit avec une précision de 95% ce que seront ces fameux trending topics (ceux qu'on voit sur la page d'accueil de Twitter)... dans une heure et demie  et parfois même 4 ou 5 heures avant!
Cette liste sur la page d'accueil est convoitée par le monde entier parce que figurer sur cette liste c'est évidemment le jackpot en clics. Elle est établie en grand secret par le réseau social avec son propre algorithme dont on sait seulement qu'il prend en compte le nombre de tweets sur un sujet et leur récente augmentation sur ce sujet.
Nul doute que Twitter va se précipiter sur l'algorithme du prof du MIT car le réseau pourrait déclencher ainsi des  actions publicitaires ciblées. Mais, selon le MIT, il possède un potentiel beaucoup plus large et peut s'appliquer à l'analyse prédictive de toute quantité qui varie dans le temps: l'heure d'arrivée du prochain bus et pourquoi pas les cours boursiers! La seule limite est qu'il s'agisse de sujets sur lesquelles l'analyse historique possède un véritable intérêt.
Ce qui semble faire l'originalité et l'intérêt du travail de Devavrat Shah, c'est qu'il n'est pas construit comme d'habitude sur un modèle mais sur une analyse des données réelles. Ainsi son algorithme compare les changements dans le temps de chaque nouveau sujet avec les changements dans le temps d'une série de sujets enregistrés dans une base échantillon. On attribue alors plus de poids aux sujets de l'échantillon dont les statistiques ressemblent à celui du nouveau sujet , ce qui détermine si ce nouveau sujet va ou  non devenir un "trending topic".
Pour l'instant la base échantillon n'est constituée que de 200 sujets qui sont devenus des trending topics et 200 qui ne le sont pas devenus. Plus cette base va augmenter, plus la précision sera bonne. Devavrat Shah indique que si le volume des données étudiées augmente, son algorithme pourra être envoyé sur une grille d'ordinateurs pour répartir la charge de traitement.
source article MIT

Aucun commentaire:

Enregistrer un commentaire