http://www.mit.edu/~devavrat/ |
Cette liste sur la page d'accueil est convoitée par le monde entier parce que figurer sur cette liste c'est évidemment le jackpot en clics. Elle est établie en grand secret par le réseau social avec son propre algorithme dont on sait seulement qu'il prend en compte le nombre de tweets sur un sujet et leur récente augmentation sur ce sujet.
Nul doute que Twitter va se précipiter sur l'algorithme du prof du MIT car le réseau pourrait déclencher ainsi des actions publicitaires ciblées. Mais, selon le MIT, il possède un potentiel beaucoup plus large et peut s'appliquer à l'analyse prédictive de toute quantité qui varie dans le temps: l'heure d'arrivée du prochain bus et pourquoi pas les cours boursiers! La seule limite est qu'il s'agisse de sujets sur lesquelles l'analyse historique possède un véritable intérêt.
Ce qui semble faire l'originalité et l'intérêt du travail de Devavrat Shah, c'est qu'il n'est pas construit comme d'habitude sur un modèle mais sur une analyse des données réelles. Ainsi son algorithme compare les changements dans le temps de chaque nouveau sujet avec les changements dans le temps d'une série de sujets enregistrés dans une base échantillon. On attribue alors plus de poids aux sujets de l'échantillon dont les statistiques ressemblent à celui du nouveau sujet , ce qui détermine si ce nouveau sujet va ou non devenir un "trending topic".
Pour l'instant la base échantillon n'est constituée que de 200 sujets qui sont devenus des trending topics et 200 qui ne le sont pas devenus. Plus cette base va augmenter, plus la précision sera bonne. Devavrat Shah indique que si le volume des données étudiées augmente, son algorithme pourra être envoyé sur une grille d'ordinateurs pour répartir la charge de traitement.
source article MIT
Commentaires
Enregistrer un commentaire