Accéder au contenu principal

Le MIT prédit l'avenir de Twitter, grâce à Twitter

http://www.mit.edu/~devavrat/
Deviner à l'avance quels seront les buzz, les sujets hype, les "trending topics" de Twitter, bref de quoi la planète web va causer dans quelques heures, c'est possible! C'est ce que pense et publie en tout cas un chercheur du MIT, Devavrat Shah. Il a mis au point un algorithme qui prédit avec une précision de 95% ce que seront ces fameux trending topics (ceux qu'on voit sur la page d'accueil de Twitter)... dans une heure et demie  et parfois même 4 ou 5 heures avant!
Cette liste sur la page d'accueil est convoitée par le monde entier parce que figurer sur cette liste c'est évidemment le jackpot en clics. Elle est établie en grand secret par le réseau social avec son propre algorithme dont on sait seulement qu'il prend en compte le nombre de tweets sur un sujet et leur récente augmentation sur ce sujet.
Nul doute que Twitter va se précipiter sur l'algorithme du prof du MIT car le réseau pourrait déclencher ainsi des  actions publicitaires ciblées. Mais, selon le MIT, il possède un potentiel beaucoup plus large et peut s'appliquer à l'analyse prédictive de toute quantité qui varie dans le temps: l'heure d'arrivée du prochain bus et pourquoi pas les cours boursiers! La seule limite est qu'il s'agisse de sujets sur lesquelles l'analyse historique possède un véritable intérêt.
Ce qui semble faire l'originalité et l'intérêt du travail de Devavrat Shah, c'est qu'il n'est pas construit comme d'habitude sur un modèle mais sur une analyse des données réelles. Ainsi son algorithme compare les changements dans le temps de chaque nouveau sujet avec les changements dans le temps d'une série de sujets enregistrés dans une base échantillon. On attribue alors plus de poids aux sujets de l'échantillon dont les statistiques ressemblent à celui du nouveau sujet , ce qui détermine si ce nouveau sujet va ou  non devenir un "trending topic".
Pour l'instant la base échantillon n'est constituée que de 200 sujets qui sont devenus des trending topics et 200 qui ne le sont pas devenus. Plus cette base va augmenter, plus la précision sera bonne. Devavrat Shah indique que si le volume des données étudiées augmente, son algorithme pourra être envoyé sur une grille d'ordinateurs pour répartir la charge de traitement.
source article MIT

Commentaires

Posts les plus consultés de ce blog

Concerné ou impliqué? La métaphore de l'oeuf au bacon

En attendant de répondre plus longuement à Baron(sur communication et information) qui me signale qu'elle est concernée voire impliquée... "Etre impliqué ou "être concerné"? : pour faire comprendre la différence à des gens, par exemple en séminaire de motivation des troupes, vous leur dites simplement: "Si vous voulez faire des oeufs au bacon, vous avez besoin, au départ, d'une poule et d'un cochon; la différence à l'arrivée, dans votre poèle, c'est que la poule est concernée mais le cochon, lui, est impliqué."

Newsletter Galerie Amavero art et poésie

Abonnez-vous à notre newsletter "Galerie Amavero art et poésie" sur Linkedin!  Vous aurez ainsi les dernières news et publications de poèmes écrits inspirés par des œuvres d'art contemporain, publiés côte à côte, œuvre et texte, sur notre galerie virtuelle. Nous en sommes à 27 artistes et 9 auteurs et le groupe grandit tous les jours! S’abonner Newsletter

Supprimer les DRM des ebooks: une solution qui marche

La plupart des soi-disant solutions qu'on vous propose pour supprimer les DRM  (Digital Rights Management), des ebooks, afin de pouvoir les lire sur le terminal/liseuse de votre choix, sont des copier-coller des mêmes remèdes. Ceux-ci ont un seul défaut: ils ne sont pas mis à jour et donc ils ne marchent plus dès que les éditeurs, comme s'ils n'avaient pas mieux à faire, par exemple élargir leur bibliothèque ridicule d'ebooks,  s'amusent à renforcer leurs DRM ces soi-disant droits de protection antipiratage qui ne sont que des abus du droit et qui devraient être interdits. Bref j'ai trouvé et testé une solution qui marche, dans ma configuration actuelle: logiciel de gestion de bibliothèque d'ebooks Calibre 1.47, sous Mac OS 10.9.4. Mais il y a aussi des solutions Windows. Cette solution est décrite sur le blog Apprentice Alf's Blog et il propose les liens suivants: "The latest tools_v6.0.8.zip can be downloaded from http://www1.datafilehost.c