Hadoop est la potion magique qu’on vous sert à toutes les sauces du Big Data et de l’entreprise numérique. Mais qu’est-ce que c’est en réalité ? Et surtout, qu’est-ce que ce n’est pas ?
Hadoop, c’est quoi ?
Au départ, c’est Apache Hadoop, une bibliothèque de logiciels open source utiles à construire un environnement distribué. Elle a un créateur : Doug Cutting (ci-contre) et la petite histoire dit que le nom vient du doudou éléphant de son fils. Mais son succès s’est entouré d’un certain nombre de mythes. En voici 12.
- Hadoop est un produit unique
- Hadoop, c’est du logiciel libre
- Hadoop se suffit à lui-même
- HDFS est un SGBD
- Hadoop, c'est du full SQL
- Hadoop et MapReduce forment un duo inséparable
- MapReduce est un outil d’analytique
- Hadoop est surtout un traitement de gros volumes
- Hadoop remplace un data warehouse
- Le Big Data ne peut pas vivre sans Hadoop
- Hadoop est gratuit
- Hadoop est surtout un produit d’analytique web
Résumé d’une très bonne étude de TechTarget « Hadoop Myths Busted » sponsorisée par IBM et Syncsort