iot-infrastructure-big-data_0.jpg

IoT : sans Big Data, point de salut : Cluster Hadoop

03/09/2019
Big Data
IoT

Cet article fait partie d'une série de 5 articles sur la relation étroite entre IoT et les infrastructures Big Data. Cette première partie se consacre aux clusters Hadoop.

Comme la téléphonie mobile en son temps, l’IoT tisse peu à peu sa toile dans le quotidien, à la fois des entreprises et des consommateurs.

Mais lĂ  oĂą le dĂ©ploiement rĂ©seau « suffisait Â», c’est aujourd’hui la question de la production, du stockage et du traitement de volumes colossaux de donnĂ©es constamment produites par les objets connectĂ©s qui est soulevĂ©e.

Car la valeur de l’IoT repose essentiellement sur les donnĂ©es gĂ©nĂ©rĂ©es par chaque objet connectĂ©. Des donnĂ©es qui sont sources d’informations prĂ©cieuses, jusqu’à devenir dĂ©terminantes dans le cadre de ses activitĂ©s. Et ces objets connectĂ©s sont en pleine expansion : selon IDC et Gartner, ils seront au nombre de 30 milliards en 2020, pour un marchĂ© estimĂ© Ă  1 700 milliards de dollars.

Derrière le réseau d’objets connectés, c’est donc toute une infrastructure de data management, et plus précisément de Big Data, à mettre en place.

Quelles technologies utiliser ? Pour quels rĂ©sultats attendus ? Couche par couche, les recommandations de Digora, en 5 parties, en matière de Big Data au service de l’IoT.

IoT : sans Big Data, point de salut – 1 : cluster Hadoop

Cluster Hadoop

Dans cette première partie, parlons des systèmes de stockage pour le Big Data : le cluster Hadoop, associé au système de stockage Blob Azure pour les données froides.

Ce n’est qu’en la combinant Ă  d’autres donnĂ©es que l’on peut maximiser la valeur d’une donnĂ©e. C’est justement tout l’objectif d’un cluster Hadoop, qui permet le stockage et l’exploitation de donnĂ©es diverses en grande quantitĂ©. Ses multiples outils disponibles (stockage, analyse et traitement : calcul distribuĂ©, haute disponibilitĂ©) offrent aux entreprises la possibilitĂ© de renforcer la valeur de leurs donnĂ©es.

Pour aller plus loin, il est possible de l’associer Ă  du stockage blob (binary large object) tel que le propose Microsoft avec son offre de stockage Blob Azure, conçu pour stocker dans le cloud de très grandes quantitĂ©s de donnĂ©es non structurĂ©es. Dans ce genre d’architectures, Hadoop est essentiellement rĂ©servĂ© Ă  la redondance et au calcul distribuĂ© (HDFS : Hadoop Distributed File System), tandis que Blob Azure assure l’archivage des donnĂ©es froides.

D’origine Open Source (Apache Software Foundation), il existe de nombreuses distributions Hadoop. Parmi elles, Cloudera a dĂ©veloppĂ©, avec Red Hat et Eurotech, une architecture IoT ouverte, complète et modulaire, pour simplifier et accĂ©lĂ©rer les dĂ©ploiements IoT. SĂ©curisĂ©e et scalable, cette plateforme, qui embarque les technologies les plus rĂ©centes, bĂ©nĂ©ficie de toute l’expertise d’un Ă©diteur spĂ©cialiste du Cloud, tout en restant ouverte pour ne pas risquer de « s’enfermer Â» dans une technologie propriĂ©taire.

 

Pour aller plus loin, retrouvez les recommandations de Digora sur les autres couches d’infrastructure en matière d'IoT & Big Data :

copy-link