[WEBINAR💻] NIS 2 en action : Stratégies et solutions pour une cyber-résilience renforcée ! Le replay est disponible dès maintenant🎙!

✖︎
iot-infrastructure-big-data-time-series.jpg

IoT : sans Big Data, point de salut – 2 : NoSQL & Time Series

09/09/2019
Big Data
IoT

Dans une première partie, vous avez découvert les systèmes de stockage pour le Big Data recommandés par Digora : le cluster Hadoop, associé au système de stockage Blob Azure pour les données froides. Dans cet article, focus sur la technologie NoSQL.

NoSQL : la saine concurrence

En fonction de leurs besoins, les entreprises ont tendance à choisir l’un ou l’autre. Pourtant, le framework Hadoop et la technologie de gestion de bases de données NoSQL sont, malgré les apparences, plutôt complémentaires. Notamment quant aux workloads qu’ils adressent. En effet, là où la technologie Not Only SQL assure un accès en lecture et écriture ultra rapide favorable aux applications temps réel et aux interactions utilisateurs, Hadoop et sa technologie MapReduce traitent beaucoup plus de données, au détriment des performances.

Parmi les (nombreux) acteurs des bases de données NoSQL, Cassandra, HBase, MongoDB et Couchbase sont les plus connus. Si leurs approches sont globalement similaires, chaque technologie propose des fonctionnalités et des spécificités propres.

  • Apache Cassandra : avec son modèle réparti, Cassandra mise prioritairement sur la scalabilité de l’architecture, mais aussi et surtout sur sa haute disponibilité et ses performances de premier plan.
  • Apache HBase : conçue d’après le modèle BigTable de Google et développée (en java) dans la cadre du projet Apache Hadoop, HBase est une base de données Open Source, non relationnelle et distribuée. HBase apporte notamment à Hadoop ses capacités de stockage à grande échelle et sa faible latence.

Pour en savoir plus : Qu’est-ce qu’une base NoSQL ? Les cas Datastax (Cassandra) et MongoDB

Time Series : l’horodatage des données, au service de l’IoT

En matière d’IoT, les bases de données Time Series (ou BDD orientées séries temporelles) trouvent également une grande utilité. Elles permettent en effet de stocker, visualiser et interroger de grandes quantités de données de séries chronologiques, à l’image de celles générées par les objets connectés.

  • InfluxDB : le SGBD InfluxDB propose une architecture distribuée sur plusieurs nœuds, avec des metadata pour la structure. InfluxDB s’insère de façon plus large dans une suite complète baptisée Tick Stack, comprenant également Telegraf (collecte et préparation des données issues des capteurs, terminaux et applications) et Chronograf (dashboards et dataviz).
  • Azure Time Series Insights : conçu pour s’intégrer nativement aux passerelles cloud telles que Azure IoT Hub et Azure Event Hubs, Azure Time Series insights gère le stockage et l’interrogation rapide de données. Son explorateur, pour la visualisation de données, et ses API, pour l’intégration des données à des applications personnalisées, en font l’un des incontournables des BDD time series du marché.

Capture d'écran d'Azure Time Series Insights

Pour aller plus loin, retrouvez les recommandations de Digora sur les autres couches d’infrastructure en matière d'IoT & Big Data :

 

Source de l'image : Capture d'écran d'Azure Time Series Insights