Digora blog

Oracle NoSQL Database : c'est une blague ?

27/02/2012
Données

Dans l'approche Big Data, on parle souvent de NoSQL.  Oracle a maintenant une offre NoSQL. Et ce n'est pas une blague...

Oracle NoSQL Database facilite le stockage efficace de quantitĂ©s massives de donnĂ©es dans un format simple et flexible.

Oracle NoSQL Database

Suite Ă  l'annonce de la disponibilitĂ© d'Oracle NoSQL Database, Rich Schwerin,  contributeur d'Oracle Magazine, s'est entretenu avec Dave Segleau, directeur de Produits chez Oracle, concernant la nouvelle offre de gestion du Big Data.

 Portrait de Dave Segleau

Voici un extrait de cette discussion, tirĂ©e d'Oracle Magazine de mars/avril 2012. Oracle Magazine: Commençons par le dĂ©but. Qu'est-ce que une base de donnĂ©es NoSQL? Segleau: NoSQL signifie pas seulement SQL, et cela  englobe un ensemble de technologies SGBD  dĂ©veloppĂ©es ces 12 dernières annĂ©es. Les bases de donnĂ©es NoSQL  essayent en gĂ©nĂ©ral de rĂ©pondre Ă  certaines des exigences de gestion des donnĂ©es de ce qui a Ă©tĂ© appelĂ© Big Data. Dans les grandes lignes, une base de donnĂ©es NoSQL est une base de donnĂ©es non relationnelle qui peut gĂ©rer des donnĂ©es sur un ensemble de serveurs de stockage distribuĂ©s, est conçue pour ĂŞtre hautement disponible tout en Ă©tant capable de monter  fortement  en charge et prend en charge un schĂ©ma de donnĂ©es variable et diffĂ©rents formats de donnĂ©es. Les bases de donnĂ©es NoSQL Ă©vitent souvent les transactions ACID (atomiques, cohĂ©rentes, isolĂ©es et durables) et les jointures de tables afin de parvenir Ă  un dĂ©bit plus rapide. Il existe diffĂ©rents types de bases de donnĂ©es NoSQL, et chaque implĂ©mentation Ă  tendance Ă  avoir son ensemble particulier de caractĂ©ristiques techniques et de comportement. Il est difficile de dĂ©finir ce qu'est une base de donnĂ©es NoSQL car il n'y a pas de normes aujourd'hui Ă  ce sujet. Il y a littĂ©ralement des centaines de produits qui prĂ©tendent ĂŞtre des bases de donnĂ©es NoSQL ou avoir des capacitĂ©s NoSQL. Oracle Magazine: Dans quels cas un dĂ©veloppeur choisira-t-il d'utiliser une base de donnĂ©es NoSQL? Segleau: Les cas d'utilisation les plus courants concernent les applications orientĂ©es Web ou orientĂ©es Internet, ce que nous aimons appeler applications Web ou services Web. Ces applications offrent soit des fonctionnalitĂ©s de saisie de donnĂ©es sur le Web soit des services Web. Data Capture dĂ©signe la capacitĂ© de surveiller, capturer, et interroger les donnĂ©es entrantes provenant d'une multitude de points de donnĂ©es, tels que la surveillance du rĂ©seau, les rĂ©seaux de capteurs dans une usine automatisĂ©e. Les Data Services sont des services orientĂ©s Web, de haute-performance et axĂ©s sur le client tels qu'AmazonLinkedIn ou Facebook. Il s'agit souvent Ă  la fois de saisie de donnĂ©es sur le Web et de services Web. Oracle Magazine: Quels sont certains avantages et inconvĂ©nients associĂ©s aux bases de donnĂ©es NoSQL? Segleau: Voici quelques avantages : une facilitĂ© pour augmenter la capacitĂ© de calcul et de stockage en ajoutant de nouveaux serveurs, des requĂŞtes simples et rapides et une approche flexible et aisĂ©e pour gĂ©rer le schĂ©ma. Voici quelques  inconvĂ©nients :  l'incapacitĂ© d'exĂ©cuter des requĂŞtes complexes, l'incapacitĂ© Ă  effectuer des jointures multi-tables, un support transactionnel limitĂ© et la nĂ©cessitĂ© d'apprendre une nouvelle  approche de technologie de base de donnĂ©es. Oracle Magazine: Vous avez parlĂ© de diffĂ©rents types de bases de donnĂ©es NoSQL. De quel type de base NoSQL est Oracle NoSQL Database ? Segleau: Oracle NoSQL Database est une base de donnĂ©es distribuĂ©e de type clĂ©-valeur, comme celles actuellement utilisĂ©es sur LinkedIn et Amazon.com. La clĂ© peut contenir, par exemple l'identifiant utilisateur (ou identifiant de membre) et la valeur contiendra des informations sur l'utilisateur, par exemple, les informations du profil de base y compris l'adresse, la photo et d'autres informations vitales. D'autres informations liĂ©es Ă  cet identifiant peuvent contenir le nom d'utilisateur ou adresse e-mail des amis de l'utilisateur et les produits que l'utilisateur a rĂ©cemment achetĂ©s. Si vous ĂŞtes un habituĂ© des bases relationnelles, vous pouvez imaginer une base de donnĂ©es clĂ©-valeur comme une table relationnelle Ă  deux colonnes : la première colonne est la clĂ©, et la deuxième colonne est la valeur. Les clĂ©s et les valeurs peuvent ĂŞtre des valeurs très simples ou des structures complexes. OracleDatabase NoSQL stocke les lignes contenant une paire de clĂ©-valeur et retrouve ces lignes en fonction de la clĂ© demandĂ©e. Oracle NoSQL Database distribue ces lignes de clĂ©s-valeurs, en fonction de la valeur de hachage de la clĂ©, Ă  travers un nombre quelconque de serveurs que nous appelons les nĹ“uds de stockage. La base de donnĂ©es est conçue pour garantir une scalabilitĂ© en fonction de l'augmentation du nombre de noeuds, ce qui permet de s'adapter aux besoins grandissants de donnĂ©es, tout en fournissant bon nombre des caractĂ©ristiques communes Ă  d'autres implĂ©mentations de bases de donnĂ©es NoSQL, ainsi que la mise Ă  disposition de plusieurs fonctionnalitĂ©s clĂ©s qui ne sont pas disponibles dans d'autres produits NoSQL. Oracle Magazine: Quels sont quelques unes de ces caractĂ©ristiques essentielles ? Segleau: Il y a plusieurs Ă©lĂ©ments clĂ©s que je voudrais mettre en Ă©vidence, mais ce qu'il faut retenir, c'est que Oracle NoSQL Database est d'usage gĂ©nĂ©ral, ainsi simple Ă  utiliser qu'Ă  dĂ©ployer. De nombreux produits NoSQL existants sont spĂ©cialement adaptĂ©s pour des types spĂ©cifiques de problèmes. Le problème est que cette approche ne s'adapte pas bien Ă  d'autres types de problèmes. Par exemple, Dynamo - la base de donnĂ©es NoSQL d'Amazon - est très efficace pour les besoins d'Amazon car c'est Amazon qui l'a Ă©crit. Mais la plupart des clients ne sont pas Amazon, et ce qu'ils veulent, c'est une solution plus polyvalente qui rĂ©pondra Ă  leurs besoins en base de donnĂ©es NoSQL. Une plainte commune est que la plupart des produits NoSQL existants mettent de cĂ´tĂ© les technologies  fondamentales de base de donnĂ©es, telles que les transactions, afin de fonctionner plus rapidement, et reportant la gestion de ces exigences fondamentales sur  le dĂ©veloppeur de l'application. Avec Oracle NoSQL Database , cette fonctionnalitĂ© reste dans la base de donnĂ©es oĂą elle doit ĂŞtre gĂ©rĂ©e. Franchement, nous avons entendu plusieurs utilisateurs NoSQL actuels dirent que des notions telles que le dĂ©bit Ă©levĂ©, sans prise en compte des transactions ni de la cohĂ©rence Ă©ventuelle, Ă©taient des modèles thĂ©oriques intĂ©ressants, mais que cette approche a fait du dĂ©veloppement d'applications un cauchemar. Par contre, Oracle NoSQL Database gère des transactions ACID. Oracle Magazine: Comment la solution Oracle NoSQL Database s'insĂ©re-t-elle dans la stratĂ©gie d'Oracle Big Data? Segleau: Le Big Data est un problème Ă  multiples facettes, qui comprend l'acquisition, l'organisation, et l'analyse de grandes quantitĂ©s de donnĂ©es qui proviennent de multiples formats et de rĂ©fĂ©rentiels sources. Oracle NoSQL Database est principalement axĂ© sur l'acquisition de donnĂ©es. Il est l'un des produits qui peuvent ĂŞtre utilisĂ©s pour acquĂ©rir et interroger rapidement de grandes quantitĂ©s de donnĂ©es Ă©lĂ©mentaires. Oracle Magazine: Comment organisez-vous et analysez-vous les donnĂ©es acquises par Oracle NoSQL Database ? Segleau: Oracle NoSQL Database stocke les paires distribuĂ©es clĂ©s-valeurs dans les nĹ“uds de stockage en utilisant un large ensemble de serveurs. Pour des statistiques simples, en particulier des opĂ©rations telles que des comptages et des agrĂ©gats sur des ensembles, vous pouvez utiliser des processus Hadoop MapReduce  pour gĂ©nĂ©rer rapidement des statistiques qui seront utilisĂ©es par vos application. Pour des analyses profondes, plus complexes, vous voudrez dĂ©placer les donnĂ©es concernĂ©es dans un Datawarehouse Oracle, puis utiliser un large ensemble d'outils et de processus, y compris Oracle Enterprise R, qui y sont disponibles pour gĂ©nĂ©rer des rĂ©sultats plus complexes, plus polyvalents. Il existe diffĂ©rentes mĂ©thodes pour transfĂ©rer des donnĂ©es Ă  partir d'Oracle NoSQL Database vers un Datawarehouse Oracle, y compris Oracle Data Integrator, des processus Hadoop MapReduce et mĂŞme  une fonctionnalitĂ© MapReduce directement intĂ©grĂ© Ă  la base Oracle et capable d'insĂ©rer des donnĂ©es dans le Datawarehouse Ă  partir d'une requĂŞte NoSQL. En d'autres termes, grâce Ă  l'utilisation des fonctions SQL - dans le cas prĂ©sent une fonction SQL MapReduce - vous pouvez utiliser, dans une requĂŞte qui s'exĂ©cute dans votre base de donnĂ©es relationnelle Oracle, des donnĂ©es externes Ă  partir d'une source de donnĂ©es externe accessible Ă  MapReduce. (fin de l'article Oracle Magazine) Oracle NoSQL Database est un des composants de l'offre Big Data d'Oracle : SchĂ©matisation de Big Data avec Oracle NoSQL Database

Nous avons prĂ©sentĂ© Oracle Enterprise R dans un billet prĂ©cĂ©dent de ce Blog. Nous avons aussi prĂ©sentĂ© le Big Data et l'approche Oracle correspondante dans un autre billet de ce Blog. Dans un prochain billet, nous prĂ©senterons plus en dĂ©tail l'approche Hadoop et MapReduce. Voici quelques liens :

Oracle NoSQL Database

http://www.oracle.com/technetwork/database/nosqldb/overview/index.html

http://www.oracle.com/technetwork/database/nosqldb/overview/nosqldb-faq-518364.html

http://www.oracle.com/technetwork/database/nosqldb/learnmore/nosql-database-data-sheet-498054.pdf

http://www.oracle.com/technetwork/database/nosqldb/learnmore/nosql-wp-1436762.pdf

http://www.oracle.com/technetwork/database/nosqldb/downloads/index.html

Oracle BigData

http://www.oracle.com/us/technologies/big-data/index.html

http://www.oracle.com/us/products/database/big-data-appliance/overview/index.html

http://www.oracle.com/us/corporate/analystreports/infrastructure/winter-big-data-1438533.pdf

Oracle Enterprise R

http://www.oracle.com/technetwork/database/options/advanced-analytics/r-enterprise/index.html

http://docs.oracle.com/cd/E27988_01/doc/doc.112/e26499/intro.htm#autoId0

http://www.oracle.com/technetwork/database/options/advanced-analytics/r-enterprise/ore-trng1-gettingstarted-1501628.pdf

 Vous souhaitez en savoir plus ? Contactez-nous

copy-link