Car-tech

Cloudera Preps Hadoop pour l'entreprise

Making Self-Service BI a Reality with Cloudera's Analytic Database

Making Self-Service BI a Reality with Cloudera's Analytic Database
Anonim

Cloudera a dévoilé un nouvel ensemble d'outils de gestion Hadoop, appelé Cloudera Enterprise, que l'entreprise proposera pour un abonnement annuel, il a annoncé mardi. Il a également mis à jour son package de distribution open source de Hadoop.

Les deux nouvelles versions, ainsi que plusieurs nouveaux partenariats avec des fournisseurs de logiciels de gestion de données, montrent que l'entreprise se prépare à offrir la technologie de base de données émergente. Par des géants du Web comme Google et Yahoo - au marché des entreprises comme une alternative aux bases de données relationnelles.

"Notre pari n'est pas seulement les grandes sociétés Web, mais les banques, les hôpitaux et les compagnies d'assurance découvriront ensemble, et Hadoop a été créé pour cela », a déclaré le PDG de Cloudera, Mike Olson. "Hadoop résout un nouveau problème, d'une manière nouvelle."

Hadoop fait partie d'un nombre croissant de bases de données non SQL ou NoSQL basées sur Google MapReduce, un framework de traitement de données en parallèle sur un grand nombre d'ordinateurs. nœuds. Hadoop, en cours de développement en tant que projet open-source par Apache Software Foundation, offre une alternative aux bases de données relationnelles traditionnelles, pour au moins les cas d'analyse de grands ensembles de données changeant rapidement.

Il peut fonctionner avec SQL et non - Les données SQL sont plus résistantes aux pannes de serveur que les bases de données relationnelles, dit M. Olson.

Cloudera est en train de mettre en place Hadoop pour les organisations de niveau intermédiaire, à la fois avec sa distribution Hadoop et son nouvel ensemble d'outils de gestion. Les deux paquets devraient permettre aux organisations n'ayant pas beaucoup d'expérience technique approfondie dans Hadoop d'exécuter le logiciel, a déclaré Olson. "Il y a ce mythe selon lequel Hadoop est utilisable si vous avez des données à l'échelle de Google: il y a beaucoup d'utilisateurs qui n'ont que quelques téraoctets de données qu'ils veulent analyser", dit Olson.

La distribution de Cloudera pour Hadoop (CDH) est un ensemble de logiciels pré-intégrés open-source construits autour de Hadoop Common, anciennement appelé Hadoop Core. Le package inclut: Hive, qui fournit une infrastructure d'entrepôt de données; HBase, la base de données sous-jacente à Hadoop; Pig, un compilateur pour les programmes de réduction de la carte; Zookeper, une application pour exécuter des applications sur plusieurs serveurs, et MapReduce.

Dans la nouvelle version 3, le paquet comprend trois programmes que l'entreprise a publiés en tant que projets open source, sous licence open source Apache V2. L'un est Flume, qui peut aider au chargement des données dans Hadoop. Un autre ajout est Oozie, qui est un logiciel de gestion de workflow. Le dernier est le code HUE (Hadoop User Environment), qui fournit une interface utilisateur pour la gestion de Hadoop.

"HUE permet à quiconque de créer des applications ciblées sur les analystes, il sait comment communiquer avec les clusters Hadoop".

Le package Cloudera Enterprise complète la version 3 de CDH avec des outils de gestion supplémentaires. Ce nouveau logiciel, qui n'est pas open source, permet aux administrateurs de contrôler la gestion des accès grâce à l'utilisation du protocole Lightweight Directory Access.

Olson ne discutera pas de ce que Cloudera a fait jusqu'ici des frais de souscription et de consultation, mais note que le premier trimestre de 2010, la société a fait autant que Ce qu'il a gagné pendant la moitié de 2009. Parmi les différentes industries, les sociétés de services financiers, de télécommunication, de commerce de détail, de gouvernement et de commerce électronique ont montré un intérêt pour la technologie, dit Olson.

"Les choses que les entreprises font avec Hadoop En général, ces personnes capturent beaucoup de données provenant de nombreux endroits et doivent les soumettre à des analyses sophistiquées », a déclaré M. Olson. "Les services financiers sont intéressés par l'utilisation de Hadoop pour la détection des fraudes Dans les télécommunications, il y a un réel besoin d'optimiser les réseaux et de réduire le taux de désabonnement des clients."

En plus d'offrir ces forfaits, Cloudera a rallié Hadoop à des fournisseurs de logiciels de veille économique et de gestion de données.

Olson prévoit d'annoncer, lors de son discours au Hadoop Summit 2010, à Santa Clara, En Californie, mardi, le fournisseur BI MicroStrategy supportera l'utilisation de Hadoop.

Talend, un fournisseur de logiciels d'intégration de données open source, est un autre partenaire. La société a étendu sa suite Talend Integration à l'interface avec les bases de données Hadoop. Sa suite permet aux administrateurs de gérer et d'agréger plusieurs sources de données à partir d'une seule console. Avec Hadoop, le logiciel «peut nativement insérer ou récupérer des données et traiter les données au sein de l'architecture Hadoop», explique Yves de Montcheuil, vice-président marketing de Talend.

Microstrategy et Talend rejoignent un nombre croissant d'entreprises ou des outils de gestion commerciale pour Hadoop. La semaine dernière, Cloudera et Quest se sont lancés dans un projet de développement de logiciels capables de relier Hadoop aux bases de données Oracle. En mai, Pentaho, une société d'intelligence d'affaires open-source, a annoncé que sa suite BI fonctionnerait avec les bases de données Hadoop.

Dans une interview séparée avec IDG News Service, Raymie Stata, CTO de Yahoo, a indiqué qu'Hadoop pourrait réduire les besoins en supercalculateurs. analyser de grands ensembles de données. Traditionnellement, de grands ensembles de données ont été déplacés du stockage dans le supercalculateur, qui est un ensemble de serveurs regroupés, à analyser. En revanche, Hadoop déplace le calcul analytique vers l'emplacement des données, éliminant ainsi le besoin d'une machine géante de calcul des nombres. Yahoo a été l'un des premiers contributeurs à Hadoop.

Outre l'offre de Cloudera, Hadoop est également commercialisé par IBM, qui a récemment commencé à proposer un ensemble de services analytiques utilisant cette technologie.

Joab Jackson couvre les logiciels d'entreprise et nouvelles sur la technologie pour

The IDG News Service. Suivez Joab sur Twitter à @Joab_Jackson. L'adresse e-mail de Joab est [email protected]