Composants

Aster Data Updates en première ligne Analytic Database

You Bet Your Life: Secret Word - Floor / Door / Table

You Bet Your Life: Secret Word - Floor / Door / Table
Anonim

Startup Aster Data Systems a publié la version 3.0 de sa base de données analytique nCluster mardi, la considérant comme idéale pour l'entreposage de données de première ligne.

"Traditionnellement, nous considérons l'entreposage de données comme une tâche de back-office", écrit Mayank Bawa, PDG d'Aster. poster mardi. «L'entrepôt de données peut être chargé dans des fenêtres de chargement distinctes, les charges peuvent être en retard (les utilisateurs professionnels recevront leurs rapports en retard), les charges, les sauvegardes et l'extension peuvent mettre hors service les entrepôts de données. Ces tâches peuvent être effectuées en dehors des heures d'ouverture (nuits / week-ends). »

Mais les clients d'Aster, dont aCerno, un réseau de diffusion de publicité sur Internet,« comptent sur l'analyse de données pour leurs revenus ». Aster's nCluster 3.0 répartit les charges de travail sur un certain nombre de serveurs et facilite l'ajout de machines supplémentaires pour plus de puissance. Le logiciel divise également les différents composants d'une charge de travail d'analyse de données en morceaux discrets.

Un niveau «chargeur» traite du chargement et de l'exportation de données vers et à partir de sources externes; une couche "worker" stocke les données sur les disques attachés localement pour l'interrogation; Une couche de nœuds «reine» effectue une planification et un traitement intelligents des requêtes.

Les utilisateurs travaillent avec le cluster comme s'il s'agissait d'une seule entité.

La possibilité de mettre à l'échelle sélectivement les segments permet aux utilisateurs d'ajouter des ressources

Pour ces fonctionnalités de base, la version 3.0 ajoute un certain nombre de fonctions pour une utilisation «en permanence», y compris la possibilité d'ajouter de la capacité, de rééquilibrer les données et de récupérer des données pendant que

Aster a également travaillé à l'ajout de la parallélisation dans tout le système, selon un responsable de l'entreprise.

«Nous voulons construire des systèmes capables de gérer 10 fois plus de données que tout autre système aujourd'hui. beaucoup de données pour un seul serveur de produits », a déclaré CTO Tasso Argyros dans un article de blog. "Nous consacrons donc beaucoup d'efforts de R & D à la parallélisation de toutes les fonctions du système - non seulement l'interrogation, mais aussi le chargement, l'exportation, la sauvegarde et les mises à niveau de données, tout en permettant à nos utilisateurs de choisir »

La version inclut également la prise en charge de MapReduce, une technique de programmation développée à l'origine par Google, qui facilite l'écriture de programmes pour l'analyse de grands ensembles de données. Greenplum, le concurrent d'Aster, a également annoncé récemment la prise en charge de MapReduce.

Les fonctionnalités supplémentaires incluent la possibilité de sélectionner des niveaux de compression de données pour des tables individuelles, un outil de mise à niveau «en un clic»; et de meilleures fonctionnalités de sécurité, telles que LDAP (Lightweight Directory Access Protocol) pour l'authentification et la possibilité de gérer les privilèges des utilisateurs au niveau des clusters, des bases de données et des tables.

Beaucoup de clients initiaux d'Aster », a déclaré Curt Monash, président de Monash Research.

« Une grande partie de la croissance et des opportunités dans l'entreposage de données réside dans le traitement de types de données relativement nouveaux », a-t-il déclaré. "Il existe de grands entrepôts de données traitant des données transactionnelles OLTP traditionnelles, mais Aster n'est pas forcément un concurrent de premier plan dans l'analyse de ces données.Les données Web et les événements réseau associés sont actuellement les points forts de l'analyse de grandes quantités de données. L'administration et le support du traitement parallèle de MapReduce sont les atouts clés d'Aster: «Aster est une startup avec un produit relativement immature, mais ils ont beaucoup réfléchi à la façon de rendre le traitement parallèle facile à administrer».

NCluster 3.0 fonctionne sur des serveurs x86 standard. Le prix est basé sur la quantité de données gérée. La société a précédemment déclaré que les coûts commencent à 100 000 $ US.