Windows

Hadoop obtient plus de recherches avec MapR, Cloudera publie

Technology Stacks - Computer Science for Business Leaders 2016

Technology Stacks - Computer Science for Business Leaders 2016
Anonim

Les utilisateurs de la plate-forme de traitement de données Hadoop disposent maintenant de deux outils supplémentaires pour les aider à trier leurs montagnes d'informations

La nouvelle distribution M7 de MapR supprime les couches Hadoop JVM pour améliorer les performances

Hadoop Le distributeur MapR a intégré LucidWorks Search dans sa propre distribution. Cloudera, quant à lui, a lancé la première version complète de son moteur de recherche open source Impala SQL pour Hadoop.

[Plus d'informations: Les meilleurs services de streaming TV]

"Utiliser la recherche comme interface utilisateur pour les données volumineuses est très intéressant. La recherche est bien adaptée pour tirer parti de nombreux types d'informations, en particulier des informations non structurées », a déclaré Jack Norris, directeur marketing de MapR. "Nous voyons des applications très intéressantes avec les moteurs de recherche, même si un utilisateur typique ne les considère pas comme moteurs de recherche."

LucidWorks Search est la version commerciale de l'open source Apache Lucene / Solr full moteur de recherche de texte. Avec la nouvelle intégration de MapR, LucidWorks Search peut rechercher des données sur les systèmes de fichiers Hadoop (HDFS) ou des fichiers sur d'autres systèmes de fichiers.

LucidWorks Search offre des instantanés et des miroirs pour la haute disponibilité et élimine une grande partie du travail installez Lucene / Solr à partir de zéro. Il offre également un support natif pour davantage de sources de données, une interface utilisateur graphique et un cadre de sécurité.

Le moteur de recherche peut être utilisé dans une application Web dynamique pour récupérer rapidement des photos, des publicités, des recommandations de produits et d'autres informations. pour peupler les sites Web à la volée. "Ce n'est pas un substitut à moindre coût pour les entrepôts de données.

MapR et LucidWorks travaillent ensemble depuis 2011 pour mettre en commun leurs technologies, lorsqu'ils ont conclu un accord de marketing commun. Plus tôt cette année, ils ont sorti un connecteur qui facilite l'utilisation de Lucene / Solr avec la distribution MapR Hadoop

LucidWords Search fonctionne avec la nouvelle distribution M7 de MapR, sous forme bêta. En plus de supporter LucidWorks Search, l'édition M7 a été ré-architecturée pour éliminer les compactions ou les contrôles de cohérence en arrière-plan, accélérant ainsi les performances.

Cloudera a également publié cette semaine la version 1.0 de Cloudera Impala. Hadoop. SQL est le langage d'interface de base de données utilisé dans les systèmes de gestion de bases de données relationnelles (RDMS) et est bien connu des administrateurs de base de données.

Impala a été conçu pour exécuter des requêtes plus rapidement que Hadoop's Hive. les résultats de recherche doivent être écrits sur le disque. Au lieu de cela, les utilisateurs peuvent interroger directement les données stockées dans HDFS et HBase. Les utilisateurs peuvent interroger les données de manière interactive ou par lots.

Cloudera a publié pour la première fois une version bêta de ce moteur en octobre dernier. Depuis, le logiciel a été testé par des entreprises telles que 37signals et Expedia.

Impala est le composant principal du package supplémentaire Cloudera Enterprise RTQ (Real-Time Query) pour la plateforme Cloudera Hadoop. Impala peut être téléchargé gratuitement.

Mis à jour le 6 mai pour corriger les informations sur la technologie Cloudera Impala.