Windows

Big Data 3 Vs - Concepts & Modèles

Machine Learning Tutorial 3 - Intro to Models

Machine Learning Tutorial 3 - Intro to Models

Table des matières:

Anonim

Le terme «données» n`est pas nouveau pour nous. c`est l`une des principales choses enseignées lorsque vous optez pour la technologie de l`information et les ordinateurs. Si vous vous souvenez, les données sont considérées comme la forme brute de l`information. Bien que déjà là depuis une décennie, le terme Big Data est un buzz ces jours-ci. Comme il ressort du terme, les charges et les charges de données sont des données volumineuses et peuvent être traitées de différentes manières en utilisant différentes méthodes et outils pour obtenir les informations requises. Cet article parle des concepts de Big Data, en utilisant les 3 V mentionnés par Doug Laney, un pionnier dans le domaine de l`entreposage de données qui est considéré comme ayant initié le domaine Infonomics (Information Economics).

Avant de continuer, vous pouvez lire nos articles sur les bases du Big Data et de l`utilisation du Big Data pour en saisir l`essence. Ils pourraient ajouter à ce poste pour plus d`explications sur les concepts de Big Data.

Big Data 3 Vs

Les données accumulées via différents moyens ont été classées correctement dans différentes bases de données plus tôt et ont été jetées après un certain temps. Lorsque le concept a émergé que plus les données sont nombreuses, plus il est facile de trouver des informations différentes et pertinentes en utilisant les bons outils, les entreprises ont commencé à stocker des données pour des périodes plus longues. Cela revient à ajouter de nouveaux périphériques de stockage ou à utiliser le cloud pour stocker les données sous quelque forme que ce soit: documents, feuilles de calcul, bases de données et HTML, etc. Il est ensuite organisé dans des formats appropriés à l`aide d`outils Data.

NOTE: Le champ d`application du Big Data ne se limite pas aux données que vous collectez et stockez dans vos locaux et dans votre cloud. Il peut inclure des données de différentes autres sources, y compris, mais sans s`y limiter, des éléments du domaine public

Le modèle 3D du Big Data est basé sur les V suivants:

  1. Volume: fait référence à la gestion du stockage de données
  2. Vitesse: se rapporte à la vitesse de traitement des données
  3. Variété: fait référence aux données de regroupement de différents ensembles de données apparemment sans rapport

Les paragraphes suivants expliquent la modélisation des Big Data en parlant de chaque dimension (chaque V).

A] Volume de Big Data

En parlant des Big Data, on pourrait comprendre le volume comme une énorme collection d`informations brutes. Bien que cela soit vrai, cela concerne aussi les coûts de stockage des données. Les données importantes peuvent être stockées sur site ou sur le cloud, ce dernier étant l`option flexible. Mais avez-vous besoin de stocker tout et n`importe quoi?

Selon un livre blanc publié par Meta Group, lorsque le volume de données augmente, certaines parties des données semblent inutiles. De plus, il stipule que seul ce volume de données devrait être conservé que les entreprises ont l`intention d`utiliser. d`autres données peuvent être écartées ou si les entreprises hésitent à laisser tomber des «données supposées non importantes», elles peuvent être jetées sur des ordinateurs inutilisés et même sur des cassettes afin que les entreprises n`aient pas à payer pour stocker ces données. > J`ai utilisé des "données supposées sans importance" parce que je crois aussi que les données de n`importe quel type peuvent être exigées par n`importe quelle entreprise à l`avenir - tôt ou tard - et doivent donc être conservées pendant une bonne période avant de savoir que les données sont en effet non important. Personnellement, je jette des données plus anciennes sur des disques durs d`antan et parfois sur des DVD. Les ordinateurs principaux et le stockage en nuage contiennent les données que je considère importantes et que je vais utiliser. Parmi ces données aussi, il y a une fois une sorte de données qui peuvent finir sur un vieux disque dur après quelques années. l`exemple ci-dessus est juste pour votre compréhension. Il ne correspondra pas à la description des données volumineuses, car le montant est très inférieur à ce que les entreprises perçoivent comme des données volumineuses.

B

] Vitesse du Big Data La rapidité du traitement des données est un facteur important quand on parle de concepts de Big Data. Il existe de nombreux sites Web, en particulier le commerce électronique. Google avait déjà admis que la vitesse à laquelle un chargement de page est essentiel pour de meilleurs classements. Outre le classement, la vitesse offre également un confort aux utilisateurs lors de leurs achats. Il en va de même pour les données traitées pour d`autres informations.

Tout en parlant de vitesse, il est essentiel de savoir qu`il est au-delà de la bande passante supérieure. Il combine des données facilement utilisables avec différents outils d`analyse. Des données facilement utilisables signifient quelques devoirs pour créer des structures de données faciles à traiter. La dimension suivante - La variété, éclaire davantage ceci.

C] Variété de Big Data

Quand il y a des charges et des charges de données, il devient important de les organiser de telle sorte que les outils d`analyse puissent facilement Les données. Il existe également des outils pour organiser les données. Lors du stockage, les données peuvent être non structurées et de n`importe quelle forme. c`est à vous de déterminer quelle relation il a avec d`autres données avec vous. Une fois la relation établie, vous pouvez choisir les outils appropriés et convertir les données au format souhaité pour le stockage structuré et trié

Résumé

En d`autres termes, le modèle 3D de Big Data repose sur trois dimensions: que tu possèdes; bon étiquetage des données; et un traitement plus rapide. Si ces trois sont pris en charge, vos données peuvent facilement être traitées ou analysées pour comprendre ce que vous voulez.

Ce qui précède explique les deux concepts et le modèle 3D de Big Data. Les articles liés dans le second paragraphe seront un soutien supplémentaire si vous êtes nouveau au concept.

Si vous souhaitez ajouter quelque chose, s`il vous plaît commenter.