Big Data

Big Data

Obecný úvod

Žijeme v nové době. V době informací, nových technologií, pokroku. S technologickým pokrokem souvisí i pokrok na komunikační úrovni. Nová zařízení, sociální sítě, to všechno nám umožňuje být stále s někým v kontaktu, pořád něco stahovat, získávat, měnit, posílat….

Dostali jsme se do doby, kdy je všechno zaplavené informacemi a všechny si tyto informace ukládají. Každý člověk, který používá technologie, po sobě zanechává datovou stopu a všechna tato data se někam ukládají. Každý člověk, každá společnost má někde uložená svá data a čím větší společnost, tím víc dat je generováno a ukládáno. Problém nastává, když těchto dat začne být příliš velké množství, příliš mnoho různých typů a vy ta data chcete využít, ale vlastně pořádně nevíte jak.

Říká se tomu, že máte problém s velkými daty neboli “Big Data Problem” a nakonec musíte přijít na to, jak taková data zpracovat, využít, zkrátka “vytěžit” z nich co nejvíce užitečných informací.

Big Data

Termínem “Big Data” označujeme informace, které se nedají zpracovat ani analyzovat tradičním procesem nebo nástrojem, v rozumném čase. Big Data jsou definována těmito třemi základními definicemi:

Volume – Objem (jak velký objem dat vlastníme)

Velocity – Rychlost (jak rychle jsme schopni data zpracovat)

Variety – Různorodost (jaké různé typy dat vlastníme)

I když je v této definici velikost dat důležitá, není to jediným rozhodujícím faktorem. Velkou roli zde hraje i formát a struktura těchto dat, a s tím spojený čas, za jaký jsme tato data schopni zpracovat a analyzovat. Souvisí to s tím, že většina těchto dat není ve strukturovaném formátu. Většinou jsou tato data nestrukturovaná a uložená na různých místech, v různých formátech a různých podobách, a organizace pak řeší nejen jejich skladování, ale i jejich správné a úplné využití.

Naše společnost v současné době nabízí 2 přední technologie na ukládání a zpracování “Big Data”, jedná se o technologie:

Hadoop –  je framework obsahující sadu opensource softwarových komponent určených pro zpracování velkého množství nestrukturovaných a distribuovaných dat v řádech petabytů a exabytů.

Verticaje analytická platforma postavená jako lehce rozšířitený cluster, který je sloupcovou databází pro uchovávání a zpracování rychle rostoucích velkých objemů dat.

Přihlášení k odběru zpravodaje

*povinné pole