Hadoop

Hadoop

Hadoop je open source program z rodiny Apache, napsaný v jazyce Java, který umožňuje distribuované zpracování rozsáhlých datových sad přes clustery počítačů pomocí jednoduchých programovacích modelů. Aplikace Hadoop je navržena pro škálování od jednoho serveru po tisíce strojů, z nichž každý nabízí lokální výpočet a úložiště.

Architektura Hadoop

Hadoop zahrnuje následující čtyři moduly:

  • Hadoop Common: Jsou knihovny a nástroje Java požadované jinými moduly Hadoop. Tyto knihovny poskytují abstrakce na úrovni souborového systému a operačního systému a obsahují potřebné soubory a skripty jazyka Java, které jsou nutné pro spuštění aplikace Hadoop.
  • Hadoop YARN: Je část aplikace Hadoop zodpovědná za plánování úloh a řízení clusterových zdrojů.
  • Hadoop Distributed File System (HDFS™): Distribuovaný souborový systém, který poskytuje vysokou rychlost v přístupu k datům aplikace.
  • Hadoop MapReduce: Jedná se o systém založený na YARN pro paralelní zpracování velkých datových sad.

 

Vizí společnosti Solutia je pomáhat svým zákazníkům při řešení jejich složitých zadání, vytvářet vyspělá, efektivní a bezpečná řešení.

Zkrátka chceme dále držet palec na tepu doby.

Připadá Vám to jako fráze? Zeptejte se našich zákazníků!

Přihlášení k odběru zpravodaje

*povinné pole