Volejte: +420 267 316 318; navštivte nás: Vršovická 1461/64, 101 00 Praha 10 - Vršovice|info@solutia.cz

Spark na cluster chytře

Apache Spark je open-source distribuovaný univerzální framework určený k provádění výpočtů na úrovni clusteru. Největší výhodou je právě možnost paralelizace na vysoké úrovni a dostupnosti v tzv. módu „High Availability“ (HA), neboli vysoká dostupnost. Díky těmto vlastnostem je Apache Spark naprosto ideální pro nasazení v prostředí pro zpracování velkého množství dat bez možnosti výpadku. Vysoké množství [...]

Vertica: databáze s velkým výkonem

Vertica V dnešní době, kdy se hromadí spousty dat, které je neustále nutné archivovat pro různé účely, se jeví „běžné“ databázové systémy jako neefektivní a velice pomalé. Terabajt je dnešní měrná jednotka pro databázové systémy. Spousty a spousty záznamů o transakcích, událostech, měřených údajích a dalších, se nemusí pouze jen ukládat pro archivaci, ale [...]

2022-03-28T12:05:13+01:0022 května, 2020|Kategorie: Big Data, Cloud|Štítky: , , , , , , |

Představujeme Apache Kafka pro zpracování datových toků v reálném čase

Apache Kafka je open-source distribuovaná streamovací platforma s vysokou propustností a nízkou latencí pro zpracování datových toků v reálném čase. Jako streamovací platforma nabízí Kafka tyto schopnosti: Publikování a přihlášení se k odběru streamů záznamů, podobných frontám zpráv. Trvalé ukládání stream záznamů způsobem odolným proti chybám. Zpracování stream záznamů v okamžiku [...]

2022-03-31T14:07:21+01:0022 května, 2020|Kategorie: Big Data, Cloud|Štítky: , , , , , , , , , , |
Přejít nahoru