Článek přečtěte do 5 min.

S potěšením oznamujeme, že  streamování OCI s Apache Kafka  je nyní všeobecně dostupné a nabízí výkon a flexibilitu distribuovaných funkcí streamování událostí Apache Kafka v infrastruktuře Oracle Cloud (OCI). S touto novou spravovanou službou Kafka můžete snadno vytvářet a provozovat aplikace řízené událostmi a datové kanály v reálném čase v zabezpečeném a škálovatelném prostředí OCI – a zároveň využívat výhod efektivního nasazení, integrace a správy.

Níže prozkoumáme klíčové funkce, výhody a běžné případy použití OCI streamování s Apache Kafka a zakončíme to podrobným návodem, který vám pomůže začít.

Proč streamovat OCI s Apache Kafka?

Vzhledem k tomu, že firmy stále více vyžadují zpracování a analýzu dat v reálném čase, poskytuje Apache Kafka robustní páteř pro streamování úloh. Díky plně spravované službě Kafka od společnosti Oracle na OCI se nyní vaše týmy mohou více soustředit na inovace dat a aplikací a méně na správu infrastruktury.

Mezi klíčové výhody patří:

  • Plně spravovaná Kafka : Automatické zřizování, škálování, údržba a opravy – OCI se postará o těžkou provozní práci.
  • Vysoká propustnost a škálovatelnost : Navrženo pro škálování napříč více doménami dostupnosti s využitím vysoce propustné sítě a odolné architektury OCI.
  • Komplexní zabezpečení : Chraňte svá data pomocí robustních síťových funkcí, ověřování (SASL-SCRAM, mTLS) a řízení přístupu. 

Klíčové vlastnosti

1. Flexibilní možnosti clusteru

  • Streamování OCI s Apache Kafka nabízí flexibilní konfigurace clusterů pro podporu různých úloh. Starter clustery, doporučené pro vývoj a testování, lze zřídit s 1 až 30 brokery. High Availability (HA) clustery, určené pro produkční použití, podporují odolné nasazení napříč více doménami, vyžadují minimálně 3 brokery a lze škálovat až na 30 brokerů.

2. Vlastní konfigurace

  • Cluster můžete rychle vytvořit pomocí výchozího nastavení konfigurace nebo přizpůsobit nastavení zprostředkovatele, replikační faktory a další parametry tak, aby vyhovovaly vašim specifickým požadavkům, a to pomocí rozhraní OCI CLI nebo Kafka API.

3. Zabezpečení a dodržování předpisů

  • Ověřování : Zabezpečení clusterů pomocí SASL-SCRAM nebo mTLS. Integrace s OCI IAM je plánována v budoucích aktualizacích.
  • Řízení přístupu : Spravujte a omezujte připojení a oprávnění pomocí seznamů řízení přístupu (ACL) Kafka spolu s flexibilními konfiguracemi VCN pro řízení přístupu k síti dle potřeby.

4. Vysoká dostupnost a obnova po havárii

  • V konfiguracích HA replikace dat v rámci oblasti zvyšuje odolnost a dostupnost.
  • Replikace napříč clustery (více regionů) a zotavení po havárii je podporováno prostřednictvím MirrorMakeru 2.

Běžné případy použití

Streamování OCI s Apache Kafka podporuje řadu kritických pracovních postupů v reálném čase a s využitím umělé inteligence:

  • Datová základna pro trénování umělé inteligence v reálném čase: Streamujte a agregujte data v reálném čase z různých zdrojů a poskytujte aktuální, vysoce kvalitní datové sady nezbytné pro trénování a přeškolování umělé inteligence a modelů velkých jazyků (LLM) na základě nových obchodních nebo provozních signálů.
  • Vektorové databázové kanály pro GenAI a RAG: Streamujte zpracovaná data, včetně vektorových vkládání, přímo do integrovaných vektorových databází (jako jsou ty používané ve scénářích vyhledávání pomocí umělé inteligence nebo generování s rozšířeným vyhledáváním), což umožňuje modelům umělé inteligence využívat kontextové a aktuální informace ke zvýšení relevance a přesnosti výstupu.
  • Orchestrace agentů AI a multiagentních systémů: Zajistěte komunikaci a sdílení událostí v reálném čase mezi mikroslužbami nebo agenty AI, podpořte správu stavu agentů a koordinujte dynamické pracovní postupy se streamovacími kanály pro responzivnější a autonomnější řešení AI.
  • Analýza dat v reálném čase: Nepřetržitě streamujte data z IoT a zařízení pacientů pro proaktivní monitorování zdraví, prediktivní analýzu a včasný zásah.
  • Analýza chování uživatelů: Zaznamenávejte a zpracovávejte data o interakcích uživatelů v reálném čase napříč webovými a mobilními aplikacemi za účelem získání praktických poznatků a personalizovaných doporučení. 
  • Předpovídání poptávky: Streamujte a analyzujte živá prodejní a provozní data pro zlepšení předpovědí za chodu, přesnosti předpovědí a podporu obchodních rozhodnutí založených na datech.
  • Detekce podvodů: Neustále monitorujte finanční transakce v reálném čase, abyste identifikovali podezřelé vzorce, odhalili anomálie a rychle reagovali na potenciální hrozby podvodů.
  • Zachycení změn dat (CDC): Bezproblémové streamování změn databáze do analytických platforem nebo datových jezer, aby byly následné systémy synchronizovány s nejnovějšími daty s nízkou latencí.

Začínáme: Návod k konzoli

Předpoklad: Nastavení zásad

Před zřízením prvního clusteru Kafka musíte udělit potřebná oprávnění jak samotné službě Kafka (označované jako  rawfka), tak i skupinám uživatelů. Aktualizujte níže uvedené zásady nahrazením zástupných symbolů. 

Oprávnění služby:

Povolit službě rawfka používat virtuální síťové karty (vnic) v oddílu .
Povolit službě rawfka používat skupiny zabezpečení sítě (network-security-groups) v oddílu .
Povolit službě rawfka používat podsítě v oddílu .

Autorizace uživatele:

Povolit skupině v | tenancy

Oprávnění superuživatele SASL (pokud jsou vyžadována):

Povolit službě rawfka použití v oddílu
Povolit službě rawfka použití tajných identifikátorů v oddílu , kde request.operation = ‚UpdateSecret'

Krok za krokem: Vytvoření clusteru Kafka

Podrobný návod se snímky obrazovky je k dispozici v dokumentaci. Níže je shrnutí postupu:

1. Zobrazení nebo vytvoření clusterů Kafka:

Přejděte do svého oddílu a zobrazte existující clustery Kafka, nebo začněte výběrem možnosti „Vytvořit cluster".

zobrazit Kafkovy clustery

2. Konfigurace podrobností clusteru:

Zadejte název clusteru, verzi a oddíl, ve kterém chcete cluster vytvořit.

konfigurace podrobností clusteru Kafka

3. Nastavení brokera:

Vyberte typ clusteru (Starter nebo HA), počet brokerů a alokace zdrojů (CPU, paměť a úložiště).

nastavení brokera

4. Konfigurace clusteru:

Podle potřeby použijte výchozí nebo vlastní konfigurace Kafka.

konfigurace clusteru

5. Nastavení zabezpečení:

Nastavte mTLS (s příslušnými certifikáty) pro zabezpečení v rámci clusteru; po nasazení nakonfigurujte SASL-SCRAM.

nastavení zabezpečení

6. Sítě:

Vyberte si virtuální cloudovou síť (VCN) a podsítě – pro clustery HA se doporučují regionální podsítě.

síťování

7. Zkontrolujte a vytvořte:

Před spuštěním nového clusteru Kafka potvrďte všechna nastavení.

zkontrolovat a vytvořit

Přehled cen

Streamování OCI s Apache Kafka se účtuje na základě využití infrastruktury:

  • Cena závisí na počtu brokerů, jader CPU, paměti a úložišti.
  • Servisní poplatek: 0,10 USD za OCPU za hodinu (nebo 0,05 USD za OCPU za hodinu pro tvary ARM A1).
  • Nejnovější informace naleznete na  stránce s cenami OCI.

Začněte ještě dnes

OCI Streaming s Apache Kafka vám pomůže využít sílu aplikací pro streamování v reálném čase se sníženými provozními náklady – a se škálovatelností, dostupností a zabezpečením, které od infrastruktury Oracle Cloud očekáváte. Pro další informace nás neváhejte kontaktovat.

Zdroj: Oracle