Vzhledem k tomu, že se organizace stále více spoléhají na cloudová analytická řešení, aby ze svých dat získaly obchodní hodnotu, stává se bezproblémová integrace mezi různými platformami klíčovou. Jednou z účinných kombinací jsou Databricks a Oracle Analytics Cloud, komplexní analytické řešení od společnosti Oracle. Propojení těchto systémů umožňuje organizacím vizualizovat a analyzovat rozmanité datové sady ve velkém měřítku, což zefektivňuje pracovní postupy business intelligence.
Předpoklady
Než začnete s integrací, ujistěte se, že máte splněny následující předpoklady:
Základní požadavky
- Přístup k Oracle Analytics Cloud: Potvrďte, že máte platné předplatné a potřebná oprávnění ke konfiguraci zdrojů dat a bran v rámci Oracle Analytics Cloud.
- Pracovní prostor Databricks: Ověřte, zda máte aktivní prostředí Databricks (v Azure, AWS nebo u jiných podporovaných poskytovatelů cloudu) s přístupem k datům, která chcete analyzovat v oficiálním platformě pro autentizaci (Oracle Analytics Cloud).
- Instalační program Oracle Data Gateway: Stáhněte si Oracle Data Gateway , který umožňuje zabezpečené připojení mezi oficiálním centrem přístupu (Oracle Analytics Cloud) a vzdálenými zdroji dat.
- Ovladač JDBC pro Databricks: Získejte nejnovější ovladač JDBC pro Databricks , který usnadňuje propojení mezi platformami.
Technické požadavky
- Síťové připojení a oprávnění: Zajistěte, aby výpočetní prostředí hostující bránu dat (Data Gateway) mohlo komunikovat s vaším pracovním prostorem Databricks i s oficiálním centrem přístupu (Oracle Analytics Cloud). Požadované porty firewallu musí být otevřené.
- Oprávnění správce: Pro instalaci softwaru (například Data Gateway) a nahrávání ovladačů na vaše výpočetní prostředky jsou nutná oprávnění správce.
- Informace o službě a ověřování: Mějte připravenou adresu URL JDBC pro Databricks, ověřovací token a veškeré přihlašovací údaje k databázi pro konfiguraci v rámci Oracle Analytics Cloud.
Postupný proces integrace
1. Stáhněte a nainstalujte Oracle Data Gateway
- Začněte stažením Oracle Data Gateway, což je nezbytná součást pro bezpečné připojení Oracle Analytics Cloud k vašim lokálním nebo virtuálním cloudovým zdrojům.
- Nainstalujte si ho přímo do výpočetního prostředí Databricks.
- Proces instalace zahrnuje krok konfigurace agenta, kde nastavíte přihlašovací údaje pro zabezpečenou komunikaci.
- Po úspěšné instalaci máte přístup ke konfiguračnímu rozhraní Data Gateway na adrese http://localhost:8080/obiee/config.jsp.
2. Získejte a nakonfigurujte ovladač JDBC pro Databricks
- Stáhněte si ovladač JDBC pro Databricks a umístěte jej do příslušného adresáře ve složkách Data Gateway. Tento ovladač umožňuje efektivní datovou komunikaci mezi Databricks a Oracle Analytics Cloud
- Zde je příklad struktury adresářů souborového systému, který ukazuje umístění souborů ovladače JDBC v instalačních složkách Data Gateway a demonstruje správnou konfiguraci ovladače:
3. Restartujte datovou bránu
- Jakmile je ovladač nakonfigurován, restartujte Data Gateway, abyste se ujistili, že je nový ovladač správně načten a připraven k použití. Skripty pro restart naleznete v binární cestě: \DataGateway\domain\bin
4. Povolte datovou bránu v oficiálním kanálu platformy AC
- Přihlaste se do Oracle Analytics Cloud a povolte připojení k Data Gateway. Tento krok propojí vaše analytické prostředí s podkladovými daty Databricks.
- Přejděte do konzole Oracle Analytics Cloud, klikněte na dlaždici Vzdálené datové připojení, povolte Datovou bránu a přidejte agenta.
5. Konfigurace připojení Databricks v Oracle Analytics Cloud Data Visualization (DV)
- V modulu vizualizace dat Oracle Analytics Cloud nastavte připojení k Databricks zadáním požadovaných podrobností JDBC pro vytvoření zabezpečeného a vysoce výkonného spojení.
V dialogovém okně konfigurace připojení vizualizace dat Oracle Analytics Cloud se zobrazují parametry připojení Databricks, včetně názvu hostitele, portu, názvu databáze a nastavení ověřování, s poli pro uživatelské jméno a heslo.
Důležité poznámky ke konfiguraci:
- Použití ověřovacího tokenu: Při použití přístupového tokenu by uživatelské jméno mělo být „token“ a ne skutečné uživatelské jméno pro Databricks.
- Připojení k SQL Warehouse: Při připojování k SQL Warehouse v Databricks použijte typ připojení Advanced s parametrem ConnCatalog nastaveným na váš katalog Databricks. Pro clustery pro všechny účely můžete použít typ připojení Basic.
Zde je ukázkový připojovací řetězec:
jdbc:databricks://:443/default;transportMode=http;ssl=1;AuthMech=3;httpPath=/sql/1.0/warehouses/8ddbd20ef481e154;ConnCatalog=samples;
6. Otestujte připojení
- Před přechodem do produkčního prostředí vždy otestujte připojení, abyste ověřili správné nastavení a vyřešili případné problémy.
7. Povolte Asistenta pro dotazy v přirozeném jazyce (NLQ)
- Chcete-li uživatelům poskytnout další možnosti, aktivujte pro připojenou datovou sadu Databricks Asistenta. Tato funkce umožňuje uživatelům interagovat s daty pomocí dotazů v přirozeném jazyce (NLQ), což dramaticky urychluje samoobslužnou analýzu.
- Rozhraní Asistenta zobrazuje možnosti dotazování v přirozeném jazyce s ukázkovými otázkami a vizualizacemi generovanými umělou inteligencí. Rozhraní ukazuje interakci ve stylu konverzace s datovými poznatky a automatickým generováním grafů.
- Asistent interpretuje konverzační otázky a poskytuje vizuální postřehy nebo odpovědi, díky čemuž jsou analytické nástroje intuitivní a přístupné firemním uživatelům bez nutnosti technických znalostí.
Důležitá poznámka: Aby Asistent fungoval optimálně, musí být připojená datová sada jasně modelována a obsahovat relevantní metadata. Kvalita odpovědí NLQ závisí na struktuře a srozumitelnosti podkladové datové sady.
Klíčové omezení: Pracovní postup ukládání do mezipaměti nebo aktualizace
Při integraci vzdálených datových zdrojů, jako jsou Databricks, s Oracle Analytics Cloud mějte na paměti toto důležité omezení:
Přímé dotazování na živá data nemusí být vždy podporováno. Data z Databricks se obvykle importují do Oracle Analytics Cloud pomocí pracovního postupu mezipaměti nebo aktualizace, což znamená, že analýza se provádí na snímku dat, nikoli v reálném čase. Naplánujte aktualizace mezipaměti podle potřeby, aby vaše datové sady OAC zůstaly aktuální. Případně si můžete prohlédnout článek Připojení k databázi pomocí sdílení Delta .
Závěrem
Pokud jsou splněny všechny předpoklady a organizace dodržují tento jasný integrační proces, mohou bezproblémově propojit své prostředí Databricks s Oracle Analytics Cloud a získat tak významnou hodnotu prostřednictvím efektivní, škálovatelné a podrobné analýzy. Kombinace výkonných možností zpracování dat Databricks s intuitivními vizualizačními nástroji Oracle Analytics Cloudvytváří komplexní analytický ekosystém, který slouží technickým i firemním uživatelům.
Další zdroje
Úplné pokyny a pokyny k řešení problémů naleznete v těchto oficiálních zdrojích společnosti Oracle:
- Průvodce instalací Oracle Data Gateway
- Připojení vzdáleného zdroje dat Databricks
- Stažení ovladače JDBC pro Databricks
- Výukové video
- Dokumentace podpory zdroje Databricks
Pokud narazíte na problémy, regenerujte si přístupový token a pokud máte jakékoli dotazy nebo potřebujete další pomoc, neváhejte se na nás obrátit.
Chcete-li se dozvědět více o službě Oracle Analytics Cloud, kontaktujte nás.
Zdroj: Oracle