Představte si, že na vás bude paralelně vedeno 25 000 konverzací a všechny čekají na odpověď. To se stane s úložnými systémy, když zákazníci dnes školí a nasazují velké jazykové modely (LLM). Nyní do mixu přidejte Multi-Modal Training s obrázky, videy, zvukem a dalším bohatým obsahem, což je právě 10x větší. Pracovní zátěže umělé inteligence (AI)/strojového učení (ML) běžně fungují v tomto měřítku. GPU zpracovávají 10 s petabajtů (PB) dat paralelně s propustností 10 s terabitů za sekundu (Tbps), aby umožnily ty nejsložitější modely na světě. Potřebují extrémně rychlý úložný systém, který dokáže přistupovat ke 100 z 1 000 souborů paralelně a napájet je 100 z 1 000 GPU vysokou rychlostí.
Představujeme úložiště souborů Oracle Cloud Infrastructure (OCI) s technologií Luster, aby splnili požadavky na výkon těchto úloh. Luster je navržen tak, aby poskytoval paralelní I/O výkon ve velkém měřítku a je široce používán v rozsáhlých školeních s velkým jazykovým modelem (LLM) a superpočítačových projektech.
OCI File Storage with Luster je plně spravovaná služba založená na Lustre. Umožňuje vám výkon a škálování výhod Lustre, včetně milisekundové latence metadat, kapacity na petabajty a vysoké propustnosti terabajtů za sekundu, a zároveň eliminuje složitost správy. Jako plně spravovaná služba OCI automatizuje nasazení, škálování a údržbu souborového systému. Navíc, protože je tato služba postavena na přední službě Block Storage Service od OCI, můžete očekávat stejnou dostupnost a trvanlivost podnikové třídy jako u podnikových aplikací běžících na službě Block Storage Service.
K souborovému systému Luster mohou paralelně přistupovat tisíce klientů. OCI File Storage with Luster je hladce integrováno s Oracle Kubernetes Engine (OKE) a lze jej nasadit v GPU Hosts, Bare Metal nebo virtualizovaných prostředích.
OCI File Storage with Luster je nyní k dispozici v Oracle Cloud Console! Ceny jsou založeny na poskytované kapacitě a úrovních výkonu. Další podrobnosti naleznete na webové stránce Oracle Cloud Pricing.
Případy použití zákazníků
Naši zákazníci již využívají výhod služby Luster pro případy použití, jako jsou LLM Training and Engineering simulation Models.
Velké LLM školení: Nedávné rozsáhlé školení LLM využívající úložiště souborů OCI se škálováním souborového systému Luster na více PB, spravované OCI, napájí 25 000 GPU s agregovanou rychlostí až 20 terabitů za sekundu (Tbps).
AI pro strojírenství: NXAI, lídr v oblasti průmyslových simulací umělé inteligence, poskytuje rozsáhlé jazykové modely pro výrobní, logistické a energetické sektory, využívá úložiště souborů OCI s technologií Luster ke zlepšení rychlosti jejich školení v oblasti umělé inteligence.
Fyzikální simulace: Emmi AI pohání fyzikální architektury a modely k odemknutí interakcí v reálném čase pro elektrické systémy, tepelné simulace a letecké inženýrství, používá úložiště souborů OCI s Lusterem ke zrychlení doby simulace.
„Byli jsme ohromeni snadností a rychlostí implementace OCI File Storage pomocí Lustre. Změnilo to náš tréninkový proces AI, díky čemuž je neuvěřitelně efektivní. To, co dříve trvalo dny, je nyní díky zvýšení výkonu 4X-10X dosaženo během hodin. Toto řešení je pro naše provozy zásadní změnou.“ — Fabian Schlager, AI Platform Operations, Emmi AI (NXAI Spin-off)
www.nx-ai.com www.emmi.ai
Proč zvolit OCI File Storage s Lustre?
Zákazníci provozující větší modely LLM, aplikace GenAI a zákazníci provozující fyzikální simulace již ve výrobě používají úložiště souborů OCI s Lusterem. OCI File Storage with Luster je hladce integrováno s Oracle Kubernetes Engine (OKE) a k souborovému systému mohou přistupovat hostitelé GPU, Bare Metal nebo virtualizované servery.
Zde jsou některé z klíčových funkcí, které umožňuje
- Výkon v měřítku: Získejte paralelní přístup k systému souborů z tisíců klientů a GPU. OCI File Storage s technologií Luster efektivně zvládá masivní zatížení dat. Souborový systém lze škálovat až na 20 petabajtů (PB), což vám umožní ukládat data AI, ML a HPC včetně trénovacích datových sad, výzkumných modelů a kontrolních bodů. Umožňuje vysoký udržitelný výkon pro každý terabajt (TB) poskytované kapacity. OCI File Storage with Luster nabízí následující úrovně výkonu
- 125 MB/s na zřízený TB
- 250 MB/s na zřízený TB
- 500 MB/s na zřízený TB
- 1000 MB/s na zřízený TB
- Plně spravovaná služba: OCI File Storage with Luster pomáhá eliminovat složitost nastavení a údržby komponent infrastruktury Luster, jako jsou úložné servery, metadatové servery a datové svazky. Můžete snadno škálovat svou kapacitu a agregovat výkon na vyžádání a přitom pokračovat ve spouštění produkčních aplikací. Toto zefektivnění vám umožní soustředit se na hlavní obchodní cíle, aniž byste se museli starat o správu infrastruktury. Souborový systém můžete vytvořit během několika minut pomocí konzoly Oracle Cloud Console, nástrojů příkazového řádku, rozhraní API, sad pro vývojáře softwaru (SDK) nebo terraform.
- Vysoce dostupná architektura: Pomáhá vašim kritickým pracovním zátěžím přistupovat k datům, která jsou vysoce dostupná a odolná vůči selhání infrastruktury.
- Bezproblémové kopírování mezi Lusterem a objektem (již brzy): Svůj souborový systém Luster můžete propojit s bucketem OCI Object Storage a kopírovat data úložiště objektů na vyžádání a přistupovat přímo ze systému souborů Luster. To vám umožní načíst data z objektu do systému souborů pro rychlejší přístup.
- Správa kvót: OCI File Storage with Luster vám umožňuje nastavit limity kapacity pro vaše uživatele, skupiny a projekty. Umožňuje předvídatelnou spotřebu úložiště, která vám pomůže udržet náklady na úložiště pod kontrolou.
Začínáme
Souborový systém můžete snadno vytvořit z OCI Cloud Console, CLI nebo API. Chcete-li si dnes vytvořit svůj vlastní souborový systém Luster, přejděte v konzole Oracle Cloud Console do části Luster File Storage v konzole Oracle Cloud. Následující obrázky ukazují hlavní panely nastavení systému souborů.
Obrázek 1: Vyberte Luster File Storage v Oracle Cloud Console
Obrázek 2: Vytvořte nový systém souborů Luster
Obrázek 3: Vyberte úroveň výkonu a kapacitu
Další informace
Pro více informací nás neváhejte kontaktovat.
Zdroj: Oracle