S potěšením oznamujeme vydání modelů Llama 4, Scout a Maverick, v rámci služby Oracle Cloud Infrastructure (OCI) Generative AI. Tyto modely využívají architekturu Mixture of Experts (MoE), která umožňuje efektivní a výkonné zpracování dat. Modely jsou optimalizovány pro multimodální porozumění, vícejazyčné úkoly, kódování, volání nástrojů a napájení agentních systémů.
Regiony podporované na GA
- Na vyžádání: ORD
- Vyhrazené klastry umělé inteligence: ORD, GRU, LHR, KIK
Klíčové vlastnosti řady Llama 4
- Multimodální možnosti: Oba modely jsou nativně multimodální, schopné zpracovávat a integrovat různé datové typy, včetně textu a obrázků.
- Vícejazyčná podpora: Školení na datech zahrnující 200 jazyků s možností doladění pro 12 jazyků včetně arabštiny, angličtiny, francouzštiny, němčiny, hindštiny, indonéštiny, italštiny, portugalštiny, španělštiny, tagalštiny, thajštiny a vietnamštiny. Aplikace Image Understanding je k dispozici pouze v angličtině.
- Efektivní vývoj: Llama 4 Scout je navržen pro přístupnost a zapadá do menších grafických nároků.
- Modely s otevřenou váhou: Oba modely jsou vydávány v rámci vlastní licenční smlouvy Llama 4 Community License Agreement, která vývojářům umožňuje je doladit a nasadit při dodržování specifických licenčních podmínek.
- Uzávěrka znalostí: srpen 2024.
Poznámka: Zásady přijatelného použití Llama omezují její použití v Evropské unii (EU).
Lama 4 Scout
- Architektura: Obsahuje 17 miliard aktivních parametrů z celkem přibližně 109 miliard parametrů a využívá 16 expertů.
- Kontextové okno: Podporuje délku kontextu až 10 milionů tokenů (vyžaduje více GPU). V GA bude služba podporovat délku kontextu 192 tisíc tokenů.
- Nasazení: Navrženo pro efektivní provoz s malým nárokem na grafický procesor.
- Výkon: V mnoha benchmarkových testech překonává modely jako Google Gemma 3 a Mistral 3.1.
Lama 4 Maverick
- Architektura: Obsahuje 17 miliard aktivních parametrů, ale v rámci širšího rámce s celkem přibližně 400 miliardami parametrů a využívá 128 expertů.
- Kontextové okno: Podporuje délku kontextu až 1 milion tokenů. V GA bude služba podporovat délku kontextu 512 tisíc tokenů.
- Nasazení: Vyžaduje větší prostor než Scout – přibližně 2x pro nasazení OCI v GA.
- Výkon: Vykazuje výkon srovnatelný s OpenAI GPT-4o a DeepSeek-V3 v úlohách kódování a uvažování.
Díky těmto vylepšením představuje řada Llama 4 významný krok vpřed ve vývoji modelů umělé inteligence a nabízí vylepšený výkon, všestrannost a přístupnost pro širokou škálu aplikací.
Zákazníci OCI mohou využívat modely bez obav ze správy infrastruktury. Přístup je možný prostřednictvím chatovacích rozhraní, API nebo vyhrazených koncových bodů.
Podrobnosti o integraci a informace o cenách naleznete v dokumentaci k službě Generative AI.
Pro více informací se prosím podívejte na následující zdroje
- Dokumentace služeb generativní umělé inteligence
- Služba generativní umělé inteligence OCI
- Agenti generativní umělé inteligence OCI
- Služba umělé inteligence OCI
- Co je generativní umělá inteligence?
- Proč generativní umělá inteligence s Oracle?
- Co je generování rozšířené o vyhledávání (RAG)?
Pro více informací nás neváhejte kontaktovat.
Zdroj: Oracle