Článek přečtěte do 2 min.

S potěšením oznamujeme vydání modelů Llama 4, Scout a Maverick, v rámci služby Oracle Cloud Infrastructure (OCI) Generative AI. Tyto modely využívají architekturu Mixture of Experts (MoE), která umožňuje efektivní a výkonné zpracování dat. Modely jsou optimalizovány pro multimodální porozumění, vícejazyčné úkoly, kódování, volání nástrojů a napájení agentních systémů.

Regiony podporované na GA

  • Na vyžádání: ORD
  • Vyhrazené klastry umělé inteligence: ORD, GRU, LHR, KIK

Klíčové vlastnosti řady Llama 4

  • Multimodální možnosti: Oba modely jsou nativně multimodální, schopné zpracovávat a integrovat různé datové typy, včetně textu a obrázků.
  • Vícejazyčná podpora: Školení na datech zahrnující 200 jazyků s možností doladění pro 12 jazyků včetně arabštiny, angličtiny, francouzštiny, němčiny, hindštiny, indonéštiny, italštiny, portugalštiny, španělštiny, tagalštiny, thajštiny a vietnamštiny. Aplikace Image Understanding je k dispozici pouze v angličtině.
  • Efektivní vývoj: Llama 4 Scout je navržen pro přístupnost a zapadá do menších grafických nároků.
  • Modely s otevřenou váhou: Oba modely jsou vydávány v rámci vlastní licenční smlouvy Llama 4 Community License Agreement, která vývojářům umožňuje je doladit a nasadit při dodržování specifických licenčních podmínek.
  • Uzávěrka znalostí: srpen 2024.

Poznámka: Zásady přijatelného použití Llama omezují její použití v Evropské unii (EU).

Lama 4 Scout

  • Architektura: Obsahuje 17 miliard aktivních parametrů z celkem přibližně 109 miliard parametrů a využívá 16 expertů.
  • Kontextové okno: Podporuje délku kontextu až 10 milionů tokenů (vyžaduje více GPU). V GA bude služba podporovat délku kontextu 192 tisíc tokenů.
  • Nasazení: Navrženo pro efektivní provoz s malým nárokem na grafický procesor.
  • Výkon: V mnoha benchmarkových testech překonává modely jako Google Gemma 3 a Mistral 3.1.

Lama 4 Maverick

  • Architektura: Obsahuje 17 miliard aktivních parametrů, ale v rámci širšího rámce s celkem přibližně 400 miliardami parametrů a využívá 128 expertů.
  • Kontextové okno: Podporuje délku kontextu až 1 milion tokenů. V GA bude služba podporovat délku kontextu 512 tisíc tokenů.
  • Nasazení: Vyžaduje větší prostor než Scout – přibližně 2x pro nasazení OCI v GA.
  • Výkon: Vykazuje výkon srovnatelný s OpenAI GPT-4o a DeepSeek-V3 v úlohách kódování a uvažování.

Díky těmto vylepšením představuje řada Llama 4 významný krok vpřed ve vývoji modelů umělé inteligence a nabízí vylepšený výkon, všestrannost a přístupnost pro širokou škálu aplikací.

Zákazníci OCI mohou využívat modely bez obav ze správy infrastruktury. Přístup je možný prostřednictvím chatovacích rozhraní, API nebo vyhrazených koncových bodů.

Podrobnosti o integraci a informace o cenách naleznete v dokumentaci k službě Generative AI.

Pro více informací se prosím podívejte na následující zdroje

Pro více informací nás neváhejte kontaktovat.

Zdroj: Oracle