Článek přečtěte do 4 min.

Vzhledem k bleskovému vývoji umělé inteligence se zcela nová slovní zásoba rychle stává součástí každodenního života. Některé z těchto zkratek a konceptů však mohou být matoucí. Tento článek proto definuje běžné pojmy, které vám pomohou s jistotou hovořit v konverzacích o umělé inteligenci a lépe porozumět technologii, která za ní stojí. Patří sem integrované funkce GenAI a agenti umělé inteligence ve vašich cloudových aplikacích Oracle Fusion. Pro snazší pochopení jsme je seřadili do skupin (záměrně nejsou řazeny abecedně).

I. Základní pojmy

Umělá inteligence (AI): AI označuje simulaci lidské inteligence ve strojích, které jsou naprogramovány tak, aby myslely a učily se ze zkušeností. Systémy AI mohou provádět úkoly, jako je rozpoznávání řeči, rozhodování a překlad jazyka.

Model umělé inteligence: Model umělé inteligence je výstupem komplexního počítačového programu nebo algoritmu, který byl trénován na datové sadě k učení vzorců, vytváření predikcí nebo generování obsahu. Schopnosti získané tímto trénováním mu umožňují provádět specifické inteligentní úkoly, aniž by byl explicitně naprogramován pro každý možný scénář.

Trénovací data: Trénovací data označují datovou sadu používanou k učení modelu umělé inteligence, aby mohl provádět úkoly v reálném světě. V případě generativní umělé inteligence to zahrnuje obrovské množství textu, obrázků, zvuku nebo jiných datových typů, ze kterých se model učí identifikovat vzory a generovat nový obsah.

Pravděpodobnostní model: Pokud je pravděpodobnostní model zadán vícekrát, produkuje pokaždé různé výstupy. Mnoho modelů GenAI a velkých jazyků (viz níže) se chová pravděpodobnostně. Další termíny pro tyto modely jsou stochastické nebo nedeterministické.

Deterministický model: Jakmile jsou deterministické modely natrénovány nebo naprogramovány, mohou při daných identických vstupech produkovat přesně stejný výstup. Patří mezi ně diagnostické systémy, které běží na pravidlech „pokud-pak“, a algoritmy, které používají pevné vzorce k vytváření predikcí.

Generativní umělá inteligence (GenAI): GenAI označuje systém, který vytváří nový obsah, jako je text, obrázky nebo hudba, učením se vzorců z existujících dat. Nejenže klasifikuje nebo analyzuje data, ale dokáže generovat originální výstupy na základě předpovídání, jaký by podle něj měl být další obsah.

Zpracování přirozeného jazyka (NLP): NLP je oblast umělé inteligence, která se zaměřuje na to, aby strojům umožnila porozumět, interpretovat a generovat lidský jazyk.

Neuronové sítě: Neuronové sítě jsou typem modelu strojového učení inspirovaného lidským mozkem. Skládají se z propojených vrstev uzlů (někdy označovaných jako umělé neurony), které zpracovávají data. Hluboké učení je podmnožinou strojového učení, která využívá neuronové sítě s mnoha vrstvami (odtud „hluboké“). Hluboké neuronové sítě s mnoha vrstvami se často používají v modelech GenAI.

Agenti umělé inteligence: Agenti umělé inteligence jsou autonomní softwarové aplikace vytvořené kombinací rozsáhlých jazykových modelů (viz níže) s dalšími pokročilými technologiemi. Interagují se svým prostředím, činí rozhodnutí, učí se a v průběhu času přizpůsobují své chování. Díky tomu jsou vhodní pro automatizaci složitých úkolů v měnících se podmínkách a pro spolupráci s lidmi a dalšími agenty v reálném čase.

II. Pojmy související s rozsáhlými jazykovými modely a generativní umělou inteligencí

Model velkého jazyka (LLM): LLM jsou typem modelu GenAI, který je trénován na obrovském množství textových dat za účelem zpracování, interpretace a generování textu podobného lidskému. Tyto modely, jako například Llama, Cohere a GPT-4, jsou schopny úkolů, jako je generování textu, sumarizace, překlad a další. Učí se jazykové vzory, gramatiku a kontextový význam zpracováním obrovského množství textu, což jim umožňuje poskytovat koherentní reakce na vstupy uživatele.

Generativní předtrénovaný transformátor (GPT): GPT je typ LLM s architekturou založenou na transformátoru. Tato architektura vyniká ve zpracování sekvenčních dat, jako je jazyk, a při jejich zpracování zvažuje důležitost různých slov ve větě. Termín „GPT“ vytvořila společnost OpenAI, ale základní architekturu transformátoru používají i modely od společností Google, Anthropic, Meta a dalších.

Token: Token je textová jednotka – například slovo, část slova nebo interpunkce – kterou LLM používá k pochopení a generování obsahu. GenAI rozděluje věty na tokeny, aby je analyzoval a generoval text smysluplným způsobem.

Cena služeb umělé inteligence se obvykle odvíjí od počtu tokenů použitých jak ve vstupu (výzva), tak ve výstupu (odpověď) pro každou interakci. Tokeny jsou přímo vázány na složitost vykonávané práce, takže pokročilejší modely a složitější úkoly vyžadují více tokenů.

Generování s rozšířeným vyhledáváním (RAG): RAG je technika, která kombinuje schopnost načítání specifických informací s modely GenAI – tj. načítání relevantních externích dat ze zdrojů (např. dokumentů, databází) a následné použití modelu GenAI ke zkombinování těchto načtených informací do souvislé a informativní odpovědi. To pomáhá zlepšit přesnost a relevanci, zejména pokud je vyžadován aktuální nebo věcný obsah.

III. Pojmy související s optimalizací a dohledem nad umělou inteligencí

Výzva: Výzva je vstup nebo instrukce poskytnutá modelu GenAI ke spuštění generování obsahu. Řídí model k provedení určitého úkolu nebo generování specifických informací.

Promptne inženýrství: Promptne inženýrství označuje proces navrhování a vytváření vstupních pokynů, které efektivně vedou model umělé inteligence k generování požadovaného výstupu. Úpravou formulací, kontextu nebo omezení ve vstupu mohou uživatelé řídit kvalitu, přesnost a relevanci odezvy modelu.

Halucinace: Halucinace je falešná informace generovaná metodou LLM a prezentovaná, jako by to byl fakt. Dochází k ní proto, že modely jsou navrženy tak, aby předpovídaly nejpravděpodobnější další slovo nebo vzorec, spíše než aby ověřovaly faktickou přesnost. Mezi strategie pro minimalizaci halucinací patří zlepšení kvality trénovacích dat, používání pokročilých architektur modelů (viz generování rozšířeného vyhledávání a jemné ladění ), vytváření specifičtějších výzev (viz inženýrství výzev ) a zahrnutí lidského dohledu.

Pozorovatelnost: Pozorovatelnost je schopnost monitorovat, analyzovat a chápat vnitřní fungování a výkon modelů umělé inteligence v reálných prostředích. Zahrnuje shromažďování a zkoumání dat o chování systému umělé inteligence, což umožňuje týmům sledovat rozhodnutí, identifikovat problémy a zajistit, aby modely přinášely spolehlivé a očekávané výsledky.

Jemné ladění: Jemné ladění označuje proces dalšího trénování předtrénovaného generativního modelu umělé inteligence na konkrétní datové sadě, aby se specializoval na určité úkoly, jako je například generování obsahu specifického pro dané odvětví.

Zdroj: Oracle