Článek přečtěte do 5 min.

MyOracle je centralizovaný intranetový portál dostupný všem zaměstnancům Oracle, aby získali přístup ke všem zdrojům Oracle. Zaznamenává více než 5 milionů přístupů měsíčně od vzdálených zaměstnanců a zaměstnanců v pobočkách Oracle, což usnadňuje zaměstnancům zkušenosti související s HR aplikacemi, včetně mzdové agendy, náboru a řízení týmu, přístup k obsahu souvisejícímu s každodenní prací zaměstnanců. Jednou z nejdůležitějších funkcí tohoto portálu je MyOracle Search, služba podnikového vyhledávání, která získává více než 500 000 dotazů měsíčně. MyOracle Search je uživatelské rozhraní založené na Oracle JET, které běží v Oracle Container Engine for Kubernetes (OKE) a využívá cloudovou nativní architekturu ke zpracování dat z mnoha zdrojů dat v Oracle.

Historické problémy s hledáním

V rámci více než desetileté práce na různých vyhledávacích technologiích si ve společnosti Oracle Cloud Infrastructure (OCI) uvědomili, že vyhledávání je obtížný problém a mnozí čelí následujícím výzvám:

Nedostatek sémantického porozumění

Lexikální vyhledávání funguje pouze proto, že zahrnuje hledání přesných shod výrazů nebo klíčových slov v dokumentu bez pochopení základního významu nebo kontextu. Tento nedostatek kontextu může vést k nepřesným výsledkům, zejména při práci s nejednoznačnými termíny nebo variacemi v jazyce. Dobrým příkladem pro pochopení této problematiky je výklad synonym.

Předpokládejme, že používáte vyhledávač s přístupem lexikálního vyhledávání a zadáte dotaz: „Obnovit heslo jednotného přihlášení“. V systému, který se primárně opírá o lexikální vyhledávání, může načíst dokumenty obsahující přesnou frázi „resetovat heslo SSO“, ale nemusí brát v úvahu dokumenty, které používají synonymní výrazy, jako je „nelze se přihlásit“ nebo „nelze se ověřit“.

Sémantický vyhledávací systém chápe, že termíny jako „SSO“, „jednotné přihlášení“ a „přihlášení“ lze v určitých kontextech používat zaměnitelně. Při čistě jazykovém vyhledávání však mohou chybět relevantní dokumenty s rovnocennými informacemi, ale s odlišným zněním. Tento nedostatek sémantického porozumění by mohl vést k neúplným výsledkům vyhledávání a nemusel by účinně zachytit záměr uživatele.

Naproti tomu sémantický vyhledávací systém rozpoznává vztahy mezi souvisejícími termíny a poskytuje komplexnější výsledky s ohledem na synonyma a kontext. Tento přístup zlepšuje zážitek z vyhledávání tím, že chápe význam za slovy, což vede k přesnějšímu a relevantnějšímu vyhledávání informací.

Omezené hodnocení relevance

Lexikální vyhledávání často postrádá sofistikované mechanismy hodnocení relevance. V důsledku toho mohou být výsledky prezentovány na základě frekvence klíčových slov nebo relevance dokumentu, aniž by se zvažovala důležitost určitých výrazů v konkrétním kontextu.

Neschopnost zachytit záměr

Lexikální vyhledávání nedokáže efektivně zachytit záměr uživatele za dotazem, potenciálně chybějící dokumenty sémanticky související s cílem uživatele, přestože obsahuje klíčová slova použitá v dotazu.

Omezené porozumění přirozenému jazyku

Lexikální vyhledávání nezahrnuje pokročilé schopnosti porozumění přirozenému jazyku. Může potřebovat pomoc se složitými dotazy, negacemi nebo dotazy zarámovanými v přirozeném jazyce, což omezuje jeho schopnost zpracovávat různé uživatelské vstupy. Jedním příkladem je jejich neschopnost porozumět složitým dotazům, zejména těm, které zahrnují kontext, záměr nebo nuance.

Zvažte následující dotaz: „Můj Mac je uzamčen. Jak se přihlásím?“ V lexikálním vyhledávači s omezeným porozuměním přirozenému jazyku se systém může zaměřit pouze na jednotlivá klíčová slova v dotazu, jako je „mac“, „zamčeno“ a „přihlásit se“. Dokáže načíst dokumenty, které obsahují tyto přesné termíny, aniž by zahrnoval širší kontext nebo základní záměr uživatele.

V této souvislosti má omezené porozumění přirozenému jazyku následující omezení:

  • Neschopnost zohlednit záměr: Vyhledávač se snaží analyzovat záměr uživatele za dotazem, chybí dokumenty, které pojednávají o širším tématu uživatelů zamčených ze svých počítačů kvůli problémům s přihlášením SSO.
  • Omezené povědomí o kontextu: Lexikální vyhledávače postrádají schopnost porozumět kontextu, ve kterém se slova používají. V tomto příkladu motor nemusí rozpoznat, že „Mac“ odkazuje na Apple Macbook.

Jak OCI zlepšuje vyhledávání

V posledních několika letech upgradovali vyhledávání pomocí platformy OCI Data Science a transformačních modelů, abychom podpořili sémantické vyhledávání, které se zaměřuje na pochopení významu dotazu a kontextu informací namísto pouze shody klíčových slov. Využívá zpracování přirozeného jazyka (NLP), strojové učení (ML) a další pokročilé techniky k pochopení záměru uživatelského dotazu.

Aby získali relevantní výsledky na základě záměru uživatele, navrhli četné modely ML využívající OCI Data Science pro obohacení metadat, identifikaci a vyhledávání nejrelevantnějších výsledků na základě záměru uživatele. Vybudovali také toky ML, které nám umožňují vyladit modely ML nebo základní znalosti a porovnávat výsledky, aby bylo možné cykly neustálého zlepšování.

„Se zavedením sémantického vyhledávání na MyOracle Search jsme si všimli, že se naše míra prokliku ve vyhledávání zvýšila z 30–40 % na 65 %–70 %,“ řekl Sudhir Dureja, vrchní ředitel Enterprise Engineering.

Po provedení několika studií použitelnosti zaměstnanců si všimli, že navzdory nalezení nejrelevantnějšího znalostního článku si zaměstnanci nemusí článek přečíst celý. Došli k závěru, že délka článku je stále odrazující při získávání informací, které zaměstnanci potřebují. S ohledem na potřeby zaměstnaneckých zkušeností s obrovskými výhodami pro poskytování správné odpovědi v požadovaném formátu jsme se rozhodli rozšířit výsledky vyhledávání o generativní metody umělé inteligence.

Začátkem roku 2024 zavedli vyhledávací generativní zkušenost (SGE) na MyOracle Search, proces získávání informací zahrnující generativní modely umělé inteligence, aby se zlepšila celková uživatelská zkušenost během procesu vyhledávání. Toto vylepšení zahrnuje přidání generativního modelu umělé inteligence, který využívá výsledky vyhledávání generované umělou inteligencí, které pak poskytují konkrétní odpovědi na dotaz uživatele.

Generování rozšířeného vyhledávání

SGE je založeno na architektuře modelu Retrieval-Augmented Generation (RAG) používané v NLP, zejména při odpovídání na otázky a generování textu. Systém RAG kombinuje vektorovou databázi, model vkládání a model generování textu za účelem syntézy uzemněných odpovědí na základě získaných dokumentů. Místo zobrazení seznamu nalezených záznamů jako tradiční vyhledávání používá architektura RAG model generování textu k vytvoření přirozené jazykové odpovědi, která odpovídá na původní otázku. Abychom uživatelům dále pomohli, vygenerovaná odpověď je podpořena odkazy a odkazy na zdrojové dokumenty.

Obrázek 1: Uživatelská zkušenost MyOracle Search
Obrázek 1: Uživatelská zkušenost MyOracle Search

Obrázek 1 ukazuje vylepšenou funkci vyhledávání pomocí RAG. Funguje to takto: Když se zaměstnanec zeptá na něco jako „Jak resetuji heslo VPN“, vyhledávání používá generativní umělou inteligenci a RAG ke generování kontextově nejrelevantnějších výsledků. Tyto výsledky jsou dodávány in-line jako pokyny krok za krokem v rámci odpovědi, což eliminuje potřebu přístupu k dokumentům pro zahájení řešení problému. Kromě toho je také uveden odkaz na zdrojový dokument(y), který se používá k vytvoření odpovědí krok za krokem, pokud se zaměstnanec rozhodne prozkoumat hlouběji.

Zjednodušené blokové schéma architektury
Obrázek 2: Zjednodušené blokové schéma architektury

Obrázek 3 níže podrobně ukazuje, jak architektura RAG funguje s MyOracle Search.

Obrázek 4: Jak funguje architektura RAG MyOracle Search
Obrázek 3: Jak funguje architektura RAG MyOracle Search

Závěr

Vydání SGE v MyOracle Search se sémantickým vyhledáváním a generativní umělou inteligencí výrazně zlepšilo zážitek z vyhledávání pro všechny zaměstnance Oracle, což vedlo ke zvýšení míry prokliku a lepšímu porozumění obsahu. „Od uvedení zkušeností SGE pro zaměstnance poskytlo více než 75 % zaměstnanců pozitivní zpětnou vazbu na kvalitu generovaných odpovědí.“ řekl Sudhir Dureja, vrchní ředitel Enterprise Engineering.

Model RAG využívá obsah generovaný umělou inteligencí a NLP k poskytování cílených a kontextově relevantních odpovědí podpořených podloženými odkazy na zdrojové dokumenty. Vzhledem k tomu, že Oracle pokračuje v inovacích v oblasti podnikového vyhledávání, mohou zaměstnanci očekávat intuitivnější a inteligentnější možnosti vyhledávání, které skutečně chápou jejich záměry a poskytují přesné a použitelné informace.

V Oracle plánují rozšířit zdroje znalostí o strukturovaná i nestrukturovaná data, aby model RAG pomohl zaměstnancům najít odpovědi na jakoukoli otázku z jakékoli domény.

Další informace naleznete v následujících zdrojích:

Zdroj: Oracle