Odemykání dat pomocí převodu textu do SQL
Generativní umělá inteligence slibuje transformaci způsobu, jakým lidé a aplikace přistupují k datům, používají je a chápou je. S pomocí GenAI by uživatelé měli být schopni řešit své problémy na koncepční úrovni obchodních termínů a metrik, které jsou pro ně nejvhodnější, spíše než na úrovni dat, která vyžaduje, aby se učili podrobnosti o doménově specifických dotazovacích jazycích a databázových schématech, vyhledávali a prořezávali data, trávili čas transformací dat z jednoho formátu do druhého nebo se zabývali fúzí různorodých dat a jejich propojením s daty mimo hranice své organizace. Klíčovým krokem k naplnění tohoto slibu je schopnost transformovat dotazy v přirozeném jazyce do dotazů SQL, známých jako Text-to-SQL neboli NL2SQL.
Organizace se však po léta spoléhají na databáze jako systém záznamů pro každodenní operace a strategická rozhodnutí a výzva přístupu k těmto datům prostřednictvím interakcí v přirozeném jazyce je obrovská a vyhýbá se přímému použití i špičkových modelů velkých jazyků (LLM). Například špičkové LLM, jako je GPT-5, dosahují v některých klíčových benchmarkech NL2SQL, jako je Spider 2.0, skóre pod 15%. Překlad dotazů v přirozeném jazyce do přesných, spustitelných výrazů SQL je z mnoha důvodů velmi obtížný. Patří mezi ně problémy na straně databáze – rozsáhlá a složitá schémata, která obsahují sloupce a tabulky s nejednoznačnými a neinformativními názvy, a také problémy na straně dotazů – dotazy často vyžadují rozklad do více primitivních dotazů, což vyžaduje iterativní proces generování, a potřeba podporovat specifické typy uvažování (aritmetické, časové, hypotetické), které se vyhýbají univerzálním modelům.
Společnost Oracle AI vyvíjí nový přístup a řešení, které řeší tyto výzvy NL2SQL. Některé aspekty řešení se používají v řešení Oracle Reasoning-based Natural Language to SQL Solution – generativním agentickém řešení založeném na umělé inteligenci, které právě získalo první místo v soutěži Archer NL2SQL Evaluation Challenge 2025. Tato soutěž zahrnuje převod přirozeného jazyka do SQL (NL2SQL) se složitým uvažováním nad více databázemi, doménami, tabulkami a jazyky. Řešení Oracle Reasoning-based Natural Language to SQL Solution nejenže překonalo globální konkurenty o více než 9 bodů v přesnosti provádění, ale také dosáhlo parity mezi výkonem v angličtině a čínštině, což je milník v oblasti vícejazyčného převodu textu do SQL.
Proč na Archerovi záleží
Přestože řešení Oracle Reasoning-based Natural Language to SQL Solution odhaluje pouze některé aspekty řešení Oracle SQL, úspěch tohoto řešení v Archeru je velmi významný, protože benchmark Archeru zvyšuje laťku pro Text-to-SQL zavedením problémů s uvažováním, které jdou nad rámec jednoduchého vyhledávání schémat.
Pochopení dotazů v Archeru vyžaduje:
- Aritmetické uvažování (např. poměry, procenta, tempo růstu)
- Inference založená na zdravém rozumu (implicitní fakta o entitách nebo podmínkách)
- Hypotézy a kontrafaktuální teorie („Co z toho vyplývá, pokud by všechna X měla Y?“)
- Dvojjazyčné provádění (dotazy v angličtině + čínštině napříč stejnými databázemi)
Úspěch vyžaduje nejen správnou syntaxi SQL (validitu), ale také platnou přesnost provedení (EX): zda SQL vrátí správnou odpověď.
Řešení od společnosti Oracle: Řešení převodu přirozeného jazyka do SQL založené na uvažování
Řešení Oracle Reasoning-based Natural Language to SQL využívá k NL2SQL plánovací multiagentní přístup. Namísto přímého mapování textu → SQL zavádí explicitní mezikrok s plánovacím agentem, který vrací plán v přirozeném jazyce. Tento plán je poté SQL agentem převeden na SQL příkaz.
- Plánovací agent
- Rozloží uživatelský dotaz na kroky uvažování.
- Zdokonaluje plán pomocí metapromptingu řízeného zpětnou vazbou: chybové případy jsou seskupeny a zredukovány do pokynů , které zlepšují zobecnění.
- Integruje pokyny pro propojování entit, aby bylo zajištěno přesné zpracování vícejazyčných a transliterovaných termínů (např. „约翰·尼斯尼克“ přeložené jako „John Nisinik“, když je správné mapování v angličtině „John Nizinik“) a zpracovává alternativní názvy entit.
- SQL Agent
- Převádí plány v přirozeném jazyce do spustitelného SQL, obohaceného o načtené schéma a kontextové příklady.
- Zajišťuje syntaktickou a sémantickou platnost.
- Robustnost díky diverzitě
- Pro každý dotaz se generuje více kandidátských plánů.
- Jejich SQL výstupy jsou provedeny a pro výběr nejspolehlivější odpovědi je použit krok ověření konzistence.
Výsledky: První místo na Archer 2025
Řešení Oracle Reasoning-based Natural Language to SQL se umístilo na celkově 1. místě v dvojjazyčném žebříčku Archeru: Překonalo HIT–SCIR, který se umístil na druhém místě v roce 2025, a zlepšilo přesnost provádění o 6,3 bodu v angličtině (54,96% oproti 48,66%) a o 12,6 bodu v čínštině (56,67% oproti 44,08%) v testovací sadě (viz obrázek 2), čímž se zmenšila mezijazyčná mezera pozorovaná v předchozích systémech.
Je pozoruhodné, že framework Oracle si udržel >99% validitu SQL, což se ukázalo jako spolehlivé a přesné napříč různými jazyky.
Klíčové inovace
- Meta-prompting se zpětnou vazbou: Lehká alternativa k multiagentní orchestraci. Zdokonalením systémových promptingů plánovače o zpětnou vazbu od lidí a modelů zlepšuje řešení Oracle Reasoning-based Natural Language to SQL přesnost uvažování o 28 bodů v angličtině ve srovnání s neupraveným plánovačem, jak je znázorněno na obrázku 3a a obrázku 3b (studie ablace pro angličtinu).
- Propojování entit pro robustnost v oblasti více jazyků: Řešení společnosti Oracle řeší nedostatek výkonu mezi angličtinou a čínštinou, kde se předchozí systémy potýkaly s neshodami v transliteraci. Plánují rozšířit rámec na všechny jazyky, abychom omezili problémy s neshodami entit způsobené různými tvary stejného výrazu, jako například „NYC“ a „New York City“ .
- Diverzifikace a konsenzus plánu: Řešení Oracle Reasoning-based Natural Language to SQL, inspirované principy ansámblu, snižuje zkreslení směrem k jednomu plánu tím, že se spoléhá na rozmanité kandidátské plány a hlasování založené na provedení.
Důsledky pro podniky
Vítězství v benchmarku je vzrušující, ale co to znamená pro zákazníky společnosti Oracle?
- Přirozené podnikové dotazy: Firemní uživatelé mohou klást hypotetické otázky, například: „Jaký je meziroční růst prémiových účtů v azijsko-pacifickém regionu?“ a získat přesné výsledky podložené SQL.
- Vícejazyčná podpora: Globální podniky mohou zadávat dotazy v angličtině i čínštině bez ztráty přesnosti. Řešení bude zobecněno tak, aby podporovalo i další jazyky.
- Důvěryhodné výstupy: Kombinací plánování, propojování entit a ověřování konzistence snižuje řešení převodu přirozeného jazyka do SQL založené na uvažování počet „chyb založených na uvažování“ – nesprávných odpovědí skrytých v platně vypadajícím SQL.
To je přímo v souladu s vizí společnosti Oracle: zajistit intuitivní a podnikovou úroveň přístupu k datům založenému na umělé inteligenci (GenAI).
Pohled do budoucna
Řešení Oracle Reasoning-based Natural Language to SQL ukazuje, že plánovací agenti NL2SQL mohou překonat přístupy s přímou generací. OraSQL je integrován do produktového řešení pro NL2SQL.
Mezi některé budoucí směry patří:
- Škálování na vícedialektový SQL nad rámec Archeru (např. PL/SQL).
- Integrace s aplikacemi Oracle Fusion pro přirozené dotazování napříč doménami.
Závěrem
- Řešením Oracle Reasoning-based Natural Language to SQL Solution společnost Oracle prokázala svůj důraz na vývoj inovativních generativních řešení s využitím umělé inteligence pro kritické obchodní problémy. Některé aspekty obecného řešení, které jsou prezentovány v řešení Oracle Reasoning-based Natural Language to SQL Solution, ilustrují, jak promyšlená optimalizace plánovače, zdokonalování založené na zpětné vazbě a vícejazyčné propojování entit mohou překonávat bariéry v převodu textu na SQL.
- Vítězstvím v soutěži Archer 2025 v Oracle nejen nastavili novou úroveň, ale také ukázali, jak Oracle GenAI utváří budoucnost přístupu k podnikovým datům: přesný, vícejazyčný a důvěryhodný.
Více informací vám o produktech Oracle rádi dodáme.
Zdroj: Oracle