Článek přečtěte do 6 min.

Odemykání dat pomocí převodu textu do SQL

Generativní umělá inteligence slibuje transformaci způsobu, jakým lidé a aplikace přistupují k datům, používají je a chápou je. S pomocí GenAI by uživatelé měli být schopni řešit své problémy na koncepční úrovni obchodních termínů a metrik, které jsou pro ně nejvhodnější, spíše než na úrovni dat, která vyžaduje, aby se učili podrobnosti o doménově specifických dotazovacích jazycích a databázových schématech, vyhledávali a prořezávali data, trávili čas transformací dat z jednoho formátu do druhého nebo se zabývali fúzí různorodých dat a jejich propojením s daty mimo hranice své organizace. Klíčovým krokem k naplnění tohoto slibu je schopnost transformovat dotazy v přirozeném jazyce do dotazů SQL, známých jako Text-to-SQL neboli NL2SQL.

Organizace se však po léta spoléhají na databáze jako systém záznamů pro každodenní operace a strategická rozhodnutí a výzva přístupu k těmto datům prostřednictvím interakcí v přirozeném jazyce je obrovská a vyhýbá se přímému použití i špičkových modelů velkých jazyků (LLM). Například špičkové LLM, jako je GPT-5, dosahují v některých klíčových benchmarkech NL2SQL, jako je Spider 2.0, skóre pod 15%. Překlad dotazů v přirozeném jazyce do přesných, spustitelných výrazů SQL je z mnoha důvodů velmi obtížný. Patří mezi ně problémy na straně databáze – rozsáhlá a složitá schémata, která obsahují sloupce a tabulky s nejednoznačnými a neinformativními názvy, a také problémy na straně dotazů – dotazy často vyžadují rozklad do více primitivních dotazů, což vyžaduje iterativní proces generování, a potřeba podporovat specifické typy uvažování (aritmetické, časové, hypotetické), které se vyhýbají univerzálním modelům.

Obrázek 1. Přehled řešení Oracle Reasoning Natural Language to SQL: (a) Planner Agent s optimalizovaným systémovým výzvou, zahrnujícím metavýzvy a propojování entit pro řešení problémů s transliterací a neshodami. Pro zajištění robustnosti jsou generovány různé plány. (b) SQL Agent zpracovává tyto plány pomocí načteného schématu a kontextových příkladů pro zvýšení kvality s krokem ověření konzistence, který vybírá konečný výstup z různých kandidátů SQL. Oracle AI vyvíjí nový přístup a řešení, které řeší tyto výzvy NL2SQL. Některé aspekty našeho řešení se používají v Oracle Reasoning-based Natural Language to SQL Solution – generativním agentickém řešení založeném na umělé inteligenci, které právě získalo první místo v soutěži Archer NL2SQL Evaluation Challenge 2025. Tato výzva zahrnuje převod přirozeného jazyka do SQL (NL2SQL) se složitým uvažováním nad více databázemi, doménami, tabulkami a jazyky. Oracle Reasoning-based Natural Language to SQL Solution nejenže překonalo globální konkurenty o více než 9 bodů v přesnosti provádění, ale také dosáhlo parity mezi výkonem angličtiny a čínštiny, což je milník ve vícejazyčném převodu textu do SQL.
Obrázek 1. Přehled řešení převodu přirozeného jazyka do SQL založeného na Oracle Reasoning: (a) Agent plánovače s optimalizovaným systémovým výzvou, zahrnující metavýzvy a propojování entit pro řešení problémů s transliterací a neshodami. Pro zajištění robustnosti jsou generovány různé plány. (b) Agent SQL zpracovává tyto plány s využitím načteného schématu a kontextových příkladů pro zvýšení kvality a s krokem ověření konzistence, který vybírá konečný výstup z různých kandidátů SQL.

Společnost Oracle AI vyvíjí nový přístup a řešení, které řeší tyto výzvy NL2SQL. Některé aspekty řešení se používají v řešení Oracle Reasoning-based Natural Language to SQL Solution – generativním agentickém řešení založeném na umělé inteligenci, které právě získalo první místo v soutěži Archer NL2SQL Evaluation Challenge 2025. Tato soutěž zahrnuje převod přirozeného jazyka do SQL (NL2SQL) se složitým uvažováním nad více databázemi, doménami, tabulkami a jazyky. Řešení Oracle Reasoning-based Natural Language to SQL Solution nejenže překonalo globální konkurenty o více než 9 bodů v přesnosti provádění, ale také dosáhlo parity mezi výkonem v angličtině a čínštině, což je milník v oblasti vícejazyčného převodu textu do SQL.

Proč na Archerovi záleží

Přestože řešení Oracle Reasoning-based Natural Language to SQL Solution odhaluje pouze některé aspekty řešení Oracle SQL, úspěch tohoto řešení v Archeru je velmi významný, protože benchmark Archeru zvyšuje laťku pro Text-to-SQL zavedením problémů s uvažováním, které jdou nad rámec jednoduchého vyhledávání schémat.

Pochopení dotazů v Archeru vyžaduje:

  • Aritmetické uvažování (např. poměry, procenta, tempo růstu)
  • Inference založená na zdravém rozumu (implicitní fakta o entitách nebo podmínkách)
  • Hypotézy a kontrafaktuální teorie („Co z toho vyplývá, pokud by všechna X měla Y?“)
  • Dvojjazyčné provádění (dotazy v angličtině + čínštině napříč stejnými databázemi)

Úspěch vyžaduje nejen správnou syntaxi SQL (validitu), ale také platnou přesnost provedení (EX): zda SQL vrátí správnou odpověď.

Řešení od společnosti Oracle: Řešení převodu přirozeného jazyka do SQL založené na uvažování

Řešení Oracle Reasoning-based Natural Language to SQL využívá k NL2SQL plánovací multiagentní přístup. Namísto přímého mapování textu → SQL zavádí explicitní mezikrok s plánovacím agentem, který vrací plán v přirozeném jazyce. Tento plán je poté SQL agentem převeden na SQL příkaz.

  1. Plánovací agent
    1. Rozloží uživatelský dotaz na kroky uvažování.
    2. Zdokonaluje plán pomocí metapromptingu řízeného zpětnou vazbou: chybové případy jsou seskupeny a zredukovány do pokynů , které zlepšují zobecnění.
    3. Integruje pokyny pro propojování entit, aby bylo zajištěno přesné zpracování vícejazyčných a transliterovaných termínů (např. „约翰·尼斯尼克“ přeložené jako „John Nisinik“, když je správné mapování v angličtině „John Nizinik“) a zpracovává alternativní názvy entit.
  2. SQL Agent
    1. Převádí plány v přirozeném jazyce do spustitelného SQL, obohaceného o načtené schéma a kontextové příklady.
    2. Zajišťuje syntaktickou a sémantickou platnost.
  3. Robustnost díky diverzitě
    1. Pro každý dotaz se generuje více kandidátských plánů.
    2. Jejich SQL výstupy jsou provedeny a pro výběr nejspolehlivější odpovědi je použit krok ověření konzistence.

Výsledky: První místo na Archer 2025

Řešení Oracle Reasoning-based Natural Language to SQL se umístilo na celkově 1. místě v dvojjazyčném žebříčku Archeru: Překonalo HIT–SCIR, který se umístil na druhém místě v roce 2025, a zlepšilo přesnost provádění o 6,3 bodu v angličtině (54,96% oproti 48,66%) a o 12,6 bodu v čínštině (56,67% oproti 44,08%) v testovací sadě (viz obrázek 2), čímž se zmenšila mezijazyčná mezera pozorovaná v předchozích systémech. 

Obrázek 2. Oficiální výsledky žebříčku Archer NL2SQL Challenge 2025 na neviditelné testovací sadě (přesnost provedení %). Naše řešení převodu přirozeného jazyka na SQL založené na technologii Oracle Reasoning, které se skládá z plánovacího agenta a SQL agenta (který jako podkladový model využívá GPT-5), dosahuje nejlepšího výkonu ze všech ostatních účastníků.
Obrázek 2. Oficiální výsledky žebříčku Archer NL2SQL Challenge 2025 na neviditelné testovací sadě (přesnost provedení %). Řešení převodu přirozeného jazyka na SQL založené na technologii Oracle Reasoning, které se skládá z plánovacího agenta a SQL agenta (který jako podkladový model využívá GPT-5), dosahuje nejlepšího výkonu ze všech ostatních účastníků.

Je pozoruhodné, že framework Oracle si udržel >99% validitu SQL, což se ukázalo jako spolehlivé a přesné napříč různými jazyky.

Klíčové inovace

  • Meta-prompting se zpětnou vazbou: Lehká alternativa k multiagentní orchestraci. Zdokonalením systémových promptingů plánovače o zpětnou vazbu od lidí a modelů zlepšuje řešení Oracle Reasoning-based Natural Language to SQL přesnost uvažování o 28 bodů v angličtině ve srovnání s neupraveným plánovačem, jak je znázorněno na obrázku 3a a obrázku 3b (studie ablace pro angličtinu).
výsledek ablace s vanilkou
Obrázek 3a. Studie ablace a porovnání modelů pro řešení Oracle Reasoning-based Natural Language to SQL Solution (základní model: GPT-5) na vývojové sadě. Ablační studie na vývojové sadě v angličtině hodnotí příspěvek modulu plánovače a vliv zdokonalení jeho systémového promptu. Odebrání modulu plánovače vede k podstatnému poklesu výkonu, což potvrzuje jeho nezbytnost pro efektivní uvažování. Nahrazení optimalizovaného promptu plánovače zjednodušenou verzí, která vynechává cílené pokyny odvozené z metapromptu řízeného zpětnou vazbou, dále vede k dalšímu (významnému) poklesu, což demonstruje důležitost zdokonalení promptu. Porovnáváme také řešení Oracle Reasoning-based Natural Language to SQL Solution (GPT-5) s běžným GPT-5 a zdůrazňujeme zvýšení výkonu, které přinášejí celkové multiagentní komponenty.
ablační studie
Obrázek 3b. Porovnání mezi řešením Oracle Reasoning-based Natural Language to SQL Solution (GPT-4o), kde je základní model nahrazen modelem GPT-4o, a HIT–SCIR (GPT-4o), druhým nejlépe fungujícím týmem používajícím stejný základní model, na anglické a čínské vývojové sadě. Řešení Oracle Reasoning-based Natural Language to SQL Solution konzistentně dosahuje lepších výsledků i u GPT-4o, což naznačuje, že zisky vyplývají z námi navrhovaného rámce, a nikoli pouze ze silnějších schopností uvažování GPT-5.
  • Propojování entit pro robustnost v oblasti více jazyků: Řešení společnosti Oracle řeší nedostatek výkonu mezi angličtinou a čínštinou, kde se předchozí systémy potýkaly s neshodami v transliteraci. Plánují rozšířit rámec na všechny jazyky, abychom omezili problémy s neshodami entit způsobené různými tvary stejného výrazu, jako například „NYC“ a „New York City“ .
  • Diverzifikace a konsenzus plánu: Řešení Oracle Reasoning-based Natural Language to SQL, inspirované principy ansámblu, snižuje zkreslení směrem k jednomu plánu tím, že se spoléhá na rozmanité kandidátské plány a hlasování založené na provedení.

Důsledky pro podniky

Vítězství v benchmarku je vzrušující, ale co to znamená pro zákazníky společnosti Oracle?

  • Přirozené podnikové dotazy: Firemní uživatelé mohou klást hypotetické otázky, například: „Jaký je meziroční růst prémiových účtů v azijsko-pacifickém regionu?“ a získat přesné výsledky podložené SQL.
  • Vícejazyčná podpora: Globální podniky mohou zadávat dotazy v angličtině i čínštině bez ztráty přesnosti. Řešení bude zobecněno tak, aby podporovalo i další jazyky.
  • Důvěryhodné výstupy: Kombinací plánování, propojování entit a ověřování konzistence snižuje řešení převodu přirozeného jazyka do SQL založené na uvažování počet „chyb založených na uvažování“ – nesprávných odpovědí skrytých v platně vypadajícím SQL.

To je přímo v souladu s vizí společnosti Oracle: zajistit intuitivní a podnikovou úroveň přístupu k datům založenému na umělé inteligenci (GenAI).

Pohled do budoucna

Řešení Oracle Reasoning-based Natural Language to SQL ukazuje, že plánovací agenti NL2SQL mohou překonat přístupy s přímou generací. OraSQL je integrován do produktového řešení pro NL2SQL.

Mezi některé budoucí směry patří:

  • Škálování na vícedialektový SQL nad rámec Archeru (např. PL/SQL).
  • Integrace s aplikacemi Oracle Fusion pro přirozené dotazování napříč doménami.

Závěrem

  • Řešením Oracle Reasoning-based Natural Language to SQL Solution společnost Oracle prokázala svůj důraz na vývoj inovativních generativních řešení s využitím umělé inteligence pro kritické obchodní problémy. Některé aspekty obecného řešení, které jsou prezentovány v řešení Oracle Reasoning-based Natural Language to SQL Solution, ilustrují, jak promyšlená optimalizace plánovačezdokonalování založené na zpětné vazbě a vícejazyčné propojování entit mohou překonávat bariéry v převodu textu na SQL.
  • Vítězstvím v soutěži Archer 2025 v Oracle nejen nastavili novou úroveň, ale také ukázali, jak Oracle GenAI utváří budoucnost přístupu k podnikovým datům: přesný, vícejazyčný a důvěryhodný.

Více informací vám o produktech Oracle rádi dodáme.

Zdroj: Oracle