Článek přečtěte do 3 min.

Služba Oracle Cloud Infrastructure (OCI) Document Understanding vám umožňuje provádět sofistikovanou extrakci dokumentů ve velkém měřítku bez jakýchkoli znalostí z oblasti datové vědy. Poskytuje předem připravené modely pro extrakci textu s optickým rozpoznáváním znaků, klasifikaci dokumentů, extrakci tabulek a extrakci klíčových hodnot pro faktury, účtenky, pasy a řidičské průkazy.

S potěšením oznamujeme obecnou dostupnost dvou nových funkcí:

Vlastní extrakce klíčové hodnoty a vlastní klasifikace dokumentů. Díky těmto doplňkům mohou zákazníci snadno přizpůsobit modely extrakce klíčových hodnot a klasifikace dokumentům specifickým pro jejich odvětví nebo konkrétní případy použití. Tyto funkce jsou dostupné ve všech komerčních oblastech OCI a lze k nim přistupovat prostřednictvím sad OCI pro vývojáře softwaru (SDK) a rozhraní REST API.

Vlastní extrakce klíčové hodnoty pro porozumění dokumentu

Představte si, že máte na starosti zpracování formulářů nákladního listu pro vaši logistickou společnost. Každý den obdržíte stovky těchto formulářů obsahujících zásadní informace, jako jsou sledovací ID, jména příjemců a přepravců a přiřazení nákladních vozidel. Váš tým tradičně extrahoval tyto informace z formulářů a zadával je do vašeho systému, což je časově náročné a náchylné k chybám. Tato únavná práce ovlivňuje morálku a produktivitu zaměstnanců a se zvyšujícím se objemem formulářů se stává stále větší výzvou pro řízení.

Pomocí OCI Document Understanding můžete vytvořit vlastní model extrakce klíčových hodnot, který se učí z práce, kterou v minulosti vykonali lidé. Když je model trénován na předchozích formulářích nákladního listu, dokáže automaticky identifikovat tato klíčová pole na příchozích dokumentech nákladního listu, což lidem umožňuje provádět méně únavné úkoly.

Snímek obrazovky stránky Analýza v konzole zobrazující podrobnosti o modelu pro vlastní model extrakce klíčové hodnoty.

Vlastní klasifikace dokumentů pro porozumění dokumentům

S vlastní extrakcí klíčových hodnot také zavádíme klasifikaci dokumentů jako novou funkci. Tento výkonný nástroj umožňuje automaticky kategorizovat dokumenty na základě jejich rozvržení a obsahu, takže je snazší než kdy jindy spravovat a zpracovávat velké objemy dokumentů. Představte si, že přijímáte nové zaměstnance a požadujete, aby uchazeči předložili doklady totožnosti, záznamy o očkování, doporučující dopisy a vyplněnou přihlášku. Pomocí vlastní klasifikace dokumentů můžete automaticky kategorizovat příchozí dokumenty do těchto kategorií a automatizovat úkoly, jako je dotazování žadatele na chybějící dokument, ověřování konzistentnosti jmen mezi ID a certifikáty, předávání dopisu s doporučením náborovému manažerovi a mnoho dalších úkolů.

Snímek obrazovky stránky Analyzovat v konzole zobrazující podrobnosti o modelu pro vlastní model klasifikace dokumentů.

Použití vlastních modelů porozumění dokumentům

Chcete-li trénovat vlastní model pomocí OCI Document Understanding, použijte následující kroky:

  1. Začněte s označenou datovou sadou. Pomocí služby OCI Data Labeling můžete snadno označovat dokumenty a sledovat výuková videa zveřejněná v seznamu videí.
  2. Vytvořte projekt v OCI Document Understanding. Zde můžete uspořádat sbírku modelů pro konkrétní případ použití nebo úkol. Chcete-li vytvořit model, vyberte typ modelu – extrakci klíčových hodnot nebo klasifikaci dokumentu – a dobu trvání školení. Výchozí hodnota je „doporučeno“.
  3. Po zahájení školení nového modelu jsou na stránce Podrobnosti modelu v konzole Oracle Cloud a prostřednictvím rozhraní Document Understanding model API k dispozici průběh školení modelu, protokoly a konečné metriky kvality.
  4. Chcete-li volat svůj vlastní model dokumentu, zahrňte OCID modelu jako součást pole ID modelu ve vstupním požadavku. Následující příklad ukazuje požadavek JSON na volání vlastního modelu extrakce hodnoty klíče:
    {
    
    "processorConfig": {
    
    "processorType": "GENERAL",
    
    "features": [
    
    {
    
    "modelId": "[your-model-ocid]",
    
    "featureType": "KEY_VALUE_EXTRACTION"
    
    }
    
    ],
    
    "isZipOutputEnabled": false
    
    },
    
    "compartmentId": "[your-compartment-ocid]",
    
    "inputLocation": {
    
    "sourceType": "INLINE_DOCUMENT_CONTENT",
    
    "data": "......"
    
    },
    
    "outputLocation": {
    
    "namespaceName": "[your-namespace]",
    
    "bucketName": "[your-bucket]",
    
    "prefix": "[your-prefix]"
    
    }
    
    }

Skutečné případy použití s ​​porozuměním dokumentů

Každý měsíc zpracovává jeden podnik tisíce dokumentů zahraničního obchodu, jako jsou obchodní faktury, nákladní listy a osvědčení o původu. Ruční příjem a zpracování takových dokumentů vede k selhání, nízké shodě a potenciálním chybám v datech. Vypořádat se s velkým množstvím dokumentů a škálovat obchodní operace po celém světě je výzvou.

eCOMEX NSI vytvořil řešení pro extrakci dokumentů a automatizaci pomocí OCI Document Understanding s názvem eCOMEX Digital Assistant. Pomocí vlastní extrakce klíčových hodnot byli schopni extrahovat informace o dodavatelích a příjemcích, cenách a datových polích zboží z dokumentů zahraničního obchodu. Díky tomu byli schopni výrazně minimalizovat nebo eliminovat ruční zadávání dat. Automatizací rutin zákazníků při zpracování dokumentů zahraničního obchodu byli schopni snížit náklady, zefektivnit operace a zajistit dodržování předpisů.

Aplikace OAN Order Management poskytuje pracovní prostor, kde se setkávají lidé, procesy a technologie. Špičková technologie Oracle Cloud se používá k výraznému zjednodušení a automatizaci každodenních úkolů, takže tým zákaznických služeb může lépe soustředit svůj čas na činnosti s přidanou hodnotou, které zvyšují zapojení zákazníků. oAppsNET použil Oracle AI Document Understanding, protože je snadné se naučit, vytvořit vlastní model AI a integrovat do jejich řešení automatizace prodejních objednávek, což umožnilo oAppsNET nabídnout podnikové řešení automatizace prodejních objednávek s minimem času a úsilí.

Zdroj: Oracle