Článek přečtěte do 4 min.
Oracle Analytics a AI Document Understanding Integration
Příklady pasových obrázků používaných v Oracle Analytics k rozpoznání textu a dat vypršení platnosti na základě předem trénovaného modelu OCI AI.

Řešení Oracle Analytics se nyní integrují s porozumění dokumentům Oracle Cloud Infrastructure (OCI) AI!

AI Document Understanding je služba OCI AI, která umožňuje vývojářům extrahovat text, tabulky a další klíčová data ze souborů dokumentů pomocí rozhraní API a nástrojů rozhraní příkazového řádku. S OCI AI Document Understanding můžete automatizovat zdlouhavé obchodní úlohy zpracování pomocí předem sestavených modelů AI a přizpůsobit extrakci dokumentů tak, aby vyhovovaly vašim specifickým potřebám.

Můžete použít předem připravené modely pro extrakci textu, extrakci tabulek, extrakci klíčových hodnot a klasifikaci dokumentů. Jakmile si vyberete předem trénovaný model, můžete nahrát své obrázky, poté model zaregistrovat v Oracle Analytics Cloud (OAC) a použít svůj model v datový tok pro extrakci klíčových hodnot ze životopisu, pasu, účtenky nebo faktury.

Zde je návod, jak můžete vytvořit projekt vizualizace dat založený na porozumění dokumentu OCI AI ve 4 krocích do 5 minut.

Postup je následující:

  1. Nahrajte ukázkové obrázky pasů do služby Oracle Cloud do veřejného úložiště objektů.
  2. Zaregistrujte si model porozumění dokumentům OCI AI ve službě Oracle Analytics Cloud.
  3. Vytvořte datový tok pro použití modelu AI na ukázkové obrázky pasů.
  4. Přidejte rozpoznané klíčové hodnoty do datové sady a použijte tuto datovou sadu v sešitu k vizualizaci dat.

Předpokladem je mít instanci Oracle Analytics Cloud s připojením k OCI.

Krok 1 – Vytvořte bucket v OCI

  1. Připojte se k OCI na této adrese URL: https://www.oracle.com/cloud/sign-in.html
  2. Klikněte na možnost nabídky, poté Úložiště vytvořte Segment a nastavte název.
  3. Nahrajte do bucketu všechny obrázky dokumentů potřebné k trénování a testování vašeho modelu.
  4. Prozatím zveřejněte bucket. V tomto příkladu je bucket „Bucket-vision-ai“, který byl dříve vytvořen, a do složky s názvem AID jsem nahrál 9 vzorových pasových obrázků.

Tento krok vygeneruje umístění, kde bude mít OAC přístup k nahraným obrázkům a použít model AI.

Krok 2 – Zaregistrujte svůj model v cloudu Oracle Analytics

  1. Na domovské stránce OAC klikněte na nabídku 3 malých teček („…“ nebo tři tečky) v pravém horním rohu.
  2. Vyberte „Registrovat model/funkci“ a vyberte „OCI Document Understanding Models“
  3. Po výběru vyberte připojení OCI. Pokud neexistuje, budete muset vytvořit nové připojení v OAC (Create > Connection > OCI Resource).
  4. Vyskočí okno Vyberte model. Vyberte typ modelu Extrakce předtrénované hodnoty klíče dokumentu.
  5. V pravém postranním panelu vyberte svůj OCI Bucket a vyberte typ dokumentu. V tomto příkladu je to Pas.
Oracle Analytics Register AI model
Příklad výběru předtrénovaných modelů AI pro extrakci klíčových hodnot dokumentů v OAC.

Krok 3 – Použijte model AI na své obrázky

  1. Vytvořte nový datový tok v OAC.
  2. Vytvořte datovou sadu pomocí souboru CSV včetně vaší adresy URL segmentu.
  3. Přidejte datovou sadu do datového toku.
  4. Přidejte krok Použít model umělé inteligence, abyste na obrázky použili svůj předem trénovaný model umělé inteligence. Pokud používáte datovou sadu zobrazující obrázky jako řádkovou položku, vyberte adresu URL segmentu v Parametrech nebo Umístění souboru.
  5. Vyberte „Dokumenty“ jako Typ vstupu, pokud používáte obrázky rozdělené na jednotlivé položky, nebo „Segmenty“, pokud používáte adresu URL svého segmentu.
  6. Přidejte krok pro uložení dat do nové datové sady. Uložená data by měla obsahovat název obrázku a adresy URL a také extrahovaný text/číslo klíčových hodnot.

Datový tok načte snímky, analyzuje je pomocí předem trénovaného modelu umělé inteligence a extrahuje klíčové hodnoty ze snímků. V tomto příkladu pasové dokumenty. Poté datový tok načte všechny informace do datové sady, kterou můžete použít k prozkoumání a vizualizaci dat.

Datový tok s použitím modelu umělé inteligence v Oracle Analytics
Tento snímek obrazovky ukazuje příklad toku dat s výsledky generovanými modelem AI.

Krok 4 – Vizualizujte výsledky v Oracle Analytics.

  1. Vytvořte nový Sešit v OAC.
  2. Přidejte novou datovou sadu vygenerovanou datovým tokem.
  3. Přidejte Obrázkový plugin vizualizační objekt, abyste viděli všechny obrázky ve vašem segmentu.
  4. Použijte tento objekt obrázku jako filtr kliknutím na ikonu filtru v levém horním rohu.
  5. Vytvořte novou tabulku, která zobrazí všechny sloupce vaší datové sady.
  6. Kliknutím na jeden z obrázků pasu zobrazíte extrahovanou hodnotu klíče v tabulce.
  7. Nyní můžete tento sešit použít jako výchozí bod k vytvoření dalších výpočtových metrik pro filtrování a analýzu dokumentů. V tomto příkladu jsem se rozhodl analyzovat datum vypršení platnosti a vytvořit koblihu podmíněného formátování, abych ukázal, zda vypršela (červená) nebo prošla (zelená).
AI Document Understanding používané s Oracle Analytics
Příklad sešitu OAC pomocí pluginu obrázků, porozumění dokumentům OCI AI a podmíněného formátování na metrikách výpočtu.

Zákazníci používají OCI AI Document Understanding k rozpoznání různých typů dokumentů ve velkém měřítku, od pasů přes faktury až po účtenky a životopisy. Oracle Analytics umožňuje aplikovat a vizualizovat data během několika minut, což vám pomůže rychle přejít od dat ke statistikám, akcím a rozhodnutím.

Tipy pro vizualizaci dat

Zdroj: Oracle