Článek přečtěte do 4 min.

Datové toky Oracle Analytics Cloud (OAC) poskytují možnost slučovat datové sady v pracovních postupech přípravy dat. Kombinace dat prostřednictvím sjednocení přináší několik výhod, včetně:

  1. Slučování dat z různých zdrojů dat do jednotné datové sady.
  2. Zvětšení velikosti datové sady sloučením informací z různých časových období, geografických lokalit, produktových oblastí a tak dále.
  3. Snížení duplikace dat odstraněním opakovaných záznamů.
  4. Vytváření datových sad pouze se společnými záznamy mezi vstupními datovými sadami.

Tento článek se zaměřuje na osvědčené postupy pro kombinování datových sad se sjednoceními, abyste mohli tuto funkci efektivně používat. Pokud se chcete dozvědět o různých typech sjednocení podporovaných v OAC (mimo jiné Union All, Union, Intersect), navštivte tento blog.

Při kombinování dat se sjednoceními ze dvou zdrojových datových sad je třeba zvážit tři obecné osvědčené postupy:

  1. Ujistěte se, že mezi zdroji dat je konzistentní počet sloupců. Krok datového toku Union Rows kombinuje datové sady podle pozice a bere v úvahu celkovou strukturu obou datových sad. Pokud vaše vstupní datové sady neobsahují stejný počet sloupců, zobrazí se chybová zpráva.
  2. Věnujte pozornost pořadí sloupců. Jak je uvedeno výše, datové toky jsou kombinovány podle pozice (to znamená, že sloupec 1 v datové sadě 1 je kombinován se sloupcem 1 v datové sadě 2 atd.), takže je důležité si uvědomit umístění každého ze sloupců na vstupu datové sady. K dispozici je funkce pro změnu pořadí sloupců, která uživatelům pomáhá s uspořádáním sloupců. Datové toky nejsou kombinovány pomocí podobnosti názvů sloupců.
  3. Zajistěte konzistenci datových typů mezi odpovídajícími sloupci. Pokud se pokusíte zkombinovat datové sady, kde odpovídající sloupce obsahují nekonzistentní datové typy, zobrazí se chybová zpráva.

Následující popis vysvětluje, jak můžete tyto osvědčené postupy implementovat pomocí nástrojů v OAC.

1. Ujistěte se, že mezi zdroji dat je konzistentní počet sloupců

Existuje několik metod, jak zajistit, aby vstupní datové sady, které chcete zkombinovat, obsahovaly stejný počet sloupců. Pokud máte ke zdrojovým datovým sadám přístup pro čtení i zápis nebo plné řízení, otevřete datovou sadu a podívejte se na počet datových prvků (tj. počet sloupců) přítomných v každé tabulce ve spodní části obrazovky. Tento přístup je užitečný, pokud pracujete s datovými sadami, které obsahují mnoho sloupců. Pokud pracujete s menšími datovými sadami, můžete jednoduše spočítat počet sloupců v panelu Dataset Inspect, prostřednictvím editoru pro přípravu datové sady nebo v samotném datovém toku.

Najděte počet datových prvků v editoru přípravy dat

 

2. Věnujte pozornost pořadí sloupců

Pomocí funkce změny pořadí v kroku „Vybrat sloupce“ můžete snadno upravit pořadí, ve kterém se sloupce objeví v každé vstupní datové sadě. Existují tři hlavní způsoby, jak změnit uspořádání sloupců pomocí funkce změny pořadí:

  1. Vyberte sloupec nebo skupinu sousedních sloupců a pomocí šipek nahoru/dolů posouvejte sloupce doleva a doprava.
  2. Vyberte sloupec nebo skupinu sousedních sloupců a pomocí ikony vodorovných čar jej přetáhněte na požadované místo.
  3. Výběrem ikony se třemi tečkami otevřete nabídku akcí a výběrem možnosti Posunout nahoru nebo Posunout dolů přesunete sloupec doleva nebo doprava. Toto funguje pouze s jednotlivým sloupcem, nikoli se skupinou sousedních sloupců.

Změňte pořadí sloupců v datovém toku

Šipky na následujícím obrázku označují tři místa, kde můžete použít funkci změny pořadí sloupců:

Funkce změny pořadí sloupců v datových tocích

3. Zajistěte konzistenci datových typů mezi odpovídajícími sloupci

Existuje několik způsobů, jak můžete zkontrolovat datové typy sloupců, a několik způsobů, jak typy dat změnit.

1. Ověřte a případně změňte datové typy sloupců v editoru přípravy dat. Chcete-li změnit datové typy v samotné zdrojové datové sadě, potřebujete minimálně oprávnění pro čtení a zápis. Otevřete datovou sadu a klikněte na požadovaný sloupec. Na levé straně vidíte panel s některými informacemi souvisejícími se sloupcem, včetně datového typu. Chcete-li změnit typ dat, klikněte na tři tečky vedle názvu sloupce a vyberte Převést na <typ dat>.

Změňte datový typ sloupce v editoru přípravy dat

2. Ověřte a případně změňte datové typy sloupců v datovém toku. Tím se nezmění typ sloupce v původní datové sadě, pouze v datovém toku. (Toto je doporučený přístup, pokud nemáte přístup pro čtení a zápis ke zdrojové datové sadě nebo pokud nechcete datovou sadu upravovat). Datový typ sloupce můžete změnit pomocí kroku Transformace sloupce v toku dat. Následující obrázek ukazuje převod sloupce COST_FIXED z datového typu textu na číselný datový typ pomocí funkce Cast(). Pokud se pokoušíte převést sloupec textu na sloupec s datem a časem, navštivte tento blog.

Cast sloupec v datovém toku

Výzva k akci

Nyní, když víte více o osvědčených postupech, můžete některé z těchto návrhů vyzkoušet ve svých pracovních postupech přípravy dat při kombinování datových sad.

Zdroj: Oracle