Článek přečtěte do 8 min.

V dnešním světě se spolehlivost cloudové infrastruktury stala kritickým faktorem pro podniky, které jsou závislé na cloudových aplikacích a službách. Jakýkoli výpadek nebo přerušení může mít za následek ztrátu příjmů, poškození pověsti značky a dokonce ztrátu zákazníků. Co může způsobit rozsáhlé selhání systému? Některé scénáře zahrnují přírodní katastrofu, kybernetický útok, výpadek proudu, výpadek hardwaru nebo dokonce lidskou chybu.

Zde vstupuje do hry odolnost a vzorce odolnosti. Co je ale odolnost a jak se projevuje v cloudové terminologii? Odolnost označuje schopnost infrastruktury rychle se zotavit ze selhání nebo přerušení a pokračovat v hladkém provozu. V cloud computingu jsou vzory odolnosti navrženy tak, aby zajistily, že aplikace zůstanou dostupné a výkonné i v případě selhání nebo přerušení. Některé z klíčových součástí odolnosti cloudu zahrnují redundanci, dostupnost, škálovatelnost, odolnost proti chybám, plánování obnovy po havárii, mechanismy zálohování a obnovy a průběžné monitorování a testování.

Odolnost v OCI

Oracle Cloud Infrastructure (OCI) uznává důležitost odolnosti a poskytuje robustní sadu vzorů odolnosti. Tyto vzory odolnosti jsou navrženy tak, aby zajistily, že aplikace a služby hostované na OCI jsou vysoce dostupné, škálovatelné, odolné proti chybám a rychle se zotavují ze selhání nebo jakékoli formy narušení. Zavedením těchto opatření organizace zvyšují pravděpodobnost, že jejich cloudové systémy a aplikace vydrží narušení a budou i nadále efektivně fungovat tváří v tvář nepřízni osudu.

Díky zajištění redundance nabízejí vzory odolnosti OCI několik pokročilých funkcí, jako je multiregionální architektura, rychlé převzetí služeb při selhání a automatické obnovení. Tyto funkce pomáhají vašim aplikacím rychle se zotavit a pokračovat v jejich fungování i v případě katastrof nebo velkých poruch.

Ochrana před ztrátou služeb nebo ztrátou dat je vždy vícevrstvá disciplína. Základní bloky OCI – regiony, domény dostupnosti, domény chyb, zálohování a obnova, nástroje pro vyrovnávání zátěže, automatické škálování, zabezpečení a monitorování – nám pomáhají navrhovat architektury tak, aby čelily nepřízni osudu a zotavily se z nich.

Odolnost cloudu se stává stále důležitější, protože stále více organizací přijímá cloud computing a spoléhá se na něj pro kritické obchodní operace. Upřednostněním odolnosti cloudu mohou organizace minimalizovat riziko výpadků, ztráty dat a poškození pověsti, a nejen udržovat, ale také zvyšovat a vytvářet důvěru u zákazníků a zúčastněných stran, a získat tak větší důvěru.

Regiony OCI

Regionální architektura OCI je navržena se zaměřením na odolnost, aby zákazníkům umožnila dosáhnout odolnosti napříč více regiony a poskytla ochranu proti regionálním katastrofám, jako jsou přírodní katastrofy, výpadky elektřiny a výpadky sítě. Tato odolnost je navržena tak, aby v případě úplného výpadku regionu mohla aplikace přejít do jiné oblasti, což umožňuje bezproblémový provoz s nulovými až minimálními prostoji během přerušení. Nasazením aplikací ve více regionech mohou zákazníci těžit z geografické rozmanitosti, snížené latence a lepšího výkonu.

Regionální architektura OCI také poskytuje zákazníkům možnost snadno implementovat řešení pro obnovu po havárii. Prostřednictvím této implementace je převzetí služeb při selhání do jiné oblasti automatické, což snižuje jakékoli zpoždění a lidské zásahy, což pomáhá vést k nepřetržitým obchodním operacím.

Domény dostupnosti

Domény dostupnosti OCI poskytují vysokou úroveň odolnosti tím, že distribuují vaše aplikace do více fyzicky oddělených datových center v rámci jednoho regionu. Každá doména dostupnosti je navržena tak, aby byla zcela nezávislá, s vlastním napájením, chlazením, sítí a připojením k internetu. Pokud tedy jedna doména dostupnosti zaznamená výpadek nebo přerušení, ostatní pokračují v normálním provozu a poskytují vysokou úroveň dostupnosti a ochrany proti jednotlivým bodům selhání.

Domény dostupnosti OCI jsou navrženy tak, aby mezi sebou poskytovaly konektivitu s nízkou latencí a velkou šířkou pásma, což umožňuje bezproblémové převzetí služeb při selhání a vyvažování zátěže mezi doménami dostupnosti. Vaše aplikace tak mohou využívat výhod odolnosti domén dostupnosti bez obětování výkonu. Kromě toho OCI poskytuje pro každou doménu dostupnosti smlouvu o vyšší úrovni dostupnosti služeb (SLA), která zajišťuje, že vaše aplikace budou mít vysokou úroveň provozuschopnosti. Celkově poskytují domény dostupnosti OCI robustní a spolehlivý základ pro vytváření vysoce dostupných a odolných aplikací.

Chybové domény

Odolnost domény chyb je důležitým aspektem vzorců odolnosti OCI. Chybová doména je logické seskupení hardwaru a infrastruktury v rámci domény dostupnosti navržené tak, aby minimalizovalo riziko souvisejících selhání. Ve výchozím nastavení OCI umisťuje instance a prostředky do více domén poruch v rámci domény dostupnosti, což zajišťuje, že pokud dojde k selhání nebo výpadku pouze u jedné domény poruchy, ostatní mohou pokračovat v normální činnosti.

Tento přístup poskytuje další vrstvu odolnosti a odolnosti proti chybám v rámci domény dostupnosti tím, že zajišťuje distribuci vašich instancí na více fyzických serverech v datovém centru. Každá poruchová doména je navržena tak, aby byla zcela izolovaná od ostatních s vlastní energetickou a síťovou infrastrukturou. Tato izolace pomáhá zajistit, že pokud dojde k selhání nebo výpadku pouze jednoho fyzického serveru, ostatní budou nadále fungovat jako obvykle, což pomáhá předcházet kaskádovým selháním a chránit před problémy souvisejícími s hardwarem.

Zálohování a obnova

OCI poskytuje komplexní, robustní sadu možností zálohování a obnovy, které pomáhají zajistit, aby vaše aplikace a data byly chráněny před ztrátou a poškozením dat. Řešení zálohování a obnovy OCI jsou navržena tak, aby byla vysoce škálovatelná a odolná s automatickým zálohováním, obnovou v určitém okamžiku a schopností replikace ve více regionech. Řešení zálohování a obnovy OCI jsou také integrována s dalšími službami OCI, jako je Object Storage a Block Storage, aby poskytovaly bezproblémové a integrované prostředí pro ochranu a obnovu dat.

Vyvažování zátěže a řízení dopravy

Služba OCI Load Balancing poskytuje vysoce dostupné a škálovatelné řešení pro distribuci provozu mezi více instancemi a doménami dostupnosti. Pomocí Load Balancingu můžete snadno distribuovat provoz mezi více instancí a doménami dostupnosti, což poskytuje vysokou úroveň odolnosti a ochrany proti selhání nebo narušení. Load Balancing také poskytuje pokročilé funkce, jako je ukončení SSL, kontroly stavu a persistence relace, což z něj dělá ideální řešení pro moderní, vysoce dostupné architektury.

OCI Load Balancing nepřetržitě monitoruje stav instancí a automaticky zjišťuje a odstraňuje nezdravé instance z fondu, čímž eliminuje riziko odesílání provozu do nefunkční instance. OCI Load Balancing také umožňuje konfigurovat kontroly stavu pro vaše instance, což mu umožňuje detekovat a izolovat nezdravé instance dříve, než ovlivní celkovou službu.

Služba Oracle DNS může distribuovat provoz do více regionů a zajistit tak geografickou odolnost. Díky schopnosti řízení provozu ve více regionech můžete směrovat provoz do nejbližšího regionu na základě vaší polohy, čímž zajistíte, že uživatelé budou mít nízkou latenci a budou mít přístup ke službě, i když dojde k výpadku celého regionu.

Automatické škálování

Služba OCI Autoscaling poskytuje vysoce a škálovatelné odolné řešení pro automatické škálování vašich aplikací v reakci na změny poptávky. Pomocí automatického škálování můžete snadno definovat zásady škálování na základě metrik, jako je využití CPU nebo rychlost požadavků nebo definovaný plán, a OCI automaticky přidává nebo odebírá instance podle potřeby, aby byla zachována požadovaná úroveň výkonu a dostupnosti.

Automatické škálování je také integrováno s dalšími službami OCI, jako je vyvažování zátěže a výpočet, aby bylo zajištěno bezproblémové používání. Integruje se také s funkcí fondu instancí OCI, která vám umožňuje vytvořit fond identických instancí, které lze společně škálovat. Tato integrace poskytuje efektivnější způsob správy prostředků a zajišťuje, že všechny instance ve fondu mají stejné konfigurace a jsou připraveny zvládnout provoz.

Bezpečnostní

Služby OCI Security poskytují komplexní bezpečnostní strategii, která zahrnuje zabezpečení sítě, správu identit a přístupu a šifrování dat. Používejte bezpečnostní služby a funkce OCI, jako je správa identity a přístupu (IAM), virtuální cloudová síť (VCN) a seznamy zabezpečení, brána firewall webových aplikací (WAF), skupiny zabezpečení sítě (NSG), služba správy klíčů (KMS) a ochrana cloudu , aby se zvýšila odolnost proti bezpečnostním hrozbám.

Implementace bezpečnostních služeb Oracle do vaší architektury OCI může pomoci zajistit, aby byl váš systém odolný a chráněný před bezpečnostními hrozbami. Je nezbytné navrhnout a implementovat bezpečnostní strategii, která pokryje všechny vrstvy systému, od sítě až po aplikační vrstvu. Dobře navržená a implementovaná bezpečnostní strategie může pomoci zajistit odolnost a dostupnost vašeho systému.

Vzory odolné architektury na OCI

Od dubna 2023 nabízí OCI služby ze 41 oblastí veřejného cloudu ve 22 zemích. Každá oblast Oracle Cloud nabízí konzistentní sadu více než 100 cloudových služeb navržených pro rychlejší a bezpečnější provoz libovolné aplikace za méně peněz. Nejnovější informace naleznete v části Oblasti veřejného cloudu.

Grafika zobrazující současné a budoucí oblasti Oracle Cloud po celém světě.

Začleněním základních bloků do architektury OCI mohou podniky navrhnout robustní a flexibilní architekturu schopnou odolat různým narušením. Tyto technologie můžete použít v kombinaci k vytvoření komplexního a efektivního řešení architektury, které poskytuje vysokou úroveň ochrany kritických systémů a dat.

Pojďme nakreslit vzory odolné architektury na OCI pro odolnost infrastruktury, dat a aplikací.

Odolnost infrastruktury

Následující architektura obsahuje následující funkce:

  • Tři domény dostupnosti v jedné cloudové oblasti
  • Čtyři aplikační servery se stejným kódem a funkcemi
  • Jedna databáze Oracle s povoleným pohotovostním režimem
  • Jeden aktivní vyvažovač zátěže

Vysoce dostupná a odolná architektura je nasazena v rámci jedné oblasti OCI. Ochrana je k dispozici pro selhání datového centra, selhání hardwaru a selhání softwaru. Také je zabudována výchozí redundance pomocí záložního nástroje pro vyrovnávání zátěže. Pokud dojde k poruše, záložní vyvažovač zátěže automaticky převezme zátěž primárního vyvažovače zátěže.

Všechny aplikační servery jsou nasazeny v různých poruchových doménách, což zajišťuje ochranu před selháním hardwaru nebo výpadkem napájení aplikačních serverů. Vzhledem k tomu, že domény dostupnosti jsou rozšířené po celém regionu, aplikační servery jsou chráněny před výpadkem napájení nebo jakoukoli katastrofou na úrovni domény dostupnosti. Každý z aktivních aplikačních serverů čte a zapisuje do služby Oracle Base Database běžící na virtuálním počítači (VM) nasazeném v AD1. Ochrana databáze běžící v AD1 je povolena replikací databázových bloků do AD2. Je-li záložní databáze aktuální, může primární v případě selhání převzít selhání.

Grafika znázorňující architekturu pro nasazení napříč doménami dostupnosti.

Odolnost dat

Oracle Maximum Availability Architecture (MAA) pro službu Database poskytuje výběr referenčních architektur, včetně bronzové, stříbrné, zlaté a platinové. Každá referenční architektura poskytuje optimální sadu funkcí pro ochranu dat a obnovu dat během neplánovaných výpadků a plánovaných událostí údržby. Schopnosti a výhody služeb se zvyšují, když přecházíme od bronzu přes stříbro přes zlato až po platinu.

Referenční architektura MAA

Grafika zobrazující úrovně architektury maximální dostupnosti pro službu databáze OCI.

Referenční architektura Platinum MAA

Referenční architektura Platinum má nejvyšší potenciál zajistit dostupnost a odolnost pro plánované události i neplánované výpadky. Tato architektura je postavena na referenční architektuře Gold a rozšířena přidáním replikační technologie Oracle GoldenGate. Oracle GoldenGate provádí logickou replikaci napříč regiony, zatímco Oracle Data Guard aplikuje fyzické změny na databáze, které jsou v různých doménách dostupnosti. Tato architektura poskytuje nejvyšší úroveň odolnosti. Můžete naplánovat zálohování pro místní nebo vzdálené lokality.

Grafika znázorňující architekturu úrovně Platinum, včetně doby obnovy a cílů bodů obnovy.

Cíl doby obnovy a cíl bodu obnovy pro referenční architekturu Platinum MAA

Typ výpadku Výpadek Událost Očekávaný RTO Očekávaný RTO
Neplánovaný Obnovitelné selhání instance Nula Nula
Opravitelné selhání serveru Nula Nula
Poškození dat, selhání webu Nula Nula až sekundy
Plánováno Reorganizace Nula Nula
Údržba hardwaru nebo O/S Nula Nula
Většina databázových záplat Nula Nula
Upgrady databáze a sady oprav Nula Nula
Migrace platforem Nula Nula
Upgrady aplikací Nula Nula

Odolnost aplikace

Následující architektura řešení byla nasazena v následujících oblastech a aplikacích:

  • Dva regiony, jako Ashburn a Phoenix
  • Dvě domény dostupnosti v každé oblasti cloudu
  • Dva aplikační servery se stejným kódem a funkcemi, které se replikují do Phoenixu.
  • Jedna databáze Oracle s okamžitým pohotovostním režimem v AD1 stejného regionu a crossregion Data Guard na AD1 regionu 2
  • Jeden globální nástroj pro vyrovnávání zatížení

Vysoce dostupná a odolná architektura je nasazena v několika oblastech: Ashburn a Phoenix. Ochrana je dostupná pro selhání v celém regionu a v rámci regionu, selhání celého datového centra, selhání hardwaru a selhání softwaru. Pro globální nástroj pro vyrovnávání zatížení je zabudována výchozí redundance pomocí pohotovostního nástroje pro vyrovnávání zatížení.
Pokud dojde k poruše, záložní vyvažovač zátěže automaticky převezme zátěž primárního vyvažovače zátěže. Všechny aplikační servery jsou nasazeny v různých poruchových doménách, které poskytují ochranu proti selhání hardwaru nebo výpadku napájení aplikačních serverů. Vzhledem k tomu, že domény dostupnosti jsou rozšířené po celém regionu, aplikační servery také získají ochranu před výpadkem napájení nebo jakoukoli katastrofou na úrovni domény dostupnosti.

Každý z aktivních aplikačních serverů musí číst a zapisovat do služby Oracle Base Database spuštěné na virtuálním počítači nasazeném v AD2 v oblasti Ashburn 1. Ochrana databáze běžící na AD2 je povolena replikací databázových bloků do AD1 s okamžitým pohotovostním režimem databáze a regionální pohotovostní režim zřízený v oblasti Phoenix, což je v případě selhání některé z oblastí.

Grafika znázorňující architekturu pro nasazení ve dvou oblastech.

Závěr

Odolnost cloudu hraje zásadní roli při zajišťování provozní kontinuity a pomáhá organizacím dosahovat jejich obchodních cílů. Přijetím správné strategie může odolnost obnovit důvěru a snížit náklady. K odolným architekturám postaveným na OCI můžete přistupovat v Architecture Center.

Zdroj: Oracle