Článek přečtěte do 3 min.

Organizace stále více přijímají strojové učení, aby dosáhly svých cílů a zůstaly konkurenceschopné, ale aby odblokovaly jeho plnou hodnotu, potřebují operace strojového učení (MLOps).

MLOps je postup zefektivnění a automatizace pracovních postupů ML, který umožňuje škálovatelné nasazení, efektivní spolupráci a konzistentní výkon modelu.

Zde přichází na řadu MLflow. Jako platforma s otevřeným zdrojovým kódem poskytuje MLflow základní nástroje pro efektivní implementaci postupů MLOps. Funguje jako most mezi vývojem a nasazením ML a pomáhá zajistit, že každý krok životního cyklu ML je dobře řízený a reprodukovatelný.

Pomocí MLflow můžete sledovat a zaznamenávat každý detail svých experimentů ML, včetně parametrů, metrik a artefaktů, vše na jednom centralizovaném místě. Umožňuje vám porovnávat různé modely a jejich výkon vedle sebe, což usnadňuje výběr toho nejlepšího pro nasazení. Funkce automatického protokolování MLflow automaticky zachycuje detaily tréninku bez ručního zadávání, což šetří čas a snižuje chyby. Poskytuje nástroje pro registraci modelů pomocí správy verzí, správu jejich životního cyklu a bezproblémové nasazení do různých prostředí.

Platforma podporuje týmovou spolupráci prostřednictvím sdílených pracovních prostorů, což usnadňuje sdílení výsledků a postřehů. MLflow také zajišťuje reprodukovatelnost, takže vaše pracovní postupy běží konzistentně bez ohledu na prostředí.

Automatizace na GitHubu nasazuje MLflow na OCI a popisuje proces.

Základní koncepty v MLflow

MLflow má následující 4 komponenty:

  • Sledování: Sleduje a zaznamenává experimenty, metriky, parametry a modely. Umožňuje srovnávací analýzu různých běhů.
  • Projekty: Balíčky opakovaně použitelného kódu ve standardizovaném formátu pro společné projekty.
  • Modely: Poskytuje standardní jednotku pro balení a opětovné použití modelů strojového učení.
  • Registr: Centrální úložiště modelů, které podporuje správu verzí a životního cyklu modelů.

MLflow a Kubeflow: Klíčové srovnání

Při porovnávání MLflow s Kubeflow slouží oba k odlišným účelům. MLflow se zaměřuje na sledování experimentů a správu životního cyklu ML, díky čemuž je lehký a uživatelsky přívětivý. Na druhou stranu je Kubeflow navržen pro automatizaci pracovních postupů ML a orchestraci kanálů. Zatímco MLflow má méně strmou křivku učení a lze jej snadněji integrovat napříč platformami, Kubeflow zazáří ve složitých scénářích vyžadujících rozsáhlou automatizaci potrubí. V závislosti na vašich potřebách může být správnou volbou kterákoli platforma, ale jednoduchost a flexibilita MLflow ji činí ideální pro mnoho případů použití ML.

Integrace MLflow s OCI

Kombinace MLflow s Oracle Cloud Infrastructure (OCI) odemyká významné výhody. Spravovaná služba Kubernetes společnosti OCI, Oracle Kubernetes Engine (OKE), poskytuje škálovatelné a spolehlivé prostředí pro nasazení MLflow. OCI Object Storage funguje jako bezpečné úložiště pro artefakty, jako jsou datové sady a modely, zatímco Resource Manager zjednodušuje nasazení. Chcete-li zvýšit zabezpečení, můžete také použít integrovanou aplikaci Oracle s MLflow, která nabízí pokročilé ověřování a správu uživatelů.

Nasazení MLflow na OCI vytváří ekosystém, kde se týmy mohou soustředit na vytváření a vylepšování modelů, aniž by se museli starat o problémy s infrastrukturou. Pomocí služeb OCI se MLflow stává výkonným nástrojem pro celý životní cyklus strojového učení.

Nasazení jedním kliknutím

Pomocí Oracle Resource Manager můžete nasadit plně nakonfigurované prostředí MLflow v několika krocích. Proces zahrnuje nastavení sítě, zřízení clusteru OKE, segmentu Object Storage a konfiguraci nástroje pro vyrovnávání zatížení. Tato integrace umožňuje MLflow efektivně fungovat na Kubernetes s minimální konfigurací.

Závěr

Přijetím MLflow na OCI získávají organizace schopnost soustředit se na to, na čem skutečně záleží: Vytváření účinných řešení ML. Tato výkonná integrace umožňuje týmům s důvěrou inovovat s vědomím, že jejich infrastruktura je postavena pro úspěch.

Další informace vám rádi sdělíme, neváhejte nás kontaktovat.

Zdroj: Oracle