Artwork

İçerik Kubernetes Bytes, Ryan Wallner, and Bhavin Shah tarafından sağlanmıştır. Bölümler, grafikler ve podcast açıklamaları dahil tüm podcast içeriği doğrudan Kubernetes Bytes, Ryan Wallner, and Bhavin Shah veya podcast platform ortağı tarafından yüklenir ve sağlanır. Birinin telif hakkıyla korunan çalışmanızı izniniz olmadan kullandığını düşünüyorsanız burada https://tr.player.fm/legal özetlenen süreci takip edebilirsiniz.
Player FM - Podcast Uygulaması
Player FM uygulamasıyla çevrimdışı Player FM !

Training Machine Learning (ML) models on Kubernetes

55:29
 
Paylaş
 

Manage episode 421319868 series 3332465
İçerik Kubernetes Bytes, Ryan Wallner, and Bhavin Shah tarafından sağlanmıştır. Bölümler, grafikler ve podcast açıklamaları dahil tüm podcast içeriği doğrudan Kubernetes Bytes, Ryan Wallner, and Bhavin Shah veya podcast platform ortağı tarafından yüklenir ve sağlanır. Birinin telif hakkıyla korunan çalışmanızı izniniz olmadan kullandığını düşünüyorsanız burada https://tr.player.fm/legal özetlenen süreci takip edebilirsiniz.

In this episode of the Kubernetes Bytes podcast, Bhavin sits down with Bernie Wu, VP Strategic Partnerships and AI/CXL/Kubernetes Initiatives at Memverge. They discuss about how Kubernetes is the most popular platform to run AI model training and model inferencing jobs. The discussion dives into model training, talking about different phases of a DAG, and then talk about how Memverge can help users with efficient and cost-effective model checkpoints. The discussion goes into topics like saving costs by using spot instances, hot restart of training jobs, reclaiming unused GPU resources, etc.

Check out our website at https://kubernetesbytes.com/

Episode Sponsor: Nethopper

  • Learn more about KAOPS: @nethopper.io
  • For a supported-demo: info@nethopper.io
  • Try the free version of KAOPS now! https://mynethopper.com/auth

Cloud Native News:

  • https://www.aquasec.com/blog/linguistic-lumberjack-understanding-cve-2024-4323-in-fluent-bit/
  • https://kubernetes.io/blog/2024/05/20/completing-cloud-provider-migration/
  • https://thenewstack.io/introducing-aks-automatic-managed-kubernetes-for-developers/
  • https://www.harness.io/blog/harness-to-acquire-split

Show Links:

  • https://www.linkedin.com/in/berniewu/
  • https://criu.org/Main_Page
  • https://memverge.com/
  • https://youtu.be/tY8YOMRuqWI?si=yB3hHqLUpYPZ-KWN
  • https://youtu.be/ND4seSKpJHI?si=shh0iuA9qC-dO6eb

Timestamps:


  continue reading

81 bölüm

Artwork
iconPaylaş
 
Manage episode 421319868 series 3332465
İçerik Kubernetes Bytes, Ryan Wallner, and Bhavin Shah tarafından sağlanmıştır. Bölümler, grafikler ve podcast açıklamaları dahil tüm podcast içeriği doğrudan Kubernetes Bytes, Ryan Wallner, and Bhavin Shah veya podcast platform ortağı tarafından yüklenir ve sağlanır. Birinin telif hakkıyla korunan çalışmanızı izniniz olmadan kullandığını düşünüyorsanız burada https://tr.player.fm/legal özetlenen süreci takip edebilirsiniz.

In this episode of the Kubernetes Bytes podcast, Bhavin sits down with Bernie Wu, VP Strategic Partnerships and AI/CXL/Kubernetes Initiatives at Memverge. They discuss about how Kubernetes is the most popular platform to run AI model training and model inferencing jobs. The discussion dives into model training, talking about different phases of a DAG, and then talk about how Memverge can help users with efficient and cost-effective model checkpoints. The discussion goes into topics like saving costs by using spot instances, hot restart of training jobs, reclaiming unused GPU resources, etc.

Check out our website at https://kubernetesbytes.com/

Episode Sponsor: Nethopper

  • Learn more about KAOPS: @nethopper.io
  • For a supported-demo: info@nethopper.io
  • Try the free version of KAOPS now! https://mynethopper.com/auth

Cloud Native News:

  • https://www.aquasec.com/blog/linguistic-lumberjack-understanding-cve-2024-4323-in-fluent-bit/
  • https://kubernetes.io/blog/2024/05/20/completing-cloud-provider-migration/
  • https://thenewstack.io/introducing-aks-automatic-managed-kubernetes-for-developers/
  • https://www.harness.io/blog/harness-to-acquire-split

Show Links:

  • https://www.linkedin.com/in/berniewu/
  • https://criu.org/Main_Page
  • https://memverge.com/
  • https://youtu.be/tY8YOMRuqWI?si=yB3hHqLUpYPZ-KWN
  • https://youtu.be/ND4seSKpJHI?si=shh0iuA9qC-dO6eb

Timestamps:


  continue reading

81 bölüm

Tüm bölümler

×
 
Loading …

Player FM'e Hoş Geldiniz!

Player FM şu anda sizin için internetteki yüksek kalitedeki podcast'leri arıyor. En iyi podcast uygulaması ve Android, iPhone ve internet üzerinde çalışıyor. Aboneliklerinizi cihazlar arasında eş zamanlamak için üye olun.

 

Hızlı referans rehberi