客户概览:Ultraleap
Ultraleap 是一家计算机视觉公司,为尖端的 VR 和 XR 设备创建手部追踪机器学习模型。他们为不同的设备、SoC 和操作系统训练了超过 90 种变体的手部追踪模型。管理所有这些模型的数据、训练、部署及其后续谱系,特别是考虑到其研究团队的工作速度,是极具挑战性的。ClearML 的端到端机器学习平台作为其 MLOps 平台的一个组成部分,为他们提供了巨大帮助。
我们最近采访了 Ultraleap 的 MLOps 技术主管 Sam Jenkins,探讨了他们如何使用 ClearML 的端到端机器学习平台来管理大量模型训练和部署的谱系。
面临的挑战:管理复杂的工作流程
Ultraleap 机器学习工作流程的一个有趣之处在于,他们模拟大量数据来训练其手部追踪模型,但这为其本已复杂的实验谱系增加了更多复杂性。在运行新实验时,他们的团队快速生成新的合成数据集,进行数据增强,训练模型,并为多种 SoC 和 OS 类型打包模型。由于涉及如此多动态部分,Ultraleap 需要一种能够轻松管理其工作流程中维护这些变量复杂性的工具,他们选择了 ClearML 的解决方案,因为它具备实验管理能力、数据版本控制和工作负载编排功能。
解决方案:ClearML 带来的解决方案
ClearML 的编排系统集成到 Ultraleap 的 Kubernetes 集群中,使他们能够在集群的多个节点上运行数据模拟。ClearML 自动跟踪这些模拟运行的配置及其生成的数据,从而节省了手动记录所有配置和生成数据的时间。
ClearML 的开源 API 使 Ultraleap 能够轻松集成到其 GitLab 流水线中,用于打包和部署模型,以便在各种硬件目标上进行测试和部署。
ClearML 的数据管理系统允许 Ultraleap 跟踪、管理和共享新数据集,供未来实验使用。他们维护了多个“基线”数据集,并在其基础上进行迭代,改变各种参数,例如光照条件和背景,从而有效地从“基线”数据集构建数据谱系。
ClearML 为 Ultraleap 提供了管理计算资源的灵活性,使其能够轻松管理大规模云基础设施和小型本地硬件。
成果:加速研究和产品上市时间
能够快速地从已部署模型回溯到数据集以及中间的所有数据处理环节,极大地加快了研究团队的工作速度,并实现了从构思到产品的更快吞吐量。使用 ClearML 的 API 集成 Ultraleap 的下游软件打包流程,也使得 Ultraleap 的机器学习模型能够更好地进行跨团队交付。ClearML 的 UI 和实验跟踪功能还允许他们的团队轻松可视化视频数据并构建自定义度量处理程序,以方便数据集和模型之间的比较。
编者按
Ultraleap 使用 ClearML 的 AI 开发中心,一个开源解决方案,它简化了从实验到生产的 AI/ML 工作流程。通过最少的设置,开发人员可以有效地大规模构建、训练和部署模型,同时利用自动化、编排和动态计算资源管理。它与 ClearML 的 基础设施控制平面无缝集成,确保在本地、云和混合设置等各种环境中的安全执行。该平台通过结构化实验跟踪、联合数据管理以及通过 CLI、UI 或 API 简化模型部署来增强协作。ClearML 的 AI 开发中心专为可扩展性和企业安全性而设计,帮助团队加速 AI 创新,同时降低操作复杂性。要了解 ClearML 的实际应用,请 申请演示,与我们的销售团队交流。