Sebastian Menke,Savana 临床AI负责人
在 Savana,我们通过开发驱动我们应用的高性能模型,不断推进临床自然语言处理 (cNLP) 的发展。为了保持生产级质量标准并简化我们的 MLOps 流程,我们利用 ClearML,这是一个强大的 AI/机器学习平台,可提高我们的模型开发和部署效率。以下是 ClearML 如何改变我们工作流程的介绍。
利用 ClearML 流水线进行高吞吐量 cNLP 模型质量检查
我们的主要挑战之一是确保 cNLP 模型在生产环境中可靠运行。通过使用 ClearML 流水线,我们构建了一个高度模块化和可配置的处理流水线,该流水线模拟了我们的生产高吞吐量处理流水线。这使我们能够在部署模型之前运行类似于生产环境的质量检查,确保鲁棒性和性能一致性。
模块化和可扩展的推理执行
我们的 cNLP 流水线需要足够灵活,以处理各种硬件和软件需求。ClearML 为我们提供了
- 模块化流水线配置:我们可以使用多个命令行参数调整流水线行为,从而轻松测试各种配置。
- 可扩展性:无论是在 GPU、CPU 还是不同的软件环境中运行,ClearML 都支持在不同基础设施设置上无缝执行模型推理。
用户友好的 UI,用于高效的实验追踪和执行
借助 ClearML 直观的 UI,我们的数据科学家可以
- 实时监控流水线执行
- 使用预定义参数重新启动流水线
- 随时调整流水线设置 – 所有这一切无需额外编码
这种自助服务能力显著加快了实验和迭代周期,使我们能够更有效地优化模型。
透明的日志记录和元数据存储,确保合规性
保持合规性和程序文档至关重要。ClearML 通过以下方式帮助我们实现这一目标:
- 自动存储每次流水线执行的日志和元数据
- 通过全面的可追溯性确保我们满足法规和程序要求
此功能对于可审计性以及保留我们所有 MLOps 活动的良好记录至关重要。
用于实验的灵活 Jupyter 会话
除了流水线之外,我们的团队还依靠 ClearML 的 Jupyter 会话作为日常工作站。此功能使我们能够
- 根据特定用例需求,在自定义硬件和软件设置上运行代码,无论硬件是在本地还是在云端
- 灵活地实验不同的模型和配置,而无需手动管理资源和环境的开销
赋予数据科学家 MLOps 自主权
通过使用 ClearML 的 RBAC 建立稳固的权限矩阵,我们能够拥有细粒度的权限,使我们的数据科学家无需持续的 DevOps 支持即可访问计算资源和项目。这种自主权加速了我们的工作流程,并解放了 DevOps 资源用于更高级别的基础设施任务。
结论
ClearML 已成为 Savana AI 构建生态系统的重要组成部分。通过利用其流水线、UI、日志记录和灵活的 Jupyter 环境,我们优化了 cNLP 工作流程,提高了合规性,并赋予了数据科学家能力。结果如何?更快的实验、更可靠的模型以及更顺畅的生产路径。
编者注:要了解 ClearML 的实际应用,请申请演示。