监控项目进度
ClearML 提供了一整套全面的监控工具,以帮助有效地跟踪和管理机器学习项目。这些工具既提供了高级概览,也提供了关于任务执行、资源利用和项目性能的详细见解。
项目概览
项目在 UI 中的概览选项卡呈现了项目的总体情况
- 指标快照 – 项目任务中选定指标值的图示,提供进度的快速评估。
- 任务状态跟踪 – 当为快照选择单一指标变体时,任务状态会进行颜色编码(例如:已完成、已中止、已发布、已失败),以提高可见性。
使用指标快照来跟踪项目进度并识别任务性能趋势。
更多信息,请参阅项目概览。
项目仪表板
专业版计划提供
项目仪表板应用程序在 ClearML 专业版计划下可用。
项目仪表板 UI 应用程序提供项目进度、任务状态、资源使用和关键性能指标的集中视图。它提供
- 全面的见解
- 跟踪任务状态和随时间变化的趋势。
- 监控 GPU 利用率和工作进程活动。
- 分析性能指标。
- 主动警报 - 通过与 Slack 集成,仪表板可以在任务失败和完成时通知团队。
更多信息,请参阅项目仪表板。
任务监控
ClearML 通过 clearml.automation.Monitor
类提供任务监控功能。利用此类,您可以实现以下监控工作流程,例如
- 通过 Slack 或其他渠道发送通知
- 根据特定任务条件触发自动化响应
有关实际示例,请参阅Slack 警报示例,该示例演示了如何
- 跟踪任务状态(完成、失败等)
- 发送通知到指定的 Slack 频道
- 检索任务详细信息,例如状态、控制台日志以及 ClearML Web UI 的链接
您还可以为任务类型和项目配置过滤器,以减少不必要的通知。