跳至主要内容

监控项目进度

ClearML 提供了一整套全面的监控工具,以帮助有效地跟踪和管理机器学习项目。这些工具既提供了高级概览,也提供了关于任务执行、资源利用和项目性能的详细见解。

项目概览

项目在 UI 中的概览选项卡呈现了项目的总体情况

  • 指标快照 – 项目任务中选定指标值的图示,提供进度的快速评估。
  • 任务状态跟踪 – 当为快照选择单一指标变体时,任务状态会进行颜色编码(例如:已完成、已中止、已发布、已失败),以提高可见性。

使用指标快照来跟踪项目进度并识别任务性能趋势。

更多信息,请参阅项目概览

Project Overview Project Overview

项目仪表板

专业版计划提供

项目仪表板应用程序在 ClearML 专业版计划下可用。

项目仪表板 UI 应用程序提供项目进度、任务状态、资源使用和关键性能指标的集中视图。它提供

  • 全面的见解
    • 跟踪任务状态和随时间变化的趋势。
    • 监控 GPU 利用率和工作进程活动。
    • 分析性能指标。
  • 主动警报 - 通过与 Slack 集成,仪表板可以在任务失败和完成时通知团队。

更多信息,请参阅项目仪表板

Project Dashboard Project Dashboard

任务监控

ClearML 通过 clearml.automation.Monitor 类提供任务监控功能。利用此类,您可以实现以下监控工作流程,例如

  • 通过 Slack 或其他渠道发送通知
  • 根据特定任务条件触发自动化响应

有关实际示例,请参阅Slack 警报示例,该示例演示了如何

  • 跟踪任务状态(完成、失败等)
  • 发送通知到指定的 Slack 频道
  • 检索任务详细信息,例如状态、控制台日志以及 ClearML Web UI 的链接

您还可以为任务类型和项目配置过滤器,以减少不必要的通知。

Slack Alerts Slack Alerts