
客户概览

Forsight 的人工智能算法实时分析闭路电视摄像头画面,以监控建筑工地是否遵守个人防护设备规定,检测危险,并发现入侵者、火灾或其他对工地构成威胁的危险。在新冠疫情期间,它甚至监控工地是否保持社交距离。Forsight 的技术就像工地经理的眼睛,在工地需要注意时立即发送警报。
挑战
他们已经到了一个地步,标注任务花费的时间几乎与处理模型花费的时间一样多,他们知道自己需要一个更顺畅、更自动化的流程。
Forsight 等应用型计算机视觉系统依靠深度学习实时检测和识别物体及运动。它们需要识别人员的存在、他们的穿着,以及火灾或危险结构形成等非生命元素。可以想象,构建一个全面解决方案所需的数据集和模型训练量庞大、多样且复杂。
该公司使用 Bitbucket 进行代码管理和版本控制,但作为数据沿袭工具,它存在局限性。他们没有一个简化、有条理的方法来跟踪和记录实验。此外,Forsight 团队
重视在设计、运行和分析实验方面的团队合作与协作。他们需要一个专为轻松协作而设计的工具,该工具无需复杂集成,也不会增加一个侵入式的用户界面层来管理。
他们的下一个挑战是管理标注过程的复杂性。他们收集的海量数据需要进行组织和标注,以便在同一数据上进行重复实验,或在不同模型上使用同一数据集。他们已经到了一个地步,手动完成这些工作花费的时间几乎与处理模型花费的时间一样多,他们知道自己需要一个更顺畅、更自动化的流程。
最后,他们最紧迫的问题是数据不平衡。使用客户数据构建模型本身没有问题,除非由于特定工地性质导致某些特定类别的数据代表性不足。Forsight 的训练流程通过在识别到差距时进行数据增强来解决这个问题,但这需要细致的管理来跟踪这些增强,以便在不直接与代码交互的情况下调整、添加、复制或删除它们,最重要的是,要进行随机化处理以确保良好的覆盖率,同时仍然保证可复现性。
Forsight 的 AI 开发达到了物流上的限制;Forsight 团队正在寻找一个“多面手”的 ML Ops 解决方案来处理他们日常实验流程的复杂性。
解决方案
当然,Forsight 团队考虑的任何解决方案都必须与 TensorFlow(他们广泛用于训练)以及他们自己的内部工具无缝集成。他们持怀疑态度,因为他们自己构建的组件显然不可能有现成的 API 或连接器。
在研究过程中,团队惊讶地听说 Clear ML 声称只需向任何软件添加两行代码即可实现集成。尝试开源版本没有任何损失,他们很高兴看到事实确实如此。“这听起来像是个噱头或空头承诺,”Forsight 首席技术官 Ivan Ralašić 说,“但听起来再不可思议,这就是事实。”
尽管他们确实定制了自己的系统以优化这种“关系”,但他们很快实现了无缝、流畅的集成。更好的是,从 ClearML 的全面产品套件中,他们需要的功能随时可用,开箱即用。
ClearML 还使 Forsight 能够将他们的工作与基础设施解耦,并且随着他们开始扩展规模,将他们的运营转移到云端。
现在确信产品线能够兑现承诺,并且准备好使用功能齐全、托管且受支持的、具有更强数据版本控制能力的实现方案,他们升级到了 ClearML Enterprise。他们不仅期待额外的功能,还欢迎 ClearML 托管带来的便利性。ClearML。
结果
Ralašić 列出了他的团队采用 ClearML 后看到的一系列变化。“首先,”他解释说,“我们已经开始进行更多实验,因为这样做更简单……无论是线性实验还是并行进行多个实验。” 通过使用 ClearML Orchestrate,他们还优化了 DevOps,将其角色基本上转变为 ML Ops:他们可以根据需要动态启动新的云计算资源,并在每次实验中实时评估模型或数据更改对 CPU、GPU 和内存性能的影响。
至于支持方面?“团队非常棒,”他说,“我们经常通过 Slack 与他们交流,他们会给出我们需要的回应。”
“毫不夸张地说,”Ralašić 总结道,“我们用同一个团队轻松地运行了 10 倍的实验。而且范围也发生了变化——我们从数千个数据集跃升到数百万个,而无需增加人手。没有比这更具成本效益的了。”