在当今的医疗保健领域,改善患者护理与优化宝贵资源的分配和效率同等重要。但仅靠人力,即使有自动化,也很难实现这一点。好消息是,机器学习正在应对这些挑战,而一家名为 Iodine Software 的公司正引领着这场创新。

该公司开创了一种名为 CognitiveMLTM 的新方法,该方法利用专有的 AI 技术和机器学习 (ML) 算法,生成实时的、高度集中的预测性洞察,临床医生和医院管理者可以利用这些洞察显著增强医疗服务的管理——从而促进关键决策、通过自动化扩大临床工作队伍规模,并改善卫生系统的财务状况。该公司的平台受到全国 700 多家医院的信任,并被 2,500 多家医疗服务提供者使用。
Iodine 如何工作
我们最近采访了 Iodine 数据科学总监 Jon Matthews,讨论了该公司如何利用机器学习提供 AI 支持的智能护理。“Iodine 在临床文档领域提供了一个先进的 AI 引擎,使医院和医疗服务提供者能够充分说明其治疗患者的状况,从而确保患者记录完整准确。因此,医院便可以获得其为患者提供的所有服务的报销,”他说。
通过将机器学习与自然语言处理相结合,Iodine 能够从临床数据中提取以前根本不可能获得的深层洞察。医疗机构利用这些洞察来提高效率、增强弹性,并为患者提供更高标准的护理。为此,Iodine 雇佣了一个由七名全职数据科学家组成的团队,他们负责维护 150 多个机器学习模型。其中一些模型被称为状况模型,它们接收来自其 NLP 系统提取的症状和诊断,以及汇总的实验室结果、医嘱、药物和其他数据,以预测患者是否确实存在某种医疗状况。

Matthews 解释了它是如何工作的:“主要有两种模型循环;一种分析文本并提取数据,另一种是表格模型,用于实际预测某人是否患有某种状况。还有第三类模型,它结合了 CNN 和 RNN 以及表格数据来预测更复杂的医疗状况。”
Iodine 雇佣了一个由七名全职数据科学家组成的团队,他们负责维护 150 多个机器学习模型。
Iodine 的系统持续接收来自其客户医院 EMR(电子病历)的数据流。公司的数据管道处理和清理数据并运行模型,模型输出到一个 Web 应用。Matthews 指出,该软件优先处理需要由临床改进专家审查的案例,这通常是当某些状况未完全记录可能需要进一步信息时发生。
“我们有一项政策规定,任何进入生产环境的内容都必须在 ClearML 中创建,”Matthews 说。“这使我们能够将代码集中在一起。我们使用 ClearML 数据存储所有数据。通过这种方式,我们可以清晰地跟踪代码,清晰地跟踪数据,并且能够很好地查看模型性能。这使得确定哪个模型表现更好变得容易。”
Iodine 如何选择 ClearML
在选择 ClearML 之前,公司演示了几种其他产品,但它们被认为过于复杂,或者试图做太多事情而做得不太好。Matthew 还指出,很难找到一个可以在本地部署的产品,这是选择 ClearML 的一个明显优势。“我非常喜欢 ClearML 的易用性,”Matthews 回忆道。“我们可以在开源服务器上试用它,并进行自己的个人项目,我们很喜欢它。我们只需要在脚本开头添加几行代码,然后它就会捕获所有内容,这真的很好。这使得我们很容易说服用户从他们基于传统文件共享的流程(将东西保存在随意的位置)转变为将所有东西集中在一起。”
保护敏感数据
使其各归其位
Matthews 指出,在使用 ClearML 之前,协助公司构建模型的顾问无法访问公司的 GPU 集群,因为他们不允许访问受保护健康信息等敏感数据。这意味着他们必须在自己的机器上完成所有工作,这效率低下。现在有了 ClearML,他们可以使用计算资源了。公司的数据科学家只需访问数据进行去身份化处理,然后将数据存储在 ClearML 中供顾问使用,这样他们就不会接触到任何敏感数据。“我们的顾问可以使用我们的 GPU 系统,而无需通过 SSH 连接到我们的机器,这是我们的安全协议不允许的,”Matthews 说。“他们可以在本地运行训练,并且只能访问他们特定的项目,从而将风险降到最低。这也帮助他们更容易地按时完成任务。”
促成更轻松的协作
他还指出,ClearML 使协作变得更加容易。“能将所有东西都公开展示并查看正在发生的事情,这很好。我也知道,如果我在做某事时遇到困难,我可以看看其他人以前是如何做的。如果其他人需要帮助,我也可以看到他们正在做什么以及他们在哪里遇到了困难,”Matthews 说。“我们还可以将其用作目录。事实上,我的一位团队成员曾询问如何创建一种新型模型,而我能够向他展示我已创建好的一个。”
最大限度地提高生产力
Matthews 发现 ClearML 的最大好处之一是挽回了先前因效率低下而浪费的时间。“使用 ClearML 后,我们停止了重复实验而浪费大量时间。以前,我们的模型构建时间可能有四分之一花在了返工上,因为我们会做一次实验,然后完全忘记发生了什么——然后一遍又一遍地做同样的事情。这种情况已经被消除,因为有了 ClearML,你可以回顾并查看你具体做了什么。”
展望未来
Matthews 表示,他们正在开发一个“发布模型”按钮和一个 Webhook,用于自动将模型上传到他们的模型服务软件,并指出这可以为每次模型部署节省八个小时。
“我们相当持续地更新模型,因为随着医学的发展,我们的数据集也在增长。我们将它们签入主产品仓库,然后在我们的预发布环境部署主产品,在那里进行测试,然后再次部署到生产环境,”Matthews 说。“为了使这个过程更容易,我们将建立一个新的模型服务基础设施,让 ClearML 可以无缝地将模型推送到生产环境,”他总结道。
如果您想开始使用 ClearML,请在 GitHub 上获取开源版本。如果您需要扩展您的 ML 管道和数据抽象,或者需要无与伦比的性能和控制,请申请演示。