在组织内部采用和部署生成式AI对于推动创新、超越竞争对手至关重要,同时也能提高效率、生产力和实现可持续增长。
认识到AI的采用并非一刀切的过程,每个组织都有其独特的用例、挑战、目标和资源。下面的框架试图认识到这种多样性,并为在组织内部规划有效采用和部署生成式AI时提供了基础支柱和关键考量因素:
1. 统一语言
AI采用的一个常见障碍是跨部门和利益相关者缺乏统一的理解。通过建立统一的语言,我们在整个采用过程中为更顺畅的沟通和协作铺平道路。要做到这一点,请启动讨论,定义AI并探索其为您、您的部门以及整个组织带来的各种益处。确保所有利益相关者对AI的含义(以及不含义)有标准化的理解。
2. 用例
从何处开始至关重要。您必须制定与数据可访问性和可用性相符的用例,并且为了推动竞争性创新,您可能还需要 venturing into uncharted territories,其益处大于风险——在评估和优先排序您的生成式AI用例时,请权衡“风险规避”和“回报驱动”之间的微妙平衡。
在权衡各种业务用例时,精确性是不可妥协的。使用通用的大型语言模型(LLMs)产生方向性准确但不具体的响应是次优的。像GPT-4这样的模型有效地服务于寻求基于大量数据获得建议或见解的消费者。虽然这些模型可能满足公司对LLMs的初步好奇心,或作为概念验证(POC)的现有可行方案,但当面临对深度、领域特定知识查询需要准确响应的需求时,它们就会显得力不从心。
话虽如此,当考虑广泛的企业级生成式AI业务集成时,特别是在企业环境中,在我们最近的《财富》1000强调查中引用的三个常见用例需要大量访问内部文档和组织数据,以产生精确和有益的结果。它们是:
A) 服务于内部团队支持的内容推荐引擎
B) 战略、公司规划和财务助手
C) 将Gen AI集成为产品功能
为这些用例定制的模型可能需要在本地部署或安全的私有云上部署,以保护公司数据和知识产权。这意味着您的企业可能需要投资组建内部团队来支持多种模型的不同用例。
3. 加速采用价值证明 (POV) 与概念验证 (POC) 的原型设计
在评估解决方案,特别是在采用新技术时,原型设计在Gen AI采用中是一个关键决策。我们的框架提倡企业使用真实数据进行原型设计,同时选择一种简化的方法,例如价值证明 (POV),以使他们能够更快地向前失败并评估狭窄的成功指标,而不是复杂、跨部门的POCs。当公司考虑大规模采用大型语言模型时,微调成为关键一步。务必评估适用于您特定用例的LLMs的可行性和类型(AI即服务、开源等)。
企业经常花费大量时间和金钱来定义大量的用例,但他们可以通过使用真实业务数据进行原型设计来加快过程,从而快速评估最小可行产品(MVP)和可行性,同时考虑安全性、合规性和知识产权保护。随着组织考虑在员工或应用程序中广泛集成LLMs以应对各种用例,务必认识到基础模型虽然具备逻辑和命令理解能力,但缺乏您独特业务的内在知识。
4. 基础设施
AI人才和部署团队假定所需的基础设施,如AI和MLOps框架、硬件限制、容器平台、云操作、数据存储、数据科学框架、数据工程和知识工作者反馈循环以及运行多种编程技术的能力已经到位。请务必仔细审计这一点,并确保您确实拥有所需的基础设施来支持您大规模采用和部署生成式AI。
5. 人才与知识
任何AI项目的成功都关键取决于您的AI/ML团队的能力。通常,内部人才可能缺乏手头任务所需的特定技能组合,因此需要聘请外部专家来大规模主导生成式AI项目。如果您选择在生成式AI部署和采用的初始阶段聘请外部团队,您现有团队可以跟随外部人才,并随着时间的推移逐步建立内部专业知识。
LLM与传统机器学习(ML)模型之间的一个关键区别在于对主动质量保证(QA)的关键需求。值得注意的是,负责构建和训练LLM的数据工程师往往缺乏主题领域的专业知识。由于LLM的生成性特点,让内部利益相关者和知识工作者参与测试并就模型准确性提供反馈,利用人类反馈强化学习(RLHF)变得异常重要。这些数据应迅速反馈到模型微调过程中,以确保基于您独特知识的持续优化。
6. 基准测试、沟通与TCO
从一开始就建立您的成功标准;否则,您将缺乏标准化的方法来评估输出是否与目标、预算和关键绩效指标(KPIs)一致。对于组织和AI领导层来说,务必制定一种有效、战略性的方法来计算、预测和控制成本,并根据他们自己的组织及其独特的业务用例进行调整。
一种方法是使用ClearML的Gen AI总拥有成本(TCO)计算器,其中考虑了各种成本驱动因素和变量,例如您的用例、公司规模、计算提供商、模型最终用户数量、数据语料库类型和体积以及选择的大型语言模型(LLM)API。通过此工具,您可以估算数据准备、所需人力资本及其相关费用以及最佳运行所需的计算或Token数量。
7. 购买(AI即服务)与构建的决策
在决定购买AI即服务还是构建自己的解决方案时,选择取决于您的用例、规模和使用模式等因素。虽然生成式AI有望带来前所未有的商业机会,但它伴随着相当大的不确定性和业务风险,特别是关于运行和可变成本升级的可能性,尤其是在企业规模下。
监控和预测这些成本可能具有挑战性,特别是考虑到最近一项ClearML/AIIA调查显示,57%的《财富》1000强高管受访者表示他们的董事会预计未来财年AI/ML投资将带来两位数的收入增长,另有37%预计将带来个位数的增长。应对与生成式AI相关的隐藏运营成本这个未知领域可能显得陌生和不可预测。然而,为了在投资和预期结果之间取得平衡,务必制定一种有效、战略性的方法来计算、预测和控制这些成本,并根据您的组织及其独特的用例进行调整。考虑使用允许您的组织直接从您的内部业务数据控制和创建AI模型的工具和平台,而不会丢失任何AI即服务的能力。
8. 数据,数据,数据
数据是AI成功的基础。这是我们框架中官方的、经常被低估和忽视的关键组成部分。它涉及基于您组织真实数据可用性、质量、复杂性和政策进行广泛和诚实的内部协调讨论。它需要早期让治理、风险和合规利益相关者参与审批。结构化和非结构化数据语料库和数据集必须是干净的,您的独特数据摄取(和逻辑)可能是一个非常具有挑战性的步骤。然而,市场上有少数工具提供低代码、安全、端到端的企业级LLM平台,具备数据接入、训练、质量控制和部署功能,例如ClearGPT,它具有预建的向导,使过程简单并可为未来的更新复制。
有兴趣了解更多关于如何在您的组织中利用AI和机器学习的信息吗?申请我们Gen AI平台ClearGPT的演示。如果您需要扩展您的ML管道和数据抽象,或者需要无与伦比的性能和控制,请申请ClearML的演示。