如何启动一个可控的AI项目
简介
随着数据科学、机器学习和人工智能的热度不断上升,越来越多的企业感受到了来自 AI 的焦虑,好像不做 AI 就有可能落后于技术趋势。但说句老实话,至少 90%的企业做不了 AI,不是不适合,是做不了,没这个能力。
该如何选择正确的项目呢?难道应该选择时髦的面向消费者的解决方案,比如聊天机器人、虚拟助手或计算机视觉应用吗?或者最好还是专注于嵌入式的后台项目,这些项目可以悄悄地帮助改进内部运营、提高员工效率或决策能力吗?一般来说,人工智能项目可以分为以下几类:
增加营业收入的、避免合规风险的、降低运营成本的、提升竞争优势的、提升团队效率的
由于有很多个潜在的使用案例但资源有限,因此重要的是将具有高商业价值和高成功率的项目优先考虑。这就是一个古老的框架——五个 W 和一个 H——对于开始人工智能(AI)之路的企业发挥作用的地方。
理想的 AI 项目应该对每个问题都有清晰而令人信服的答案:
• 这个项目标用户是谁?
• 它将如何具体改善体验或结果,以及如何衡量这一点?
• 使用 AI 进行这个目的为什么比现有过程更好?
• 如果成功了,它的优势是什么,如果失败了会有什么后果?
• 数据从哪里来,是否已经存在?
• 应该何时交付初始工作原型以及随后的生产最终解决方案?
本文将详细讨论每个这些考虑因素,并提供示例、策略和后续问题,以帮助指导选择最终将带来业务价值的 AI 用例。
[Who]这个项目的目标用户是谁?
个重要的考虑因素是认识到“用户”不必一定是外部的——受益于 AI 项目的人当然可以是企业内部的员工,特别是如果用例旨在提高内部的速度或团队效率。
例如:
一家金融服务企业正在考虑是否构建一个面向外部的应用程序,具体来说是一个虚拟助手,可以与手机银行应用程序和小爱同学集成。在深入项目之前,确定是否有特定用户群体对产品最相关非常重要。一个重要的问题可能是:这些特定细分市场对于整个业务战略有多重要?
要点:
• 在构建解决方案之前,为 AI 项目定义一个特定的用户。
• 协作至关重要——开发 AI 项目的人员需要与目标用户或其他行业专家密切合作,不仅要选择,而且要真正了解用户。他们是谁?他们的需求是什么?他们的当前流程和习惯是什么?
[How]AI 项目将如何具体改善目标用户的经验或结果?我们可以衡量这一点吗?
确定了目标用户后,重要的是考虑 AI 应用程序或系统将如何具体改善该用户的经验。这种 HOW 应该尽可能量化,以显示一旦应用 AI 系统后,其 ROI(投资回报率)是多少。
比如考虑在保险公司构建一个后台 AI 应用程序,这个应用程序可以自动标记自由形式文本(例如保险和索赔赔偿单、呼叫中心笔记或医疗健康记录)中的所有相关类别,并提取日期、地点和名称等关键内容。
实际 ROI:通过使用上述方法在大规模上自动扫描患者记录,一家欧洲大型医院能够改善患者的结果并获得数百万欧元的 ROI。他们通过使用文本分析来检测以前未记录的医疗记录中提到的次要疾病和治疗方式,这些记录因此也未向保险公司开具账单;此外,自动化此过程节省了数百个昂贵的医生时间来进行手动审查。
要点:
• 始终问:这个 AI 用例如何帮助我赚钱、省钱或做一些今天无法做到的事情?
• 如果答案不清楚,则将其从列表中删除。
AI 用例(尤其是在获得整个企业对 AI 努力的支持时)应重点关注具有实际可衡量的业务结果的机会。
[Why]使用 AI 进行这个项目的好处是什么?
当 ChatGPT 公开后,AI 似乎也成了“容易”的代名词,我们可以使用 ChatGPT 很容易地完成很多任务,因此我们也很容易被 AI 成为一个新的“容易”按钮的想法所诱惑。但是新的并不总是意味着更有价值——在权衡各种 AI 项目的利弊时,考虑预期的好处是否能够证明替换现有过程所需的时间和投资是值得的。
例如,假设一家大型零售商的营销部门每周手动标记新获得的图像,以便它们可以在数字资产管理系统中正确索引。这种方式下,员工可以找到符合公司要求的包含特定元素(如商务人士、平板电脑、飞机等)的演示图像。是否值得构建一个对象识别模型来自动检测并标记每张照片中的物品?
在这种情况下:由于图像数量较少且自动化此过程的商业价值可能不足以克服从头开始训练和维护强大深度学习模型所需的重大努力,因此可能不是一个好的用例。然而,使用预训练模型(如 YOLO、COCO、Mask R-CNN 等)可能会提供所需的捷径,而不必耗费过多的资源。
要点:
• 避免为了做 AI 而做 AI,而是要关注真正在大规模提供价值或提供以前不可能实现的其他有形价值的重头应用。
• 如果使用 AI 不会提供任何更大的价值或 ROI,那么就尝试另外的项目。
[What]如果该项目成功,将会有什么好处?如果项目失败,将会有什么后果?
在上面,我们清楚了量化成功 AI 项目可能带来的好处(例如增加收入、节省运营成本等)的重要性。但是风险也应该在决定开始项目之前进行评估。没有人喜欢在开始前考虑 AI 项目失败的可能性,但 VentureBeat AI 报告称 87%的数据科学项目从未进入生产阶段。因此,重要的是评估最坏情况下的结果。
• 是否会对品牌声誉或用户信任造成重大损害?
• 是否会对企业对 AI 项目的信任和数据团队执行能力造成损害?
• 是否存在关于监管合规或用户隐私的风险?
Celent 分析师 Dan Latimore 在他的 2018 年出版物《 Artificial Intelligence in Banking 》中说得最好:"Pick a welldefined and manageable project whose failure won't be catastrophic and whose success will be inspirationa‘翻译过来的大概意思“选择一个明确且可管理的项目,其失败不会是灾难性的,而成功的则将能够鼓舞人心。”
要点:
• 选择一个在失败时不会对公司或 AI 程序本身造成灾难性后果的 AI 项目。
• 评估以下因素对于确定一个在失败时不会对公司或 AI 程序本身造成灾难性后果的项目至关重要。
• 项目范围
• 团队是否有对应行业的内容专家支持?
• 可用的分析资源(包括人力和基础设施)
[Where]数据从哪里来,以及是否适合这个项目?
数据是人工智能系统最重要的元素之一。现代大多数 AI 解决方案都利用机器学习中的监督学习算法,这些算法需要从数据科学开发者那里获得的标记数据集来训练计算机。换句话说,计算机从它所获得的例子(包括答案)中学习,通常,这些算法需要大量的标记训练数据才能产生高度准确的结果。
当企业想要实施酷炫的 AI 解决方案,但没有手头可用的特定任务数据时,就会发生脱节。那些着手进行第一个 AI 项目的企业可能会考虑选择仅依赖于内部数据的初始项目,而不是那些严重依赖第三方来源或大量制造训练数据(如斯坦福大学的 Snorkel、亚马逊的 Mechanical Turk 或谷歌的 AI 平台数据标记服务)的项目。
要点:
• 对于第一个 AI 项目,尽量减少外部依赖。这不仅降低了复杂性,还将团队引导到具有高速度价值早期项目的早期阶段,这对于获得企业支持至关重要。
• 业务、IT 和数据科学小组之间的协作对于这种考虑也至关重要,因此应尽早并经常与相关利益相关者参与项目设计。
[When]MVP(最小可行)模型何时需要完成?最终生产解决方案何时实现?
最后:设定做出一个 MVP 模型的 DDL(最终截止时间)也是至关重要的。就像 DIY 家装一样,AI 应用程序构建可能会无限期地拖延;似乎总是需要进行更多的微调,添加另一个小功能。但是为了与内部利益相关者建立信任,最好的做法是在短期内有限地从头到尾运行整个解决方案,而不是在第一次尝试中就追求完全成熟的解决方案。
实际例子:以面向用户的聊天机器人为例,第一个原型可以专注于广度(即回答各种不同主题的简单问题),或者深度(能够回答许多不同方式提出的非常详细的问题,但只涉及几个主题)。然而,在第一次迭代中实现这两个目标可能是不现实的。一旦聊天机器人预览获得内部用户接受 - 即利益相关者确认一旦完成构建,它将实际上带来预期的商业成果 - 才适当地完全开发应用程序。
操作化是 AI 项目中的关键步骤:将数据洞察力转化为实际的大规模业务和运营影响。这意味着在设计机器学习模型的探索性工作和实际生产系统中所需的工业努力之间建立巨大的差距(更不用说精度了)。
AI 项目的时间概念不仅应包括开发 MVP 原型的时间,还应包括部署到生产以及进行第二(或更多次)次迭代的时间。AI 项目适合 MVP 方法,因为了解机器学习模型表现的最佳方式是在生产环境中进行,因此成功项目的关键是尽早进行操作化,经常调整并推出新版本。
要点:
• 采用“先进步再完美”和 MVP 心态可以让利益相关者对 AI 项目的长期愿景感到兴奋,并在项目早期阶段提供反馈,以便进行大版本迭代。
• AI 项目时间表不仅应包括从开发到原型的开发,还应包括从开发到操作化的操作化。
• 事先设定这些时间概念至关重要,需要解决任何潜在的障碍,以便在到达那里之前就可以实现操作化,如果可能的话,还要发现 bug 和提升用户体验~
结论
当今最成功的企业已经接受了这样一种观点:有效地利用数据和技术不仅可以带来竞争优势,还可以改善员工和用户的经验。但是在规划企业的人工智能战略时,需要保持策略性和谨慎。文中概述的框架将有助于避免人工智能项目启动时的错误,并为成功创造环境。
最后献上 AI 项目规划的指南: