2023年:企业生成式AI的现状报告
在Menlo Ventures的《企业生成式人工智能现状》报告中,我们调查了美国和欧洲的450多名企业高管,并与十几位高管进行了交谈,以提供对当今企业采用生成式人工智能的看法。
尽管大肆宣传,但我们的研究表明,与其他软件类别相比,企业对生成式人工智能的投资仍然小得惊人。将创造的大部分价值还有待观察。虽然现有企业在当今市场占据主导地位,但我们已经确定了初创公司最有可能获胜的三个机会领域。
下面,我们将深入研究我们的研究,分享实际预算数据和关键发现,以提供企业买家如何看待生成式人工智能并确定其优先级的观点。
企业支出:这些数字揭示了什么?
与传统人工智能(700亿美元)和云软件(4000亿美元)的企业预算相比,企业对生成式人工智能的投资(我们估计今年为25亿美元)小得惊人。
当然,人工智能对企业来说并不陌生;传统的人工智能技术(计算机视觉、深度学习等)早在生成式人工智能出现之前就已经使用了。在我们调查的企业中,有一半在 2023 年之前实施了某种形式的人工智能,无论是在面向客户的产品中还是在内部自动化中。
ChatGPT的推出标志着一个转折点:AI战略突然成为董事会的热门话题。采用率增加。经过五年的停滞,我们的调查发现:
- 使用某种形式的人工智能的企业数量增长了 7%(从 2022 年的 48% 增加到 2023 年的 55%)。
- 在同一时期,企业内部的人工智能支出平均增长了8%。这蚕食了企业技术总支出,仅增长了 5%。
对生成式人工智能的投资促成了人工智能支出的增加。在构建与购买方面,今天的企业购买;80% 的受访者表示购买了第三方生成式 AI 软件。
2023 年,企业在生成式 AI 上花费了约 25 亿美元,推动了 GitHub Copilot 和 Hugging Face 等工具的兴起(两者的收入都超过了数千万美元)。但市场仍处于萌芽状态。如今,企业对生成式 AI 的投资仍不到所有云支出的 1%。
更重要的是,生成式 AI 势在必行也推动了对经典非生成式 AI 应用程序的需求,例如数据科学平台 Dataiku 和基础设施提供商 Databricks。根据我们的研究,传统的人工智能应用和基础设施解决方案的支出超过700亿美元,远高于用于新的基于LLM的软件和工具的资金,在4000亿美元的云软件和基础设施市场中占有相当大的比例。
在比较部门预算时,我们发现产品和工程部门在人工智能和生成式人工智能上的支出比其他任何部门都多。事实上,我们调查的中位数企业在产品和工程方面的人工智能支出(占所有企业技术支出的4.7%)高于所有其他部门的总和(3.5%)。
产品和工程组织倾向于在内部使用 AI 进行构建,从而推动了这些成本。在这里,企业正在大力投资人工智能团队和技术。他们正在要求传统开发人员和数据科学家构建内部基础设施,有些人正在招聘额外的人工智能专家(ML工程师、研究科学家等)。他们还大力投资作为现代 AI 堆栈核心的第三方解决方案(例如,数据库、数据管道和开发人员工具)。
尽管如此,现在还为时过早:如今,产品和工程团队推动了 AI 投资,但随着解决方案不断发展以提供更多价值,我们预计生成式 AI 投资将增加。
预测 1:尽管大肆宣传,但企业对生成式 AI 的采用将会仔细斟酌,就像早期采用云服务一样
ChatGPT 的兴起激发了生成式 AI 的出现与移动技术和互联网的引入之间的比较。但是,尽管消费者迅速而热情地接受了生成式人工智能,但我们预计企业人工智能的采用速度会更慢,类似于早期企业采用云计算。
在短期内,初创公司可能会因此而陷入困境。许多第一波新进入者仍在努力使自己与众不同,因此很难在解决方案丰富但卖家犹豫不决的市场中获得牵引力。
相比之下,那些设法消除噪音的早期赢家则通过技术实现了差异化。例如,Typeface * 开发了一种具有企业范围反馈循环的深度技术产品。
在第一个十年之后,云计算达到了企业软件支出的30%;互联网普及率达到45%,移动普及率接近80%。
预测2:市场将继续青睐将AI嵌入现有产品的已合作公司
当前的市场有利于那些与年轻竞争对手相比,在规模、分销、品牌和工程资源方面保持强大优势的现有企业。在争夺生成式人工智能市场份额的同时,现有参与者以惊人的速度转向采用“嵌入式人工智能战略”——顾名思义,该战略涉及将人工智能功能嵌入到现有产品中。
例如,Microsoft Copilot 是一个 AI 伴侣,它涵盖了 Microsoft 的所有应用程序和体验(例如 Microsoft 365、Windows 11、Edge 和 Bing),可在用户工作流程的几乎每个方面提供 AI 帮助。据该公司首席财务官称,包括 Copilot 在内的生成工具在未来几年可能会贡献超过 100 亿美元的收入。
像 Copilot 这样的工具与映射到现有 SaaS 类别(部门、垂直和水平 AI 应用程序)的新一波 AI 原生解决方案形成鲜明对比。这些新的人工智能进入者在拥挤的市场中与财力雄厚的类别领导者竞争。对于每个 AI CRM,都有一个 Salesforce Einstein;对于每个 AI 设计工具都有一个 Figma copilot;对于每个联络中心座席都有一个 Observe.AI。
我们预计,在未来几年内,现有的优势将持续下去,直到新的、更强大的人工智能方法(如代理和多步推理)变得普遍。
预测 3:强大的上下文感知、数据丰富的工作流将是解锁企业生成式 AI 采用的关键
目前在生成式人工智能上投资的25亿美元(相对微不足道)表明,企业解决方案尚未兑现其有意义的转型承诺。他们未能创建新的工作流和行为;生产力的提高是有限的。
买家将保持怀疑,直到价值明确。企业高管认为“未经证实的投资回报”是采用的最大障碍。另一方面,企业买家在做出购买决定时将“性能和准确性”置于所有其他标准之上。
这是企业的铁律:挑战者必须提供比现状更好的东西。企业购买者不会被效率的提高所打动。人工智能解决方案必须证明生产力的显著提高,取代旧方法,并以全新的方式重写工作流程。对于高潜力的初创公司来说,这意味着:
- 下一代推理功能。代理架构、思维链和反射等新兴技术将使初创公司能够执行多步骤推理,并实现比现有产品更容易附加到现有产品更复杂的任务。
- 专有数据。下一代人工智能原生用户将能够整合有价值的专有数据集(包括客户反馈)并从中学习,从而使他们比许多现有企业使用的编程逻辑更具优势(例如,通过强化学习或微调)。
- 工作流和企业范围的反馈循环。初创公司可以在许多工作流上“闭环”,并以与现有企业工作流完全不同的方式实现企业范围的反馈和工作流优化(其中许多是各种软件、数据系统和人类的开放式菊花链)。
这将是企业工作的未来。提供情境感知、数据丰富的工作流程的初创公司将最终释放买家,并最终释放更大的企业市场。
在下一节中,我们将探讨这些初创公司将建立的三个最有前途的领域。
初创企业可以赢得的三个机会领域
对于初创公司来说,在一个有利于老牌企业的市场中竞争并不容易。但是,初创公司的优势在于,它们能够在现有企业最初可能忽视或忽视的领域开辟新的道路,并且他们愿意接受如此新的市场,以至于它们是任何人的游戏。
我们确定了三个领域,这些领域为初创公司提供了巨大的突破潜力:
- 垂直人工智能。在特定行业的应用中,人工智能将重塑人机协作,成为端到端自动化的驱动力,而不仅仅是副驾驶或协作平台。
- 水平 AI。水平解决方案很受欢迎,因为它们可以跨行业和部门使用,从而提高了工作流程的效率,超出了以前的可能性。随着人工智能的推理、协作、沟通、学习和预测能力越来越强,下一代工作流工具不仅将允许机器增强或自动化日常任务,而且通过代理和多步骤推理等高级方法,承担以前只有人类才能完成的工作。
- 现代 AI 堆栈。新的生成功能需要新的工具来构建 LLM 应用程序,包括数据库、服务基础设施、数据编排和管道。尽管仍在合并,但现代 AI 堆栈吸引了最大比例的企业 AI 投资,使其成为生成式 AI 领域最大的市场,也是初创公司的有吸引力的焦点。
垂直人工智能
近年来,垂直 SaaS 的惊人崛起表明了对针对专业行业需求量身定制的软件的需求,并催生了 Toast(餐厅 POS)、Procore(建筑)和 Benchling *(生命科学)等公司。
但是,当引入生成式人工智能时,行业特定的工具获得了超能力。工作流程得到优化,任务自动化,用户体验不是在行业层面定制,而是根据组织甚至个人需求和偏好进行更精细的定制。
新兴的人工智能医疗抄写员市场就是一个例子。像 Eleos Health * 这样的下一代解决方案不需要医生在看病时手动绘制图表,而是利用有价值的行业特定数据和强化学习来根据每个机构的指导方针和风格定制医疗笔记,并最终为每个提供者定制医疗笔记。
我们的研究表明,两个行业正在引领垂直生成式人工智能的采用:营销和法律。例如,营销人员已经接受了 Synthesia,这是一种 AI 工具,可以轻松快速地制作高质量的视频内容。与此同时,律师事务所已求助于 Eve * 和 Harvey,以承担合同分析、尽职调查、诉讼和监管合规等劳动密集型工作。
随着时间的流逝,我们将看到更保守的行业,如医疗保健和金融,也接受生成式人工智能的价值。尽管这些行业的高管目前报告的生成式人工智能用例较少,但我们的调查显示,人工智能是路线图的首要任务。
这张图表显示,在各行各业中,人们的兴趣比今天的实际采用要多得多。
许多公司目前正在试行自动化解决方案,如人工智能临床工作流程自动化(例如,Co:Helm、Latent)和用于财务分析的副驾驶(例如 Minerva)。下面的市场地图重点介绍了一些最有前途的早期垂直人工智能初创公司。
水平 AI
我们还看到了初创公司通过横向解决方案获胜的机会,这些解决方案使用人工智能通过自动化手动任务来增强员工的能力。不断增长的横向软件浪潮将实现跨部门的人工智能用例,涵盖工作流程自动化、内部工具/应用程序和下一代 RPA。
虽然上一代水平自动化公司(例如Zapier、Retool、UiPath)正在经历人工智能改造,但新一波人工智能原生挑战者(包括Adept和Lindy *)将基础模型智能和基于点击和UI数据训练的定制模型相结合,以提供其前辈无法触及的自主性。他们动态推理的能力(而不是遵循一套僵化的、容易出错的编程步骤来完成任务)释放了巨大的潜力。
除了工作流程自动化之外,我们预计独立思考和行动的座席将兴起。经验丰富的个人代理将跨越整个工作日,处理电子邮件、日历、记笔记等,并进入特定于部门和领域的工作流程。像行政助理一样,给他们一项工作要做(例如,更新一系列CRM条目,提供与会者的背景信息并记录后续步骤),他们将代表您执行。随着时间的流逝,人工智能代理会获得智能,并且随着高级推理技术(例如,思维链、思维树和反射)的成熟,员工将能够可靠地将许多重复性和手动任务卸载给这些代理。
不难想象,有一天,人工智能将能够访问每一个口语和鼠标点击——我们喜欢它。如果人工智能可以访问整个工作语料库(每次通话、会议、电子邮件、笔记、浏览器搜索等),可能会对生产力产生不可思议、直接和明显的影响。今天,我们感受到了牺牲隐私和提高生产力之间的紧张关系,但随着人工智能获得信任,这种权衡将变得容易。这种转变已经在进行中;我们看到用于特定用例的离散产品,例如使用 Gong 或 Zoom AI Companion 来记录销售电话。如果类似的解决方案能够带来价值并提高生产力,那么这些“观察优化”工具将在我们工作时发挥作用,使我们在工作中更聪明、更出色。
正如 SOC-2 在第一波 SaaS 浪潮中成为合规的黄金标准一样,生态系统将围绕支持我们 AI 未来的安全要求进行融合。立法和公司政策必须不断发展,但我们相信,通过适当的 RBAC、5 治理、安全性和对企业知识库(电子邮件、文档、演示文稿等)的私人访问,人工智能可以提供有价值的自动化,并作为人类团队的自然延伸发挥作用。
随着人工智能变得越来越复杂,我们将越来越依赖这些工具来使我们更快、更聪明、更好地完成工作。人工智能将失去其新颖性,并在整个工作日中成为一个不足为奇的合作者,如果不是预期的。
现代 AI 堆栈
今年,企业在现代人工智能堆栈上投资了11亿美元,使其成为生成式人工智能领域最大的新市场,也是初创公司的一个有吸引力的焦点。
我们调查的企业买家报告说,他们 35% 的基础设施资金用于 OpenAI 和 Anthropic * 等基础模型。他们在围绕这些模型的数据基础设施上花费更多(6.5亿美元)。
今年上半年,现代人工智能堆栈是狂野西部。它正在不断建设和修改中,使买家很难知道在哪里投资。
在过去的六个月中,业界已经围绕一些核心组件和企业部署的标准实践进行了融合,提供了更高程度的稳定性和标准化。
我们的研究显示:
- 大多数型号都是现成的。只有 10% 的企业预训练了自己的模型。
- 与 Llama 2 和 Mistral 等开源选项相比,来自 Anthropic 和 OpenAI 的闭源模型占主导地位,占生产模型的 85% 以上。
- 60% 的企业采用多个模型(并将提示路由到性能最高的模型)。这种多模型方法消除了单模型依赖性,提供了更高的可控性,并降低了成本。
- 如今,96% 的支出都用于推理,这表明更多的预算用于运行模型,而不是在需要更多情节的情况下训练它们。
- 中间件和工具仍处于发展阶段。提示工程是最流行的定制方法,而最流行的评估方法是人工审查。
- 检索增强生成 (RAG) 正在成为一种标准。RAG 是一个 AI 框架,它使用从外部知识库检索到的相关和最新信息来增强 LLM,以提高响应质量。这种动态增强使 LLM 能够克服固定数据集的局限性,以生成最新且与上下文相关的响应。在我们调查的 AI 采用者中,有 31% 的人正在使用这种方法,高于微调 (19%)、实施适配器 (18%) 或利用 RLHF (13%)的人。
尽管 RAG 已经获得了关注,但它落后于更简单的定制技术,例如提示工程。同样,手动评估仍然是模型评估中使用最广泛的方法。
尽管已经围绕一些核心组件和方法进行了标准化,但现代人工智能堆栈绝不是固定的。正如今年所证明的那样,它将继续发展:今天的许多著名参与者,包括 Scale、HuggingFace 和 Weights & Biases,最初是为传统的 MLOps 构建的,但在现代 AI 堆栈中发现了新的相关性。我们也看到了新的参与者的出现,比如 Pinecone *,它随着 RAG 的普及而扩展。
新的构建块将继续脱颖而出,为初创公司创造难以置信的机会。我们对堆栈的这些新兴领域感到最兴奋。
- 模型部署和推理。与现代数据堆栈一样,现代 AI 堆栈将是无服务器的,将开发人员从运行应用程序的复杂性中解放出来,促进快速迭代和优化资源,以便企业为计算而不是可用性付费。 Baseten 和 Modal 等公司已经提供了无服务器远程环境来运行和部署模型,从而实现了无与伦比的性能和成本效益,同时最大限度地减少了手动部署和推理的痛苦,包括手动配置 Kubernetes、服务器配置、许可和自动缩放。
- 数据转换和管道。数据在命中 LLM 之前必须进行预处理。这包括从整个组织的数据存储中提取相关上下文,将数据转换为可用格式,并将数据加载到模型的上下文窗口或矢量数据库中进行检索,以及用户在提示 LLM 时所期望的即时响应时间。 非结构化和超级链接正在成为领先的“LLM 的 ETL”7 — 处理传入批处理和流数据源的复杂数据管道创建、管理嵌入并实现实时同步,以便企业 LLM 始终拥有跨用户和内容模型的最新上下文。
- 可观测性和安全性。适当的数据治理和 LLM 安全性对于企业部署至关重要。Credal(数据丢失防护)、Calypso(内容治理)和 HiddenLayer(威胁检测和响应)等领域专家使公司能够安全地将内部数据存储连接到第三方基础模型或面向客户的 AI 应用程序,从而确保完全透明、可审计性和可追溯性。
下一步是什么?
2023 年是 AI 炒作的一年,正在让位于 2024 年真正采用 AI 的艰苦工作。
尽管目前市场仍处于早期阶段,并且由提供渐进式创新的现有企业主导,但初创公司的机会正在出现,可以在下一个计算历史时代的最前沿发挥领导作用并进行创新。推理和创造中的涌现特性——由代理、思维链推理和反思等下一代技术实现——将推动下一波生成式 AI 原生参与者重写企业工作流程并创造新的绿地市场。
Menlo的团队渴望与具有前瞻性思维的创始人合作,他们正在寻求颠覆现状并引领潮流。我们已经投资了该领域一些最具变革性的公司,包括 Anthropic、Pinecone、Aisera、Typeface、Cleanlab、Sana Labs、Eleos Health、Lindy 和 Eppo。
现在是构建生成式 AI 的最佳时机。在Menlo,我们对企业中生成式AI的未来非常乐观。如果您是跨生成式 AI 堆栈构建的创始人,我们很乐意与您交谈。
原文:https://menlovc.com/2023-the-state-of-generative-ai-in-the-enterprise-report/