文/明道云创始人任向晖

李彦宏在近期的一个行业会议上抱怨大家都卷在大模型本身上,而忽视了AI原生应用的实现。他说的当然对,但这个状况绝对不能怪AI创业者。至少在企业应用领域,很多应用开发者并不确定企业愿意为什么样的应用买单,更不要说他们背后的模型提供商了。

这一年我看到了几十个已经初步产品化的企业AI应用,大多数是围绕某一个目标的生成工具。生成PPT,生成文档,生成设计图等等。说实话,我几乎没有看到任何能够给终端客户带来明显价值的产品,更不要说持续为应用买单了。相反,那些接入个大模型Completion API(通常就是ChatGPT),做一个Chatbot的前端,卖个智能助手账号的倒是更接地气,毕竟客户得到了一问一答的明确价值。这是这个价值有多大呢?再大也大不过一个月20美元。因为这就是ChatGPT Plus的月费定价。依靠信息差和接入壁垒也许可以略微扩大一些价值,但它就是这么一个数量级。

如果要客户为AI应用支付一个显要的价格,那么它必须服务于企业的业务流程,甚至最好是核心业务流程。反过来说,如果企业为某一个外部信息和数据服务支付六位数以及更多价款的,那么这个服务必然和客户的生产活动息息相关,甚至是需要紧密耦合在一起的,如同饭店的锅灶,医院的化验室,广告公司的Photoshop和软件公司的开发工具。我举这些例子是为了说明当下的AIGC应用距离规模化商业还有多远。

要和业务流程耦合,意味着大多数AIGC应用也要以API Centric的方式来设计规划。用户并不总是依靠AI应用的前端界面来使用,大多数的输入和输出都是在幕后进行的,智能服务不仅无声无息,而且无影无形。想想这么多年来,人脸识别这类视觉AI提供服务的过程就知道了。

不仅主要的服务通过API进行,而且AI应用还需要准确地判断客户业务流程所能够提供的传入参数和所需要的传出参数。这些参数不仅是技术概念,也是商业概念。也就是说,应用需要知道客户企业是怎么运作的。在AI技术能够提供价值的业务环节中,客户能够提供什么使用支持,受限于什么样的条件,期望得到什么规格和质量标准的产出。在人脸检测领域,无论什么行业,能够提供的参数就是来自视频流的帧,受限于物理条件,这个画面可能是清晰的,也可能是昏暗的,受制于设备条件,分辨率可能是1980横向,也可能是1280横向,画面可能是横向的,也可能是竖向的。幸运的是,客户对输出的要求则极其简单,只需要一个True 或 False的回答。

但是在AIGC领域,和企业业务流程的结合就要复杂和困难得多。我们以常见的文生图应用为例来说明这个落差有多大。

今天几乎所有的文生图应用都无法满足企业哪怕最基本的营销素材生成需求。因为他们完全不了解企业营销工作流程,甚至也不了解营销流程背后的设计规范原理。他们认为企业生成图片的过程就是输入标题文案,选择一个模版,选择一个产品照片,用文字来描述一下含糊的风格就行了。比如下图百度云一念生成的汽车营销海报。在专家看来,这些产出最多也就是实习生涂鸦的水平,它不可能用在汽车品牌真实的营销活动中。
24000758-2023-12-23T16:08:22.png
实际并非如此。企业营销过程中的图形设计需要服从VI规范,也要和同类产出物的设计建立连续性,建立一个品牌的设计系统,这是一个非常专业和有价值的过程。至于这个过程能不能被AIGC替代是另外一个话题,但不管这个规范是专家设计的,还是AI设计的,它都要用来强烈地控制所有的产出物。
24000806-2023-12-23T16:08:29.png
上图是保时捷跨度几十年的广告设计风格

现有的多模态大模型能够理解图片背后的设计规范吗?我认为只是时间早晚问题。但是,即便大模型有了这个能力,应用开发者依然需要把这个能力和企业运作环境结合起来。设计规范是以什么形式保存在哪里?是应该通过设计规范文档来制约模型输出,还是应该以经过验证的历史产出物作为“训练”素材?。即便做到了这一点,我们还要确定用户在使用AI能力创作时能够对规范进行调整突破的程度。

以我们自己公司的一个需求为例。明道云每周都要开展一场直播活动,事先我们会确定直播的主题,议程,时间,参与嘉宾,报名链接等信息,然后我们就希望AI能够按照既定的标准风格一键生成一个固定尺寸的PNG文件。它应该大致长这样:
24000823-2023-12-23T16:08:41.png
现在市场上有人做出这样的应用吗?如果有,我们愿意花每年10万元来使用,因为此类设计大体要占据一位初级平面设计师的日常工作。当然,为了做到这一点,这个应用需要提供友好可用的API,能够让我们把这组能力整合到现有的业务流程中。

文生图只是一个例子。其实不管什么AI应用,如果要占领企业客户市场,都需要遵循这两个原则:

  1. 了解AI能力所服务的企业运营流程,理解上下文,不能为了推销AI能力,对客户的运营流程有太多的调整要求。
  2. 通过可靠且易用的API,让服务能够以无影无形的方式提供。

我们再把这两个原则应用到一个更为复杂的场景 ——销售策略分析和建议。

销售策略分析和建议毫无疑问是作用于企业的核心业务流程——把产品服务卖出去。为了解决这个问题,AI应用设计者应该充分了解并且能够抽象相关业务环节的诸多要素。决定一个有效的销售行动建议绝对不是一个简单的提示词对话框所能够涵盖的。根据下面我画的示意图,它至少涉及上下文相关的输入参数,包括理想客户画像描述,不断扩充的销售知识库(包括公司,产品,方案,方法论等诸多细节内容),以及公司当下的竞争战略描述。同时,为了给每一个销售对象提供不同时机的销售建议,还需要获取在销售漏斗中的线索和商机的相关信息。

AI的输出也要结合业务环节提供具体的产出物。在新线索阶段可能是理想客户吻合度的一个量化结果,也可能是对线索跟进的行为建议,同时包含在线索阶段为激发客户兴趣所生成的针对性沟通内容,在商机阶段能够给出明确的竞争性销售策略以及生成报价文档。
24000852-2023-12-23T16:09:17.png
这寥寥两段文字,说起来简单,要落地到企业实践中就非常复杂。我们需要推断客户在当前业务实践中所使用的工具和流程,能够让客户在不改变主体流程的情况下利用上这组AI能力。所以,这个应用必然需要和客户所使用的CRM工具集成,不管是Excel还是Salesforce都要有办法;还要和企业知识库的特定条目整合,要有一个十分方便的机制让用户可以实时汇入这些知识文件,在AI技术领域被称为Grounding。返回的输出有简单呈现的信息,也有结构化的文档。这些也都要考虑让客户能够方便地取用。这意味着,此类AI应用不应该长得像一个筐子,而是要更像绳子,能够把多个业务流程连接起来。为了达成这个目标,AI应用要综合运用Web应用,Co-pilot交互,插件和更灵活的API来提供服务。

是不是很难?实际情况可能比我描述得更难。因为AI模型和AI应用都需要接触客户的敏感数据,所以在实现过程中,还需要设计数据Masking和Demasking的环节,因为AI提出的输出可能会实时面向外部顾客,所以它必须经过严格的质量和有害性控制。

这些不断叠加的难度其实也在提示一个市场规律。一个独立的AI应用想要闭环企业应用的一个特定场景很困难,因为它要额外延伸的使用场景实在太长了,而一个现有的企业应用,比如一个CRM产品,想要加载额外的AI能力却要容易一些。这个整合壁垒给企业应用公司带来了一层保护,因为孤立的AI工具将很难端到端满足客户的需求。但反过来说,在自己的产品中提供AI能力也就成了企业应用公司的责任。因为如果你不提供,你的竞争对手会提供。所以,不管是自己动手,还是引入合作产品,未来一两年,大多数企业软件公司都要完成这个命题。

美国市场大致已经开始呈现出这样的趋势。独立的ChatPDF产品作为个人工具依然会存在,但是壁垒几乎完全没有,最终会消失在市场象限中,而以Salesforce Einstein AI为代表的企业应用AI加载项开始成为主流的市场力量,包括Canva,Adobe,ServiceNow等主流的企业软件厂商都开始提供了额外收费的AI产品订购选项。当然,这个阵营中也包括微软,作为横跨基础设施和企业应用两端的巨无霸,他并非一个典型的存在,我们不要被他带歪了。

中国市场也必然开始跟进,只是对我们来说,选择谁家的模型真是一个两难的问题。凡是在着手研究此项工作的朋友应该知道我说的意思。