注:本文是“剖析人工智能应用程序”系列文章中的第一篇,该系列文章介绍了人工智能系统的心智模型。该模型作为跨学科人工智能和产品团队讨论、规划和定义人工智能产品的工具,以及与业务部门保持一致的工具。它旨在汇集产品经理、用户体验设计师、数据科学家、工程师和其他团队成员的观点。在本文中,我将介绍思维模型,而未来的文章将演示如何将其应用到特定的人工智能产品和功能中。_

1、为什么人工智能的整合如此困难?

通常,公司认为他们需要将人工智能纳入他们的产品中只是聘请人工智能专家并让他们发挥技术魔力。这种方法直接导致他们陷入集成谬误:即使这些专家和工程师产生了出色的模型和算法,他们的输出也常常停留在游乐场、沙箱和演示的水平上,而永远不会真正成为产品的成熟部分。多年来,我看到了数据科学家和工程师的极大挫败感,他们技术上出色的人工智能实现未能融入到面向用户的产品中。相反,他们拥有尖端实验的光荣地位,给内部利益相关者留下了驾驭人工智能浪潮的印象。现在,自 2022 年 ChatGPT 发布以来,人工智能无处不在,

为什么人工智能的整合如此困难?有几个原因:

  • 通常,团队只关注人工智能系统的一个方面。这甚至导致了不同阵营的出现,比如以数据为中心、以模型为中心、以人为中心的人工智能。虽然它们都提供了令人兴奋的研究视角,但现实生活中的产品需要将数据、模型和人机交互结合到一个连贯的系统中。
  • 人工智能开发是一个高度协作的企业。在传统的软件开发中,您使用由后端和前端组件组成的相对清晰的二分法。在人工智能中,您不仅需要为您的团队添加更多样化的角色和技能,还需要确保各方之间更紧密的合作。人工智能系统的不同组件将以亲密的方式相互作用。例如,如果您正在开发虚拟助手,您的用户体验设计师将必须了解提示工程才能创建自然的用户流程。您的数据注释者需要了解您的品牌和虚拟助理的“性格特征”,以创建与您的定位一致且一致的培训数据,
  • 在构建人工智能时,公司常常低估设计的重要性。虽然人工智能始于后端,但要使其在生产中大放异彩,良好的设计是必不可少的。人工智能设计突破了传统用户体验的界限。您提供的许多功能本身在界面中并不可见,而是“隐藏”在模型中,您需要教育和指导用户以最大化这些好处。此外,现代基础模型是野生动物,可能会产生有毒、错误和有害的输出,因此您将设置额外的护栏来降低这些风险。所有这些可能都需要您的团队具备新技能,例如快速工程和对话式设计。有时,这也意味着做一些违反直觉的事情,比如低估价值来管理用户的期望,以及增加摩擦来给他们更多的控制权和透明度。
  • 人工智能的炒作带来了压力。许多公司本末倒置地实施未经客户和市场需求验证的实施。偶尔加入人工智能流行语可以帮助您将自己定位为一家进步和创新的企业,但从长远来看,您需要用真正的机会来支持您的流行语和实验。这可以通过业务和技术之间的紧密协调来实现,这是基于市场机会与技术潜力的明确映射。

在本文中,我们将为人工智能系统构建一个整合这些不同方面的心智模型(参见图 1)。它鼓励开发人员进行整体思考,对目标产品有一个清晰的了解,并在此过程中用新的见解和输入来更新它。该模型可以用作简化协作、协调人工智能团队内部和外部的不同观点以及基于共同愿景构建成功产品的工具。它不仅可以应用于人工智能驱动的新产品,还可以应用于融入现有产品的人工智能功能。

26171113-2023-09-26T09:11:13.png
图 1:人工智能系统的心理模型

以下部分将简要描述每个组件,重点关注特定于 AI 产品的部分。我们将从商业角度开始——市场机会和价值——然后深入研究用户体验和技术。为了说明该模型,我们将使用副驾驶的运行示例来生成营销内容。

2、机会

现在,您可以使用人工智能完成所有很酷的事情,您可能会迫不及待地想要亲自动手并开始构建。然而,为了构建用户需要和喜爱的东西,您应该用市场机会来支持您的开发。在理想的世界中,机会来自于告诉我们他们需要或想要什么的客户。[1] 这些可能是未满足的需求、痛点或愿望。您可以在现有客户反馈中查找此信息,例如销售和成功团队的产品评论和注释。另外,不要忘记自己是产品的潜在用户——如果您针对的是自己经历过的问题,那么这种信息优势就是额外的优势。除此之外,您还可以使用调查和访谈等工具进行主动的客户研究。

例如,我不需要看得太远就能看到初创公司以及大公司内容营销的痛苦。我自己也经历过——随着竞争的加剧,通过个人、定期和高质量的内容发展思想领导力对于差异化变得越来越重要。与此同时,对于一个小而忙碌的团队来说,桌面上总会有一些事情看起来比撰写本周的博客文章更重要。我还经常在我的网络中遇到那些努力建立一致的内容营销程序的人。这些“本地”的、可能存在偏见的观察结果可以通过超出网络范围的调查来验证,并确认解决方案的更广泛市场。

现实世界有点模糊,客户不会总是来找你提供新的、精心设计的机会。相反,如果伸出你的触角,机会就会从很多方向降临到你身上,例如:

  • 市场定位:人工智能是一种趋势——对于成熟的企业来说,它可以用来强化企业创新、高科技、面向未来等的形象。例如,它可以将现有的营销机构提升为人工智能驱动的营销机构服务并使其与竞争对手区分开来。但是,不要为了人工智能而做人工智能。定位技巧必须谨慎应用,并与其他机会结合起来——否则,你就有失去信誉的风险。
  • 竞争对手:当你的竞争对手采取行动时,他们很可能已经完成了基础研究和验证。一段时间后看看他们——他们的开发成功了吗?使用这些信息来优化您自己的解决方案,采用成功的部分,并消除错误。例如,假设您正在观察一家竞争对手,该竞争对手正在提供全自动生成营销内容的服务。用户点击“红色大按钮”,人工智能就会开始编写和发布内容。经过一些研究,您发现用户犹豫是否使用该产品,因为他们希望保留对过程的更多控制,并为写作贡献自己的专业知识和个性。毕竟,写作也是关于自我表达和个人创造力的。现在是您使用多功能工具继续前进的时候了,该工具提供丰富的功能和配置来塑造您的内容。它提高了用户的效率,同时允许他们随时将自己“注入”到流程中。
  • 法规:技术颠覆和全球化等大趋势迫使监管机构收紧要求。法规会带来压力,同时也是绝佳的机会来源。例如,假设有一项法规严格要求每个人都对人工智能生成的内容进行广告宣传。那些已经使用人工智能内容生成工具的公司将在内部讨论是否想要这样做时消失。他们中的许多人会避免这样做,因为他们想保持真正的思想领导力的形象,而不是生产明显由人工智能生成的样板。假设您很聪明,选择了一种增强的解决方案,为用户提供足够的控制权,以便他们仍然是文本的官方“作者”。随着新限制的出台,您可以免疫并利用该规定,
  • 支持技术:新兴技术和现有技术的重大飞跃,例如 2022-23 年的生成式人工智能浪潮,可以开辟新的做事方式,或将现有应用程序提升到新的水平。假设您在过去十年中一直经营一家传统的营销机构。现在,您可以开始将人工智能技巧和解决方案引入您的企业,以提高员工的效率,利用现有资源为更多客户服务,并增加您的利润。您正在以现有的专业知识、声誉和(希望是善意的)客户群为基础,因此引入人工智能增强功能可以比新来者更顺利、风险更小。

最后,在现代产品世界中,机会通常不那么明确和正式,可以在实验中直接验证,从而加快您的开发速度。因此,在产品主导的增长中,团队成员可以提出自己的假设,而无需严格的数据驱动论证。这些假设可以以零碎的方式制定,例如修改提示或更改某些 UX 元素的本地布局,这使得它们易于实现、部署和测试。_通过消除提供先验的_压力每个新建议的数据,这种方法利用所有团队成员的直觉和想象力,同时强制对建议进行直接验证。假设您的内容生成运行顺利,但您听到越来越多的抱怨普遍缺乏人工智能透明度和可解释性。您决定实施额外的透明度级别并向用户显示用于生成内容片段的特定文档。您的团队对该功能进行了一群用户的测试,发现他们很乐意使用它来追溯原始信息源。因此,您决定将其建立在核心产品中以提高使用率和满意度。

3、 价值

要了解和传达人工智能产品或功能的价值,您首先需要将其映射到用例(它将解决的特定业务问题)并计算出 ROI(投资回报率)。这迫使您将注意力从技术上转移开,专注于解决方案的用户方优势。投资回报率可以从不同的维度来衡量。对于人工智能来说,其中一些是:

  • 提高效率:人工智能可以促进个人、团队和整个公司的生产力。例如,对于内容生成,您可能会发现撰写博客文章 [2] 通常需要 4-5 小时,现在只需 1-2 小时即可完成,并将节省的时间用于其他任务。效率的提高通常与成本的节省齐头并进,因为完成相同数量的工作所需的人力更少。因此,在商业环境中,这种好处对于用户和领导层都具有吸引力。
  • 更加个性化的体验:例如,您的内容生成工具可以要求用户设置其公司的参数,例如品牌属性、术语、产品优势等。此外,它可以跟踪特定作者所做的编辑,并适应其世代随着时间的推移,该用户的独特写作风格。
  • 乐趣和愉悦:在这里,我们进入产品使用的情感层面,也被 Don Norman 称为“本能”层面 [3]。B2C 阵营中存在整个类别的娱乐产品,例如游戏和增强现实。那么 B2B 呢?您是否认为 B2B 产品存在于无菌的专业真空中?事实上,这一类别可以产生比 B2C 更强烈的情感反应。[4] 例如,写作可以被视为一种令人满意的自我表达行为,或者是与写作障碍和其他问题的内心斗争。想想你的产品如何能够增强任务的积极情绪,同时减轻甚至改变其痛苦的方面。
  • 便利性:您的用户需要做什么才能利用人工智能的魔力?想象一下,将您的内容生成副驾驶集成到 MS Office、Google Docs 和 Notion 等流行协作工具中。用户将能够在不离开舒适的数字“家”的情况下获得产品的智能和效率。因此,您可以最大限度地减少用户体验产品价值并继续使用它所需的努力,从而提高用户获取和采用率。

人工智能的一些好处(例如效率)可以直接量化投资回报率。对于便利和愉悦等不太有形的收益,您需要考虑用户满意度等代理指标。请记住,从最终用户价值的角度思考不仅会缩小用户和产品之间的差距。作为一个受欢迎的副作用,它可以减少公共通信中的技术细节。这将防止您意外地将不必要的竞争引入聚会。

最后,您应该尽早考虑的价值的一个基本方面是可持续性。您的解决方案如何影响社会和环境?在我们的示例中,自动化或增强的内容生成可以取代并消除大规模的人工工作负载。您可能不想成为整个工作类别的杀手——毕竟,这不仅会引发道德问题,还会引起您的工作受到威胁的用户的抵制。想想如何解决这些恐惧。例如,您可以教育用户如何有效地利用新的空闲时间来设计更复杂的营销策略。即使其他竞争对手正在追赶自动化内容生成,这些也可以提供防御护城河。

4、数据

对于任何类型的人工智能和机器学习,您都需要收集和准备数据,以便它反映现实生活中的输入并为您的模型提供足够的学习信号。如今,我们看到了以数据为中心的人工智能的趋势——这种人工智能哲学不再对模型进行无休止的调整和优化,而是专注于解决输入到这些模型的数据中的众多问题。当您开始时,可以通过不同的方法来获得合适的数据集:

  • 您可以使用现有的数据集。这可以是标准机器学习数据集,也可以是具有不同初始目的(您可以根据任务进行调整)的数据集。有一些数据集经典,例如用于情感分析的IMDB 电影评论数据集和用于手写字符识别的MNIST 数据集。还有更多奇特和令人兴奋的替代方案,例如捕获非法捕鱼和狗品种识别,以及 Kaggle 等数据中心上无数用户管理的数据集。您找到为您的特定任务制作并完全满足您的要求的数据集的机会相当低,并且在大多数情况下,您还需要使用其他方法来丰富您的数据。
  • 您可以手动注释或创建数据创建正确的学习信号。手动数据注释(例如,用情感分数注释文本)是机器学习早期的首选方法。最近,它作为 ChatGPT 秘密武器的主要成分重新受到关注。我们花费了大量的人力来创建模型的响应并对其进行排名,以反映人类的偏好。该技术也称为人类反馈强化学习 (RLHF)。如果您拥有必要的资源,则可以使用它们为更具体的任务(例如营销内容的生成)创建高质量的数据。注释可以在内部完成,也可以使用外部提供商或众包服务(例如 Amazon Mechanical Turk)完成。反正,
  • 因此,您可以使用数据增强向现有数据集添加更多示例。对于情感分析等更简单的任务,您可以在文本中引入一些额外的噪音,交换几个单词等。对于更开放的生成任务,目前人们对使用大型模型(例如基础模型)进行自动化有很大的热情训练数据生成。一旦确定了增强数据的最佳方法,您就可以轻松扩展数据以达到所需的数据集大小。

创建数据时,您面临质量和数量之间的权衡。您可以手动注释较少的高质量数据,或者将预算花在开发自动数据增强的黑客和技巧上,这会引入额外的噪音。如果您选择手动注释,您可以在内部完成并塑造细节和质量的文化,或者将工作众包给匿名人士。众包的质量通常较低,因此您可能需要添加更多注释来补偿噪音。你如何找到理想的平衡?这里没有现成的秘诀 - 最终,您将通过训练和增强数据之间不断的来回找到理想的数据组合。一般来说,在预训练模型时,需要从头开始获取知识,这只有在数据量较大的情况下才会发生。另一方面,如果您想对现有大型模型进行微调并进行最后的专业化处理,那么您可能更看重质量而不是数量。在这种情况下,使用详细指南对小型数据集进行受控手动注释可能是最佳解决方案。

5、 算法

数据是模型学习的原材料,希望您能够编译出具有代表性的高质量数据集。现在,人工智能系统的真正超能力——从现有数据中学习并推广到新数据的能力——在于算法。就核心人工智能模型而言,您可以使用三个主要选项:

  • 提示现有模型。GPT 系列的高级 LLM(大型语言模型)(例如 ChatGPT 和 GPT-4)以及来自 Anthropic 和 AI21 Labs 等其他提供商的高级 LLM(大型语言模型)可通过 API 进行推理。通过提示,您可以直接与这些模型对话,包括在提示中任务所需的所有特定于域和任务的信息。这可以包括要使用的特定内容、类似任务的示例(几次提示)以及模型要遵循的说明。例如,如果您的用户想要生成有关新产品功能的博客文章,您可能会要求他们提供有关该功能的一些核心信息,例如其优点和用例、如何使用它、发布日期等。然后,您的产品会将这些信息填充到精心设计的提示模板中,并要求法学硕士生成文本。提示对于在预训练模型中抢占先机非常有用。然而,随着时间的推移,你可以通过提示构建的护城河很快就会变薄——从中期来看,你需要一个更具防御性的模型策略来维持你的竞争优势。
  • 微调预训练模型。这种方法使得人工智能在过去几年中非常受欢迎。随着越来越多的预训练模型变得可用,并且 Huggingface 等门户网站提供模型存储库以及用于模型的标准代码,微调正在成为尝试和实现的首选方法。当您使用预先训练的模型时,您可以从某人已经对模型的数据、训练和评估进行的投资中受益,该模型已经“了解”了许多有关语言和世界的知识。您需要做的就是使用特定于任务的数据集对模型进行微调,该数据集可能比最初用于预训练的数据集小得多。例如,对于营销内容生成,您可以收集一组在参与度方面表现良好的博客文章,并对这些内容进行逆向工程说明。从这个数据来看,您的模型将了解成功文章的结构、流程和风格。使用开源模型时,微调是必经之路,但 OpenAI 和 Cohere 等 LLM API 提供商也越来越多地提供微调功能。特别是对于开源赛道,您仍然需要考虑模型选择的问题、训练和部署更大模型的成本开销以及模型的维护和更新时间表。
  • 从头开始训练您的 ML 模型。一般来说,这种方法适用于更简单但非常具体的问题,您拥有特定的专业知识或良好的数据集。内容的生成并不完全属于这一类——它需要先进的语言能力才能让你起步,而这些能力只有在对大量数据进行训练后才能获得。诸如特定类型文本的情感分析之类的简单问题通常可以通过逻辑回归等既定的机器学习方法来解决,这些方法在计算上比花哨的深度学习方法更便宜。当然,还存在相当复杂的问题的中间立场,例如特定领域的概念提取,您可能会考虑从头开始训练深度神经网络。

除了培训之外,评估对于机器学习的成功使用也至关重要。合适的评估指标和方法不仅对于自信地推出人工智能功能很重要,而且还可以作为进一步优化的明确目标以及内部讨论和决策的共同基础。虽然精确度、召回率和准确度等技术指标可以提供一个良好的起点,但最终您会希望寻找能够反映人工智能为用户提供的现实生活价值的指标。

6、用户体验

人工智能产品的用户体验是一个引人入胜的主题——毕竟,用户寄予厚望,但也担心与人工智能“合作”,因为人工智能可能会增强并可能超越他们的智力。这种人类与人工智能合作伙伴关系的设计需要深思熟虑且明智的发现和设计过程。关键考虑因素之一是您希望赋予产品的自动化程度 - 请注意,到目前为止,完全自动化并不总是理想的解决方案。下图说明了自动化连续体:
26171136-2023-09-26T09:11:35.png
图 2:人工智能系统的自动化连续体

让我们看看每个级别:

  • 在第一阶段,人类完成所有工作,不进行自动化。尽管人工智能大肆宣传,但现代企业中大多数知识密集型任务仍然在这个层面上进行,这为自动化提供了巨大的机会。例如,内容作家抵制人工智能驱动的工具,并相信写作是一种高度手工和特殊的手艺,在这里工作。
  • 在辅助人工智能的第二阶段,用户可以完全控制任务执行,并手动完成大部分工作,但人工智能工具可以帮助他们节省时间并弥补其弱点。例如,当在紧迫的期限内撰写博客文章时,使用 Grammarly 或类似工具进行最终语言检查可能会节省时间。它可以消除手动修改,手动修改需要您投入大量宝贵的时间和注意力,并且可能仍然会给您带来错误和疏忽——毕竟,人都会犯错。
  • 通过增强智能,人工智能成为增强人类智能的合作伙伴,从而充分利用两个世界的优势。与辅助人工智能相比,机器在您的流程中可以说的更多,并且涵盖了更多的职责,例如草稿的构思、生成和编辑以及最终的语言检查。用户仍然需要参与工作、做出决策并执行部分任务。用户界面应清楚地表明人类和人工智能之间的劳动力分配,突出显示潜在的错误,并提供其执行步骤的透明度。简而言之,“增强”体验通过迭代和细化引导用户达到期望的结果。
  • 最后,我们拥有完全自动化——这对人工智能极客、哲学家和专家来说是一个有趣的想法,但通常不是现实生活中产品的最佳选择。完全自动化意味着您提供一个“大红色按钮”来启动该过程。一旦人工智能完成,你的用户就会面临最终的输出,要么接受,要么放弃。中间发生的任何事情他们都无法控制。正如您可以想象的那样,这里的用户体验选项相当有限,因为几乎没有交互性。成功的大部分责任落在您的技术同事的肩上,他们需要确保极高的输出质量。

人工智能产品在设计时需要特殊对待。标准图形界面是确定性的,允许您预见用户可能采取的所有可能路径。相比之下,大型人工智能模型具有概率性和不确定性——它们展现了一系列令人惊叹的能力,但也存在诸如有毒、错误和有害输出等风险。从外部看,您的 AI 界面可能看起来很简单,因为您产品的许多功能直接驻留在模型中。例如,LLM可以解释提示、生成文本、搜索信息、总结信息、采用某种风格和术语、执行指令等。即使您的 UI 是一个简单的聊天或提示界面,也不要忽视这种潜力——为了引导用户走向成功,你需要明确而现实。让用户了解人工智能模型的功能和局限性,让他们轻松发现和修复人工智能所犯的错误,并教他们如何迭代以获得最佳输出。通过强调信任、透明度和用户教育,您可以让用户与人工智能进行协作。

虽然深入探讨人工智能设计这一新兴学科超出了本文的范围,但我强烈建议您不仅从其他人工智能公司寻找灵感,还从其他设计领域(例如人机交互)寻找灵感。您很快就会识别出一系列重复出现的设计模式,例如自动完成、提示建议和人工智能通知,您可以将它们集成到您自己的界面中,以充分利用您的数据和模型。并教他们如何迭代以获得最佳输出。通过强调信任、透明度和用户教育,您可以让用户与人工智能进行协作。

此外,为了提供真正出色的设计,您可能需要为您的团队添加新的设计技能。例如,如果您正在构建一个聊天应用程序来完善营销内容,您将与一位对话设计师合作,他负责对话流程和聊天机器人的“个性”。如果您正在构建一个丰富的增强产品,需要通过可用选项彻底教育和指导您的用户,那么内容设计师可以帮助您构建正确类型的信息架构,并为您的用户添加适量的推动和提示。

最后,要对惊喜持开放态度。人工智能设计可以让你重新思考关于用户体验的最初构想。例如,许多用户体验设计师和产品经理都致力于最大限度地减少延迟和摩擦,以便使用户体验更加顺畅。那么,在人工智能产品中,你可以暂停这场战斗,并利用两者来发挥你的优势。延迟和等待时间对于教育用户非常有用,例如通过解释人工智能当前正在做什么并指示他们可能采取的后续步骤。对话和通知弹出窗口等中断可能会带来摩擦,从而加强人类与人工智能的合作伙伴关系,并提高用户的透明度和控制力。

7、 非功能性需求

除了使您能够实现特定功能的数据、算法和用户体验之外,所谓的非功能性需求 (NFR)(例如准确性、延迟、可扩展性、可靠性和数据治理)可确保用户确实获得预期的价值。NFR 的概念源自软件开发,但尚未在人工智能领域得到系统解释。通常,这些需求是在人工智能功能的用户研究、构思、开发和运营过程中以临时方式提出的。

您应该尽早尝试理解和定义您的 NFR,因为不同的 NFR 将在您旅程的不同阶段出现。例如,需要从数据选择的最初步骤开始就考虑隐私。当用户开始在线使用您的系统时,准确性在生产阶段最为敏感,可能会因意外输入而不知所措。可扩展性是一个战略考虑因素,当您的企业扩展用户和/或请求的数量或所提供的功能范围时,它就会发挥作用。

对于 NFR,您不可能拥有全部。以下是您需要平衡的一些典型权衡:

  • 提高准确性的首要方法之一是使用更大的模型,这会影响延迟。
  • “按原样”使用生产数据进行进一步优化最适合学习,但可能会违反您的隐私和匿名规则。
  • 更具可扩展性的模型是多面手,这会影响它们在公司或用户特定任务上的准确性。

如何优先考虑不同的需求将取决于可用的计算资源、您的用户体验概念(包括自动化程度)以及人工智能支持的决策的影响。

8、总结要点

  1. 以终为始:不要认为仅靠技术就能完成这项工作;您需要一个清晰的路线图,将人工智能集成到面向用户的产品中,并教育用户了解其优势、风险和局限性。
  2. 市场契合:优先考虑市场机会和客户需求,引导人工智能发展。不要在没有经过市场验证的情况下,通过炒作推动人工智能的实施。
  3. 用户价值:从效率、个性化、便捷性等价值维度定义、量化和传达AI产品的价值。
  4. 数据质量:关注数据质量和有效训练人工智能模型的相关性。尝试使用小型、高质量的数据进行微调,并使用较大的数据集从头开始进行训练。
  5. 算法/模型选择:为您的用例选择正确的复杂性和防御性级别(提示、微调、从头开始训练),并仔细评估其性能。随着时间的推移,当您获得必要的专业知识和对产品的信心时,您可能希望切换到更高级的模型策略。
  6. 以用户为中心的设计:设计人工智能产品时考虑用户的需求和情感,平衡自动化和用户控制。注意概率人工智能模型的“不可预测性”,并引导用户使用它并从中受益。
  7. 协作设计:通过强调信任、透明度和用户教育,您可以让用户与人工智能协作。
  8. 非功能性需求:在整个开发过程中考虑准确性、延迟、可扩展性和可靠性等因素,并尝试尽早评估这些因素之间的权衡。
  9. 协作:促进人工智能专家、设计师、产品经理和其他团队成员之间的密切协作,从跨学科智能中受益并成功集成您的人工智能。