初创公司也有机会参与大模型和生成式AI的未来
在过去的70年中,按照任何一个指标来看,计算机技术都取得了巨大的成功。它一直呈现上升趋势。
我们已经解决了许多原本认为计算机不擅长的问题。例如,在20世纪50年代和60年代,我们利用专家系统进行医疗诊断。在80年代和90年代,我们利用计算机在国际象棋上击败了俄罗斯选手。我们擅长图像识别和机器人技术,解决了很多最初认为计算机只是大型计算器的问题。
除了解决这些问题之外,几十年来,许多计算机技术解决方案实际上都比人类做得更好。比如,计算机技术在手写检测上比人类做得更好,在识别图像中的对象上也比人类做得更好。有了这一切神奇的技术,也为大公司增加了很多价值,对吧?每次你使用谷歌搜索时,这都是在使用AI。任何时候你得到一些个性化服务时,这也是AI,对吧?这些东西就像魔法一样,它已经存在很长时间了。它解决了许多问题。
因此,在投资界出现了一个巨大的难题。这个难题是:如果这些东西如此神奇,解决了许多问题,为什么我们没有看到像移动互联网或互联网那样的平台转变(platform shift )呢?为什么这还没有发生?
a16z对此做了很多研究,答案是,尽管计算机技术像我所说的那样,能力非常出色,但其能带来的经济效益并没有以同样的方式出现。这有很多原因。我无法详细说明,但我会简要介绍几点。
因此,其中一个原因是,很多解决方案往往只适用于小众市场。缺乏广泛的市场吸引力。第二个也可能是最重要的原因是,许多AI应用场景对准确性要求非常高,比如机器人技术,要达到绝对的准确性非常困难,需要大量的投资。此外,还需要配合相应的硬件设备,这通常涉及更多的成本和资源投入。
最后,AI的竞争对手不是另一台计算机,实际上是人类的大脑。很多时候人脑非常高效,而且成本极低。
其中最好的例子之一就是自动驾驶车辆或机器人出租车。我在2003年进入斯坦福大学攻读博士学位时,Sebastian Thrun刚刚赢得了DARPA大挑战赛,他驾驶一辆面包车在沙漠中实现了自主驾驶并赢得了比赛。我们当时很激动,认为自动驾驶汽车在2003年已经是一个解决方案了。
但再看看现在,如果再往前数20年,我们已经为一个行业投资了750亿美元。虽然当前确实有自动驾驶汽车上路,它们表现很棒,正在解决真正的问题,但单位经济效益仍然比如Uber和Lyft要差,因为它们在与人脑竞争。因此,尽管这是非常重要的技术,但迄今为止,它实际上仍然局限在能够承担这些投资的大型公司领域。
因此,过去几十年关于AI的教训并不是无法构建技术技术,以及我们无法将其商业化,甚至我们在所有这些方面都做得很好,关键问题是初创公司仍然非常难以围绕其建立业务。
所以,我们如此兴奋行业变化如此之快的原因是,这波浪潮在经济形态上与过去相比非常非常不同。
当我谈论这股浪潮时,我指的是大语言模型、基础模型或最先进模型的出现。这些是一种软件,你输入文本或图像,然后就能得到一些结果。结果可能是图像、文本或对话。它们非常智能,你可以向它们进行任何提问,它们都会给出答案。
AI以前无法做到这一点。例如,创造力。这些模型在创造图像、音乐或声音模仿方面比人类做得更好。事实证明,它们在自然语言推理方面也很出色。它们是出色的对话者,是好朋友,是浪漫的伴侣,是优秀的治疗师,现在它们还承担着我们称之为副驾驶(copilot)的角色,这是一个泛指它们擅长的各种在线任务的术语。这里的“mean”指的是“平均”,即AI能够处理常见的、平均水平的任务。如果有某项任务是经常进行的,AI可以逐渐掌握并且也能够完成它。
还记得我说过的,传统AI的经济效益不佳,有一系列原因吗?这些原因并不适用于大语言模型和生成式AI。后者的市场规模是巨大的。仅视频游戏和电影市场就有大约0.5万亿美元。在这些应用中,准确性并不是最重要的问题。我的意思是,创造一个幻想图像或创作一首十四行诗之类的事情,并没有正式的准确性概念。也就是说,当前AI技术应用的场景主要是软件领域。与传统AI时代相比,当时的经济模型已经不适用于生成式AI。
最后一点是我没有预料到,也最令人惊讶的,事实证明,对于这些我们认为非常人性化的任务,比如沟通、社交互动和创造力,计算机远比人类更便宜,更出色。我想举一个非常具体的例子。它可能听起来有些愚蠢,但实际上非常具有普遍性。
比如我想要创造一个我自己作为皮克斯角色的图片,如果我让AI模型来做,实际的推理成本,也就是做这件事的成本大约是1/100美分,而且只需要大约一秒钟。但如果你雇佣一名平面设计师,可能需要100美元一小时,甚至比这多得多。所以,AI并不仅仅是稍微更好而已。它不是比人类好20%,而是便宜且快速比人类多了4个数量级。
并且这不仅仅限于图像,对任何形式的语言理解也是如此。比如,拿复杂的法律文件来说。我可以把一份复杂的法律文件输入到一款大语言模型中,然后提出问题。如果进行类比的话,就好比我与我的律师合作。律师需要阅读文件,理解内容。我不知道律师的平均费用是多少,但一般来说,至少需要500美元。但使用大语言模型比人类律师便宜和快速得多,并且价格方面节约了四到五个数量级。
正因为如此,我们作为风险投资者和私募市场的一员非常兴奋,因为我们正在见证互联网历史上增长最快的公司,包括互联网本身作为一个平台和生态系统,也在经历快速的增长和变化。这是通过收入或用户数量等指标来衡量的。正是经济上的各种颠覆创造了新的创业公司,而不仅仅是新技术。
因此,从历史上看,当边际成本降低如此之多时,就会引起平台转变,彻底改变行业。这种情况发生过两次。
第一次是计算机。随着微处理器的问世,计算机的边际成本降至零。在有了微处理器之前,计算都是靠人工完成的。就好比人们在大房间里制作对数表。然后ENIAC问世,速度提高了四个数量级,于是就有了计算机革命。接着,IBM和HP等公司纷纷涌现。
互联网将分发的边际成本降至零。在此之前,无论你要发送什么,你都需要邮寄或寄信,而现在可以通过互联网发送,费用也很低。顺便说一句,这也是提升了四个数量级。并引发了互联网革命,亚马逊、谷歌和Salesforce等公司随之兴起。
而现在,大型模型将创造成本降至零,无论是创造图像和语言理解,或是解读文档内容,等等这些都是可以广泛应用的领域。
现在,每当我们谈论经济时,我们总是会谈到就业变动(包括裁员等)问题。这非常重要,尤其是在面对如此大规模的经济颠覆时。我们可以从过去两个时代中即微处理器时代和互联网时代学到很多经验。
如果需求具有弹性,也就是说,对于计算能力和分发能力的需求似乎是无限的,那么即使成本降低,总体吞吐量和使用量也会因为更易于获取而大幅增加。因此,这些变革不仅不会减少就业岗位或价值,反而会扩大经济增长。就像互联网非常确定地提振了美国的经济增长一样。所以,我们认为这次也会发生同样的情况。
所以,准备迎接一波新的代表性公司的到来吧。这几乎肯定会发生。我们现在看到的技术进步不仅仅是解决了以前从未解决过的问题,而且它们的经济效益也是显而易见的。
当互联网出现时,我们其实并不知道会有什么结果。就像我们无法预测Google和雅虎会出现一样,但我们知道一定会有所发生。这有点像那种时刻,但我们有一些眉目。我们知道社会秩序正在改变。我们也知道现在有一些非常实际的应用场景正在被商业化,人们正在使用它们。
创造力本身将会发生变化。生产力和工人的平均水平也正在发生变化。一个显著的发展趋势是,我认为我们首次真正能够看到具身通用人工智能(Embodied AGI)的实现。所谓的“具身AGI”指的是经济上可行的人工智能,也就是说,不会有一群因为成本太高而无法工作的机器人。换句话说,这种AGI能够解决我们需要解决的实际问题。