“大多数人工智能初创公司注定无法成功”的说法可能听起来平淡无奇。毕竟,仅从数字来看,大多数初创公司都注定无法成功。我想说一些更具挑衅性的话:几乎所有在ChatGPT之后的炒作中诞生的初创公司以及专门给自己贴上“人工智能初创公司”标签的公司都注定无法成功。现在,我是一位长期聚焦人工智能投资的VC投资人,事实上,我最初放弃对冲基金的工作,是因为我看到人工智能领域发生了如此多的事情。所以,我绝对不是人工智能的怀疑论者。话虽如此,从根本上,我认为在投资人看来,当前炒作周期中获得融资的大多数公司都是毫无价值的。

1. 你一个周末打造出来,别人也可以

我们从最简单的情况谈起。我见过很多初创公司,他们基本上只是简单地将几个生成式人工智能API整合在一起,做一些提示工程开发,然后添加一个前端用户界面。有一些产品做得很精致,功能方面也令人印象深刻。但这些公司也都注定不会成功,要么成为普通的公司(但不是保罗·格雷厄姆定义的典型初创公司),要么消亡。

显然,如果这家公司是你在一个周末打造出来的,别人也可以做到。假设你是一名编程天才,是名副其实的10X级别的程序员神童!其他人可能需要几个周末的时间……但最终会打造出来。如果你的项目只是提供免费分享的产品,只是为了娱乐,那没什么问题。但是,如果你开始收费,并且客户开始非常依赖它,其他竞争者可能会以更低的价格介入进来。也许你的产品还是更好,并且用户往往会选择更好的产品。但如果产品确实很重要(即客户有很高的支付意愿并且经常使用),那么经济学和竞争的规律就会发挥作用:其他人会模仿你并争夺你的利润。

没有防御性和没有差异化就等于没有利润。这是基本的经济学原理。

2. 连Alphabet、Meta或OpenAI都没有任何防御能力

这些就是基础的经济学知识和创业常识,对于人工智能这个领域来说也并不新鲜。每个创业热点的炒作周期,其本质特征都是人们忘记了这些基本规则的存在,然后在周期结束时懊恼地重新认识到它们。不过,请注意,我主要谈论的是那些仅仅简单地将ChatGPT等API集成到用户界面的初创公司。这些公司显然没有什么差异化和防御性。即使你的用户界面做得更好,其他人也可以轻易模仿。不过,我的观点不局限于这些浅显的例子。现在,同样的逻辑应用到ChatGPT、Bard、LlaMA等大语言模型(LLM)底层技术本身也是成立的。

如果我告诉你,我有一项出色的技术,所有人都想使用,要创造它,我必须做的事情包括:

  1. 收集网上所有文本
  2. 使用大量的GPU、花费数百万美元对其进行训练
  3. 基于众所周知的技术(其中大部分是开源的)打造它

这样就具备防御性了吗?对于小规模初创公司来说,第1点和第2点可能会遇到一定程度的技术或保障困难,但对于其他大公司来说,这些都不是特别难以克服的,尤其是与第3点的事实相结合时。所有这些技术都建立基于变型器(Transformer)和大语言模型(LLM)的相同底层架构上。这些LLM没有真正的护城河,任何一家大型的互联网公司都有能力复制它们。

事实上,甚至连Alphabet/Google内部也有类似的说法。对于所有图像和视频生成式人工智能(生成式AI)也是如此。只需用图像或视频替换第1点(注:如果Alphabet可以限制对YouTube的访问,则视频可能是一个例外)。但如果我拥有最佳版本的人工智能会如何呢?现在,我们已经确定,基于其他人的技术打造API并不是非常有用(我们的浅显案例)。我们现在还讨论了,为什么LLM这个不那么微不足道的案例,从根本上来说也是不具备防御性的。

如果我灵活运用上面的第3点,并提出LLM的最佳版本会怎么样?或者在人工智能的其他领域也有类似的创新呢?从理论上讲,这很有吸引力。但问题是,整个行业的技术前沿发展速度太快了。

这就像在上世纪90年代拥有最快速度的CPU

如果在20世纪90年代告诉你,我拥有最好的CPU会怎么样?比如说,它的速度是英特尔的3倍!考虑到开发CPU的成本和难以置信的难度,这在技术上确实令人难以置信!但接下来的问题是,你能年复一年地重复这一壮举吗?因为考虑到当时半导体技术的发展速度(摩尔定律),你(也许)有一两年的优势。英特尔和其他公司将很快拿出可以媲美的产品。如果你有一些特殊的手段可以不断保持领先,这是一回事,但更有可能的是,你只是偶然发现了一些优化技术,其他人很快也会采用。今天的人工智能领域也存在同样的问题。前沿技术发展得太快了,整个人工智能学术界和行业研究界的前沿几乎肯定比你一家公司的实力更强。顺便说一句,当我们谈论研发实力时,即便在最大规模的情况,这一挑战仍然存在。例如,据传闻称,中国在人工智能上的发展速度并没有跟上全球(主要是美国)研究界的步伐。基本上,所有独立发展专有模型的公司都会很快落后,并最终不得不采用全球最先进的技术。人工智能比半导体更糟糕,因为所有人工智能都倾向于开源,这使得在算法能力方面保持任何长期优势变得更加困难。

因此,除非你能够利用那一两年的优势真正构建一条持久的护城河,否则你不会获得任何持久的价值——如果你仔细想想,要做到这一点实际上是非常困难的。

3. 那么什么具备防御性呢?

那经过这个筛选过程,到底还剩下什么?

1)哥斯拉规模的巨量计算

你可以从事一些计算密集型的东西,只有你才能以经济可行的方式进行训练或推理。在我看来,这种情况不太可能发生,因为人工智能在减少实现特定结果所需的数据量和计算量方面取得了长足的进展。但请注意,我的这个观点并不太受欢迎。你可以自己判断这一点是否正确。不过,至少从投资人的角度来看,即使这确实是一个优势,我也对一家初创公司积累比谷歌、Facebook、百度等巨头更多的GPU/ASIC/FPGA的策略不感到兴趣…

2)真实世界的专有数据

另一方面,你可以进入一个无法简单地从互联网上获取数据的领域。例如,医疗健康数据被孤立在医院里,甚至现在根本没有被收集起来;另外,蛋白质折叠或药代动力学反应数据等,都必须通过现实世界的实验精心收集。还有很多其他的数据…所有这些都有一个共同的特点,那就是这些数据不存在于纯粹的数字世界中,并且不能简单地从互联网上爬取。这就是我认为大多数人工智能初创公司的价值所在。在这些领域,你无法简单地收集数据,而是需要应对高昂的成本、时间和物理世界混乱性。这些初创公司可以简单地顺应人工智能技术进步的浪潮——这并不重要,因为算法都已经商品化了——但它们却唯一拥有并掌握那些几乎不可能获取的真实世界的专有数据。

4. 创造的价值并不意味着获取的价值**

请注意,上文我提到了初创公司。很多人忘记了,仅仅因为在社会层面上创造了价值,并不一定意味着该价值完全被一家公司获取。20世纪90年代的互联网繁荣期,打造了大量的网络基础设施,但这些公司实现的却是巨大的负值投资回报率(ROI)。虽然这些基础设施对于社区的线上化来说大有裨益,但这是社会效益,而不是公司的投资回报率。在近期的一个案例中,你是否知道Azure实际上运行着大量的私有区块链?出于多种种原因,很难真正在公司的财务报告上公开这些内容,但很多大公司在Azure上运行这些区块链,使微软成为区块链的大赢家之一。(当然,还有一个单独的问题,即私有区块链是否真的与数据库存在不同。但这与本文观点无关。)

类似的情况也可能发生在OpenAI身上,OpenAI看起来就像是微软的研发实验室。微软在Azure中提供计算资源,作为回报,OpenAI开发工具,再由Azure将其作为托管服务提供。然后,Azure可以通过ChatGPT和其他可以按需付费的API调用方式赚大钱。当然,这与Bard和谷歌云技术(Google Cloud Compute)等看起来也是一样的。

这一原则贯穿了当今人工智能领域的大部分领域。这些领域将会产生大量价值,但这些价值只会归社会所有,不会被任何私人参与者攫取。顺便说一句,这实际上太棒了——这就是技术成为我们社会和宏观经济中为数不多的“免费午餐”之一的方式。当然,会有大量的价值将会被现有的行业巨头攫取,它们利用其市场影响力和规模优势。虽然这对社会而言不是免费的午餐,但也是资本主义的运作方式,并且通常仍然为社会创造“剩余价值”(经济学上的“好东西”)。

最后,只有一小部分的价值,既会被创造出来,又会被新的、年轻的公司所获取,理想情况下,这些公司可以不断发展并最终取代现有的巨头企业(这就是健康的市场更替方式)。这些公司将产生巨额的回报,并成为未来的知名科技公司——当然,这正是VC投资人在理论上追求的目标。但现实中,大多数投资人在向人工智能初创公司(甚至是声称拥有“人工智能战略”的大型上市公司)投资时却过于随意。因此,大多数的资金都被直接冲进了下水道,白白浪费掉了。

人工智能将改变世界。但绝大多数人工智能初创公司都注定无法成功。

原文:https://weightythoughts.com/p/most-ai-startups-are-doomed