“刚开始觉得模型还挺值钱的,现在又陷入到内卷了。前段时间碰到一个客户,BAT等都报价了。刚开始报价,还挺贵,1000多万。大家知道最后的成单价是多少?太卷了。”

在“大模型改变世界”、“AIGC颠覆千行百业”、“50%的岗位将被AI替代”等观点不断冲击我们认知的时刻,一群人聚在一起,清醒地说一些真话。这些真话,不亚于某些箴言。

9月12日下午,创业黑马北京总部迎来一波 “AI新势力”。

华为云、APUS、拓尔思、商汤、快手、360集团、清博智能、黑马天启、MiniMax、创新工场、奇绩创坛、中国信通院……有上市公司,有龙头企业,有独角兽企业,还有AI领域领先的投资机构和科研院所。

参会嘉宾们直奔主题——

“大模型目前的行业现状?企业如何更好地进行商业化?有哪些值得关注的新趋势和新机会?”

很荣幸,参与了本次AI闭门会,38条笔记和真话,分享给大家。

行业到底有多卷?

最新统计,中国已有130多个大模型问世,在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型,仅2023年就有超60家创业公司拿到融资,产品更是布满了基础层、模型层和应用层。新一代生成式AI,可能要回头看看上一代AI趟过的坑,不要行业自嗨,避免上一个冬天的轮回。在这个领域的从业者,更要清晰地看到行业的内卷和客户的痛点,别被大佬的鸡汤迷了眼。

1、现在有客户找到我们,说有20个场景,一个场景X万块?然后挨家询价,华为做不做?阿里做不做?百度做不做?要这么卷下去,最后都没有钱赚。

2、大家融到的钱,80%-90%给到了算力,这是现状。要知道,现在还只是训练,训练的成本是可控的,推理的成本是不可控的。

3、我们GPU有30000块,算力6000p,年底争取算力超12000p。数据方面,每个月有2万亿token清洗和标注完,年底会有10万亿的token。

4、目前看,行业还是缺少一些颠覆式的杀手级的应用,从而难以实现商业化的变现。

5、怎么能够在成本和效果之间,找到一个平衡点,这是比较难的地方。都用大模型,成本太高了。

6、再过一段时间,大家要比拼的是基础设施的优化能力。比如,网络优化能力,别人断时你不断,就能比别人多训练几次。

7、在算力紧张的情况下,我们在做一些前瞻性的技术尝试。大家可能都想不到,在我们大模型公司,做基础架构的同学,比做模型的同学要多。他们普遍的价格都还挺贵,也很难招。

8、大模型现在很尴尬,自身卖不上价格,最后都是卖云卖卡卖算力的赚钱了。

9、刚开始觉得模型还挺值钱的,现在又陷入到内卷了。前段时间碰到一个客户,BAT等都报价了。刚开始报价,还挺贵,1000多万。大家知道最后的成单价是多少?太卷了。

10、百亿参数的大模型,在某些特殊客户的认知里面,就是免费的。

来自一线的声音

人工智能领域的企业,耳根子应该时刻记得毛主席说的话,“从实践中来到实践中去”。脱下长袍马褂,走到田间地头,在客户身边才能得到最真实地反馈。现在AI领域的伪专家太多了,不如多听听来自一线的声音。

11、我们大概聊了150个客户。对于大模型本身的需求主要分为两类。一类是大模型本身文字上的需求,客户对大语言模型的要求是100%准确。另一种,是AI agent,函数调用、代码显示器、调用第三方工具。

12、我们在合作过程中,出现了一个冲突矛盾。客户会觉得,在内部决定部署之前,是不能把数据拿出来给你的。但如果没有这个数据,我们又怎么能训练出适合客户需求的模型呢?

13、我们在做项目的时候发现,用户是不愿意为大模型去买单的,他还是为你的应用去买单。有的客户会直接问,有了大模型,以前的一些智能中台、知识图谱就不需要了吗?最后发现,场景才是最核心的。

14、我们要找到一些性感的场景。有几个标准。第一,小切口。第二,跟大模型的优势相匹配。第三,让买单的决策用户有强感知。比如以前获取一些数据、结论或者服务,需要不同的流程,现在通过大模型,决策者在移动设备就能快速获取和完成。

15、大模型想做成功需要三件事:1)能不能拿到足够多的钱去买算力。2)能不能拿到足够多的数据。3)人才密度是不是够厚,不在数量多,而是有没有足够多的高质量的科学家。

16、现在我们遇到三类客户。一类是焦虑的客户,比如金融的客户因为竞对都在搞,于是也想搞,但他并不清楚自己的需求是什么?一类是希望降本的客户,客户的管理层认为,这主要是降本节流的问题,但模型到底节流了多少,不好评判具体的价值。最后一类是希望部署模型开源赚钱的客户,他是靠这个模型来创收的,这类客户付费是最爽快的。

ToC 还是 ToB?

据了解,GPT-4训练一次的成本约为6300万美元,需要1.8万亿巨量参数。中国目前发布的一些大模型,ToC方向还是互联网的免费模式。但从业者都清楚,大模型的开发和运行都需要消耗大量的成本,从而ToB的商业模式更容易良性运转。在商业化探索上,ToB还是ToC,一直是行业关注的问题。在闭门会中,我们反复听到了两个关键词:1)基因 2)越界。“你无法成为你所不是的”。

17、我们认为机会还是在tob垂直模型,核心点在数据和场景本身,这是最核心的。

18、我们自己也在思考,人工智能如何跟互联网、数字化等结合起来,怎么更好地将原来的场景做得更智能。

19、ToC还是ToB,坦率讲这跟大家的基因有关。我们做不到,不代表别人做不到。比如一些ToC的应用,都是一些00后10后的小朋友在玩,超出了我们年龄的认知。

20、Toc和Tob还是很不一样的。ToC对容错率相对较高。TOB则相反。举个例子,智能问答。准确率如何保证?像政府,都是有红线的。如何避免模型的幻觉,目前大家都在做相应的探索。

21、我们反而认为ToC赚钱比较容易。ToB有个问题,一个项目的历程时间比较长。客户批预算,再到立项,再到实施,钱的周期是很长的。

22、我觉得现在是机会太多,不要把资源分到你所不是的地方,做战略选择,这个很重要。

ToB 和 ToG 也很苦

23、B端最大的bug在于,最后做成了高级的人力外包。

24、所有的项目都是有周期的,所有的付款也是根据周期的节点来走的。不可能我无限制地帮你训练和优化一个模型。

25、AIGC创作这种,包容性比较强,可以有些错误。但到一些企业生产制造,对准确性的要求就很高了。往往我们从模型中挑一两个比较好case是比较容易的,但要它维持在较高的水平里面,没有比较差的case,这个还是蛮难的。

26、我们在一个经济发达的省份去做智能数字化政府项目的时候,我们推了超过5个场景,最后客户就认可了3个场景。接着,就对安全、对数据、对底层刨根问底。接着还会问,你们跟其他大模型的差异和优势是什么?最后,多方要坐下来,出一个评测体系。评测体系过了还要评性能。

用项目孵化产品和方案

27、用项目孵化产品,做完几个项目后,抽离出相应的技术方案。这套方案,大概率不是一个模型,而是大模型+小模型,最后是多个模型形成的综合解决方案。

28、最近一两年,可能是做创新、做产品的过程,现金的回收周期会相对长一些。

Agent

想象一下人工智能模仿人类的日常任务来处理大量人类的复杂社会行为。斯坦福大学的一篇名为《Generative Agents: Interactive Simulacra of Human Behavior,titled》的论文深入研究了记忆、反应和计划的AI Agent。AI Agent 被认为是OpenAI 发力的下一个方向。OpenAI 联合创始人在近期的活动上也说:“相比模型训练方法,OpenAI内部目前更关注Agent领域的变化,每当有新的AI Agents 论文出来的时候,内部都会很兴奋并且认真地讨论 ”。

29、我们总会把大模型想象成万能的,它能解决各种各样的问题?事实是这样的么?大模型只是大模型。

30、我们内部管AI,叫隐形的AI。在用户面前,我们不会强调是什么模型,参数有多少。我们对AI的定义,就是人的辅助。

31、绕开模型,绕开算力,可能接下来的机会就是Agent。

32、目前影响客户使用的最大的问题:投入产出比。一旦跟客户聊到最后,谈到项目预算的时候,如果只是纯文字相关,投入大几百万小几百万,客户就不太满意。另外,如果大模型使用AI agent 嵌入到实际的生产环境中,解决实际的问题,客户会非常愿意买单。

33、在大模型基础上,AI Agent具备记忆、规划和执行等能力,能力加强。我们这期投了60多个初创项目,其中20多个都是Agent。

34、中国和国外,ToC的产品,付费形态和产品形态,差别也特别大。近期,我们投了一些Agent的公司。

35、但是,现阶段AI Agent只是处于新的尝试阶段,距离通用智能还有一定差距。未来还需要解决单个AI Agent综合能力之外,多个AI Agent之间协作及情感(Emotion)等方面能力表现的突破。

36、大模型玩家,要保证自己能留在牌桌上,才有机会看到下半场新的东西出来。