AI产业链下半年投资机会
01 AI三大板块都有机会,行情能否持续关键看两点
妙投:AI是今年资本市场投资主线,已积累较大涨幅,最近两个月处在震荡行情中。您认为下一步AI行情会怎么走?
武超则:每一轮科技创新,一定是先是主题行情。看到市场的巨大机会,大量公司涌入。这个阶段看不清基本面。比如最终到底大模型谁能跑出来?没人能回答。但可以确定的是:
第一,AI是一跟移动互联网、PC互联网同样量级的革命,相比于单点技术比如元宇宙,它机会更大。
第二,它在中长期需要不断被验证,去辨别真伪,持续迭代,可能大家各领风骚三五年,都很正常。
我个人判断,目前还是偏主题投资为主。主题投资也正常,行业在巨大变革中,每个公司都会有机会,估值空间就是会被打开。
我们简单把AI产业链分成大模型、中间层算力,再加上应用。未来半年内,算力的业绩确定性、基本面兑现确定性会更高。因为做基础算力是个门槛比较高的生意,而且在这个节点上,确实在通胀阶段。因为做大模型的人很卷,对于上游包容度会高一些。
第二大机会是大模型,空间很大,但胜率很低、赔率很高。谁能跑出来,毫无疑问就是时代的龙头。
第三是应用。应用现在国内还是偏主题投资,最简单的建议是板块化投资。这时候选白马不一定效果最好。应用阶段赔率很好,巨大不确定性,变化很快,最后只有5%甚至更少的公司跑出来。但过程中板块的涨幅是巨大的。它更多是行业贝塔机会。应用来讲,不能太苛求必须得落地业绩,到那个节点可能公司已经很贵了。
所以大体判断,三大块都有机会。在投资上,影响整个板块最核心的因素,一是半年内要有比较靠谱的大模型出来。靠谱是类似GPT3.5到4这个区间,能让大家用上,这比较关键。
二是要有让大家眼前一亮的应用。不管是To B还是To C,至少能看到流量、日活、月活增长。2013年游戏能起来,是因为当年月活千万或更高的手游不断出现,这才能推动行业持续往前走。
02 高质量语料愈发成为AI发展关键
妙投:报告提到通用AI曙光乍现、现在离通用AI还有多远距离?
武超则:时间很难判断,各有各的解读。像OpenAI CEO说很快出现,也有人提到在未来十年内也不一定能出现通用AI节点。
我个人理解,AI三大阶段,现在处在弱人工智能阶段。AI在大模型出现之前,更多是在底层的深度学习、专家网络等。大模型出现之后,是真正意义上的类人智慧,即弱人工智能时代开始。一旦开始,再往后迭代、向上学习的速度会加快。因为不管是喂给它的数据,还是算力提升,以及训练周期和速度,都比人类学习要更快。有数据说到2026年高质量语料就会被学习完。过了这个奇点之后,它向更聪明的智慧去演化的速度是变快的。
通用AI本质上指跟人类现有智力相等同的阶段。过了节点再往后演进就是强人工智能,即超过人类平均智慧水平的阶段。这是后半段,影响行业会非常多。
妙投:走向通用人工智能,会通过怎样的途径?是像大模型这样不断增加参数吗?
武超则:肯定是综合手段。现在看大模型底层要素,一方面是模型算法自身,现在算法里面比较核心的,除了用大模型去计算大数据的方法之外,还有人工干预的强化模型等,在算法上有创新迭代。更重要的是,接下来高质量数据尤其是新增语料是核心。
现在大模型至少千亿数据集,也有万亿数据量的模型。数据量足够大。关键是边际的高质量语料。这些数据从哪来呢?有新的说法叫具身智能,就是不能仅从过去存量互联网上去获取数据。它可能会是信息茧房,还要跟真实世界学习,比如通过机器视觉、机器人、真实发生在工厂或边缘场景上的数据,作为学习对象。
弱人工智能阶段大部分是让机器会语言、会工具等简单场景。越往通用AI去走,场景的复合度、复杂程度会提高。所以除了基本的算法、算力之外,核心就是数据加场景。
妙投:未来AI竞争的核心要素相比于算法跟算力,数据可能是更重要的要素?
武超则:门槛的话都需要,但再往后有二八定律,即模型边际效率的提升,八成由数据决定,两成由模型自身决定。
03 芯片关键在“生态+集群”,光模块后续要看加单节奏与技术迭代速度
妙投:算力现在有瓶颈,未来可能不再是瓶颈。
武超则:算力分训练阶段和推理阶段,一大部分是训练模型的阶段,为什么一定要用国外AI芯片龙头的A100、H100甚至模块化产品?因为模型训练是巨大矩阵,它不断地点乘,对通用并行计算的需求巨大,相当于要去总结概括小数点后一万位数字,对并行计算要求非常高。算力需求是这种计算任务决定的。
之后到了推理阶段,需求肯定不会问到小数点后1万个数,所以会出现专用推理芯片,包括可以去蒸馏一些模型。不需要巨大矩阵去回答一些垂类场景单一、专业的问题,不需要每次都运算千亿甚至万亿数据集的大模型,而是会变成几百亿甚至几十亿的数据集,单场景算力需求下降,不需要太先进的并行计算大芯片。当然这是用单一场景来算。推理阶段场景又会指数级变多,要看应用发展到什么阶段。
目前训练模型是核心任务,大厂都在做,所以现阶段算力有一定瓶颈,尤其从GPT3.5往GPT4、多模态演进,对算力有要求。之后从芯片适配,从场景差异化上来讲,可能会好一些。
妙投:国内AI芯片企业实力相比于美国AI芯片龙头有很大的差距,是否还有追赶国际先进水平的机会?
武超则:这是一个综合问题。现在美国AI芯片龙头一技绝尘。除了看芯片的计算性能、传输性能外,非常重要的是它构建的CUDA开发者生态,类似于当年X86软件生态,对开发者友好,因为全球都用这个标准。这是先发和规模优势带来的。
第二个,美国AI芯片龙头非常重要的是集群和互联概念。从V100到A100再到H100,除了单颗性能提升,它可以连接多颗芯片在一起,从几万颗到最新可能近10万颗,集群计算性能大幅提升。
国产芯片不管是计算性能还是传输,我觉得挺好的。一些公司其实单颗芯片对标A100是能做到的。但问题是,一个是开发者生态问题,国内大厂现在推深层集群也是类似。核心是要解决开发生态的问题,另一个是要解决集群的问题,不能谈单颗的,尤其在训练模型阶段,我觉得这两个是接下来主要的挑战。
妙投:光模块今年上半年关注度非常高,怎么看光模块下一步的业绩兑现和市场表现?
武超则:光模块主要映射的是北美大厂今年的加单。至少从短期来看,业绩很确定。对应在时间节点上,今年上半年加单,要在下半年和明年全年业绩里逐步体现。如果大模型至少在半年内还在持续推出的过程中,那么互联网公司砍单概率不大。
目前加单情形是不错的,以800G光模块为例,市场一致预期是大概从今年150万只增长到明年1000万只以上。对应到明年的业绩上,是比较确定的。
但往后年还要盯几个指标。一个是北美四家大厂后续的加单周期。要到今年八月底美国季报期,看是否有变化。
第二是国内现在主要是以400G光模块为主,有一个错位周期。还有核心的利润率问题。光模块都是第一代产品毛利率最高,再往后新进入者越来越多,毛利率净利率会下来一些。所以第二个关键指标是后续1.6T、3.2T何时推出。必须有快的技术迭代,才能摆脱类似逆变器的格局。TMT技术迭代是比较快的,不能简单按制造业逻辑来看。我觉得后面EPS问题不大,关键是估值。上述这两个指标都影响估值。
妙投:有观点认为光模块技术难度比芯片差,所以格局会比较差,投资机会也弱一些。您怎么看?
武超则:我觉得不能这么理解。如果很简单,AI芯片大厂为什么不自己做呢?它自己也有光模块公司,但还是分出来给国内公司做。原因是它做这事不经济。
未来从CPU时代到异构计算,就是CPU加GPU加NPU,机房越来越非标准化,不像CPU时代是标准化机房,之前可以水平分工,现在会变成垂直分工。每家互联网厂商的机房都不一样,就一定会有光模块厂商存在。原因是服务器、互联网厂商自己去做这事不经济。
对光模块企业来讲,至少现在被需要,是有价值的,而且利润率还挺高。尤其是高端产品从800G往1.6T去演进,目前来看还是挺好的生意,控制好利润率也是一种能力和壁垒。
04 轻量化趋势强化大模型落地能力,AI在To B场景会更有机会
妙投:报告里提到轻量化模型。这与之前参数较少的小模型有何差异?
武超则:跟之前的小模型是两个概念。轻量化模型是先把模型做大,然后才能把模型做小,小模型直接就是小参数。轻量化是以大模型作为基础,基于专用的或者相对比较单一的场景,比如智能客服场景、安防场景,把大模型的能力提炼出来,用行话叫蒸馏出来,保留最必要场景。因为90%以上场景用基本模型就可以涵盖,没必要为了10%的增益,去把模型做得很大。
在这些垂直场景上,数据集的量能从千亿降低两个数量级。基本能力比如举一反三能力、推理能力、逻辑能力、生成能力都保留,然后结合场景,会有一些专有数据、行业认知放进去,训练专有模型,效果会在原有大模型基础上增强。
现在有说法是前些年从终端走向云端,大量CPU和GPU功能实际是在云端。但接下来要从云端走回终端,不可能所有场景都调回到云端计算。这时可以在汽车、机器、穿戴设备上做比较强的芯片,直接去调用终端模型。
妙投:轻量化模型主要的产业影响,就是细分场景的适配、应用?
武超则:是更切实地在产业化中,在应用阶段,让模型跑起来。现在大模型核心问题是调用很大的时候,排队、时延比较严重。所以都探索怎么去用API方式把大模型部署在云上,通过API去调用服务。跟它互补的就是在终端上轻量化部署,更简单,也支持离线使用。
妙投:最近大家关注点是chatGPT流量下滑了。有观点说是API接口越来越多,流量到了各种API的环节。
武超则:对,这是一个概念。流量指的是终端网站和APP调用次数。大概五月份峰值19亿,六月份约十五六亿。这说明不了什么。一个to c的聊天场景,本来就有很多人猎奇,不是日常刚需,经过半年左右的测试使用,这类账号流量肯定会下来。
更重要的是未来chatGPT或GPT3.5怎么商业化。聊天只是一种应用。如果把GPT想成一个操作系统,它会有很多应用。比如API就是To B应用,操作系统去给各样场景做调用。除此之外,OpenAI也提出要去垂类场景如金融、医疗、交通去做垂类模型。可能会有第三种商业模式,相当于基础大模型作为生成垂类模型的底座,本地化部署给客户。
比如建一个医疗垂类场景,可以把这套底座做本地化部署,再基于客户的医疗场景数据去做垂直模型,然后再到应用。这些流量肯定没有被统计进去。所以不用只盯着每月月活,它只是一个场景。
妙投:这意味着To B场景会崛起?未来To B跟To C哪块的机会更多一些?
武超则:在中国市场,我更看好To B,趋势还是很明显的。一方面过去40年制造业崛起,已经形成了成熟的产业链和产业集群,大公司也非常多,数据质量、数据量都较高。
另外To B相比于To C,市场空间足够大。大模型跟它相结合,是一加一大于二的,创造了新的增量。移动互联网时代,To B数字化没有想象中那么好,因为可靠性安全要求都比较高。过去十年很多还处在信息化阶段,这样提升空间是巨大的。
To C方面,大模型可以解决很多问题但也有很多问题解决不了,比如不可能因为游戏有了大模型,用户从一个1万块钱的玩家变成100万。市场是不是能变大,要再考量。这个阶段To C更多是降本,但增效能不能看到,还要再探讨。但在To B是两者兼顾。
第三,目前大厂主推的也是To B场景。一是To C效果没有那么好,数据安全等监管要求较高,在To B端相对包容度、灵活性更好。
妙投:您比较看好AI在哪些To B场景的应用?
武超则:看海外的话,第一比较强的是编程,当然编程也会应用在各个To B的场景中;第二个比较大的是教育。除此之外,在中国,工业数字化有机会。工业互联网过去做得不是很好,因为数字化成本高,设备数字化比例低,连接成本高。工业APP非标准化,比如造纸和纺织行业需求可能完全不同。既懂传统行业又懂数字化的人又很稀缺。大模型接下来会更有希望解决这个问题,包括具身智能、通用人工智能会大幅降低制造业数字化成本。
05 年底大模型会有逐步清晰的格局,后续会像公有云出现分工
妙投:如果未来有很多To B的行业大模型,是不是通用大模型机会少一些?未来大模型的行业格局会是怎样的?
武超则:我觉得未来是两类。一类是通用大模型,这是基础。头部公司现在大模型分为L0、L1、L2。L1和L2是细分的一级和二级行业,建立在L0层基础上。所以会有一类公司做基础大模型,也会有更多公司做垂类大模型。
从数量上来讲,基础大模型公司不会超过几家。太多的话带来标准化问题,生态问题。另外基础大模型太难,要无止境去迭代演进,才能在产业中保持先进性,被别人去license去引用,另外对数据量、模型优化、算力的要求都非常高。所以不会有太多公司在这儿,更多还是大厂有优势。也会有做得好的基础大模型会被大厂收购,或者大家合作。垂直大模型可能会比较百花齐放。会变得很细分。在L1层、L2层基础上分出L3、L4也会有可能。
妙投:行业大模型公司没有基础大模型,行业大模型能做好吗?
武超则:大模型公司之间不是简单的竞争关系,还有合作关系,比如清华的大模型跟多家互联网公司在合作,A股某家做基础大模型的公司也跟华为合作。核心是基础底座,是所有人的基础,不会排他做封闭生态。就像当年安卓开源,原因就是很少有人能复制IOS闭源的商业模式。所以一定有人选择开源,这样基础大模型才能活下来。
妙投:A股有上百家公司要做大模型,70来家已推出自己的大模型。什么样的公司可能胜出?
武超则:现在去判断挺难的。要看有没有足够的数据、场景、算力,至少今年内,推出一个锚定GPT 3.5水平差不多的产品。再往后真正的分化是对标GPT4,就是多模态,是否有这样的能力,对格局会有很大影响。
这阶段有点像今天的电动车,逐步分化。基础大模型公司会慢慢做减法。估计有些做基础大模型的公司,会慢慢转向做垂直。也会有很多中间层,比如做出好的基础大模型,不一定就去给别人用,而是基于这个再去做垂直,更像L1.5层。
行业会从开始的混沌状态,即所有人都做同质化的事,变得开始有分工。有点像当年公有云,开始大家都想做公有云,最后发现这个生意是一个规模加门槛、加先发优势、加资本、综合要求非常高的事,就慢慢有人去做混合云、私有云、SaaS。
如果一定要拍个时间,我觉得可能今年年底会有逐步清晰的方向和格局。因为OpenAI基本每半年大迭代一次。
06 多模态还有较大技术难点
妙投:报告中强调了多模态的价值。相比于办公软件、游戏等AI应用,多模态相关公司没有涨太多。您怎么看多模态模型现在的技术成熟度?
武超则:当下GPT3或者ChatGPT更多聚焦在文本,即文字和语音、图片处理上。应用大部分是语音转文字,文字的语义概括,图生图,文字生图,这是相对比较成熟的。再往后多模态的核心是延伸到一些音频、视频。比如有一篇小说能不能生成一个电影,有一个电影是不是能生成一部小说,处理的数据量指数级提升。
这些状态之间的互相转化,背后是需要更加复杂的交互场景才会出现。比如智能家居,智慧城市,诊疗,自动驾驶。自动驾驶是非常典型的多模态。过去车数据可能都来自于雷达等,现在有电动车企推了transformer加BEV,就是自动驾驶结合大模型去做。比如前面有个箱子,车没有学习过这个箱子是什么。以前可能会撞上去。现在transformer大模型植入进去,它可以举一反三,认识到这可能是个箱子。
这样一个简单的决策和推理过程,背后结合了机器视觉,摄像头先看到,分析这个图,再去在云端大模型上做处理。推理这是什么东西,再返回到车,制动。这一系列行为要在几秒之内完成。
多模态难点除了数据量大很多之外,在多种场景中,它要有组合、联动的决策,怎么去降低时间损耗,最后才能应用在这些场景上,实现产业化,这是很大的难点。这除了对大模型技术的成熟要求,对于传感器、网络、边缘计算的要求都是很高。
妙投:您比较看好哪些多模态应用场景?
武超则:自动驾驶肯定重要。此外智慧医疗也比较看好。过去看病望闻问切,全部综合起来去考虑,是非常典型的多模态。再比如智慧城市,以前是单一的摄像头场景,现在要结合城市治理管网,也是非常典型的多模态。
智能家居也是较好场景,智能电视、智能音箱、空调等都能上网。数据来源、数据质量大幅提升。怎么来把这些信息做组合,在家庭端去做出好应用,判别用户需求,没有大模型是很难的,因为非标准化场景,各自场景数据又较碎。用通用AI做综合处理,形成家庭端智能助手、生活助理,尤其对老人、小孩、残障人士的看护,很有意义。
07 具身智能已现发展潜力,脑机接口需要等待通用AI成熟
妙投:具身智能是大家关注的热点,马斯克、黄仁勋等科技大佬都比较看好。具身智能现在更多是一种理念,还是已经具备技术、产品方面的发展基础?
武超则:肯定是后者。之前有机器人公司推出一个视频,机器人在快递场景下搬箱子,发现箱子很高够不着,它像人类去思考,在旁边找一块木板,搭到高的地方去。出现偶然性或被干扰的场景,机器人工作已经比较顺畅。大模型出来以后,对原有机器人或者传统工业场景,会解决很多问题。
具身智能是相对于原有旁观式学习而提出的概念,不仅从互联网搜集图像文本学习,也跟真实世界学习。以前没有学习过某个场景,AI会看不懂。现在具身智能可以通过人给它做示范来成为学习对象,得到反馈,再去总结,可以去模仿人。现在已经开始有相结合的场景,让人工智能从会语言、会工具,接下来能会规划、会决策,在认知能力上有提升,这在GPT4里面已经看到一些。
妙投:具身智能更多是机器人或自动驾驶汽车,未来载体会有没有一些演化?
武超则:机器人肯定比较重要。现在制造业的机器场景,也是广义的机器人概念。未来在比如教育场景、医疗场景中,也有很多机器,有提升的过程。
妙投:具身智能市场机会会不会受到减速器、伺服器、关节等硬件制约?
武超则:对。具身智能跟机器视觉未来肯定要结合。跟真实世界去学习,需要摄像头、终端传感器的灵敏度清晰度大幅提升。
妙投:具身智能的投资机会,可能更多在软件,还是硬件方面的完善?
武超则:可能会涉及到比较多涉及到物联网相关的东西。这其实是一个比较广义的系统化的概念。传感器是一大块,再比如终端通信模组、软件。
妙投:报告提到脑机接口有望成为下一代人机交互方式。随着Neuralink开启人体临床研究,产业是否已经进入加速落地阶段?
武超则:还比较早。脑机接口跟通用AI相辅相成,脑机接口更多承载材料,怎么跟人体结合,本质还是AI,至少得有弱人工智能。脑机接口是通用AI的一个场景,能承载在这个场景中,让它发挥作用。通用AI和脑机接口至少都是按未来十年的周期去规划,不会那么快。
应用领域上,医疗可能最快。因为现在弱人工智能低于人类平均智商,可能不会用到普通人身上。但对于一些语言障碍、行动障碍人士,即使弱人工智能也比没有强,可能会有更多帮助。
妙投:报告里边提到的新技术,像脑机接口,向量数据库,人形机器人,都还很早期,二级市场已经开始炒了,怎么看这种投资方式?
武超则:科技就是这样。最关键的是在投资中把所看好的方向跟所选标的之间的典型特征要匹配起来。如果是遥远的方向,如向量数据库、通用AI,那就不能太苛求EPS。如果已经是比较成熟的方向,比如算力,那标的就得今年有业绩有订单能分享行业增长。
08 AI火起来,信创会更有机会
妙投:AI火起来之后,信创表现相对逊色一些。您怎么看下半年信创?
武超则:我还是很看好国产化。国产化或信创一定不是静态的、没有增量的、为了替代而替代,这会很慢。行业有新变化,有增量,再去做替代,国产化才能加速。
比如某个龙头产业链,如果需求就是5G或者4G时代的场景。落地确实会慢,因为没有人为这买单。但当所有人都开始去投AI,去投新的数字化,会觉得又有一轮新的技术周期来临。整个产业链都会活跃起来,芯片、设备、材料、数据库等才有可能快速替换。
这是密切相关的。新技术周期或AI发展,会加速国产化和信创节奏。简单来看服务器过去在信创里面是很核心的。但如果服务器没有新需求,就没有新增的资本开支,云厂商和运营商都不愿意投入。单靠政府投资,也是慢的。
上半年大家看好的AI产业链是北美系,服务海外的云厂商、AI公司。下半年重点应该是服务国产化。
妙投:信创会不会受到财政状况限制比较大?
武超则:信创也不是就全卖给大B和大G。今年信创里面,行业需求最重要。包括金融、运营商、电力等。但这些机构资本开支的核心,是得有新需求。比如电力是有预算的场景。如果电力数字化和分布式能源技术都不成熟,电力公司也不会去投。如果AIGC来了,对电力数字化落地会带来巨大推进,他们才可能会在这上面去做更大投入。