一直以来,我认为创业是时代、机会和个人努力三者的结合,是有方法论的,通过不断的迭代才能够持续找到成功的路径。6年前我开始投资人工智能,到今天为止,猎豹移动+猎户星空在人工智能投资的研发费用已经超过1亿美金,走了很多弯路。但是我一直坚信,人工智能是一个改变时代的机会。当ChatGPT出来的时候,我也非常兴奋,认真学习了很多,比如远程观看硅谷创投机构YC的路演。我发现,硅谷一半以上的项目都在做ChatGPT相关的应用创业。
作为一位创业者,我们应该深入底层逻辑思考它的原理是什么?为什么ChatGPT可以改变世界?以前为什么没有这样的应用?实际上,从原理来讲,语义理解是人工智能技术的皇冠。今天是2.0时代,但是在我投人工智能的时候是1.0时期,那时做图像识别,觉得计算机能够识别人脸已经很厉害了。现在想想,能够识别不是人类独有的智能,动物也具备这样的能力,因此识别只能算智能,把智能和人类智能分开尤为重要。人类智能和动物智能的核心区别是语言,在于能够描述虚拟事物的语言,即逻辑语言。但语言到底是什么东西,人类自己都没有研究清楚。在ChatGPT出现之前,我们认为语言的规律已经被总结完了,只要按照这些规律就会学会语言,后来发现ChatGPT根本不需要那些规律去学习语言。我们的语言虽然有主谓宾定状补这些语法,但是语言实际上是浩瀚大海。100年前,图灵在计算机几乎还没有出现的时候就提出了一个思维假设,如何证明机器有人类智能?于是进行了对话测试,把机器放在黑屋里与成年人聊天,其中30%、40%的人觉得它是一个人,有人类的对话能力就意味着有人类的智能。攻克语义理解的难度,高于最初做出图像识别的难度。这是由于两个斯坦福大学的研究生用电脑把人类30年的识别成果提高了十几个点。人工智能如果能攻克语义理解,基本意味着通用人工智能很快出现。语义理解有两条技术路线,第一条路叫做“教育”神经网络。因为人类有语言学,总结了很多的逻辑。所以最开始大家的本能反应是我教会你,最常见的一个词是知识图谱,把知识整理出来告诉你要学习。这个模式更符合我们对语言学习的逻辑理解,像人学习外语,开始投入就能见到效果,所以绝大部分公司选择这条路线。但问题是系统达到一定语言能力后,无论如何优化,依然有大量的问题的回复完全是答非所问,人工智能瞬间成为“人工智障”。这条路线有条隐含大BUG:人类学外语时已经通母语,对世界有了逻辑认知。
第二条路是神经网络“自学”,像人类学母语,给神经网络海量文本,让神经网络自己发现文本之间的规律给它文本,让它自己去找文本的规律。母语路线其实是没有严格的理论支撑的,在ChatGPT3.0之前,几乎只有OpenAI坚信第二条路线,最后成功了。ChatGPT通过对海量文本的学习,自动构建了一个含有千亿参数的大模型,建立了对这个世界基本的逻辑认知,“涌现“出了基于逻辑的推理能力,产生了人的智能。有一天我问ChatGPT,我家的狗为什么叫三万这个名字?我给它一个提示:这只狗是我在宠物医院收养的,被前主人送过来的时候手术费要三万,因为被撞骨折了。后来,那个主人就消失了,但是三万块钱没有人付。ChatGPT能够依据我给的信息,推断三万这个名字是由于手术费需要支付三万元。它能够回答出这么一个简单的问题,说明它具备了对社会的常识。然后我又问了很多尖锐的问题,比如穿山甲能不能穿山,它说土包可以;我说能不能穿钢板,它说钢板太硬了;我说能不能穿木板,它说取决于木板的厚度。你会发现,它具备了对这个世界的理解力。在ChatGPT出来之前,对话系统就像鹦鹉学舌,虽然能够部分匹配内容,但是系统并不完全理解具体的含义。比如对小爱同学,诸如下一首、上一首这样的指令词,可以泛化出上百种问法,最后只能用模板式的指令。ChatGPT出现以后,对话系统是建立在语义理解的基础上。尽管也会说错,但都是“一本正经”的胡说八道。
ChatGPT的回答原理是当用户键入一段话,系统会根据这段话形成一个数学表达式去和大模型里的参数做匹配,产生关联概率最大的一个词,然后再以这个词和上面那段话合在一起,继续以上过程。我特意问过ChatGPT,参数是不是能理解词和词之间的概率关系?它说,对,是在一个巨大的空间里面形成了各种词之间的关系,当你一句话由很多的词组成的时候,就根据这句话形成的数学表达式去猜下一个词。这个原理很重要,因为这意味着你所有的问题都和你上面问过的问题具有相关性,是根据上面的整个语境去完成下面的输出。
基于以上原理,我们可以把GPT看成一个大号计算器,不断计算下一个词的概率。这种词的概率的推断符合人类的预期,因此产生了人一样的思维逻辑。我们经常说机器没有温度,但它可以表现得非常有温度。根据你得需求去产生答案,如果你揭开它神秘的面纱,它就一定有很多的不完美。但是它产生的逻辑思维能力,是绝大部分人在脑力劳动当中能用上的,如果你的逻辑思维不够缜密或足够浅,它就能够替代你。这是底层范式的变化。一本正经地胡说八道,重点在一本正经,而不在胡说八道。一本正经说明它的逻辑是正确的,胡说八道可以通过plug in专用系统来矫正。比如数学做不好,可以给予数学小模型,把题解析出来。正是因为从原理层理解,所以逻辑和推理能力会越来越强,因为参数可以不断扩大。理论上,芯片只要足够便宜,大语言模型参数量可以不断扩大。
但是它没有意识、欲望和好奇心,更重要的是它不会自然而然的知道你是谁,你要什么。所以它不会是上帝,只会是copilot,需要应用生态,需要人来驾驭。比如你让它提供一个好的策划案,但是不告诉它你的产品、目标用户群、期望的结果,它在没有意识的情况下就不会产生策划案。我认为ChatGPT带来的变化有两类,一类是交互革命,GUI跨向LUI时代,第一次机器可以自适应人的表达,所有的软件、设备,都值得重做一遍。乔布斯说过:“每一次交互的变革都是一次工业变化的机会”。苹果有幸抓过两次机遇,一次是键盘图形界面,第二次是iPhone。无论怎样在图形化界面上使用,人都是要学习的,比如程序员,将很多时间用来学习如何把人类的语言翻译成机器语言。第二类是生产力革命,人类智能水平不仅取决于人口数量和教育程度,也取决于大模型的智能化水平。数字化员工会成为公司标配,比重越大者越能胜出。以前硅谷的科技公司融钱全部用来雇人,现在一半用来雇人,一半用来购买大数据、向量数据库、三件套服务,建立自己的数据模型。行政工作也已经大幅减少了,因为把内部的规章文档做成了模型接口。
未来行业的变化,第一是平台“核战争”,中国已经有超40家大模型,都号称千亿参数。没有超级大模型的大公司,不再会是平台公司。如果没有生产力变革,作为平台公司就会被淘汰。大家做的效果本质上都差不多,基于算法、数据、场景,基本上都会做数据标注。第二是垂直私有大模型会“白菜价”,随着行业垂直模型能力普及化,成本急剧降低,不再是20亿美金才能做一个私有化大模型。第三是人人都是程序员。“码农”作为独立的工种可能会消亡,因为让ChatGPT帮助写一个程序,它可以完成从推荐程序、搭建环境及安装等工作,甚至于每一行代码如何贴,如果贴过去出错了,告诉它出错点,它会告诉你纠正的方法。第四是自然人语言的交互模式将成为核心交互,正如《Her》这部电影描述的一样,未来设备交互的终端形态基本上是“有事您吩咐”的状态。第五是企业的HR会变成IR,人力资源变成智能资源,数字员工越多效率越高。如果我们再不努力,可能会被人工智能所替代。正如Sam的采访一样,以后人工智能的终极形态可能是你跟它说,需要一个1万亿美金的公司。ChatGPT就会去开始分析市场,创建公司,写商业计划书,然后组建团队,进行融资等活动,在3年以后将一家1万亿美金的公司呈现在你的面前。未来的人族只有两类人,米卢在执教中国足球队的时候说过,态度决定一切。《正念领导力》这本书对我的影响很大,核心是为什么创业者不快乐?总的来说,由心态决定,一个是积极的心态,一个是消极的心态。在正念领导力线上的人,被称之为AI的驾驭者,不断突破自我,不断以当下为乐趣,做了很多成就,但是他们不快乐。那些想要躺平享受生活的人,未来一定能实现,但在此过程中会经历一段阵痛期。而正好,OpenAI的愿景便是发行世界货币,把钱给到那些不能驾驭AI的人手中。在《未来简史》中,作者也提出了同样的观点:在未来,大约有少部分人需要掌握知识,因此,“体验和敏感度”将是未来最稀缺的能力。但是,不管那个未来以何种形式到来,学习仍旧是今天最重要的事情,因为世界的变化实在太快了。
现在我提一个问题:如果你只学习大模型的一个技术点,你会选择学什么?怎么能赚到钱?我的答案是Prompt。Prompt十分重要,它指与大模型的对话能力,这个看似简单的能力却涉及到很复杂的技巧和技术。吴恩达专门开设了这门课程,他用了非常浅显的方式去教学,适配不同学历层级的人。但有天我发现我们公司的绝大部分程序员都没有上过这门课,这让我感到意外和愤怒。由此反映出一个现象:对投资人来说Prompt太薄弱;对工程师来说Prompt太浅显。
但其实,Prompt既不薄弱也不浅显,相反,它尤为重要。为了说明这些人心里的偏见,我特意翻出了牛顿写的一本书,名叫《自然哲学的数学原理》。在这本书里,牛顿把Prompt定义为:自然语言天然的压缩性导致的天然歧义性。以及每个行业的专业属性,使得Prompt是嫁接大模型逻辑能力和应用需求的桥梁。因此它不可或缺,非常重要,一点也不浅薄。我们今天提到“苹果”,我脑海里出现的是“苹果手机”,你脑海里出现的是“ipad”,而农民想到的是水果。因此,语言具有歧义性,我今天提到的Prompt与你解压而成的信息会有一定出入,造成了理解上的误差。这也是为什么“在工作中,80%以上的问题都出在沟通不畅方面”,因为自然语言天然的压缩性。压缩完后,你在脑海里的信息还原与我是不一致的,需要一定的时间进行沟通。还有一点是不同行业的专业属性。比如小红书文案工作,做咖啡的内容和做酒的内容会很不一样。这种属性怎么处理?只能靠Prompt。我和《哪吒》的导演聊了聊电影和AI,他提到,现在的AI发展得不错,但还没有达到他的要求。比如,让它把一张图弄成张艺谋的风格时,明显效果不如人工设计师。我承认现在AI的水平还有待提升,但是他在命令AI把图片做成张艺谋的风格时,对“张艺谋的风格”并没有明确的指标。他心中的“张艺谋的风格”跟AI知识库里“张艺谋的风格”肯定很不一样。而他的设计师跟他至少一起工作了两三年的时间,自然很熟悉他的审美,知道他想要什么。他与设计师之前存在着很深的Prompt。所以,我们怎么理解Prompt这件事?其实我们每天大量的工作就是在做Prompt,Prompt并不简单,需要你告诉员工该怎么做。大家不妨想一下:公司为什么要推OKR?也是Prompt。
1)在我看来,Prompt首先是不可或缺的行业知识定义。今天每一个行业都有差别,今天每一个创业者真正的价值就来自于了解行业。大模型始终存在一个问题——它学的全都是公开文本。公开文本里面叫做冰山上的角,最后露出水面的东西,但是有大量知识是在公开文本里找不到的。比如说我们学牛顿,只能学智能科学的那些哲学原理,但如果牛顿还活着,天天去跟他喝咖啡,才能真正地快速进步。所以,大量的行业知识是宝贵的,你应该思考怎么能把大模型能力用起来。2)其次,Prompt是撬动生产力的杠杆。因为它是为所有人准备的,它能给你一个所有人都觉得正确但是没什么用的答案。因为它不知道你是谁,不知道你的实际诉求,因此它可以作为一个知识点的考核,但不能做出一个真正的方案解决。3)Prompt是人工智能时代的编程语言。我跟很多工程师说过,以后可能真的不太需要写C++了,以前工程师有很多所谓的经验是在了解语言特性上,未来每个人只要会说话、会写字,就会写Prompt,再也不用去学专用的编程语法了。但还是要把这些东西写的很好,就像写本书、毕业论文和好的结构目录一样,如果把这个东西阐述的好,大语言模型就能助你一臂之力。你觉得它浅薄是应用理解的浅薄。我们有一个项目,制作了一款人工智能角色吵架的产品,如果跟它说:“需要一个调研报告,不能少于1000字。”这款产品能写出几十上百页,多种角度代表不同角色。这个项目很有意思,就看着一群机器人在那里吵架,大概10分钟后,给到你一篇报告。这个项目让团队很有成就感,把它视为大家智慧的结晶。在此过程中,我切实感受到了Prompt对编程提供的便利,但是却发现中国创业者当中重视的人不多,对此我深感遗憾。如果一家技术公司的代码全是工程师写的,工程师是不是真的可以作为99%的价值贡献人?一般而言,老板不写代码,其实他才是那家公司最大的价值。基于此,让我们回到那个争论——为什么会有不同的判断?我觉得有两点:第一,Prompt是个实践工程,大语言模型也是个实践工程。不管听说了多少内容,看过和写过是完全不一样的。我们曾经担心在大模型下做应用会很浅薄,但现在整个硅谷都很重视智能体、记忆、个性等内容,到如今,OpenAI依然解决不了这些问题。因为这里面要深入的工作有很多,包括把模型的参数做好、把服务并发降下来等。GPT4到今天还需要用户付费,这说明成本非常高。第二,大模型开启的是新时代。用过去的眼光看新应用算不过来账,很容易忽略价值,新时代的开启需要新的思维模式。互联网刚出来的时候,很有多类似“为什么中国移动没有做出QQ?”、“淘宝有什么价值?”等言论,如果一直用狭隘的角度看时代的发展,未来不会有新的东西发生,也不会有创新的出现。今天,硅谷近一半的创业项目都围绕着大模型展开。硅谷为此砸入了很多资金,所以这些应用肯定不是一个套壳,让我们拭目以待。OpenAI刚出来时,对我的震撼非常大,当时在鼓吹千亿模型、自学习的时候,我也心动了。因为我们在AI上投了一亿美金,后来,我女儿去商场看了我们的机器人,回来跟我说,“你开发了一个人工智障机器人。”对此,我只好跟她说:“不是爸爸不行,是行业水平有限。”结果,OpenAI真的实现了。我们摸索了很久,宣告失败,而它为什么能做出来?
第一,它做的是通用人工智能。美国投资人很尊重创业者,因为在他们看来,创业者是专业的,所以要让创业者有更多的机会。过去的思维没办法判断未来,伟大不能被计划,未来也很难被预测。那么,创业者机会在哪里?千亿大模型的难度的确很大,现在大公司都在开始行动了,在OpenAI之前没有大公司做,而现在大家都在争抢。在此情形下,创业团队举步维艰。第二,行业垂直大模型。我觉得行业垂直大模型是很大的机会,每个行业语调的训练、对这个行业的理解可以直接融合在大模型的基座里,而不是完全通过Prompt。第三,直接做 ToB和 ToC的应用。这里面不乏机会,但是制作 ToC的应用还需要一些时间。因为这个行业在快速发展,各个技术手段还在调试中,但我相信 ToC的应用肯定会出现颠覆性的产品。不过,它已经不在现在我们思考的逻辑里了。包括做语音呼叫外卖、语音搜索、陪聊机器人等,我认为鲜少有市场机会,因为微信已经摆在那里了。第四,要尽快使用数字员工,提高运营效率。尽可能私有化部署垂直大模型,数据私有能够提升自身的竞争力。我始终认为,在国内,大模型应用应该聚焦于ToB;在海外,大模型应用应该聚焦于ToC。目前我看到,猎豹移动虽然很早便开始行动了,但是与海外开发者的速度相差很多。虽然,目前出现了一波中国ToC应用的出海潮,但我不建议在国内做ToC,因为国内的互联网公司的竞争太大了,另外还存在着制作出来的应用无法走向市场的情况。就我自身而言,我在团队内部展开了一系列的活动,虽然进程有点滞后,但大方向是正确的。另外,我还实施了大模型应用和小组化,尝试进军行业大模型。由于开源的兴起,要做一个垂直模型的难度是大幅度下降的,这其中需要的财力和人力对一家中等规模的公司来说,是完全能够承担的。因此,先不要过度害怕。经过2016年那次制作人工智能的失败,我总结教训以后,发现所有的创新都应该是从核心的点,慢慢地生长出来。而不应该一开始就铺太大的摊子,这样很容易在其中任何一个环节上出错。
对外做产品,我总结了一句话:大模型,小工具。虽然做的是大模型,但我们一定不能把它想大了。比如,智能体是经过多人讨论后,决定的一个想法。当时我们讨论各种了问题,后来我决定根据市场调研报告的情况再行动。我昨天帮我一个同事的公司做了一份报告,发给他后,我问:“让你付50块钱,你付不付?”他说:“挺好的,那你应该多收一点。”这就是一次小小市场调研行为,我们要做一个大项目,可以从一个小小的点开始,由此拓展开去。我相信未来AI创业、ChatGPT创业一定来自于草根阶层。有些人在一个专业团队不重视的内容上天天钻研,说不定能创造出别样的天地。因为如今大环境的范式发生了改变,或许你有很多的经验,但有经验可能会变成阻碍。一些灵光闪现的创意可能就改变了整个时代的发展防线,因而,不要过于依赖于经验。我们曾推出过一款中间服务,有点类似于钉钉。你可以把你自己的企业文档给它,它根据这个文档进行回复,帮你做文档的分析和回复,做客服。我们深入机器人行业多年,把线上线下两条线都打开了。最后我们其实就想做一个促销员,它的可以根据企业的实际,把各种单子打通。你去问ChatGPT:“我今天想请婚假怎么办?”ChatGPT的回答大概是基于国内法律法规你可以怎样怎样。但是你去问内部行政的机器人,它就会根据我们公司的规定、你入职时间、请假时间等进行回答。我们有几个优势,其实我想最重要的优势是:第一,我们提供了一个非常方便去做促销员的接口,你只要把你的文档整理好,不用像以前一样需要做问答训练。第二,我们也提供私有化部署。线下的机器人可以出色地完成产品介绍。现在,我女儿再去问我们的机器人,她一定不会说人工智障了,因为什么问题它都能回答,不管回答的水平,但是不会再一问三不知。今天的生态会如何生长是无法预测的,因为价值靠自己创造。正如刘嘉教授所说,现在是过去的未来,现在不是未来的过去。面对未来,除了顺势而为,还应该相信事在人为。创业者的价值就在于创造价值,未来的价值来自于你的努力。不要犹豫,先做起来。2001年,当时我在网上投了几份简历,最后被互联网公司招聘了,一个不经意的行为让我进入了互联网大潮。从2001年开始做产品经理,跟住了互联网的浪潮,才得以成长为今天的自己。
我觉得这个时代一定不会因为你花了5分钟作出一个创意,就迎来一个爆发点。因为大家都在绞尽脑汁创造出不一样的东西,它达成共识的速度太快了,导致所有人都在思考,而思考会提升创意的产出密度。因此,这时拼的不再是苦功夫,而是看谁能够深入下去,把别人看不起、看不上的东西做得很扎实。有一次我在Youtube上看了一个博主做的一个视频,我认真听了3个小时,突然心生恐惧。我想,他有时间把这个东西琢磨得那么深,我却都不知道。所以,我认为创业者今天就是应该先做起来,因为今天不是未来的过去,我们不知道未来会怎样,我觉得创业者应该有这样的特质。所以,这也正是一个有机会跨越阶层,有机会一个年轻人去崛起、乱拳打死老师傅的时代。最后,我希望创业者不要去简单迷信权威,要相信价值是靠我们这群人创造的,时代也是靠人来创造的。王候将相宁有种乎,不是宿命论,而是创造论,所以我相信有好奇心、敢于行动的创业者是能真正创造未来的,大家一起加油!