吴恩达(Andrew Ng)博士是AI Fund的执行总经理,deeplearning.ai和Landing AI的创始人,Coursera的主席和联合创始人,斯坦福大学计算机科学系的兼职教授。此前,他创立并领导了谷歌大脑团队,帮助谷歌采用现代AI,他也曾担任斯坦福AI实验室的主任。约有800万人,即地球上1/1000的人口,从他那里学习过AI课程,通过他的教育和AI工作,他改变了无数人的生活

吴恩达教授2023年7月26日在斯坦福大学商学院主办活动中进行了一个人工智能新机遇的讲座,这是来自世界顶级人工智能专家对未来的判断,强烈推荐

01 人工智能技术和工具的发展趋势

今天我想和大家聊聊AI中的一些机遇。我一直把AI看成是一种新的电力,理解AI的困难之处在于,它是一种通用技术,这意味着它不仅仅对一件事有用,而是对许多不同的应用都有用。所以,我想从分享我如何看待技术格局开始,这将引出一系列机遇
05162342-2023-09-05T08:23:41.png
关于AI有很多炒作和兴奋,我认为理解AI的好方法是将其视为一套工具。这包括一种称为监督学习的技术,它非常擅长识别或标记事物,还有最近令人兴奋的发展——生成式AI。如果你熟悉AI,你可能听说过其他工具,但我将重点放在我认为目前两种最重要的工具上,即监督学习和生成式AI。

1)监督学习非常擅长标记事物,或者说非常擅长计算输入到输出,或者从A到B的映射。给定输入A,给我一个输出B。

监督学习的一个好处是,它不仅对一件事有用,而是对所有这些不同的应用都有用,而且还有许多其他用途。让我具体地讲解一下监督学习标记事物项目的工作流程。

如果你想建立一个系统来标记餐厅点评,那么你需要收集一些数据点或数据集,比如你知道巴斯特拉米三明治很好吃,这是积极的,服务很慢,这是消极的,我最喜欢的鸡咖喱,这是积极的。在这里,我展示了三个数据点,但在实际构建时,你可能需要成千上万个这样的训练示例。一个机器学习项目或AI项目的工作流程是,你获得标记数据,可能有成千上万的数据点,然后你的AI工程团队在这些数据上训练一个AI模型来学习,最后你可能会找到一个云服务来运行经过训练的AI模型,然后你可以输入“我尝过的最好的波霸奶茶”,这就是积极的情感。所以我认为过去十年可能是大规模监督学习的十年。

我们大约在10-15年前发现,如果训练一个小的AI模型,一个小的神经网络,一个小的深度学习算法,基本上是一个小的AI模型,可能不是在一个非常强大的计算机上,随着给它更多的数据,它的表现会有所提高,但之后会趋于平稳,不再能够利用数据进行改进。但是,如果你训练一个非常大的AI模型,大量计算,可能在强大的GPU上,随着我们扩大给机器学习模型的数据量,这个表现会越来越好。这就是为什么当我领导谷歌大脑团队时,我指导团队要解决的主要任务是构建真正巨大的神经网络,我们在这上面注入大量数据,幸运的是,这个配方奏效了。我认为过去十年中,大规模计算和大规模数据的想法真的帮助我们在AI进步中走了很长的路。

如果那是AI的过去十年,那么我认为这个十年也在做监督学习的所有事情,但在此基础上增加了激动人心的生成式AI工具。

2)生成式AI,至少这种文本生成,其核心是使用输入输出映射的监督学习来反复预测下一个单词。通过获取你在互联网或其他来源上找到的文本,并使用这种输入输出的监督学习来试图反复预测下一个词,如果你在数以十亿计的词上训练一个非常大的AI系统,那么现在的情况下在最大的模型,超过一万亿个词,你就会得到像GPT这样的大语言模型,当然还有其他一些重要的技术细节。

从技术上讲,这些系统预测的是下一个子词或单词的一部分,称为标记,还有其他技术,如渐进式微调,可以进一步调整AI输出以使其更有帮助、诚实和无害。但核心是使用监督学习反复预测下一个单词,这才真正使大语言模型取得了激动人心的进步。虽然许多人把大语言模型视为一种极好的消费者工具,你可以去GPT的网站或其他大语言模型的网站使用它,但我认为作为开发者工具的大语言模型的力量是一个还没有得到充分重视的趋势。

过去构建可能需要我花6个月甚至1年的某些AI应用程序,现在世界各地的许多团队可以在1周内构建。我认为这已经开始,但最好的还在后头。这开始打开大量AI应用程序的大门,可以被更多的人构建。我认为许多人仍然低估了定制AI应用程序的数量将出现的巨大规模。

举个例子,我现在就编写一个情感分类器,哈哈我不认为在这个讲座中你会期待我编写代码,但这就是我要做的。看上图,我将导入一些你们知道的python和来自openai的重要工具,然后我有这个提示,它说将下面由三个破折号分隔的文本分类为积极或消极情感,我不知道,我不知道我是不是在斯坦福商学院度过了美好的时光,我们学到了很多,也结交了优秀的新朋友。好的,这是我的提示,现在我就运行它,我以前从未运行过它,所以我真的希望哦,谢天谢地,我们得到了正确的答案。这实际上就是构建情感分类器所需的所有代码。所以今天,世界各地的开发者可以用10分钟左右的时间构建这样的系统。这是一个非常令人兴奋的发展。

02 人工智能领域的新机遇

来看看技术格局,我分享一下我对AI机遇的看法。

下图显示了我认为不同AI技术今天的价值,我将谈论三年后的情况,但今天AI的大部分财务价值我认为来自监督学习(Supervised learning),对于像谷歌这样的单一公司,每年的价值可能超过1000亿美元,而且还有数百万开发者正在构建监督学习应用程序。它已经有巨大的价值,并且势头强劲,仅仅因为大规模的应用识别和构建工作以及努力。
05162212-2023-09-05T08:22:11.png
然后,生成式AI(Generative AI)是一个真正激动人心的新进入者,目前还很小,然后还有我出于完整性考虑列出的其他工具,我们可以看到这些圆圈代表它们今天的价值大小以及它在三年内可能达到的规模。监督学习已经真正实现了大规模,可能在未来三年翻一番,从真正巨大到更加巨大,而生成式AI今天还很小,但我认为在未来三年中将增长两倍以上,因为开发者的兴趣量,风险投资的投资数量,大公司探索应用的数量。我还指出三年是一个非常短的时间跨度,如果它以任何接近这个速率的方式持续复合,那么在六年内它将是更加巨大。但那个淡绿色或橙色的浅色区域是新创公司或现有公司创造和获取价值的机会。但是我希望您从这图片中获得的一个信息是,所有这些技术都是通用技术。

监督学习的情况是,过去十年所做的大量工作将在未来十年继续进行,即识别和执行具体用例。生成式AI也刚刚启动了这个过程。对于讲座的这一部分,我希望您能够了解通用技术对许多不同任务都有用,通过监督学习创造大量剩余价值,尽管我们远未完成找出生成式AI的令人兴奋的用例,但我们拥有这个可以扩展我们现在能够用AI做的事情集合的另一个非常棒的工具。

我认为随着生成式AI或新AI工具的兴起,真正让我激动的是创造那些真正深刻、真正艰巨的应用程序的机会,希望它们可以创造长期价值。

第一个我想分享的趋势是AI作为通用技术,我们面前的大量工作是找到非常多样化的用例并构建它们。我想分享的第二个趋势与为什么AI还没有更广泛地采用有关。感觉我们有些人好像已经谈论AI有15年了,但如果你看看AI的价值今天在哪里,它仍然高度集中在消费者软件和互联网。一旦你走出科技或消费者软件互联网,采用还很初级。为什么会这样呢?
05162227-2023-09-05T08:22:27.png
事实证明,如果你把所有当前和潜在的AI项目排序,按价值降序排序,那么这条曲线的左侧是那些价值数十亿美元的项目,如广告或网页搜索或电子商务的产品推荐。约10-15年前,我和一些朋友想出了一个配方,即招聘100名工程师来编写一份软件,向10亿用户提供更相关的广告,从而产生巨大的财务价值。这是可行的。但是一旦你走出消费者软件互联网,几乎没有人拥有1亿或10亿用户,可以编写并应用一份软件。

因此,一旦你进入其他行业,当我们从曲线左侧的头部移到长尾部时,这些是我看到的一些项目,它们使我感到兴奋。我与一家比萨饼制造商合作,他们拍摄制作的比萨饼图片,因为他们需要做一些事情,比如确保奶酪均匀涂抹。这是一个约500万美元的项目。但雇佣100名工程师或几十名工程师为一个500万美元的项目工作的配方是不可行的。或者还有另一个例子,我与一家农业公司合作,我们发现可以使用摄像头来确定小麦的高度,小麦通常因风或雨而弯曲,我们可以正好切断杂草,使农民可以出售更多食物,这对环境也更好。但这也是一个500万美元的项目,那种让大量受过高等教育的工程师为这个项目工作的旧配方行不通。像这些材料分级、布分级、钢板分级等许多项目都是如此。

因此,在曲线左侧的头部有少数价值数十亿美元的项目,我们知道如何执行它们,但在其他行业,我看到有成千上万个价值500万美元的项目,到目前为止一直很难执行,因为定制的高成本。我认为激动人心的趋势是,AI社区一直在构建更好的工具,让终端用户进行定制。具体而言,我看到许多令人兴奋的低代码和零代码工具,使用户能够自定义AI系统。这意味着我不需要太担心比萨饼的图片,我们有工具,因为我们开始看到可以让比萨饼制造工厂的IT部门在自己的比萨饼页面上训练AI系统的工具,从中获取500万美元的价值。顺便说一句,比萨饼的图片在互联网上是不存在的,所以谷歌和必应无法访问这些图片,我们需要的是比萨饼工厂自己可以使用的工具,在他们自己的比萨饼图片上构建、部署和维护定制的AI系统。

广义地说,支持这一点的技术,一些是提示,文字提示、视觉提示,但真正起作用的是大语言模型和类似工具,或者一种称为数据中心AI的技术,其中我们不要求比萨饼工厂编写大量代码,这很具有挑战性,而是要求他们提供数据,这被证明是更可行的。我认为第二个趋势很重要,因为我认为这将是AI的价值,到目前为止仍然高度集中在技术世界,向其他行业乃至整个经济推广的关键部分,有时很容易忘记除技术世界之外的经济要大得多。

我分享了两个趋势:作为一种通用技术具有大量具体用例有待实现,以及容易使用的本地代码工具,使AI能够在更多行业中部署

03 创建初创企业

我们如何抓住这些机会?大约5年前,我想解决一个难题,我觉得现在可能实现的有价值的AI项目很多,我在想我们如何完成它们,之前在谷歌、百度等大公司领导AI团队,我很难想出我如何用一个大公司的团队去追求非常不同的机会,从海运到教育再到金融服务和医疗保健等等,用例非常多样,进入市场的方式也非常不同,真正的客户基础和应用也非常不同。
05162240-2023-09-05T08:22:39.png
我觉得最有效的方法是启动许多不同的公司来追求这些非常不同的机会。这就是为什么我最终启动了AI Fund,这是一家建立初创公司以追求各种机会的创业工作室。当然,除了许多初创公司,现有公司也有许多将AI整合入现有业务的机会。事实上,我看到的现有企业的一个模式是分销,如果现有企业玩得好的话,这通常可以让他们相当高效地将AI整合到他们的产品中。

但是具体来说,哪里有机会呢?这是我认为的AI栈

在最底层是半导体硬件层,那里有巨大的机会,但需要大量资本,很集中,所以有很多资源但获胜者相对较少。所以有些人可以并且应该在那玩,但我个人不喜欢自己玩。还有基础设施层,也有巨大的机会,但也需要大量资本,非常集中,所以我自己也倾向不玩。然后是开发者层,我刚才向你展示的就是使用OpenAI的API作为开发者工具,然后我认为开发者层竞争非常激烈,看看现在所有追逐OpenAI的初创公司,但会有一些超级赢家,所以我有时会在这里玩,但主要是当我认为有明显的技术优势时,因为我认为这让你有权利或获得成为少数超级赢家的更好机会。

最后,尽管媒体关注和热点在基础设施和开发者工具层,但事实证明,只有应用层更成功时,那一层才能成功。我们在SaaS兴起时也看到了这一点。在技术和工具层有许多关注和兴奋没错,但它成功的唯一方法是应用层更成功,以便它们可以产生足够的收入来支付基础设施和工具层。

所以因为我花了大量时间反复构建初创公司,我将做的就是非常透明地告诉你我们开发的构建初创公司的配方。经过多年的迭代和改进,这就是我们现在构建初创公司的方式。在很多年里,我的团队总是有许多不同的想法,内部生成的想法,来自合作伙伴的想法,我想以我们做的一些事情为例说明这个流程,即一家名为Bearing AI的公司,它使用AI使船舶更节省燃料

这个想法是几年前一家大日本财阀三井物产找上我,他们是Uber的主要股东和大型航运公司,他们对我说,嘿,安德鲁,你应该建立一个业务,使用AI使船舶更节省燃料。具体的想法是,把它想象成船舶的谷歌地图,你可以建议船长或轮船如何转向,以按时到达目的地,但使用10%更少的燃料。所以我们现在所做的就是花大约一个月的时间验证这个想法。仔细检查这在技术上是否可行,然后与潜在客户交谈,确保这是可行的。如果它通过了这个阶段,我们会招募CEO与我们一起开展这个项目。刚开始时,我曾花很多时间自己研究这个项目,然后再带入CEO,但在多次迭代后,我们意识到从一开始就带入领导可以减少知识转移的负担,或者CEO不必重新验证我们发现的内容。所以我们学到的更高效的流程是从一开始就带入领导。

在Bearing AI的例子中,我们找到了一个优秀的CEO Dylan Kyle,他是一位连续创业者,之前的一次创业很成功,然后我们花了3个月的时间,每两周进行一次冲刺,与他一起构建原型并进行深入的客户验证。如果它通过了这个阶段,我们有大约66%的存活率,每次第一个检查点会给公司提供资源来招聘管理团队,建立关键团队,使MVP(最小可行产品)正常工作,并获得一些真实客户。之后,希望它可以成功地募集额外的外部资金,以继续增长和扩展。我对我的团队能够做的工作感到非常自豪,支持三井的想法,以及Dylan Kyle作为CEO的工作,现在数百艘船在公海上航行,因为Bearing AI而以不同的方式自我驾驶,10%的燃料节省按船舶每年约45万美元的数量级计算,当然对环境也好很多。我认为如果没有Dylan的出色工作和三井将这个想法带给我,这家初创公司就不会存在
05162301-2023-09-05T08:23:00.png
我想讲这个例子,因为这是一个我个人永远也想不到的创业想法,因为你知道我坐过船,但我对海运一无所知。但是三井的专业知识结合Dylan和我团队的AI专业知识使这成为可能。因此,在运营AI的过程中,我学到的一件事是我的泳道就是AI,仅此而已,因为我花了很多时间,发现如果我只是AI领域的专家,然后使用AI资源来确保技术团队强大,那么与领域专家合作通常会产生激动人心的新机会。

我想与你分享构建创业公司时我发现的另一件奇怪的事,那就是我只关注有具体想法的情况。这与许多人听到的来自设计思维方法论的建议相反,它通常说不要急于解决方案,要广泛探索各种替代方案。老实说,我们试过了,但进展很慢。但是我们学到的是,在构想阶段,如果有人来找我说,嘿,安德鲁,你应该将AI应用于金融服务,因为我不是金融服务的主题专家,我去学习足够的金融服务知识以便弄清楚要做什么,对我来说是一个非常劳动密集、缓慢、昂贵的过程。

相比之下,我的一位合作伙伴开玩笑地写下了这个想法,让我们说某个国家购买每个做广告的产品,改变或停止看任何广告。这可能不是一个好主意,但它是一个具体的想法,可以被有效验证或证伪。它们还为团队提供了明确的执行方向。我了解到,在当今世界,特别是考虑到对AI的关注、宣传和曝光,今天的世界有很多领域专家已经深思熟虑了问题几个月,甚至一两年,但还没有遇到合适的合作伙伴。当我们与他们见面并听到他们分享想法时,我们可以与他们一起非常快速地进行验证和构建。我发现这很有效,因为有很多人已经做了设计思考,探索了许多想法,找到了好的想法,但没有人在工作,找到这些想法,有人想分享给我们,与我们一起构建,这被证明比我试图学习一个又一个行业更有效。

04 人工智能的风险与社会影响

在结束之前,我谈谈风险和社会影响。是的,这是一种非常强大的技术。你可能已经猜到我和我的团队只致力于推动人类进步的项目。事实上,我们多次否决看似财务稳健的项目,因为道德原因。事实证明,我一直惊讶和沮丧的是人们想出真正好主意或者非常糟糕但似乎profitable的坏主意的创造力。我们以这些理由停止了几个项目。

必须承认,AI今天确实存在偏见、公平性、准确性等问题。但也要认识到,技术正在快速改进。我看到今天的AI系统比6个月前更少偏见,更加公平。这并不是贬低这些问题的重要性,这些确实都是问题,我们应该继续努力解决它们,但我也对许多AI专家努力改进这些问题感到欣慰。

当我思考AI的最大风险时,我认为其中最大的风险之一是对就业的破坏。上图是来自宾夕法尼亚大学和OpenAI部分人员的一张图表,分析不同工作对AI自动化的敞口。结果发现,虽然前一波自动化主要使低薪工作(如当我们将机器人放入工厂)最容易受到影响,但当前这波自动化实际上使图表右侧的高薪工作其任务更容易受到AI自动化的影响。因此,即使我们使用AI创造了巨大的价值,但作为公民,我认为我们的公司、政府和整个社会都有强烈的义务确保人们的生计受到破坏,特别是那些生计受到破坏的人得以很好地照顾和对待。

最后,每当AI出现大进步时,人们似乎都会对通用人工智能产生大量炒作。当10年前深度学习开始发挥作用时,有大量关于AGI的炒作,现在生成式AI进展顺利,又出现了关于AGI的新一轮炒作。但我认为通用人工智能,即AI可以做人能做的任何事情,仍然还有几十年的路要走,也许需要30到50年,甚至更长时间。我希望我们有生之年能见证它,但我认为它不会很快发生。

其中一个挑战是生物进化通向智能的路径与数字通向智能的路径截然不同,AGI的定义是用生物智能的标准衡量数字智能,这是一个有趣的比较。我认为大语言模型在某些关键维度上比我们任何人都更聪明,但在其他维度上比我们任何人都愚蠢。所以强迫它做人类能做的任何事情是一个有趣的比较。但我希望我们能在有生之年见证这一点。人们也非常夸大AI对人类造成灭绝风险。老实说,我看不到AI造成人类任何真正的灭绝风险。我认为人们担心我们无法控制AI,但我们有大量经验来驾驭比任何个人都强大得多的实体并确保它们大多造福人类。此外,技术是逐步发展的,所谓的硬起飞场景,今天它基本上不工作,然后突然有一天它变得非常聪明并接管世界,这根本就不现实。我认为AI技术会缓慢发展,就像其他技术一样,这给了我们足够的时间来进行监督并确保它是安全的。

所以我的感觉是,如果你想人类在未来1000年生存和繁荣,与其减慢AI的发展速度,我宁愿AI尽可能快地发展。总之,我认为AI作为一种通用技术为每个人创造了大量新机会,我们所有人面前激动人心和重要的工作是去建立那些具体的用例。希望将来我有机会也许与更多的人共同开发这些机会。