通义千问大模型未来将接入阿里所有产品
距离被阿里“通义千问”刷屏还不到一周时间,4 月 11 日,阿里云峰会又再放大招。
活动现场,阿里巴巴集团董事会主席兼 CEO、阿里云智能集团 CEO 张勇在云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,钉钉、天猫精灵已率先接入通义千问测试,并会在评估认证后正式发布新功能。
不仅如此,阿里云还将开放通义千问的能力,帮助每家企业打造自己的专属大模型。张勇表示,面向 AI 时代,所有产品都值得用大模型重新升级。
当大家还在就通义千问跟 ChatGPT、文心一言的对比效果而津津乐道时,阿里再进一步,已抢先在其应用中率先测试,让外界深切地感受到,生产力变革真的要到来了,中国 AI 下半场激烈竞争的号角也正式吹响。
钉钉、天猫精灵接入通义千问
接入通义千问后,钉钉和天猫精灵将获得哪些新能力呢?
钉钉在通义千问接入后增加了近 10 项新 AI 功能,通过类似微软 Copilot(副驾驶)的设定,用户可以随地随地唤醒 AI 来辅助日常的工作。
例如在钉钉文档智能创作功能中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等,协助完成一些创意类的写作:
作为工作环境中重要的群聊沟通环节,通义千问带来了一个高效助手,可基于群内聊天内容自动生成聊天记录摘要,当面对上百条群聊记录时,让你也能以最快速度了解上下文:
而打工人往往一周逃不开几个会打底,通义千问也在最大化地减轻用户的开会压力。在钉钉的音视频会议中,新增了 AI 自动语音转文字功能,可实时记录与摘要重点、专业术语解释等;会后,AI 还可以一键生成会议纪要,包括会议摘要、议程回顾、重点内容、行动待办等:
而最令人惊艳的是,是会上钉钉展示的拍照开发新应用功能,只需上传一张功能草图,不用写一行代码,即可立刻生成一个新应用:
看完钉钉,再来看通义千问在天猫精灵上的表现。
前段时间,天猫精灵悄悄上线了阿里版 ChatGPT 语音助手、脱口秀版 GPT “鸟鸟分鸟”,引起了业内广泛好评,而此次在峰会现场展示的天猫精灵对话式智能交互系统,无论是相比此前的产品还是“鸟鸟分鸟”,其能力也有了一定的提升,它支持自由对话,能根据用户需求和场景随时生成内容。
比如,你可以在跑步时要求天猫精灵合成一个定制版歌单:当你是个有各种天马星空想法、喜欢讲故事写小说的人,也可以邀请天猫精灵和你一起创造新故事:如果这个话题你不想聊,新版天猫精灵也支持你随时打断对话,并任意开启下一个话题......
可以看到,嵌入通义千问的钉钉和天猫精灵所展现出来的新功能,不仅极大提高了用户的办公效率,或还将改变人们和 AI 的交互方式。
除此之外,张勇在活动现场还重磅宣布,阿里所有产品将用大模型进行全面改造,通义千问将陆续嵌入阿里电商、搜索、导航、文娱等场景。
一个崭新的 AI 大时代正加速到来。阿里大招频出,让接下来的竞赛,不再是局限于大模型的追逐,而是依托于云计算基础,真正让 AI 大模型出现在工作、生活、娱乐等各种领域。
AI 大模型成功的两大要素
尽管阿里并不是国内第一个公布类 GPT 的,但阿里却是国内最早着手 AI 大模型研发的大厂之一。
阿里云智能 CTO 周靖人表示,“对我们行业内的人来讲,我们并不认为这条道路好像就是 2023 年突然出现。这是一个长期以来技术发展的演进过程。”在他看来,大模型通义千问既不是起点,也不是终点,而是一个中间节点。
实际上,阿里达摩院在 NLP(自然语言处理)等前沿科研领域布局多年。2019 年阿里启动大模型研发,当年即发布大规模预训练语言模型 structBERT 并登顶全球 NLP 权威榜单 GLUE,成为近年中国公司在 AI 领域的核心突破之一。
此后,阿里陆续发布国内首个超百亿参数的多模态大模型及语言大模型,训练实现全球首个 10 万亿参数 AI 模型。在 2022 年,达摩院推出集大成的通义大模型,在语言及多模态能力、超大模型、通用统一模型等多个技术维度上,均处于国内第一梯队。
在周靖人看来,阿里对 AI 大模型的投入及研发,已通过自身实践锤炼出了国内唯一支撑过万亿参数以上大模型的“飞天智算基础设施”。
此次云峰会上,他首次全面诠释了“飞天智算基础设施”可提供的三层系统服务能力:
智算 IaaS 服务包括可支持最大十万卡 GPU 单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模 AI 集群提供无拥塞通讯的自研 RDMA 网络架构等;
智算 PaaS 服务以机器学习平台 PAI 为核心,可支持万卡的单任务分布式训练规模,AI 训练效率提升可达 10 倍,推理效率提升可达 6 倍,覆盖全链路 AI 开发工具与大数据服务,深度支持了通义大模型的研发;
智算 MaaS 服务包括通义大模型系列和以之为基础的企业定制大模型,以及国内首个“模型即服务”开放平台魔搭社区,魔搭现已汇聚超 800 个优质开源模型,总用户量超 100 万,模型累计下载次数超 1600 万,成为国内规模最大的模型社区。
“这一系列都是帮助我们在人工智能的时代更好的训练自己的模型,更好的把我们模型服务推向我们的业务去解决我们实际的问题。”周靖人总结说到。
不少业界人士认为,这是通义千问问世背后的关键因素——深厚的大模型技术积淀、强大的云基础设施能力,对大模型的研发来说缺一不可。
大模型百花齐放即将到来
然而,放眼国内,绝大部分 AI 领域的公司和开发者不具备阿里的综合能力。但是,时代的变革已经降临,许多国内 AI 从业者们兴奋又焦虑,不想在浪潮中被抛弃,就要积极拥抱新技术,找到一条自己擅长的路径。
在此之前,AI 的 To B 生意大多以针对具体的任务和应用场景,提供定制解决方案并出售模型,而这种商业模式早已经是一片红海、失去其竞争力,背后根本的原因在于,只能解决单点的阶段性问题,难以深入模型层创新、自研层,无法构建企业自己的核心竞争力。
举个例子,在去年第一轮 AIGC 浪潮中,有些当时火起来的国内绘画产品,采用的方法是调用开源模型 API 作为技术基座,在此基础上去做风格化和微调的工作,这种纯应用层的产品壁垒较低、可持续性不强。
即便是很多头部企业,从 0 到 1 不断训练、优化大模型也并不经济,各行各业都需要成本足够低的 AI 基础设施,这当中就囊括了底层算力、网络、存储、大数据、AI 框架、AI 模型等复杂技术的系统性工程,需要“AI+ 云计算”的全栈技术能力。
某种程度上,这已成为限制国内 AI 发展的主要桎梏。面对这一困境,阿里给出了新解法。
此次云峰会,张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,为此,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。
基于阿里提供算力基础设施、机器学习平台和大模型服务,企业不必再“重复造轮子”、陷入对大模型通用能力的无意义内卷,而是把更多的精力投入到原创的、专属的模型研发中。
每一个企业都可以在阿里云上拥有专属的大模型空间,在上面,企业既可以调用通义千问的全部能力,也可以结合自身行业知识和应用场景,训练自己的企业大模型,例如企业专属的智能客服、智能导购、智能语音助手、文案助手、AI 设计师、自动驾驶模型等。
除了通用场景外,由于企业的业务特性不同,对于大模型服务需求也不同,阿里云也将通过产品化的方式,满足企业专属大模型从生成到部署全生命周期的需求。
例如企业存在各类文本、视频、图片等数据,以及各种存放数据的系统,如数据库、数据湖或是其他阿里云的数据类产品等,将此类具有企业特性的数据存放在一个企业自有的数据空间(Repo)里,即可作为企业专属大模型的训练数据。
通义千问能够自动理解数据内容,学习内容产生的企业知识,并且通过这些知识增强大模型的能力,补充企业所需要的模型特性,然后自动生成企业专属的大模型并且将大模型部署到阿里云上。同时,企业专属大模型也提供丰富的选项,让企业定制的提示语与问题回答,满足企业个性化的需求。
据周靖人介绍,阿里为企业专属大模型将提供两种使用方式:
一种是 Web 界面,可直接使用或是嵌入在企业的各类网站中,让企业能以快速使用专属大模型的服务;另一种是专属 API 服务,企业开发者通过企业大模型提供的专属 API,即可开发各类企业的应用,提供对内的管理应用以及对外的客户服务。
通过企业专属大模型服务,让大模型服务在企业应用落地,将 GPT 化为无形,让 AI 成为企业和用户手中的生产力工具。
峰会现场,阿里云宣布将与 OPPO 安第斯智能云联合打造 OPPO 大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的 AI 服务。未来,阿里云也还将与中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业在大模型相关场景展开技术合作的探索和共创。
峰会之后,不少业界人士感叹,此前那个熟悉的、勇猛的阿里又回来了。大模型时代,不能单打独斗,而关于 AI 企业们的新故事,或许刚刚开始。