当前热门的AI Agent有哪些

随着人工智能技术的不断进步,AI Agent成为了提高工作效率和信息处理能力的重要工具。当前市场上的热门AI Agent例如AiAgent.app和哥伦比亚大学推出的GPT Researcher,不仅能够快速准确地理解用户需求,为用户提供全面的内容目标,还能为特定的用户群体和应用场景提供定制化服务,显著降低研究资料的获取时间,极大地推动了各类职业,如媒体从业者和行业分析师的工作效率。

同时,这些AI Agent的应用已经从内容获取拓展到多个应用场景,包括软件应用和硬件设备的控制,预示着AI Agent的广泛应用潜力和未来的发展趋势。像AiAgent.app只需要输入一句话,它就分析出了你可能的需求并列出相对全面的内容目标,引导你去完成想要的东西,效率提升数倍。

在内容获取的丰富度以及效率上,显然AI Agent更胜一筹。这种资讯内容类Agent对媒体从业者、行业分析师等职业具有非常大的价值,能够大大减少研究资料的获取时间。
17201958-2023-10-17T12:20:13.png

现在已经出现了一些面向更精确用户群体及应用场景的此类Agent,比如哥伦比亚大学推出的GPT Researcher就是一个基于ChatGPT的面向研究人员的Agent,可以为用户创建各种研究报告以促进研究。 

这个案例还只是内容的获取,事实上现在已经出现面向多个应用场景的Agent,足以调动更多软件应用乃至硬件设备完成各项任务。
17202023-2023-10-17T12:20:38.png

而在LLM还没有出现之前,一些企业就已在研究传统AI与Agent的结合应用。因此,AI Agenmt在各领域的落地比大家预想得要快很多。
17202034-2023-10-17T12:20:51.png

下面,是几个行业领域的代表性Agent应用。

医疗领域:Agent可以帮助诊断、治疗和监测患者。IBM Watson Health 是一个AI智能体,可以分析医疗数据,以识别潜在的健康问题并推荐治疗方案。
金融领域:Agent可以分析财务数据、检测欺诈行为并提出投资建议。嘉信理财(Charles Schwab)使用名为Intelligent Portfolio的人工智能智能体,根据客户的投资目标创建和管理投资组合。
零售业务场景中:Agent可以提供个性化推荐,改善供应链管理,增强客户体验。亚马逊的Alexa是一个AI智能体,可以推荐产品,下订单和跟踪发货。
制造业:Agent可以优化生产流程,预测维护需求,提高产品质量。通用电气使用名为Predix的AI智能体实时监控机器,以预测和防止设备故障。
运输领域:自主AI Agent可以协助路线规划、交通管理和车辆安全。特斯拉的Autopilot有助于自动驾驶车辆,并帮助驾驶员停车、变道和安全驾驶。
教育行业:Agnet可以提供个性化的学习体验,自动执行管理任务并分析学生的表现。培生(Pearson)的AI智能体Aida可以为学生提供反馈,并建议个性化的学习路径。
农业领域:AI Agent可以优化作物生产、监测土壤质量并预测天气模式。约翰迪尔(John Deere)正在使用一种名为See&Spray的AI智能体来检测和定位杂草,而不会影响作物。

AI Agent的机会和未来

AI Agent的潜力和未来是多方面的,既包括toB(企业对企业)也包括toC(企业对消费者)领域。类似于移动互联网的轨迹,toC领域的AI Agent有可能通过超级应用的产生,快速拥有大量客群。

"帮你做"而不是仅仅是“告诉你怎么做”对用户来说更具吸引力和粘性。短期内会有数月客群数亿的“超级代理”产生的情景是可以预见的。

反之,toB领域的应用可能会遵循一个“线性但持久”的模式。AI Agent的特性可能会导致一个更普遍的现象,即企业用户追求的便利性和易用性推动了组织的决策变化,类似于SaaS时代曾经发生的情况。即使是toB领域的应用,由于AI Agent的“解决问题”的能力,成长曲线也会变得更“陡峭”,就像GitHub的Copilot迅速在编程开发工程师群体中蔓延一样。

在toC和toB领域中,AI Agent的应用预计会有类似于移动互联网时代的规律,toC的应用将有机会通过超级应用的产生,快速拥有大量客群。相比之下,toB的应用可能会进入到“线性但持久”的模式中。

例如,GitHub的Copilot在编程开发工程师群体中的迅速传播显示了AI Agent的潜力,即使在toB领域的应用中,由于AI Agent的“解决问题”的能力,成长曲线也会变得更“陡峭”。

多模态的兴起与未来的AI Agent

传统上,我们所见的AI Agent主要围绕着文本处理和理解展开。然而,随着多模态技术的突破,未来的Agent将不再仅限于文本,而是会融入多模态世界中,具备图像、声音和感觉等多种模态的理解能力。

在开发基于文本的Agent时,我们可能不需要完全废弃原有的开发框架,但当多模态的创新时刻来临,Agent的功能和性能将呈现出显著的差异。

例如,GPT的未来版本可能会集成更强大的图像和其他多模态理解功能,这些功能最好是直接内置在模型中,而非依赖于外部模块的调用,以确保模型的高效和协同。

未来半年内,我们有望见证多模态大模型的诞生。而多模态Agent的推出可能会比我们预想的更为迅速。一方面,许多大公司正在如火如荼地进行多模态技术的研发,这种量变的积累可能很快就会催生质变,推动实质性的突破。另一方面,人们期望能拥有类似人类助手的Agent,不仅能与我们沟通,还能看、听和感知,实现多感官、多模态的交互

未来的Agent将在多模态的世界中发挥重要角色,助力智能生产、新的经济模型的构建,为未来的工作和学习机会提供新的可能。多模态技术将成为推动未来AI Agent发展的重要动力,为未来10年的100万个新岗位的创造奠定基础。