分类 AI智能体 下的文章

史上首位“AI科学家” ,横空出世!一登场就一口气生成了十篇完整学术论文。从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI科学家”自动搞定。每篇论文的成本约为15美元(约107.62元)。这就是第一个用于自动化科......    阅读全文

AI初创公司Cosine,宣布推出世界上最强的AI程序员Genie。根据第三方基准测试SWE-Bench,Genie的得分为30%,位居排行榜第一,拳打GPT4、脚踢Devin。▲SWE-Bench的测试结果Genie是什么?Genie作为一个 AI 编程模型,它可以根据人们下达的各种......    阅读全文

病毒式传播的“毒舌AI” Twitter Personality,只需输入一个推特用户名,就能得到AI根据历史发言做的犀利点评。而且只要是公开账号就行,并不需要获取任何权限,除了查看AI对自己的看法,还可以用来恶搞朋友,甚至名人。比如马斯克是肯定逃不过这一劫的。首先AI会总结出几个能代......    阅读全文

AI Agent平台DevRev在官网宣布获得1亿美元A轮融资,估值达到11.5亿美元。本次由Khosla Ventures、Mayfield Fund和Dheeraj Pandey等联合投资。公开资料显示,DevRev创立于2020年由Dheeraj Pandey和Manoj Aga......    阅读全文

8 月 9 日,DeepMind 的研究人员公布了首款能够与人类业余水平对抗的 AI 机器人乒乓球手,该系统将 ABB IRB 1100 工业机械手臂与 DeepMind 的定制 AI 软件结合起来。虽然人类专业运动员仍然更胜一筹,但该系统仍展示出机器在处理复杂物理任务时的瞬间决策与强......    阅读全文

近日,OpenaDevin 团队发布了OpenDevin的技术报告。在技术报告中,OpenDevin 的作者,来自伊利诺伊大学香槟分校、卡耐基梅隆大学等机构的学者们详细介绍了 OpenDevin,这是一个社区驱动的平台,旨在开发通过软件与世界交互的通用和专业 AI Agent。更重要的......    阅读全文

01. Voice Agent 全景图为了快速框定出端到端模型出现后什么领域会有剧烈变化、什么领域不会,我们搭建了以下框架来分析声音领域的不同场景需求。‍象限分类标准:1)纵轴是该场景是否对实时性敏感,上方的需要实时在线的回答,下方的可以离线完成声音制作。2)横轴是区分该场景准确度还是......    阅读全文

Cradle框架能够通过人类使用的统一界面执行复杂的计算机任务,即以屏幕截图作为输入,以键盘和鼠标操作作为输出。项目简介 Cradle是一个模块化且灵活的 LMM 驱动框架。Cradle框架由六个关键模块组成:信息收集、自我反思、任务推断、技能策划、动作规划和记忆。这些模块协同工作,使......    阅读全文

AI 崛起,能够自主规划并执行多个步骤的 Agents,正成为用户的接口,也成为开发者的核心着力点。近期美国风投 Madrona 合伙人 John Turow 发表了一篇行业洞察《The Rise of AI Agent Infrastructure》,分享了 agent 领域的观察和......    阅读全文

对于AI native公司应该关注Agent能够全链路端到端支撑公司业务SOP,尽可能的突破人对业务规模和效率的制约。**就打造AI Native公司来讲,最值得尝试的领域就是对于人员成本敏感的BPO(商务流程外包)业务,谁的成本低,谁就将在竞争中获得大的优势。下面就是一个概念性的设计......    阅读全文

我们今天在做什么?我们正在为一家名为“Aniket Very General Electric Company”的虚构电气公司建立一个 BPO(业务流程外包)呼叫中心。我们将创建由人工智能代理组成的不同部门,他们可以与客户聊天(并最终在下一部分发言)以回答问题、处理投诉或提供服务。为什......    阅读全文

6月18日,又一家生成式 AI 初创公司 Decagon 浮出水面,正式宣布完成由 Accel 领投的 3500 万美元 A 轮融资以及此前由 a16z 领投的 500 万美元种子轮融资。此外,此次融资还吸引了A*、Elad Gil 和多位知名天使投资人的参与,包括 Box 的 CEO......    阅读全文

既然 AI / GenAI / AIGC 应用爆发已经成为共识,那么为此做好准备工作就是重要且必要的。其中,AI Agent (智能体) 就是重要组成部分。开发者们正在基于 AI Agent 快速创建新应用,并逐渐改变了传统 App 的构建模式。👇 下图是 AI Agent 基础设施现......    阅读全文

复旦大学语言与视觉团队推出的 AgentGym 平台,打通了大语言模型智能体「数据采样、训练微调、自我进化、能力评测」全流程。基于该平台提出的 AgentEvol 算法,首次探索了通用智能体的自我进化能力,并在多项智能体任务上表现非凡,与 GPT-4、Claude 等 SOTA 模型比......    阅读全文

在Sam Altman、吴恩达等几位AI业界人士的“带货”之下,Agent作为新一代生产力工具的巨大潜力和广泛的应用前景终于“破圈”、被更多的看到和讨论。其实在2023年时,我就预测过,2024年会是大语言模型应用落地和Agent的元年。为什么Agent会是大语言模型发展应用下的必然?......    阅读全文

OpenDevin是一个旨在复制 Devin 的开源项目,Devin 是一位自主人工智能软件工程师,能够执行复杂的工程任务并在软件开发项目上与用户积极协作。该项目致力于通过开源社区的力量复制、增强和创新 Devin。Devin 代表了一种尖端的自主代理,旨在应对软件工程的复杂性。它利用......    阅读全文

当前市面上的AI Agent产品形态主要包括标准化Agent和Agent构建平台两种,后者则更能够满足大部分用户的个性化需求。基于LLM的AI Agent构建平台承载了“人人都是开发者”的愿景与使命,真正拉开了全民开发的应用构建序幕,因此像Coze、Dify.ai、Beam.ai等也更......    阅读全文

这是 E2B 制作的 AI Agents Landscape 最新版 (V2.4),并且对每家公司进行了详细介绍。这应该是目前市面上最完整的 AI Agents 清单了。   阅读全文

AutoWebGLM 框架是一个基于 ChatGLM3-6B 模型的自动网页浏览 Agent 框架。与其前身——专注于检索增强的 WebGLM —— 不同,AutoWebGLM 会像人类一样去操作真实的网页,从而能够自主完成复杂的现实世界中的任务。一、架构AutoWebGLM 系统包括......    阅读全文

最近,一项由伊利诺伊大学香槟分校研究团队开展的研究,将GPT-4推向了一个新的高度——黑客攻击。这项研究不仅展示了GPT-4在安全领域的潜在能力,也引发了关于AI伦理和安全的广泛讨论。这个黑客智能体架构使用了LangChain的ReAct智能体框架。系统结构如下图所示:进行漏洞攻击时,......    阅读全文