摘要自驾行业通常雇用专业艺术家来制作精美的 3D 汽车模型。然而,制作大规模的数字资产成本高昂。由于已经有许多包含大量汽车图像的数据集,我们专注于从这些数据集中重建高质量的 3D 汽车模型。然而,这些数据集只包含前行场景中汽车的一侧图像。我们尝试使用现有的生成模型提供更多的监督信息,但......    阅读全文

上海交通大学联合退格数字共同研发的基于扩散模型的框架——Stable-Hair!在生成人像时,可以更好地控制头发的生成效果了。Stable-Hair 采用了双阶段设计:第一阶段用光头转换器将原图变成秃头第二阶段则精准地将目标发型移植上去框架的核心包含三大模块:发型提取器:负责从参考图中......    阅读全文

01. Voice Agent 全景图为了快速框定出端到端模型出现后什么领域会有剧烈变化、什么领域不会,我们搭建了以下框架来分析声音领域的不同场景需求。‍象限分类标准:1)纵轴是该场景是否对实时性敏感,上方的需要实时在线的回答,下方的可以离线完成声音制作。2)横轴是区分该场景准确度还是......    阅读全文

Traini是一款AI狗语翻译器,可以在你和狗狗之间,进行跨物种翻译:你能听懂你家狗什么时候是想要吃的、什么时候是分离焦虑,你家狗也能听懂你说的“给我拿遥控器”“爱我就抱抱我”。Traini不仅能让用户听懂狗狗的叫声,还能看懂狗狗的面部表情、身体行为等语言,来了解狗狗的心理状况。训练模......    阅读全文

LivePortrait是快手推出的人像视频生成框架,由快手可灵大模型团队开源,只需1张原图就能生成动态视频。LivePortrait专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态人像,创造出富有表现力的视频。该技术通过隐式关键点框架实现,利用大规模高质量训练数据和混合训练策......    阅读全文

北美时间7月23日,Meta(原Facebook,脸书)公司正式官宣发布了开源模型Llama 3.1。不出意外的话,根据各项AI模型基准测试的结果来看,Llama 3.1将会成为史上最强大的开源LLM模型。Llama 3.1模型具备128K的上下文长度,支持八种语言,并推出了首个开放源......    阅读全文

StockBot由Llama3-70B模型驱动,运行在Groq上,能够提供实时股票图表、财务数据、新闻的聊天机器人。StockBot能够以闪电般的速度处理数据。通过Verceld生成式UI,StockBot能够将输出结果直接展示为用户友好的UI界面。它不仅能够展示每日市场表现热图、股票......    阅读全文

谷歌的研究人员在Gemini模型的基础之上,微调出了专用于个人健康的大语言模型PH-LLM。用户通过将健康数据与PH-LLM相结合,就能快速获取个性化健康建议、日常疾病问答、健康报告预测等专家级医疗咨询服务。数据整合PH-LLM会先通过数据整合模块,将来自智能手表、健身追踪器等智能设备......    阅读全文

Cradle框架能够通过人类使用的统一界面执行复杂的计算机任务,即以屏幕截图作为输入,以键盘和鼠标操作作为输出。项目简介 Cradle是一个模块化且灵活的 LMM 驱动框架。Cradle框架由六个关键模块组成:信息收集、自我反思、任务推断、技能策划、动作规划和记忆。这些模块协同工作,使......    阅读全文

1 Julius AI用于数据可视化和分析的 AI 数据分析师Julius 是一位强大的 AI 数据分析师,可帮助您分析和可视化数据。您可以与数据聊天、创建图表、构建预测模型等。只需上传您的数据,然后向 Julius 询问见解或指示其执行特定的分析或可视化。特征:分析和可视化数据与数......    阅读全文

除了学习AI理论知识,产品经理能熟练使用 AI 工具,也是竞争优势的关键要素。如果想显著提升工作效率和决策质量,应该把哪些AI工具放进自己的「工具箱」呢?应该在什么场景下用AI重构自己的工作流呢?产品经理们!快读这篇文章!不仅有详细的分类工具清单,还列举了 PM (产品经理) 可以使用......    阅读全文

时间序列预测(Time-series Forecasting)对众多行业都至关重要,包括健康、能源、商业、气候等。在不同预测长度上的准确性,对这些领域中服务短期和长期的规划和决策需求来说极其重要。例如,在疫情爆发这种公共卫生的紧急情况下,预测一到四周内的感染病例和死亡人数对于有效分配医......    阅读全文

Dimebots 是一系列自主独立的微型机器人,它们小如一美分硬币大小,重量不足5g(4.1g),是世界上最小的机器人之一。硬件主要器件及原理Microchip/Atmel ATTiny1614 & Texas Instruments DRV8837ATTiny1614,它采用 14 ......    阅读全文

在讨论人工智能先进技术或产品时,我们常常会看到一个专业术语:SOTA。当某项产品或技术被打上SOTA关键词时,似乎就能自带光环。话说回来,到底什么是SOTA?它和人工智能有着怎样的关联?如何才能成为某个领域的SOTA?如果你也好奇,下面我们一起看瞧瞧。什么是SOTA?在业内,SOTA普......    阅读全文

人工智能,已经进入奥本海默时刻。现在,AI武器不断被用于军事用途,相关行业正在蓬勃发展。价值数十亿美元的AI军备竞赛,已经吸引了硅谷巨头和世界各地的国家。世界各地日益加剧的冲突,既是AI战争的加速器,也是试验场。各国军队都对AI有着极大的兴趣,而且,这一领域目前还缺乏监管。而美国军方,......    阅读全文

去年9月,Meta与雷朋推出第二代智能眼镜Ray-Ban Meta,与第一代相比,最大的更新是集成Meta AI大模型。用户可通过摄像头和内置麦克风与扬声器,使用Meta AI实现目标识别和对话问答等功能。据第三方消息,Ray-Ban Meta已售出超过百万台,成为科技界新贵网红产品,......    阅读全文

中山大学&字节智创数字人团队提出了一个名为MMTryon的虚拟试穿框架,可以通过输入多个服装图像及指定穿法的文本指令来生成高质量的组合试穿结果。比如选中一件大衣、一条裤子,再配一个包,用语言描述穿法,“啪”的一键就穿到了人像上:无论是真人图像又或是漫画人物,都能一键按照搭配试穿衣服: ......    阅读全文

本月初,微软发布最强 RAG 知识库开源方案 GraphRAG,项目上线即爆火,现在星标量已经达到 10.5 k。GraphRAG 使用 LLM 生成知识图谱,在对复杂信息进行文档分析时可显著提高问答性能,尤其是在处理私有数据时。GraphRAG 使用 LLM 生成知识图谱,在对复杂信......    阅读全文

近两年最热的赛道就是 AI 了,我们技术团队早在去年上半年就开始布局相关的技术研究,但现在一年多时间过去了,产品上却迟迟没有做任何与 AI 相关的功能。 是不是很奇怪? 主要的原因在于我没有解答清楚自己心中的一些问题,所以一直在观察、在研究、在分析…… 直到最近我才觉得 AI 产品可......    阅读全文

前段时间,我组织了一次AI搜索的线下闭门会:与会的同学包括了:360AI搜索、某大厂搜索、Gemini、ThinkAny、万知、Repotify、Miku、荣耀,基本占据了国内AI搜索的半壁江山吧,从中得到了很多的收获和思考,结合最近专门找了小邵深夜聊了一次,快速的整理出了本篇文章,提......    阅读全文