8月6日,MiniCPM-V 开源项目重磅更新了「小钢炮」 MiniCPM-V 2.6。仅 8B 参数,单图、多图、视频理解全面超越GPT-4V,稳坐端侧最强多模态铁王座。8B 参数的模型很有意义,这种小模型可以在手机端侧落地。MiniCPM-V 2.6 刷新了端侧多模态复杂推理能力。......    阅读全文

近年来,量化投资在国内快速发展,也引起了市场各界广泛的讨论和争议。由于量化投资本身的专业性与复杂性,很多认识难免存在一些误解。对此,我们将结合长期以来的投资实践,来阐述国内量化领域的一些问题,希望可以让大家更加客观、清晰地看待量化投资。1 什么是量化投资?量化投资是指用数学/统计/人工......    阅读全文

智谱AI的视频生成模型CogVideoX-2B正式开源了。模型已上架GitHub、Hugging Face,FP16精度下的推理仅需18GB显存,微调则只需要40GB,单张4090显卡可推理,单张A6000可微调。CogVideoX-2B的提示词上限为226个token,视频长度为6秒......    阅读全文

项目简介Stable Fast 3D 是一个由 Stability AI 开发的开源项目,旨在为三维建模和渲染提供高效、稳定的解决方案。该项目集成了先进的图形算法和优化技术,旨在提升三维图形生成的速度和质量。用户可以通过该项目快速创建和渲染复杂的三维场景,适用于游戏开发、动画制作以及虚......    阅读全文

谷歌DeepMind开源了轻量级模型Gemma 2 2B,其在大模型竞技场上的分数超越了GPT-3.5、Llama 2 70B等更大参数的模型。只有20亿参数使得Gemma 2 2B可以轻松在手机、PC等终端设备上快速运行。开发者实测在Google AI Studio上,其推理速度达到......    阅读全文

近日,OpenaDevin 团队发布了OpenDevin的技术报告。在技术报告中,OpenDevin 的作者,来自伊利诺伊大学香槟分校、卡耐基梅隆大学等机构的学者们详细介绍了 OpenDevin,这是一个社区驱动的平台,旨在开发通过软件与世界交互的通用和专业 AI Agent。更重要的......    阅读全文

摘要自驾行业通常雇用专业艺术家来制作精美的 3D 汽车模型。然而,制作大规模的数字资产成本高昂。由于已经有许多包含大量汽车图像的数据集,我们专注于从这些数据集中重建高质量的 3D 汽车模型。然而,这些数据集只包含前行场景中汽车的一侧图像。我们尝试使用现有的生成模型提供更多的监督信息,但......    阅读全文

上海交通大学联合退格数字共同研发的基于扩散模型的框架——Stable-Hair!在生成人像时,可以更好地控制头发的生成效果了。Stable-Hair 采用了双阶段设计:第一阶段用光头转换器将原图变成秃头第二阶段则精准地将目标发型移植上去框架的核心包含三大模块:发型提取器:负责从参考图中......    阅读全文

01. Voice Agent 全景图为了快速框定出端到端模型出现后什么领域会有剧烈变化、什么领域不会,我们搭建了以下框架来分析声音领域的不同场景需求。‍象限分类标准:1)纵轴是该场景是否对实时性敏感,上方的需要实时在线的回答,下方的可以离线完成声音制作。2)横轴是区分该场景准确度还是......    阅读全文

Traini是一款AI狗语翻译器,可以在你和狗狗之间,进行跨物种翻译:你能听懂你家狗什么时候是想要吃的、什么时候是分离焦虑,你家狗也能听懂你说的“给我拿遥控器”“爱我就抱抱我”。Traini不仅能让用户听懂狗狗的叫声,还能看懂狗狗的面部表情、身体行为等语言,来了解狗狗的心理状况。训练模......    阅读全文

LivePortrait是快手推出的人像视频生成框架,由快手可灵大模型团队开源,只需1张原图就能生成动态视频。LivePortrait专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态人像,创造出富有表现力的视频。该技术通过隐式关键点框架实现,利用大规模高质量训练数据和混合训练策......    阅读全文

北美时间7月23日,Meta(原Facebook,脸书)公司正式官宣发布了开源模型Llama 3.1。不出意外的话,根据各项AI模型基准测试的结果来看,Llama 3.1将会成为史上最强大的开源LLM模型。Llama 3.1模型具备128K的上下文长度,支持八种语言,并推出了首个开放源......    阅读全文

StockBot由Llama3-70B模型驱动,运行在Groq上,能够提供实时股票图表、财务数据、新闻的聊天机器人。StockBot能够以闪电般的速度处理数据。通过Verceld生成式UI,StockBot能够将输出结果直接展示为用户友好的UI界面。它不仅能够展示每日市场表现热图、股票......    阅读全文

谷歌的研究人员在Gemini模型的基础之上,微调出了专用于个人健康的大语言模型PH-LLM。用户通过将健康数据与PH-LLM相结合,就能快速获取个性化健康建议、日常疾病问答、健康报告预测等专家级医疗咨询服务。数据整合PH-LLM会先通过数据整合模块,将来自智能手表、健身追踪器等智能设备......    阅读全文

Cradle框架能够通过人类使用的统一界面执行复杂的计算机任务,即以屏幕截图作为输入,以键盘和鼠标操作作为输出。项目简介 Cradle是一个模块化且灵活的 LMM 驱动框架。Cradle框架由六个关键模块组成:信息收集、自我反思、任务推断、技能策划、动作规划和记忆。这些模块协同工作,使......    阅读全文

1 Julius AI用于数据可视化和分析的 AI 数据分析师Julius 是一位强大的 AI 数据分析师,可帮助您分析和可视化数据。您可以与数据聊天、创建图表、构建预测模型等。只需上传您的数据,然后向 Julius 询问见解或指示其执行特定的分析或可视化。特征:分析和可视化数据与数......    阅读全文

除了学习AI理论知识,产品经理能熟练使用 AI 工具,也是竞争优势的关键要素。如果想显著提升工作效率和决策质量,应该把哪些AI工具放进自己的「工具箱」呢?应该在什么场景下用AI重构自己的工作流呢?产品经理们!快读这篇文章!不仅有详细的分类工具清单,还列举了 PM (产品经理) 可以使用......    阅读全文

时间序列预测(Time-series Forecasting)对众多行业都至关重要,包括健康、能源、商业、气候等。在不同预测长度上的准确性,对这些领域中服务短期和长期的规划和决策需求来说极其重要。例如,在疫情爆发这种公共卫生的紧急情况下,预测一到四周内的感染病例和死亡人数对于有效分配医......    阅读全文

Dimebots 是一系列自主独立的微型机器人,它们小如一美分硬币大小,重量不足5g(4.1g),是世界上最小的机器人之一。硬件主要器件及原理Microchip/Atmel ATTiny1614 & Texas Instruments DRV8837ATTiny1614,它采用 14 ......    阅读全文

在讨论人工智能先进技术或产品时,我们常常会看到一个专业术语:SOTA。当某项产品或技术被打上SOTA关键词时,似乎就能自带光环。话说回来,到底什么是SOTA?它和人工智能有着怎样的关联?如何才能成为某个领域的SOTA?如果你也好奇,下面我们一起看瞧瞧。什么是SOTA?在业内,SOTA普......    阅读全文