微软开源最强小模型Phi-4 作者: AIGC开放社区 时间: 2025-01-09 分类: 大语言模型 标签: None 阅读(36) 推荐(0) 评论(0) 今天,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B...... 阅读全文
Veo 2:谷歌DeepMind发布的最强视频模型 作者: zhexuan 时间: 2024-12-18 分类: 大语言模型 标签: Veo 阅读(125) 推荐(0) 评论(0) Veo 2是Google DeepMind推出的强大视频生成模型,能根据文本或图像生成高质量视频。它支持4K分辨率,理解镜头控制,模拟物理现象和表情。在MovieGenBench基准测试中表现卓越。生成视频带有SynthID水印。 阅读全文
Phi-4:微软发布用于复杂推理的小语言模型 作者: zhexuan 时间: 2024-12-18 分类: 大语言模型 标签: None 阅读(86) 推荐(0) 评论(0) 微软发布小巧的语言模型Phi-4,专注于复杂数学推理。该模型通过改进的数据处理方法、高质量的合成数据集与有机数据管理及训练创新,展现出卓越性能。Phi-4不仅在数学问题解答上表现出色,而且持续推动模型尺寸与质量的新边界。体验地址与最新技术报告已附。 阅读全文
Gemini 2.0:面向AI智能体时代的AI大模型 作者: 猜想笔记 时间: 2024-12-13 分类: 大语言模型 标签: Gemini 阅读(89) 推荐(0) 评论(0) 谷歌发布Gemini 2.0,带来三个AI代理新突破。包括增强现实功能的Project Astra,探索人机交互未来的Project Mariner,以及助力开发人员的Jules。还有游戏代理和具身智能等领域的探索。这些代理旨在开启AI智能体时代的新篇章。 阅读全文
腾讯开源130亿参数视频模型HunyuanVideo 作者: AIGC开放社区 时间: 2024-12-04 分类: 大语言模型 标签: None 阅读(134) 推荐(0) 评论(0) 腾讯开源了强大的视频生成模型HunyuanVideo(混元),具备130亿参数与多项先进技术特性。混元能够生成高还原度文本语义的视频,具备物理模拟能力,色彩、对比度等表现优异,且能生成带音乐的视频。文章还介绍了混元的架构、技术特点和使用效果。 阅读全文
李飞飞「世界实验室」重磅推出 AI“造物主” 作者: AI寒武纪 时间: 2024-12-03 分类: 大语言模型 标签: None 阅读(140) 推荐(1) 评论(0) 斯坦福大学李飞飞教授带领World Labs团队推出AI“造物主”,能从单张图片生成可交互的3D物理场景!实时渲染、视角自由控制,突破生成式AI的新维度。体验三维相机效果,走进世界名画,与其他AI工具无缝衔接,提升创作效率! 阅读全文
英伟达开源AI制药框架BioNeMo 作者: AIbase基地 时间: 2024-11-22 分类: 大语言模型 标签: None 阅读(84) 推荐(0) 评论(0) 英伟达最新开源的BioNeMo框架引领AI辅助药物研发进入超算时代。该框架集成了AI模型运算、海量数据分析及新药开发流程,显著提升了制药行业的研发效率。通过BioNeMo平台,制药公司、生物科技创新者和AI研究人员能更快速地推进药物研发工作。 阅读全文
xTrimo:全球规模最大的生命科学基础模型 作者: 量子位 时间: 2024-11-07 分类: 大语言模型 标签: 生命科学 阅读(176) 推荐(0) 评论(0) 百图生科发布全球最大生命科学基础模型xTrimo V3,具备2100亿参数与多模态整合能力。此模型能解码生命语言,为药物研发、精准医疗等领域提供支持,并在基因进化、合成生物学和生命设计等领域带来新突破。模型应用广泛,包括精准医疗、药物研发、创新创造及合成生物学等。 阅读全文
Meta官方Llama微调指南 作者: 新智元 时间: 2024-08-27 分类: 大语言模型 标签: None 阅读(313) 推荐(0) 评论(0) 大型语言模型(LLM)在众多语言任务和NLP基准测试中表现出卓越能力。适配LLM的产品用例正在增加。这篇博客指导小型AI产品团队如何适配LLM。首先澄清LLM的术语,比较不同的适配方法,推荐一个循序渐进的流程图以确定适合用例的正确方法。最后讨论微调的技术和策略,包括数据集的管理和调试。 阅读全文
谷歌AI模型HeAR AI利用声音检测疾病 作者: IT之家 时间: 2024-08-20 分类: 大语言模型 标签: None 阅读(290) 推荐(0) 评论(0) 谷歌最新AI模型HeAR通过声音检测疾病,利用Google Cloud API向研究人员开放。该模型通过分析咳嗽和呼吸声诊断疾病,表现卓越,尤其对数据匮乏的医疗保健研究具有重要意义。潜在应用领域广泛,可增强现有模型进行早期疾病检测。 阅读全文
MiniCPM-V 2.6:端侧最强多模态模型 作者: Jack Cui 时间: 2024-08-09 分类: 大语言模型 标签: None 阅读(781) 推荐(0) 评论(0) MiniCPM-V 2.6:端侧最强多模态模型。仅8B参数,超越GPT-4V,端侧友好,支持单图、多图、视频理解,具备强大的复杂推理能力。体验在线demo,探索更多可能性。 阅读全文
CogVideoX-2B:智谱开源视频生成模型 作者: 智东西 时间: 2024-08-07 分类: 大语言模型 标签: None 阅读(452) 推荐(0) 评论(0) 智谱AI推出开源视频生成模型CogVideoX-2B,支持快速推理和微调。模型基于3D VAE和专家Transformer架构,可生成连贯长视频。具有高效视频压缩方法,适用于大规模视频处理。团队持续探索新技术,致力于训练更大更强模型,生成更长、更高质量视频。期待更多开发者及企业参与开发...... 阅读全文
Stability AI发布Stable Fast 3D开源项目 作者: 开源AI 时间: 2024-08-06 分类: 大语言模型 标签: None 阅读(342) 推荐(0) 评论(0) Stability AI发布Stable Fast 3D开源项目,采用先进图形算法和优化技术,提升三维建模和渲染的速度与质量。去光照影响、UV展开与材质预测、网格提取和优化等技术细节,为游戏开发、动画制作及虚拟现实等领域提供高效解决方案。项目已发布Demo和详细论文。 阅读全文
谷歌开源小模型Gemma 2 2B 作者: 智东西 时间: 2024-08-05 分类: 大语言模型 标签: None 阅读(286) 推荐(0) 评论(0) 谷歌DeepMind开源轻量级模型Gemma 2 2B,性能超越GPT-3.5等大模型,可在手机、PC等终端设备上快速运行。Gemma Scope增强模型可解释性,ShieldGemma过滤有害内容。Gemma 2 2B提供灵活的部署方式,适用于研究和商业应用。 阅读全文
DreamCar:高质量的3D汽车模型 作者: PaperWeekly 时间: 2024-08-01 分类: 大语言模型 标签: None 阅读(237) 推荐(0) 评论(0) 本文介绍了一种名为DreamCar的新方法,能够从有限数量的图像中重建高质量的3D汽车模型。通过利用Car360数据集和多种技术,包括图像分割、姿态估算、逐步由粗到细的几何重建、纹理优化等,DreamCar显著优于现有方法。代码已开源。 阅读全文
Stable-Hair:开源换发AI技术 作者: AI面 时间: 2024-07-28 分类: 大语言模型 标签: None 阅读(605) 推荐(0) 评论(0) 上海交通大学联合退格数字研发基于扩散模型的开源换发AI技术Stable-Hair,采用双阶段设计,实现精准移植目标发型并保持源图身份特征。通过全新Latent ControlNet结构,解决颜色不一致问题,超越现有方法。Stable-Hair支持跨域发型转移,更多细节与特性请访问官网及代码仓库了解。 阅读全文
Traini:AI狗语翻译器 作者: 智能涌现 时间: 2024-07-26 分类: 大语言模型 标签: None 阅读(1484) 推荐(0) 评论(0) Traini是一款创新的AI狗语翻译器,实现跨物种沟通。它不仅能翻译狗狗的语言,包括叫声、面部表情及身体行为,还能为宠物提供医疗诊断及训练指导。创始人孙邻家基于多年创业经验及对宠物市场的洞察,成功将AI技术应用于宠物领域。Traini已收集超过10万只狗的声音和表情数据,翻译准确度达八...... 阅读全文
LivePortrait:可控人像视频生成框架 作者: 快手 时间: 2024-07-24 分类: 大语言模型 标签: 快手 阅读(483) 推荐(0) 评论(0) LivePortrait:高效可控人像视频生成框架,利用隐式关键点技术实现表情与姿态迁移,生成高质量动态视频。支持多种风格与分辨率,具备快速生成与强大泛化能力。 阅读全文
Meta发布最强开源模型Llama 3.1 作者: AI信息Gap 时间: 2024-07-23 分类: 大语言模型 标签: Meta 阅读(280) 推荐(0) 评论(0) Meta发布最新开源模型Llama 3.1,据称成为史上最强大的开源LLM模型。支持八种语言,推出首个开放源码前沿级AI模型Llama 3.1 405B。具有广泛的用途和领先的性能,可与市场上的顶级闭源模型相媲美。提供多种型号以满足不同需求,并配备安全工具以支持负责任的开发。 阅读全文
PH-LLM:专用于个人健康的大语言模型 作者: AIGC开放社区 时间: 2024-07-21 分类: 大语言模型 标签: None 阅读(361) 推荐(0) 评论(0) 谷歌最新研究PH-LLM:个人健康大语言模型的详细介绍,从数据整合、上下文理解到专家知识集成。结合智能手表等智能设备数据,提供个性化健康建议、日常疾病问答等。注重隐私保护,并与医学专家合作验证建议准确性。 阅读全文