分类 大语言模型 下的文章

今天,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B......    阅读全文

微软发布小巧的语言模型Phi-4,专注于复杂数学推理。该模型通过改进的数据处理方法、高质量的合成数据集与有机数据管理及训练创新,展现出卓越性能。Phi-4不仅在数学问题解答上表现出色,而且持续推动模型尺寸与质量的新边界。体验地址与最新技术报告已附。   阅读全文

谷歌发布Gemini 2.0,带来三个AI代理新突破。包括增强现实功能的Project Astra,探索人机交互未来的Project Mariner,以及助力开发人员的Jules。还有游戏代理和具身智能等领域的探索。这些代理旨在开启AI智能体时代的新篇章。   阅读全文

腾讯开源了强大的视频生成模型HunyuanVideo(混元),具备130亿参数与多项先进技术特性。混元能够生成高还原度文本语义的视频,具备物理模拟能力,色彩、对比度等表现优异,且能生成带音乐的视频。文章还介绍了混元的架构、技术特点和使用效果。   阅读全文

斯坦福大学李飞飞教授带领World Labs团队推出AI“造物主”,能从单张图片生成可交互的3D物理场景!实时渲染、视角自由控制,突破生成式AI的新维度。体验三维相机效果,走进世界名画,与其他AI工具无缝衔接,提升创作效率!   阅读全文

英伟达最新开源的BioNeMo框架引领AI辅助药物研发进入超算时代。该框架集成了AI模型运算、海量数据分析及新药开发流程,显著提升了制药行业的研发效率。通过BioNeMo平台,制药公司、生物科技创新者和AI研究人员能更快速地推进药物研发工作。   阅读全文

百图生科发布全球最大生命科学基础模型xTrimo V3,具备2100亿参数与多模态整合能力。此模型能解码生命语言,为药物研发、精准医疗等领域提供支持,并在基因进化、合成生物学和生命设计等领域带来新突破。模型应用广泛,包括精准医疗、药物研发、创新创造及合成生物学等。   阅读全文

大型语言模型(LLM)在众多语言任务和NLP基准测试中表现出卓越能力。适配LLM的产品用例正在增加。这篇博客指导小型AI产品团队如何适配LLM。首先澄清LLM的术语,比较不同的适配方法,推荐一个循序渐进的流程图以确定适合用例的正确方法。最后讨论微调的技术和策略,包括数据集的管理和调试。   阅读全文

谷歌最新AI模型HeAR通过声音检测疾病,利用Google Cloud API向研究人员开放。该模型通过分析咳嗽和呼吸声诊断疾病,表现卓越,尤其对数据匮乏的医疗保健研究具有重要意义。潜在应用领域广泛,可增强现有模型进行早期疾病检测。   阅读全文

智谱AI推出开源视频生成模型CogVideoX-2B,支持快速推理和微调。模型基于3D VAE和专家Transformer架构,可生成连贯长视频。具有高效视频压缩方法,适用于大规模视频处理。团队持续探索新技术,致力于训练更大更强模型,生成更长、更高质量视频。期待更多开发者及企业参与开发......    阅读全文

Stability AI发布Stable Fast 3D开源项目,采用先进图形算法和优化技术,提升三维建模和渲染的速度与质量。去光照影响、UV展开与材质预测、网格提取和优化等技术细节,为游戏开发、动画制作及虚拟现实等领域提供高效解决方案。项目已发布Demo和详细论文。   阅读全文

谷歌DeepMind开源轻量级模型Gemma 2 2B,性能超越GPT-3.5等大模型,可在手机、PC等终端设备上快速运行。Gemma Scope增强模型可解释性,ShieldGemma过滤有害内容。Gemma 2 2B提供灵活的部署方式,适用于研究和商业应用。   阅读全文

本文介绍了一种名为DreamCar的新方法,能够从有限数量的图像中重建高质量的3D汽车模型。通过利用Car360数据集和多种技术,包括图像分割、姿态估算、逐步由粗到细的几何重建、纹理优化等,DreamCar显著优于现有方法。代码已开源。   阅读全文

上海交通大学联合退格数字研发基于扩散模型的开源换发AI技术Stable-Hair,采用双阶段设计,实现精准移植目标发型并保持源图身份特征。通过全新Latent ControlNet结构,解决颜色不一致问题,超越现有方法。Stable-Hair支持跨域发型转移,更多细节与特性请访问官网及代码仓库了解。   阅读全文

Traini是一款创新的AI狗语翻译器,实现跨物种沟通。它不仅能翻译狗狗的语言,包括叫声、面部表情及身体行为,还能为宠物提供医疗诊断及训练指导。创始人孙邻家基于多年创业经验及对宠物市场的洞察,成功将AI技术应用于宠物领域。Traini已收集超过10万只狗的声音和表情数据,翻译准确度达八......    阅读全文

Meta发布最新开源模型Llama 3.1,据称成为史上最强大的开源LLM模型。支持八种语言,推出首个开放源码前沿级AI模型Llama 3.1 405B。具有广泛的用途和领先的性能,可与市场上的顶级闭源模型相媲美。提供多种型号以满足不同需求,并配备安全工具以支持负责任的开发。   阅读全文

谷歌最新研究PH-LLM:个人健康大语言模型的详细介绍,从数据整合、上下文理解到专家知识集成。结合智能手表等智能设备数据,提供个性化健康建议、日常疾病问答等。注重隐私保护,并与医学专家合作验证建议准确性。   阅读全文