分类 大语言模型 下的文章

谷歌的全新模型Gemini 2.5 Pro,深夜上线了!Gemini 2.5 Pro是一个「思考」模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的Gemini的所有功能(长上下文、工具等)。它在多个基准测......    阅读全文

谷歌公司于 3 月 7 日发布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本处理模型,现已集成至 Gemini API。该模型在 Massive Text Embedding Benchmark(MTEB)中拔得头筹,超越了 Mistral、Cohere 和......    阅读全文

当昆仑万维宣布开源全球首个AI短剧大模型SkyReels时,所有短剧圈人都在奔走相告:用一张RTX4090显卡就能生成带33种微表情的影视级画面,甚至支持百人同框不穿帮的场景。这意味着:一个人、一台电脑,就能搭建一套碾压传统团队的工业化短剧流水线。想知道这款AI短剧创作模型到底有多强?......    阅读全文

近日,阿里巴巴开源了号称"参数少性能猛"的推理模型QwQ-32B。这个仅有320亿参数的"小钢炮",在数学、编程等核心能力上追平了671亿参数的满血版DeepSeek-R1!更绝的是,竟然能让普通Mac秒变"AI超算中心",数学编程两开花,甚至能抢答高考压轴题!一、"参数少≠能力弱"的......    阅读全文

Anthropic于2025年2月25日深夜正式推出革命性AI模型——Claude 3.7 Sonnet。在官方博文中,Anthropic称,Claude 3.7 Sonnet是Anthropic迄今为止最智能的模型,也是市场上首个混合推理模型。作为该系列首款混合推理模型,其突破性架构......    阅读全文

今日中午 12 时,马斯克旗下人工智能公司 xAI 发布了其最新一代大模型 Grok 3。马斯克称,Grok 3 能力较前代产品 Grok 2 提升了“一个数量级”,并且是一款“追求极致真实”的 AI,即使这种真实有时会与“政治正确”相悖。在数学推理、科学逻辑推理和代码写作等能力表现方......    阅读全文

谷歌 DeepMind 宣布,Gemini 2.0 现已向所有人开放!本次发布带来了一系列更新和新模型,旨在为开发者和用户提供更强大、更快速、更具成本效益的 AI 体验,重点是推出了Gemini 2.0 Pro全新模型主要亮点Gemini 2.0 Flash 全面可用: 12 月发布的......    阅读全文

今天,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B......    阅读全文

微软发布小巧的语言模型Phi-4,专注于复杂数学推理。该模型通过改进的数据处理方法、高质量的合成数据集与有机数据管理及训练创新,展现出卓越性能。Phi-4不仅在数学问题解答上表现出色,而且持续推动模型尺寸与质量的新边界。体验地址与最新技术报告已附。   阅读全文

谷歌发布Gemini 2.0,带来三个AI代理新突破。包括增强现实功能的Project Astra,探索人机交互未来的Project Mariner,以及助力开发人员的Jules。还有游戏代理和具身智能等领域的探索。这些代理旨在开启AI智能体时代的新篇章。   阅读全文

腾讯开源了强大的视频生成模型HunyuanVideo(混元),具备130亿参数与多项先进技术特性。混元能够生成高还原度文本语义的视频,具备物理模拟能力,色彩、对比度等表现优异,且能生成带音乐的视频。文章还介绍了混元的架构、技术特点和使用效果。   阅读全文

斯坦福大学李飞飞教授带领World Labs团队推出AI“造物主”,能从单张图片生成可交互的3D物理场景!实时渲染、视角自由控制,突破生成式AI的新维度。体验三维相机效果,走进世界名画,与其他AI工具无缝衔接,提升创作效率!   阅读全文

英伟达最新开源的BioNeMo框架引领AI辅助药物研发进入超算时代。该框架集成了AI模型运算、海量数据分析及新药开发流程,显著提升了制药行业的研发效率。通过BioNeMo平台,制药公司、生物科技创新者和AI研究人员能更快速地推进药物研发工作。   阅读全文

百图生科发布全球最大生命科学基础模型xTrimo V3,具备2100亿参数与多模态整合能力。此模型能解码生命语言,为药物研发、精准医疗等领域提供支持,并在基因进化、合成生物学和生命设计等领域带来新突破。模型应用广泛,包括精准医疗、药物研发、创新创造及合成生物学等。   阅读全文

大型语言模型(LLM)在众多语言任务和NLP基准测试中表现出卓越能力。适配LLM的产品用例正在增加。这篇博客指导小型AI产品团队如何适配LLM。首先澄清LLM的术语,比较不同的适配方法,推荐一个循序渐进的流程图以确定适合用例的正确方法。最后讨论微调的技术和策略,包括数据集的管理和调试。   阅读全文

谷歌最新AI模型HeAR通过声音检测疾病,利用Google Cloud API向研究人员开放。该模型通过分析咳嗽和呼吸声诊断疾病,表现卓越,尤其对数据匮乏的医疗保健研究具有重要意义。潜在应用领域广泛,可增强现有模型进行早期疾病检测。   阅读全文

智谱AI推出开源视频生成模型CogVideoX-2B,支持快速推理和微调。模型基于3D VAE和专家Transformer架构,可生成连贯长视频。具有高效视频压缩方法,适用于大规模视频处理。团队持续探索新技术,致力于训练更大更强模型,生成更长、更高质量视频。期待更多开发者及企业参与开发......    阅读全文

Stability AI发布Stable Fast 3D开源项目,采用先进图形算法和优化技术,提升三维建模和渲染的速度与质量。去光照影响、UV展开与材质预测、网格提取和优化等技术细节,为游戏开发、动画制作及虚拟现实等领域提供高效解决方案。项目已发布Demo和详细论文。   阅读全文