谷歌发布Gemini 2.5 Pro模型 作者: 新智元 时间: 2025-03-26 分类: 大语言模型 标签: Google 阅读(25) 推荐(0) 评论(0) 谷歌的全新模型Gemini 2.5 Pro,深夜上线了!Gemini 2.5 Pro是一个「思考」模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的Gemini的所有功能(长上下文、工具等)。它在多个基准测...... 阅读全文
谷歌Gemini Embedding问鼎最强嵌入模型 作者: IT之家 时间: 2025-03-11 分类: 大语言模型 标签: None 阅读(60) 推荐(0) 评论(0) 谷歌公司于 3 月 7 日发布博文,宣布推出 Gemini Embedding,是一款基于 AI 的文本处理模型,现已集成至 Gemini API。该模型在 Massive Text Embedding Benchmark(MTEB)中拔得头筹,超越了 Mistral、Cohere 和...... 阅读全文
国内首个短剧创作大模型免费开源 作者: AI解说大师知识库 时间: 2025-03-08 分类: 大语言模型 标签: None 阅读(62) 推荐(0) 评论(0) 当昆仑万维宣布开源全球首个AI短剧大模型SkyReels时,所有短剧圈人都在奔走相告:用一张RTX4090显卡就能生成带33种微表情的影视级画面,甚至支持百人同框不穿帮的场景。这意味着:一个人、一台电脑,就能搭建一套碾压传统团队的工业化短剧流水线。想知道这款AI短剧创作模型到底有多强?...... 阅读全文
阿里发布320亿参数推理模型QwQ-32B 作者: zhexuan 时间: 2025-03-07 分类: 大语言模型 标签: None 阅读(54) 推荐(0) 评论(0) 近日,阿里巴巴开源了号称"参数少性能猛"的推理模型QwQ-32B。这个仅有320亿参数的"小钢炮",在数学、编程等核心能力上追平了671亿参数的满血版DeepSeek-R1!更绝的是,竟然能让普通Mac秒变"AI超算中心",数学编程两开花,甚至能抢答高考压轴题!一、"参数少≠能力弱"的...... 阅读全文
Anthropic发布Claude 3.7 Sonnet 作者: zhexuan 时间: 2025-02-26 分类: 大语言模型 标签: None 阅读(61) 推荐(0) 评论(0) Anthropic于2025年2月25日深夜正式推出革命性AI模型——Claude 3.7 Sonnet。在官方博文中,Anthropic称,Claude 3.7 Sonnet是Anthropic迄今为止最智能的模型,也是市场上首个混合推理模型。作为该系列首款混合推理模型,其突破性架构...... 阅读全文
xAI发布Grok 3 作者: IT之家 时间: 2025-02-18 分类: 大语言模型 标签: None 阅读(92) 推荐(0) 评论(0) 今日中午 12 时,马斯克旗下人工智能公司 xAI 发布了其最新一代大模型 Grok 3。马斯克称,Grok 3 能力较前代产品 Grok 2 提升了“一个数量级”,并且是一款“追求极致真实”的 AI,即使这种真实有时会与“政治正确”相悖。在数学推理、科学逻辑推理和代码写作等能力表现方...... 阅读全文
谷歌发布Gemini 2.0 Pro 作者: zhexuan 时间: 2025-02-06 分类: 大语言模型 标签: Gemini 阅读(140) 推荐(0) 评论(0) 谷歌 DeepMind 宣布,Gemini 2.0 现已向所有人开放!本次发布带来了一系列更新和新模型,旨在为开发者和用户提供更强大、更快速、更具成本效益的 AI 体验,重点是推出了Gemini 2.0 Pro全新模型主要亮点Gemini 2.0 Flash 全面可用: 12 月发布的...... 阅读全文
微软开源最强小模型Phi-4 作者: AIGC开放社区 时间: 2025-01-09 分类: 大语言模型 标签: None 阅读(109) 推荐(0) 评论(0) 今天,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B...... 阅读全文
Veo 2:谷歌DeepMind发布的最强视频模型 作者: zhexuan 时间: 2024-12-18 分类: 大语言模型 标签: Veo 阅读(267) 推荐(0) 评论(0) Veo 2是Google DeepMind推出的强大视频生成模型,能根据文本或图像生成高质量视频。它支持4K分辨率,理解镜头控制,模拟物理现象和表情。在MovieGenBench基准测试中表现卓越。生成视频带有SynthID水印。 阅读全文
Phi-4:微软发布用于复杂推理的小语言模型 作者: zhexuan 时间: 2024-12-18 分类: 大语言模型 标签: None 阅读(163) 推荐(0) 评论(0) 微软发布小巧的语言模型Phi-4,专注于复杂数学推理。该模型通过改进的数据处理方法、高质量的合成数据集与有机数据管理及训练创新,展现出卓越性能。Phi-4不仅在数学问题解答上表现出色,而且持续推动模型尺寸与质量的新边界。体验地址与最新技术报告已附。 阅读全文
Gemini 2.0:面向AI智能体时代的AI大模型 作者: 猜想笔记 时间: 2024-12-13 分类: 大语言模型 标签: Gemini 阅读(161) 推荐(0) 评论(0) 谷歌发布Gemini 2.0,带来三个AI代理新突破。包括增强现实功能的Project Astra,探索人机交互未来的Project Mariner,以及助力开发人员的Jules。还有游戏代理和具身智能等领域的探索。这些代理旨在开启AI智能体时代的新篇章。 阅读全文
腾讯开源130亿参数视频模型HunyuanVideo 作者: AIGC开放社区 时间: 2024-12-04 分类: 大语言模型 标签: None 阅读(257) 推荐(0) 评论(0) 腾讯开源了强大的视频生成模型HunyuanVideo(混元),具备130亿参数与多项先进技术特性。混元能够生成高还原度文本语义的视频,具备物理模拟能力,色彩、对比度等表现优异,且能生成带音乐的视频。文章还介绍了混元的架构、技术特点和使用效果。 阅读全文
李飞飞「世界实验室」重磅推出 AI“造物主” 作者: AI寒武纪 时间: 2024-12-03 分类: 大语言模型 标签: None 阅读(245) 推荐(1) 评论(0) 斯坦福大学李飞飞教授带领World Labs团队推出AI“造物主”,能从单张图片生成可交互的3D物理场景!实时渲染、视角自由控制,突破生成式AI的新维度。体验三维相机效果,走进世界名画,与其他AI工具无缝衔接,提升创作效率! 阅读全文
英伟达开源AI制药框架BioNeMo 作者: AIbase基地 时间: 2024-11-22 分类: 大语言模型 标签: None 阅读(162) 推荐(0) 评论(0) 英伟达最新开源的BioNeMo框架引领AI辅助药物研发进入超算时代。该框架集成了AI模型运算、海量数据分析及新药开发流程,显著提升了制药行业的研发效率。通过BioNeMo平台,制药公司、生物科技创新者和AI研究人员能更快速地推进药物研发工作。 阅读全文
xTrimo:全球规模最大的生命科学基础模型 作者: 量子位 时间: 2024-11-07 分类: 大语言模型 标签: 生命科学 阅读(298) 推荐(0) 评论(0) 百图生科发布全球最大生命科学基础模型xTrimo V3,具备2100亿参数与多模态整合能力。此模型能解码生命语言,为药物研发、精准医疗等领域提供支持,并在基因进化、合成生物学和生命设计等领域带来新突破。模型应用广泛,包括精准医疗、药物研发、创新创造及合成生物学等。 阅读全文
Meta官方Llama微调指南 作者: 新智元 时间: 2024-08-27 分类: 大语言模型 标签: None 阅读(412) 推荐(0) 评论(0) 大型语言模型(LLM)在众多语言任务和NLP基准测试中表现出卓越能力。适配LLM的产品用例正在增加。这篇博客指导小型AI产品团队如何适配LLM。首先澄清LLM的术语,比较不同的适配方法,推荐一个循序渐进的流程图以确定适合用例的正确方法。最后讨论微调的技术和策略,包括数据集的管理和调试。 阅读全文
谷歌AI模型HeAR AI利用声音检测疾病 作者: IT之家 时间: 2024-08-20 分类: 大语言模型 标签: None 阅读(378) 推荐(0) 评论(0) 谷歌最新AI模型HeAR通过声音检测疾病,利用Google Cloud API向研究人员开放。该模型通过分析咳嗽和呼吸声诊断疾病,表现卓越,尤其对数据匮乏的医疗保健研究具有重要意义。潜在应用领域广泛,可增强现有模型进行早期疾病检测。 阅读全文
MiniCPM-V 2.6:端侧最强多模态模型 作者: Jack Cui 时间: 2024-08-09 分类: 大语言模型 标签: None 阅读(936) 推荐(0) 评论(0) MiniCPM-V 2.6:端侧最强多模态模型。仅8B参数,超越GPT-4V,端侧友好,支持单图、多图、视频理解,具备强大的复杂推理能力。体验在线demo,探索更多可能性。 阅读全文
CogVideoX-2B:智谱开源视频生成模型 作者: 智东西 时间: 2024-08-07 分类: 大语言模型 标签: None 阅读(570) 推荐(0) 评论(0) 智谱AI推出开源视频生成模型CogVideoX-2B,支持快速推理和微调。模型基于3D VAE和专家Transformer架构,可生成连贯长视频。具有高效视频压缩方法,适用于大规模视频处理。团队持续探索新技术,致力于训练更大更强模型,生成更长、更高质量视频。期待更多开发者及企业参与开发...... 阅读全文
Stability AI发布Stable Fast 3D开源项目 作者: 开源AI 时间: 2024-08-06 分类: 大语言模型 标签: None 阅读(431) 推荐(0) 评论(0) Stability AI发布Stable Fast 3D开源项目,采用先进图形算法和优化技术,提升三维建模和渲染的速度与质量。去光照影响、UV展开与材质预测、网格提取和优化等技术细节,为游戏开发、动画制作及虚拟现实等领域提供高效解决方案。项目已发布Demo和详细论文。 阅读全文