分类 大语言模型 下的文章

本文介绍了Hugging Face在2023年开源大模型之年的最新发展。文章详细阐述了预训练大语言模型的配方,包括模型架构、训练数据集、分词器、训练超参数和模型权重等。同时,回顾了2022年的模型竞争,介绍了开源模型家族和数据量与模型参数的平衡。文章还探讨了2023年小型大语言模型的崛......    阅读全文

回顾2023年“大模型元年”的发展历程,从年初的ChatGPT到大模型的各种技术创新和突破,带给大家无限的惊喜。这篇文章详细描述了这一年大模型的研究进展、新模型的发布、以及各大科技巨头在大模型领域的布局和成果。相信这篇回顾文章能让大家更加深入了解大模型的发展历程,并为未来的技术革新充满期待。   阅读全文

Mistral AI团队揭秘Mixtral-8x7B-MoE模型超强性能背后的秘密,解析MoE(混合专家)技术细节。跟随UP主@良睦路程序员,深入探究MoE网络架构,解读MoE与传统LLaMa架构的差异,以及MoE是否具备颠覆潜力。通过生动的生活化例子,帮助理解MoE工作原理,带你轻松......    阅读全文

澳大利亚悉尼科技大学科学家开发出便携式、非侵入性的人工智能系统DeWave,可解码脑电波并转化为文本。该系统有望帮助无法说话的人进行沟通,实现人与设备之间的无缝通信。DeWave采用大模型技术,表现超越现有方法,为脑部疾病患者提供交流帮助。   阅读全文

Mistral AI发布首个MoE开源模型Mixtral 8x7B,团队背景强大,包括Meta和DeepMind前研究人员。新模型Mixtral表现优异,超越GPT-3.5,开放权重可商用。一周内成为热门大模型创业公司。了解更多关于Mixtral 8x7B的详细信息,请访问官网。   阅读全文

微软在最新发布会上公布了其新一代的小模型Phi-2,具有出色的推理和语言理解能力。尽管参数规模仅为2.7B,但其性能在多个基准测试中已超越其他大型模型。微软展示了自己遥遥领先的基准测试结果,Phi-2在众多评估标准中表现优异,尤其是对比谷歌最新发布的大模型。   阅读全文

Google发布最新AI模型Gemini,开启全新AI时代。该模型具备多模态、高效运行等特点,可在各种设备上应用。Google CEO桑达尔·皮查伊亲自站台,称此为最大科学和工程努力之一。Gemini包括针对不同需求的多种型号,将显著增强开发人员和企业客户利用人工智能进行构建和扩展的能力。   阅读全文

上海交大与上海AI Lab发布RadFM:开源多模态医疗基础模型。该模型支持2D/3D放射影像输入,解决了医学领域基础模型构建的三大挑战。研究团队构建了目前最大规模的医疗多模态数据集MedMD,并提供了RadFM模型架构。该模型具有巨大的临床应用意义,支持三维数据处理、多图像输入和交错数据格式。   阅读全文

Pika Labs推出视频生成器Pika 1.0,采用先进AI模型生成和编辑三维动画、动漫、卡通和电影等视频。创始人Demi Guo和Chenlin Meng成功筹集到5500万美元融资,支持团队扩张和创新。新推出的Pika 1.0拥有更多功能并开放注册,致力于帮助非专业创作者实现创意表达。   阅读全文

《北京市人工智能行业大模型创新应用白皮书(2023年)》全面解析北京大模型应用创新情况。涵盖全球及国内大模型发展趋势、北京应用成果、行业应用案例等。白皮书揭示大模型重塑企业生产引擎的潜力,并探讨当前面临的挑战和未来发展方向。关注北京市大模型产业,解读政策,洞察市场趋势。   阅读全文

机器学习正在影响每个行业,训练大型语言模型(LLM)的成本成为关注的焦点。本文将深入探讨训练LLM的成本构成,包括硬件成本、模型架构、训练动态、效率优化等因素。同时,也将介绍一些降低训练成本的方法,如使用预训练模型、并行和分布式训练等。   阅读全文

OpenAI开发者大会:全球领先的AI技术盛会,聚焦OpenAI最新产品发布与技术创新。会议亮点包括GPT-4 Turbo、自定义GPT、DALL·E 3 API等重磅内容的发布,以及OpenAI Dev Day多项更新的深入探讨。与行业专家、企业代表共同见证AI技术的未来发展。   阅读全文

零一万物发布Yi系列开源大模型,包括Yi-34B和Yi-6B。Yi系列大模型在多项全球评测中取得第一,展现强大性能。团队针对数学方向展开研究,提出MammoTH大模型解决数学问题。Yi系列模型刷新了大模型的上下文窗口长度,可处理超长文本输入。零一万物坚定进军全球第一梯队目标。   阅读全文

Grok是xAI发布的全新AI大模型产品,具有强大的解决问题的能力并致力于构建造福全人类的人工智能工具。通过前沿技术实现大规模分布式训练,Grok能够回答其他AI无法解决的难题。目前为早期测试阶段,诚邀用户参与并提供反馈以共同改进。   阅读全文

Stable 3D让文本图片生成高质量3D模型成为可能!无需专业技能,轻松创建可编辑的3D模型,适用于Blender、Maya等主流平台。Stable AI还推出了Sky Replacer功能,一键替换图片天空,提供多种风格选择。适用于专业设计师、房地产销售等。Stable 3D预览版......    阅读全文

英伟达推出全新430亿参数大语言模型ChipNeMo,专门用于AI芯片设计。该模型可帮助团队完成芯片设计的各项任务,包括回答问题、文档总结和EDA工具脚本编写等。研究标志着将大型语言模型应用于半导体设计的复杂工作迈出了重要的一步。   阅读全文

智谱AI在CNCC上推出全自研第三代基座大模型ChatGLM3及相关系列产品,包括性能提升、多模态理解、智能体能力、Edge端侧模型及高效推理等功能。生成式AI助手智谱清言具备代码交互能力,并支持图像处理、数学计算等场景。   阅读全文

这篇文章详细介绍了AI视频生成的多种方式,包括文生视频、图生视频、视频生视频、AI Avatar+语音生成等,同时按产品阶段和可用维度分类解析。了解前沿技术如何应用于AI视频生成领域,深入了解各种产品特点和应用场景。附有多篇相关原文链接,不容错过。   阅读全文

Meta和INRIA联合开源数字水印产品Stable Signature,为AI生成的图片提供追溯和版权保护。Stable Signature生成的数字水印可抵抗裁剪、压缩等破坏性操作,并有助于追踪图片来源。微软、谷歌等科技巨头已应用此技术。   阅读全文