分类大语言模型下的文章

Anthropic推出新一代Claude 3系列模型

作者: AI寒武纪
时间: 2024-03-06
分类: 大语言模型
标签: None
阅读(788)
推荐(0)
评论(0)

Anthropic推出新一代Claude 3系列模型，包含Claude 3 Haiku、Claude 3 Sonnet和最高阶的Claude 3 Opus。它们树立了新的认知任务处理标准，具有智能新标准、实时结果、强大视觉能力等特点。Claude 3 Opus在多个AI系统评估基准上表...... 阅读全文

阿里发布AI图生视频模型EMO

作者: 钛媒体
时间: 2024-03-01
分类: 大语言模型
标签: None
阅读(811)
推荐(0)
评论(0)

阿里巴巴发布AI图生视频模型EMO，以图片和音频为输入，生成会说话唱歌的AI视频，实现无缝对接的动态小视频，最长时间可达1分30秒。表情到位，语音图像对应精准，技术革新引领AI视频生成新纪元。阅读全文

Stable Diffusion 3：强大的文生图模型

作者: 机器之心
时间: 2024-02-24
分类: 大语言模型
标签: None
阅读(1011)
推荐(0)
评论(0)

Stable Diffusion 3是Stability AI推出的最新文生图模型，相比前版本有重大改进，支持多主题提示，文字书写效果更佳。生成图像质量更高，为创作者带来革命性的体验。团队采取安全措施，防止滥用。提交申请即可尝鲜。阅读全文

Gemma：谷歌推出全新的最强开源大语言模型

作者: 机器之心
时间: 2024-02-22
分类: 大语言模型
标签: Google
阅读(1273)
推荐(0)
评论(0)

谷歌推出全新的开源大语言模型系列——Gemma。该模型轻量级且免费可用，允许商用，并在关键基准测试中表现优异。Gemma提供预训练和指令微调版本，可通过Kaggle、Colab Notebook或Google Cloud访问。模型支持多种语言，并提供不同尺寸以满足各种计算限制和应用程序需求。阅读全文

SORA：OpenAI跨时代的文本生成视频模型

作者: 智东西
时间: 2024-02-16
分类: OpenAI,大语言模型
标签: SORA
阅读(916)
推荐(0)
评论(0)

OpenAI推出全新文生视频大模型Sora，能根据提示词生成高质量视频，呈现惊艳视觉效果。Sora具备深刻文本理解、多镜头创建、细节处理等多项亮点，并支持图像生成、静止图像转视频等功能。业内专家热议其影响，周鸿祎称Sora加速AGI实现，贾扬清分享行业趋势观点。了解更多关于Sora的信...... 阅读全文

AlphaGeometry：几何定理证明系统

作者: DeepMind
时间: 2024-01-22
分类: 大语言模型
标签: None
阅读(1491)
推荐(0)
评论(0)

AlphaGeometry：革命性的几何定理证明系统。通过结合神经语言模型和符号推理引擎，该系统实现了几何定理的高效自动证明。在解决奥林匹克级别问题的测试中，其表现超越先前最佳方法，接近国际数学奥林匹克竞赛金牌选手水平。探索其工作原理及应用前景，深入理解AlphaGeometry如何引...... 阅读全文

Suno.ai：音频领域的内容协同创作工具

作者: zhexuan
时间: 2024-01-22
分类: 大语言模型
标签: None
阅读(1170)
推荐(0)
评论(0)

Suno.ai：无需乐理与乐器，简易创作音乐的神奇工具。通过AI技术，只需提示词即可生成伴奏和人声音乐，自定义歌词、风格和歌名。与微软Copilot合作，拓展音乐创作可能性。Suno创建的Bark模型能生成多语言高度逼真的语音及其他音频。探索音乐与语音的无限可能。阅读全文

Hugging Face：2023开源大模型之年

作者: Hugging Face
时间: 2023-12-31
分类: 大语言模型
标签: Hugging Face
阅读(961)
推荐(0)
评论(0)

本文介绍了Hugging Face在2023年开源大模型之年的最新发展。文章详细阐述了预训练大语言模型的配方，包括模型架构、训练数据集、分词器、训练超参数和模型权重等。同时，回顾了2022年的模型竞争，介绍了开源模型家族和数据量与模型参数的平衡。文章还探讨了2023年小型大语言模型的崛...... 阅读全文

2023“大模型元年” 回顾这一年的「大模型之战」

作者: AINLPer
时间: 2023-12-30
分类: 大语言模型
标签: None
阅读(1924)
推荐(0)
评论(0)

回顾2023年“大模型元年”的发展历程，从年初的ChatGPT到大模型的各种技术创新和突破，带给大家无限的惊喜。这篇文章详细描述了这一年大模型的研究进展、新模型的发布、以及各大科技巨头在大模型领域的布局和成果。相信这篇回顾文章能让大家更加深入了解大模型的发展历程，并为未来的技术革新充满期待。阅读全文

MoE实现细节

作者: ShowMeAI
时间: 2023-12-19
分类: 大语言模型
标签: None
阅读(1234)
推荐(0)
评论(0)

Mistral AI团队揭秘Mixtral-8x7B-MoE模型超强性能背后的秘密，解析MoE（混合专家）技术细节。跟随UP主@良睦路程序员，深入探究MoE网络架构，解读MoE与传统LLaMa架构的差异，以及MoE是否具备颠覆潜力。通过生动的生活化例子，帮助理解MoE工作原理，带你轻松...... 阅读全文

DeWave：用大模型解读脑电波并翻译成文本

作者: 量子位
时间: 2023-12-19
分类: 大语言模型
标签: None
阅读(1178)
推荐(0)
评论(0)

澳大利亚悉尼科技大学科学家开发出便携式、非侵入性的人工智能系统DeWave，可解码脑电波并转化为文本。该系统有望帮助无法说话的人进行沟通，实现人与设备之间的无缝通信。DeWave采用大模型技术，表现超越现有方法，为脑部疾病患者提供交流帮助。阅读全文

Mistral AI发布首个MoE开源模型 Mixtral 8x7B

作者: Founder Park
时间: 2023-12-14
分类: 大语言模型
标签: None
阅读(905)
推荐(0)
评论(0)

Mistral AI发布首个MoE开源模型Mixtral 8x7B，团队背景强大，包括Meta和DeepMind前研究人员。新模型Mixtral表现优异，超越GPT-3.5，开放权重可商用。一周内成为热门大模型创业公司。了解更多关于Mixtral 8x7B的详细信息，请访问官网。阅读全文

微软发布2.7B小模型Phi-2

作者: 微软
时间: 2023-12-14
分类: 大语言模型
标签: None
阅读(950)
推荐(0)
评论(0)

微软在最新发布会上公布了其新一代的小模型Phi-2，具有出色的推理和语言理解能力。尽管参数规模仅为2.7B，但其性能在多个基准测试中已超越其他大型模型。微软展示了自己遥遥领先的基准测试结果，Phi-2在众多评估标准中表现优异，尤其是对比谷歌最新发布的大模型。阅读全文

Google发布最强AI模型Gemini

作者: CSDN
时间: 2023-12-07
分类: 大语言模型
标签: Google
阅读(1185)
推荐(0)
评论(0)

Google发布最新AI模型Gemini，开启全新AI时代。该模型具备多模态、高效运行等特点，可在各种设备上应用。Google CEO桑达尔·皮查伊亲自站台，称此为最大科学和工程努力之一。Gemini包括针对不同需求的多种型号，将显著增强开发人员和企业客户利用人工智能进行构建和扩展的能力。阅读全文

RadFM：开源多模态医疗基础模型

作者: 机器之心
时间: 2023-12-04
分类: 大语言模型
标签: None
阅读(1917)
推荐(0)
评论(0)

上海交大与上海AI Lab发布RadFM：开源多模态医疗基础模型。该模型支持2D/3D放射影像输入，解决了医学领域基础模型构建的三大挑战。研究团队构建了目前最大规模的医疗多模态数据集MedMD，并提供了RadFM模型架构。该模型具有巨大的临床应用意义，支持三维数据处理、多图像输入和交错数据格式。阅读全文

Pika Labs推出视频生成器Pika 1.0

作者: Pika
时间: 2023-11-30
分类: 大语言模型
标签: None
阅读(1049)
推荐(0)
评论(0)

Pika Labs推出视频生成器Pika 1.0，采用先进AI模型生成和编辑三维动画、动漫、卡通和电影等视频。创始人Demi Guo和Chenlin Meng成功筹集到5500万美元融资，支持团队扩张和创新。新推出的Pika 1.0拥有更多功能并开放注册，致力于帮助非专业创作者实现创意表达。阅读全文

北京市人工智能行业大模型创新应用白皮书

作者: 北京市科学技术委员会
时间: 2023-11-29
分类: 大语言模型,AI行业
标签: None
阅读(951)
推荐(0)
评论(0)

《北京市人工智能行业大模型创新应用白皮书（2023年）》全面解析北京大模型应用创新情况。涵盖全球及国内大模型发展趋势、北京应用成果、行业应用案例等。白皮书揭示大模型重塑企业生产引擎的潜力，并探讨当前面临的挑战和未来发展方向。关注北京市大模型产业，解读政策，洞察市场趋势。阅读全文

训练一个大型语言模型需要多少钱

作者: Harper Carroll
时间: 2023-11-27
分类: 大语言模型
标签: None
阅读(1355)
推荐(0)
评论(0)

机器学习正在影响每个行业，训练大型语言模型（LLM）的成本成为关注的焦点。本文将深入探讨训练LLM的成本构成，包括硬件成本、模型架构、训练动态、效率优化等因素。同时，也将介绍一些降低训练成本的方法，如使用预训练模型、并行和分布式训练等。阅读全文

Stability开源视频大模型Stable Video Diffusion

作者: Stability AI
时间: 2023-11-22
分类: 大语言模型
标签: None
阅读(906)
推荐(0)
评论(0)

Stability AI发布最新视频生成大模型Stable Video Diffusion，它能通过现有图片生成视频。该模型分为SVD和SVD-XT，可生成高质量视频。目前处于研究预览阶段，使用需遵守特定条款。阅读全文

OpenAI开发者大会

作者: OpenAI
时间: 2023-11-07
分类: OpenAI,大语言模型
标签: DevDay
阅读(127574)
推荐(32)
评论(23)

OpenAI开发者大会：全球领先的AI技术盛会，聚焦OpenAI最新产品发布与技术创新。会议亮点包括GPT-4 Turbo、自定义GPT、DALL·E 3 API等重磅内容的发布，以及OpenAI Dev Day多项更新的深入探讨。与行业专家、企业代表共同见证AI技术的未来发展。阅读全文

分类大语言模型下的文章

Anthropic推出新一代Claude 3系列模型

阿里发布AI图生视频模型EMO

Stable Diffusion 3：强大的文生图模型

Gemma：谷歌推出全新的最强开源大语言模型

SORA：OpenAI跨时代的文本生成视频模型

AlphaGeometry：几何定理证明系统

Suno.ai：音频领域的内容协同创作工具

Hugging Face：2023开源大模型之年

2023“大模型元年” 回顾这一年的「大模型之战」

MoE实现细节

DeWave：用大模型解读脑电波并翻译成文本

Mistral AI发布首个MoE开源模型 Mixtral 8x7B

微软发布2.7B小模型Phi-2

Google发布最强AI模型Gemini

RadFM：开源多模态医疗基础模型

Pika Labs推出视频生成器Pika 1.0

北京市人工智能行业大模型创新应用白皮书

训练一个大型语言模型需要多少钱

Stability开源视频大模型Stable Video Diffusion

OpenAI开发者大会

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅

分类 大语言模型 下的文章

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅

分类大语言模型下的文章