分类大语言模型下的文章

带你逛遍LLM 全世界

作者: zhexuan
时间: 2023-08-29
分类: 大语言模型
标签: None
阅读(903)
推荐(0)
评论(0)

跟随博主逛遍LLM的奇妙世界！探索LLM领域的发展历程，了解大型语言模型如ChatGPT、Google Bard和Llama 2的技术背景。跟随本文，你将领略LLM工具的优秀表现，掌握使用技巧，并深入了解编程、构建应用等方面的知识。同时，我们还将探讨LLM的训练方式、安全问题和开源模型等热点话题。阅读全文

Code Llama：文本生成代码模型

作者: zhexuan
时间: 2023-08-25
分类: 大语言模型
标签: Meta
阅读(1433)
推荐(0)
评论(0)

全球科技巨头Meta正式开源文本生成代码模型Code Llama，基于最强开源大语言模型Llama 2开发，支持多种主流编程语言，可商业化使用。Code Llama Python模型针对Python编程进行微调，还有针对自然文本指令微调的Code Llama - Instruct模型。阅读全文

Meta开源多模态翻译大模型SeamlessM4T

作者: zhexuan
时间: 2023-08-24
分类: 大语言模型
标签: Meta
阅读(1178)
推荐(0)
评论(0)

Meta开源多模态翻译大模型SeamlessM4T，支持100种语音、语言翻译，实现多模式翻译功能，突破传统翻译产品的限制，助力全球交流。模型开源地址已公布。阅读全文

大语言模型参数规模与显存大小的关系估算方法

作者: zhexuan
时间: 2023-08-22
分类: 大语言模型
标签: None
阅读(3335)
推荐(0)
评论(0)

本文介绍大语言模型参数规模与显存大小的关系估算方法，包括预训练、微调、推理三个阶段的显存消耗及估算方法。文章详细解释不同阶段显存消耗的因素，并提供简化的估算公式。通过实例说明如何根据显卡资源选择合适的模型规模，帮助读者更好地运行和体验大语言模型。阅读全文

Text2Cinemagraph：文本合成艺术化的动态照片

作者: zhexuan
时间: 2023-08-22
分类: 大语言模型
标签: None
阅读(1023)
推荐(0)
评论(0)

Snap与卡内基梅隆大学合作推出AI大模型Text2Cinemagraph，能将图片转化为动态艺术照片，并根据文本内容调整细节。以梵高星之夜为例，展示山前小溪流过的画面。官网、代码及演示链接附后。阅读全文

Llama模型初学者指南

作者: zhexuan
时间: 2023-08-20
分类: 大语言模型
标签: Llama
阅读(1341)
推荐(0)
评论(0)

Llama模型初学者指南，介绍Llama模型的工作原理、如何使用、与其他模型的区别及优势。涵盖模型安装、使用软件、性能比较等方面，是初学者入门Llama模型的理想指南。阅读全文

Stable Diffusion（稳定扩散）的原理解释

作者: zhexuan
时间: 2023-08-20
分类: 大语言模型
标签: Stable Diffusion
阅读(2012)
推荐(0)
评论(0)

本文介绍Stable Diffusion（稳定扩散）原理，解释文本到图像生成背后的技术。包括潜在扩散模型的训练、自编码器（VAE）、U-Net、文本编码器以及调度器的作用。文章还讨论了潜在扩散模型在各种创造性应用中的潜力，如文本到图像生成、图像到图像生成等。阅读全文

清华大学大语言模型(LLM)公开课

作者: zhexuan
时间: 2023-08-17
分类: 大语言模型
标签: None
阅读(2453)
推荐(0)
评论(0)

清华大学自然语言实验室推出的《大模型交叉研讨课》带你探索大模型的奥秘！课程由刘知远团队和助教授课，涵盖大模型基础知识、关键技术和跨学科应用。课程视频已上传B站，不容错过！阅读全文

LLaMA2相关资源

作者: zhexuan
时间: 2023-08-16
分类: 大语言模型
标签: Llama
阅读(993)
推荐(0)
评论(0)

LLaMA 2是Meta开发的大型语言模型，可用于研究和商业用途。这篇博客包含LLaMA 2的所有相关资源，如模型性能、如何使用和部署等。来自Meta官方的公告、不同大小的模型体验、研究工作、性能基准测试、如何写提示词、如何训练和部署LLaMA 2等都在讨论范围内。阅读全文

DoctorGPT：通过美国医师执照考试的开源模型

作者: zhexuan
时间: 2023-08-14
分类: 大语言模型
标签: None
阅读(888)
推荐(0)
评论(0)

DoctorGPT是一个可通过美国医师执照考试的大型语言模型开源项目，模拟医生提供医疗咨询。基于Meta的Llama2模型，经过医疗对话数据集训练，支持离线使用，保护隐私，适用于iOS、Android和Web平台。欢迎参与功能改进。阅读全文

StableCode：首个用于编码的生成式 AI 大模型

作者: zhexuan
时间: 2023-08-11
分类: 大语言模型
标签: None
阅读(1050)
推荐(0)
评论(0)

StableCode是Stability AI推出的首个用于编码的生成式AI大模型，旨在帮助程序员处理日常工作并为新手开发者提供学习工具。它通过三个不同版本的模型，包括基础模型、指令模型和长上下文窗口模型，来提高开发者的效率。StableCode可处理复杂的编程任务，并为编码新手提供理想的学习体验。阅读全文

AgentBench：AI Agent能力评测工具

作者: zhexuan
时间: 2023-08-10
分类: 大语言模型
标签: None
阅读(1271)
推荐(0)
评论(0)

AgentBench评测LLM作为AI Agent的能力，涵盖25个主流LLM在8个任务上的表现。结果显示商业模型表现优异，GPT-4成为佼佼者。文章解析LLM作为Agent的潜力与当前挑战，为未来发展提供见解。阅读全文

构建基于LLM的系统和产品的模式

作者: zhexuan
时间: 2023-08-07
分类: 大语言模型
标签: None
阅读(1128)
推荐(0)
评论(0)

这是一篇关于将大型语言模型（LLM）集成到系统和产品中的实用模式的文章。我们将以学术研究、行业资源和从业者的专业知识为基础，提炼出关键思想和实践。有七种关键模式，它们按照提高性能与降低成本/风险以及更接近数据与更接近用户的范围进行组织。这些模式包括评估、RAG、微调、缓存、护栏、防御性...... 阅读全文

IBM和NASA开源最大的地理空间AI基础模型

作者: zhexuan
时间: 2023-08-03
分类: 大语言模型
标签: None
阅读(954)
推荐(0)
评论(0)

IBM和NASA合作开放最大的地理空间AI基础模型，利用卫星地球数据构建，公开在Hugging Face上。此模型可加速卫星图像分析，促进科学发现，是IBM watsonx AI平台的一部分。模型开源，有望推动气候和地球科学领域创新。阅读全文

AudioCraft：开源的生成式AI音乐音频工具

作者: zhexuan
时间: 2023-08-03
分类: 大语言模型
标签: None
阅读(933)
推荐(0)
评论(0)

Meta 开源的AudioCraft是新一代生成式AI音乐音频工具，通过文本提示创作音乐和音频。包括MusicGen、AudioGen和EnCodec三大核心组件，可生成高质量音乐、音效和环境音效。适用于音乐家、游戏开发者、小企业主和教育工作者。轻松实现文本到音频的转换，提供丰富示例音频。阅读全文

岐黄问道：国内首个中医大模型

作者: zhexuan
时间: 2023-08-02
分类: 大语言模型
标签: None
阅读(2099)
推荐(0)
评论(0)

国内首个中医大模型发布，岐黄问道引领中医药传承创新。基于大数据与人工智能技术，融合千年中医智慧，为中医临床诊疗提供全新解决方案。自然语言交互模式，降低使用门槛，全面支持中医药发展。阅读全文

Llama 2: 令人难以置信的开源大语言模型

作者: zhexuan
时间: 2023-08-02
分类: 大语言模型
标签: Llama
阅读(885)
推荐(0)
评论(0)

Llama 2是LLaMA的延续，在数据质量、培训技术等方面进行了实质性的技术扩展。包含模型介绍、功能特点、安全评估等。具有强大的功能，可以微调以匹配不同的需求。提供开放的API和工具，支持开发者社区进行创新。阅读全文

Meta-Transformer：统一的多模态学习框架

作者: zhexuan
时间: 2023-07-31
分类: 大语言模型
标签: None
阅读(1479)
推荐(0)
评论(0)

Meta-Transformer：统一多模态学习框架，实现12种不同模态信息处理。通过统一学习无配对数据，为多模态领域带来新设计思路。强大的多模态感知理解能力，为未来多模态大模型发展提供工具。阅读全文

Llama 2的简易微调指南

作者: zhexuan
时间: 2023-07-30
分类: 大语言模型
标签: Llama
阅读(1162)
推荐(0)
评论(0)

本指南教你如何微调Llama 2模型，使其变成对话摘要器。文章包括使用Huggingface库微调模型、自定义数据微调教程等。此外，还提供模型下载、转换、运行推理等步骤的详细说明。阅读全文

OpenCat：开源四足机器人宠物框架

作者: zhexuan
时间: 2023-07-20
分类: 大语言模型
标签: 机器人
阅读(1998)
推荐(0)
评论(0)

OpenCat是开源四足机器人宠物框架，基于Arduino和Raspberry Pi打造。它支持复杂运动，可拓展感知和AI功能，部署在多种机器人上。OpenCat的目标是促进四足机器人研究、教育和开发，激励新人加入机器人人工智能领域革命。阅读全文

分类大语言模型下的文章

带你逛遍LLM 全世界

Code Llama：文本生成代码模型

Meta开源多模态翻译大模型SeamlessM4T

大语言模型参数规模与显存大小的关系估算方法

Text2Cinemagraph：文本合成艺术化的动态照片

Llama模型初学者指南

Stable Diffusion（稳定扩散）的原理解释

清华大学大语言模型(LLM)公开课

LLaMA2相关资源

DoctorGPT：通过美国医师执照考试的开源模型

StableCode：首个用于编码的生成式 AI 大模型

AgentBench：AI Agent能力评测工具

构建基于LLM的系统和产品的模式

IBM和NASA开源最大的地理空间AI基础模型

AudioCraft：开源的生成式AI音乐音频工具

岐黄问道：国内首个中医大模型

Llama 2: 令人难以置信的开源大语言模型

Meta-Transformer：统一的多模态学习框架

Llama 2的简易微调指南

OpenCat：开源四足机器人宠物框架

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅

分类 大语言模型 下的文章

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅

分类大语言模型下的文章