带你逛遍LLM 全世界 作者: zhexuan 时间: 2023-08-29 分类: 大语言模型 标签: None 阅读(568) 推荐(0) 评论(0) 跟随博主逛遍LLM的奇妙世界!探索LLM领域的发展历程,了解大型语言模型如ChatGPT、Google Bard和Llama 2的技术背景。跟随本文,你将领略LLM工具的优秀表现,掌握使用技巧,并深入了解编程、构建应用等方面的知识。同时,我们还将探讨LLM的训练方式、安全问题和开源模型等热点话题。 阅读全文
Code Llama:文本生成代码模型 作者: zhexuan 时间: 2023-08-25 分类: 大语言模型 标签: Meta 阅读(571) 推荐(0) 评论(0) 全球科技巨头Meta正式开源文本生成代码模型Code Llama,基于最强开源大语言模型Llama 2开发,支持多种主流编程语言,可商业化使用。Code Llama Python模型针对Python编程进行微调,还有针对自然文本指令微调的Code Llama - Instruct模型。 阅读全文
Meta开源多模态翻译大模型SeamlessM4T 作者: zhexuan 时间: 2023-08-24 分类: 大语言模型 标签: Meta 阅读(736) 推荐(0) 评论(0) Meta开源多模态翻译大模型SeamlessM4T,支持100种语音、语言翻译,实现多模式翻译功能,突破传统翻译产品的限制,助力全球交流。模型开源地址已公布。 阅读全文
大语言模型参数规模与显存大小的关系估算方法 作者: zhexuan 时间: 2023-08-22 分类: 大语言模型 标签: None 阅读(2535) 推荐(0) 评论(0) 本文介绍大语言模型参数规模与显存大小的关系估算方法,包括预训练、微调、推理三个阶段的显存消耗及估算方法。文章详细解释不同阶段显存消耗的因素,并提供简化的估算公式。通过实例说明如何根据显卡资源选择合适的模型规模,帮助读者更好地运行和体验大语言模型。 阅读全文
Text2Cinemagraph:文本合成艺术化的动态照片 作者: zhexuan 时间: 2023-08-22 分类: 大语言模型 标签: None 阅读(668) 推荐(0) 评论(0) Snap与卡内基梅隆大学合作推出AI大模型Text2Cinemagraph,能将图片转化为动态艺术照片,并根据文本内容调整细节。以梵高星之夜为例,展示山前小溪流过的画面。官网、代码及演示链接附后。 阅读全文
Llama模型初学者指南 作者: zhexuan 时间: 2023-08-20 分类: 大语言模型 标签: Llama 阅读(838) 推荐(0) 评论(0) Llama模型初学者指南,介绍Llama模型的工作原理、如何使用、与其他模型的区别及优势。涵盖模型安装、使用软件、性能比较等方面,是初学者入门Llama模型的理想指南。 阅读全文
Stable Diffusion(稳定扩散)的原理解释 作者: zhexuan 时间: 2023-08-20 分类: 大语言模型 标签: Stable Diffusion 阅读(1090) 推荐(0) 评论(0) 本文介绍Stable Diffusion(稳定扩散)原理,解释文本到图像生成背后的技术。包括潜在扩散模型的训练、自编码器(VAE)、U-Net、文本编码器以及调度器的作用。文章还讨论了潜在扩散模型在各种创造性应用中的潜力,如文本到图像生成、图像到图像生成等。 阅读全文
清华大学大语言模型(LLM)公开课 作者: zhexuan 时间: 2023-08-17 分类: 大语言模型 标签: None 阅读(1829) 推荐(0) 评论(0) 清华大学自然语言实验室推出的《大模型交叉研讨课》带你探索大模型的奥秘!课程由刘知远团队和助教授课,涵盖大模型基础知识、关键技术和跨学科应用。课程视频已上传B站,不容错过! 阅读全文
LLaMA2相关资源 作者: zhexuan 时间: 2023-08-16 分类: 大语言模型 标签: Llama 阅读(605) 推荐(0) 评论(0) LLaMA 2是Meta开发的大型语言模型,可用于研究和商业用途。这篇博客包含LLaMA 2的所有相关资源,如模型性能、如何使用和部署等。来自Meta官方的公告、不同大小的模型体验、研究工作、性能基准测试、如何写提示词、如何训练和部署LLaMA 2等都在讨论范围内。 阅读全文
DoctorGPT:通过美国医师执照考试的开源模型 作者: zhexuan 时间: 2023-08-14 分类: 大语言模型 标签: None 阅读(556) 推荐(0) 评论(0) DoctorGPT是一个可通过美国医师执照考试的大型语言模型开源项目,模拟医生提供医疗咨询。基于Meta的Llama2模型,经过医疗对话数据集训练,支持离线使用,保护隐私,适用于iOS、Android和Web平台。欢迎参与功能改进。 阅读全文
StableCode:首个用于编码的生成式 AI 大模型 作者: zhexuan 时间: 2023-08-11 分类: 大语言模型 标签: None 阅读(685) 推荐(0) 评论(0) StableCode是Stability AI推出的首个用于编码的生成式AI大模型,旨在帮助程序员处理日常工作并为新手开发者提供学习工具。它通过三个不同版本的模型,包括基础模型、指令模型和长上下文窗口模型,来提高开发者的效率。StableCode可处理复杂的编程任务,并为编码新手提供理想的学习体验。 阅读全文
AgentBench:AI Agent能力评测工具 作者: zhexuan 时间: 2023-08-10 分类: 大语言模型 标签: None 阅读(730) 推荐(0) 评论(0) AgentBench评测LLM作为AI Agent的能力,涵盖25个主流LLM在8个任务上的表现。结果显示商业模型表现优异,GPT-4成为佼佼者。文章解析LLM作为Agent的潜力与当前挑战,为未来发展提供见解。 阅读全文
构建基于LLM的系统和产品的模式 作者: zhexuan 时间: 2023-08-07 分类: 大语言模型 标签: None 阅读(721) 推荐(0) 评论(0) 这是一篇关于将大型语言模型(LLM)集成到系统和产品中的实用模式的文章。我们将以学术研究、行业资源和从业者的专业知识为基础,提炼出关键思想和实践。有七种关键模式,它们按照提高性能与降低成本/风险以及更接近数据与更接近用户的范围进行组织。这些模式包括评估、RAG、微调、缓存、护栏、防御性...... 阅读全文
IBM和NASA开源最大的地理空间AI基础模型 作者: zhexuan 时间: 2023-08-03 分类: 大语言模型 标签: None 阅读(622) 推荐(0) 评论(0) IBM和NASA合作开放最大的地理空间AI基础模型,利用卫星地球数据构建,公开在Hugging Face上。此模型可加速卫星图像分析,促进科学发现,是IBM watsonx AI平台的一部分。模型开源,有望推动气候和地球科学领域创新。 阅读全文
AudioCraft:开源的生成式AI音乐音频工具 作者: zhexuan 时间: 2023-08-03 分类: 大语言模型 标签: None 阅读(603) 推荐(0) 评论(0) Meta 开源的AudioCraft是新一代生成式AI音乐音频工具,通过文本提示创作音乐和音频。包括MusicGen、AudioGen和EnCodec三大核心组件,可生成高质量音乐、音效和环境音效。适用于音乐家、游戏开发者、小企业主和教育工作者。轻松实现文本到音频的转换,提供丰富示例音频。 阅读全文
岐黄问道:国内首个中医大模型 作者: zhexuan 时间: 2023-08-02 分类: 大语言模型 标签: None 阅读(1288) 推荐(0) 评论(0) 国内首个中医大模型发布,岐黄问道引领中医药传承创新。基于大数据与人工智能技术,融合千年中医智慧,为中医临床诊疗提供全新解决方案。自然语言交互模式,降低使用门槛,全面支持中医药发展。 阅读全文
Llama 2: 令人难以置信的开源大语言模型 作者: zhexuan 时间: 2023-08-02 分类: 大语言模型 标签: Llama 阅读(529) 推荐(0) 评论(0) Llama 2是LLaMA的延续,在数据质量、培训技术等方面进行了实质性的技术扩展。包含模型介绍、功能特点、安全评估等。具有强大的功能,可以微调以匹配不同的需求。提供开放的API和工具,支持开发者社区进行创新。 阅读全文
Meta-Transformer:统一的多模态学习框架 作者: zhexuan 时间: 2023-07-31 分类: 大语言模型 标签: None 阅读(812) 推荐(0) 评论(0) Meta-Transformer:统一多模态学习框架,实现12种不同模态信息处理。通过统一学习无配对数据,为多模态领域带来新设计思路。强大的多模态感知理解能力,为未来多模态大模型发展提供工具。 阅读全文
Llama 2的简易微调指南 作者: zhexuan 时间: 2023-07-30 分类: 大语言模型 标签: Llama 阅读(687) 推荐(0) 评论(0) 本指南教你如何微调Llama 2模型,使其变成对话摘要器。文章包括使用Huggingface库微调模型、自定义数据微调教程等。此外,还提供模型下载、转换、运行推理等步骤的详细说明。 阅读全文
OpenCat:开源四足机器人宠物框架 作者: zhexuan 时间: 2023-07-20 分类: 大语言模型 标签: 机器人 阅读(1009) 推荐(0) 评论(0) OpenCat是开源四足机器人宠物框架,基于Arduino和Raspberry Pi打造。它支持复杂运动,可拓展感知和AI功能,部署在多种机器人上。OpenCat的目标是促进四足机器人研究、教育和开发,激励新人加入机器人人工智能领域革命。 阅读全文