清华大学大语言模型(LLM)公开课 作者: zhexuan 时间: 2023-08-17 分类: 大语言模型 标签: None 阅读(1573) 推荐(0) 评论(0) 清华大学自然语言实验室推出的《大模型交叉研讨课》带你探索大模型的奥秘!课程由刘知远团队和助教授课,涵盖大模型基础知识、关键技术和跨学科应用。课程视频已上传B站,不容错过! 阅读全文
LLaMA2相关资源 作者: zhexuan 时间: 2023-08-16 分类: 大语言模型 标签: Llama 阅读(535) 推荐(0) 评论(0) LLaMA 2是Meta开发的大型语言模型,可用于研究和商业用途。这篇博客包含LLaMA 2的所有相关资源,如模型性能、如何使用和部署等。来自Meta官方的公告、不同大小的模型体验、研究工作、性能基准测试、如何写提示词、如何训练和部署LLaMA 2等都在讨论范围内。 阅读全文
DoctorGPT:通过美国医师执照考试的开源模型 作者: zhexuan 时间: 2023-08-14 分类: 大语言模型 标签: None 阅读(485) 推荐(0) 评论(0) DoctorGPT是一个可通过美国医师执照考试的大型语言模型开源项目,模拟医生提供医疗咨询。基于Meta的Llama2模型,经过医疗对话数据集训练,支持离线使用,保护隐私,适用于iOS、Android和Web平台。欢迎参与功能改进。 阅读全文
StableCode:首个用于编码的生成式 AI 大模型 作者: zhexuan 时间: 2023-08-11 分类: 大语言模型 标签: None 阅读(610) 推荐(0) 评论(0) StableCode是Stability AI推出的首个用于编码的生成式AI大模型,旨在帮助程序员处理日常工作并为新手开发者提供学习工具。它通过三个不同版本的模型,包括基础模型、指令模型和长上下文窗口模型,来提高开发者的效率。StableCode可处理复杂的编程任务,并为编码新手提供理想的学习体验。 阅读全文
AgentBench:AI Agent能力评测工具 作者: zhexuan 时间: 2023-08-10 分类: 大语言模型 标签: None 阅读(570) 推荐(0) 评论(0) AgentBench评测LLM作为AI Agent的能力,涵盖25个主流LLM在8个任务上的表现。结果显示商业模型表现优异,GPT-4成为佼佼者。文章解析LLM作为Agent的潜力与当前挑战,为未来发展提供见解。 阅读全文
构建基于LLM的系统和产品的模式 作者: zhexuan 时间: 2023-08-07 分类: 大语言模型 标签: None 阅读(631) 推荐(0) 评论(0) 这是一篇关于将大型语言模型(LLM)集成到系统和产品中的实用模式的文章。我们将以学术研究、行业资源和从业者的专业知识为基础,提炼出关键思想和实践。有七种关键模式,它们按照提高性能与降低成本/风险以及更接近数据与更接近用户的范围进行组织。这些模式包括评估、RAG、微调、缓存、护栏、防御性...... 阅读全文
IBM和NASA开源最大的地理空间AI基础模型 作者: zhexuan 时间: 2023-08-03 分类: 大语言模型 标签: None 阅读(553) 推荐(0) 评论(0) IBM和NASA合作开放最大的地理空间AI基础模型,利用卫星地球数据构建,公开在Hugging Face上。此模型可加速卫星图像分析,促进科学发现,是IBM watsonx AI平台的一部分。模型开源,有望推动气候和地球科学领域创新。 阅读全文
AudioCraft:开源的生成式AI音乐音频工具 作者: zhexuan 时间: 2023-08-03 分类: 大语言模型 标签: None 阅读(507) 推荐(0) 评论(0) Meta 开源的AudioCraft是新一代生成式AI音乐音频工具,通过文本提示创作音乐和音频。包括MusicGen、AudioGen和EnCodec三大核心组件,可生成高质量音乐、音效和环境音效。适用于音乐家、游戏开发者、小企业主和教育工作者。轻松实现文本到音频的转换,提供丰富示例音频。 阅读全文
岐黄问道:国内首个中医大模型 作者: zhexuan 时间: 2023-08-02 分类: 大语言模型 标签: None 阅读(1006) 推荐(0) 评论(0) 国内首个中医大模型发布,岐黄问道引领中医药传承创新。基于大数据与人工智能技术,融合千年中医智慧,为中医临床诊疗提供全新解决方案。自然语言交互模式,降低使用门槛,全面支持中医药发展。 阅读全文
Llama 2: 令人难以置信的开源大语言模型 作者: zhexuan 时间: 2023-08-02 分类: 大语言模型 标签: Llama 阅读(462) 推荐(0) 评论(0) Llama 2是LLaMA的延续,在数据质量、培训技术等方面进行了实质性的技术扩展。包含模型介绍、功能特点、安全评估等。具有强大的功能,可以微调以匹配不同的需求。提供开放的API和工具,支持开发者社区进行创新。 阅读全文
Meta-Transformer:统一的多模态学习框架 作者: zhexuan 时间: 2023-07-31 分类: 大语言模型 标签: None 阅读(720) 推荐(0) 评论(0) Meta-Transformer:统一多模态学习框架,实现12种不同模态信息处理。通过统一学习无配对数据,为多模态领域带来新设计思路。强大的多模态感知理解能力,为未来多模态大模型发展提供工具。 阅读全文
Llama 2的简易微调指南 作者: zhexuan 时间: 2023-07-30 分类: 大语言模型 标签: Llama 阅读(572) 推荐(0) 评论(0) 本指南教你如何微调Llama 2模型,使其变成对话摘要器。文章包括使用Huggingface库微调模型、自定义数据微调教程等。此外,还提供模型下载、转换、运行推理等步骤的详细说明。 阅读全文
OpenCat:开源四足机器人宠物框架 作者: zhexuan 时间: 2023-07-20 分类: 大语言模型 标签: 机器人 阅读(861) 推荐(0) 评论(0) OpenCat是开源四足机器人宠物框架,基于Arduino和Raspberry Pi打造。它支持复杂运动,可拓展感知和AI功能,部署在多种机器人上。OpenCat的目标是促进四足机器人研究、教育和开发,激励新人加入机器人人工智能领域革命。 阅读全文
Observe.ai推出全球首个客服领域GPT 作者: zhexuan 时间: 2023-07-12 分类: 大语言模型 标签: None 阅读(555) 推荐(0) 评论(0) Observe.AI推出全球首个专注于客服领域的GPT大语言模型,提供自动摘要、知识库问答、客服表现分析等功能。该模型准确率比GPT-3.5高35%,且确保提供可靠信息。Observe.AI认为这有助于提升客服效率、运营效果和销售转化率。 阅读全文
LLM App构建指南 作者: zhexuan 时间: 2023-07-06 分类: 大语言模型 标签: None 阅读(620) 推荐(0) 评论(0) 本文旨在演示创建简单解决方案的过程,该解决方案允许我们分析自己的文本和文档,然后将从中获得的见解合并到我们的解决方案返回给用户的答案中。文章展示了如何使用嵌入模型、向量存储和LLM(大型语言模型)来处理用户查询,并有效地检索上下文相似的信息,确保可靠的结果。 阅读全文
单细胞生物学基础大型语言模型scGPT 作者: zhexuan 时间: 2023-07-06 分类: 大语言模型 标签: None 阅读(700) 推荐(0) 评论(0) 单细胞生物学基础大型语言模型scGPT,利用生成预训练在超过3300万个细胞数据上进行训练,实现多组学整合、细胞类型注释等任务。通过灵活的微调流程,适应各种下游任务。研究展示了单细胞组学计算应用的通用解决方案。 阅读全文
多模态大语言模型首篇综述 作者: zhexuan 时间: 2023-07-05 分类: 大语言模型 标签: None 阅读(617) 推荐(0) 评论(0) 多模态大语言模型(MLLM)综述,探讨MLLM的研究进展、技术挑战及未来方向。文章介绍MLLM的定义、优势,围绕多模态指令微调、多模态上下文学习、多模态思维链和LLM辅助的视觉推理等技术进行详细介绍,并总结当前研究面临的挑战和未来研究方向。 阅读全文
LLM-Blender:大语言模型排序融合框架 作者: zhexuan 时间: 2023-06-26 分类: 大语言模型 标签: None 阅读(489) 推荐(0) 评论(0) 本文主要介绍LLM-Blender这一大型语言模型排序融合框架,通过集成学习的方法综合多个开源的“弱”LLM的能力,使其整体成为“强”LLM。文章详细介绍了LLM-Blender的构成及运行流程,并构建了新的指令数据集MixInstruct用于测试。实验证明LLM-Blender能显著提高回答质量。 阅读全文
思维树ToT:全新的语言模型推理框架 作者: zhexuan 时间: 2023-05-24 分类: 大语言模型 标签: 思维链 阅读(1461) 推荐(0) 评论(0) 本文介绍了思维树ToT:一种全新的语言模型推理框架。该框架通过将问题分解为连贯的单元,并探索文本(思维)的连贯性,来提高LLM的推理能力。实验表明,ToT显著提高了LLM在三个新任务中的问题解决能力。该框架让LLM能够自我评估并做出有意识决策,通过搜索算法来解决问题。 阅读全文
LawGPT:中文法律知识界的大语言模型 作者: zhexuan 时间: 2023-05-24 分类: 大语言模型 标签: None 阅读(1662) 推荐(0) 评论(0) LaWGPT是基于中文法律知识的开源大语言模型,它扩展了通用中文基座模型,增强了对法律领域的基础语义理解能力,并通过指令精调提升了对法律内容的理解和执行能力。该项目包含法律领域数据集及系列模型的持续开源。LawGPT系列模型可用于法律咨询、法律文书生成等领域。 阅读全文