分类 大语言模型 下的文章

Observe.AI推出全球首个专注于客服领域的GPT大语言模型,提供自动摘要、知识库问答、客服表现分析等功能。该模型准确率比GPT-3.5高35%,且确保提供可靠信息。Observe.AI认为这有助于提升客服效率、运营效果和销售转化率。   阅读全文

本文旨在演示创建简单解决方案的过程,该解决方案允许我们分析自己的文本和文档,然后将从中获得的见解合并到我们的解决方案返回给用户的答案中。文章展示了如何使用嵌入模型、向量存储和LLM(大型语言模型)来处理用户查询,并有效地检索上下文相似的信息,确保可靠的结果。   阅读全文

单细胞生物学基础大型语言模型scGPT,利用生成预训练在超过3300万个细胞数据上进行训练,实现多组学整合、细胞类型注释等任务。通过灵活的微调流程,适应各种下游任务。研究展示了单细胞组学计算应用的通用解决方案。   阅读全文

多模态大语言模型(MLLM)综述,探讨MLLM的研究进展、技术挑战及未来方向。文章介绍MLLM的定义、优势,围绕多模态指令微调、多模态上下文学习、多模态思维链和LLM辅助的视觉推理等技术进行详细介绍,并总结当前研究面临的挑战和未来研究方向。   阅读全文

本文主要介绍LLM-Blender这一大型语言模型排序融合框架,通过集成学习的方法综合多个开源的“弱”LLM的能力,使其整体成为“强”LLM。文章详细介绍了LLM-Blender的构成及运行流程,并构建了新的指令数据集MixInstruct用于测试。实验证明LLM-Blender能显著提高回答质量。   阅读全文

本文介绍了思维树ToT:一种全新的语言模型推理框架。该框架通过将问题分解为连贯的单元,并探索文本(思维)的连贯性,来提高LLM的推理能力。实验表明,ToT显著提高了LLM在三个新任务中的问题解决能力。该框架让LLM能够自我评估并做出有意识决策,通过搜索算法来解决问题。   阅读全文

LaWGPT是基于中文法律知识的开源大语言模型,它扩展了通用中文基座模型,增强了对法律领域的基础语义理解能力,并通过指令精调提升了对法律内容的理解和执行能力。该项目包含法律领域数据集及系列模型的持续开源。LawGPT系列模型可用于法律咨询、法律文书生成等领域。   阅读全文

Hippocratic AI提供医疗问答服务,模拟各类患者与医生的对话,帮助医生提升医学知识。近日获5000万美元种子轮融资,并在医疗领域展现优异性能。关注Hippocratic AI的更多医疗应用与服务。   阅读全文

介绍一个基于python语言开发、基于LLaMA微调的中文医学大模型——华驼。该模型通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集,对LLaMA进行了指令微调,提高了其在医疗领域的问答效果。文章还介绍了模型的使用方法和数据集构建过程,以及计算资源需求和实验过程。   阅读全文

Google发布大型语言模型PaLM 2,提供不同规模的四个版本。该模型具有多语言理解和生成能力,并应用于谷歌产品体系。谷歌还推出了由PaLM 2驱动的新搜索引擎和AI助手。此外,谷歌发布了文本生成音乐模型MusicLM和AI笔记本项目Tailwind。同时,谷歌云推出了三款大模型,并在移动端发力。   阅读全文

本文简要总结了当今市场上热门的七个矢量数据库的特点和差异,包括Milvus、Pinecone、Vespa、Weaviate、Vald、GSI和Qdrant。文章强调了每个数据库的价值主张、类型、架构、算法和代码开放性等方面的特点,并提供了相关链接和图像。最后,强调了矢量数据库在选择和使用上的多样性。   阅读全文

微软提出多任务处理模型TaskMatrix,整合AI和API,实现自动化处理各种任务。从图像处理到文字处理,再到通用任务,TaskMatrix都能高效完成。通过API平台统一管理API,便于扩展和提升可解释性。将AI应用于办公自动化和智能家居等领域,大幅解放生产力。   阅读全文

Midjourney:只有11人的伟大公司,凭借AI绘图技术成为业界翘楚。通过独特的付费订阅模式实现盈利,同时解决大模型训练的高昂成本。团队虽小却具备灵活性、创见和魄力,成功吸引了云供应商的支持。追踪用户多样化、个性化需求,提供兼具泛用性和针对性的服务,是Midjourney成功的关键。   阅读全文

BloombergGPT是布隆伯格在2023年3月30日公开的大型语言模型,专门为金融领域设计,参数量达到500亿,使用了金融领域和通用领域的数据集进行训练。该模型在金融领域和通用领域都取得了良好的表现,提高了工作效率。虽然模型本身不会被公开,但相关的训练经验和思考将被分享。未来,该领......    阅读全文

MiniGPT-4是一个由阿卜杜拉国王科技大学研究人员开发的图片识别AI模型,其功能类似于ChatGPT-4。它可以通过手写草图生成详细的图像描述、创建网站、生成故事和诗歌,并提供图像问题的解决方案。MiniGPT-4已开源,并提供了多个部署和体验方式,用户可以自行体验或部署。   阅读全文

本文介绍如何在Slack中使用Anthropic的Claude AI聊天机器人,包括在Slack中添加Claude应用程序的步骤和如何使用它在Slack中与其他人交流。此外,还介绍了在Nat.dev上使用Claude的方法。文章还讨论了Claude作为ChatGPT竞争对手的表现和潜在的改进空间。   阅读全文

微软开源的DeepSpeed系统框架,可以实现完整的RLHF规模化训练,轻松生成类ChatGPT模型。通过混合引擎,降低成本并大大提高训练效率。支持端到端的RLHF训练,生成高质量对话。提供完整的训练流程和多种功能,如数据抽象和混合能力。   阅读全文