分类大语言模型下的文章

Observe.ai推出全球首个客服领域GPT

作者: zhexuan
时间: 2023-07-12
分类: 大语言模型
标签: None
阅读(931)
推荐(0)
评论(0)

Observe.AI推出全球首个专注于客服领域的GPT大语言模型，提供自动摘要、知识库问答、客服表现分析等功能。该模型准确率比GPT-3.5高35%，且确保提供可靠信息。Observe.AI认为这有助于提升客服效率、运营效果和销售转化率。阅读全文

LLM App构建指南

作者: zhexuan
时间: 2023-07-06
分类: 大语言模型
标签: None
阅读(995)
推荐(0)
评论(0)

本文旨在演示创建简单解决方案的过程，该解决方案允许我们分析自己的文本和文档，然后将从中获得的见解合并到我们的解决方案返回给用户的答案中。文章展示了如何使用嵌入模型、向量存储和LLM（大型语言模型）来处理用户查询，并有效地检索上下文相似的信息，确保可靠的结果。阅读全文

单细胞生物学基础大型语言模型scGPT

作者: zhexuan
时间: 2023-07-06
分类: 大语言模型
标签: None
阅读(1169)
推荐(0)
评论(0)

单细胞生物学基础大型语言模型scGPT，利用生成预训练在超过3300万个细胞数据上进行训练，实现多组学整合、细胞类型注释等任务。通过灵活的微调流程，适应各种下游任务。研究展示了单细胞组学计算应用的通用解决方案。阅读全文

多模态大语言模型首篇综述

作者: zhexuan
时间: 2023-07-05
分类: 大语言模型
标签: None
阅读(1193)
推荐(0)
评论(0)

多模态大语言模型（MLLM）综述，探讨MLLM的研究进展、技术挑战及未来方向。文章介绍MLLM的定义、优势，围绕多模态指令微调、多模态上下文学习、多模态思维链和LLM辅助的视觉推理等技术进行详细介绍，并总结当前研究面临的挑战和未来研究方向。阅读全文

LLM-Blender：大语言模型排序融合框架

作者: zhexuan
时间: 2023-06-26
分类: 大语言模型
标签: None
阅读(834)
推荐(0)
评论(0)

本文主要介绍LLM-Blender这一大型语言模型排序融合框架，通过集成学习的方法综合多个开源的“弱”LLM的能力，使其整体成为“强”LLM。文章详细介绍了LLM-Blender的构成及运行流程，并构建了新的指令数据集MixInstruct用于测试。实验证明LLM-Blender能显著提高回答质量。阅读全文

思维树ToT：全新的语言模型推理框架

作者: zhexuan
时间: 2023-05-24
分类: 大语言模型
标签: 思维链
阅读(2009)
推荐(0)
评论(0)

本文介绍了思维树ToT：一种全新的语言模型推理框架。该框架通过将问题分解为连贯的单元，并探索文本（思维）的连贯性，来提高LLM的推理能力。实验表明，ToT显著提高了LLM在三个新任务中的问题解决能力。该框架让LLM能够自我评估并做出有意识决策，通过搜索算法来解决问题。阅读全文

LawGPT：中文法律知识界的大语言模型

作者: zhexuan
时间: 2023-05-24
分类: 大语言模型
标签: None
阅读(2245)
推荐(0)
评论(0)

LaWGPT是基于中文法律知识的开源大语言模型，它扩展了通用中文基座模型，增强了对法律领域的基础语义理解能力，并通过指令精调提升了对法律内容的理解和执行能力。该项目包含法律领域数据集及系列模型的持续开源。LawGPT系列模型可用于法律咨询、法律文书生成等领域。阅读全文

Hippocratic AI：为医疗提供问答服务

作者: zhexuan
时间: 2023-05-19
分类: 大语言模型
标签: None
阅读(1153)
推荐(0)
评论(0)

Hippocratic AI提供医疗问答服务，模拟各类患者与医生的对话，帮助医生提升医学知识。近日获5000万美元种子轮融资，并在医疗领域展现优异性能。关注Hippocratic AI的更多医疗应用与服务。阅读全文

华驼(HuaTuo): 基于中文医学知识的LLaMA微调模型

作者: zhexuan
时间: 2023-05-19
分类: 大语言模型
标签: None
阅读(1439)
推荐(0)
评论(0)

介绍一个基于python语言开发、基于LLaMA微调的中文医学大模型——华驼。该模型通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集，对LLaMA进行了指令微调，提高了其在医疗领域的问答效果。文章还介绍了模型的使用方法和数据集构建过程，以及计算资源需求和实验过程。阅读全文

Google发布大语言模型PaLM2

作者: zhexuan
时间: 2023-05-12
分类: 大语言模型
标签: Google
阅读(1245)
推荐(0)
评论(0)

Google发布大型语言模型PaLM 2，提供不同规模的四个版本。该模型具有多语言理解和生成能力，并应用于谷歌产品体系。谷歌还推出了由PaLM 2驱动的新搜索引擎和AI助手。此外，谷歌发布了文本生成音乐模型MusicLM和AI笔记本项目Tailwind。同时，谷歌云推出了三款大模型，并在移动端发力。阅读全文

7个矢量数据库：Milvus,Pinecone、Vespa、Weaviate、Vald、GSI和Qdrant

作者: zhexuan
时间: 2023-05-10
分类: 大语言模型
标签: 向量数据库
阅读(2178)
推荐(0)
评论(0)

本文简要总结了当今市场上热门的七个矢量数据库的特点和差异，包括Milvus、Pinecone、Vespa、Weaviate、Vald、GSI和Qdrant。文章强调了每个数据库的价值主张、类型、架构、算法和代码开放性等方面的特点，并提供了相关链接和图像。最后，强调了矢量数据库在选择和使用上的多样性。阅读全文

微软提出多任务处理模型TaskMatrix：一个AI驱动百万个AI和API

作者: zhexuan
时间: 2023-05-09
分类: 大语言模型
标签: None
阅读(910)
推荐(0)
评论(0)

微软提出多任务处理模型TaskMatrix，整合AI和API，实现自动化处理各种任务。从图像处理到文字处理，再到通用任务，TaskMatrix都能高效完成。通过API平台统一管理API，便于扩展和提升可解释性。将AI应用于办公自动化和智能家居等领域，大幅解放生产力。阅读全文

Midjourney：只有11个人的伟大公司

作者: zhexuan
时间: 2023-04-27
分类: 大语言模型
标签: Midjourney
阅读(1709)
推荐(0)
评论(0)

Midjourney：只有11人的伟大公司，凭借AI绘图技术成为业界翘楚。通过独特的付费订阅模式实现盈利，同时解决大模型训练的高昂成本。团队虽小却具备灵活性、创见和魄力，成功吸引了云供应商的支持。追踪用户多样化、个性化需求，提供兼具泛用性和针对性的服务，是Midjourney成功的关键。阅读全文

BloombergGPT: 用于金融领域的大型语言模型

作者: zhexuan
时间: 2023-04-25
分类: 大语言模型
标签: None
阅读(1136)
推荐(0)
评论(0)

BloombergGPT是布隆伯格在2023年3月30日公开的大型语言模型，专门为金融领域设计，参数量达到500亿，使用了金融领域和通用领域的数据集进行训练。该模型在金融领域和通用领域都取得了良好的表现，提高了工作效率。虽然模型本身不会被公开，但相关的训练经验和思考将被分享。未来，该领...... 阅读全文

MiniGPT-4：开源且可媲美ChatGPT4的图片识别AI模型

作者: zhexuan
时间: 2023-04-23
分类: 大语言模型
标签: None
阅读(2509)
推荐(0)
评论(0)

MiniGPT-4是一个由阿卜杜拉国王科技大学研究人员开发的图片识别AI模型，其功能类似于ChatGPT-4。它可以通过手写草图生成详细的图像描述、创建网站、生成故事和诗歌，并提供图像问题的解决方案。MiniGPT-4已开源，并提供了多个部署和体验方式，用户可以自行体验或部署。阅读全文

Hugging Face：人工智能界的Github

作者: zhexuan
时间: 2023-04-21
分类: 大语言模型
标签: HuggingFace
阅读(1640)
推荐(0)
评论(0)

Hugging Face：人工智能界的Github。从OpenAI的ChatGPT到Hugging Face的开源项目，探寻人工智能的最新进展。以GPT为核心的开源AI平台Hugging Face，通过开源模型库和工具，赋能开发者，推动AI行业发展。阅读全文

认识Claude：与ChatGPT竞争的免费且不限量的聊天机器人

作者: zhexuan
时间: 2023-04-19
分类: 大语言模型
标签: Claude
阅读(2946)
推荐(0)
评论(0)

认识Claude：与ChatGPT竞争的免费且不限量的聊天机器人，支持中文，无需注册即可使用。Claude 的表现如何？一文带你测评。阅读全文

在Slack中使用Claude

作者: zhexuan
时间: 2023-04-17
分类: 大语言模型
标签: Claude
阅读(12708)
推荐(0)
评论(0)

本文介绍如何在Slack中使用Anthropic的Claude AI聊天机器人，包括在Slack中添加Claude应用程序的步骤和如何使用它在Slack中与其他人交流。此外，还介绍了在Nat.dev上使用Claude的方法。文章还讨论了Claude作为ChatGPT竞争对手的表现和潜在的改进空间。阅读全文

微软开源DeepSpeed

作者: zhexuan
时间: 2023-04-14
分类: 大语言模型
标签: None
阅读(1443)
推荐(0)
评论(0)

微软开源的DeepSpeed系统框架，可以实现完整的RLHF规模化训练，轻松生成类ChatGPT模型。通过混合引擎，降低成本并大大提高训练效率。支持端到端的RLHF训练，生成高质量对话。提供完整的训练流程和多种功能，如数据抽象和混合能力。阅读全文

通义千问大模型未来将接入阿里所有产品

作者: zhexuan
时间: 2023-04-13
分类: 大语言模型
标签: None
阅读(1028)
推荐(0)
评论(0)

阿里版Copilot惊艳亮相，AI时代即将进入下半场火拼。通义千问接入钉钉和天猫精灵等应用，展现新功能。阿里云开放大模型能力，助力企业打造专属大模型，推动AI在各领域的应用和发展。阅读全文

分类大语言模型下的文章

Observe.ai推出全球首个客服领域GPT

LLM App构建指南

单细胞生物学基础大型语言模型scGPT

多模态大语言模型首篇综述

LLM-Blender：大语言模型排序融合框架

思维树ToT：全新的语言模型推理框架

LawGPT：中文法律知识界的大语言模型

Hippocratic AI：为医疗提供问答服务

华驼(HuaTuo): 基于中文医学知识的LLaMA微调模型

Google发布大语言模型PaLM2

7个矢量数据库：Milvus,Pinecone、Vespa、Weaviate、Vald、GSI和Qdrant

微软提出多任务处理模型TaskMatrix：一个AI驱动百万个AI和API

Midjourney：只有11个人的伟大公司

BloombergGPT: 用于金融领域的大型语言模型

MiniGPT-4：开源且可媲美ChatGPT4的图片识别AI模型

Hugging Face：人工智能界的Github

认识Claude：与ChatGPT竞争的免费且不限量的聊天机器人

在Slack中使用Claude

微软开源DeepSpeed

通义千问大模型未来将接入阿里所有产品

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅

分类 大语言模型 下的文章

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅

分类大语言模型下的文章