分类 大语言模型 下的文章

Meta 开源了一款生成式 AI 工具 AudioCraft,可帮助用户通过文本提示创作音乐和音频。AudioCraft 包含了三个核心组件:MusicGen:使用 Meta 拥有 / 特别授权的音乐进行训练,根据文本提示生成音乐。AudioGen:使用公共音效进行训练生成音频或扩展现......    阅读全文

近日,中医药垂直领域中的人工智能领先公司,南京大经中医药信息技术有限公司成功发布了一款名为“岐黄问道·大模型”的中医大模型。这一重要的技术成果不仅在医疗领域引起了广泛关注,更将为中医药的传承创新发展带来崭新的机遇。发布会上,大经中医技术总监王祺介绍了“岐黄问道·大模型”的训练过程和技术......    阅读全文

Llama 2是LLaMA的延续。在数据质量、培训技术(包括新颖的研究工件)、能力评估、安全培训和负责任的发布方面进行了实质性的技术扩展。技术研究论文包括所有这些领域的实质性细节。从大局来看,这是LLM生态系统迈出的一大步,当研究共享处于历史最低水平,监管捕获处于人工智能的历史最高水平......    阅读全文

近期,香港中文大学多媒体实验室联合上海人工智能实验室的研究团队提出了一种全新的统一多模态学习框架——Meta-Transformer。该框架通过统一学习无配对数据,实现了对12种不同模态的信息进行处理,为当前多模态学习提供了强大的工具,同时为多模态领域带来了新的设计思路。Meta-Tr......    阅读全文

在本指南中,我将介绍如何微调 Llama 2 以使其成为对话摘要器!上周末,我想在我自己收集的Google Keep笔记数据集上微调Llama 2(现在在Open LLM排行榜中占据至高无上的地位);我的每个笔记都有一个标题和一个正文,所以我想训练 Llama 从给定的标题生成一个正文......    阅读全文

OpenCat:一个基于Arduino和Raspberry Pi的开源四足机器人宠物框架。项目灵感来自于到波士顿动力公司Big Dog和Spot Mini的启发。OpenCat提供了一个基础的开源平台,可以创建令人惊奇的可编程步态、运动四足机器人。借助定制的 Arduino 板和伺服系......    阅读全文

目前,金融、医疗、旅游、证券、法律等行业,相继推出了垂直业务场景的类ChatGPT大语言模型,客户服务领域还处于空白,即便是有也是通过微调方式打造而成。知名客服平台Observe.AI凭借自己多年客服语料数据和技术沉淀,推出了只专注客服领域完全自研的300亿参数的大语言模型。(申请测试......    阅读全文

为什么我们需要LLM语言的进化使我们人类至今难以置信地走得很远。它使我们能够以我们今天所知道的形式有效地分享知识和协作。因此,我们的大部分集体知识继续通过无组织的书面文本保存和传播。过去二十年来为数字化信息和流程而采取的举措通常侧重于在关系数据库中积累越来越多的数据。这种方法使传统的分......    阅读全文

生成式预训练模型在自然语言处理(NLP)和计算机视觉等领域取得了显著的成功。文本是由文字组成的,细胞可以用基因来表征。NLP 和单细胞生物学之间的另一个核心相似之处是,用于训练的公开可用的单细胞 RNA 测序(scRNA-seq)数据的规模庞大且不断增长。NLP 模型是否也能理解单细胞......    阅读全文

近来,多模态大语言模型(Multimodal Large Language Model,MLLM)受到广泛关注,成为一个新兴的研究热点。MLLM通常以大语言模型(Large Language Model,LLM)为基础,融入其它非文本的模态信息,完成各种多模态任务。相比于常规的多模态模......    阅读全文

随着Alpaca, Vicuna, Baize, Koala等诸多大型语言模型的问世,研究人员发现虽然一些模型比如Vicuna的整体的平均表现最优,但是针对每个单独的输入,其最优模型的分布实际上是非常分散的,比如最好的Vicuna也只在20%的任务里比其他模型有优势。有没有可能通过集成......    阅读全文

2022年,前谷歌大脑华人科学家Jason Wei在一篇思维链的开山之作中首次提出,CoT可以增强LLM的推理能力。但即便有了思维链,LLM有时也会在非常简单的问题上犯错。最近,来自普林斯顿大学和Google DeepMind研究人员提出了一种全新的语言模型推理框架——「思维树」(To......    阅读全文

LaWGPT 是一系列基于中文法律知识的开源大语言模型。该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考......    阅读全文

5月17日,生成式AI平台Hippocratic AI 宣布获得5000万美元(约3.5亿元)种子轮融资,本次由 General Catalyst 和 Andreessen Horowitz共同领投。Hippocratic AI是一个基于大语言模型开发的AI聊天机器人主要聚焦在医疗教学......    阅读全文

前言在大模型兴起的时代浪潮引领下,无数款AI应用应运而生,本文的核心目标除了技术知识科普外,还有还重要的一点,就是进行知识梳理。github地址为:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese介绍一个基于python语言开发、基......    阅读全文

Google PaLM 2模型提供了不同规模的四个版本,其中轻量级的Gecko模型可以在移动设备上运行,速度非常快,不联网也能在设备上运行。谷歌还推出了两个专业领域大模型,其中,Med-PaLM 2能回答各种医学问题,是首个在美国医疗执照考试中达到专家水平的大语言模型。谷歌首席执行官桑......    阅读全文

本文简要总结了当今市场上正在积极开发的7个矢量数据库,Milvus、Pinecone、Vespa、Weaviate、Vald、GSI 和 Qdrant 的详细比较。我们已经接近在搜索引擎体验的基础层面上涉及机器学习:在多维多模态空间中编码对象。这与传统的关......    阅读全文

萧箫 发自 凹非寺量子位通往AGI的路究竟怎么走,微软有了新想法——基于ChatGPT这类大模型的强大理解能力,将输入的任何信号拆解成一个个可完成的任务,交给其他的AI和程序完成。简单来说,就像是建了一座司令塔,每个大模型都能成为其中的“大脑&rdq......    阅读全文

  目前,随着 AI 技术的快速迭代,各种基于 AIGC(人工智能内容生成)技术的产品不断涌向社会,而其中最普遍的,则莫过于大量的 AI 绘图模型,如 Midjourney、Dreambooth、Novel AI 和 Stable Diffusion 等。  虽然 AI 绘图领域,看似......    阅读全文