分类 大语言模型 下的文章

国际学术期刊Science于9月1日发表了一篇关于人工智能模仿人类嗅觉能力的研究进展的新论文。德雷克塞尔大学的研究团队使用图神经网络生成了一个名为主要气味地图(POM)的模型,该模型能够保留感知关系,并对以前未表征的气味进行预测。研究人员通过让AI嗅探400瓶未知液体的气味,并根据化学......    阅读全文

Civitai是一个全球性的提供AI艺术资源分享和发现的平台,旨在帮助用户轻松探索并使用各类AI艺术模型。平台用户可以上传和分享自己用数据训练的AI自定义模型,或者浏览和下载其他用户创建的模型。因此可以说 Civitai 聚集了,全球很多的优秀 AI 艺术创造者,也是全球最大的AI模型......    阅读全文

国内最大的开源社区:Llama中文社区率先完成了国内首个真正意义上的中文版Llama2-13B大模型,从模型底层实现了Llama2中文能力的大幅优化和提升。毋庸置疑,中文版Llama2一经发布开启了国内大模型新时代!全球最强,但中文短板Llama2是当前全球范围内最强的开源大模型,但其......    阅读全文

这几天,代码大模型领域又热闹了起来!先是 Meta 开源代码专用大模型 ,且免费商用。效果也非常好,Code Llama 在 HumanEval 和 MBPP 代码数据集上的一次生成通过率(pass@1)轻松超越 GPT-3.5,其中「Unnatural」版本的 pass@1 逼近了原......    阅读全文

来自上海交通大学的团队推出一个70亿参数的地球科学大语言模型名叫K2。K2是基于初代LLaMA-7B模型,并使用了100万余篇地球科学文献以及和地球科学相关的维基百科的文章进行更进一步的预训练。同时设计了第一个地球科学领域的微调数据集GeoSignal,包含文章内容、类别、参考文献、提......    阅读全文

我在North Bay Python做了一个演讲,我试图总结过去几年LLM领域的发展——大型语言模型,这是ChatGPT,Google Bard和Llama 2等工具背后的技术。我的目标是帮助那些没有完全沉浸在这个空间的人赶上正在发生的事情。我涵盖了很多方面:它们是什么,你可以使用它们......    阅读全文

全球社交、科技巨头Meta(Facebook、Instagram等母公司)在官网正式开源了,文本生成代码模型Code Llama。据悉,Code Llama是基于Meta前不久发布的,最强开源大语言模型Llama 2之上开发而成,提供基础代码、专门针对Python开发和基于自然语言指令......    阅读全文

8月23日,全球社交、科技巨头Meta(Facebook、Instagram等母公司)在官网宣布,开源多语音、语言,翻译、转录大模型SeamlessM4T。据Meta介绍,SeamlessM4T是首个一体化AI翻译大模型,支持100种语音、语言翻译,可执行语音到文本、语音到语音、文本到......    阅读全文

开源大语言模型的发展非常迅速,其强大的能力也吸引了很多人的尝试与体验。尽管预训练大语言模型的使用并不复杂,但是,因为其对GPU资源的消耗很大,导致很多人并不能很好地运行加载模型,也做了很多浪费时间的工作。其中一个比较的的问题就是很多人并不知道自己的显卡支持多大参数规模的模型运行。本文将......    阅读全文

Snap 近日联手卡内基梅隆大学共同发表论文,公布一款AI大模型 Text2Cinemagraph。据悉,Text2Cinemagraph可以将图片转换成动画,还可以根据文本内容来调整动画的细节。论文表示,利用现有的自然图像和视频数据集,Text2Cinemagraph可以准确地分割现......    阅读全文

什么是Llama?Llama(大型语言模型Meta AI)是大型语言模型(LLM)家族。这是Meta(Facebook)对ChatGPT的回应。但两家公司走的是不同的道路。ChatGPT是专有的。您不知道模型的代码、训练数据和训练方法。Llama是一个开源软件。代码、训练数据和训练代码......    阅读全文

本文介绍Stable Diffusion(稳定扩散)如何工作,并解释文本到图像生成背后的技术。(用户定义文本提示用于文本到图像合成)大型文本到图像模型在实现高质量的图像合成方面取得了显著成功。扩散模型可应用于文本到图像生成任务,以实现最先进的图像生成结果。稳定扩散模型在图像生成方面取得......    阅读全文

清华大学自然语言实验室在2022年推出的《大模型交叉研讨课》,由刘知远团队和两位助教共同授课,三个部分共9节,完整课程视频已经上传B站。大模型基础知识NLP 和大模型基础 (GPU server, Linux, Bash, Conda, …)神经网络基础 (PyTorch)Transf......    阅读全文

Llama 2 是一个由 Meta 开发的大型语言模型,是 LLaMA 1 的继任者。Llama 2 可通过 AWS、Hugging Face 获取,并可以自由用于研究和商业用途。Llama 2 预训练模型在 2 万亿个标记上进行训练,相比 LLaMA 1 的上下文长度增加了一倍。它的......    阅读全文

DoctorGPT是一个大型语言模型,可以通过美国医生执照考试。这是一个开源项目,其使命是为每个人提供自己的私人医生。DoctorGPT 是 Meta 的 Llama2 70 亿参数大型语言模型的一个版本,它在医疗对话数据集上进行了微调,然后使用强化学习和宪法人工智能进一步改进。由于该......    阅读全文

近日,开源了文生图神器 Stable Diffusion 的 Stability Al 又发布了新的大模型 ——StableCode,其首个用于编码的生成式 AI 大模型。Stability Al 对它的描述是「革命性的」。据介绍,StableCode 旨在帮助程序员处理日常工作,同时......    阅读全文

所谓AI Agent就是一个以LLM为核心控制器的一个代理系统。业界开源的项目如AutoGPT、GPT-Engineer和BabyAGI等,都是这样的系统。然而,并不是所有的AI Agent都有很好的表现,其核心还是取决于LLM的水平。尽管LLM已经在许多NLP任务上取得进步,但它们作......    阅读全文

“有一大类问题很容易想象和构建演示,但很难制造产品。例如,自动驾驶:在一个街区周围演示一辆汽车自动驾驶很容易,但把它变成一个产品需要十年的时间。这篇文章是关于将大型语言模型(LLM)集成到系统和产品中的实用模式。我们将以学术研究、行业资源和从业者的专业知识为基础,并将其提炼成关键思想和......    阅读全文

IBM 和开源人工智能平台Hugging Face今天宣布,IBM的 watsonx.ai 地理空间基础模型(基于NASA的卫星地球数据构建)现在将在Hugging Face上公开提供。这将是Hugging Face上最大的地理空间基础模型,也是有史以来第一个与NASA合作建立的开源A......    阅读全文

Meta 开源了一款生成式 AI 工具 AudioCraft,可帮助用户通过文本提示创作音乐和音频。AudioCraft 包含了三个核心组件:MusicGen:使用 Meta 拥有 / 特别授权的音乐进行训练,根据文本提示生成音乐。AudioGen:使用公共音效进行训练生成音频或扩展现......    阅读全文