分类 大语言模型 下的文章

港中大最新研究MathCoder大模型,融合自然语言与代码,解决数学难题!超越GPT-4,在MATH和GSM8K数据集上获SOTA表现。无缝集成代码能力,自动建模、推导公式与方程。革新性技术,为数学领域带来新突破!   阅读全文

MotionAgent:文字生成剧本再生成视频的模型工具!使用MotionAgent,您能将用户创造的剧本轻松转化为高清视频,同时支持剧照生成和图片/视频生成功能。通过简洁的操作界面和强大的功能特性,MotionAgent让您能够快速高效地完成剧本创作、剧照生成和视频生成工作。兼容多种......    阅读全文

NVIDIA GET3D:开源的3D模型技术与工具集。包含Omniverse协作创作平台、CloudXR云端VR/AR技术,以及Edge Stack边缘设备AI和图形平台等。致力于增强3D视觉效果和性能,助力创作者与开发者实现高效高质量的协作与创作。   阅读全文

EvoDiff是由Microsoft推出的新型AI,能生成“高保真”,“多样化”的蛋白质。此技术跳过传统设计中需依赖目标蛋白质结构信息的步骤,使得蛋白质设计更为便捷。EvoDiff通过扩散模型逐步优化蛋白质序列,实现通用性、规模和模块化设计,为新药和治疗方法以及工业酶的创造提供了新的可能。   阅读全文

MAmmoTH是一个专为解决通用数学问题而设计的大型语言模型。通过与MathInstruct数据集结合,它在数学推理领域表现出卓越性能,显著提高了准确率。此外,该模型展现了强大的跨领域能力,在多个数据集上的表现甚至超过了闭源模型。开源的新王正在崛起!   阅读全文

Stable Audio:文本轻松生成背景音乐!稳定性AI最新发布,提供多种音乐风格生成,包括摇滚、爵士等。免费版每月可生成有限音乐片段,付费版更无限制并可用于商业。跟随简单文本提示,定制专属音乐体验。   阅读全文

人工智能模仿人类嗅觉能力,使用图神经网络生成主要气味地图(POM)模型,可准确识别气味。通过嗅探未知液体和推断化学结构,展示与人类相当的描述气味质量的能力。研究为食品和香料行业提供宝贵工具。   阅读全文

Civitai,全球领先的AI绘画模型分享平台,汇集全球优秀AI艺术创造者。用户可上传自定义模型,浏览下载其他用户创作的模型。平台推出生成式AI工具,满足用户生成需求,涵盖多种SD模型版本。探索AI艺术的无限可能,尽在Civitai。   阅读全文

国内首个预训练中文版Llama2大模型!Llama中文社区完成13B大模型的中文优化,通过大规模中文语料预训练提升中文能力。全球领先,专为中文语境设计。   阅读全文

上海交大团队推出地球科学大语言模型K2,基于LLaMA并使用了大量地球科学文献进行预训练。K2具备解决地球科学问题的能力,并建立了GeoBenchmark评估模型。团队还提供了丰富的数据清洗工具包和平台,为地球科学领域的大模型训练提供了贡献。   阅读全文

跟随博主逛遍LLM的奇妙世界!探索LLM领域的发展历程,了解大型语言模型如ChatGPT、Google Bard和Llama 2的技术背景。跟随本文,你将领略LLM工具的优秀表现,掌握使用技巧,并深入了解编程、构建应用等方面的知识。同时,我们还将探讨LLM的训练方式、安全问题和开源模型等热点话题。   阅读全文

全球科技巨头Meta正式开源文本生成代码模型Code Llama,基于最强开源大语言模型Llama 2开发,支持多种主流编程语言,可商业化使用。Code Llama Python模型针对Python编程进行微调,还有针对自然文本指令微调的Code Llama - Instruct模型。   阅读全文

本文介绍大语言模型参数规模与显存大小的关系估算方法,包括预训练、微调、推理三个阶段的显存消耗及估算方法。文章详细解释不同阶段显存消耗的因素,并提供简化的估算公式。通过实例说明如何根据显卡资源选择合适的模型规模,帮助读者更好地运行和体验大语言模型。   阅读全文

Llama模型初学者指南,介绍Llama模型的工作原理、如何使用、与其他模型的区别及优势。涵盖模型安装、使用软件、性能比较等方面,是初学者入门Llama模型的理想指南。   阅读全文

本文介绍Stable Diffusion(稳定扩散)原理,解释文本到图像生成背后的技术。包括潜在扩散模型的训练、自编码器(VAE)、U-Net、文本编码器以及调度器的作用。文章还讨论了潜在扩散模型在各种创造性应用中的潜力,如文本到图像生成、图像到图像生成等。   阅读全文