MathCoder:让模型写代码解决数学难题 作者: 量子位 时间: 2023-10-08 分类: 大语言模型 标签: None 阅读(400) 推荐(0) 评论(0) 港中大最新研究MathCoder大模型,融合自然语言与代码,解决数学难题!超越GPT-4,在MATH和GSM8K数据集上获SOTA表现。无缝集成代码能力,自动建模、推导公式与方程。革新性技术,为数学领域带来新突破! 阅读全文
【动画科普】Transformer 的诞生让生成式 AI 成为可能 作者: zhexuan 时间: 2023-10-08 分类: 大语言模型 标签: None 阅读(611) 推荐(0) 评论(0) 《动画科普:Transformer的诞生引领生成式AI时代》一文,通过生动有趣的动画形式,直观解读LLM原理,带你了解词嵌入、Transformer、encoder-decoder结构及自注意力的运行机制。易懂易上手,带你走进AI新世界。 阅读全文
MotionAgent:文字生成剧本再生成视频的模型 作者: zhexuan 时间: 2023-09-23 分类: 大语言模型 标签: None 阅读(921) 推荐(0) 评论(0) MotionAgent:文字生成剧本再生成视频的模型工具!使用MotionAgent,您能将用户创造的剧本轻松转化为高清视频,同时支持剧照生成和图片/视频生成功能。通过简洁的操作界面和强大的功能特性,MotionAgent让您能够快速高效地完成剧本创作、剧照生成和视频生成工作。兼容多种...... 阅读全文
Nvidia Get3D:开源的3D模型 作者: zhexuan 时间: 2023-09-22 分类: 大语言模型 标签: None 阅读(585) 推荐(0) 评论(0) NVIDIA GET3D:开源的3D模型技术与工具集。包含Omniverse协作创作平台、CloudXR云端VR/AR技术,以及Edge Stack边缘设备AI和图形平台等。致力于增强3D视觉效果和性能,助力创作者与开发者实现高效高质量的协作与创作。 阅读全文
EvoDiff:一种新型的蛋白质生成AI 作者: zhexuan 时间: 2023-09-20 分类: 大语言模型 标签: None 阅读(585) 推荐(0) 评论(0) EvoDiff是由Microsoft推出的新型AI,能生成“高保真”,“多样化”的蛋白质。此技术跳过传统设计中需依赖目标蛋白质结构信息的步骤,使得蛋白质设计更为便捷。EvoDiff通过扩散模型逐步优化蛋白质序列,实现通用性、规模和模块化设计,为新药和治疗方法以及工业酶的创造提供了新的可能。 阅读全文
MAmmoTH:通用数学问题的开源大模型 作者: zhexuan 时间: 2023-09-20 分类: 大语言模型 标签: None 阅读(667) 推荐(0) 评论(0) MAmmoTH是一个专为解决通用数学问题而设计的大型语言模型。通过与MathInstruct数据集结合,它在数学推理领域表现出卓越性能,显著提高了准确率。此外,该模型展现了强大的跨领域能力,在多个数据集上的表现甚至超过了闭源模型。开源的新王正在崛起! 阅读全文
AnomalyGPT:专注工业领域的异常检测模型 作者: zhexuan 时间: 2023-09-15 分类: 大语言模型 标签: None 阅读(834) 推荐(0) 评论(0) AnomalyGPT:新型工业异常检测模型介绍,通过模拟异常图像及其描述进行训练,无需手动调整即可检测工业故障,为工业生产效率提高提供新的高效途径。 阅读全文
Stable Audio:文本生成背景音乐 作者: zhexuan 时间: 2023-09-15 分类: 大语言模型 标签: None 阅读(547) 推荐(0) 评论(0) Stable Audio:文本轻松生成背景音乐!稳定性AI最新发布,提供多种音乐风格生成,包括摇滚、爵士等。免费版每月可生成有限音乐片段,付费版更无限制并可用于商业。跟随简单文本提示,定制专属音乐体验。 阅读全文
POM:人工智能获得嗅觉准确识别气味 作者: zhexuan 时间: 2023-09-15 分类: 大语言模型 标签: None 阅读(553) 推荐(0) 评论(0) 人工智能模仿人类嗅觉能力,使用图神经网络生成主要气味地图(POM)模型,可准确识别气味。通过嗅探未知液体和推断化学结构,展示与人类相当的描述气味质量的能力。研究为食品和香料行业提供宝贵工具。 阅读全文
Civitai (C站) - 全球最大AI绘画模型分享平台 作者: zhexuan 时间: 2023-09-07 分类: 大语言模型 标签: None 阅读(1632) 推荐(0) 评论(0) Civitai,全球领先的AI绘画模型分享平台,汇集全球优秀AI艺术创造者。用户可上传自定义模型,浏览下载其他用户创作的模型。平台推出生成式AI工具,满足用户生成需求,涵盖多种SD模型版本。探索AI艺术的无限可能,尽在Civitai。 阅读全文
Llama2中文大模型 作者: Llama中文社区 时间: 2023-09-05 分类: 大语言模型 标签: Llama 阅读(669) 推荐(0) 评论(0) 国内首个预训练中文版Llama2大模型!Llama中文社区完成13B大模型的中文优化,通过大规模中文语料预训练提升中文能力。全球领先,专为中文语境设计。 阅读全文
WizardCoder:直逼GPT-4的开源代码大模型 作者: zhexuan 时间: 2023-08-31 分类: 大语言模型 标签: None 阅读(769) 推荐(0) 评论(0) WizardCoder:开源代码大模型,直逼GPT-4水平。Code Llama的强劲对手,利用Evol-Instruct微调,在HumanEval上pass@1达73.2%,超越GPT-4等模型。WizardLM团队提供demo体验,复现性100%。 阅读全文
K2乔戈里:地球科学大语言模型 作者: ScienceAI 时间: 2023-08-31 分类: 大语言模型 标签: None 阅读(728) 推荐(0) 评论(0) 上海交大团队推出地球科学大语言模型K2,基于LLaMA并使用了大量地球科学文献进行预训练。K2具备解决地球科学问题的能力,并建立了GeoBenchmark评估模型。团队还提供了丰富的数据清洗工具包和平台,为地球科学领域的大模型训练提供了贡献。 阅读全文
带你逛遍LLM 全世界 作者: zhexuan 时间: 2023-08-29 分类: 大语言模型 标签: None 阅读(506) 推荐(0) 评论(0) 跟随博主逛遍LLM的奇妙世界!探索LLM领域的发展历程,了解大型语言模型如ChatGPT、Google Bard和Llama 2的技术背景。跟随本文,你将领略LLM工具的优秀表现,掌握使用技巧,并深入了解编程、构建应用等方面的知识。同时,我们还将探讨LLM的训练方式、安全问题和开源模型等热点话题。 阅读全文
Code Llama:文本生成代码模型 作者: zhexuan 时间: 2023-08-25 分类: 大语言模型 标签: Meta 阅读(504) 推荐(0) 评论(0) 全球科技巨头Meta正式开源文本生成代码模型Code Llama,基于最强开源大语言模型Llama 2开发,支持多种主流编程语言,可商业化使用。Code Llama Python模型针对Python编程进行微调,还有针对自然文本指令微调的Code Llama - Instruct模型。 阅读全文
Meta开源多模态翻译大模型SeamlessM4T 作者: zhexuan 时间: 2023-08-24 分类: 大语言模型 标签: Meta 阅读(658) 推荐(0) 评论(0) Meta开源多模态翻译大模型SeamlessM4T,支持100种语音、语言翻译,实现多模式翻译功能,突破传统翻译产品的限制,助力全球交流。模型开源地址已公布。 阅读全文
大语言模型参数规模与显存大小的关系估算方法 作者: zhexuan 时间: 2023-08-22 分类: 大语言模型 标签: None 阅读(2245) 推荐(0) 评论(0) 本文介绍大语言模型参数规模与显存大小的关系估算方法,包括预训练、微调、推理三个阶段的显存消耗及估算方法。文章详细解释不同阶段显存消耗的因素,并提供简化的估算公式。通过实例说明如何根据显卡资源选择合适的模型规模,帮助读者更好地运行和体验大语言模型。 阅读全文
Text2Cinemagraph:文本合成艺术化的动态照片 作者: zhexuan 时间: 2023-08-22 分类: 大语言模型 标签: None 阅读(604) 推荐(0) 评论(0) Snap与卡内基梅隆大学合作推出AI大模型Text2Cinemagraph,能将图片转化为动态艺术照片,并根据文本内容调整细节。以梵高星之夜为例,展示山前小溪流过的画面。官网、代码及演示链接附后。 阅读全文
Llama模型初学者指南 作者: zhexuan 时间: 2023-08-20 分类: 大语言模型 标签: Llama 阅读(757) 推荐(0) 评论(0) Llama模型初学者指南,介绍Llama模型的工作原理、如何使用、与其他模型的区别及优势。涵盖模型安装、使用软件、性能比较等方面,是初学者入门Llama模型的理想指南。 阅读全文
Stable Diffusion(稳定扩散)的原理解释 作者: zhexuan 时间: 2023-08-20 分类: 大语言模型 标签: Stable Diffusion 阅读(962) 推荐(0) 评论(0) 本文介绍Stable Diffusion(稳定扩散)原理,解释文本到图像生成背后的技术。包括潜在扩散模型的训练、自编码器(VAE)、U-Net、文本编码器以及调度器的作用。文章还讨论了潜在扩散模型在各种创造性应用中的潜力,如文本到图像生成、图像到图像生成等。 阅读全文