分类 大语言模型 下的文章

生成式 AI 初创公司 Pika Labs 完成 5500 万美元融资,并推出视频生成器 Pika 1.0,包括一个新的AI模型,能够生成和编辑三维动画、动漫、卡通和电影等不同风格的视频,以及全新的网页版,使其更易于使用,用户可以在官网申请使用。Pika是一家初创公司,由两位斯坦福大学......    阅读全文

11月29日,北京市科学技术委员会、中关村科技园区管理委员会在AICC 2023人工智能计算大会上发布了《北京市人工智能行业大模型创新应用白皮书(2023年)》(以下简称《白皮书》)。《白皮书》从大模型全球发展态势、国内外行业应用概述、北京应用情况和发展建议等方面进行了系统分析和阐述,......    阅读全文

机器学习正在影响每个行业,似乎没有人清楚地知道训练一个专门的LLM需要多少钱。在本周的 2023 年 OpenAI 开发者日上,该公司宣布了他们的模型构建服务,最低价格为200万-300万美元。这是为专业模型付出的沉重代价,许多人想知道,有必要吗?训练 LLM 需要多少成本的问题是一个......    阅读全文

专注于开发人工智能(AI)产品的初创公司 Stability AI 发布了其最新的 AI 模型 ——Stable Video Diffusion。这款模型能够通过现有图片生成视频,是基于之前发布的 Stable Diffusion 文本转图片模型的延伸,也是目前为止市面上少有的能够生成......    阅读全文

11月7日凌晨,OpenAI在美国旧金山举办首届开发者大会,与来自全球的开发者、企业、合作伙伴分享了最新产品。微软首席执行官Satya Nadella作为特邀嘉宾出席了此次盛会。会上,OpenAI发布了128K 上下文的GPT-4 Turbo、自定义GPT、DALL·E 3 API、全......    阅读全文

李开复博士创办的AI 2.0公司零一万物发布首款开源大模型——Yi系列大模型:Yi-34B和Yi-6B。虽然Yi系列大模型出道时间相对较晚,但从效果上来看,绝对称得上是后发制人。一出手即问鼎多项全球第一:Hugging Face英文测试榜单位居第一,以34B的大小碾压Llama-2 7......    阅读全文

马斯克旗下的xAI发布了首个AI大模型产品“Grok”。Grok可以回答其他AI系统无法解决的难题,仿照《银河系漫游指南》设计,可以回答几乎任何问题并给出建议。但Grok仍然是一个早期测试产品,希望用户的帮助下能快速改进。体验地址:https://grok.x.ai/Grok的目标是收......    阅读全文

英伟达推出了自家最新430亿参数大语言模型——ChipNeMo。对于它的用途,英伟达在官方披露消息中也是非常的明确,剑指AI芯片设计。具体而言,ChipNeMo可以帮助工作人员完成与芯片设计相关的任务——包括回答有关芯片设计的一般问题、总结bug文档,以及为EDA工具编写脚本等等。20......    阅读全文

2023年10月27日,智谱AI于2023中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型ChatGLM3及相关系列产品。汇总如下。全新技术升级1. 更强大的性能:今年以来,这是我们第三次对ChatGLM基座模型进行了深度优化。我们采用了独创的多阶段增强预训练方法,更丰富的......    阅读全文

若从生成方式分类,AI视频生成包含:文生视频、图生视频(Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stability Animation)视频生视频:又分逐帧生成(SD + ......    阅读全文

全球社交、科技巨头Meta(Facebook、Instagram等母公司)在官网宣布,开源数字水印产品Stable Signature,并公开论文。据悉,Stable Signature是由Meta和INRIA(法国国家信息与自动化研究所)联合开发而成,可将数字水印直接嵌入到AI自动生......    阅读全文

港中大最新研究放了个“大招”:他们开发了一个叫做MathCoder的大模型,数学能力直接在竞赛级“题库”Math上超过GPT-4。做到这一点靠的就是无缝集成代码的能力——在遇到数学问题时,它不仅能用自然语言推理,还能自动编写和执行代码来建模、推导公式与方程。这样的工作方式无疑和强大的G......    阅读全文

这篇文章很有意思!翻页时,页面右侧的动画与左侧文字变化同步,以非常具体的案例解释了 LLM 的基本原理。如果公式、术语、论文看起来太枯燥晦涩,就来看这个网页吧!随着网页下拉,可以清楚地了解到词嵌入 (Word Embedding)、Transformer、encoder-decoder......    阅读全文

MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。MotionAgent的模型由ModelScope开源模型社区提供支持。功能特性剧本生成(Script Generation......    阅读全文

GET3D 是 NVIDIA 推出的一个系列的技术和工具,旨在增强 3D 视觉效果和性能。具体而言,GET3D 包括多种不同的技术和工具,如 Omniverse、NVIDIA CloudXR、NVIDIA Edge Stack 等等。其中,Omniverse 是一个创新的3D 协作和创......    阅读全文

蛋白质是在体内执行关键细胞功能的天然分子,是所有疾病的基石。表征蛋白质可以揭示疾病的机制,包括减缓疾病或可能逆转疾病的方法,而创造蛋白质可以导致全新类别的药物和治疗方法。但目前在实验室中设计蛋白质的过程是昂贵的 - 无论是从计算还是人力资源的角度来看。它需要提出一种蛋白质结构,可以在体......    阅读全文

最近,滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.MathInstruct由13个具有中间原理的数学数据集编译而成,其中6个为新数据集,混合了思想链(CoT)和思......    阅读全文

尽管像MiniGPT-4这样的大型模型在理解图像方面表现出色,但它们在处理工业环境中的详细异常方面却存在困难。而新型解决方案AnomalyGPT,通过对模拟异常图像及其描述进行训练,可以检测出工业故障,无需手动调整。这个模型的开发为工业异常检测提供了一种新的高效途径,以期能对工业生产中......    阅读全文

9月14日,著名开源平台Stability AI在官网发布了,音频生成式AI产品Stable Audio。用户通过文本提示就能直接生成摇滚、爵士、电子、嘻哈、重金属、民谣、流行、朋克、乡村等20多种类型背景音乐。例如,输入迪斯科、鼓机、合成器、贝司、钢琴、吉他、欢快、115 BPM等关......    阅读全文