Suno创业路上的闪光时刻
Suno 是一款AI音乐创作工具,可以通过提示词和页面设置生成一段音乐,而且可以包含歌词和人声 (这非常难得)。在经历了两年探索之后,最近迎来了一次大爆发,也被誉为「音乐圈的 ChatGPT 时刻」。
1 AI与音频的首次结缘,要追溯到遥远的1938年。第一台电子语音合成器 Voder 在贝尔实验室建造成功,标志着电子语音合成技术的诞生。
2 此前,Google、Meta、Stability AI 公司等均发布过AI生成音乐的研究工具,比如 Google DeepMind 推出的人工智能音乐生成模型 Lyria、可以指定歌手风格进行创作的 Dream Track、可以根据文本提示词创作音乐的 MusicFX,还有 Meta 推出的使用文本创建音乐的 MediaGen、可以根据文字描述创建声音效果的 AudioGen 等。
3 然而,Suno 横空出世,实现了歌词、人声、乐器、节奏、和声等所有内容的一次性生成,而且歌曲品质非常高,完全超出预期 👍 Suno 似乎真正破解了AI音乐的密码。
4 Suno 创始人 Mikey Shulman,今年37岁,哈佛大学物理学博士。有些孩子气,总是背着双肩包。喜欢弹钢琴、弹贝斯、弹吉、敲鼓,自认资质一般但依旧迷恋音乐,超级 (!) 喜欢咖啡。
5 Mikey Shulman 和他的三位联合创始人 Georg Kucsko、Martin Camacho、Keenan Freyberg,此前共同任职于AI金融科技创业公司 Kensho,主要工作内容是开发基于AI的语音转录技术。碰巧四人也都是音乐发烧友和音乐家,便开始尝试音频生成技术,并最终全职投入到这一领域。
6 2023年4月,Mikey Shulman 他们推出了第一个开源的文本转音频模型 Bark,不仅可以生成语音,还创新地可以生成音乐和哭泣、大笑、叹息等声音效果,一个月之内在 GitHub 狂收 19K Star (现在已经 32K Star 啦) → https://github.com/suno-ai/bark
7 Bark 在架构上受到了 Andrej Karpathy 的 NanoGPT 的启发 → https://github.com/karpathy/nanoGPT
8 随着 Bark 的流行,越来越多的人开始用它生成音乐,这给开发团队留下了深刻印象。
9 2023年7月,他们基于 Bark 开发了一个名为 Chirp 的音乐生成模型,增加了人声音乐功能。
10 2023年9月,发布 Suno Chirp V1,并开始邀请用户加入 Discord 频道体验文字生成音乐。
11 Mikey Shulman 发现,Discord 频道里的用户也在尝试从模型中提取音乐,人们真的渴望使用AI进行音乐创作,这帮助团队明确了方向。
12 2023年12月,Suno 推出网页版;同月与微软达成合作,Suno 插件集成到了微软 Copilot,为更多人所熟知。
13 2024年 2月,Suno 与英伟达合作推出新的音乐模型 Parakeet。
14 2024年3月,Suno 发布 V3,效果提升明显,生成的音乐质量更高、音乐风格与流派更丰富、对 Prompt 理解更准确、幻觉也更少。随着「We Go!」「宫保鸡丁」等作品的快速传播,Suno 终于迎来了爆发,音乐生成领域也出现了「ChatGPT 时刻」。
15 Suno 的爆火其实早有预兆。据 a16z 统计,截至2024年1月,全世界最受欢迎的 GenAI 应用 Top 100 里,Suno 是唯一一个上榜的音乐公司。
16 据 Suno CEO 透露,目前用户已经创造出了很多新奇玩法!比如,用 Suno 制作很多歌曲 (片段),各自讲述故事的一部分,然后把它们串起来组成一张迷你音乐专辑 💿
17 Suno 目前支持25种语言,效果比较好的是英语、西班牙语、德语、印地语、普通话和日语,汉语效果也不错,甚至支持粤语、四川话等方言。
18 通常一首歌曲包括:前奏 → 主歌 Verse → 导歌 Pre Chorus → 副歌 Chorus → 间奏 → 主歌 → 导歌 → 副歌 → 桥段 → 副歌 → 尾奏。想用 Suno 创作高品质音乐,基础乐理知识和提示词技巧缺一不可 → 指路这篇教程
19 网易云音乐 App 有 Suno 主题歌单,包含歌曲名和歌词,甚至还有 Suno.ai 歌手账户,感兴趣可以前往收听 → https://music.163.com/#/playlist?id=9484842202