MotionAgent:文字生成剧本再生成视频的模型
MotionAgent是一个能将用户创造的剧本生成视频的深度学习模型工具。用户通过我们提供的工具组合,进行剧本创作、剧照生成、图片/视频生成、背景音乐谱写等工作。
MotionAgent的模型由ModelScope开源模型社区提供支持。
功能特性
剧本生成(Script Generation)
- 用户指定故事主题和背景,即可生成剧本
- 剧本生成模型基于LLM(如Qwen-7B-Chat),可生成多种风格的剧本
剧照生成(Movie still Generation)
- 通过输入一幕剧本,即可生成对应的剧照场景图片
视频生成(Video Generation)
- 图生视频
- 支持高分辨率视频生成
音乐生成(Music Generation)
- 自定义风格的背景音乐
兼容性验证
已经验证过的环境:
- python3.8
- torch2.0.1
- CUDA11.7
- OS: Ubuntu 20.04
- Nvidia-A100 40G
资源要求
- GPU显存:36GB
- 磁盘: 推荐预留50GB以上的存储空间
conda虚拟环境
使用conda虚拟环境,参考Anaconda来管理您的依赖,安装完成后,执行如下命令:
conda create -n motion_agent python=3.8
conda activate motion_agent
GIT_LFS_SKIP_SMUDGE=1 git clone https://github.com/modelscope/motionagent.git --depth 1
cd motionagent
# 安装依赖
pip3 install -r requirements.txt
# 运行应用
python3 app.py
# Note: MotionAgent目前支持单卡GPU,如果您的环境有多卡,请使用如下命令
# CUDA_VISIBLE_DEVICES=0 python3 app.py
# Note: 如果您使用了Modelscope社区的Notebook或者您的磁盘剩余内存小于100GB,
# 推荐使用如下命令打开清理内存开关,每次运行都会重新下载模型导致速度变慢很多,请耐心等待
# python3 app.py --clear_cache
# 最后点击log中生成的URL即可访问页面。
模型列表
[1] Qwen-7B-Chat: 模型 | 创空间
[2] SDXL 1.0:模型 | 创空间
[3] I2VGen-XL: 模型 | 创空间
[4] MusicGen: 模型 | 创空间