镜像社区
部署GPU实例
模型API
文档中心
常见问题(FAQ)
数字人
ComfyUI
最强图片数字人Multitalk唱歌说话(支持长视频)
最强的图片数字人,支持唱歌、说话,效果超强!
0/小时
v1.0

Multitalk(支持长视频) 镜像使用教程

效果展示+云端使用教程:

B站演示视频:https://www.bilibili.com/video/BV1GTuBzvE4A/?vd_source=6c8b8679b818b05d24c65f49a65eb994

与AI同行-镜像作者交流群

image

1、在镜像详情界面点击“使用该镜像创建实例”,如没有注册平台,可先注册登录。

image.png

2、选择GPU型号(推荐24G显存或48G显存),再点击“立即部署”。

PS:该模型较大,请根据视频长度选择合适显存的显卡。

(1) 40s及以下长度视频需要24G显存,90s及以下长度需要至少32G显存,120s及以下长度需要48G显存

(2) 如果视频长度超过120s,建议先本地剪辑音频,分段生成即可。每段剪辑长度根据(1)中的显卡显存。

image.png

3. 工作流在comfyui左侧,打开即用。支持单人、多人(最多4人)说话、唱歌。

image.png

镜像信息
@与AI同行
已使用
217
镜像大小150GB
最近编辑2025-07-12
支持卡型
RTX40系48G RTX40系H20
+3
框架版本
PyTorch-Torch2.7.1
CUDA版本
12.8
应用
JupyterLab: 8888
版本
v1.0
2025-07-31
PyTorch:Torch2.7.1 | CUDA:12.8 | 大小:150.00GB