🎭 数字人模型

数字人模型专门用于生成与人物相关的AI视频内容,包括音频驱动的人物视频生成等多种功能。

🎭 OmniHuman 音频驱动人物视频生成

OmniHuman 是 ByteDance 推出的音频驱动人物视频生成模型,能够使用与音频文件配对的人物图像生成视频。它制作出生动、高质量的视频,其中角色的情绪和动作与音频保持着很强的相关性。

💰 OmniHuman 价格表

💳 积分扣除规则

按照音频长度计算:42积分/秒

  • SVIP 会员:基础价格 42积分/秒
  • VIP 会员:基础价格 + 50%,但增加的金额不超过50积分
  • 普通会员:基础价格翻倍,但增加的金额不超过100积分
会员等级 音频时长 计算公式 价格示例
SVIP 任意时长(≤30秒) 42积分 × 秒数 5秒=210积分,10秒=420积分,30秒=1260积分
VIP 任意时长(≤30秒) 42积分 × 秒数 + min(42积分×秒数×0.5, 50积分) 5秒=273积分,10秒=470积分,30秒=1310积分
普通会员 任意时长(≤30秒) 42积分 × 秒数 + min(42积分×秒数, 100积分) 5秒=310积分,10秒=520积分,30秒=1360积分

📋 OmniHuman 模型案例

OmniHuman 音频驱动人物视频生成

APP st-ai/bytedance/omnihuman
{
  "app_name": "st-ai/bytedance/omnihuman",
  "input_params": {
    "image_url": "https://s.coze.cn/t/Yfus-lf4L60/",
    "audio_url": "https://ve-template-0920.oss-cn-shanghai.aliyuncs.com/uploads/1754297672316_omx2b63rlh.mp3"
  }
}

📝 OmniHuman 参数说明

参数名 类型 必填 描述 限制
image_url string 用于生成视频的人物图像URL 有效的图片URL,推荐人物正面照片
audio_url string 用于生成视频的音频文件URL 音频时长必须不超过30秒

📤 OmniHuman 输出格式

{
  "video": {
    "url": "https://storage.googleapis.com/falserverless/example_outputs/omnihuman_output.mp4"
  }
}

🎬 输出效果展示

以下是 OmniHuman 模型生成的视频效果示例:结合人物图像和音频生成的逼真数字人视频。

示例视频:展示 OmniHuman 音频驱动人物视频生成效果

🎯 OmniHuman 应用场景

1. 虚拟主播内容

将静态人物图片与语音结合,生成虚拟主播视频内容。

2. 教育培训

为在线课程制作生动的讲师视频,提升教学体验。

3. 营销推广

快速制作产品介绍视频,让品牌形象更加生动。

4. 个人创作

将个人照片与音频结合,制作个性化视频内容。

⚠️ OmniHuman 使用注意事项
  • 音频时长限制:音频文件时长不能超过30秒
  • 图片质量:推荐使用清晰的人物正面照片,避免侧脸或模糊图片
  • 音频质量:使用清晰的音频文件可以获得更好的唇形同步效果
  • 内容合规:确保使用的图片和音频符合相关法律法规
  • 成本控制:音频越长成本越高,建议根据需要合理控制音频时长