python+阿里api实现参考照片与音频+说话内容生成这个人说话的数字人视频代码-python代码-BFW代码库

python+阿里api实现参考照片与音频+说话内容生成这个人说话的数字人视频代码

代码语言：python

所属分类：其他

代码描述：python+阿里api实现参考照片与音频+说话内容生成这个人说话的数字人视频代码，只要一个人的照片和这个人说话的3s声音，输入台词文案，就能生成这个人说台词内容的完整视频。

下面为部分代码预览，完整代码请点击下载或在bfwstudio webide中打开

import os
import subprocess
import requests
import time
import uuid
import json
import asyncio
import httpx
import oss2
import dashscope
import logging
from dashscope.audio.tts_v2 import SpeechSynthesizer

# 配置日志输出，以支持 dashscope_imgtovideo 中的 logging 调用
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# ================= 配置区 =================
# 1. 阿里云 OSS 配置
OSS_ACCESS_KEY_ID =""
OSS_ACCESS_KEY_SECRET =""
OSS_ENDPOINT ="oss-cn-beijing.aliyuncs.com"
OSS_BUCKET_NAME =""

# 拼接公网访问域名 (需确保 Bucket 已开启公共读权限)
OSS_PUBLIC_DOMAIN = f"https://{OSS_BUCKET_NAME}.{OSS_ENDPOINT}"

# 2. 阿里云 DashScope 配置
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY', "sk-")
dashscope.api_key = DASHSCOPE_API_KEY

# 3. FFmpeg 路径 (虽然此流程不需要分离音视频，但保留以备不时之需)
FFMPEG_PATH = 'ffmpeg'
# ==========================================

# ──────────────────────────────────────────────────────────
# 辅助函数：阿里云 DashScope 图生视频 (Wanx 异步生成)
# ──────────────────────────────────────────────────────────
async def dashscope_imgtovideo(
    img_url: str,
    prompt: str,
    api_key: str,
    http_client: httpx.AsyncClient,
    resolution: str = "720P",
    duration: int = 5,
    prompt_extend: bool = True,
    model: str = "wan2.2-i2v-flash"
) -> str:
    """
    异步提交首帧图片生成视频任务，并进行循环状态查询直到成功或失败
    """
    submit_url = "https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis"
    headers = {
        ".........完整代码请登录后点击上方下载按钮下载查看