python+阿里api实现参考照片与音频+说话内容生成这个人说话的数字人视频代码

代码语言:python

所属分类:其他

代码描述:python+阿里api实现参考照片与音频+说话内容生成这个人说话的数字人视频代码,只要一个人的照片和这个人说话的3s声音,输入台词 文案,就能生成这个人说台词内容的完整视频。

代码标签: python 阿里 api 参考 照片 音频 说话 内容 生成 数字人 视频 代码

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

import os
import subprocess
import requests
import time
import uuid
import json
import asyncio
import httpx
import oss2
import dashscope
import logging
from dashscope.audio.tts_v2 import SpeechSynthesizer

# 配置日志输出,以支持 dashscope_imgtovideo 中的 logging 调用
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# ================= 配置区 =================
# 1. 阿里云 OSS 配置
OSS_ACCESS_KEY_ID =""
OSS_ACCESS_KEY_SECRET =""
OSS_ENDPOINT ="oss-cn-beijing.aliyuncs.com"
OSS_BUCKET_NAME =""

# 拼接公网访问域名 (需确保 Bucket 已开启公共读权限)
OSS_PUBLIC_DOMAIN = f"https://{OSS_BUCKET_NAME}.{OSS_ENDPOINT}"

# 2. 阿里云 DashScope 配置
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY', "sk-")
dashscope.api_key = DASHSCOPE_API_KEY

# 3. FFmpeg 路径 (虽然此流程不需要分离音视频,但保留以备不时之需)
FFMPEG_PATH = 'ffmpeg'
# ==========================================

# ──────────────────────────────────────────────────────────
# 辅助函数:阿里云 DashScope 图生视频 (Wanx 异步生成)
# ──────────────────────────────────────────────────────────
async def dashscope_imgtovideo(
    img_url: str,
    prompt: str,
    api_key: str,
    http_client: httpx.AsyncClient,
    resolution: str = "720P",
    duration: int = 5,
    prompt_extend: bool = True,
    model: str = "wan2.2-i2v-flash"
) -> str:
    """
    异步提交首帧图片生成视频任务,并进行循环状态查询直到成功或失败
    """
    submit_url = "https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis"
    headers = {
        ".........完整代码请登录后点击上方下载按钮下载查看

网友评论0