python+Whisper+edge-tts免费离线运行语音识别与文字转语音合成web api代码

代码语言:python

所属分类:web系统

代码描述:python+Whisper+edge-tts免费离线运行语音识别与文字转语音合成web api代码成web api,采用flask实现http服务。

代码标签: python Whisper edge-tts 免费 离线 运行 语音识别 文字 语音 合成 w

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
#pip install flask openai-whisper edge-tts

from flask import Flask, request, jsonify, send_file
import whisper
import edge_tts
import asyncio
import os

app = Flask(__name__)

# 加载 Whisper 模型
model = whisper.load_model("base")  # 使用 base 模型,你可以根据需求换成其他模型

# Whisper 语音识别功能
def transcribe_audio(audio_path):
    result = model.transcribe(audio_path)
    return result["text"]

# Edge-TTS 合成文字转语音
async def synthesize_text(text, output_path):
    tts = edge_tts.Communicate(text, "zh-CN-XiaoxiaoNeural")  # 可选择不同语言和发音人
    await tts.save(output_path)

# 语音识别 API
@app.route('/transcribe', methods=['POST'])
def transcribe():
    if 'file' not in request.files:
        return jsonify({"error": "No file provided"}), 400

    audio_file = request.files['file']
    audio_path = os.path.join("temp", audio_file.filename)
    audio_file.save(audio_path)

    # 执行.........完整代码请登录后点击上方下载按钮下载查看

网友评论0