python使用whisper+opencc实现音频声音自动识别转成srt字幕文件代码

代码语言:python

所属分类:其他

代码描述:python使用whisper+opencc实现音频声音自动识别转成srt字幕文件代码,OpenCC只要解决繁体字与简体的转换。

代码标签: python whisper opencc 音频 声音 自动 识别 转成 srt 字幕 文件 代码

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

#pip install -U openai-whisper
#pip install -U opencc
#pip install moviepy
import whisper
from moviepy.editor import VideoFileClip
from opencc import OpenCC  # 用于繁体到简体转换

# 使用 Whisper 转录音频并生成 SRT 文件
def generate_srt_from_audio(audio_file, srt_file):
    # 加载 Whisper 模型
    model = whisper.load_model("base")
    # 初始化 OpenCC 转换器
    cc = OpenCC('t2s')  # 从繁体转为简体
    # 转录音频并获取时间戳
    result = model.transcribe(audio_file, language="zh", task="transcribe")

    # 导出 SRT 字幕文件
    def export_srt(result, filename):
        def srt_timestamp(seconds):
            h = int(seconds // 3600)
            m = int((seconds % 3600) // 60)
            s = int(seconds % 60)
            ms = int((seconds % 1) * 1000)
            return f"{h:02}:{m:02}:{s:02},{ms:03}"

        srt_content = []
        for i, segment.........完整代码请登录后点击上方下载按钮下载查看

网友评论0