python使用whisper+opencc实现音频声音自动识别转成srt字幕文件代码
代码语言:python
所属分类:其他
代码描述:python使用whisper+opencc实现音频声音自动识别转成srt字幕文件代码,OpenCC只要解决繁体字与简体的转换。
代码标签: python whisper opencc 音频 声音 自动 识别 转成 srt 字幕 文件 代码
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
#pip install -U openai-whisper #pip install -U opencc #pip install moviepy import whisper from moviepy.editor import VideoFileClip from opencc import OpenCC # 用于繁体到简体转换 # 使用 Whisper 转录音频并生成 SRT 文件 def generate_srt_from_audio(audio_file, srt_file): # 加载 Whisper 模型 model = whisper.load_model("base") # 初始化 OpenCC 转换器 cc = OpenCC('t2s') # 从繁体转为简体 # 转录音频并获取时间戳 result = model.transcribe(audio_file, language="zh", task="transcribe") # 导出 SRT 字幕文件 def export_srt(result, filename): def srt_timestamp(seconds): h = int(seconds // 3600) m = int((seconds % 3600) // 60) s = int(seconds % 60) ms = int((seconds % 1) * 1000) return f"{h:02}:{m:02}:{s:02},{ms:03}" srt_content = [] for i, segment.........完整代码请登录后点击上方下载按钮下载查看
网友评论0