python+gemini api实现在网页中websocket实时音视频聊天示例代码

代码语言:python

所属分类:其他

代码描述:python+gemini api实现在网页中websocket实时音视频聊天示例代码,几乎无延迟,就能使用gemini的多模态大模型实时音视频通话聊天。

代码标签: python gemini api 网页 websocket 实时 音视频 聊天 示例 代码

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

import asyncio
import pyaudio
import sys
from google import genai

# 配置参数
API_KEY = "AIz********************"  # 替换为你的 Gemini API Key
MODEL = "gemini-2.0-flash-exp"  # 使用支持实时的模型

# 音频配置 (Gemini Live API 标准要求)
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 24000  # Gemini 输出通常为 24kHz
CHUNK_SIZE = 512

class AudioLoop:
    def __init__(self):
        self.audio = pyaudio.PyAudio()
        self.out_queue = asyncio.Queue()
        self.running = True

    async def send_audio(self, session):
        """从麦克风捕获音频并发送给 Gemini"""
        stream = self.audio.open(
            format=FORMAT,
            channels=CHANNELS,
            rate=16000,  # 输入音频采样率推荐 16kHz
    .........完整代码请登录后点击上方下载按钮下载查看

网友评论0