python+gemini api实现在网页中websocket实时音视频聊天示例代码
代码语言:python
所属分类:其他
代码描述:python+gemini api实现在网页中websocket实时音视频聊天示例代码,几乎无延迟,就能使用gemini的多模态大模型实时音视频通话聊天。
代码标签: python gemini api 网页 websocket 实时 音视频 聊天 示例 代码
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
import asyncio
import pyaudio
import sys
from google import genai
# 配置参数
API_KEY = "AIz********************" # 替换为你的 Gemini API Key
MODEL = "gemini-2.0-flash-exp" # 使用支持实时的模型
# 音频配置 (Gemini Live API 标准要求)
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 24000 # Gemini 输出通常为 24kHz
CHUNK_SIZE = 512
class AudioLoop:
def __init__(self):
self.audio = pyaudio.PyAudio()
self.out_queue = asyncio.Queue()
self.running = True
async def send_audio(self, session):
"""从麦克风捕获音频并发送给 Gemini"""
stream = self.audio.open(
format=FORMAT,
channels=CHANNELS,
rate=16000, # 输入音频采样率推荐 16kHz
.........完整代码请登录后点击上方下载按钮下载查看















网友评论0