python+千问qwen-vl视觉大模型实现ai自动化操作win10电脑完成任务代码

代码语言:python

所属分类:其他

代码描述:python+千问qwen-vl视觉大模型实现ai自动化操作win10电脑完成任务代码,一条指令需求,ai自动操作你的win10电脑,截屏模拟点击,输入文本,完成任务。

代码标签: python 千问 qwen-vl 视觉 大模型 win10 电脑 ai 自动化 操作 完成 任务

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

import os
import time
import base64
import json
import subprocess
import ctypes  # [新增] 引入 ctypes 库
from openai import OpenAI
from PIL import Image, ImageGrab
import pyautogui
import pyperclip

# ================= 核心修复:处理 Windows 缩放 =================
# 强制让 Python 进程感知 DPI,统一截图和鼠标的坐标系
try:
    ctypes.windll.shcore.SetProcessDpiAwareness(1)
except Exception:
    ctypes.windll.user32.SetProcessDPIAware()

# ================= 配置 =================
OPENAI_API_KEY = "sk-"  # 替换为你的 DashScope API Key
MODEL_INPUT_SIZE = 1120 

client = OpenAI(
    api_key=OPENAI_API_KEY,
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

pyautogui.FAILSAFE = True
pyautogui.PAUSE = 0.5

# ================= 通用桌面操作 =================

def capture_and_resize(original_path=&q.........完整代码请登录后点击上方下载按钮下载查看

网友评论0