python+千问qwen-vl视觉大模型实现ai自动化操作win10电脑完成任务代码
代码语言:python
所属分类:其他
代码描述:python+千问qwen-vl视觉大模型实现ai自动化操作win10电脑完成任务代码,一条指令需求,ai自动操作你的win10电脑,截屏模拟点击,输入文本,完成任务。
代码标签: python 千问 qwen-vl 视觉 大模型 win10 电脑 ai 自动化 操作 完成 任务
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
import os
import time
import base64
import json
import subprocess
import ctypes # [新增] 引入 ctypes 库
from openai import OpenAI
from PIL import Image, ImageGrab
import pyautogui
import pyperclip
# ================= 核心修复:处理 Windows 缩放 =================
# 强制让 Python 进程感知 DPI,统一截图和鼠标的坐标系
try:
ctypes.windll.shcore.SetProcessDpiAwareness(1)
except Exception:
ctypes.windll.user32.SetProcessDPIAware()
# ================= 配置 =================
OPENAI_API_KEY = "sk-" # 替换为你的 DashScope API Key
MODEL_INPUT_SIZE = 1120
client = OpenAI(
api_key=OPENAI_API_KEY,
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)
pyautogui.FAILSAFE = True
pyautogui.PAUSE = 0.5
# ================= 通用桌面操作 =================
def capture_and_resize(original_path=&q.........完整代码请登录后点击上方下载按钮下载查看















网友评论0