百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

python自动化办公——定位按钮

yuyutoo 2024-11-24 01:04 1 浏览 0 评论

想要python自动点击按钮,首先得定位按钮,python定位按钮有如下几种方式:

一. 使用坐标定位


1.我们需要获取屏幕的分辨率,以便计算出按钮在屏幕上的实际坐标。可以使用win32api库提供的GetSystemMetrics函数来获取屏幕的分辨率。

import win32api
screen_width = win32api.GetSystemMetrics(0)
screen_height = win32api.GetSystemMetrics(1)

2. 计算出按钮在屏幕上的实际坐标。假设按钮在屏幕上的相对坐标是(100, 200),那么它在屏幕上的实际坐标可以通过以下公式计算:

button_x = int(screen_width * 100 / 1920)
button_y = int(screen_height * 200 / 1080)

其中,1920和1080分别是屏幕的宽度和高度,100和200分别是按钮在屏幕上的相对坐标。

3. 使用win32api库提供的mouse_event函数来模拟鼠标点击。例如,如果我们要在按钮上单击左键,可以使用以下代码:

import win32api
import win32con
win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN, button_x, button_y, 0, 0)
win32api.mouse_event(win32con.MOUSEEVENTF_LEFTUP, button_x, button_y, 0, 0)

win32con.MOUSEEVENTF_LEFTDOWN表示鼠标左键按下,win32con.MOUSEEVENTF_LEFTUP表示鼠标左键释放,button_x和button_y是按钮在屏幕上的实际坐标。

这样,我们就可以使用坐标定位的方式来模拟鼠标点击了。需要注意的是,使用坐标定位的方式需要计算出按钮在屏幕上的实际坐标,因此需要获取屏幕的分辨率。同时,由于不同的计算机分辨率可能不同,因此需要根据实际情况进行调整。

二. 使用图像识别定位

可以使用pyautogui.locateOnScreen()函数在屏幕上查找指定图像的位置,并返回该图像在屏幕上的坐标。我们可以将按钮的截图保存为一个PNG或JPG文件,然后使用pyautogui.locateOnScreen()函数来查找该图像在屏幕上的位置。这种方式比较灵活,但是对于相似的图像容易出现误判。

1.获取屏幕的截图,并保存到本地。可以使用pyautogui库提供的screenshot函数来获取屏幕截图,然后使用pyscreeze库提供的imwrite函数将截图保存到本地。

import pyautogui
import pyscreeze
screenshot = pyautogui.screenshot()
pyscreeze.imwrite('screenshot.png', screenshot)

2.加载要搜索的图像,并在屏幕截图中搜索它。可以使用pyscreeze库提供的locate函数来搜索图像,并返回它在屏幕截图中的位置。

import pyscreeze
button_image = pyscreeze.imread('button.png')
button_position = pyscreeze.locate(button_image, screenshot)

其中,'button.png'是要搜索的图像的文件名,button_image是加载的图像,screenshot是屏幕截图。

3.使用pyautogui库提供的click函数来模拟鼠标点击。例如,如果我们要在按钮上单击左键,可以使用以下代码:

import pyautogui
button_x, button_y = pyautogui.center(button_position)
pyautogui.click(button_x, button_y)

pyautogui.center函数可以计算出图像在屏幕截图中的中心坐标,button_x和button_y是按钮在屏幕上的实际坐标。

这样,我们就可以使用图像定位的方式来模拟鼠标点击了。需要注意的是,使用图像定位的方式需要加载要搜索的图像,并在屏幕截图中搜索它,因此需要一定的时间和计算量。同时,由于图像的颜色、大小、位置等可能会发生变化,因此需要根据实际情况进行调整。

三. 使用控件ID定位

假设我们要在Windows操作系统中打开“计算器”应用程序,并查找其中的“1”按钮控件。这时,我们可以使用控件ID定位的方式来查找该控件。

(一)、使用win32gui库和win32api库

1. 查找“计算器”应用程序的窗口句柄。可以使用win32gui库提供的FindWindow函数来查找窗口,需要传入窗口类名和窗口标题。

import win32gui
calc_handle = win32gui.FindWindow('CalcFrame', 'Calculator')

'CalcFrame'是“计算器”应用程序的窗口类名,'Calculator'是窗口标题。

2. 查找“1”按钮控件,并将其激活。可以使用win32gui库提供的FindWindowEx函数来查找控件,需要传入父窗口句柄、控件类名和控件标题。

import win32gui
button_handle = win32gui.FindWindowEx(calc_handle, 0, 'Button', '1')
win32gui.SetForegroundWindow(button_handle)

'Button'是“计算器”应用程序中的按钮控件类名,'1'是按钮控件的标题。

3. 我们可以使用win32api库提供的SendMessage函数来模拟按钮点击。例如,如果我们要点击“1”按钮,可以使用以下代码:

import win32api
import win32con
win32api.SendMessage(button_handle, win32con.WM_LBUTTONDOWN, win32con.MK_LBUTTON, 0)
win32api.SendMessage(button_handle, win32con.WM_LBUTTONUP, win32con.MK_LBUTTON, 0)

win32con.WM_LBUTTONDOWN表示鼠标左键按下事件,win32con.WM_LBUTTONUP表示鼠标左键释放事件,win32con.MK_LBUTTON表示鼠标左键被按下,0表示鼠标事件的坐标。

(二)、使用pywinauto库

1. 导入pywinauto库,并使用Application类来打开“计算器”应用程序。

from pywinauto.application import Application
app = Application().start('calc.exe')

2. 使用Application类的connect方法来连接已经打开的“计算器”应用程序。

from pywinauto.application import Application
app = Application().connect(title='Calculator')

3. 使用Application类的top_window方法来获取“计算器”应用程序的主窗口。

from pywinauto.application import Application
app = Application().connect(title='Calculator')
main_window = app.top_window()

4. 使用主窗口的child_window方法来查找“1”按钮控件,并将其激活。

from pywinauto.application import Application
app = Application().connect(title='Calculator')
main_window = app.top_window()
button = main_window.child_window(title='1', control_type='Button')
button.click()

'1'是按钮控件的标题,'Button'是按钮控件的类名。

(三)、如何知道某个控件的类名和标题呢?

可以使用Spy++工具,该工具可以用来查看窗口和控件的信息,包括窗口句柄、窗口类名、窗口标题、控件句柄、控件类名、控件标题等。

四. 使用快捷键定位

有些应用程序支持使用快捷键来触发按钮的操作,例如使用`Alt+S`来保存文件。我们可以使用`pyautogui.hotkey()`函数模拟按下快捷键,从而触发按钮的操作。这种方式比较简单,但是需要应用程序支持快捷键。

需要根据具体情况选择合适的定位方式,从而实现自动化办公。


接下来我们将重点研究图片定位和控件ID定位,敬请关注!

相关推荐

TCP协议原理,有这一篇就够了

先亮出这篇文章的思维导图:TCP作为传输层的协议,是一个软件工程师素养的体现,也是面试中经常被问到的知识点。在此,我将TCP核心的一些问题梳理了一下,希望能帮到各位。001.能不能说一说TC...

Win10专业版无线网络老是掉线的问题

有一位电脑基地的用户,使用...

学习计算机网络需要掌握以下几方面基础知识

计算机基础知识操作系统:了解常见操作系统(如Windows、Linux)的基本操作和网络配置,例如如何设置IP地址、子网掩码、网关和DNS服务器等,以及如何通过命令行工具(如ping、tr...

网络工程师的圣经!世界级网工手绘268张图让TCP/IP直接通俗易懂

要把知识通俗地讲明白,真的不容易。——读者说TCP/IP从字面意义上讲,有人可能会认为TCP/IP是指TCP和IP两种协议。实际生活当中有时候也确实就是这两种协议。然而在很多情况下,它只是...

三分钟了解通信知识TCP与IP协议(含“通信技术”资料分享)

TCP/IPTCP/IP分层模型①应用层...

网闸与防火墙:网络安全设备的差异与应用

在网络安全领域,网闸(安全隔离网闸,GAP)和防火墙(Firewall)是两类重要的防护设备。尽管它们都服务于网络安全防护,但在设计理念、技术原理、安全效能及适用场景等方面存在显著差异,以下从五个维度...

S7-300的TCP/IP通信

一、首先在项目中创建2个S7-300的站点;二、硬件组态中,设置合适的TCP/IP地址,在同一网段内;...

西门子S7-1500 PLC的 MODBUS TCP通信

MODBUSTCP使MODBUS_RTU协议运行于以太网,MODBUSTCP使用TCP/IP和以太网在站点间传送MODBUS报文,MODBUSTCP结合了以太网物理网络和网络标准TC...

系统规划与管理师新版备考必备:第7章考点思维导图解析

备考系统规划与管理师的小伙伴们,福利又来啦!今天为大家带来《系统规划与管理师(第2版)》第7章考点的思维导图,助你高效梳理重点,让备考更有方向!...

TCP/IP、Http、Socket 有何区别与联系?

HTTP协议对应于应用层,Socket则是对TCP/IP协议的封装和应用(程序员层面上)。HTTP是应用层协议,主要解决如何包装数据。而我们平时说的最多的Socket是什么呢?实际上...

西门子PLC串口协议与以太网通信协议对比

西门子plc品牌众多,通信协议的类型就更多了,具体可分为串口协议和以太网通信协议两大类。...

网络编程懒人入门(十三):一泡尿的时间,快速搞懂TCP和UDP的区别

本文引用了作者Fundebug的“一文搞懂TCP与UDP的区别”一文的内容,感谢无私分享。1、引言...

程序员必备的学习笔记《TCP/IP详解(一)》

为什么会有TCP/IP协议在世界上各地,各种各样的电脑运行着各自不同的操作系统为大家服务,这些电脑在表达同一种信息的时候所使用的方法是千差万别。就好像圣经中上帝打乱了各地人的口音,让他们无法合作一样...

一文读懂TCP/IP协议工作原理和工作流程

简述本文主要介绍TCP/IP协议工作原理和工作流程。含义TCP/IP协议,英文全称TransmissionControlProtocol/InternetProtocol,包含了一系列构成互联网...

如何在 Windows 10 和 Windows 11 上重置 TCP/IP 堆栈

传输控制协议/Internet协议,通常称为TCP/IP,是您的WindowsPC如何与Internet上的其他设备进行通信的关键部分。但是当事情出错时会发生什么?你如何解决它?幸运的...

取消回复欢迎 发表评论: