python基于pywinauto实现PC端自动化 python操作微信自动化

时间:2024-02-19 15:31:45

一、 pywinauto安装和启动

1.安装:

pip install pywinauto

2.backend选择 和 控件查看工具inspect介绍

我们安装好Pywinauto之后,首先要确定哪种可访问性技术(backend)可以用于我们的应用程序,在windows上受支持的有两种:

  • Win32 API (backend= "win32") 默认的backend

  • MS UI Automation (backend="uia")

如果不能确定程序到底适用于那种backend,可以借助于GUI对象检查工具来做,常用的检查工具有Inspect.exSpy++ ,下载地址:https://github.com/blackrosezy/gui-inspect-tool

giithub的项目中的inspect好像不行了,可以用下面这个:

链接:https://pan.baidu.com/s/1LHvbcP5NKqSHC7FLSpiTFQ
提取码:p4hm

将inspect左上角的下拉列表中切换到“UI Automation”,然后鼠标点一下你需要测试的程序窗体,inspect就会显示相关信息,如下图所示。说明backend为uia

 程序里面的任意一个部位其实都是控件,在inspect的控件树中都可以找到,是一层一层分级别的,可以一个个点开所有控件

2.启动(实例化程序):以微信示例

from pywinauto.application import Application
# 常用方式一:连接已有微信进程(进程号在 任务管理器-详细信息 可以查看,项目中一般根据进程名称自动获取)
app = Application(backend=\'uia\').connect(process=8948)
# 常用方式二:启动微信进程 (注意路径中特殊字符的转义,/和\,不注意有时会出错)
app = Application(backend="uia").start(r\'C:\Program Files (x86)\Tencent\WeChat\WeChat.exe\') 

3.Application对象app的常用方法

通过查看pywinauto的源码中application.py文件,可以看到app的所有属性方法,下面列举常用方法:

app.top_window()
# 返回应用程序当前顶部窗口,是WindowSpecification对象,可以继续使用对象的方法往下继续查找控件
# eg:如:app.top_window().child_window(title=\'地址和搜索栏\', control_type=\'Edit\')

app.window(**kwargs)
# 根据筛选条件,返回一个窗口, 是WindowSpecification对象,可以继续适用对象的方法往下继续查找控件
# eg: 微信主界面 app.window(class_name=\'WeChatMainWndForPC\')

app.windows(**kwargs)
# 根据筛选条件返回一个窗口列表,无条件默认全部,列表项为wrapped对象,可以使用wrapped对象的方法,注意不是WindowSpecification对象
# eg:[<uiawrapper.UIAWrapper - \'李渝的早报 - Google Chrome\', Pane, -2064264099699444098>]

app.kill(soft=False) # 强制关闭
app.cpu_usage() # 返回指定秒数期间的CPU使用率百分比
app.wait_cpu_usage_lower(threshold=2.5, timeout=None, usage_interval=None) # 等待进程CPU使用率百分比小于指定的阈值threshold
app.is64bit() # 如果操作的进程是64-bit,返回True

二、控件定位方法和控件可用方法

操作控件需要以下几个步骤: 

第一步 实例化要操作的进程:得到的app是Application对象

第二步 选择窗口 :app.window(\'一个或多个筛选条件\') 得到的窗口是WindowSpecification对象

第三步:基于WindowSpecification对象使用其方法再往下查找,定位到具体的控件

第四步:使用控件的方法属性执行我们需要的操作

WindowSpecification源码中有一些自带的方法可以直接使用,也有注释说到:

    """
    A specification for finding a window or control

    Windows are resolved when used.
    You can also wait for existance or non existance of a window

    .. implicitly document some private functions
    .. automethod:: __getattribute__
    .. automethod:: __getitem__
    """
WindowSpecification 说明

就是说这是一个查找空间或者窗口的规范,可以使用等待机制。

并且该对象中__getattribute__和__getitem__两个魔术方法,隐式地记录一些私有方法

我的理解是我们可以继续往下一层一层的查找,下面一层一层的控件其实是各种各样的wrapper对象,wrapper有很多种是一系列对象,对象源码都在pywinauto源码的controls目录中

以下总结了常用方法,基本可以满足所有场景的操作,如下:

2.1 层级查找控件的方法

# 通过层级查找控件相关方法+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
window(**kwargs) # 用于窗口的查找
child_window(**kwargs) # 可以不管层级的找后代中某个符合条件的元素,最常用
parent() # 返回此元素的父元素,没有参数
children(**kwargs) # 返回符合条件的子元素列表,支持索引,是BaseWrapper对象(或子类)
iter_children(**kwargs) # 返回子元素的迭代器,是BaseWrapper对象(或子类)
descendants(**kwargs) # 返回符合条件的所有后代元素列表,是BaseWrapper对象(或子类)
iter_children(**kwargs) # 符合条件后代元素迭代器,是BaseWrapper对象(或子类)

2.2 kwargs筛选条件

常用的一些筛选条件:

# 这些是常用的
class_name=None, # 类名
class_name_re=None, # 正则匹配类名
title=None, # 控件的标题文字,对应inspect中Name字段
title_re=None, # 正则匹配文字
control_type=None, # 控件类型,inspect界面LocalizedControlType字段的英文名
best_match=None, # 这个有坑,我不喜欢用,下文有讲解
auto_id=None, # 这个也是固定的可以用,inspect界面AutomationId字段,但是很多控件没有这个属性
# 下面这些不常用,基本用不到
parent=None,
process=None,# 这个基本不用,每次启动进程都会变化
top_level_only=True,
visible_only=True,
enabled_only=False,
handle=None,
ctrl_index=None,
found_index=None,
predicate_func=None,
active_only=False,
control_id=None,
framework_id=None,
backend=None,
源码中有我没用过的条件

2.3 控件可用的方法属性

# 以下几个只支持窗口模式的控件=======================================================================
dlg.close() # 关闭界面
dlg.minimize() # 最小化界面
dlg.maximize() # 最大化界面
dlg.restore() # 将窗口恢复为正常大小,比如最小化的让他正常显示在桌面
dlg.get_show_state() # 正常0,最大化1,最小化2

dlg.exists(timeout=None, retry_interval=None) # 判断是否存在
    #timeout:等待时间,一般默认5s
    #retry_interval:timeout内重试时间
dlg.wait(wait_for, timeout=None, retry_interval=None) # 等待窗口处于特定状态
dlg.wait_not(wait_for_not, timeout=None, retry_interval=None) # 等待窗口不处于特定状态,即等待消失
    # wait_for/wait_for_not:
    # * \'exists\' means that the window is a valid handle
    # * \'visible\' means that the window is not hidden
    # * \'enabled\' means that the window is not disabled
    # * \'ready\' means that the window is visible and enabled
    # * \'active\' means that the window is active
    # timeout:等待多久
    # retry_interval:timeout内重试时间
    # eg: dlg.wait(\'ready\')

# 鼠标键盘操作 =====================================================================================
# 我只列举常用形式,他们有很多默认参数但不常用,可以在源码中查看
ctrl.click_input() # 最常用的点击方法,一切点击操作的基本方法(底层调用只是参数不同),左键单击,使用时一般都使用默认不需要带参数
ctrl.right_click_input() # 鼠标右键单击
# 键盘输入,底层还是调用keyboard.send_keys
ctrl.type_keys(keys, pause = None, with_spaces = False,)
    # keys:要输入的文字内容
    # pause:每输入一个字符后等待时间,默认0.01就行
    # with_spaces:是否保留keys中的所有空格,默认去除0
ctrl.double_click_input(button ="left", coords = (None, None)) # 左键双击
ctrl.press_mouse_input(coords = (None, None)) # 指定坐标按下左键,不传坐标默认左上角
ctrl.release_mouse_input(coords = (None, None)) # 指定坐标释放左键,不传坐标默认左上角
ctrl.move_mouse_input(coords=(0, 0)) # 将鼠标移动到指定坐标,不传坐标默认左上角
ctrl.drag_mouse_input(dst=(0, 0)) # 将ctrl拖动到dst,是press-move-release操作集合

# 控件的常用属性===================================================================================
ctrl.children_texts() # 所有子控件的文字列表,对应inspect中Name字段
ctrl.window_text() # 控件的标题文字,对应inspect中Name字段
# ctrl.element_info.name
ctrl.class_name() # 控件的类名,对应inspect中ClassName字段,有些控件没有类名
# ctrl.element_info.class_name
ctrl.element_info.control_type # 控件类型,inspect界面LocalizedControlType字段的英文名
ctrl.is_child(parent) # ctrl是否是parent的子控件
ctrl.legacy_properties().get(\'Value\') # 可以获取inspect界面LegacyIAccessible开头的一系列字段,在源码uiawraper.py中找到了这个方法,非常有用
#如某些按钮显示值是我们想要的,但是window_text获取到的是固定文字‘修改群昵称’,这个值才是我们修改后的新名字
# 控件常用操作======================================================================================== ctrl.draw_outline(colour=\'green\') # 空间外围画框,便于查看,支持\'red\', \'green\', \'blue\' ctrl.print_control_identifiers(depth=None, filename=None) # 打印其包含的元素,详见打印元素 ctrl.scroll(direction, amount, count=1,) # 滚动 # direction :"up", "down", "left", "right" # amount:"line" or "page" # count:int 滚动次数 ctrl.capture_as_image() # 返回控件的 PIL image对象,可继续使用其方法如下: eg: ctrl.capture_as_image().save(img_path) ret = ctrl.rectangle() # 控件上下左右坐标,(L430, T177, R1490, B941),可.输出上下左右 eg: ret.top=177 ret.bottom=941 ret.left=430 ret.right=1490

三、具体使用举例

第二节中列举了能用到的方法属性,本节列举实际操作中的具体用法

1.对话框dialog选择

根据pywinauto的源码中application.py文件介绍,窗口选择有三种方式:

Once you have an Application instance you can access dialogs in that
application either by using one of the methods below. ::

   dlg = app.YourDialogTitle
   dlg = app.child_window(title="your title", classname="your class", ...)
   dlg = app[\'Your Dialog Title\']
View Code

以微信主界面窗口为例:

# 微信主界面几种方式:
# 这个最好用,下面几种不指名道姓容易出错且速度很慢
dlg1 = app.window(class_name=\'WeChatMainWndForPC\') # 是WindowSpecification对象
# 下面几种方法速度慢,我是不喜欢用
# dlg2_1 = app.Dialog
# dlg2_2 = app.微信
# dlg3_1 = app[\'Dialog\']
# dlg3_2 = app[\'微信\']

2.打印元素

我们拿到控件后,是可以将该控件下的所有子控件及其属性以树形结构打印出来的:

# 拿到微信主窗口
win_main_Dialog = app.window(class_name=\'WeChatMainWndForPC\')

# 判断是否为dialog,一个微信是一个dialog,就是窗口
print(win_main_Dialog.is_dialog)

# 给控件画个红色框便于看出是哪个
win_main_Dialog.draw_outline(colour = \'red\')

# 打印当前窗口的所有controller(控件和属性)
win_main_Dialog. print_control_identifiers(depth=None, filename=None)
# 源码内部函数名链式赋值了,都能用,一样的
# print_ctrl_ids = dump_tree = print_control_identifiers

depth:打印的深度,缺省时打印最大深度。
filename:将返回的标识存成文件(生成的文件与当前运行的脚本在同一个路径下)
eg:dlg. print_control_identifiers(filename =’a.txt’)

打印出来的文档树就是inspect中的控件树完全展开的样子,都是有层级的,和微信程序中的各个元素是一一对应的:

3 常用查找方法

# 拿到微信主窗口
win_main_Dialog = app.window(class_name=\'WeChatMainWndForPC\')
# 主窗口下的某个窗口,不管层级的找
chat_list = win_main_Dialog.child_window(control_type=\'List\', title=\'会话\')
first = chat_list.items()[0] # 第一个聊天项  列表支持items(),支持循环,支持索引

# 详情页修改备注操作  parent()和children()都是只往上或往下查找一个层级,所有满足的放进列表
details_page = win_main_Dialog.child_window(class_name=\'ContactProfileWnd\') # 窗口下的某个窗口
we_id = details_page.child_window(title="微信号:", control_type="Text").parent().children()[1].window_text() # 窗口的爸爸的第二个儿子的文字
alia = details_page.child_window(title="微信号:", control_type="Text").parent().parent().children()[0].children()[0].window_text()
edit_btn = details_page.child_window(title="备   注", control_type="Text").parent().children()[1]
edit_btn.click_input()
btn_modify_name_edit = edit_btn
# 先ctrl+a选中所有然后再type_keys替换
btn_modify_name_edit.type_keys(\'^a\').type_keys(\'备注名字\', with_spaces=True)

# descendants查找所有后代中满足的,不管层级,所有满足的放进列表
btns_list = win_main_Dialog.child_window(control_type=\'ToolBar\').parent().descendants(control_type=\'Button\')
btns_list[0].click_input()

dialog.child_window(title="文件名(N):", auto_id="1148", control_type="Edit")

4 快速定位

定位一个元素我们可以一层一层定位,但是这样真就有点笨蛋了,不仅效率低下还不容易适应结构变化,可以先定位某个页面,打印出页面结构,然后基于页面快速定位

 

 

 

    def we_name(self):
        # todo+++++++++++++++++++++++++++++++++++++
        try:
            self._popup = wechat.win_main.child_window(class_name=\'ContactProfileWnd\')
            self._popup.wait(\'visible\')
            self._popup.print_control_identifiers(depth=None, filename=None)

            print(self._popup.Edit.window_text()) # www.pu