旺店通多页连续表格数据抓取

描述

支持批量抓取旺店通多页面表格数据。 旺店通多页连续表格数据抓取

配置项说明

输入

窗口对象

输入一个窗口对象,不传为 None 时根据元素自动匹配窗口。

抓取目标

要抓取的表格元素或表格内的元素。

保存至数据表格

是否将结果保存至数据表格。

抓取页数

设置要抓取的最大页数

翻页间隔(s)

为了获取某些动态加载的数据,需要在抓取数据前等待其加载,"翻页间隔"即是在抓取数据前的等待时间

下一页按钮

下一页按钮(分页元素)

模拟人工点击翻页按钮

如果使用模拟人工点击则通过模拟人工的方式触发点击事件,否则将根据目标元素的自动化接口触发点击

输出

保存批量数据至

指定一个变量名称,该变量用于保存获取到的网页批量数据。

使用示例

示例1

指定窗口对象:通过“获取窗口对象”获取到的旺店通窗口

指定抓取目标:通过“获取元素对象”获取到的旺店通表格或表格内元素

指定下一页按钮:选中元素库中捕获的旺店通下一页按钮

完成多页连续批量数据抓取

旺店通多页连续表格数据抓取

示例2

不指定旺店通窗口对象

指定抓取目标:选中元素库中捕获的旺店通表格或表格内元素

指定下一页按钮:选中元素库中捕获的旺店通下一页按钮

直接调用“旺店通多页连续表格数据抓取”自定义指令,则根据元素自动匹配窗口

旺店通多页连续表格数据抓取

编码版

概述

xbot_extensions.Shadowbot_WDT.extract_table.wdt_extract_table 需要一个旺店通表格或表格内任意一个元素对象作为参数

返回值为目标元素对应的旺店通表格内容

将 wdt_extract_table 嵌套于循环中封装内部逻辑(比如点击下一页按钮等操作)即可

编码版使用示例

import xbot
from xbot import print, sleep
from . import package
import xbot_extensions
from xbot.app import databook


def main(args):
    for i in range(2):
        hele = xbot.win32.get('旺店通').find('wdt_table_td')
        rows = xbot_extensions.Shadowbot_WDT.extract_table.wdt_extract_table(hele)
        for row in rows:
            databook.append_row(row)

        xbot.win32.get('旺店通').find('next_page_btn').click()
        sleep(2)
    pass
问题没有解决?去社区提问 all right reserved,powered by Gitbook

results matching ""

    No results matching ""