5

本视频由 保利威 提供技术支持

视频介绍

智能模式第十节课:任务的运行设置(定时启动和数据去重)

大家好,这是后羿采集器智能模式系列课程的第十节课,主要给大家介绍一下后羿采集器智能模式中的任务的运行设置(定时启动和数据去重)。

定时启动有两种设置,一种是循环采集,循环采集只有间隔时间,没有结束时间,所以除非进行手动停止,任务会一直运行下去。之类的间隔时间是前一次任务运行自动停止之后到下一次自动开始之间的间隔。

另一种定时启动是有开始和结束时间,启动频率可以设置为一次,每天、每周或每小时。

需要注意的是,如果在下一次启动任务时间到达之前,前一次任务还没有停止,软件会自动停止该任务,然后重新启动。

定时采集是重头开始运行采集任务,所以是重复采集,如果想只采集最新的数据,我们可以结合之前教程中提到的数据筛选功能,或者使用数据去重功能。

数据去重有两种设置,第一种是当数据重复时,跳过继续采集,这样可以保证即使任务从头开始采集,也不会将已经采集过的数据再采集下来,但是实际上采集行为还是有的,并且需要将当前采集到的数据与已采集的数据进行逐个比较,比较时我们可以选择对所有字段进行比较,也可以对某一个字段进行比较。数据比较过程会在一定程度上影响采集速度,数据量越大影响越大。

另一种设置是当数据重复时,停止采集任务,这种通常会用于对采集任务刷新速度要求比较高的场景。

关闭