功能说明:可以定义某些条件,当采集的信息项内容符合这些条件时则保存,否则丢弃。该功能可以支持同时几个条件联合匹配。
举例:在某个采集新闻的任务中,我们要标题不为空的记录才保存,否则则丢弃。
源信息:选择某个信息项,这个信息项的内容将作为条件保存的判断主体。
举例:以本文开头的例子举例,这里应该选择“标题”信息项。
操作符:
=:如果源信息项的采集结果 = 条件,则保存该条采集记录。
>:如果源信息项的采集结果 > 条件,则保存该条采集记录。
>=:如果源信息项的采集结果 >= 条件,则保存该条采集记录。
<:如果源信息项的采集结果 < 条件,则保存该条采集记录。
<=:如果源信息项的采集结果 <= 条件,则保存该条采集记录。
<>:如果源信息项的采集结果 <> 条件,则保存该条采集记录。
like:如果条件字符串出现在源信息项的采集结果中,则保存该条采集记录。
all like:如果源信息项的采集结果出现在条件字符串中,则保存该条采集记录。
not like:如果条件字符串没有出现在源信息项的采集结果中,则保存该条采集记录。
备注:=、>、>=、<、<=、<>操作符支持数字和日期类型数据的操作,如可以执行 1 < 3这样的操作,如果是非数字和日期类型的普通字符串,则将取源信息字符串和条件字符串的长度作为匹配的对象。Like、all like、not like只支持字符串类型数据的操作。
举例:以本文开头的例子举例,这里应该选择“<>”操作符。
条件:制定源信息项采集结果要满足的条件。
举例:以本文开头的例子举例,这里应该什么都不填,保持为空。如果要“标题”包含有“快讯”才保存记录,则这里可以填“快讯”。
操作模式:
and:记录满足当前条件保存定义后,还需要同时满足下一条条件保存定义才能最终保存。
or:记录只要满足当前条件保存定义或下一条条件保存定义就能最终保存。
not:记录满足当前条件保存定义后,还需要同时不满足下一条条件保存定义才能最终保存。
备注:如果只定义了一条条件保存规则,则操作模式选项不起任何作用。
连续:如果采集的记录连续超过多少条不符合条件保存规则的定义,则自动停止任务。
新建:点击新建按钮可以新增加一个空的条件保存规则。
添加:点击添加按钮可以将一个已经设置好的条件保存规则添加到上方的规则列表中。
修改:点击修改按钮可以修改规则列表中选中的那条规则的参数。
删除:点击删除按钮可以将规则列表中选中的规则项删除掉。