首页 首页 产品 版本介绍 采集样本 合作伙伴 升级 客服论坛 帮助文档
帮助首页帮助首页
快速上手快速上手
菜单菜单
文件文件
任务任务
工具工具
系统数据库系统数据库
查看查看
任务管理任务管理
任务任务
访问规则访问规则
信息抓取规则(基础设置)信息抓取规则(基础设置)
信息抓取规则(高级设置)信息抓取规则(高级设置)
信息类型信息类型
任务高级设置任务高级设置
存储数据库设置存储数据库设置
网站登录网站登录
计划执行采集任务计划执行采集任务
页面预提处理页面预提处理
提取链接设置提取链接设置
定义特殊链接定义特殊链接
关联页面规则关联页面规则
防止重复访问设置防止重复访问设置
编码编码
删除Htm设置删除Htm设置
结果替换结果替换
自动分类自动分类
条件保存条件保存
保存遍历页面保存遍历页面
其它任务选项其它任务选项
系统设置系统设置
控制控制
界面界面
代理代理
下载下载
菜单常见问题
软件安装问题软件安装问题
软件应用问题软件应用问题
任务规则问题任务规则问题
任务高级设置-条件保存

功能说明:可以定义某些条件,当采集的信息项内容符合这些条件时则保存,否则丢弃。该功能可以支持同时几个条件联合匹配。
举例:在某个采集新闻的任务中,我们要标题不为空的记录才保存,否则则丢弃。

源信息:选择某个信息项,这个信息项的内容将作为条件保存的判断主体。
举例:以本文开头的例子举例,这里应该选择“标题”信息项。

操作符:
=:如果源信息项的采集结果 = 条件,则保存该条采集记录。
>:如果源信息项的采集结果 > 条件,则保存该条采集记录。
>=:如果源信息项的采集结果 >= 条件,则保存该条采集记录。
<:如果源信息项的采集结果 < 条件,则保存该条采集记录。
<=:如果源信息项的采集结果 <= 条件,则保存该条采集记录。
<>:如果源信息项的采集结果 <> 条件,则保存该条采集记录。
like:如果条件字符串出现在源信息项的采集结果中,则保存该条采集记录。
all like:如果源信息项的采集结果出现在条件字符串中,则保存该条采集记录。
not like:如果条件字符串没有出现在源信息项的采集结果中,则保存该条采集记录。
备注:=、>、>=、<、<=、<>操作符支持数字和日期类型数据的操作,如可以执行 1 < 3这样的操作,如果是非数字和日期类型的普通字符串,则将取源信息字符串和条件字符串的长度作为匹配的对象。Like、all like、not like只支持字符串类型数据的操作。
举例:以本文开头的例子举例,这里应该选择“<>”操作符。

条件:制定源信息项采集结果要满足的条件。
举例:以本文开头的例子举例,这里应该什么都不填,保持为空。如果要“标题”包含有“快讯”才保存记录,则这里可以填“快讯”。

操作模式:
and:记录满足当前条件保存定义后,还需要同时满足下一条条件保存定义才能最终保存。
or:记录只要满足当前条件保存定义或下一条条件保存定义就能最终保存。
not:记录满足当前条件保存定义后,还需要同时不满足下一条条件保存定义才能最终保存。
备注:如果只定义了一条条件保存规则,则操作模式选项不起任何作用。

连续:如果采集的记录连续超过多少条不符合条件保存规则的定义,则自动停止任务。

新建:点击新建按钮可以新增加一个空的条件保存规则。

添加:点击添加按钮可以将一个已经设置好的条件保存规则添加到上方的规则列表中。

修改:点击修改按钮可以修改规则列表中选中的那条规则的参数。

删除:点击删除按钮可以将规则列表中选中的规则项删除掉。

贵阳论坛  天天住宿网  贵阳爱城网  测试  Firefox's中文之家