首页 首页 产品 版本介绍 采集样本 合作伙伴 升级 客服论坛 帮助文档
帮助首页帮助首页
快速上手快速上手
菜单菜单
文件文件
任务任务
工具工具
系统数据库系统数据库
查看查看
任务管理任务管理
任务任务
访问规则访问规则
信息抓取规则(基础设置)信息抓取规则(基础设置)
信息抓取规则(高级设置)信息抓取规则(高级设置)
信息类型信息类型
任务高级设置任务高级设置
存储数据库设置存储数据库设置
网站登录网站登录
计划执行采集任务计划执行采集任务
页面预提处理页面预提处理
提取链接设置提取链接设置
定义特殊链接定义特殊链接
关联页面规则关联页面规则
防止重复访问设置防止重复访问设置
编码编码
删除Htm设置删除Htm设置
结果替换结果替换
自动分类自动分类
条件保存条件保存
保存遍历页面保存遍历页面
其它任务选项其它任务选项
系统设置系统设置
控制控制
界面界面
代理代理
下载下载
菜单常见问题
软件安装问题软件安装问题
软件应用问题软件应用问题
任务规则问题任务规则问题
任务高级设置-关联页面规则

功能说明:该设置可以将两个关联的页面联合为一个页面进行采集。
举例:Alibaba网站上企业介绍存在在a.htm页面中,有关的企业联系方式存放在b.htm页面中,其中a页面有链接指向b页面。那就可以利用关联页面规则把a和b页面联系在一起,将b页面的内容嵌套在a页面中,从而视为一个网页来进行采集。

关联页面网址标识:设置该标识后,访问的网址如果符合该标识,则软件从该网页代码中,根据前后标提取出关联页面的网址字符串。

关联页面提取前、后标:用于在网页代码中提取出关联页面的网址字符串。

类型:
1、自动类型:自动根据当前的访问状态来将前后标提取的字符串转换为关联页面地址。
2、前后缀类型:根据定义的网址前后缀将前后标提取的字符串转换为关联页面地址。关联页面地址 = 网址前缀 + 前后标提取的字符串 + 网址后缀

新建:点击新建按钮可以新增加一个空的关联页面规则。

添加:点击添加按钮可以将一个已经设置好的关联页面规则添加到上方的规则列表中。

修改:点击修改按钮可以修改规则列表中选中的那条规则的参数。

删除:点击删除按钮可以将规则列表中选中的规则项删除掉。

贵阳论坛  天天住宿网  贵阳爱城网  测试  Firefox's中文之家