首页 首页 产品 版本介绍 采集样本 合作伙伴 升级 客服论坛 帮助文档
帮助首页帮助首页
快速上手快速上手
菜单菜单
文件文件
任务任务
工具工具
系统数据库系统数据库
查看查看
任务管理任务管理
任务任务
访问规则访问规则
信息抓取规则(基础设置)信息抓取规则(基础设置)
信息抓取规则(高级设置)信息抓取规则(高级设置)
信息类型信息类型
任务高级设置任务高级设置
存储数据库设置存储数据库设置
网站登录网站登录
计划执行采集任务计划执行采集任务
页面预提处理页面预提处理
提取链接设置提取链接设置
定义特殊链接定义特殊链接
关联页面规则关联页面规则
防止重复访问设置防止重复访问设置
编码编码
删除Htm设置删除Htm设置
结果替换结果替换
自动分类自动分类
条件保存条件保存
保存遍历页面保存遍历页面
其它任务选项其它任务选项
系统设置系统设置
控制控制
界面界面
代理代理
下载下载
菜单常见问题
软件安装问题软件安装问题
软件应用问题软件应用问题
任务规则问题任务规则问题
任务高级设置-定义特殊链接

功能说明:通过该设置,采集软件可以识别一些非标准的网址,比如通过Javascript动态编程生成的类似“Javascript:OpenWin(‘123’)”这样的网址,这样的网址可能其真实的地址是http://www.xxx.com/OpenWin.asp?ID=123。

特殊链接前、后标:定义一对前后标,将特殊链接字符串从网页代码中提取出来。
举例:Javascript:OpenWin(‘123’),定义前标:OpenWin(‘,后标:’),提取得到的特殊链接字符串就是“123”。在匹配特殊链接类型,就能得到真实的网址。

是否反方向查找:前后标的反向查找。与信息提取规则中的“是否反方向查找”是一个概念。
类型:
1、自动类型:自动根据当前的访问状态来将特殊链接字符串转换为真实地址。
说明:不需要设置网址前后缀。
举例:特殊链接字符串为:123 当前正在访问网址为:http://www.xxx.com/List.asp 真实网址为:http://www.xxx.com/123
2、前后缀类型:根据定义的网址前后缀将特殊链接字符串转换为真实地址。真实地址 = 网址前缀 + 特殊连接字符串 + 网址后缀
说明:需要设置网址前后缀。
举例:特殊链接字符串为:123 前缀为:http://www.xxx.com/OpenWin.asp?ID= 后缀为:&Style=1 真实网址为:http://www.xxx.com/OpenWin.asp?ID=123&Style=1
3、补充参数类型:用特殊连接字符串替换正在访问网址中的某个参数,你必须在网址前缀中定义这个参数的内容。
说明:需要设置网址前缀,不需设置网址后缀。
举例:特殊链接字符串为:123 当前正在访问网址为:http://www.xxx.com/List.asp 前缀为:List 真实网址为:http://www.xxx.com/123.asp
4、批量添加类型:提取到的特殊链接字符串必须是个数字n。然后采集软件会生成真实地址=网址前缀”+1..n+网址后缀。
说明:需要设置网址前后缀。
举例:特殊链接字符串为:123 前缀为:http://www.xxx.com/OpenWin.asp?ID= 后缀为:&Style=1 真实网址为:http://www.xxx.com/OpenWin.asp?ID=1&Style=1 http://www.xxx.com/OpenWin.asp?ID=2&Style=1 http://www.xxx.com/OpenWin.asp?ID=3&Style=1 …… http://www.xxx.com/OpenWin.asp?ID=123&Style=1

新建:点击新建按钮可以新增加一个空的特殊链接规则。

添加:点击添加按钮可以将一个已经设置好的特殊链接规则添加到上方的规则列表中。

修改:点击修改按钮可以修改规则列表中选中的那条规则的参数。

删除:点击删除按钮可以将规则列表中选中的规则项删除掉。

贵阳论坛  天天住宿网  贵阳爱城网  测试  Firefox's中文之家