功能说明:通过该设置,采集软件可以识别一些非标准的网址,比如通过Javascript动态编程生成的类似“Javascript:OpenWin(‘123’)”这样的网址,这样的网址可能其真实的地址是http://www.xxx.com/OpenWin.asp?ID=123。
特殊链接前、后标:定义一对前后标,将特殊链接字符串从网页代码中提取出来。
举例:Javascript:OpenWin(‘123’),定义前标:OpenWin(‘,后标:’),提取得到的特殊链接字符串就是“123”。在匹配特殊链接类型,就能得到真实的网址。
是否反方向查找:前后标的反向查找。与信息提取规则中的“是否反方向查找”是一个概念。
类型:
1、自动类型:自动根据当前的访问状态来将特殊链接字符串转换为真实地址。
说明:不需要设置网址前后缀。
举例:特殊链接字符串为:123
当前正在访问网址为:http://www.xxx.com/List.asp
真实网址为:http://www.xxx.com/123
2、前后缀类型:根据定义的网址前后缀将特殊链接字符串转换为真实地址。真实地址 = 网址前缀 + 特殊连接字符串 + 网址后缀
说明:需要设置网址前后缀。
举例:特殊链接字符串为:123
前缀为:http://www.xxx.com/OpenWin.asp?ID=
后缀为:&Style=1
真实网址为:http://www.xxx.com/OpenWin.asp?ID=123&Style=1
3、补充参数类型:用特殊连接字符串替换正在访问网址中的某个参数,你必须在网址前缀中定义这个参数的内容。
说明:需要设置网址前缀,不需设置网址后缀。
举例:特殊链接字符串为:123
当前正在访问网址为:http://www.xxx.com/List.asp
前缀为:List
真实网址为:http://www.xxx.com/123.asp
4、批量添加类型:提取到的特殊链接字符串必须是个数字n。然后采集软件会生成真实地址=网址前缀”+1..n+网址后缀。
说明:需要设置网址前后缀。
举例:特殊链接字符串为:123
前缀为:http://www.xxx.com/OpenWin.asp?ID=
后缀为:&Style=1
真实网址为:http://www.xxx.com/OpenWin.asp?ID=1&Style=1
http://www.xxx.com/OpenWin.asp?ID=2&Style=1
http://www.xxx.com/OpenWin.asp?ID=3&Style=1
……
http://www.xxx.com/OpenWin.asp?ID=123&Style=1
新建:点击新建按钮可以新增加一个空的特殊链接规则。
添加:点击添加按钮可以将一个已经设置好的特殊链接规则添加到上方的规则列表中。
修改:点击修改按钮可以修改规则列表中选中的那条规则的参数。
删除:点击删除按钮可以将规则列表中选中的规则项删除掉。