首页 首页 产品 版本介绍 采集样本 合作伙伴 升级 客服论坛 帮助文档
帮助首页帮助首页
快速上手快速上手
菜单菜单
文件文件
任务任务
工具工具
系统数据库系统数据库
查看查看
任务管理任务管理
任务任务
访问规则访问规则
信息抓取规则(基础设置)信息抓取规则(基础设置)
信息抓取规则(高级设置)信息抓取规则(高级设置)
信息类型信息类型
任务高级设置任务高级设置
存储数据库设置存储数据库设置
网站登录网站登录
计划执行采集任务计划执行采集任务
页面预提处理页面预提处理
提取链接设置提取链接设置
定义特殊链接定义特殊链接
关联页面规则关联页面规则
防止重复访问设置防止重复访问设置
编码编码
删除Htm设置删除Htm设置
结果替换结果替换
自动分类自动分类
条件保存条件保存
保存遍历页面保存遍历页面
其它任务选项其它任务选项
系统设置系统设置
控制控制
界面界面
代理代理
下载下载
菜单常见问题
软件安装问题软件安装问题
软件应用问题软件应用问题
任务规则问题任务规则问题
常见问题-软件应用问题

1、请问我编辑了很多任务,怎样将这些任务能比较简单的分发给我的同事。
答:如果任务数量少,你可以将这些任务用“任务导出”的功能将每个任务导出为一个任务包文件(*.wtp),再将这些任务一一传送给同事,同事用采集软件中的“任务导入”功能即可导入你制作的这些任务,并进行采集。如果你的任务数量非常多,你可以将采集软件安装目录下的Setting.dll文件直接发送给你的同事,让其替换掉他电脑上采集软件安装目录中的Setting.dll文件即可,但是这样的话,会丢失同事所有以前制作的任务。

2、采集软件支持把采集数据导出到数据库中吗?
答:采集软件本身就是直接将采集到的数据保存到数据库中,无特殊情况不需再导出,默认情况下采集到的数据是保存到“采集软件安装目录\Data\任务名称\任务名称.mdb”这个文件中,你可以通过采集任务高级设置中的“存储数据库设置”来改变采集数据存放的数据库类型及相关信息。最新版本的网络信息采集专家软件支持将采集数据保存到Access、SQL Server2000、Oracle、MySQL这几种数据库中。

3、采集任务的线程一般设置几个比较合适。
答:采集任务的线程概念同下载软件的线程概念,使用越多的线程采集就越快,但是太多反而会导致计算机性能被大量占用而引起采集速度下降,同时采集线程过多,也会增加采集目标服务器的压力。所以我们一般建议,普通电脑+普通的网速+普通的采集目标服务器=可采用3-6个线程;高档电脑+较快网速+无任何限制且性能较好的采集目标服务器=可采用6-15个线程;低档电脑+较慢网速+有限制且性能较差的采集目标服务器=可采用1-3个线程。

4、可以采集网页中的图片、动画文件、音乐文件吗?
答:网页中的图片等二进制文件是可以采集的,采集下来的文件是放在本地指定的磁盘路径中,默认路径是“采集软件安装目录\Data\任务名称\Download”,同时相应的数据库中存放的采集文章中的图片地址也会改成相应的相对路径。所以你只要采集好了,将你的数据上传到服务器中就可以了,不需要采集系统在服务器上运行。如果你要下载这些内容,你需要有一个信息项来采集这些下载内容的下载地址,确保能准确采集到下载地址后,你可以把该信息项的“是否下载”选项打开,即可在采集的时候下载该内容了。选项如下图所示:

5、软件支持SSL协议网址的采集吗?就是一Https://开头的那种。
答:抱歉,截至2.2版的采集专家都还不支持这种网址的采集。

6、请问“重新开始”和“继续”采集有什么区别。
答:如果要开始采集的任务重来没有采集过,那“重新开始”采集和“继续”采集方式没有区别,都会从头开始采集;如果这个任务采集过,并且完成度不到100%,比如只采集到50%,那“重新开始”采集就会从头开始采集,以前采集的数据和记录都将被清零,“继续”采集则从50%处继续开始采集;如果这个人物采集过,并且已经100%的完成,那“重新采集”同样将以前采集的数据和记录清零,“继续”采集不清空以前的采集记录,而是从开始地址重头开始采集,但是会根据访问规则设置的情况自动判断已采集过的网址中,那些需要重新 采集,那些可以忽略跳过,这时“继续”采集就相当于一种更新采集模式,即只采集可能有更新的页面。

7、我想每天定时执行采集,请问可以办到吗?
答:你可以选中任务,然后在主菜单中的“计划执行任务”功能中设置。

贵阳论坛  天天住宿网  贵阳爱城网  测试  Firefox's中文之家