前期给大家分享了关于设置选项的配置方法,现在给大家分享一下关于关关采集器的标准模式下的各种设置方法,由于牵扯内容过多,我这里给大家分开说明各个的配置方法和注意事项。
今天先分析一下采集模式的设置方法,先上图:
如图所示说明各个功能实用方法:
1、按照目标站页面获得编号:
选择次选择采集器将从这里抓取对方站点更新页面,一般这里设置最新更新列表,如果没有最新更新列表可以设置首页的最新更新区块去获取最新更新的数据,如果有列表的情况下支持多行模式,一条一行,这样可以输入对方的多条地址。
2、按照目标站变化顺序:
选择此处将根据对方的设置区间获取,比如输入 1 后面输入50,意思就是根据对方小时id,从id为1开着抓取一直抓取到50结束,这里注意一下,如果抓取数据失败请确认对方抓取失败的id是否为空,其次此设置必须对方id为数字,拼音之类的无法使用。
3、按目标站自定义编号:
选择此处后,在后面直接输入对方小说id如果有多个id用半角逗号隔开,比如:1,2,3,4,5......以此类推,对方如果不是纯数字id也可以使用,比如:dazhuzai,tainxiawushuang,jkjkl455,jkjkgfdl.....依次类推都可以。
其他:按自己站编号经过测试均无法使用,这里不再赘述使用方法。
4、日志记录:
这里根据你的需要来选择,有一些版本如果此处不选择遇到错误会弹窗提示,遇到这种问题选择即可,具体记录那些数据请看【关关采集器配置之(四)-设置-系统设置-日志设置】的设置方法。
5、循环间隔:
此处单位是分钟,比如输入10就是间隔十分钟循环一次,此处配合上面的1、2、3步骤来循环,上面配置的数据全部抓取处理完开始执行下面指定的间隔时间,好多朋友输入1,再这样说明一下不建议这样设置,原因如下
①:抓取对方数据刚结束再次抓取,现在站点大部分都有缓存,在抓取还是刚刚抓取过的数据,这样一直重复抓取毫无意义,无形中增加自己服务器负担,同时也增加了目标站服务器负担。
②:如果抓取频繁对方很容易给你封禁ip,这样得不偿失。
经过两点这里建议设置10-30直接,具体根据情况。
今天的大致设置分享完毕,后续再抽时间分享其他的相关设置方法,感谢阅读,祝生活愉快。