一、新建方案
1、认识方案列表;
方案设定窗口的左侧,是一个树形目录,以‘分组’和‘方案’两级方式显示方案列表,见图示1:
(图示1)
2、操作菜单;
在方案树上点击右键,弹出操作菜单,注意,在分组和方案上点击右键的弹出菜单项目是有区别的;
新增:弹出菜单中的‘添加组’和‘添加方案’项分别用来新增方案和分组,方案列表需要至少1个分组;
复制:在方案上弹出菜单时有‘复制方案’项,可以将当前选中的方案完整复制一份,对于新建大部分设置和该方案相似的新方案,能缩减很多操作;
更名:使用弹出菜单的‘重命名’项,能修改选中的分组或方案的名称;在分组或方案名称上双击鼠标左键,也可以进入修改状态;
删除:使用弹出菜单的‘删除’项,能删除选中的分组或方案,这是删除的唯一方法;
排序:分组和方案根据名称自动排序;
调整分组: 左键点住方案名称,可以将方案拖动到其他分组,见图示2:
(图示2)
二、基本设置
创建新方案后,在方案窗口右侧的方案设定区进行方案设置;
1、选择规则;
一个方案由采集规则、中间规则、发布规则组合而成,这三者是相互独立,又是相互关联的,通过不同的搭配,能组合出实现各种采集目标的方案,见图示3:
(图示3)
当所选规则有关键项未设置时,将弹出提示;
点击规则选框旁的小图标,可以快捷进入规则配置窗口;
注:改变方案的采集规则会导致该方案的未发布文章记录被自动删除。
2、方案执行次数
方案在自动工作时,每天的执行总次数,设为0则不限制,见图示:
通过本项与自动文章发布数配合,可以控制方案每天发布的文章数量。
3、文章发布数
在自动工作时,每一次执行方案所允许发布成功的最大文章数量,设为0则不限制,见图示:
通过本项与自动执行次数配合,可以控制方案每天发布的文章数量。
4、采集间隔;
用于控制采发节奏,很多网站尤其是论坛类都对一定时间内的发帖次数有限制,如果用户未在接口中取消这个限制,则需要用采集间隔时间来控制采发节奏,以保证不会被网站程序拒发文章,同时,也控制采发速度,采集间隔以秒为单位,见图示4:
(图示4)
5、发布顺序;
这是一个发布时的容错机制,通过三个选项的组合,控制数据发布与文件上传,见图示5:
(图示5)
先发布文章:选中此项,发布时,先发布各数据项,成功后再上传文件;
先上传文件:选中此项,发布时,先上传文件,成功后再发布各数据项;
6、重复检查范围;
勾选此项时,ET内部数据库文章重复检查仅在同一方案中进行,若本地数据库中有文章与采集目标相同,而所属方案不同,仍执行采集,见图示7:
(图示7)
7、文章本地检查模式;
ET采集文章列表时,会现根据预设模式检查是否与ET内部数据库已采集文章重复,如果重复,则不会再次采集,下图中的四个选项则用来控制检查模式,见图示6:
(图示6)
不检查重复:选中时,不在ET内部数据库做文章是否重复检查;
按网址检查:选中时,若内部数据库存在与采集目标网址相同的文章条目,则系统判定文章重复,不予采集,此项受‘仅限本方案’选项影响;
按标题检查:选中时,若内部数据库存在与采集目标标题相同的文章条目,则系统判定文章重复,不予采集,此项受‘仅限本方案’选项影响;
网址和标题:选中时,只有在内部数据库存在与采集目标网址、标题同时相同的文章条目,系统才判定文章重复,不予采集,此项受‘仅限本方案’选项影响;
8、不保存记录
启用本项,将不保存发布成功的文章到已发布文章列表,选项见图示:
三、文件设置
当启用文件下载后,下载文件将按此处设置处理。
1、强制发布文章
勾选此项时,则当发生文件下载、上传失败的情况后仍然继续发布文章。
2、发布后本地自动删除文件
此项一般在ET运行于工作机时启用,工作机上一般不需要保留下载文件,启用此项则在文件上传后自动删除本地文件;当ET在网站服务器上运行,且文件直接下载到网站文件目录时,不可启用此项;
3、图片下载失败时从文章删除
如果用户启用了文件传送失败时强制发布文章,那么在文章中无效的图片将不能正常显示,启用本功能时,则会自动从文章中删除图片的HTML代码,以美化显示,本功能为2.5版新增。
4、使用下载文件原名
启用本项时ET将自动获取下载文件的原名。
注:当下载的文件名重复时,将会使用ET命名规则的文件名。
5、自动命名名前缀
下载文件的命名规则是 ‘文件名前缀+本地文章ID+日期时间+文章内序号+扩展名’;
6、本地下载目录
指定下载文件到本地的位置;当ET在网站服务器运行时,通常不需要使用文件上传,只需要将文件保存路径指定到该网站文件目录即可;
7、本地子目录
在文件保存路径下按自动建立子目录,文件将保存到该子目录下;
8、目录同名文件
在本地保存目录中存在同名文件时的处理方法:跳过表示不下载,覆盖表示用新文件覆盖旧文件,更名表示按自动命名规则重命名新文件。
当ET在网站服务器上运行时,用户可以直接将下载的文件保存到网站附件目录,而不再需要使用文件上传,可参考帮助文章 《ET中文件下载和上传的四种情况》 ;
四、定时设置
通过设置方案定时,可使ET在指定时间执行该方案,见图示8:
五、日志设置
ET采集3新增方案日志功能。
1、类型
设置需要记录的日志消息种类,警告类型包括警告和错误,当日志项目中出现警告或错误消息时,将当前信息保存到日志中,错误类型则只在出现错误消息时保存。
2、项目
选择需要保存的日志记录。
3、滚动更新
按计划周期保存最近的日志,超出周期的记录将自动删除。
文件大小限制单个日志文件的尺寸,超过后将新建日志文件。