一、基本设置页简介
1、说明
[基本设置页]包含采集规则中接口网址、字数范围、编码方式等项目的设置,见图示1:
(图示1)
二、接口网址
1、说明
接口网址包括三个部分、分别是[检查网址]、[发布网址]、[回复网址],其中[发布网址]为必填项,根据接口设计的不同,三个接口网址可能相同,也可能各自独立,见图示2:
(图示2)
2、检查网址
本项可选填,全称为文章重复检查接口网址,该网址通常用于在发布目标网站中对是否已经存在相同的文章进行独立检查,以避免文章重复发布,本项可以留空。
ET以POST方式访问该网址,提交的参数为通过[文章标题]标记调用的文章标题数据项的值以及检查接口网址中的其他参数。
[检查网址]中必须带Url格式标题参数,其他参数根据对应接口说明选用;
[检查网址]有一个[文章标题]标记,标记代码为<%title%>,该标记为必用项,自动从采集规则的[标题]数据项或[标题]标记中取值,在[检查网址]中作为标题参数的值;
使用模拟发布方式时,[检查网址]通常留空不用;
检查返回值:
[检查网址]返回值 “1” 或 “[yes]” 表示文章重复,返回值 “0” 或 “[no]” 表示无此文章;
ET官方提供的接口请参看接口说明填写本项,除ET官方提供的接口外,网站管理员可根据需要自行编写文章重复检查接口;
接口编写说明见《ET接口设计规范》;
3、发布网址
本项为必填项,全称为文章发布接口网址,该网址用于接收ET使用POST方式提交的各个参数,在网站中以文章或其他形式发布;
ET向该网址提交的参数为发布项页面中的参数。
使用接口发布方式时,[发布网址]填写为对应的文章发布接口网址;
使用模拟发布方式时,[发布网址]填写为该网站自身的文章发布网址;
发布返回值:
使用接口发布方式时,返回值 “[ok]” 或 “1” 或 [发布成功特征码](见 发布配置-模拟发布-成功特征码)表示发布成功,其他表示发布失败或错误信息;
使用接口发布方式时若使用支持回复的接口,则发布成功返回值格式为 “[reply]文章主题ID参数名=文章ID;其他参数名1=参数值1;其他参数名2=参数值2[/reply]” ;
使用模拟发布方式时,以[模拟发布设置页]中的[发布成功特征码]为发布成功返回值;
ET官方提供的接口请参看接口说明填写本项,除ET官方提供的接口外,网站管理员可根据需要自行编写文章发布接口;
通过自行编写发布接口,可以对信息进行灵活处理,实现如回复、附件管理、特殊格式、同义词替换等各种功能;
接口编写说明见《ET接口设计规范》;
4、回复网址
本项可选填,全称为文章回复接口网址,该网址用于接收ET使用POST方式提交的数据,在网站中作为文章的回复、评论部分或类似形式发布;
ET向该网址提交的参数除了[回复关联参数]和[内置参数]外,与向发布接口网址所提交的参数相同。
启用回复网址需要勾选[启用独立回复]选项;
[回复网址]中不能附带Url格式参数,使用与[发布网址]相同的参数以及[发布网址]接口返回值中包含的参数;
使用模拟发布方式时,不能启用回复接口;
有时候回复功能被整合在发布接口中,不需要启用回复网址,如ET官方免费提供的Discuz 6.0、Discuz 6.1、Phpbb 3.01等支持回复的发布接口;
若当前回复的内容为空白(空值或各种空白字符,包括中文全角空格),则不会被发布。
回复关联参数:
作为提供回复内容的参数名称,ET提交回复信息时,使用该参数的值作为回复内容,留空时默认值为正文参数名,表示使用[正文]参数的值作为回复内容;
用户可以使用[正文]数据项来采集回复内容,也可以另建新数据项单独采集回复内容,使用哪个数据项来采集回复内容,则此处填写其对应的参数名。
当本项留空或使用正文参数名时,[正文]数据项第一条匹配内容将被提交至[发布网址]作为主题发布,从第二条匹配内容开始的其他匹配内容将依次被发送至[回复网址]作为回复提交,如果此时[正文]数据项未选择[匹配多条内容]属性或[正文]数据项无多条匹配值则此功能不生效;
当本项使用其他参数名时,该参数的值中如果包含ET分隔标记#-0-#,则按其分隔为多条逐次作为回复提交;
注:本项从2.3.8版开始启用,支持回复和正文分别采集发布;
回复参数名:
回复内容将使用 发布配置-发布项 中设置的[正文发布参数名]作为回复内容的发送参数名;
回复返回值:
回复返回值为 “[ok]” 或 “1” 或 [发布成功特征码](见 发布配置-模拟发布-成功特征码)表示回复成功,其他表示回复失败或错误信息;
内置参数:
回复时将使用内置参数replyno(见 发布配置-参数值设置-内置参数)表示当前是第几次回复;
ET官方提供的接口请参看接口说明填写本项,除ET官方提供的接口外,网站管理员可根据需要自行编写文章回复接口;
接口编写说明见 ET接口设计规范 ;
三、字数限定
1、说明
通过对标题、正文数据项的字数范围进行限制,保证发布的文章字数在网站允许范围内,避免因字数超长而丢失内容或因字数过长、过短导致发布失败,见图示3:
(图示3)
[自动截断]功能可在字数超长时,去掉超出部分;
当启用回复时,回复的内容也会受此功能影响。
四、格式与编码
1、说明
此处用于对编码和代码格式进行设置,见图示4:
(图示4)
2、使用UBB代码格式
勾选此项,ET将会自动将数据项内容转换为UBB格式后再发布;
注意,UBB代码仅是部分网站使用的数据处理格式,并非网页显示源代码格式(网页显示源代码为HTML或XML格式),ET官方提供的接口都不需要使用此项,仅作为对用户自行编写接口和模拟发布的支持;
3、保留换行符
本项通常与[使用UBB代码格式]选项同时使用;
在UBB格式中,因为没有段落标记和换行标记,所以需要使用文本换行符表示换行,在HTML格式中换行符不起作用;
4、编码转换
采集对象网站和发布对象网站使用的网页字符编码经常会不同,通过本项,可以将数据项转换为和发布对象网站匹配的编码字符;
其中,简体转繁体是指,将简体中文gb2312码字符转为繁体中文BIG5码字符,繁体转简体是指将繁体中文BIG5码字符转为简体中文gb2312码字符;
要查看字符编码可以打开该网站的网页,在源代码<head>部分查看类似如下代码,其中 charset=gb2312 部分表示当前使用的字符编码:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
五、附件子目录
1、说明
本项用于选择是否为附件建立子目录,包括FTP上传目录和附件在网页上的显示Url,见图示5:
(图示5)
ET采集3中本项已移动到 [文件]设置页。
六、文件Url
1、说明
[文件显示Url]指文章中的图片、文件等各种由下载获得的附件在发布后的网页中的显示网址目录,见图示6:
(图示6)
本项仅对下载的文件有效;
[文件显示Url]通常有完整网址(即以http://开头的网址)和相对网址(即类似“upfile/2007”“/upfiles/pic”等相对路径形式的网址)两种;
[文件显示Url]中不含文件名;
ET采集3中本项已移动到 [文件]设置页。
相关主题