一、文件下载设置页简介

1、说明

我们经常需要在采集文章时下载一些如图片、视频、软件、书籍等各种类型的文件,下载有两种方式,在 采集配置-数据项设置-数据项属性-类型选项 处已经提到,当某个数据项勾选了[包含下载文件]或[作为下载文件网址]选项时,[文件下载设置页]的设置将发挥作用,见图示1:


(图示1)

 

文件一旦下载成功,包含该文件的数据项中的文件网址则会被自动替换为发布对象网站中适用的文件网址,具体设置见 发布配置-基本设置-文件Url 处;

 

 

二、启用下载

即使数据项已经勾选了类型选项[包含下载文件]或[作为下载文件网址],但如果在[文件下载设置页]中未启用下载,那么系统也不会执行文件下载,启用下载见图示2:


(图示2)

 

 

三、文件网址HTML属性名

1、说明

本项用以指定在网页源代码中,什么范围内的字符串包含下载文件网址,见图示3:


(图示3)

 

这一项的名字有点复杂,要理解它,我们需要把这个标题分解看待,分别是‘文件网址’、‘HTML属性名’;

文件网址:表示需要下载的文件的网络地址,系统需要从网页源代码中判断出哪一些字符串是文件网址,而我们需要给它指示;

HTML属性名:在HTML中,绝大部分标记都有一个或多个属性参数,例如下例中IMG标记有三个属性参数src、width、height,分别表示图片网址、图片高度、图片宽度,而这个属性名,就是我们给系统的指示,我们告诉系统在图示3中列出的属性参数中去按[下载文件扩展名]和[动态下载Url]的设置寻找匹配的文件网址;

 

<img src="setup-cj-6-3.gif" width="503" height="53" />

默认的包含文件网址的HTML标记属性名包括href 、src 、data、value等,多个属性参数名请以换行分隔;

 

2、如何使用

我们曾经遇到过这样的案例,一个用户要下载IMG标记显示的图片,但不需要下载A标记链接的图片,在HTML中,IMG标记和A标记链接图片分别如下:

 

<img src="setup-cj-6-3.gif" width="503" height="53" />

<a href="setup-cj-6-3.gif" >图片名</a>

其中,IMG标记的图片网址链接是属性参数SRC的值,而A标记中是属性参数HREF的值,用户只需要在[文件网址HTML属性名]一栏中填写如下图,即可实现需求;


(图示4)

 

当然,用户仍需要在其下的[下载文件扩展名]或[动态下载Url]中做对应设置。

 

 

四、下载文件扩展名

1、说明

[下载文件扩展名]可以选填,通过填写文件扩展名,指定哪些文件被下载,见图示5:


(图示5)

 

网址一般有三种形式:链接到域名的网址(如 http://et.zzcity.net)、链接到网站目录的网址(如 http://ent.sina.com.cn/star/)、链接网站文件的网址(如 http://et.zzcity.net/files/ET2.0beta.rar),当链接网站文件的网址中的文件扩展名与[下载文件扩展名]栏所填相符,则下载该文件;

例如,图片扩展名一般是GIF、JPG、BMP等,压缩文件一般是RAR、ZIP等,文档一般是TXT、DOC等,音乐一般是MP3、WMA、RM等;

 

 

五、动态下载Url

1、说明

[动态下载Url]可以选填,用于判断没有扩展名、不适合指定扩展名,或扩展名后带参数等格式的文件网址,见图示6:


(图示6)

 

选择目标文件网址中的固定不变的部分作为特征字符串填写到[动态下载Url],多个请换行填写;

例如:在discuz论坛中,通常附件文件的网址为 http://bbs.zzcity.net/attachment.php?aid=XXXX&k=XXXX&t=XXXX ,而在新浪博客中,通常图片的网址为 http://staticX.photo.sina.com.cn/bmiddle/XXXXXXXX ;通过对不同网站的动态文件网址比较可以观察到,在各个网站中,动态文件网址的格式一般都是固定的、且与非文件网址有显著区别的,所以,我们可以依据这种格式来判断某个网址是否是需要下载的文件;

在图示6中,我们提取出了discuz论坛附件文件网址的固定部分,当系统监测到网址格式与其匹配时,就会下载该文件,当然,我们还可以将其填写为attachment.php ,也能产生同样效果;而新浪博客的图片网址,我们可以提取[动态下载Url]为 http://staticX.photo.sina.com.cn/bmiddle。

 

 

 

六、自动解析专用链接

1、说明

自2.4.14版开始,文件下载支持自动解析迅雷快车QQ旋风等专用格式下载链接。

要下载这些专用链接,在动态下载Url栏分别填写:thunder:// 、 flashget:// 、qqdl:// 等特征字符串;


(图示7)

如果数据项属性为“包含下载文件”,则还需要同时在文件网址HTML属性名栏里填写包含这些链接的HTML属性参数名;