基础图例-使用ET采集3获取自动摘要

ET采集3数据项增加了一个“截取”选项,“截取”选项用于将数据项的内容按指定长度的字数自动截断。

我们可以用该功能实现自动摘要。

步骤如下:

1、新建数据项,下图我们建立了一个名为“自动摘要”的数据项。

 

2、复制正文数据项的采集规则粘贴到自动摘要的规则里,勾选“去首尾空白”,设置截取字数。

 

3、建立自动摘要的数据整理组。

 

示例中第一条规则用于去除所有HTML标记,第二条规则过滤换行,第三条规则将连续的空白替换为一个空格。

 

4、在自动摘要数据项里关联整理组,然后点测试按钮进行测试。

 

5、从测试结果可以看到,我们想要的从正文自动截取生成摘要的功能已经实现了。