一、简介

在ET中,我们使用一些通用的符号字母组合表示一些可变信息,用于分析、处理、传递数据信息,我们称其为运算标记。

这些标记都有统一的格式,即使用“<%”“%>”或 “<[”“]>”、包括,例如[变量标记](<%var%>)。

 


二、注意事项

1、除[空白标记]、[换行标记]以及数据整理替换结果中的[参数标记]等在手册注明的标记外,其他任何运算标记都不能连接在一起使用;

2、运算标记代表连续的、不确定的任意字符:其中 [变量标记](<%var%>) 用于在代码文本中匹配不需要获取的字符串,其他标记则用于在代码文本中匹配各自需要获取的字符串;

3、除[变量标记]和数据整理替换结果中的[参数标记]外,其他的运算标记在同一规则中不能多次使用;

4、深入理解规则及运算标记的使用请查阅‘正则表达式’相关资料;

 


三、使用范例

我们通过下面几个例子来示范运算标记的使用;

 

1、[变量标记]的使用范例

为了将数据从大量文本中提取出来,我们通常会选择一些具有特征性的字符串作为一个规则的起止,然后,在特征字符串和我们要提取的数据之间,通常会有一些不确定的、可能发生变化的字符串,这时,我们使用[变量标记]在表示这些字符串,使我们的规则能正确分析并提取到需要的数据,如下例:

 

<li><a href="http://ent.sina.com.cn/m/c/2009-02-11/11422370990.shtml" target="_blank">《新宿事件》成龙饰东北农民 与徐静蕾亲密(图)</a><span class="time"> 11:42</span></li>
<li><a href="http://ent.sina.com.cn/m/c/p/2009-02-11/11392370970.shtml" target="_blank">本木雅弘缺席发布会 李威大胆挑战礼仪师(组图)</a><span class="time"> 11:39</span></li>

我们要从上面的文本中获取网址和标题,然而这里出现了下面所示我们不需要的变化的字符串:

<span class="time"> 11:42</span>

<span class="time"> 11:39</span>

我们在规则中使用[变量标记]来处理这种情况,规则如下:

<li><a href="<%fileid%>" target="_blank"><%title%></a><span class="time"><%var%></span></li>

 

变量标记使用应尽量精简,使用越多,效率越低,以下一例说明:

我们建立的数据项要获取当前文章中的所有图片网址,图片的源码如下:

<img src="http://123.com/abc456.jpg" height="200" width="300" alt="图片1"/>

<img src="http://123.com/xyz789.jpg" height="300" width="400" alt="图片2"/>

 

不当的规则如下:

<img src="<%content%>" height="<%var%>" width="<%var%>" alt="<%var%>">

 

正确的规则如下:

<img src="<%content%>" <%var%>>

 

2、[文章地址]的使用范例

[文章地址]的使用具有相当的灵活性,根据需要,在同一个规则中,可以有多种用法,如下例:

 

<li><a href="http://ent.sina.com.cn/m/c/2009-02-11/11422370990.shtml" target="_blank">《新宿事件》成龙饰东北农民 与徐静蕾亲密(图)</a><span class="time"> 11:42</span></li>
<li><a href="http://ent.sina.com.cn/m/c/p/2009-02-11/11392370970.shtml" target="_blank">本木雅弘缺席发布会 李威大胆挑战礼仪师(组图)</a><span class="time"> 11:39</span></li>

我们需要从上面的文本中获得文章的网址,因此使用[文章地址]标记建立规则如下:

 

<li><a href="<%fileid%>" target="_blank">

在上面的规则中,我们通过[文章地址]标记获取了完整的网址:

 

http://ent.sina.com.cn/m/c/2009-02-11/11422370990.shtml

http://ent.sina.com.cn/m/c/p/2009-02-11/11392370970.shtml

由于最终我们使用的文章网址是用[文章地址]标记合成的,所以,为了保证我们所取到的网址是我们需要的该类文章,而不会包含其他所有符合该规则的文章网址,我们通常会建立规则如下:

 

<li><a href="http://ent.sina.com.cn/<%fileid%>" target="_blank">

<li><a href="http://ent.sina.com.cn/<%fileid%>.shtml" target="_blank">

 

 

3、[参数标记]

[参数标记]在数据整理中使用,标记代码为<%itemdata%>,用于从原代码中传递数据到替换值,[参数标记]一共有9个,分别为<%itemdata1%><%itemdata2%><%itemdata3%><%itemdata4%><%itemdata5%><%itemdata6%><%itemdata7%><%itemdata8%><%itemdata9%>

每一个[参数标记]在原代码中只能独立使用,不能与[空白标记]和[换行标记]之外的其他标记连接使用;

各个[参数标记]在替换值中可以多次使用可以连接使用

 

从2.2版开始,[参数标记]取代[原值标记]<%itemdata%>,并兼容[原值标记],<%itemdata%>等于<%itemdata1%>

 

1、[参数标记]可用来为数据项前后增加内容,如下例:

某年份数据项内容为

 

2008

建立数据整理规则如下:

 

原代码处填写:<%itemdata1%>

替换值处填写:<%itemdata1%>

使用此数据整理规则后,该数据项内容为:

 

2008年

 

 

2、某标题数据项的值类似“欢迎下载ET2用户帮助手册”,将该数据项的值替换为“这是ET2的说明书,欢迎你阅读帮助手册”的格式:

 

原代码:欢迎下载<%itemdata1%>用户<%itemdata2%>

替换值:这是<%itemdata1%>的说明书,欢迎你阅读<%itemdata2%>

 

3、将图片代码居中显示:

 

原代码:<img<%itemdata1%>>

替换值:<center><img<%itemdata1%>></center>

 


四、相关参考

1、常用术语

字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等等。字符串是0个或更多个字符的序列。文本也就是文字,字符串。说某个字符串匹配某个表达式,通常是指这个字符串里有一部分(或几部分分别)能满足表达式给出的条件。

 

2、正则表达式

在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。