Dedecms织梦自带的采集工具很好用,可以通过采集规则进一步优化采集内容,但也有缺点,如果你注意检查文章内容的时候,你就会发现,采集源文章带有关键词的文本都被过滤掉了,原因在于你再采集规则中选择了过滤所有的a标签,但是要是不选择的话,就会把a标签也给采集了,然而,很多网站文章为了seo优化都有设置关键词内链,因此陷入两难的局面。那么,有没有办法,在采集的时候只去除链接,过滤掉a标签,但是保留文本呢?
有的,方法也很简单,只要你再稍微修改一下过滤规则即可。修改方法如下:
将过滤规则中的a标签
{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}
改成如下:
{dede:trim replace=""}<a([^>]*)>{/dede:trim}
{dede:trim replace=""}</a>{/dede:trim}
如此之后,就可以在过滤a标签的同时,保留关键词文本了。