织梦dedecms商业教程 DEDE采集规则过滤与替换

织梦dedecms商业教程 DEDE采集规则过滤与替换

学习教程tuzi2018-10-17 17:48:55A+A-

过滤与替换常用操作:点击“常用规则”,选择要过滤的代码段,再编辑成我们需要的。

如果会文章简单采集了,接下来就需要过滤掉采集内容中的广告和链接及其它代码。一般的写法是{dede:trim}要过滤的内容{/dede:trim}  ,举几个例子:

1,去除超链接,这种最常用。

{dede:trim replace=''}<a([^>]*)>{/dede:trim}

{dede:trim replace=''}</a>{/dede:trim}

如果填成这样,那就把链接的文本也一起去掉了

{dede:trim replace=''}<a([^>]*)>(.*)</a>{/dede:trim}

2,过滤JS调用广告,比如GG的广告,就加个这样的:

{dede:trim replace=''}<script([^>]*)>(.*)</script>{/dede:trim}

3,过滤div标签。这个很重要,如果没过滤干净则可能使发布出来的文章版面错位,目前大多数遇到采集后错位的原因在此。

{dede:trim replace=''}<div([^.]*)>{/dede:trim}

{dede:trim replace=''}</div>{/dede:trim}

有的时候也需要这样子过滤:

{dede:trim replace=''}<div 选择器>(.*)</div>{/dede:trim}

4,其它的过滤规则可以照以上规律进行推出。

5,过滤摘要和关键字使用,经常要用到。

{dede:trim replace=''}{/dede:trim}

6,简单替换。

{dede:trim replace='替换后的词语'}要替换的词语{/dede:trim}

采集的内容当然也要求搜索引擎收录,过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。


点击这里复制本文地址

声明

本站发布所有广告信息、下载资源,均来自互联网,非本站自制,与本站无关。 如有侵犯您的合法权益请来信告之。我们会在三个工作日内予以清除。


本站中所有资料、资源文件均来自于网络搜索,仅作为技术学习研究之用,请必须在24小时内删除所下载文件,切勿用于商业用途,否则由此引发的法律纠纷及连带责任本站和发布者概不承担。


本站保证站内提供的所有可下载资源(软件等等)都是按“原样”提供,本站未做过任何改动;但本网站不保证本站提供的下载资源的准确性、安全性和完整性;同时本网站也不承担用户因使用这些下载资源对自己和他人造成任何形式的损失或伤害。 


访问本站的用户必须明白,[资源爱好者]对提供下载的软件等不拥有任何权利,其版权归该下载资源的合法拥有者所有。


本站所有资源均不提供相关技术服务,如果源码下载地址失效则请联系站长进行补发。


本站所有资源展现图片仅供参考

资源爱好者 © 本站发布所有资源,均来自互联网,非本站自制,分享目的仅供大家学习与参考,与本站无关。
如有侵犯您的合法权益请来信告之。我们会在三个工作日内予以清除。邮箱:admin?aihao.org
关于我们|广告合作|网站地图|冀ICP备14009590号|冀公网安备 13018302000072号