帝国cms采集图文教程
zhushican 2015-12-14 seo教程 次浏览
前两讲我们分别介绍了帝国cms采集基本流程和帝国cms如何采集内容分页,最后这一讲主要介绍帝国cms采集过滤与替换,还有些技巧。
一、过滤
1、帝国cms采集过滤分为两种:
(1)“整体页面过滤正则”:
1-1-1.JPG
(2)“过滤广告正则”:
1-1-2.JPG
我们有些疑惑,这两种过滤到底有什么区别?“整体页面过滤正则”是过滤整个网页的html代码。“过滤广告正则”是过滤文章内容,仅对文章内容([!--newstext--])起作用。