phpcms文章采集器如何设置采集规范

哪里能治愈白癜风 http://pf.39.net/bdfyy/

在应用采集器采集文章的时候,第一步就是设置采集规范,那么应当如何设置呢?本文就此问题做一个简单的介绍。

首先我们需要新建一个采集任务,并单击右侧的添加按钮。

系统弹出对话框,该对话框给出五中采集分时,一般我们应用的比较多的为、、这三种方式。我们在单条或多条网址下输入需要采集的网址,并依次单击右侧的按钮和按钮。

网址添加完毕后,我们需要告诉采集软件我们需要采集网页的哪一部分。此时,我们需要单击右侧的添加按钮添加采集规则。

在选项框中,一般我们勾选,并在下方设置来达成采集某一段网页的目的。

我们可以通过查看该页面的HTML代码来得到我们需要哪些栏目,或者通过观看这些连写的共性,之后通过网址过滤的方式将这些网址过滤出来,比如文本中过滤条件为:


转载请注明:http://www.aierlanlan.com/rzgz/4105.html