规则列表显示规则名称,描述、提供者、类别和操作。 可以对选中的规则进行编辑、复制、转换、导出和删除。 可以对多个选中的规则进行批量删除。...
1、 规则根据内容分为两种类型,这种分类只是单纯为了便于查找,与采集无关。当然也需要为规则指定一个名称以示区别。 2、选择目标页面编码 一般情况下只需要选择默认的自动,...
规则的识别特征字符串分列表页和内容页两种。 当采集站点为论坛时,内容页也就是贴子。 当列表采集器的采集模式设置为规则模板时,插件会自动读取指定页面的源代码,如果该源...
设置列表页(或搜索页)网址的通用形式。 当列表采集器的采集模式设置为规则模板时采集范围指定其中变量的具体值来确定采集范围。 链接中的变量用(*)代替,可以有多个变量,...
替换或过滤列表页地址的规则用于修正获取到的错误链接或无效链接。 1、替换 用@@隔开搜索字符串与替换字符串,搜索字符串中变化的区域用(*)代替。 比如 aa@@bb,表示将aa替换成bb 搜...
指定如何从列表页中获取内容页面的地址链接。 可以通过DOM获取或字符串获取两种方式。 使用DOM获取时规则分为两行,第一行是列表的获取规则,第二行是链接获取规则。写法如:...
某些站点的列表页使用图片墙的形式展示,通过获取这种列表页中每个内容页的图片可以作为发布时的封面。 选择从列表页采集封面,指定封面获取规则。 DOM获取规则分两行,第一行...
在测试地址中输入一个页面链接。 也可能点击自动获取从网页列表链接获取设置中指定的列表页链接根据网页列表获取规则获取的内容页链接列表中随机选取一个链接。 标题获取规则...
发贴者用户信息包括用户名、发贴时间和其它信息。 提示: 此功能采集到的数据仅适用于发布到论坛。 1、用户名 用户名可以使用DOM或字符串获取规则采集。 采集DZ论坛,DOM写法推荐...
1、选择采集分类信息 2、从下拉框中选择需要配置的分类信息,按照论坛-分类信息-分类管理中可用字段显示规则定义 3、指定获取规则 有关DOM获取请参考 操作指南:DOM获取规则 。 有...