操作指南:规则管理--添加规则--自动识别设置
规则的识别特征字符串分列表页和内容页两种。 当采集站点为论坛时,内容页也就是贴子。 当列表采集器的采集模式设置为规则模板时,插件会自动读取指定页面的源代码,如果该源
规则的识别特征字符串分列表页和内容页两种。
当采集站点为论坛时,内容页也就是贴子。
当列表采集器的采集模式设置为“规则模板”时,插件会自动读取指定页面的源代码,如果该源代码中包含该”识别特征字符串“则判定使用该规则。
一般情况下只要指定列表页识别特征字符串和内容页识别特征字符串,当规则较多,两个或两个以上无法避免使用相同识别特征字符串(例如使用了相同的程序和模板),则可以使用第二识别特征字符串加以识别。
可以在测试地址中输入一个列表页或内容页地址,点击查看测试结果,确认列表页或内容页的源代码中是否包含识别特征字符串。
示例
列表页:https://www.dismall.com/forum-48-1.html
采集规则:
<body id="nv_forum" class="pg_forumdisplay"
内容页:https://www.dismall.com/thread-14121-1-1.html
采集规则:
<body id="nv_forum" class="pg_viewthread"