当前位置:首页 > 单贴采集 >

操作指南:单页采集--创建采集器--自动识别设置

插件可以依此字符串识别目标站点,自动匹配采集器,字符串为网页源代码中的一部分。 建议使用body标签部分的内容 不允许有中文和换行 长度不能少于10个字符 尽量避免与其它采集器

admin

    插件可以依此字符串识别目标站点,自动匹配采集器,字符串为网页源代码中的一部分。

  •     不要使用srcipt、style、iframe标签、备注和各种事件(例如onclick、onmouse)内的字符串
  •     不允许有中文和换行
  •     长度不能少于10个字符
  •     尽量避免与其它采集器特征字符串相同或者是其中的一部分

       如果不同的采集器识别特征字符串相同,可以增加第二特征字符串进行识别。

    “点击查看测试结果”可以确认指定的页面源代码中是否包含识别特征字符串。

 

    示例

    内容页:https://www.dismall.com/thread-14121-1-1.html

   采集规则:

        <body id="nv_forum" class="pg_viewthread"

 


返回顶部