操作指南:单页采集--创建采集器--自动识别设置
插件可以依此字符串识别目标站点,自动匹配采集器,字符串为网页源代码中的一部分。 建议使用body标签部分的内容 不允许有中文和换行 长度不能少于10个字符 尽量避免与其它采集器
插件可以依此字符串识别目标站点,自动匹配采集器,字符串为网页源代码中的一部分。
- 不要使用srcipt、style、iframe标签、备注和各种事件(例如onclick、onmouse)内的字符串
- 不允许有中文和换行
- 长度不能少于10个字符
- 尽量避免与其它采集器特征字符串相同或者是其中的一部分
如果不同的采集器识别特征字符串相同,可以增加第二特征字符串进行识别。
“点击查看测试结果”可以确认指定的页面源代码中是否包含识别特征字符串。
示例
内容页:https://www.dismall.com/thread-14121-1-1.html
采集规则:
<body id="nv_forum" class="pg_viewthread"