Discuz!官方免费开源建站系统

 找回密码
 立即注册
搜索

[发布] 阜阳新闻网文章采集规则

[复制链接]
世界村 发表于 2012-3-11 22:11:28 | 显示全部楼层 |阅读模式
采集机器人:http://bbs.gv2010.com/thread-13012-1-1.html
使用方法:下载附件,直接导入机器人

代码规则
列表页面编码
  1. gbk
复制代码
列表区域识别规则
  1. <!--[diy=listcontenttop]-->[list]<!--[diy=listloopbottom]-->
复制代码
文章链接URL识别规则
  1. <dt class="xs2"><a href="" target="_blank" class="xi2" style="">
复制代码
文章标题识别规则
  1. <h1 class="ph">[subject] </h1>
复制代码
文章内容识别规则
  1. <!--[diy=diycontenttop]-->[message]<!--[diy=diycontentbottom]-->
复制代码
文章内容过滤规则
  1. <div class="pg">*</div>
复制代码
文章内容分页区域识别规则
  1. <div class="pg">[pagearea]</div>
复制代码
文章内容分页链接识别规则
[code]<a href="
回复

使用道具 举报

lkbase 发表于 2012-3-13 12:17:36 | 显示全部楼层
不是本地的,不想要。哈哈。不过感谢分享
回复

使用道具 举报

hhahahala 发表于 2012-3-14 12:30:33 | 显示全部楼层
不错。值得学习啊,顶一个
回复

使用道具 举报

qdreai 发表于 2013-10-25 13:29:26 | 显示全部楼层
感谢楼主分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-11-26 16:33 , Processed in 0.102625 second(s), 14 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表