Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

ss采集建议多参考一下火车头

[复制链接]
FromCD 发表于 2006-7-9 15:58:33 | 显示全部楼层 |阅读模式
1。获取连接 可以设置过滤:包含某些字符或不能包含某些字符
一个区域内连接经常是多种多样的,比如有来自bbs、新闻、广告... ;还有大站连接地址经常包含日期,这样也方便采集指定日期的连接
2。最好自动判断url前缀,如果连接地址是绝对地址还方便--添加域名前缀就可以了;假如 使用相对地址 ,那么相同规则下各小板块就麻烦了,因为前缀总有些差别,每个小板块都复制新规则,规则列表就一大堆了。
3. 处理出来的分页全部是单独文章,很不合适,ss不支持分页发表?
4. bbs多楼采集怎么做?
5. 分页区域 不能 自动识别重复页码,绝大部分分页是上下页和上下页导航同时存在
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-16 01:37 , Processed in 0.021895 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表