Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[分享] 【原创】SS7.5采集机器人定期更新发布哦&.&【5.5日更3000篇,总更217320篇】

  [复制链接]
 楼主| kingtung 发表于 2009-12-20 21:42:21 | 显示全部楼层
本帖最后由 kingtung 于 2009-12-20 21:44 编辑

有个别 的网页,它的代码规则不全部是一样的(比如第一条资讯中的内容前后的标签是<h1></h1>,第十条资讯中的内容前后标签是<h2></h2>,而我做采集时候,内容页识别标准是依据第一条中的<h1>这样的,所以碰到内容标签<h2>的信息时就会找不到而导致采集失败,明天我会优化一下这条规则,把它的识别范围适应放大一点,就可以解决了,再重传上来给你。)
回复

使用道具 举报

79549066 发表于 2009-12-20 22:09:32 | 显示全部楼层
真没用 我晕  骗你不是人 有必要吗 .........
回复

使用道具 举报

 楼主| kingtung 发表于 2009-12-20 22:44:07 | 显示全部楼层
真没用 我晕  骗你不是人 有必要吗 .........
79549066 发表于 2009-12-20 22:09



    用不着这样,留下你Qq我直接到你网站后台给你新建一个采集机器人就可以了。不知道你的SS是什么版本的?
回复

使用道具 举报

woshisma 发表于 2009-12-21 01:03:59 | 显示全部楼层
同行啊 呵呵 我是用PHP写蜘蛛的
回复

使用道具 举报

mancheng 发表于 2009-12-21 01:16:27 | 显示全部楼层
我想要采集的目标站及频道: http://gz.ganji.com/fang1/
采集后的信息要放在我网站的哪个频道:房屋信息-出租房
我的网站地址:www.wanggoo.com
回复

使用道具 举报

 楼主| kingtung 发表于 2009-12-21 12:39:50 | 显示全部楼层
本帖最后由 kingtung 于 2009-12-21 12:52 编辑
我想要采集的目标站及频道: http://gz.ganji.com/fang1/
采集后的信息要放在我网站的哪个频道:房屋信息-出 ...
mancheng 发表于 2009-12-21 01:16



    多次测试,还是采集失败,规则不支持,对不起哦,换一个来采吧!
回复

使用道具 举报

mancheng 发表于 2009-12-21 17:16:48 | 显示全部楼层
多次测试,还是采集失败,规则不支持,对不起哦,换一个来采吧!
kingtung 发表于 2009-12-21 12:39



看下这个:http://gz.58.com/zufang/  或者是:http://gz.51tie.com/zufang/

都可以 麻烦你啦~
回复

使用道具 举报

 楼主| kingtung 发表于 2009-12-21 17:29:45 | 显示全部楼层
看下这个:http://gz.58.com/zufang/  或者是:http://gz.51tie.com/zufang/

都可以 麻烦你啦~
mancheng 发表于 2009-12-21 17:16



    次日早上重新为你写&.&
回复

使用道具 举报

cool530 发表于 2009-12-21 19:03:34 | 显示全部楼层
我想要采集的目标站及频道:http://reviews.cnmo.com/
采集后的信息要放在我网站的哪个频道:手机评测♂手机新闻  http://cool530.com/forum-37-1.html
我的网站地址:http://cool530.com
回复

使用道具 举报

aqukun8088 发表于 2009-12-21 19:20:29 | 显示全部楼层
支持 楼主,支持 免费分享精神!楼主万岁
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-12-24 10:49 , Processed in 0.027800 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表