Discuz!官方免费开源建站系统

 找回密码
 立即注册
搜索

[疑问] SS采集多个网站提示无法读取都

[复制链接]
pcnet120 发表于 2008-4-2 11:04:03 | 显示全部楼层 |阅读模式
http://www.315che.com/newsc/50.htm
http://www.ccfv.cn/category-329.shtml无法读取(连我自己的站也无法读取)

还有好几个站都无法获取全部的源码
仔细观察,以上几站都是DIV+CSS代码的站。
回复

使用道具 举报

ted1006 发表于 2008-4-2 11:49:28 | 显示全部楼层
这个确实不能连接~
不知道他的网站是怎麽的设置。
回复

使用道具 举报

 楼主| pcnet120 发表于 2008-4-2 12:05:46 | 显示全部楼层
我觉得不是目标网站设置的原因,而是SS采集器的原因。我用动易的采集测试都没有问题,包括昨天中国消费网的,获取代码只获取一部分,用动易的采集都没有问题。但SS的采集就是获取不了代码,而且这个站改版前是TD表格结构,采集都没有问题。
建议SS技术人员仔细看一下这个问题,修正一下采集器的问题。 采集.jpg

[ 本帖最后由 pcnet120 于 2008-4-2 12:10 编辑 ]
回复

使用道具 举报

疯鼠 发表于 2008-4-2 17:28:21 | 显示全部楼层
http://www.ccfv.cn/category-329.shtml
你的网站可以抓取的

另外的一个估计对方做了防盗链
回复

使用道具 举报

 楼主| pcnet120 发表于 2008-4-2 19:24:04 | 显示全部楼层
原帖由 疯鼠 于 2008-4-2 17:28 发表
http://www.ccfv.cn/category-329.shtml
你的网站可以抓取的

另外的一个估计对方做了防盗链


没有防盗链的,我用动易的采集器采集一点问题也没有。
回复

使用道具 举报

 楼主| pcnet120 发表于 2008-4-2 19:34:40 | 显示全部楼层
08-3-31 13:59
http://www.ccn.com.cn/news/18/1.html,这个站的其它栏目的列表页也是这样,总是显示以下这段源码,而显示不了以后的源吗,同样的页面我用动易的采集器能够获取准确的文章链接。在SS后台测试了一上午,这一步老通不过,请你帮我测试一下。
回复

使用道具 举报

 楼主| pcnet120 发表于 2008-4-3 11:46:00 | 显示全部楼层
请官方测试一下,GBK2312编码转GBK的问题,在论坛中也看过这种编码的网站,采集时获取不了代码的问题,把代码改为U8的能读出列表,但采集出来的是乱码。
回复

使用道具 举报

v215com 发表于 2008-4-3 16:04:58 | 显示全部楼层
不知道SS采集时的UserAgent是什么

是不是以模拟蜘蛛爬行啊

有些网站会屏蔽一些UserAgent的
回复

使用道具 举报

 楼主| pcnet120 发表于 2008-4-3 22:04:51 | 显示全部楼层
同类编码的和U8的没问题的,好像就是GBK2312的转BGK的有问题。
回复

使用道具 举报

v215com 发表于 2008-4-4 04:26:15 | 显示全部楼层
GBK2312的转BGK??

这两不用转
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-9-15 13:14 , Processed in 0.117464 second(s), 17 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表