Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

SupeSite采集器的几个bug

[复制链接]
Simonsen46 发表于 2008-11-6 20:56:12 | 显示全部楼层 |阅读模式
本帖最后由 Simonsen46 于 2008-11-8 00:38 编辑

最近在使用,发现了几个问题,报告上来,希望官方能够修正。

1、在采集动网论坛这一类url中带query string(即url中含“&”字符)的页面时,从远端获取的页面会报告“参数错误”,经排查,发现是采集器内部发送到远端服务器的url有误,错将“&”符号编码为“&”了。此其一。
2、当远端页面的编码与当前SS系统编码不符时,即使已经正确填写远端页面的编码类型,仍然不能获得远端内容的“subject”、“message”之值,经排查系采集器从远端取得页面源码后没有将页面源码转码所致。
3、一个严重的错误!采集器采集的结果在“采集结果”中看不到,经排查,是因为supe_robotmessage表中没有数据所致。

以上三个问题系统官方能及时解决。

第一次使用SS的采集器就发现这么几个问题,汗啊……
 楼主| Simonsen46 发表于 2008-11-7 00:54:54 | 显示全部楼层
关于第三个问题,刚刚发现不是什么严重问题,而且表也不是“robotmessages”,而是“robotitems”,这里更正一下。似乎是项目组的逻辑不够严密造成的。

我提出这个问题是因为在采集器采集一次完成之后,会出现一个链接:“采集完成,点击此处查看采集结果”。我每次点进去看,不管是“已导入”还是“未导入”,都没有内容,让我怀疑是不是哪个地方出错了,或者是另外一个未解决的bug,结果后来才发现,原来spaceitems里面已经有内容了,只是因为我在采集器中指定了导入到某个具体的分类,所以采集时直接将内容导入分类,这个所谓的“结果”页面就不再做任何显示。同时在采集器设置页面也没有任何文字表明设置了导入分类就不会在结果页面展示采集结果。这就是对用户的误导了。
简而言之:即使用户指定了“自动导入到”的分类,也在“查看结果”页的“已导入”栏目中保留导入的结果。至于删除采集结果的同时会删除spaceitems和spacenews等相关联的数据,这点相当好,我觉得完全可以保留。未避免出错,在用户提交删除操作时通过js的alert来提示一下,也就完全足够了。
回复

使用道具 举报

hxzhuang 发表于 2008-11-7 01:10:32 | 显示全部楼层
强大。。
回复

使用道具 举报

 楼主| Simonsen46 发表于 2008-11-8 00:40:15 | 显示全部楼层
咋不见官方的同学来回个话呢?
偶也是一番好意,给点儿掌声么,呵呵
回复

使用道具 举报

stshx 发表于 2008-11-11 16:44:22 | 显示全部楼层
升级到6.0.1后早就不能采集了~~
不过 你在原来的机器人复制一下,,修改一下网址还是可以采集的
回复

使用道具 举报

紫琼 发表于 2008-11-18 09:51:13 | 显示全部楼层
SS6.0.1 uc 音乐盒和采集器的问题都解决了,请下载1017的补丁覆盖即可。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-16 10:47 , Processed in 0.025934 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表