Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

gbk的ss程序采集utf-8页面,总是出现采集内容失败。反复尝试排除其他原因。

[复制链接]
testi 发表于 2009-2-17 11:22:52 | 显示全部楼层 |阅读模式
gbk的ss程序采集utf-8页面,总是出现采集内容失败。反复尝试排除其他原因。
紫琼 发表于 2009-2-17 13:51:40 | 显示全部楼层
采集器:GBK站采集繁体utf-8编码网站:https://discuz.dismall.com/thread-1156325-1-1.html
回复

使用道具 举报

jackzhang 发表于 2009-2-21 23:38:14 | 显示全部楼层
不行的,你给的例子也采不了.
对于utf-8的网页来说,如果不做字符转换的话是可以采的,但是乱码。如果做字符转换的话,没有一个能够采成功的。我的是 SupeSite 6.0Final .
希望能够引起重视。
我采集的网站是:http://www.linear.com.cn/company/press  不信你们自己采采试试
回复

使用道具 举报

jackzhang 发表于 2009-2-22 18:50:13 | 显示全部楼层
帮我做做上面那个网页的采集吧
回复

使用道具 举报

jackzhang 发表于 2009-2-24 14:59:01 | 显示全部楼层
感觉到discuz官方在逃避这一问题,这个问题时确实存在的,为什么不好好解决一下?!
回复

使用道具 举报

etming 发表于 2009-3-6 12:50:35 | 显示全部楼层
UTF-8在SS7中同样不能采集,一开始还以为是对方网站做了设置。
地址 http://www.yaoyu8.com
回复

使用道具 举报

tjason 发表于 2009-3-8 14:35:15 | 显示全部楼层
本帖最后由 tjason 于 2009-3-8 14:38 编辑

不同编码的采集是有问题的,我用utf-8的版本采集gbk的网站很多时都有问题,分页更是一直存在问题,只是康盛一直觉得是我们的规则问题

我试过用utf8 ss采集gbk网站,很多分页都采集不成功,有些分页内容是空的,内容过虑也失败了,然后我用gbk ss导入同一个robot采集就成功了

注:规则中我没使用中文
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-16 01:40 , Processed in 0.065614 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表