Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[采集] 发现ss7.5采集器一个问题,采集后某些字符会发生改变

[复制链接]
信宁军 发表于 2010-3-24 16:05:58 | 显示全部楼层 |阅读模式
从去年12月开始尝试使用ss7.5,因为采集使用不多,一直没有发现存在这个问题,今天也是偶然发现的。
使用采集之后,假设目标资讯的标题中含有以下字符,则不能识别或发生转换错误:
1、含有“喝”字的,变为“?”
2、含有“痕”字的,变为“?”
3、含有“病”字的,假设之后有引号或空格,变为“玻?”
4、含有“危害”的,变为“危?”,而仅含有“害”字的,无异常
我本身使用的是GBK版本,目标资讯无论是UTF8,还是GBK、GB2312,测试发现以上异常都会发生。
 楼主| 信宁军 发表于 2010-3-24 16:08:09 | 显示全部楼层
测试环境
Windows 2003 server IIS6.0+php 5.2.1+mysql 5.0.37+ZendOptimizer 3.2.6+phpMyAdmin 2.10.0.2
回复

使用道具 举报

skyice9 发表于 2010-3-30 19:48:55 | 显示全部楼层
我也无法采集,同样的问题
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-17 15:58 , Processed in 0.023635 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表