Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[采集] 求助,采集的时候列表页和内容页的编码不一致怎么办?

[复制链接]
windflaw 发表于 2009-5-24 21:41:38 | 显示全部楼层 |阅读模式
采集新浪的体育资讯,如:http://rss.sina.com.cn/roll/sports/hot_roll.xml
该网页的编码为utf-8,而链接的内容页的编码却是gb2312
我用的是ss6 utf-8

如果采集的编码设置为utf-8,则内容无法采集,直接就说“标题经过处理为空,跳过”,而如果我采集编码设置为GB2312,则直接列表页测试显示“没识别出任何内容,请检查识别规则”。

请问该问题该如何解决?
巴萨最强 发表于 2009-5-24 21:51:09 | 显示全部楼层
我也想知道这个怎么办
回复

使用道具 举报

々脚印 发表于 2009-5-24 22:01:43 | 显示全部楼层
官方得去考虑8.0是不是要增加这个的采集功能!
回复

使用道具 举报

 楼主| windflaw 发表于 2009-5-25 00:05:19 | 显示全部楼层
哎呀!我急啊!
官方怎么也不增强一下?
回复

使用道具 举报

 楼主| windflaw 发表于 2009-5-26 09:45:20 | 显示全部楼层
官方对于这个缺陷可有修复/开发计划?
回复

使用道具 举报

 楼主| windflaw 发表于 2009-6-7 20:38:34 | 显示全部楼层

再顶一下吧!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-15 11:46 , Processed in 0.032361 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表