求助，采集的时候列表页和内容页的编码不一致怎么办？

windflaw · 发表于 2009-5-24 21:41:38

采集新浪的体育资讯，如：http://rss.sina.com.cn/roll/sports/hot_roll.xml
该网页的编码为utf-8,而链接的内容页的编码却是gb2312
我用的是ss6 utf-8

如果采集的编码设置为utf-8,则内容无法采集，直接就说“标题经过处理为空，跳过”，而如果我采集编码设置为GB2312，则直接列表页测试显示“没识别出任何内容,请检查识别规则”。

请问该问题该如何解决？

巴萨最强 · 发表于 2009-5-24 21:51:09

我也想知道这个怎么办

々脚印 · 发表于 2009-5-24 22:01:43

官方得去考虑8.0是不是要增加这个的采集功能！

windflaw · 发表于 2009-5-25 00:05:19

哎呀！我急啊！
官方怎么也不增强一下？

windflaw · 发表于 2009-5-26 09:45:20

官方对于这个缺陷可有修复/开发计划？

windflaw · 发表于 2009-6-7 20:38:34

再顶一下吧！

		自动登录	找回密码
密码			立即注册

[采集] 求助，采集的时候列表页和内容页的编码不一致怎么办？