Discuz!官方免费开源建站系统

 找回密码
 立即注册
搜索

[已答复] 采集中,部分图片本地化失败

[复制链接]
zh99998 发表于 2009-10-5 09:48:32 | 显示全部楼层 |阅读模式
本帖最后由 zh99998 于 2009-10-7 20:21 编辑

我想把一些图片URL转换成附件,于是自己构造了一个列表页和一些内容页,来做采集
因为列表页和内容页都是自己构造的,所以格式很统一,每条内容里面都是只有一张图片,所以正常情况应该是所有的采集出来的资讯全都带一个图片附件才对,现在只有一部分变成附件了,另一部分仍然是<img src的形式链接的


求解

URL已经编码为带百分号的那种形式,并且现在发现英文的也有一部分是这样子,所以应该不是编码的问题了
我ss程序是UTF8,用来采集的数据文件UTF8和GB2312都试过,都是只能转一部分
回复

使用道具 举报

littlehz 发表于 2009-10-5 12:25:33 | 显示全部楼层
标准URL本来就不能含有中文的。
回复

使用道具 举报

 楼主| zh99998 发表于 2009-10-5 12:28:06 | 显示全部楼层
转URL编码成功了^ ^

然后配置的采集器又挂了- -
纠结啊纠结
回复

使用道具 举报

锦猫鼠 发表于 2009-10-5 13:18:56 | 显示全部楼层
对url进行编码,再次试一试
回复

使用道具 举报

 楼主| zh99998 发表于 2009-10-6 06:41:32 | 显示全部楼层
本帖最后由 zh99998 于 2009-10-6 06:43 编辑

对URL编码后,所有资讯都有附件了,但是有一部分资讯,里面是一个空附件,图片还是以HTML的形式进行的链接
无标题.png 无标题.png
并且发现貌似不是中文的问题- -英文的也有这样的
回复

使用道具 举报

littlehz 发表于 2009-10-6 12:23:45 | 显示全部楼层
<img src="" />用了引号没? 有没有用/结束?后缀名是否都为.jpg或者.gif?
回复

使用道具 举报

 楼主| zh99998 发表于 2009-10-6 17:34:50 | 显示全部楼层
本帖最后由 zh99998 于 2009-10-6 17:53 编辑

之前的没用/结束,但是添加了/之后仍然那样
有jpg,bmp,png和bmp,但是jpg文件也有失败(比如上面的截图里那个,jpg的,英文名字,失败了)
现在那个页的代码是这样子的
  1. 40334<p><img src="http://bbs.66rpg.com/zh99998/ss0906/up/TEACH/200512/zymap908.jpg" /></p>
复制代码
还有很奇怪的是,如果采集的时候不指定导入的分类,那么是能够识别出来有个图片的,但是不论是采集的时候指定分类,还是采集完之后导入,都会出现失败

无标题.png
↑注意看【包含图片】一栏,程序已经认出来那个图片了
回复

使用道具 举报

 楼主| zh99998 发表于 2009-10-7 11:56:37 | 显示全部楼层
一天了……up一下……
回复

使用道具 举报

蓝色月刃 发表于 2009-10-7 17:23:25 | 显示全部楼层
专业采集团队  QQ:200888328
回复

使用道具 举报

littlehz 发表于 2009-10-7 18:17:00 | 显示全部楼层
一时半会儿也想不出什么原因。我所有站点上的采集图片都没有过问题。
你还是整理一下没采集到的图片在URL或者源代码,或者体积大小等上有没有什么共同特点。这样才好分析是什么原因
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-9-14 09:21 , Processed in 0.111574 second(s), 17 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表