Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[采集] 文章内容识别规则测试成功,采集时候却内容处理失败

[复制链接]
155185446 发表于 2009-9-24 23:59:58 | 显示全部楼层 |阅读模式
文章内容识别规则测试成功,采集时候却内容处理失败。不知道是怎么一回事
pengzicheng 发表于 2010-2-14 23:28:59 | 显示全部楼层
我也是这样,规则都没问题,调试里看到的也是我想要的结果,但就是采集时提示内容处理失败,不知道是什么原因.  我个人感觉有可能是有的网站具有防采集功能!
回复

使用道具 举报

caoxk 发表于 2010-3-2 16:21:10 | 显示全部楼层
我的也是,采集淘宝的资讯,而且肯定是没有做防采集的,我用帝国是能够正常采集的,规则也是正确的,就是采集不了
回复

使用道具 举报

信宁军 发表于 2010-3-2 16:29:27 | 显示全部楼层
关于supesite7采集器的采集完就结束修改方案:
https://discuz.dismall.com/thread-1316401-1-1.html
回复

使用道具 举报

caoxk 发表于 2010-3-2 16:42:41 | 显示全部楼层
本帖最后由 caoxk 于 2010-3-2 17:18 编辑

按楼上的替换了代码,测试采集字符集出了问题,我的网站是UTF8的,采集的页面是GB2312的,设置正常
按同样的方法来设置,如果采集页是UTF8就正常,如果不设置采集页的字符集,也能采集,但采集到的是乱码,应该是个字符集转换的BUG
回复

使用道具 举报

信宁军 发表于 2010-3-2 20:08:36 | 显示全部楼层
按楼上的替换了代码,测试采集字符集出了问题,我的网站是UTF8的,采集的页面是GB2312的,设置正常
按同样 ...
caoxk 发表于 2010-3-2 16:42



    我有过类似经历,有次写规则时使用测试是乱码,不去管它,采回来却不是,估计测试的时候不会转换,真开始工作时才转换。
我用采集很少,没有太多经历支持以上说法,好像就一次吧
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-18 11:50 , Processed in 0.029790 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表