Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

采集存在明显的缺陷:采集列表之前应该还有一步要做修正!!

[复制链接]
wcl2222 发表于 2008-6-7 18:07:42 | 显示全部楼层 |阅读模式
本人在采集过程中,发现有些页面的符号作怪,不能让机器人识别,但又无法在采集列表之前进行过滤和替换,所以建议采集列表之前增加一步,可以过滤,或替换被采集页面源码的某些字符,内容,以免在采集过程中出现意外!!

[ 本帖最后由 wcl2222 于 2008-6-7 18:09 编辑 ]
 楼主| wcl2222 发表于 2008-6-8 05:07:51 | 显示全部楼层
郁闷啊,这个符号 ·  竟然过不去,抓取的内容遇到这个点就止住了,下面的抓不到!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-2-25 10:34 , Processed in 0.020829 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表