Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[采集] 采集时如何过滤空白行

[复制链接]
protoss2008 发表于 2009-7-17 10:31:13 | 显示全部楼层 |阅读模式
有些网站里的文章段落之间采用3~5行空白行,文章采集到这里时就会自动中止,后面内容无法采集。请问该怎么办?
lidq.jingwu 发表于 2009-7-17 10:37:21 | 显示全部楼层
你采集的哪个网站,哪些内容,我本地试试
回复

使用道具 举报

 楼主| protoss2008 发表于 2009-7-17 10:53:40 | 显示全部楼层
http://bbs.tiexue.net/ShowClass_26_1.html   好像是我定义的采集文章内空的问题,文章内容里定义了一个<div>标签,插入了一段广告,采集时只能采集第一个<div>标签里的内容,我还在尝试中,如果你找到答案请跟我分享一下,谢谢!我的QQ570822611
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-1-10 17:12 , Processed in 0.023035 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表