采集特殊的分页要如何处理？

irw · 发表于 2009-7-24 19:58:52

本帖最后由 irw 于 2009-7-24 20:41 编辑

要采集阿里的一些图文资讯可是他的分页搞的太让人奇怪了
下面这个地址
http://info.china.alibaba.com/ne ... d1002992970-p1.html

分页代码如下：

var clearTime;
function nextPage(){
var isHash = '#cartoon';
document.forms["picnewsForm"].action='/news/detail/v5003000-d1002992970-p4.html'+isHash;
document.forms["picnewsForm"].submit();
}
function prePage(){
var isHash = '#cartoon';
document.forms["picnewsForm"].action= '/news/detail/v5003000-d1002992970-p2.html'+isHash;
document.forms["picnewsForm"].submit();
}

复制代码

这个可以处理了。可以在采集的时候程序会采集下一面
文章内容分页区域识别规则

复制代码

文章内容分页链接识别规则[code]document.forms["picnewsForm"].action='

复读生 · 发表于 2009-7-24 20:11:47

注意分页的url就可以了
javascript 要注意跳转

irw · 发表于 2009-7-24 20:53:17

注意分页的url就可以了
javascript 要注意跳转
复读生发表于 2009-7-24 20:11

能说的具体点吗？我现在就是这个问题！

复读生 · 发表于 2009-7-25 09:23:42

能说的具体点吗？我现在就是这个问题！
irw 发表于 2009-7-24 20:53

采集分页的时候

最主要的就是观测url的变化

找到这个就可以了

需要多尝试

		自动登录	找回密码
密码			立即注册

[疑问] 采集特殊的分页要如何处理？