Discuz!官方免费开源建站系统

 找回密码
 立即注册
搜索

[疑问] 采集特殊的分页要如何处理?

[复制链接]
irw 发表于 2009-7-24 19:58:52 | 显示全部楼层 |阅读模式
本帖最后由 irw 于 2009-7-24 20:41 编辑

要采集阿里的一些图文资讯可是他的分页搞的太让人奇怪了
下面这个地址
http://info.china.alibaba.com/ne ... d1002992970-p1.html

分页代码如下:
  1.                 var clearTime;
  2.                 function nextPage(){
  3.                         var isHash = '#cartoon';
  4.                                                 document.forms["picnewsForm"].action='/news/detail/v5003000-d1002992970-p4.html'+isHash;

  5. document.forms["picnewsForm"].submit();
  6.                                           }
  7.                 function prePage(){
  8.                         var isHash = '#cartoon';
  9.                                                   document.forms["picnewsForm"].action= '/news/detail/v5003000-d1002992970-p2.html'+isHash;
  10.                   
  11.                                                                                                                                         document.forms["picnewsForm"].submit();
  12.                                           }
复制代码
这个可以处理了。可以在采集的时候程序会采集下一面
文章内容分页区域识别规则
  1. function nextPage(){[pagearea]}
复制代码
文章内容分页链接识别规则[code]document.forms["picnewsForm"].action='
回复

使用道具 举报

复读生 发表于 2009-7-24 20:11:47 | 显示全部楼层
注意分页的url就可以了
javascript 要注意跳转
回复

使用道具 举报

 楼主| irw 发表于 2009-7-24 20:53:17 | 显示全部楼层
注意分页的url就可以了
javascript 要注意跳转
复读生 发表于 2009-7-24 20:11

能说的具体点吗?我现在就是这个问题!
回复

使用道具 举报

复读生 发表于 2009-7-25 09:23:42 | 显示全部楼层
能说的具体点吗?我现在就是这个问题!
irw 发表于 2009-7-24 20:53


采集分页的时候

最主要的就是观测url的变化

找到这个就可以了

需要多尝试
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-9-12 04:14 , Processed in 0.101493 second(s), 14 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表