Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

这种分页采集要怎么采呢????

[复制链接]
aishangni 发表于 2009-11-16 19:34:17 | 显示全部楼层 |阅读模式
本帖最后由 aishangni 于 2009-11-16 20:12 编辑



这么一个分页形式的,就是说分页一共有10页的,但他一个页面上最多显示分页为8页,也就是要点到第8页时就变成这样了



也就是说一次显示他只显示8个页面的链接,无法全部显示,这样就很采集了,最多只能采集最前面的8页,不知有没有高手帮我一下,是不是能采集,规则要怎么写??????

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
ljbetter 发表于 2009-11-16 19:55:24 | 显示全部楼层
还真没有试过多达8页以上的
回复

使用道具 举报

 楼主| aishangni 发表于 2009-11-16 20:03:04 | 显示全部楼层
这挺多的吧,不知道该怎么采集了......高手呀高手快来教一教呀
回复

使用道具 举报

 楼主| aishangni 发表于 2009-11-16 20:13:12 | 显示全部楼层
没人来回答一下吗?
回复

使用道具 举报

花花世界2009 发表于 2009-11-16 22:38:39 | 显示全部楼层
应该去改SS源代码,把里面的限制去掉即可吧
回复

使用道具 举报

hoping 发表于 2009-11-16 23:36:57 | 显示全部楼层
本人没使用过ss自带的采集,以下纯属猜测:如果是这样的话,那么,采集时每一页都要轮询一下页面导航区域,就是常见的那种页面链接模式(全部列表,上下页模式)的。只是不知道SS的后台是否有这样的设置。
回复

使用道具 举报

gagade 发表于 2009-11-17 01:20:34 | 显示全部楼层
上饶的本地网站有很多,我觉得上饶生活网不错,网站提供了最新http://www.0793i.com]上饶新闻[/url],融入了电影、小说等娱乐元素,上饶影院中更是有激情电影,上饶房产介绍最新房产信息,上饶商机为您提供最新商机,让您把握市场脉搏,上饶发布,上饶信息,上饶求职,上饶人才,上饶美女,上饶美食,这里顺便给大家介绍一个南昌烧烤的网站,里面有很多好吃的烧烤,可以算是最好吃的烧烤了,还有烧烤技术,烧烤配方,烧烤加盟,烧烤培训,无烟烧烤,特色烧烤,烧烤车,南昌美食,南昌小吃,美食秘方等.上饶旅游,上饶二手交易等综合信息,是上饶美女,上饶帅哥交流的最佳乐园.上饶论坛更是聚集了上饶交友,上饶兼职,其中上饶兼职美女多多哦,上饶的驴友们可以来此发布信息了,想在上饶租房,在上饶买房的朋友也不要错过了,在同城活动板块里可以发布上饶聚会,上饶一夜,A饭K歌.爱漂亮的上饶女人们在美丽女人板块里尽情的遨游吧。两性话题栏目讲诉两性故事,性知识,性保健避孕专题等,您可以发布生活中的[url=http://www.0793i.com/bbs/forumdisplay.php?fid=53][color=#424242.
回复

使用道具 举报

oiomage 发表于 2009-11-17 10:16:58 | 显示全部楼层
有两种采集模式,一是利用【上下页】来获取下一页的连接,二是通过页码,究竟如何选择,那要看你如何能准确的获取链接
其实两者以获取下一页的链接为工作原理,
假如下一页会有特殊的标记,比如
  1. <a style="nextpage" href="www.baby-i.cn/news/">下一页</a>
复制代码
那就可以使用【上下页】模式,规则为
  1. <a [color=Red]class="nextpage" [/color]href="[pagearea]">[color=Red]下一页[/color]
复制代码

分页链接规则则直接可以写为
复制代码
。关键是要有特殊的标记(见例子中的红色标记)

如果采用页码模式,则需要获取下一页的链接
示例:
  1. <div id="page_list">
  2. <a href="1.html">1</a>
  3. <a href="2.html">2</a>
  4. [color=Red]<span color="red">3</span>[/color]
  5. <a href="4.html">4</a>
  6. <a href="5.html">5</a>
  7. </div>
复制代码


如上,通过
  1. <div id="page_list">[pagearea]</div>
复制代码
可以获取分页区域
,又知以上页码列表中,
  1. <span color="red">3</span>
复制代码
比较特殊,为当前页
那么
  1. <a href="4.html">4</a>
复制代码
就是下一页,通过获取这一个就可以了,
,那么链接的规则就是
  1. </span>*<a href="">
复制代码

注意代码中的*,*可以代表任意多的任意字符,包括换行,但是*是以最少匹配为原则,即代码从前到后如果遇到与*后面相匹配的,就停止匹配。

如果在每一页的页码列表中,当前页之后可以看到下一页的链接就可以使用这种方式采集。
比如一共有20页,但是当前(在第一页的时候)只能看到10个页码链接,但只要到点击第十页会自动将第十一页链接显示就可以使用。
回复

使用道具 举报

 楼主| aishangni 发表于 2009-11-17 13:55:26 | 显示全部楼层
非常感谢楼上的,原本我也使用了上下页,但没弄成,现在看你这么一说,明了了很多,谢谢楼上的,
回复

使用道具 举报

 楼主| aishangni 发表于 2009-11-17 14:09:53 | 显示全部楼层
  1. <div class="page"><ul><li><a>共9页: </a></li><li><a href='#'>上一页</a></li><li class="thisclass"><a href='#'>1</a></li><li><a href='7384_2.html'>2</a></li><li><a href='7384_3.html'>3</a></li><li><a href='7384_4.html'>4</a></li><li><a href='7384_5.html'>5</a></li><li><a href='7384_6.html'>6</a></li><li><a href='7384_7.html'>7</a></li><li><a href='7384_8.html'>8</a></li><li><a href='7384_2.html'>下一页</a></li></ul></div>
复制代码
还是有问题,这种类形的,好像采不了吧...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-17 02:30 , Processed in 0.037574 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表