Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

信息采集器建议

[复制链接]
robogame 发表于 2007-4-26 07:47:49 | 显示全部楼层 |阅读模式
1.提供采集器分类
2.在采集图片的时候,比如说新华网的图片的前缀是当前网页的前缀,但是这个前缀不是固定的,所以建议图片前缀设置两个选项:a.当前网页目录前缀,b,自己添加前缀
茄子 发表于 2007-4-26 17:05:26 | 显示全部楼层
谢谢您的建议
回复

使用道具 举报

茄子 发表于 2007-4-26 17:05:55 | 显示全部楼层
.在采集图片的时候,比如说新华网的图片的前缀是当前网页的前缀,但是这个前缀不是固定的,所以建议图片前缀设置两个选项:a.当前网页目录前缀,b,自己添加前缀



这个可以详细说说
回复

使用道具 举报

 楼主| robogame 发表于 2007-4-27 11:59:20 | 显示全部楼层
原帖由 茄子 于 2007-4-26 17:05 发表
.在采集图片的时候,比如说新华网的图片的前缀是当前网页的前缀,但是这个前缀不是固定的,所以建议图片前缀设置两个选项:a.当前网页目录前缀,b,自己添加前缀



这个可以详细说说

比如说新华网的新闻的链接地址是http://news.xinhuanet.com/photo/2007-03/18/12133.html
那么它的新闻图片的链接地址就是34324.jpg,
而前缀是http://news.xinhuanet.com/photo/2007-03/18/
再者就是关于下一页,
很多新闻的下以页是这样的http://news.xinhuanet.com/photo/2007-03/18/12133_1.html
所以搜索下一页,应该搞成可以选择的,要么增长型,要么自己手工输入
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-17 19:02 , Processed in 0.028626 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表