Discuz!官方免费开源建站系统

 找回密码
 立即注册
搜索

[采集] 新浪新闻频道采集规则FOR SupeSite 7.0

[复制链接]
artemis_team 发表于 2009-11-5 16:00:27 | 显示全部楼层 |阅读模式
本帖最后由 artemis_team 于 2009-11-6 14:11 编辑

最近帮朋友搞了个站,然后要采集新闻,于是懒的就去论坛找了几个,发现采集错误不少,于是就 改了很多规则!
全部可以用!采集时间和网上的新闻是同一天的!


robot_新浪-港台明星.txt
robot_新浪-国际军情.txt
robot_新浪科技-互联网国际新闻.txt
robot_新浪科技-互联网国内新闻.txt
robot_新浪-内地明星.txt
robot_新浪-欧美明星.txt
robot_新浪-日韩明星.txt
robot_新浪-社会万象.txt
robot_新浪-社会与法.txt
robot_新浪-中国军情.txt
回复

使用道具 举报

五元超市 发表于 2009-11-5 16:11:07 | 显示全部楼层
有多少个啊。
回复

使用道具 举报

jajab 发表于 2009-11-6 11:28:06 | 显示全部楼层
我用的是  SS7.5   
采集地址   
商业观察 >> 商场报道
http://fashion.chinasspp.com/manasp200002.htm]http://fashion.chinasspp.com/manasp200002.htm[/url]
http://fashion.chinasspp.com/manasp140002.htm
帮我写下可以吗?
我的网站是:[url=http://www.jajab.cn/,我用摸版免费相送???
回复

使用道具 举报

 楼主| artemis_team 发表于 2009-11-6 12:05:35 | 显示全部楼层
如果采集新闻少的页面,建议采集是正序!
回复

使用道具 举报

 楼主| artemis_team 发表于 2009-11-6 14:11:37 | 显示全部楼层
*******************************************************************************/
修改common.js,在这里我添加了一些代码

function title_powered(str2) { var str1 = document.title; var str2 = str1.indexOf(" - Powered by X-Space"); if (str2 != -1) {

document.title=document.title.substring(0,str2);}}title_powered();function title_powered2(str3) { var str1 = document.title; var

str3 = str1.indexOf(" - Powered by SupeSite"); if (str3 != -1) { document.title=document.title.substring(0,str3); }}title_powered2

();

上面这段代码的作用是去掉页面标题后的版权

*******************************************************************************/
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-9-16 02:56 , Processed in 0.105123 second(s), 15 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表