Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
12
返回列表 发新帖

CMS用到最后只剩采集

[复制链接]
 楼主| 7u5 发表于 2009-6-10 10:23:36 | 显示全部楼层
楼上的,我假设一个例子。

先撇开质量与否,垃圾站与否。

假设你一天手动采集100篇文章。
你需要做什么?
0.选择内容
1.复制内容,图片
2.(进行一些编辑)
3.选择类别
4.发布。

而这些除了编辑以外,其他4个步骤都可以通过采集实现。
其他不说,单单就“选择类别”来说,一般站点都是目录结构。比如“体育”->“NBA”,这样的例子。

你如果在采集器里设置一个类别对应替换。这个重复100次的选择操作,就可以省略。

再说你的质量问题,也即选择。这个就是内容选择性聚合的问题。

而对应的操作,其实是一个文章id的列表(选择完以后)。
采集器读取这个列表文章id。并替你进行 以上所列出的1-4步骤的3步,你只需在此后做第三步的工作。
回复

使用道具 举报

 楼主| 7u5 发表于 2009-6-10 10:29:25 | 显示全部楼层
事实上ss的采集器,根本没有实现这样的功能。ss7的采集器甚至80%时间罢工。

类别匹配、手动自定列表、根据采集内容新增类别等等。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-24 05:32 , Processed in 0.025308 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表