Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[已答复] 采集来的文章,如何不重复?

[复制链接]
beginzy 发表于 2009-7-8 11:12:52 | 显示全部楼层 |阅读模式
是这样的,我发现我用不同采集器采来的文章有很多都是一样的,能不能在哪设置一下让他们有相同标题的文章不抓取或采集呢?

第二个问题,现在我里面文章有上千个,我不可能自己手动去一个一个的找,有没有什么办法能把标题重复的文章显示出来呢。
紫琼 发表于 2009-7-8 11:17:29 | 显示全部楼层
目前没有这样的过滤功能,我提交下发展建议吧~采集信息重复确实是个很头疼的事情~
回复

使用道具 举报

ug8 发表于 2009-7-8 11:20:06 | 显示全部楼层
哎  是的不好搞

手工都会发重复的
回复

使用道具 举报

littlehz 发表于 2009-7-8 11:31:41 | 显示全部楼层
如果需要后期把所有文章标题重复的列出来,可以到数据库中直接运行如下SQL语句。supe_spaceitems是表名,subject是标题所在字段

  1. select supe_spaceitems1.subject,count(*) from supe_spaceitems as supe_spaceitems1 ,supe_spaceitems as supe_spaceitems2 where supe_spaceitems1.itemid!=supe_spaceitems2.itemid and supe_spaceitems1.subject=supe_spaceitems2.subject group by supe_spaceitems1.subject;
复制代码
详细请看http://www.littz.cn/viewnews-349.html
回复

使用道具 举报

 楼主| beginzy 发表于 2009-7-8 14:23:07 | 显示全部楼层
目前没有这样的过滤功能,我提交下发展建议吧~采集信息重复确实是个很头疼的事情~
紫琼 发表于 2009-7-8 11:17



希望早日出来这个问题的补丁~~~~~~~~~~~
回复

使用道具 举报

 楼主| beginzy 发表于 2009-7-8 14:23:42 | 显示全部楼层
如果需要后期把所有文章标题重复的列出来,可以到数据库中直接运行如下SQL语句。supe_spaceitems是表名,subject是标题所在字段
select supe_spaceitems1.subject,count(*) from supe_spaceitems as supe_spaceitem ...
littlehz 发表于 2009-7-8 11:31

不行,你这太复杂了,你是高手可以弄,像我这样的初级人员可不行了。
回复

使用道具 举报

chenjinquan 发表于 2009-7-8 15:11:10 | 显示全部楼层
是啊,确实是个问题,希望提早出来
回复

使用道具 举报

ug8 发表于 2009-7-8 15:15:02 | 显示全部楼层
不行的我早就试过一
应用就会报警

数据库一大  就那他没有办法的


呵呵


反正搜索引擎会过滤的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-1-10 00:41 , Processed in 0.030971 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表