Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[已解决] robots禁止了蜘蛛爬行动态URL,怎么还是爬行呢?

[复制链接]
alvintony 发表于 2012-11-19 15:51:57 | 显示全部楼层 |阅读模式
我的论坛http://bbs.594zz.com/ 设置了robots禁止爬行动态页面。可是后台查看蜘蛛记录的时候,还是爬行的动态URL,而不是伪静态的。这个是怎么回事啊 ?如下图:


我实在是很郁闷,求大神指点啊!感激不尽!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
 楼主| alvintony 发表于 2012-11-21 13:21:39 | 显示全部楼层
么人回答啊????
回复

使用道具 举报

huoshi5151 发表于 2012-11-21 13:25:03 | 显示全部楼层
我也来学习一下
  1. #
  2. # robots.txt for Discuz! X2.5
  3. #

  4. User-agent: *
  5. Allow: /forum.php?mod=rss
  6. Allow: /favicon.ico
  7. Disallow: /api/
  8. Disallow: /data/
  9. Disallow: /source/
  10. Disallow: /install/
  11. Disallow: /template/
  12. Disallow: /config/
  13. Disallow: /uc_client/
  14. Disallow: /uc_server/
  15. Disallow: /static/
  16. Disallow: /admin.php
  17. Disallow: /archiver/
  18. Disallow: /search.php
  19. Disallow: /member.php
  20. Disallow: /api.php
  21. Disallow: /misc.php
  22. Disallow: /misc.php?mod=*
  23. Disallow: /connect.php
  24. Disallow: /forum.php?*
  25. Disallow: /home.php?*
  26. Disallow: /seoseokj*.html
  27. Disallow: /kj*.html
  28. Disallow: /qiandao
  29. Disallow: /renwu
  30. Disallow: /userapp.php?mod=app&*
  31. Disallow: /*?mod=misc*
  32. Disallow: /*?mod=attachment*
  33. Disallow: /*mobile=yes*
  34. Disallow: /?*
复制代码
回复

使用道具 举报

。See_you_tomor 发表于 2012-11-21 13:47:38 | 显示全部楼层
你的robot是什么时候更新的
回复

使用道具 举报

 楼主| alvintony 发表于 2012-11-21 14:10:35 | 显示全部楼层
。See_you_tomor 发表于 2012-11-21 13:47
你的robot是什么时候更新的

老早了,3个月前,以前是rewrite2.0的 换成了3.0的后,用的是.haccess,原来是httpd.ini
回复

使用道具 举报

mark35 发表于 2012-11-21 15:51:05 | 显示全部楼层
不是所有蜘蛛都遵守robot约定的
回复

使用道具 举报

 楼主| alvintony 发表于 2012-11-22 13:48:27 | 显示全部楼层
mark35 发表于 2012-11-21 15:51
不是所有蜘蛛都遵守robot约定的

我看的是百度 百度也不遵守吗?
回复

使用道具 举报

mark35 发表于 2012-11-22 13:53:52 | 显示全部楼层
alvintony 发表于 2012-11-22 13:48
我看的是百度 百度也不遵守吗?

有时搜索引擎会伪装成普通客户端来访问页面的
回复

使用道具 举报

 楼主| alvintony 发表于 2012-11-22 13:56:52 | 显示全部楼层
mark35 发表于 2012-11-22 13:53
有时搜索引擎会伪装成普通客户端来访问页面的

我查过的,ip是百度蜘蛛的。不过爬行的url全部是动态的!
回复

使用道具 举报

mark35 发表于 2012-11-22 14:00:36 | 显示全部楼层
alvintony 发表于 2012-11-22 13:56
我查过的,ip是百度蜘蛛的。不过爬行的url全部是动态的!

看访问日志中是否带了百度bot的标示么,没有那就是模拟正常访问
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2024-11-27 00:47 , Processed in 0.028713 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表