Discuz!官方免费开源建站系统

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

浅析搜索引擎对页面的收录原理以及收录方式,疑问多多?

[复制链接]
iduaiwx 发表于 2009-11-16 14:56:17 | 显示全部楼层 |阅读模式
本帖最后由 媛来后爱 于 2009-11-16 17:18 编辑

今天在学习的时候,看到如此一篇文章,浅析搜索引擎对页面的收录原理以及收录方式,该作者主要提到了三个连贯方面来进行阐述,但就其中所提到的这三个方面我却意思模糊。 
1. 页面收录流程 
  作者提到:URL是页面的入口,则域名则是网站的入口,搜索引擎就是通过域名进入网站,挖掘URL资源,换而言之搜索引擎在互联网中抓取页面的首要任务就是要有庞大的域名列表,在不断的通过域名,进入网站抓取网站中的页面。
  所谓的域名列表作何解释?

2.页面收录原理 
  不停地从URL 列表中移出已经访问的URL,并存储原始页面,同时提取原始页面中的URL的信息:再将URL分为域名及内部URL两大类,同时判断URL是否被访问过, 将未访问过的URL加入URL列表中。递归地扫描URL列表,直至耗尽所有URL资源为止。经过这些工作,搜索引擎就可以建立庞大的域名列表、页面URL 列表并储存足够多的原始页面。

3.页面收录方式
  页面收录方式是指搜索引擎抓取页面时所使用的策略,目的是为了能在互联网中筛选出相对重要的信息,页面收录的方式的制定取决于搜索引擎对网络结构的理解
goodluck818 发表于 2009-11-17 15:19:13 | 显示全部楼层
学习了。。。。
回复

使用道具 举报

№11买空间网 发表于 2009-11-17 16:58:45 | 显示全部楼层
看一下 呢~~~
回复

使用道具 举报

xinshouwz 发表于 2009-11-17 23:01:38 | 显示全部楼层
支持一个!!!!!!!!!!!!!!
回复

使用道具 举报

 楼主| iduaiwx 发表于 2009-11-19 21:53:35 | 显示全部楼层
我自己也顶一个。。不过很多问题还是没有得到解决!呜呜。。。
回复

使用道具 举报

hookme 发表于 2009-11-26 22:21:14 | 显示全部楼层
学习了!!!             
回复

使用道具 举报

coldhair 发表于 2009-11-27 09:50:21 | 显示全部楼层
分析的还不错,谢谢
回复

使用道具 举报

coldhair 发表于 2009-11-27 09:50:40 | 显示全部楼层
分析的还不错,谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|Discuz! 官方站 ( 皖ICP备16010102号 )star

GMT+8, 2025-1-9 16:49 , Processed in 0.030175 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表