搜索
查看: 61|回复: 0

百度抓取与收录的工作原理

[复制链接]
发表于 2018-6-30 14:56:39 | 显示全部楼层 |阅读模式
【廊坊网站优化】百度抓取与收录的工作原理

  很多初学者一直分不清“抓取”与“收录”有什么区别,甚至认为这两者是同一个意思,那么真是大错特错。掌握搜索引擎抓取、收录的工作原理,对于百度优化甚至其他搜索引擎优化将会有很大的帮助。

  一、抓取原理

  搜索引擎在抓取到我们网站的前提是必须要有渠道,当你新建一个域名,新建了一个普通页面,页面没有经过任何人的访问,也没有任何地方出现过你的页面,那么搜索引擎是无法正确的抓取到你的页面的,之所你建议页面以后什么都没有操作,搜索引擎一样可以抓取和收录,其原因主要是通过以下几个渠道。

  链接渠道:我们做外链的主要目的是什么,更重要的是让搜索引擎能够通过此链接正确的抓取到我们的网站,这也是SEOER都在说,现在新站建议做外链,老站就没必要的原因之一。

  提交渠道:80%的站点在建立以后会手动提交到搜索引擎,这是搜索引擎在收录到更多站点的一个重点渠道。

  浏览器渠道:百度曾报道,360浏览器可更具用户流量的网页进行收集和抓取,也就是说,当用户使用了360浏览器浏览了某一个未被360搜索引擎发现的站点,那么360浏览器将会记录这个网站,然后将这个网站放到搜索引擎去处理,同样,百度浏览器也是。

  二、收录原理

  为什么同时发布两篇文章,一篇被收录,还有一篇未收录?

  对比:当搜索引擎在抓取到你网站的文章页面的时候,会识别你的每一个内页的相同区与不同区,也你网站的不同区将会被定义为主题内容区域,然后拿着你的主题内容与其他网站的主题内容进行对比,分出你页面主题内容的原创度。

  分类:通过对你的站点进行对比后,可以直接对你的内容进行分类,如同一篇关于SEO相关的文章,搜索引擎可直接通过对比来判断,你的网站属于那种类型,是否适合你的站点。

  用户得分:分类之后,并不是代表搜索引擎就一定会收录你的文章,主要还是要依靠用户的得分,用户的点击率、停留时间判断出此文的价值。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

菜鸟论坛

菜鸟论坛-致力于个人网站发展的草根站长联盟,为广大从事互联网工作、前端开发、个人站长、网站搭建、SEO优化、网络运营以及其他领域的个人草根站长同学提供一个免费公益性的信息交流与资源分享的站长平台。

微信公众号

联系我们

  • 广告合作
  • QQ:542750839

QQ|手机版|小黑屋|菜鸟论坛 ( 鲁ICP备17013748号 )|网站地图

Powered by Discuz! X3.4 © 2018 MZHENG.CN

快速回复 返回顶部 返回列表