全国服务热线 :138-2323-0086 7*24小时  )           

全国售后邮箱 :365#besthuitong.cn  请把#换成@)

让互联网技术普惠中小企业 
成为中小企业信任并依赖的云服务伙伴
联系我们

谷歌搜索引擎是如何工作抓取的?

浏览数量: 1350     作者: 本站编辑     发布时间: 2019-12-09      来源: 本站

1、谷歌搜索引擎根据查询方式与关键词进行切词。

2、谷歌搜索结果排序

3、谷歌搜索引擎展示搜索结果与文档摘要



谷歌搜索引擎查询服务


  查询服务顾名思义,就是处理用户在谷歌搜索界面的查询请求。谷歌搜索引擎构建检索器,然后分三步来处理请求。


   1、谷歌搜索引擎根据查询方式与关键词进行切词。

  首先先把用户谷歌搜索的关键词切分为一个关键词序列,我们暂时用q来表示,则用户搜索的关键词q被切分为q={q1,q2,q3,……,qn}。


  然后再根据用户查询方式,例如是所有词连在一起,还是中间有空格等,以及根据q中不同关键词的词性,来确定所需查询词中每一个词在查询结果的展示上所占有的重要性。


  2、谷歌搜索结果排序

  我们有了谷歌搜索词集合q,q中每个关键词所对应的URL排序——索引库,同时也根据用户的查询方式与词性计算出每个关键词在查询结果的展示上所占有的重要,那么只需要进行一点综合性的排序算法,搜索结果就出来了。


  3、谷歌搜索引擎展示搜索结果与文档摘要

  当有了谷歌搜索结果后,谷歌搜索引擎就会将搜索结果展示在用户阅览的界面上以供用户使用。


  在这里,大家可以思考两个问题。


  (1)大家在搜索界面中经常发现百度展示的摘要是用户搜索词周围的,如果我不仅仅只看第一页,多往后翻一些页,会看到有些结果由于其目标页面本身并未完全包含搜索词,而在百度提取的摘要中标红词仅是部分搜索词,那么我们可以这样理解,谷歌在搜索词不被完全包含的情况下,是不是应该优先展现在分词结果中被谷歌认为较为重要的词呢?那么从这些搜索结果中我们是不是就可以看出谷歌分词算法的部分端倪呢?


  (2)有时候页面中会多次出现搜索词,而谷歌搜索结果页面中在网站摘要部分仅会显示部分,通常这么部分是连续的,那我们是不是可以理解在摘要部分,谷歌会优先展示页面中它认为与对此搜索词最重要的部分呢?那么由此我们是不是可以揣度出谷歌针对页面除噪后对不同部分赋予权重的算法呢?


  这两个问题仁者见仁智者见智,做谷歌SEO的朋友们自己去探索与摸索吧,小编不敢在此误人子弟。