Google更新过程的最终解释

原著:Serge Thibodeau
编译:Sunny 
参考: 了解Google Dance工具 如何提高网站的Google PR值  浅谈Google网页级别  Google的原罪--网页序列等级 Google-Dance-Machine
摘要:Google是如何更新全部索引的?这是一个范围相当宽的问题,大家都知道,Google为确保向用户提供最具相关性和质量最高的搜索结果而对其数据库按月进行更新。为了回答上述问题,在本文中我将向大家详细说明Google更新过程的每个步骤。
 

  有相当多的用户和公司都已经发现,为了在早期的搜索引擎优化中,能在Google里有个很好的排名,在认真做计划之前就要采取一切必要的措施。就免费提交的搜索引擎来说,Google是为数极少之中的一个,也是最早将网站收录到数据库的搜索引擎之一。到2003年7月10日为止,Google已经成为收录34亿个网页之多的最广泛的数据库。其中只有一小部分不能够被Google访问,因为这些站点是不能够被搜索引擎爬虫或蜘蛛所访问的。
 就象在现实生活中一样,无论是对网站所有者、网站管理员还是搜索引擎优化专家来说,当开始一个新产品的市场时,有很大的风险和潜在的复杂性。然而大多数专家都一致同意在使用Google搜索时,要正确输入关键字,这样才可以有效地搜索到你所要查找的信息。因为Google每个月都会更新它的数据库。在这篇文章中,我们要解释关于“Google Dance”的信息,还有如何在恰当的时间理解“Googlebot”。另外,我们也会告诉你如何进行搜索引擎的优化。著名的“Google Dance”  
  如果你想写封信去参加在Google总部的年度更新过程,那么你可能希望继续读到GooglePlex这篇文章,从中了解Google数据库和搜索引擎机器人是何如工作的。关于Google每月周期性的更新过程有很多的文档记录。而在过去整整一年,Google的这种每个月的周期性更新(如今人们亲切称之为“Google Dance”)对那些焦虑等待的网站所有者和网站管理员来说,都变得愈加复杂和不可琢磨。
 
 每次的更新都是从Google的一个主要的深层次的爬虫开始的。我们先把它叫做爬虫A。它是如何索引到整个网站中至少三四十亿的网页的呢?Google使用了15,000多台位于不同数据中心的计算机,来索引全世界范围内的站点。当Googlebot来搜索数据库中现有站点时,同时也会搜索到最新的网站。一旦Google完成了爬虫A这个过程,就会为下一步的更新有效地搜索到所有的网页,然后便是两个星期后的第二次更新过程。 
 最后,Google会更新整个数据库,在www2.google.com和ww3.google.com这两个站点上可以看到最新的更新结果。在更新的同时,其结果会很快的连接在主要数据库和第二、第三个数据库之间。由于Google使用的服务器有15,000台之多,因此在整个更新结束之前,不同地方的人们所得到的搜索结果是不同的。“Google Dance”会持续好几天,但是不会超过一个星期。除非Google要改变一些主要的规则,比如2003年4月份的更新。无论是在Google的每个数据库更新的时候还是在更新之后, 只要其中一个数据库进行更新,Google又会开始新一轮的“全面”检索。我们把它称做爬虫B。这次检索仍然包括数据库中所有已被收录站点和一些新发布的网站。GoogleBot的这次检索完成之后,就是Google下一轮更新的起点,意味着下个月的更新又全面开始了。在完美时间“捕捉”Googlebot

时间: 2024-03-04 22:27:45

Google更新过程的最终解释的相关文章

关于Google搜索引擎作弊的解释

  目前国内有部分"个体户"在了解了一些非常规的网站优化手法之后,就开始在市场上"招摇撞骗",很多不明真相的客户就被这种"公司"所骗.他们对客户的网站实施做弊的优化手法,使其网站在google搜索结果排名有所提升.其实这种"做弊"手段,将会为客户的网站带来制命的打击,最终甚至会被Google 排除在其数据库中.客户所花费的金钱,与辛苦构造的网站就这样毁于一旦. 一但您在发现了某些做弊的网站,您可以通过Google 提供的接口,

《Google软件测试之道》—第2章2.1节SET的工作

第2章 软件测试开发工程师 Google软件测试之道 C:\Documents and Settings\Administrator\桌面\页面提取自- 9780321803023_book.jpg 在理想情况下,一个完美的开发过程是怎样进行的呢?测试先行,在一行代码都没有真正编写之前,一个开发人员就会去思考如何测试他即将编写的代码.他会设计一些边界场景的测试用例,数据取值范围从极大到极小.导致循环语句超出限制范围的情况,另外还会考虑很多其他的极端情况.这些测试代码会作为产品代码的一部分,以自检

Google曝光其服务器都含自定义安全芯片

近日,Google发布了基础设施安全设计概述的文章,解释了如何在云中保护其自身的安全,以及公有云服务. 该安全设计思路包涵了六层安全,并透露了一些有趣的事情,比如曝光了"Google在设计定制芯片,包括目前部署在服务器上的硬件和周边设备上的安全芯片,这些芯片可在硬件层面安全地识别和验证合法的Google设备. ▲ 同时,Google服务器使用各种技术来确保它们正在引导正确的软件堆栈.在低级组件(如BIOS,引导加载程序,内核和基本操作系统映像)上使用加密签名.这些签名可以在每次引导或更新期间验证

Google Glass到底有多少战斗数值?

争议不断的 Google Glass,战斗数值到底多少? 事情大家都知道了:北京时间1月16日凌晨,Google 发布消息,称其将从下周开始停止接受谷歌眼镜 (Google Glass) 订单,并将关闭其"探索者(Explorer)"软件开发项目."探索者"项目终止的同时,Google Glass 团队也将搬出Google X 部门. 消息一出,各方评论不一.有说 Google Glass 已死的 (比如BBC),也有说 Google Glass 未来前景更大的.总

Google wave挑战Facebook失败 运营一年后凄惨落幕

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 8月5日消息,谷歌表示,放弃其已经运行了一年多的社交网络服务Google Wave. 谷歌高级副总裁乌尔斯·霍泽尔(Urs Holzle)在其博客中声称,"我们没有得到我们所想要的Google Wave用户反馈.由于用户对此兴趣不高,我们将不会将其作为一款独立产品来开发." 据悉,谷歌将会维持Google Wave服务到今

我们能从Google的全新UI中学到什么

2011年网站变化最显著的就是Google,其一系列产品启用了全新的用户界面.这篇文章将探索决定Google用户界面设计背后的思维过程,或许我们能从中学到值得借鉴的方法和设计原则. 谷歌用户界面改革历程 1998 谷歌原始主页 2012 更新后的界面 "Google 的使命是整合全球信息,使人人皆可访问并从中受益." 统一Google体验 Google的网页从早期开始就发生了彻底的变化.用户的网页体验与以前相比有了更多途径,可以在不同的设备上观看并感受.Google已经做出了改变来反映

Google“+1” 可推荐搜索结果

Google刚刚发布了传说中的社交搜索功能"+1",在搜索结果旁边显示一个类似Facebooklike按钮的"+1"按钮,用户通过单次点击就可以对搜索结果进行投票,并且推荐给Google社交网络中的其他有联系的用户. Google官方介绍说,作为共享目标的社交网络目前包括用户的Gmail通讯录,Google Reader和Buzz的follow关系,未来会支持Twitter上的社交关系.跟Facebook的like按钮功能一样,用户可以在点击"+1&quo

Google不为人知的怪异服务

中介交易 SEO诊断 淘宝客 云主机 技术大厅 通常情况下,当我们听说Google会推出某种服务时,总是会表示惊讶.即使大家有惊讶的表情,但Google服务还是一如既往地出现在Google首页上,下面就让我们一起来见识见识Google这些怪异的服务吧! Google的复活节彩蛋游戏 这是一个寻找复活节彩蛋的游戏,你要靠眼力和鼠标操作水平来捡这些蛋.Google会把一些彩蛋放在游戏画面中,而你则需要扮演一只兔子,在画面上跳来跳去,尝试着把所有的彩蛋都放到自己的篮子里面.而这种游戏的真正意图是让用户

GoogleAdWords常用名词解释

在以 Google AdWords 为中心的http://www.aliyun.com/zixun/aggregation/8485.html">搜索引擎营销(Search Engine Marketing)活动中,下面几个重要名词会经常遇到. CPC(Cost per Click) 每次点击费用:CPC模式的广告按点击付费,当访问者点击了广告后才收取费用,无点击不产生费用. CTR(Click through Rate) 点击率:广告的点击次数/展示次数 x 100,投放中的广告点击比率