在国内, 相信检索功能做得最好的速度最快的度娘应该是当之无愧的第一了, 那么为什么百度的用户这么多, 搜索还这么快, 了解百度的问题还是得去百度啊.
我在网上搜到了很多个版本, 下面就来总结一下.
1. 使用了数据库的搜索技术. 也就是在采集信息时就已经分门别类在数据库中放好, 相关索引也已经做好. 对于大部分搜索, 其实引擎并不是直接查询数据库, 而是根据提交关键字寻找已经贮备好的最近似关键字搜索结果, 直接提交. 因此你会发现, 越是搜索多的东西, 查找的越快, 越是偏门的东西, 搜索的越慢. 而我们的电脑是不会建立全面的数据库和索引的, 也没有预搜索结果保存, 因此就慢.
2. 采用了代理服务器技术. 代理服务器技术是指在两个网络之间运行这样一个程序体系, 相对于客户来讲, 相当于一台服务器, 相对于外界服务器来讲, 它又是一台客户机. 当代理服务器得到一个客户的连接访问某站点请求时, 会检查这种请求是否符合规定, 如果相关规则允许这种连接访问, 代理服务器就从这个站点取回信息再转发给用户. 代理服务器在外部网络和内部网络提出服务请求时, 起着中间转接和隔离内, 外层网络的作用, 所以叫代理服务器 (promy sener). 代理服务器在内部用户和外界之间, 相当于一堵墙, 外界要访问内部网络, 必须要通过它进行, 无法连接访问内部网络的资源. 代理服务器本身就是一种防火墙, 该技术将跨越防火墙的链通信路进行了分段隔离, 防火墙内外的计算机网络的连接只能通过代理服务器进行. 所有的资源都储存在服务器的数据库中. 直接进行对比即可.
3. 处理器处理速度快. 这个就是硬实力了, 人家财大气粗, 设备也是杠杠的, 所以肯定比其他的服务器快一些.
4. 百度是一个门户网站. 所谓门户网站, 是指通向某类综合性互联网信息资源并提供有关信息服务的应用系统. 百度储存的数据是建立以来, 所有上网的人搜索过的, 也就是说任何人搜索过的任何东西, 都会在这个门户留下痕迹, 当你再次搜索的时候, 会抓捕到和你搜索最相近的词汇.
5. 你搜索到的不是资源. 而是链接. 一个链接只有几十上百个字节的大小. 而一般的网速可以承载 100000 字节 / S 以上的速度.
来源: http://www.bubuko.com/infodetail-3096663.html