Tecnología de Google

Aparte del PageRank (el sistemas de clasificación de la importancia de cada WeB), una de las claves del éxito de Google es la tecnología de sus servidores.

Google atiende a más de 5,000 millones de búsquedas cada mes (unas dos mil por segundo), y esta cifra aumenta progresivamente cada día. Para atender todas estas peticiones, y buscar entre más de 3,000 millones de documentos, Google optó por la tecnología Linux.

Disponen de un clúster de cerca de 20,000 servidores repartidos en siete ‘data centers’. Estos centros de datos se encuentran situados en diversos puntos del planeta, como Washington D.C. (USA), Herndon (Virginia, USA), Santa Clara (California, USA) o Zurich (Suiza). Cada servidor dispone de un solo procesador Intel, y una memoria RAM que va desde 256 Mb a 1 Gb.

Entre estos ‘data centers’, Google utiliza su propio gestor de tráfico y su propio software de balanceo de cargas, para dirigir cada petición hacia el mejor servidor

En cada PC se encuentran uno o dos discos duros de 40Gb ó 75Gb, de marca IBM. Google prefiere este sistema distribuido de almacenamiento de datos, antes que uno centralizado. Las razones: es mucho más barato y tiene menos posibilidades de fallo.

En cada una de estas máquinas está instalado Linux RedHat. En mayo de 2002, Google llegó a un acuerdo con RedHat para que esta empresa le proporcionase el software del Sistema Operativo.

La elección de Linux fue sencilla para Google: el menor ratio coste/rendimiento, corre en simples PCs, y la posibilidad de personalizar cualquier parte del Sistema Operativo. De hecho, no solamente usan Linux en sus servidores, sino también en la mayoría de los PCs de los empleados. Una vez instalado Linux en cada equipo, los técnicos de Google, lo personalizan a su antojo. Ellos lo llaman ‘Googlelizar’ el Sistema Operativo con sus propias aplicaciones.

La mayoría de las aplicaciones están programadas en C++ (aunque también utilizan Python y PHP), y las herramientas que utilizan son ‘gcc’, ‘gdb’ y ‘gnats’ para el desarrollo y ‘p4′ para el control de las versiones. Google dispone de más de 100 desarrolladores en su plantilla.

Debido a la multitud de servidores de los que se dispone, el tamaño de estos es muy importante. Por ello, la compañía californiana Rackable Systems compacta para Google varios servidores en un espacio realmente reducido.

Referente a la seguridad, la mayoría de las máquinas de Google no están accesibles desde Internet, ya que se encuentran detrás de un router/firewall que lo impide. Las que sí están accesibles (los servidores web) son auditados periódicamente para encontrar posibles agujeros de seguridad.

Duración de una consulta de Google

Las consultas de Google suelen tardar menos de medio segundo. Sin embargo, conllevan una serie de pasos que deben llevarse a cabo antes de que el usuario pueda visualizar los resultados.

Más información: Google & Linux

Saludos… shades_smile.gif

Anuncios

Un comentario sobre “Tecnología de Google

Agrega el tuyo

  1. Gracias por desentrañar en parte ese misterio de eficiencia que es Google. Siempre me ha maravillado como presumen…1,600,000 resultados en 0,11 seg.
    Son, de momento, impresionantes.

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea tu propio blog con WordPress.com.

Subir ↑

DMyGuate

Adventure, history and mystery in the land of eternal spring...

El Blog de PuPiLo

Tecnología y más...

JsiTech

Seguridad, Ethical Hacking, Linux

The Guatemala Chronicle

News, Investigations, & Opinions

WordPress.com

WordPress.com is the best place for your personal blog or business site.

A %d blogueros les gusta esto: