Google File System

Visitas: 307  
Tiempo total: 6 días con 7:38:52 hrs  

Es el sistema de archivos de Google, el cual también es llamado GFS, GooFS o bien GoogleFS, fue construido por Lary Page y Sergey Brin, fundadores de Google, los cuales inicialmente crearon este sistema para que se diera a basto ante la gran capacidad que este sistema debía de rendir en un entorno de consultas de internet.

Fue presentado en octubre del año 2003 en Lake George, Nueva York, en Estados Unidos, bajo el evento llamado 19th ACM Symposium on Operating Systems Principles, la cual es una conferencia en donde los desarrolladores presentan sus más grandes avances en el campo de los sistemas operativos.

Está diseñado para ser eficiente, tener fiabilidad de acceso a los datos usando clusters masivos de procesamiento paralelo para un entorno de infraestructura de procesamiento de información en la nube.

Diseño

Se puede mencionar que la estructura del sistema de archivos de Google está separada en dos partes importantes: nodos maestro y nodos Chunk.

El diseño de este sistema de archivos fue creado para manipular consultas de almacenamiento de datos, generando enormes cantidades de información en cada consulta, la cual deberá de servir en el futuro para contestar otras consultas, optimizando el manejo de información.

Los bloques que utiliza GFS son similares a los de un disco duro normal pero las diferencias consisten en que tienen un gran tamaño de 64 MB, rara vez se modifican, casi nunca se reducen de tamaño y normalmente, se adiciona información o simplemente se leen para su manipulación.

Estos bloques de datos están separados en nodos, estos nodos están en servidores los cuales a su vez están compuestos por computadoras de bajo costo con algunas de las siguientes especificaciones: 1.4 GHz de velocidad de procesador, 2 GB de memoria RAM, dos discos de 80 GB 5400 rpm y corren bajo el sistema operativo LINUX.

La decisión de los fundadores de Google de utilizar maquinas de bajo costo y software libre, fue porque en los inicios de su fundación no disponían del dinero suficiente para comprar servidores y programas de pago, pero si disponían de creatividad e inteligencia para fundar la empresa aun cuando eran estudiantes de la universidad de Stanford, Estados Unidos.

El diseño de este sistema, esta creado para recuperarse de fallos sin ningún problema contando con distintas replicas en distintos lugares. Otra característica es la utilización de archivos que almacenan una gran cantidad de información que satisfacen los requerimientos que las consultas en internet necesitan. Otro punto importante es la necesidad en el sistema de la velocidad para producir una gran fluidez en el procesamiento de información, esta característica es llamada baja latencia.

GFS funciona gracias a los Clusters basados en Linux, estos consisten en un nodo maestro y varios nodos Chunk. Los archivos de los nodos chunk se dividen en bloques de tamaño fijo que tienen asignados una etiqueta de 64 bits en el nodo maestro y están replicados en otros servidores de acuerdo a su demanda.

La función del nodo maestro es la manipulación de meta datos creados por cada bloque de los nodos chunk, es decir que su función es la de la localización de la información.

Rendimiento

El rendimiento de GFS está directamente relacionado con el número de servidores que contiene. Por ejemplo un disco normal con una velocidad de 80 a 100mb por segundo es equivalente a 15 de estos nodos, y si reducimos la cantidad de nodos a 5 la velocidad que se obtiene es de 5 mb/s, mucho más lenta que el disco duro normal de 80mb/s. Ahora, si se incrementa la cantidad de servidores a 342 se obtendrá una velocidad de 538 mb/s. Otra característica que se obtiene al aumentar los servidores tanto de información como los que sirven para replicar la información es el aumento de la velocidad de respuesta.


Para recibir boletines de información, por favor escribe tu correo electrónico:

Por favor ingrese un correo electrónico valido.
Registrado correctamente!