Searching...
domingo, 11 de septiembre de 2016

Escalabilidad y Seguridad de Datos

Hay muchas formas de ver la escalabilidad y voy a analizarla a medida que avancemos en el curso. Una forma es considerar el escalado vertical (scaling up) y el escalado horizontal (scaling out). En pocas palabras, se trata de una decisión entre configurar una máquina que aumente la potencia de un servidor en comparación con la incorporación de más máquinas. La primera alternativa implicará añadir más memoria, sustituir procesos por un procesador con más núcleos e incorporar más procesos dentro de un sistema con una velocidad de conexión a Internet muy rápida. La segunda alternativa implica incorporar más máquinas a una red relativamente más lenta.
Escalabilidad y Seguridad de los Datos

Ninguna de estas alternativas es definitiva de manera absoluta. En muchos casos elegiremos al primera opción para optimizar el rendimiento en sistemas grandes de datos. Sin embargo, la tendencia general en el mundo de Big Data es concentrarse en la opción de escalado horizontal. La mayoría de los sistemas de gestión de grandes volúmenes de datos de hoy en día están diseñados para funcionar sobre un cluster de máquinas y tienen la capacidad de adaptarse a medida que se incorporen más máquinas y cuando las máquinas fallen. La gestión del cluster y la gestión de las operaciones de datos sobre un cluster es un componente importante de los sistemas actuales de gestión de grandes volúmenes de datos.

Ahora voy a referirme brevemente a un problema complejo, como es el de la seguridad de los datos. Es obvio que tener datos más sensibles implica la necesidad de una mayor seguridad. Si los datos están dentro del recinto de una organización, seguiremos necesitando un plan de seguridad. Sin embargo, si desplegamos un sistema de grandes volúmenes de datos en la nube sobre múltiples máquinas, la seguridad de los datos se convierte en un desafío todavía mayor, ya que en este caso tenemos que garantizar la seguridad no solo de las máquinas sino también de la red que va a ser utilizada de forma intensiva a lo largo de las diferente fases de las operaciones sobre los datos. Por ejemplo, si el almacenamiento y el análisis de datos se lleva a cabo a través de diferentes conjuntos de servidores, entonces cada una de las operaciones de análisis conlleva una sobrecarga adicional de encriptación de los datos a medida que estos llegan a la red y de descifrado cuando llegan al servidor donde se procesan. Esto aumenta en la práctica el coste operacional.

A día de hoy, si bien existen muchos productos de seguridad, los métodos para garantizar la seguridad y alcanzar simultáneamente la eficiencia en el procesamiento de los datos, sigue siendo un campo de investigación de la gestión de grandes de grandes volúmenes de datos.

0 comentarios:

Publicar un comentario

Gracias por participar en esta página.

 
Back to top!