Searching...
miércoles, 21 de septiembre de 2016

Operaciones sobre los Modelos de Datos

El segundo componente de un modelo de datos es el conjunto de operaciones que se pueden realizar sobre los datos. En este módulo voy a analizar las operaciones sin tener en cuenta la faceta "Big" o de grandeza de los datos. En el siguiente curso voy a volver a la cuestión de la realización de estas operaciones cuando los datos son grandes.
Operaciones con los datos
Las operaciones especifican los métodos para manipular los datos. Dado que los diferentes modelos de datos se asocian normalmente con diferentes estructuras, las operaciones sobre ellos serán diferentes. Sin embargo, algunos tipos de operaciones se realizan generalmente en todos los modelos de datos. Voy a describir a continuación algunas de ellas.

Una operación común consiste en extraer una parte de una colección en función de una condición. En este ejemplo tenemos un conjunto de registros y estamos buscando un subconjunto que satisfaga la condición de que el quinto campo tenga un valor superior a 100.000. Solo existe un registro que cumple este requisito. Observa que he llamado a esta operación "subconjunto" con poco rigor. Dependiendo del contexto, también se le llama selección o filtrado.
Operación de selección o filtrado
La siguiente operación común consiste en extraer una parte especificada de una estructura. En este caso especificamos que estamos interesados solo en los dos primeros campos de una colección de registros, pero esto genera una nueva colección de registros que sólo tiene estos campos. Este tipo de operación tiene muchos nombres. El nombre más dominante es la proyección. En el siguiente módulo vamos a ver varias versiones de esta operación para diferentes modelos de datos.
Operación de proyección
Las siguientes dos operaciones consisten en combinar dos colecciones en una más grande. El término "combinar" se puede interpretar de varias maneras. El más sencillo de ellos es la unión. La operación de unión presupone que las dos colecciones implicadas tienen la misma estructura. En otras palabras, si una colección cuenta con cuatro campos y otra tiene 14 campos, o si una tiene cuatro campos sobre personas con sus fechas de nacimiento y la otra tiene cuatro cosas sobre los países y sus capitales, entonces no se pueden combinar mediante la unión. En este ejemplo, las dos colecciones tienen tres y dos registros, respectivamente, con un registro que es común a ambas, el de color verde. La colección resultante tiene cuatro registros, ya que no se permiten los duplicados al ser una operación de conjunto. De hecho existe otra versión de la unión donde se permiten los duplicados y que genera cinco registros en lugar de cuatro.
Operación de unión
El segundo tipo de combinación, denominada "Join", se puede hacer cuando las dos colecciones tienen diferentes contenidos de datos, pero disponen de algunos elementos en común. En el ejemplo mostrado, el primer campo es el elemento común entre las dos colecciones de la izquierda. En este tipo de combinación de datos hay dos etapas. En primer lugar, para cada elemento de datos de un registro de la colección uno, se localiza un conjunto de elementos de datos a juego en la colección dos. Por lo tanto, los primeros registros de las dos colecciones tienen una coincidencia basada en el primer campo. En la segunda etapa de la operación, se juntan todos los campos de los pares de registros a juego. En el primer registro de la colección resultante que se muestra a la derecha, se obtienen los primeros cuatro campos de la primera colección y los dos campos restantes de la segunda colección. En este ejemplo encontramos un par de registros coincidentes de las dos colecciones. Como se puede observar, esta operación es más compleja y puede ser muy cara cuando el tamaño de las colecciones es grande.
Operación de Join

0 comentarios:

Publicar un comentario

Gracias por participar en esta página.

 
Back to top!