Searching...
martes, 10 de mayo de 2016

Big Data generada por máquinas

¿De donde vienen los datos Big Data? Los datos Big Data en realidad no son algo nuevo. La mayoría de las grandes fuentes de datos ya existían, pero lo que ha cambiado en la actualidad es la escala en la que los utilizamos y los aplicamos. Los grandes volúmenes de datos suelen reducirse a unas cuantas variantes de datos generados por máquinas, personas y organizaciones.

Con datos generados por máquinas nos referimos a datos generados a partir de sensores en tiempo real de maquinaria industrial o vehículos que registran el comportamiento del usuario en modo online, sensores medioambientales o dispositivos de seguimiento de la salud, y muchos otros recursos sensoriales de datos. Por ejemplo, el acelerador de partículas del Laboratorio del CERN en la frontera franco-suiza cerca de Ginebra genera 40 terabytes de datos por segundo durante los experimentos.


Los aviones grandes necesitan grandes volúmenes de datos. ¿Sabías que un Boing 787 produce medio terabyte de datos cada vez que vuela? En realidad, casi todas las partes del avión actualizan constantemente su estado tanto al personal de vuelo como al de tierra. Este es un ejemplo de datos generados por máquinas procedentes de sensores. Si nos fijamos en todas las fuentes de Big Data, los datos generados por máquinas constituyen la mayor fuente de Big Data, y son además los más complejos. 

En general, a las máquinas que proporcionan algún tipo de capacidad de detección las llamamos smart. A nuestros teléfonos móviles los llamamos smartphones porque nos permiten seguir la pista de muchas cosas, incluyendo nuestra geolocalización, y conectarnos a otras cosas. En términos generales hay tres características principales de los dispositivos inteligentes en función de lo que hacen con los sensores y las cosas que encapsulan: la capacidad de conexión con otros dispositivos o redes, la ejecución de servicios y la recopilación autónoma de datos, es decir, por su propia cuenta, y el reconocimiento del entorno.

La amplia disponibilidad de los dispositivos inteligentes ha dado lugar a que se acuñe un nuevo término, la Internet de las Cosas (Internet of Things, IOT). Piensa en un mundo rodeado de dispositivos inteligentes en el hogar, en el coche, en la oficina, en la ciudad, en las zonas rurales, en el cielo, incluso en el océano, todos conectados y todos generando datos. Vamos a ver un ejemplo de un dispositivo que incluye algunas de estas cosas. Un rastreador de actividad es un dispositivo o aplicación para la monitorización y seguimiento de métricas relacionadas con la actividad física, como la distancia recorrida caminando o corriendo, el consumo de calorías y, en algunos casos, los latidos del corazón y la calidad del sueño. ¿Que pasaría si todo el mundo en la ciudad de Madrid llevara un dispositivo rastreador de actividad? ¿Y que pasaría si todo el mundo llevara varios? Por ejemplo, no es extraordinario imaginar que muchas personas pueden llevar uno para controlar el sueño, otro para controlar la actividad física y, además, el smartphone, que va con nosotros a todas partes.

Como ya hemos visto anteriormente en un artículo donde he hablado de los datos personalizados, estos rastreadores de actividad han permitido una nueva manera de actuar con el paciente a través de la medicina personalizada. Del mismo modo, los sensores en los aviones han generado una nueva forma de pensar en la gestión de flotas y la seguridad aérea.

Volviendo al ejemplo de los aviones, si nos fijamos en algunos de los sensores que contribuyen al medio terabyte de datos generados en un avión, encontraremos que alguno proviene de acelerómetros que miden las turbulencias. También hay sensores incorporados en los motores para la temperatura, la presión y muchos otros factores cuantificables para detectar fallos de funcionamiento del motor. Un análisis continuo en tiempo real de todos los datos recogidos proporciona monitorización y detección de problemas a 12.000 metros por encima del suelo. A este tipo de procesamiento analítico se le llama "in situ" (en inglés se le llama también on-premise).

Antes, en los sistemas tradicionales de gestión de bases de datos relacional, los datos solían trasladarse al espacio de computo para su procesamiento. En las instalaciones on-premise de Big Data se lleva el procesamiento a donde están ubicados los datos o, en este caso, a donde se generan los datos. Una característica clave de este tipo de notificaciones en tiempo real es que permiten acciones en tiempo real. Sin embargo, el uso de esta capacidad requeriría dar un nuevo enfoque a la aplicación y trabajar de forma diferente. Si estamos utilizando un rastreador de actividad, lo más seguro es que ideemos una estrategia para incorporar el uso de estos artilugios útiles en nuestro estilo de vida. 

De la misma manera, si estamos pensando incorporar el análisis de Big Data en nuestra organización, se necesita definir una nueva estrategia y una nueva forma de trabajar. La mayoría de las empresas centradas en Big Data han actualizado su cultura para estar más enfocados a las acciones en tiempo real, perfeccionando los procesos de tiempo real para gestionar cualquier cosa, desde las relaciones con los clientes (CRM) y la detección de fraudes, hasta la monitorización y control de sistemas. Además, estos volúmenes de datos en tiempo real y operaciones analíticas que deben llevarse a cabo, requieren un mayor uso de sistemas informáticos escalables, que deben formar parte de la planificación de una estrategia de Big Data para la organización.

SOFIA (sinónimo de Smart Objects For Intelligent Applications) es una plataforma semántica de interoperabilidad entre dispositivos desarrollada en el marco del proyecto europeo de investigación en la que participaron 18 partners de 4 países de la UE. SOFIA ha demostrado su eficacia en más de 7 proyectos pilotos asociados a contextos como Smart City, Smart Spaces, Coche Eléctrico, Domótica, Procesamiento de video, Eficiencia Energética y Turismo. Indra ha adaptado conceptos de SOFIA al mundo empresarial creando SOFIA2, una plataforma de interoperabilidad IoT con enfoque Big Data.

SCADA (sinónimo de Supervisory Control And Data Acquisition) es un tipo de sistema de control industrial para monitorización y control remoto de procesos industriales que existen en el mundo físico, que pueden incluir múltiples sitios y muchos tipos de sensores. Además de la monitorización y control, el sistema SCADA se puede utilizar para definir acciones para reducir los residuos y optimizar la eficiencia de los procesos industriales, incluyendo la fabricación y la generación de energía, procesos de infraestructura pública o privada, incluyendo el tratamiento del agua, petroleo, gasoductos, y transmisión de energía eléctrica, así como procesos de instalaciones que incluyen edificios, aeropuertos, barcos y estaciones espaciales. Incluso se pueden utilizar en la construcción de aplicaciones inteligentes que monitorizan y controlan la calefacción, la ventilación, los sistemas de aire acondicionado como la climatización, el acceso y el consumo de energía. En la estrategia de Big Data hay que resolver la gestión de estos procesos una vez que se identifiquen en tiempo real las tendencias, los patrones y las anomalías.

Resumiendo:
  • Las máquinas recogen datos 24/7 a través de sus sensores incorporados, tanto a escalas personales como industriales y, por lo tanto, son las fuentes de datos más grandes de todas las fuentes de Big Data.
  • Como tipo más grande y más rápido de Big Data, los datos generados por máquinas pueden permitir acciones especiales en tiempo real en muchos sistemas y procesos. No obstante, se requiere un cambio de cultura para su procesamiento y accionamiento en tiempo real.

0 comentarios:

Publicar un comentario

Gracias por participar en esta página.

 
Back to top!