Searching...
sábado, 23 de julio de 2016

Fase de Comunicación de Resultados

La cuarta fase de nuestro proceso de ciencia de datos consiste en comunicar los conocimientos adquiridos a partir de nuestro análisis, lo cual resulta muy importante para justificar las acciones que procedan. Esta comunicación puede cambiar de forma según la audiencia y no debe subestimarse. Entonces, ¿como empezamos?
Fase de Comunicación de Resultados del Proceso de Ciencia de Datos

Lo primero que hay que hacer es examinar los resultados del análisis y decidir que presentar o reportar como valor o conjunto de valores más importante. Al decidir que presentar debemos hacernos las siguientes preguntas: ¿Que es lo más relevante? En otras palabras, ¿cuales son los principales resultados? ¿Qué valor añadido proporcionan estos resultados o cómo puede el modelo añadir valor a la aplicación? ¿Cómo se comparan los resultados con los criterios de éxito determinados al inicio del proyecto? Las respuestas a estas preguntas son los elementos que necesitamos incluir en nuestro informe o presentación, de modo que los convertimos en los temas principales y recabamos la información que los respalde.

Debemos tener en cuenta que no todos nuestros resultados pueden ser optimistas. Nuestro análisis puede mostrar resultados que contradicen lo que esperábamos encontrar, o resultados que sean inconcluyentes o confusos. Tenemos que mostrar también estos resultados. Los expertos de dominio pueden descubrir que algunos de estos resultados son confusos, y los resultados inconcluyentes pueden conducir a nuevos análisis. Recuerda que el objetivo de reportar los resultados es decidir cual debe ser el siguiente paso. Todos los resultados deben presentarse de manera que se puedan tomar decisiones informadas.

La visualización es una herramienta importante en la presentación de resultados. Las técnicas que discutimos en la exploración de los datos también se pueden utilizar aquí. ¿Cuales eran? Los diagramas de dispersión, los gráficos de líneas, los mapas de calor y otros tipos de gráficos constituyen formas eficaces de presentar los resultados visualmente. Esta vez estamos representando gráficamente los datos de salida con herramientas similares, en lugar de los datos de entrada. También debemos tener copias de seguridad en tablas con los datos de detalle del análisis, por si alguien necesita profundizar en los resultados.

Existen muchas herramientas de visualización disponibles. A continuación enumeramos algunas de las más populares de código abierto:

  • R es una paquete de software para análisis general de datos. También cuenta con potentes capacidades de visualización.
  • Python es un lenguaje de programación de propósito general que también tiene una serie de paquetes para soportar el análisis de datos y los gráficos.
  • D3 es una biblioteca JavaScript para producir visualizaciones web interactivas y documentos basados en datos.
  • Leaflet es una biblioteca JavaScript de peso ligero optimizada para móviles para crear mapas interactivos.
  • Tableau Public nos permite crear visualizaciones en nuestro perfil público, y compartirlas o ponerlas en un sitio o blog.
  • Google Charts proporciona compatibilidad entre navegadores y portabilidad de su plataforma cerrada para iPhone y Android.
  • Timeline es una biblioteca JavaScript que nos permite crear líneas de tiempo.
Resumiendo:

Necesitamos comunicar los resultados mediante informes y añadir valor mediante gráficos utilizando herramientas de visualización.

0 comentarios:

Publicar un comentario

Gracias por participar en esta página.

 
Back to top!