Todos hemos oído que la ciencia de datos convierte los datos en conocimiento (insights) o incluso en acciones. Pero, ¿qué significa esto en realidad? La ciencia de datos se puede considerar como una base para la investigación empírica en la que se utilizan los datos para inducir datos para las observaciones. Estas observaciones son sobre todo datos, o en nuestro caso, Big Data relacionada con un caso de negocio o con un caso científico.
Insight (conocimiento) es un término que utilizamos para hacer referencia a los productos de datos de la ciencia de datos. Se extrae a partir de una cantidad diversa de datos mediante una combinación de análisis y modelado exploratorio de datos. Las preguntas son a veces más específicas, y algunas veces se requiere observar los datos y sus patrones para llegar a la pregunta específica.
Otro punto importante a reconocer es que la ciencia de datos no es estática. No es un único análisis temporal. Se trata de un proceso en el que los modelos generados para producir insights se optimizan constantemente mediante evidencias empíricas adicionales, o sencillamente, datos. Por ejemplo, una tienda de libros como Amazon.com puede mejorar constantemente el modelo de preferencias de un cliente utilizando datos demográficos, del historial de compras y de las reseñas de libros. La tienda de libros también puede utilizar la información para predecir que clientes tienen probabilidades de que le guste cualquier libro, y adoptar medidas (acciones) para vender el libro a esos clientes. Aquí es donde vemos cómo el conocimiento (insights) se transforma en acciones.
Como hemos visto en el ejemplo de la venta de libros, utilizando la ciencia y el análisis de datos del pasado junto con la información actual, la ciencia de datos genera acciones. No se trata solo de un análisis del pasado, sino más bien de generar información útil (accionable) para el futuro. Esto es lo que podemos llamar una predicción, como el pronóstico meteorológico. Cuando decidimos lo que ponernos durante el día basándonos en la previsión del tiempo, estamos tomando medidas (acciones) basadas en el conocimiento (insight) que nos han ofrecido. De la misma manera, los líderes y los ejecutivos de negocio deciden acciones basadas en las evidencias aportadas por sus equipos de científicos de datos.
Formamos equipos de científicos de datos debido a la amplitud de la información y de las competencias que se necesitan para lograr esto. Probablemente hayas visto diagramas como este que describen la ciencia de datos.
La ciencia de datos se da en la intersección entre la informática, las matemáticas y la experiencia de negocio. Si vemos con más detalle este diagrama y abrimos los conjuntos de conocimientos veremos una variación de esta figura. Incluso a este nivel, todos estos círculos requieren un conocimiento más profundo y habilidades en áreas como la experiencia en el sector, ingeniería de datos, estadística e informática. Un análisis todavía más profundo de estas competencias nos llevará a habilidades como el aprendizaje automático, el modelado estadístico, el álgebra relacional, la pasión por el negocio, la resolución de problemas y la visualización de datos. ¡Son un montón de habilidades para una sola persona!
Esta amplia gama de habilidades y definiciones de los científicos de datos nos han conducido a debates como: ¿existen de verdad los científicos de datos? Seguro que existen expertos en ciencias de datos que tienen experiencia en más de una de estas competencias, pero son relativamente escasos y probablemente necesitarían la ayuda de un experto en algunas de estas áreas. Así que, en realidad, los científicos de datos son equipos de personas que actúan como una sola, les apasiona la historia y el significado de los datos, entienden el problema que están tratando de resolver y su objetivo es encontrar los métodos analíticos adecuados para resolver este problema. Todos tienen interés en las soluciones de ingeniería para resolver este problema, tienen curiosidad por el trabajo de los demás y tienen habilidades de comunicación para interactuar con el equipo y presentar sus ideas y resultados a los demás.
Resumiendo:
Un equipo de científicos de datos suele reunirse para analizar situaciones, casos de negocios o casos científicos que ninguno de ellos puede resolver por su cuenta. Hay un montón de piezas móviles en la solución, pero al final todas estas piezas deben juntarse para proporcionar una conocimiento útil (insight) basado en Big Data. Ser capaz de utilizar este conocimiento basado en evidencias en las decisiones de negocio es más importante ahora que nunca. Los científicos de datos poseen una combinación de habilidades técnicas, de negocio y sociales para lograr que esto suceda.
Buena entrada!
ResponderEliminar