Hay diferentes maneras de abordar un proyecto de Ciencia de Datos. Una muy utilizada consiste en instalar en un primer paso la distribución...
domingo, 29 de noviembre de 2020
viernes, 23 de octubre de 2020
Comandos esenciales de la CLI de AWS S3
En este artículo voy a explicar los conceptos básicos de cómo gestionar buckets de S3 y sus objetos mediante la CLI de AWS S3. Crear un nuev...
domingo, 11 de octubre de 2020
Virtual Box: Cómo aumentar el tamaño del disco en el host de Windows 10 a Ubuntu usando Gparted
DESCARGAR Hasta la próxima !
viernes, 17 de julio de 2020
Introducción a la programación Hive
Desde los primeros días de la ruptura principal de Internet, los principales motores de búsqueda y las empresas de comercio electrónico han...
jueves, 9 de julio de 2020
Flujo de trabajo con GIT
Git es un sistema de control de versiones distribuido gratuito y de código abierto diseñado para gestionar todo tipo de proyectos de pequeñ...
lunes, 6 de julio de 2020
Instalar y configurar notebooks Zeppelin para trabajar en Spark
En este post voy a explicar como empezar a utilizar Apache Zeppelin para dar soporte al desarrollo y análisis interactivo de datos utilizand...
lunes, 22 de junio de 2020
Programación con UDFs con Spark Scala
Los UDFs son una característica emocionante de Spark que ha evolucionado enormemente en las distintas releases. Voy a intentar cubrir difer...
Suscribirse a:
Entradas (Atom)