En el marco de la Semana de la Ingeniería 2021 se desarrollará la conferencia "Pipelines de Machine Learning para procesar datos de Spotify" el día miércoles 2 de junio, a hs.11. La misma será dictada por el Mg. Ing. Aldo Escobar.
Acerca del Mg. Ing. Aldo Escobar
Tucumano, 26 años. Ing. en Sistemas de Información recibido en la UTN FRT. MSc. en Management+Analytics recibido en UTDT. Trabaja como ingeniero de datos en Mutt Data. Tengo +3 años de experiencia trabajando con datos. Dicto seminarios en Digital House sobre Airflow y Spark, herramientas muy requeridas en mi campo, data engineering.
Acerca de la conferencia:
La automatización de los servicios y la utilización de tools modernas que dan soporte a los flujos de trabajos en productos de datos es crucial para la ejecución eficiente del día a día de los data engineers. Esta charla explicará cómo utilizar las distintas herramientas para la creación de ETFLs (Extracción-Transformación-Entrenamiento-Carga de datos).
En esta charla presentará cómo crear de manera práctica y profesional la creación de un pipeline de datos, usando la API (una forma de comunicarnos con otros sistemas externos) de Spotify y transformando los datos para entrenar un modelo de machine learning (un modelo estadístico que aprende de los datos con los cuales lo alimentamos), luego cargar los datos resultantes en una base de datos y realizar el trackeo del entrenamiento de modelos y sus métricas.
Algunas de las herramientas que se utilizarán:
Python: Uno de los lenguajes más amados y queridos por los programadores. Usado por las principales universidades de USA.
Pandas: Caja de herramientas esencial para todo profesional de datos.
PostgreSQL: Una de las bases de datos más amadas y queridas por los programadores.
Airflow: Herramienta esencial para un ingeniero de datos.
SqlAlchemy: Herramienta que nos permite comunicarnos con las bases de datos.
MLflow: Herramienta utilizada para tener un monitoreo y seguimiento de los modelos de Machine Learning.
Docker-compose: Herramienta que nos permite definir nuestra infraestructura (arquitectura de nuestra solución).