Desde la Secretaria Técnica del Sindicato CePETel convocamos a participar del siguiente curso de formación profesional:
Big Data & Analytics – Parte 2
Clases: 8 de 3hs c/u de 18:00 a 21:00 hs.
Días que se cursa: los días martes 21 y 28 de marzo; 4, 11, 18 y 25 de abril; 2 y 9 de mayo.
Modalidad: a distancia (requiere conectarse a la plataforma Zoom en los días y horarios indicados precedentemente).
Docentes: María Trinidad Aquino y Raúl Alejandro Grassi
La capacitación es:
- Sin cargo para afiliados y su grupo familiar directo.
- Sin cargo para encuadrados con convenio CePETel.
- Con cargo al universo no contemplado en los anteriores.
Informes: enviar correo a tecnico@cepetel.org.ar
Inscripción (hasta el 16 de marzo): ingresar al formulario (se recomienda realizar el registro por medio de una cuenta de correo personal y no utilizar dispositivos de la empresa para acceder al link).
https://forms.gle/zi9cgmHkgEN7gZyK8
Temario:
Módulo 1
Modelado Dimensional
(Clases 1, 2 y 3)
- Programación distribuida
- Ejemplos de frameworks de programación distribuida
- Definición del modelo dimensional
- Concepto DER
- Conceptos del modelo dimensional
- Arquitectura estándar del modelo dimensional
- Diferencias entre el modelo relacional y dimensional. ¿Cuál es más conveniente y por qué?
- Beneficios del modelado dimensional
- Componentes del Modelado Dimensional: Hechos, Atributos, Elementos y Dimensiones
- Toma de Decisiones Basada en Datos: Cultura Data Driven
TP Clase 1: Identifique la diferencia entre programación distribuida vs programación paralela
TP Clase 2: A partir de un modelo relacional construir un modelo dimensional con tablas de hechos y dimensiones (diagrama DER)
TP Clase 3: Investigar cuales son las características requeridas de un Data Warehouse (enumere al menos 4).
Módulo 2
Data Warehouse
(Clases 4 y 5)
- Definición de Data Warehouse. Objetivos y Características de un DW.
- Arquitectura estándar.
- Dimensiones conformadas
- Data Marts y Data Warehouse
- Modelado de Datawarehouse según enfoque: Snowflaked vs Star Schema.
- Proceso de modelado
- Tablas de Hechos y Dimensiones
- Nivel de Granularidad
- DW: Modelado vs. Desnormalización
- Proceso ETL. Sistemas más usados (PDI, Data Stage)
- Almacenamiento basado en filas vs columnas
TP Clase 4: A partir del modelo relacional construido en la clase 2 identificar las dimensiones y medidas. Si fuera necesario modificar el modelo siguiendo el enfoque estrella. Identificar las dimensiones conformadas.
TP Clase 5: Armar un modelo de ingesta de datos a un Data Warehouse. Incluir fuentes de datos internas y externas. Marcar como mínimo 5 diferencias entre procesos de ETL y ELT.
Módulo 3
Data Lake
(Clases 6, 7 y 8)
- ETL vs ELT – Cambio de Paradigma de BI
- Definición de Data Lake
- Diferencias y similitudes entre ambos sistemas (DW vs DL)
- Desafíos a la hora de implementar un Data Lake
- Recomendaciones para crear un Data Lake
- Tecnologías para un Data Lake
- Disaster Recovery y su importancia
- Arquitectura de un Data Lake
- Ingestas de Datos Batch, Micro Batch y Real Time
- Zonas en un Data Lake
- Ecosistema Hadoop
- Componentes de Hadoop
- Sistema de Almacenamiento Distribuido
TP Clase 6: Identificar si las siguientes características corresponden a un Data Warehouse o Data Lake.
TP Clase 7: Identificar a que framework del ecosistema Hadoop corresponden las características detalladas
Acerca de los docentes
María Trinidad Aquino: 2007-12–03 al momento Analista Senior Marketing – Región Patagonia Movistar, Neuquén.
* Proyecto Canal Presencial (Agentes y CEC) responsable de la construcción y disposición de los datos (KPI´s) para ver su evolución con aporte analítico, diagnóstico y sugerencia de planes de acción para su mejora.
*Proyecto Educador Digital País, referente de la región Patagonia con seguimiento de los KPI´s y evolución.
* Nuevos proyectos del área con análisis de datos, participación en el diseño, elaboración y difusión de lo implementado.
Formación académica:
- 2020-09 – 2021-10 (finalizada) Big Data, Data Engineer (Diplomatura) ITBA, CABA
- 1999-03 – 2003-12 (finalizada) Ciencias Sociales, Licenciada en Relaciones Públicas Universidad Nacional de Lomas de Zamora, Lomas de Zamora
Raúl Alejandro Grassi: desde 1995 hasta la fecha TELEFONICA DE ARGENTINA S.A. Puesto:Analista Senior – Sector Big Data Comercial.
Responsabilidades: Definición de inversiones anuales en capital (CapEx) en base a análisis de proyección comercial. Gestión de proyectos y seguimiento de inversiones. Diseño e implementación de modelos de aseguramiento de satisfacción de clientes. Planeamiento y ejecución de tableros de control y análisis del negocio basado en datawarehousing (heavy user) en los últimos 10 años, programando en SQL y modelado de datos. Análisis y Evaluación de acciones que impacten en cumplimiento de objetivos del Negocio B2C. Analista Senior BI, desarrollo en herramientas de explotación de BI (Microstrategy; Tibco Spotfire, Power BI, Tableau, etc.) y ecosistema Hadoop (Spark, Hive, SQL, procesos de ingestas ETL, ELT, etc.).
Desempeño durante 4 años en el sector Data Driven Comercial, promoviendo la cultura
Data Driven y desarrollando tableros de control predictivos y prescriptivos con herramientas de explotación basadas en modelos relacionales/dimensionales.
Experiencia al menos 7 años como líder de proyectos, Manejo de Metodologías Agiles en
posiciones como Stakeholder, Scrum Master y PO.
Formación académica:
- 2020-2021 Licenciatura en Big Data – especialista en Data Engineer – ITBA (Instituto Tecnológico de Buenos Aires)
- 1999 Posgrado en Gestión Gerencial Avanzada (Managemente Executive Program) Universidad Argentina de la Empresa (UADE)
- 1986-1992 Ingeniero Electrónico Universidad de Buenos Aires
María Trinidad Aquino y Raúl Alejandro Grassi dictaron de manera virtual y para el Sindicato CEPETel Big Data & Analytics – Parte 1 durante el año 2022.