Duración:6 Semanas
Tipo:Cursos
Modalidad:A distancia
Presentación
Las organizaciones son cada vez más dependientes del inteligente uso de sus datos para la toma de decisiones. Esos datos para ser útiles deben estar almacenados en una plataforma que sea compatible con múltiples consultas concurrentes de gran complejidad y que no traben la operación normal. A estas plataformas se las conoce como "almacenes de datos" o Al mismo tiempo es preciso que esta información esté libre de errores y deformaciones que se producen al cargar los datos en las aplicaciones transaccionales y que podrían arruinar el esfuerzo analítico que se busca construir sobre ellos.
Estos conjuntos de datos deben también actualizarse en forma periódica para ir incorporando la nueva información que generan las aplicaciones transaccionales que soportan la operación. Los procedimientos que se encargan de esa actualización se llaman ETL (Las siglas de extracción, transformación y carga) Tanto el diseño del almacén de datos como de los ETL requieren de técnicas de optimización que, de no aplicarse, atascos, inconsistencias. En este curso les proporcionamos a los participantes conocimientos y herramientas para implementar almacenes de datos y realizar los procesos de limpieza y carga correspondientes.
Qué vas a aprender
Objetivo general
Formar a los participantes en el diseño e implementación de almacenes de datos y los procesos de limpieza y carga correspondientes.
Objetivos específicos
• Utilizar Open Refine como herramienta de limpieza de datos y distinguir entre los problemas que conviene encarar con Open Refine y los que resultan menos apropiados.
• Entender el problema de negocios que un almacén de datos viene a solucionar y desde allí comprendan los fundamentos de diseño y de los programas de carga y limpieza asociados
• Utilizar Pentaho como herramienta de ETL y tomar conciencia de fortalezas y debilidades de Pentaho.
• Elegir la estrategia de ETL conveniente para una carga inicial y para una actualización.
• Desarrollar criterios de diseño para un DW y practicar la construcción de distintos tipos de repositorios.
Destinatarios
Profesionales que quieran desarrollar almacenes de datos y los correspondientes programas de ETL.
Unidad 1
Unidad 2
Unidad 3
Unidad 4
Unidad 5
Unidad 6
Es necesario que los participantes posean conocimientos equivalentes a los impartidos en los cursos de Fundamentos de Programación y la Diplomatura en Bases de Datos.