Descripción:
La calidad de los datos o “Data Quality”, en inglés, hace referencia a una percepción o una evaluación de la idoneidad de los datos para cumplir su propósito en un contexto dado. La calidad de los datos está determinada por factores como la exactitud, la integridad, la confiabilidad, la relevancia y cómo de actualizados están.
A medida que los datos se han vinculado estrechamente con las operaciones de las organizaciones, el énfasis en la calidad de los datos ha ganado una mayor atención.
La calidad de los datos se evalúa a través del Marco de Evaluación de la calidad de los datos (DQAF) creado por el Fondo Monetario Internacional (FMI). Un método común para estimar la calidad de los datos.
El DQAF proporciona pautas para medir los datos, en la que hoy en día tienen mucha importancia cuando se reciben los datos, si en tiempo real o en diferido.
Objetivo del curso:
Después de completar con éxito este curso, los estudiantes deben ser capaces de:
- Describir el Proceso de Gestión de Calidad de Datos
- Ilustrar la Arquitectura de Calidad de Datos
- Diferenciar entre los Roles y Herramientas de Analista y Desarrollador.
- Navegar por la Herramienta del Desarrollador
- Colaborar en proyectos
- Realizar Perfiles de Columna, Regla, Multiobjeto, Comparativo y de Flujo Medio
- Gestionar tablas de referencia
- Desarrollar mapeos y mapplets de normalización, limpieza y análisis sintáctico
- Identificación de registros duplicados mediante Classic Data Matching
- Crear y ejecutar flujos de trabajo para rellenar las bandejas de entrada de los usuarios con tareas de excepciones y registros duplicados.
- Describir las opciones de despliegue disponibles al ejecutar mappings fuera de Informatica Developer
- Resolución de problemas que puedan surgir durante el desarrollo
Requisitos de ingreso.
Comprensión de lectura de textos en idioma inglés.
Conocimiento sólidos o experiencia equivalente en algún lenguaje de programación orientada a objetos (Java, C#, etc).
Conocimientos básicos en el manejo o consumo de APIs
Temario:
Módulo 1: Introducción al curso
- Temas del curso
- Módulos y contenidos
Módulo 2: Visión general del proceso de calidad de datos
- Ciclo del proceso de gestión de la calidad de datos
- Dimensiones de la calidad de datos
- Procesos de Calidad de Datos
- Funciones y herramientas de desarrolladores y analistas
- Arquitectura de Calidad de Datos
Módulo 3: Proyectos y Soluciones de Calidad de Datos
- Casos de uso de la calidad de datos de clientes
- Proyectos que se benefician de datos depurados y estandarizados
- Calidad de datos y proyectos típicos de DI/DQ
- Proyectos de generación de informes, Gating y Cleansing
- Arquitectura de soluciones para proyectos con calidad de datos
Módulo 4: Colaboración en proyectos y gestión de tablas de referencia
- Interfaz del desarrollador
- Comprensión de los proyectos de Analistas, Objetos de Datos, Perfiles, Reglas, Scorecards, Comentarios y Etiquetas
- Tablas de Referencia y el Proceso de Calidad de Datos
- Creación de Tablas de Referencia
- Laboratorio: Revisión de un proyecto creado por un analista
- Laboratorio Construir tablas de referencia
Módulo 5: Trabajar en la Herramienta de desarrollo
- Tareas en la Herramienta de desarrollo
- Trabajar con objetos de datos físicos y lógicos
- Conexión a una tabla
- Importación de un archivo plano
- Creación de objetos de datos lógicos
- Transformaciones para desarrolladores
- Asignaciones y mapplets
- Conjuntos de contenidos y sus usos
- Trucos y consejos para desarrolladores
- Laboratorio Creación de un proyecto y asignación de permisos
- Laboratorio: Creación de una conexión a una tabla Oracle e importación de un archivo plano
- Laboratorio Construir un objeto lógico de datos
Módulo 6: Perfiles, Mapplets y Reglas
- Perfiles de Columna
- Mapplets y Cuadros de Mando
- Técnicas de creación de perfiles para depurar y mejorar el desarrollo
- Actualización de Scorecards con Reglas
- Laboratorio: Creación de una regla para medir la precisión de los datos de un campo.
- Laboratorio: Mediante Informatica Analyst, aplique la regla a un Scorecard y revise los resultados.
Módulo 7: Normalización, limpieza y mejora de datos
- Estandarización, limpieza y mejora de datos.
- Mappings que limpian, estandarizan y mejoran los datos.
- Desarrollo de mapplets de normalización
- Configuración de transformaciones de estandarización
- Laboratorio: Construir un mapeo de estandarización y mapplets utilizando transformaciones de estandarización.
Módulo 8: Análisis sintáctico de datos
- El proceso de análisis sintáctico
- Técnicas de análisis sintáctico
- Transformaciones de análisis sintáctico clave
- Laboratorio: Análisis sintáctico mediante diversas transformaciones de análisis sintáctico
- Laboratorio Completar un mapeo de normalización
Módulo 9: Correspondencia de datos
- Definición de correspondencia de datos
- El proceso de correspondencia de DQ
- Las diferentes etapas de la correspondencia
- La agrupación y su efecto en la correspondencia
- Métodos de agrupamiento
- Agrupación de resultados y perfeccionamiento de una estrategia de agrupación
- Algoritmos de emparejamiento
- Laboratorio: Creación y ajuste de una asignación de agrupación y correspondencia
Módulo 10: Gestión manual de excepciones y consolidaciones
- Gestión de excepciones y registros duplicados
- Proceso de gestión de excepciones.
- Rellenar tablas con tareas de excepciones y registros duplicados
- Laboratorio: Creación de una asignación que pueda utilizarse para identificar datos de excepciones
- Laboratorio Creación de una asignación que pueda utilizarse para identificar datos duplicados
Módulo 11: Creación, gestión e implementación de flujos de trabajo
- Flujos de trabajo y tareas de flujo de trabajo
- Tareas y pasos humanos
- Identificación de registros de excepción y duplicados
- Despliegue y ejecución de flujos de trabajo
- Verificación de tareas en Informatica Analyst.
- Laboratorio: Creación de un flujo de trabajo para rellenar la bandeja de entrada de Analyst con tareas de excepción
- Laboratorio: Creación de un flujo de trabajo para rellenar la bandeja de entrada de Analyst con tareas de registros duplicados
Módulo 12: Despliegue: Ejecución de asignaciones fuera de la herramienta de desarrollo
- Opciones de despliegue.
- Asignaciones como aplicaciones
- Programación de mappings, perfiles y Scorecards
- Laboratorio: Programación de mappings para su ejecución mediante Informatica Scheduler.
Módulo 13: Importación y exportación de objetos de proyecto
- Casos de uso de exportación/importación de proyectos
- Opciones de importación básicas y avanzadas
- Exportación de un proyecto
- Laboratorio: Importar un proyecto utilizando el método básico
- Laboratorio: Importar un proyecto utilizando el método Avanzado.
- Laboratorio: Exportar un Proyecto.
Módulo 14: Resolución de problemas
- Errores comunes del desarrollador
- Errores comunes de configuración de Mapeo y Transformación
- Errores comunes de configuración del flujo de trabajo
- Consejos para trabajar con la herramienta Developer
- Laboratorio (opcional): Solucionar problemas de configuración de Mapas
Módulo 14: Oracle
- Integración de Datos con Oracle
Hola buenas noches, gusto en saludarles. Por favor me indican cómo se puede acceder al curso y material de este? Solo veo en la página lode detalles del curso como lista, gracias.