KMMX Capacitación acorde a tu pensamiento

Introducción a Data Science con R (40 horas)

Descripción: El Data Science, o “Ciencia de los datos” en español, es el estudio de la extracción generalizada del conocimiento a partir de información o datos, aunque la palabra comúnmente utilizada es ciencia. Este incorpora elementos variables y construcciones a partir de técnicas y teorías de muchos campos, los cuales van desde el procesamiento de señales, matemáticas, modelos de probabilidad y estadística, ingeniería de datos, programación de sistemas, aprendizaje máquina o inteligencia artificial, reconocimiento y aprendizaje de patrones, visualización, datawarehousing, inteligencia de negocios, cómputo de alto performance, etc. con el objetivo común de extraer significados de la información y crear productos de datos. Mediante el Data Science el comercio y la investigación están siendo transformados debido al descubrimiento y la predicción basada en datos. Habilidades requeridas para el análisis de datos a niveles masivos, gestión escalable de datos dentro y fuera de la nube, elaborando algoritmos paralelos y un modelado estadístico y de competencia con un complejo ecosistema de herramientas y plataformas.

Objetivo del curso: El asistente aprenderá a formular preguntas relevantes desde el punto de vista contextual e hipótesis que impulsen a la investigación científica de datos. Identificar, obtener y transformar un conjunto de datos para hacerlo utilizable para la producción de evidencia estadística y su comunicación a través de la vía escrita. Construir modelos basados en nuevos tipos de datos, diseño experimental e inferencia estadística.

Dirigido a: Programadores y Desarrolladores.

Nivel: Básico - Intermedio.

Temario

Parte 1 - Introducción

Ejemplos | Ciencia de datos articulada | Historia y contexto | Panorama de la tecnología | Bases de datos y su evolución, Big Data y Tendencias

Parte 2 - Manipulación de datos con R

Introducción a R | Instalación y preparación de R | Vectores en R | Matrices en R | Listas en R | DataFrames en R | Sentencias de control en R | Funciones en R | I/O en R | Graficación en R | Programación orientada a objetos en R

Parte 3 - Analíticas

Modelado básico estático | Diseño experimental | Sobreajustes | Modelos de regresión | Gráficas analíticas | Búsquedas recursivas | Procesando iterativamente | Analíticas de texto, semántica | Filtro colaborativo: slope-one | Inferencias estadísticas

Parte 4 - Comunicando resultados

Visualización | Productos de datos | Analíticas visuales de datos | Privacidad y gobernanza

Precio por participante: $11,600 MN (IVA incluido)

Formas de pago