IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS

Descripción del scorm IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS

Contenido e-learning IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS

Contenido e-learning de IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS


SCORM 1. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

Introducción a la minería de datos y el aprendizaje automático

- Proceso KDD

- Modelos y Técnicas de Data Mining

- Áreas de aplicación

- Minería de textos y Web Mining

- Data mining y marketing


SCORM 2. R COMO HERRAMIENTA PARA BIG DATA

Instalación de R y RStudio

- Introducción al lenguaje

- Historia e Introducción a R

- Operaciones Básicas y Números

- Atributos, Entrada y Coerción

- Matrices

- Precedencia Operaciones Vectoriales

- Manejo de fechas y tiempo

- Listas, Factores, Valores Faltantes y Dataframes

- Subconjuntos de Datos

- Leer y Escribir Datos

Uso del lenguaje

- Estructuras de Control

- Funciones

- Reglas de Alcance

Sistema de gráficos

- Funciones *apply: apply

- Funciones *apply: lapply / sappy

- Funciones *apply: mapply / rep

- Graficación con el Sistema de Base de Gráficos

- Algunas Funciones Gráficas de Alto Nivel

- Parámetros en el Sistema de Gráficos

- Colores en el Sistema de Gráficos

- Graficación con Notación Matemática

- Graficación con texto y notación matemática

- Creación de Gráficas en 3D

Expresiones regulares. Gráficas con ggplot2 y Simulación

- Expresiones Regulares

- Paquete de gráficos ggplot2

- Simulación

R en el mundo real

- Estadística Descriptiva y Predictiva con R

- Integración de R en Hadoop


SCORM 3. PRE-PROCESAMIENTO &, PROCESAMIENTO DE DATOS

Obtención y limpieza de los datos (ETL)

Inferencia estadística

Pruebas de hipótesis

Modelos de regresión

Árboles de Decisión

Algoritmos de Clasificación / Regresión (J48/C5.0, M5P)

Normalización, Tipos de distancia, Correlación

Machine Learning

Comparar Artículos (k-NN)

Modelo predictivo de profit (k-NN, M5P...)

Modelo predictivo de clasificación (J48, k-NN)


SCORM 4. ANÁLISIS DE LOS DATOS

Inteligencia Analítica de negocios

La teoría de grafos y el análisis de redes sociales

Presentación de resultados


SCORM 5. PROCESAMIENTO DISTRIBUIDO DE DATOS CON HADOOP

¿Qué es Hadoop?

El sistema de archivos HDFS

Algunos comandos de referencia

Procesamiento MapReduce con Hadoop

El concepto de los clusters en Hadoop


SCORM 6. WEKA Y DATA MINING

¿Qué es Weka?

Técnicas de Data Mining en Weka

Interfaces de Weka

Selección de atributos

Interesados en IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS


Duración sugerida para este contenido: 80 horas