Objetivo

diplomado en
Ciencia de Datos

Proporcionar a los participantes las herramientas necesarias para la adquisición de conocimientos y habilidades básicas para desarrollarse en áreas especializadas de análisis de datos, que les permitan aplicar la programación y modelos de aprendizaje automático, basados en algoritmos matemáticos y estadísticas, con el propósito de resolver problemas complejos con grandes volúmenes de datos, para generar la información que soporte la toma de decisiones en diversos ámbitos.

Módulos

Conocer los fundamentos y distinguir los objetivos de la Ciencia de Datos y sus aplicaciones, así como su relación con el Big Data, la inteligencia de negocios y otras áreas

  1. Antecedentes
    • Introducción
    • Los datos, el internet y los dispositivos
    • Tipos de datos
  2. Evolución de la ciencia y tecnología informática
    • Revolución científica
    • Ciencia y el mundo contemporáneo
    • Telecomunicaciones e Informática
    • Aldea global
  3. El big data como desarrollo tecnológico de los datos
    • Características del big data, las diferentes V’s.
    • Incertidumbre, imprecisión, falta de datos.
    • Herramientas estadísticas.
  4. Nuevos paradigmas computacionales
    • Data mining
    • Modelos predictivos
    • Análisis estadístico
    • Machine learning
  5. Aplicación de la Ciencia de Datos
    • Inteligencia de negocios
    • Salud
    • Procesos productivos
    • Ciencias sociales
    • Comunicaciones
  6. Desafíos éticos de la Ciencia de Datos
    • Automatización y digitalización
    • Cambio de perfiles laborales
    • Privacidad y seguridad

Conocer y aplicar los elementos básicos de Estadística Descriptiva y Estadística Inferencial, en la extracción de información significativa de los datos disponibles, identificando variables y sus posibles relaciones o tendencias que permitan tomar decisiones con un nivel de confianza aceptable.

  1. Introducción: Estadística y Ciencia de Datos
    • Ramas de la Estadística
    • Software R
  2. Estadística Descriptiva
    • Recopilación y procesamiento de datos.
    • Tipos de datos
    • Tipos de medidas (tendencia central, dispersión, posición, sesgo, curtosis).
    • Gráficos
  3. Fundamentos de probabilidad
    • Teoría de Probabilidad
    • Distribuciones de Probabilidad
  4. Estadística Inferencial
    • Distribuciones muestrales.
    • Estimación.
    • Prueba de Hipótesis.
  5. Regresión
    • Regresión lineal simple y múltiple.
    • Otros modelos de regresión.
  6. Series de Tiempo
    • Descomposición de series de tiempo.
    • Modelos de pronósticos.

Identificar los principales componentes de una base de datos para analizar información en modelos estándares para instrumentar esquemas de formato, acceso y búsqueda.

  1. Introducción
    • Conceptos básicos
    • Objetivo de la base de datos
    • Modelos de base de datos
    • Clasificación de base de datos
  2. Exploración de datos.
    • Recuperación de datos
    • Expresiones Aritméticas
    • Operadores
  3. Restriccion y ordenamiento de datos
    • Restringir datos
    • Ordernar datos
  4. Funciones
    • Funciones para un solo dato
    • Funciones para multiples datos
    • Fechas
  5. Agrupamiento de datos
    • Funciones de grupo
    • Restringir agrupamientos

Conocer los fundamentos del lenguaje de programación Python a través de la codificación de programas sobre el ambiente de programación con Notebooks, esto para cumplir con los requerimientos necesarios en la aplicación de la Ciencia de Datos.

  1. Introducción y conceptos básicos
    • Introducción a la programación.
    • Introducción a Python.
    • Instalación del entorno de trabajo.
    • Variables.
    • Operadores matemáticos, lógicos y de comparación.
    • Tipos de datos y conversión de tipos.
    • Creación y uso de notebooks.
  2. Estructuras de control de flujo
    • Condicionales.
    • Ciclos e iteradores.
    • Funciones.
  3. Estructuras de datos
    • Colecciones.
    • Listas.
    • Tuplas.
    • Conjuntos.
    • Cadenas de caracteres.
    • Diccionarios.
    • Lectura y escritura de archivos

Conocer las librerías especializadas más comunes para el análisis y visualización de datos al implementar aplicaciones de Ciencia de Datos, sobre el ambiente de programación notebook.

  1. Manipulación de datos con Pandas
    • DataFrames
    • Selección de datos en DataFrames
    • Filtros en DataFrames
    • Agrupaciones de datos
  2. Introducción a NumPy
    • Arreglos en NumPy
    • Funciones universales
    • Agregaciones
    • Comparaciones y máscaras
    • Indexaciones en NumPy
    • Datos estructurados
  3. Visualización con Matplotlib
    • Diagramas de barras
    • Histogramas
    • Diagramas de caja
    • Diagramas de dispersión
    • Diagramas de contorno
    • Mapas de color

Comprender y utilizar a nivel introductorio los modelos de aprendizaje automático incluidos en la librería Scikit-learn de Python identificando tareas básicas y la orientación de los modelos hacía aplicaciones específicas.

  1. Introducción al aprendizaje automático y a Scikit-learn.
    • ¿Qué es al aprendizaje automático?
    • Tipos de aprendizaje
    • Tareas de aprendizaje.
    • Librería Scikit-learn
  2. Aprendizaje supervisado
    • Regresión Polinomial
    • Regresión Logística.
    • Clasificación
  3. Aprendizaje no supervisado
    • Agrupamiento
    • Reducción dimensional
  4. Redes neuronales
    • Perceptrón
    • Estructura de redes neuronales

Acerca de este curso

Requerimientos

  • Disponibilidad para trabajar al menos 8 horas semanales
  • Iniciativa para el estudio independiente
  • Actitud creativa, innovadora y apertura al uso de tecnología
  • Tener acceso a internet

Perfil de Ingreso

Este diplomado está dirigido a estudiantes de licenciatura y profesionistas interesados en el análisis y el procesamiento de grandes volúmenes de datos, para la toma de decisiones basadas en la información, en relación con las áreas involucradas con las Matemáticas, la Informática, la Física, la Actuaria, las Ciencias y las Ingenierías. Se requieren conocimientos básicos de álgebra así como la habilidad para hacer uso de herramientas digitales para buscar información en Internet y la edición de documentos de texto.

Inscripción

19 de Marzo al 26 de Abril de 2024

Inicio de Clases

29 de Abril de 2024


Duración Estimada

120 horas totales

Investigadores

Card image

Ulises
Iván
Bravo
Sanchéz

Card image

Luis
Fabian
Fuentes
Cortés

Card image

Miguel
Ángel
Guzmán
Rivera

Card image

Guillermo
Fernández
Romo

Card image

José
Jesús
Sánchez
Farías

Card image
María Angela Magdalena Jiménez Grajales
Card image
Daniel Villanueva Vásquez

Aliados Estratégicos