Skip to content

Diapositivas, ejercicios, código de ejemplo y página del curso de Datos Masivos para la licenciatura de Ciencia de Datos

Notifications You must be signed in to change notification settings

misaelLS21/CursoDatosMasivos

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

82 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Curso de Datos Masivos, UNAM

Este repositorio contiene las diapositivas, los cuadernos y código de ejemplo del curso de Datos Masivos I

Temario

1. Conceptos básicos

  • Definición y características
  • Generación, procedencia y preparación de datos
  • El principio de Bonferroni
  • Privacidad y riesgo
  • Modelos de computación para datos masivos

2. Modelo de mapeo y reducción

  • Sistema de almacenamiento y procesamiento distribuido
  • Modelo de programación
  • Algoritmos con el modelo de mapeo y reducción
  • Extensiones
  • El modelo costo-comunicación
  • Teoría de la complejidad para el modelo de mapeo y reducción

3. Búsqueda de elementos similares

  • Medidas de similitud y distancia Resúmenes de conjuntos con preservación de similitud
  • Funciones hash sensibles a la localidad
  • Métodos para altos grados de similitud
  • Aplicaciones

4. Algoritmos para flujos de datos

  • Modelos de flujo de datos
  • Muestreo
  • Filtrado
  • Conteo
  • Estimación de momentos
  • Búsqueda de los elementos más comunes

5. Algoritmos de memoria externa

  • Modelo de memoria externa
  • Modelo de caché inconsciente
  • Cotas fundamentales de operaciones de entrada y salida
  • Escaneo
  • Ordenamiento
  • Búsqueda
  • Estructuras de datos estáticos y dinámicos

Horario

  • Martes 10:00am a 11:30am (teoría)
  • Miércoles 14:00pm a 16:00pm (práctica)
  • Jueves 10:00am a 11:30am(teoría)

Lugar

  • Salón 201, segundo piso del anexo del IIMAS (clases teóricas)
  • Sala A y B, tercer piso del anexo del IIMAS (clases prácticas)

Criterios de evaluación

4 exámenes parciales escritos (50%)

  • 27 de febrero: Conceptos básicos y modelo de mapeo y reducción
  • 24 de marzo: Búsqueda de elementos similares
  • 21 de abril: Algoritmos para flujos de datos
  • 21 de mayo: Algoritmos de memoria externa

4 evaluaciones prácticas (50%)

  • 26 de febrero: Conceptos básicos y modelo de mapeo y reducción
  • 25 de marzo: Búsqueda de elementos similares
  • 22 de abril: Algoritmos para flujos de datos
  • 20 de mayo: Algoritmos de memoria externa

Profesores

Blanca Hilda Vázquez Gómez

  • Correo: blancavazquez2013[arroba]gmail.com

Gibran Fuentes Pineda

  • Correo: gibranfp[arroba]unam.mx

Ambiente de programación

En este curso las herramientas de programación que se emplearán son las siguientes:

About

Diapositivas, ejercicios, código de ejemplo y página del curso de Datos Masivos para la licenciatura de Ciencia de Datos

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 97.0%
  • Scala 2.5%
  • Python 0.5%