Este repositorio contiene las diapositivas, los cuadernos y código de ejemplo del curso de Datos Masivos I
1. Conceptos básicos
- Definición y características
- Generación, procedencia y preparación de datos
- El principio de Bonferroni
- Privacidad y riesgo
- Modelos de computación para datos masivos
2. Modelo de mapeo y reducción
- Sistema de almacenamiento y procesamiento distribuido
- Modelo de programación
- Algoritmos con el modelo de mapeo y reducción
- Extensiones
- El modelo costo-comunicación
- Teoría de la complejidad para el modelo de mapeo y reducción
3. Búsqueda de elementos similares
- Medidas de similitud y distancia Resúmenes de conjuntos con preservación de similitud
- Funciones hash sensibles a la localidad
- Métodos para altos grados de similitud
- Aplicaciones
4. Algoritmos para flujos de datos
- Modelos de flujo de datos
- Muestreo
- Filtrado
- Conteo
- Estimación de momentos
- Búsqueda de los elementos más comunes
5. Algoritmos de memoria externa
- Modelo de memoria externa
- Modelo de caché inconsciente
- Cotas fundamentales de operaciones de entrada y salida
- Escaneo
- Ordenamiento
- Búsqueda
- Estructuras de datos estáticos y dinámicos
- Martes 10:00am a 11:30am (teoría)
- Miércoles 14:00pm a 16:00pm (práctica)
- Jueves 10:00am a 11:30am(teoría)
- Salón 201, segundo piso del anexo del IIMAS (clases teóricas)
- Sala A y B, tercer piso del anexo del IIMAS (clases prácticas)
4 exámenes parciales escritos (50%)
- 27 de febrero: Conceptos básicos y modelo de mapeo y reducción
- 24 de marzo: Búsqueda de elementos similares
- 21 de abril: Algoritmos para flujos de datos
- 21 de mayo: Algoritmos de memoria externa
4 evaluaciones prácticas (50%)
- 26 de febrero: Conceptos básicos y modelo de mapeo y reducción
- 25 de marzo: Búsqueda de elementos similares
- 22 de abril: Algoritmos para flujos de datos
- 20 de mayo: Algoritmos de memoria externa
Blanca Hilda Vázquez Gómez
- Correo: blancavazquez2013[arroba]gmail.com
Gibran Fuentes Pineda
- Correo: gibranfp[arroba]unam.mx
En este curso las herramientas de programación que se emplearán son las siguientes: