Course: Ciencia de Datos a través del Big Data

Section outline

Select section General

Collapse Expand
General

Collapse all Expand all
Este curso ofrece una inmersión en el mundo del Big Data, desde los conceptos fundamentales hasta las últimas herramientas de análisis. Los participantes explorarán los principios esenciales de Big Data, aprendiendo a gestionar grandes volúmenes de datos. Además, se sumergirán en el ecosistema de Hadoop, dominando el arte del procesamiento y almacenamiento distribuido en el Hadoop Distributed File System (HDFS).

Una vez establecidas las bases, el curso se adentrará en Apache Spark, ofreciendo una visión detallada de esta potente y popular plataforma de procesamiento en memoria y su papel fundamental en el análisis de Big Data. Desde la manipulación de datos hasta aplicaciones reales, los estudiantes adquirirán habilidades prácticas para abordar los desafíos más complejos en el ámbito del análisis de datos.

Agradecimientos

El uso de esta plataforma docente para impartir este curso ha sido financiado por el proyecto TSI-100927-2023-1, financiado por Plan de Recuperación, Transformación y Resiliencia Europeo, de la Unión Europea-Next Generation EU a través del Ministerio para la Transformación Digital y de la Función Pública.
- Select activity Avisos
  
  Avisos Forum
- Select activity Programa del curso
  
  Programa del curso File
  
  Students must
  
  Mark as done
- Select activity Foro
  
  Foro Forum
  
  Students must
  
  Mark as done
- Select activity ¿Te interesa colaborar?
  
  ¿Te interesa colaborar? Feedback
  
  Students must
  
  Mark as done
Select section Terminamos con ...

Collapse Expand
Terminamos con ...

Highlighted
- Select activity Solicitud de Certificación
  
  Solicitud de Certificación Quiz
  
  Opened: Saturday, 4 January 2025, 10:00 AM
  
  Closed: Thursday, 20 February 2025, 11:59 PM
  
  Students must
  
  Mark as done

Profesorado y material docente

¿Cómo realizar (y sobrevivir) este curso?

Te recomendamos que veas el video introductorio para conocer la estructura y conocimientos previos que esperamos que tengas para seguir este curso con normalidad.

El curso está pensado para que le dediques un total de 20 horas a lo largo de dos semanas. Los contenidos de los distintos bloques estarán disponibles en la siguientes fechas:


Tema	Duración estimada	Fecha de comienzo
Introducción	2 horas	10 de enero
MapReduce	2 horas de teoría 2 horas de prácticas	13 de enero
Hadoop/HDFS	2 horas	16 de enero
Spark	2 horas de teoría 2 horas de prácticas	17 de enero
SparkSQL	2 horas de teoría 2 horas de prácticas	20 de enero
Machine Learning con Spark	2 horas de teoría 2 horas de prácticas	22 de enero

Material de refuerzo: En caso de que no estés familiarizado con machine learning, te dejamos disponible una breve introducción para que puedas entender mejor el último bloque del curso.

En cada bloque encontrarás:

- Un video corto (blackcoffee) que resume lo que vas a aprender en el bloque.

- Uno o más videos largos de una clase real.

- Transparencias.

- Enlace a Google Colab con los Python Notebooks usados durante la clase.

- Prácticas: Notebooks auto-evaluados con prácticas y ejercicios.

- Evaluación: Cada bloque tendrá un cuestionario asociado que debes de responder antes del 25 de enero de 2025.

Interacción con el profesorado y otros compañeros

Estamos seguros que durante el curso tendrás dudas o preguntas sobre Spark, Hadoop y todos los conceptos que vas a aprender. Te pedimos que no seas tímid@ y uses el foro para preguntarnos tus dudas.

Contacto:

Dr. Diego García (djgarcia@ugr.es)

Dr. Isaac Triguero (isaaktriguero@ugr.es)

---------------------------------------------------------------------------------------------------------------------------------------------
El contenido de este curso está basado en el libro "Large-Scale Data Analytics with Python and Spark, Cambridge: Cambridge University Press.", del cual tomaremos prestadas trasparencias, código y ejercicios prácticos.

Select activity Presentación - Ciencia de Datos a Través del Big Data

Presentación - Ciencia de Datos a Través del Big Data URL

Students must

Mark as done

Select section Introducción al Big Data

Collapse Expand
Introducción al Big Data
- Select activity Blackcoffee - Introducción al Big Data
  
  Blackcoffee - Introducción al Big Data URL
  
  Students must
  
  Mark as done
- Select activity Introducción al Big Data
  
  Introducción al Big Data File
  
  Students must
  
  Mark as done
- Select activity Vídeo - Introducción al Big Data
  
  Vídeo - Introducción al Big Data URL
  
  Students must
  
  Mark as done
- Select activity Cuestionario: Introducción al Big Data
  
  Cuestionario: Introducción al Big Data Quiz
  
  Students must
  
  Mark as done
Select section MapReduce

Collapse Expand
MapReduce
- Select activity Blackcoffee - MapReduce I
  
  Blackcoffee - MapReduce I URL
  
  Students must
  
  Mark as done
- Select activity MapReduce I
  
  MapReduce I File
  
  Students must
  
  Mark as done
- Select activity Vídeo - MapReduce I
  
  Vídeo - MapReduce I URL
  
  Students must
  
  Mark as done
- Select activity MapReduce - Lab I
  
  MapReduce - Lab I URL
  
  Students must
  
  Mark as done
- Select activity MapReduce II
  
  MapReduce II File
  
  Students must
  
  Mark as done
- Select activity Vídeo - MapReduce II
  
  Vídeo - MapReduce II URL
  
  Students must
  
  Mark as done
- Select activity MapReduce - Lab II
  
  MapReduce - Lab II URL
  
  Students must
  
  Mark as done
- Select activity Cuestionario: MapReduce
  
  Cuestionario: MapReduce Quiz
  
  Students must
  
  Mark as done
Select section Hadoop

Collapse Expand
Hadoop
- Select activity Blackcoffee - Hadoop & HDFS
  
  Blackcoffee - Hadoop & HDFS URL
  
  Students must
  
  Mark as done
- Select activity Hadoop
  
  Hadoop File
  
  Students must
  
  Mark as done
- Select activity HDFS
  
  HDFS File
  
  Students must
  
  Mark as done
- Select activity Vídeo - Hadoop & HDFS
  
  Vídeo - Hadoop & HDFS URL
  
  Students must
  
  Mark as done
- Select activity Cuestionario: Hadoop & HDFS
  
  Cuestionario: Hadoop & HDFS Quiz
  
  Students must
  
  Mark as done
Select section Spark

Collapse Expand
Spark
- Select activity Blackcoffee - Apache Spark
  
  Blackcoffee - Apache Spark URL
  
  Students must
  
  Mark as done
- Select activity Spark I
  
  Spark I File
  
  Students must
  
  Mark as done
- Select activity Spark II
  
  Spark II File
  
  Students must
  
  Mark as done
- Select activity Vídeo - Apache Spark
  
  Vídeo - Apache Spark URL
  
  Students must
  
  Mark as done
- Select activity Spark - demo
  
  Spark - demo URL
  
  Students must
  
  Mark as done
  
  Este notebook de Google Colab incluye todo el código que se genera durante el vídeo.
- Select activity Spark Lab
  
  Spark Lab URL
  
  Students must
  
  Mark as done
  
  Este notebook incluye diferentes ejercicios para que practiques con Spark. Verás la versión en inglés y en español. Te recomendamos que uses la versión en inglés.
- Select activity Cuestionario: Spark
  
  Cuestionario: Spark Quiz
  
  Students must
  
  Mark as done
Select section Spark SQL

Collapse Expand
Spark SQL
- Select activity Blackcoffee - Spark SQL II
  
  Blackcoffee - Spark SQL II URL
  
  Students must
  
  Mark as done
- Select activity Spark SQL demo
  
  Spark SQL demo URL
  
  Students must
  
  Mark as done
- Select activity Spark SQL I
  
  Spark SQL I File
  
  Students must
  
  Mark as done
- Select activity Vídeo - Spark SQL I
  
  Vídeo - Spark SQL I URL
  
  Students must
  
  Mark as done
- Select activity Spark SQL II
  
  Spark SQL II File
  
  Students must
  
  Mark as done
- Select activity Vídeo - Spark SQL II
  
  Vídeo - Spark SQL II URL
  
  Students must
  
  Mark as done
- Select activity Spark SQL Lab
  
  Spark SQL Lab URL
  
  Students must
  
  Mark as done
- Select activity Datos
  
  Datos Folder
  
  Students must
  
  Mark as done
- Select activity Cuestionario: Spark SQL
  
  Cuestionario: Spark SQL Quiz
  
  Students must
  
  Mark as done
Select section Machine Learning con Spark

Collapse Expand
Machine Learning con Spark
- Select activity Blackcoffee - Spark ML
  
  Blackcoffee - Spark ML URL
  
  Students must
  
  Mark as done
- Select activity Machine Learning con Spark: MLlib
  
  Machine Learning con Spark: MLlib File
  
  Students must
  
  Mark as done
- Select activity Vídeo - Spark ML
  
  Vídeo - Spark ML URL
  
  Students must
  
  Mark as done
- Select activity MLlib demo
  
  MLlib demo URL
  
  Students must
  
  Mark as done
- Select activity Spark ML - Laboratorio
  
  Spark ML - Laboratorio URL
  
  Students must
  
  Mark as done
- Select activity Examen Final
  
  Examen Final Quiz
  
  Students must
  
  Mark as done
Select section Material de refuerzo: Introducción al Machine Learning

Collapse Expand
Material de refuerzo: Introducción al Machine Learning
- Select activity Introduction to Machine Learning
  
  Introduction to Machine Learning File
  
  Students must
  
  Mark as done
- Select activity Ciencia de Datos - Lab
  
  Ciencia de Datos - Lab URL
  
  Students must
  
  Mark as done
- Select activity Data
  
  Data Folder
  
  Students must
  
  Mark as done