Curso: Ciencia de Datos a través del Big Data

Perfilado de sección

Seleccionar sección General

Colapsar Expandir
General

Colapsar todo Expandir todo
Este curso ofrece una inmersión en el mundo del Big Data, desde los conceptos fundamentales hasta las últimas herramientas de análisis. Los participantes explorarán los principios esenciales de Big Data, aprendiendo a gestionar grandes volúmenes de datos. Además, se sumergirán en el ecosistema de Hadoop, dominando el arte del procesamiento y almacenamiento distribuido en el Hadoop Distributed File System (HDFS).

Una vez establecidas las bases, el curso se adentrará en Apache Spark, ofreciendo una visión detallada de esta potente y popular plataforma de procesamiento en memoria y su papel fundamental en el análisis de Big Data. Desde la manipulación de datos hasta aplicaciones reales, los estudiantes adquirirán habilidades prácticas para abordar los desafíos más complejos en el ámbito del análisis de datos.

Agradecimientos

El uso de esta plataforma docente para impartir este curso ha sido financiado por el proyecto TSI-100927-2023-1, financiado por Plan de Recuperación, Transformación y Resiliencia Europeo, de la Unión Europea-Next Generation EU a través del Ministerio para la Transformación Digital y de la Función Pública.
- Seleccionar actividad Avisos
  
  Avisos Foro
- Seleccionar actividad Programa del curso
  
  Programa del curso Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Foro
  
  Foro
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad ¿Te interesa colaborar?
  
  ¿Te interesa colaborar? Encuesta
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección Terminamos con ...

Colapsar Expandir
Terminamos con ...

Destacado
- Seleccionar actividad Solicitud de Certificación
  
  Solicitud de Certificación Cuestionario
  
  Abrió: sábado, 4 de enero de 2025, 10:00
  
  Cerró: jueves, 20 de febrero de 2025, 23:59
  
  Los estudiantes deben
  
  Marcar como hecha

Profesorado y material docente

¿Cómo realizar (y sobrevivir) este curso?

Te recomendamos que veas el video introductorio para conocer la estructura y conocimientos previos que esperamos que tengas para seguir este curso con normalidad.

El curso está pensado para que le dediques un total de 20 horas a lo largo de dos semanas. Los contenidos de los distintos bloques estarán disponibles en la siguientes fechas:


Tema	Duración estimada	Fecha de comienzo
Introducción	2 horas	10 de enero
MapReduce	2 horas de teoría 2 horas de prácticas	13 de enero
Hadoop/HDFS	2 horas	16 de enero
Spark	2 horas de teoría 2 horas de prácticas	17 de enero
SparkSQL	2 horas de teoría 2 horas de prácticas	20 de enero
Machine Learning con Spark	2 horas de teoría 2 horas de prácticas	22 de enero

Material de refuerzo: En caso de que no estés familiarizado con machine learning, te dejamos disponible una breve introducción para que puedas entender mejor el último bloque del curso.

En cada bloque encontrarás:

- Un video corto (blackcoffee) que resume lo que vas a aprender en el bloque.

- Uno o más videos largos de una clase real.

- Transparencias.

- Enlace a Google Colab con los Python Notebooks usados durante la clase.

- Prácticas: Notebooks auto-evaluados con prácticas y ejercicios.

- Evaluación: Cada bloque tendrá un cuestionario asociado que debes de responder antes del 25 de enero de 2025.

Interacción con el profesorado y otros compañeros

Estamos seguros que durante el curso tendrás dudas o preguntas sobre Spark, Hadoop y todos los conceptos que vas a aprender. Te pedimos que no seas tímid@ y uses el foro para preguntarnos tus dudas.

Contacto:

Dr. Diego García (djgarcia@ugr.es)

Dr. Isaac Triguero (isaaktriguero@ugr.es)

---------------------------------------------------------------------------------------------------------------------------------------------
El contenido de este curso está basado en el libro "Large-Scale Data Analytics with Python and Spark, Cambridge: Cambridge University Press.", del cual tomaremos prestadas trasparencias, código y ejercicios prácticos.

Seleccionar actividad Presentación - Ciencia de Datos a Través del Big Data

Presentación - Ciencia de Datos a Través del Big Data URL

Los estudiantes deben

Marcar como hecha

Seleccionar sección Introducción al Big Data

Colapsar Expandir
Introducción al Big Data
- Seleccionar actividad Blackcoffee - Introducción al Big Data
  
  Blackcoffee - Introducción al Big Data URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Introducción al Big Data
  
  Introducción al Big Data Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - Introducción al Big Data
  
  Vídeo - Introducción al Big Data URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Cuestionario: Introducción al Big Data
  
  Cuestionario: Introducción al Big Data
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección MapReduce

Colapsar Expandir
MapReduce
- Seleccionar actividad Blackcoffee - MapReduce I
  
  Blackcoffee - MapReduce I URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad MapReduce I
  
  MapReduce I Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - MapReduce I
  
  Vídeo - MapReduce I URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad MapReduce - Lab I
  
  MapReduce - Lab I URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad MapReduce II
  
  MapReduce II Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - MapReduce II
  
  Vídeo - MapReduce II URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad MapReduce - Lab II
  
  MapReduce - Lab II URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Cuestionario: MapReduce
  
  Cuestionario: MapReduce
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección Hadoop

Colapsar Expandir
Hadoop
- Seleccionar actividad Blackcoffee - Hadoop & HDFS
  
  Blackcoffee - Hadoop & HDFS URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Hadoop
  
  Hadoop Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad HDFS
  
  HDFS Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - Hadoop & HDFS
  
  Vídeo - Hadoop & HDFS URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Cuestionario: Hadoop & HDFS
  
  Cuestionario: Hadoop & HDFS
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección Spark

Colapsar Expandir
Spark
- Seleccionar actividad Blackcoffee - Apache Spark
  
  Blackcoffee - Apache Spark URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark I
  
  Spark I Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark II
  
  Spark II Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - Apache Spark
  
  Vídeo - Apache Spark URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark - demo
  
  Spark - demo URL
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Este notebook de Google Colab incluye todo el código que se genera durante el vídeo.
- Seleccionar actividad Spark Lab
  
  Spark Lab URL
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Este notebook incluye diferentes ejercicios para que practiques con Spark. Verás la versión en inglés y en español. Te recomendamos que uses la versión en inglés.
- Seleccionar actividad Cuestionario: Spark
  
  Cuestionario: Spark
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección Spark SQL

Colapsar Expandir
Spark SQL
- Seleccionar actividad Blackcoffee - Spark SQL II
  
  Blackcoffee - Spark SQL II URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark SQL demo
  
  Spark SQL demo URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark SQL I
  
  Spark SQL I Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - Spark SQL I
  
  Vídeo - Spark SQL I URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark SQL II
  
  Spark SQL II Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - Spark SQL II
  
  Vídeo - Spark SQL II URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark SQL Lab
  
  Spark SQL Lab URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Datos
  
  Datos Carpeta
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Cuestionario: Spark SQL
  
  Cuestionario: Spark SQL
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección Machine Learning con Spark

Colapsar Expandir
Machine Learning con Spark
- Seleccionar actividad Blackcoffee - Spark ML
  
  Blackcoffee - Spark ML URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Machine Learning con Spark: MLlib
  
  Machine Learning con Spark: MLlib Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Vídeo - Spark ML
  
  Vídeo - Spark ML URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad MLlib demo
  
  MLlib demo URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Spark ML - Laboratorio
  
  Spark ML - Laboratorio URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Examen Final
  
  Examen Final Cuestionario
  
  Los estudiantes deben
  
  Marcar como hecha
Seleccionar sección Material de refuerzo: Introducción al Machine Learning

Colapsar Expandir
Material de refuerzo: Introducción al Machine Learning
- Seleccionar actividad Introduction to Machine Learning
  
  Introduction to Machine Learning Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Ciencia de Datos - Lab
  
  Ciencia de Datos - Lab URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Data
  
  Data Carpeta
  
  Los estudiantes deben
  
  Marcar como hecha