Envíanos tu consulta
Términos y condiciones *
*Si no puedes asistir en directo de facilitaremos un enlace para verlo en diferido
logoImagina
iconoCurso

Curso completo de Spark ML con Python

DISPONIBLE EN MODALIDAD:
Con este curso de Spark ML con Python aprenderás a usar el lenguaje de programación Python para crear modelos de aprendizaje automático y a utilizar la biblioteca de Spark ML para implementar modelos de aprendizaje automático en un entorno de Big Data. Al final del curso, los alumnos tendrán los conocimientos necesarios para comenzar a usar Apache Spark ML con Python en sus puestos de trabajo de manera profesional.
iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient
Formación en Spark ML con Python bonificable para empresas

¿A quién va dirigido?

Profesionales con experiencia en Python que busquen introducirse profesionalmente en el mundo del Machine Learning a través de Apache Spark ML

Objetivos

  • Introducirse en Spark ML y los conceptos fundamentales del aprendizaje automático.
  • Desarrollar habilidades en el uso de la biblioteca de Spark ML.
  • Aprender a trabajar con modelos de aprendizaje automático supervisado y no supervisado como regresión lineal, árboles de decisión, random forest, support vector machines, k-means clustering, etc.
  • Preparar a los alumnos para comenzar a utilizar Apache Spark ML con Python en sus entornos de trabajo de manera profesional

¿Qué vas a aprender?

Con este curso de Spark ML con Python aprenderás a usar el lenguaje de programación Python para crear modelos de aprendizaje automático y a utilizar la biblioteca de Spark ML para implementar modelos de aprendizaje automático en un entorno de Big Data. Al final del curso, los alumnos tendrán los conocimientos necesarios para comenzar a usar Apache Spark ML con Python en sus puestos de trabajo de manera profesional.

Requisitos

  • Tener experiencia desarrollando con Python y realizando consultas SQL
  • Son necesarios permisos de instalación en el equipo en el que se realice la formación
  • Tener acceso (revisar configuraciones proxy en caso de tenerlas) a una cuenta Community de Azure Databricks para realizar los laboratorios de Spark
  • Disponer de una cuenta de Google con acceso a Google Colab donde poder realizar pruebas de modelos
  • Tener Python 3, Git y un IDE para desarrollar en Python instalado previamente (por ejemplo Pycharm) instalados previamente en el equipo

Temario del curso

tema 1

Introducción a PySpark y Spark ML

  • Características principales de PySpark
  • Instalación y configuración de PySpark
  • Utilización de Spark con Python
  • Configuración del entorno de desarrollo
  • Introducción a Spark ML
  • Usos de Spark ML en la actualidad
tema 2

Aprendizaje automático con Spark ML

  • Uso de la API ML
  • Entrenamiento de modelos de aprendizaje automático
  • Evaluación de modelos
  • Optimización de parámetros
  • Uso de la API ML para predecir
tema 3

Feature engineering

  • Definición de features
  • Preprocesamiento de datos
  • Selección de features
  • Transformación de features
  • Normalización de datos
tema 4

Modelos de regresión

  • Regresión lineal
  • Regresión logística
  • Regresión de árbol de decisión
  • Regresión de bosque aleatorio
  • Regresión de boosting
tema 5

Modelos de clasificación

  • Clasificación binaria
  • Clasificación multiclase
  • Clasificación de árbol de decisión
  • Clasificación de bosque aleatorio
  • Clasificación de boosting
tema 6

Modelos de clustering

  • Clustering K-means
  • Clustering aglomerativo
  • Clustering de densidad
tema 7

Matriz de confusión

  • Definición de la matriz de confusión
  • Cálculo de la matriz de confusión
  • Visualización de la matriz de confusión
  • Interpretación de resultados
tema 8

Métricas de evaluación

  • Métrica de precisión
  • Métrica de recall
  • Métrica de F-Score
  • Métrica de ROC
  • Métrica de AUC
tema 9

Optimización de hiperparámetros

  • Selección de hiperparámetros
  • Uso de GridSearch
  • Uso de RandomizedSearch
  • Uso de Cross Validation
tema 10

Modelos de aprendizaje profundo con Spark ML

  • Introducción a los modelos de aprendizaje profundo
  • Redes neuronales convolucionales
  • Redes neuronales recurrentes
  • Redes neuronales profundas
tema 11

Modelos avanzados con Spark

  • Modelos de aprendizaje automático en línea
  • Modelos de aprendizaje por refuerzo
  • Modelos de aprendizaje generativo
tema 12

Evaluación de modelos

  • Evaluación de los modelos con Spark ML
  • Uso de técnicas de validación cruzada
  • Uso de métricas de evaluación
  • Interpretación de resultados
tema 13

Persistencia de modelos

  • Introducción a la persistencia de modelos
  • Uso del modelo para predicciones
  • Guardar y cargar modelos
  • Serialización de modelos
tema 14

Uso de librerías

  • Introducción a Scikit-learn
  • Utilización de librerías en Spark
  • Utilización de librerías externas
  • Integración con frameworks
tema 15

Proyecto final

  • Definición del proyecto
  • Análisis de los datos
  • Entrenamiento de modelos
  • Evaluación de los modelos
  • Puesta en producción de los modelos

Curso de Spark ML con Python bonificado para Empresas a través de FUNDAE

Somos entidad organizadora de FUNDAE, todas nuestras formaciones se pueden bonificar hasta el 100%, sujeto a vuestro crédito disponible y a cumplir con todos los requisitos de realización establecidos por la Fundación Estatal para el Empleo.

 

Si desconoces el funcionamiento de las bonificaciones, ofrecemos el servicio de gestión en FUNDAE, consúltanos cualquier duda que te surja.

Descargar Guía FUNDAE
imagenFundae
iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient