Bit - loader
Bit - Python for Data Science

Python for Data Science


Python for Data Science

El objetivo de este curso es aprender los fundamentos de la ciencia de datos y desarrollar una competencia efectiva orientada a resolver problemas reales usando Python como lenguaje. Se busca estructurar correctamente el conocimiento sobre algoritmos y técnicas asociadas para ofrecer soluciones empresariales automatizadas basadas en los datos.


Objetivos

Al finalizar el curso, el alumnado tendrá las nociones básicas de los siguientes conceptos, a la vez que sabrá utilizar el lenguaje Python para resolver casos reales asociados a ellos:

  • ¿Qué es (y qué no es) exactamente la ciencia de datos?
  • Las diferencias y usos principales del aprendizaje supervisado y no supervisado
  • Como orientar correctamente un proyecto de datos
  • Los principales algoritmos de clasificación y regresión
  • Los principales algoritmos de agrupación (clustering) y recomendadores
  • Cómo mejorar y optimizar modelos de Machine Learning
  • El uso de la simulación en la ciencia de datos

 


Perfil de los alumnos

Todo tipo de profesionales que deseen aprender cómo implementar soluciones de negocio basadas en la ciencia de datos, y planeen usar el lenguaje de programación Python.


Requisitos previos

Se supone que el alumnado tiene un dominio a nivel básico de Python, o un buen nivel en otro lenguaje de programación como Java, R, C++…


Profesorado

Contamos con un equipo de instructores altamente cualificados que combinan la actividad formativa con el desarrollo de su actividad profesional como expertos en el campo de las TIC. Profesionales capaces de transferir de forma amena y entendedora los conceptos técnicos más abstractos.


Documentación

Cada alumno recibirá un ejemplar de la Documentación elaborada por BIT by Netmind.


Contenidos del Python for Data Science

1. Introducción a la ciencia de datos

  • Diferencias entre Data Science, Business Intelligence y Big Data
  • Aprendizaje supervisado vs Aprendizaje no supervisado
  • Tipos de datos en Python y sus particularidades
  • Introducción al Scikitlearn
  • Preprocesamiento de datos
  • Ingeniería de variables

2. Principales algoritmos de Regresión

  • Regresión lineal y evaluación de modelos numéricos
  • Árboles de regresión
  • Random Forests
  • Redes neuronales
  • Validación interna, externa y cruzada

3. Principales algoritmos de Classificación

  • Regresión logística y evaluación de modelos basados en categorías
  • Árboles de clasificación
  • KNN
  • Support Vector Machine
  • Selección de parámetros automática

4. Otras técnicas de ciencia de datos

  • Reducción de la dimensionalidad (PCA)
  • Clustering (K-means, Jerárquico, Espectral)
  • Recomendadores
  • Introducción a la simulación

Metodología

Curso presencial, participativo y práctico. El docente introducirá los contenidos mediante problemas realistas, los participantes asimilarán los conocimientos mediante resolución de actividades de nivel adaptativo.


Certificaciones

Evaluación continua en base a las actividades realizadas en grupo y/o individualmente. El formador proporcionará feedback de forma continuada e individualmente a cada participante.

En el curso se realizará una prueba de evaluación tipo test que deberá superarse en un 70%. Se dispondrá de 30 minutos para su realización.

 

Las condiciones de los servicios adicionales de Certificación están sujetos a los términos del propietario de la licencia o de la entidad certificadora autorizada.


Acreditación

Se emitirá Certificado de Asistencia sólo a los alumnos con una asistencia superior al 75% y Diploma aprovechamiento si superan también la prueba de evaluación.


Cursos relacionados

Knowledge Center