Python para Data Science

Python para Data Science
Tipo
Presencial o por videoconferencia

Aun cuando hay disponibles varios lenguajes de programación para la llamada Ciencia de los Datos (R, Julia, Scala, Java, MATLAB...), Python se ha ido estableciendo como opción principal debido a diversos factores, entre los que se encuentran su simplicidad, disponibilidad de librerías, soporte de la comunidad de desarrolladores, etc. En este curso revisaremos las principales características de Python, su sintaxis, estructuras de control, funciones integradas... y algunas de las librerías más utilizadas en análisis: NumPy y su array multidimensional, y pandas y las princiaples estructuras de datos que ofrece, la serie y el dataframe. Aprenderemos a mostrar de forma gráfica los datos usando la librería matplotlib, lo que resultará especialmente útil tanto en el análisis exploratorio previo al análisis como en la comunicación del resultado del análisis, veremos las bases del Machine Learning -qué es el Machine Learning, tipos de algoritmos, conceptos como "entrenamiento", "Deep Learning", "Big Data"...- y pondremos todo esto en práctica usando la librería scikit-learn. Revisaremos librerías que ofrecen las implementaciones más potentes de algoritmos de tipo "Gradient Boosting" (LightGBM y XGBoost) y Redes Neuronales (Keras), aplicándolos a la visión artificial (clasificación con Redes Neuronales Convolucionales) y procesamiento de lenguaje natural con la librería NLTK.

Contenido

  • Introducción a Python
  • La librería Numpy
    • El array multidimensional
  • La librería pandas
    • La serie
    • El dataframe
  • Visualización de datos con matplotlib
  • Introducción al Machine Learning
  • La librería scikit-learn
  • Algoritmos "Gradient Boosting"
    • LightGBM
    • XGBoost
  • Redes Neuronales
    • La librería Keras
  • Aplicaciones del Machine Learning
    • Visión artificial (clasificación) con Redes Neuronales Convolucionales
    • Procesamiento del Lenguaje Natural (NLP) con la librería NLTK