Python para Data Science

Python para Data Science
Duración
16-25 horas

Aun cuando hay disponibles varios lenguajes de programación para la llamada Ciencia de los Datos (R, Julia, Scala, Java, MATLAB...), Python se ha ido estableciendo como opción principal debido a diversos factores, entre los que se encuentran su simplicidad, disponibilidad de librerías, soporte de la comunidad de desarrolladores, etc. En este curso revisaremos las principales características de Python, su sintaxis, tipos de datos, estructuras de control, funciones integradas... y algunas de las librerías más utilizadas en análisis: NumPy y su array multidimensional, pandas y las principaples estructuras de datos que ofrece, la serie y el dataframe. Aprenderemos a mostrar de forma gráfica los datos usando la librería matplotlib, lo que resultará especialmente útil tanto en el análisis exploratorio previo al análisis como en la comunicación del resultado del análisis, revisaremos también la librería seaborn que, basándose en matplotlib ofrece una interfaz de más alto nivel y cómoda de utilizar, y revisaremos la organización y funciones más importantes de la librería Scikit-Learn aplicándolas a ejemplos sencillos de análisis supervisado y no supervisado.

Contenido

  • Introducción a Python
    • Tipos de datos
    • Estructuras de control
    • Librerías integradas de Python
  • La librería Numpy
    • El array multidimensional
  • La librería pandas
    • La serie
    • El dataframe
  • Visualización de datos con matplotlib
  • La librería seaborn
  • La librería Scikit-Learn
    • Algoritmos supervisados
    • Algoritmos no supervisados
    • Funciones de transformación de datos
    • Otras funciones