Cálculo del número de NaN por columna en un dataframe

Para calcular el número de NaN que hay en cada una de las columnas de un dataframe df vamos a hacer uso del método "isnull" de pandas. Éste método detecta valores NaN en arrays numéricos y valores "None" o "NaN" en arrays de objetos, devolviendo una estructura semejante a la de entrada (un dataframe en este ejemplo) en el que cada elemento se sustituye por "True" o "False" en el caso de que se trate de un NaN o no.

Comprobación del tipo de las columnas de un dataframe

En este sencillo escenario queremos comprobar el tipo de los datos contenidos en un dataframe "df". Para ello podemos ejecutar simplemente la siguiente instrucción:

df.dtypes

Si deseamos recorrer las columnas para realizar con ellas una acción diferente en función del tipo de la misma, podemos recorrerlas con un bucle for:

for c in df.columns:
    print(c, df[c].dtype)

Codificación de las columnas de tipo "object" de un data frame

Para codificar las columnas de un dataframe vamos a recorrerlas comprobando su tipo. En el caso de ser "object" la mostramos en pantalla y la codificamos con LabelEncoder (hay otras formas de ejecutar esta codificación). En el siguiente código se entrena ("fit") el codificador "LabelEncoder" y se aplica ("transform") a la columna en dos pasos, aunque podría hacerse con un solo paso, hacienod uso del método "fit_transform":