Configuración del número de columnas mostradas en un DataFrame

Con cierta frecuencia tenemos que trabajar con DataFrames pandas que, al ser mostrados en un cuaderno Jupyter, muestran solo parte de las columnas que incluyen. Por ejemplo, carguemos el dataset Breast Cancer de Scikit Learn:

from sklearn.datasets import load_breast_cancer
import pandas as pd

data = load_breast_cancer()
df = pd.DataFrame(data.data, columns = data.feature_names)

df

Dataset Breast Cancer

En la captura de pantalla anterior podemos ver que se muestra una barra de desplazamiento horizontal en la parte inferior pues el número de columnas es relativamente elevado, pero no es posible visualizar todas ellas, cosa que queda patente por la presencia de los puntos suspensivos que se muestran en cierta columna del DataFrame.

Y la pregunta que podemos hacernos es, ya que podemos usar una barra de desplazamiento ¿por qué no poder visualizar todas las columnas? Pues bien, el número máximo de columnas a mostrar puede configurarse fijando el valor de la variable pd.options.display.max_columns. Por ejemplo, el dataset anterior tiene 30 columnas:

len(df.columns)

30

Si fijamos el número máximo de columnas a una cifra igual o superior o este número:

pd.options.display.max_columns = 50

...ahora, al mostrar el DataFrame, no se mostrará la columna de puntos suspensivos hasta que no se supere dicha cifra, permitiéndonos visualizar todas las columnas:

df

Dataset Breast Cancer

Si fijamos como número máximo el valor None, se mostrarán siempre todas las columnas del DataFrame.

Categoría
Enviado por admin el Mar, 23/06/2020 - 19:11