Lectura y escritura de ficheros

La principal función ofrecida por pandas para la lectura de datos desde un fichero es pandas.read_csv. Esta función lee un fichero de valores separados por comas (formato CSV) y lo vuelca en un dataframe, incluyéndo gran candidad de parámetros para determinar cómo se realiza la lectura y cómo deberán tratarse los datos leídos. Los más destacados son los siguientes:

  • header: Este parámetro determina qué fila o filas se usarán como etiquetas de columnas. Por defecto se usarán los valores de la primera línea del fichero. Si los datos no tienen cabecera, deberá indicarse por medio de header = None.
  • names: Lista de nombres de columnas a usar.
  • index_col: Columna a usar como índice de filas.
  • parse_dates: Determina si las columas conteniendo fechas pero estén en otros formatos (texto) deberán ser convertidas a formato de fechas o no.
  • nrows: Número del filas del fichero a leer. Útil si se desea leer un fichero en bloques.
  • compression: Especifica si deberá aplicarse un algoritmo de descompresión a los datos ("zip", "gzip", etc.)

Por otro lado, el método pandas.Series.to_csv permite almacenar una serie en un fichero con formato CSV, incluyéndose igualmente gran cantidad de argumentos para controlar cómo hacer el volcado. El método equivalente para dataframes es pandas.DataFrame.to_csv.