Datasets

seaborn incluye un interesante conjunto de datasets que pueden ser utilizados para probar las distintas visualizaciones. La función disponible para la carga de estos conjuntos de datos es seaborn.load_dataset, devolviendo un dataframe pandas. A lo largo de este tutorial se utilizarán algunos de estos datasets:

flights

flights = sns.load_dataset("flights")
flights.sample(5)

Dataset flights

Dataset con información sobre pasajeros transportados en avión por mes entre 1949 y 1960. Las cifras de pasajeros probablemente hacen referencia a "miles" de pasajeros (no está documentado).

titanic

titanic = sns.load_dataset("titanic")
titanic.sample(5)

Dataset titanic

Famoso conjunto de datos con información sobre los pasajeros del último viaje del Titanic, con información sobre quiénes sobrevivieron, su edad, sexo, clase en la que viajaban...

iris

iris = sns.load_dataset("iris")
iris.sample(5)

Dataset iris

Otro de los clásicos, con información de la longitud y ancho de pétalos y sépalos de 150 flores Iris de tres especies relacionadas.

tips

tips = sns.load_dataset("tips")
tips.sample(5)

Dataset tips

En este conjunto de datos hay información sobre propinas dejadas en un restaurante, con información sobre el día en el que se produjo, si fue en el almuerzo o la cena, el número de comensales, el sexo de la persona que dejó la propina, si era fumador o no...

En este enlace puedes descargar los ficheros en formato CSV contenidos en todos los datasets de seaborn.