Violin Plot

Desarrollador
Precio
Versión
1.3.0.4
Última actualización
Valoración
4.50/5
Certificada

Los gráficos de violín como los ofrecidos por esta visualización, Violin Plot, nos permiten mostrar la distribución de una variable combinando la funcionalidad ofrecida por los clásicos gráficos de caja y los de densidad kernel (KDE).

La configuración de esta visualización es muy sencilla, apenas tres campos:

Configuración de Violin Plot

Supongamos que queremos conocer la distribución de los precios de los productos (qué precios son más o menos frecuentes, etc.). Bastaría con llevar el campo Price de nuestra tabla de productos tanto al campo Measure Data como al campo Sampling:

Violin Plot

Visualmente ya se aprecia, por ejemplo, que la mayor parte de los precios rondan los 750€ (valor del eje vertical en la zona más ancha del violín) y que hay más productos con precios bajos que con precios altos (pues la zona inferior del violín es más ancha que la zona superior).

La caja interior muestra el valor de la mediana (raya horizontal blanca) y el primer y tercer cuantil (límites inferior y superior de la caja): es decir, la caja representa el rango intercuantil de la distribución. El extremo superior e inferior de la línea vertical que se incluye en el interior del violín representan los valores máximos y mínimos de los datos, y el círculo (que, en la imagen anterior, se muestra encima de la mediana) representa el valor medio.

Si movemos el cursor encima del violín se muestra una ventana flotante con información adicional:

Violin Plot

En la imagen anterior vemos que tenemos 153 muestras (153 precios correspondientes a otros tantos productos), que el valor máximo es de 1.700€, el valor medio es de 731.54€, etc. Es posible añadir datos adicionales en Formato > Default Tooltip Details. Téngase en cuenta que estos valores hacen referencia a la estimación KDE, no a los valores en sí. Por ejemplo, el precio máximo es de 1.347€, no 1.700€ (ya se ha comentado que la línea vertical en el centro del violín sí representa esos valores mínimo y máximo).

Pero podemos estar interesados no en conocer la distribución de los precios, sino en cómo otra variable se distribuye en función de los precios. Por ejemplo, si quisiéramos saber cómo se reparten nuestros beneficios en función del precio del producto, tendríamos que llevar nuestra medida Margin (suma del beneficio derivado de cada venta) a Measure Data y dejar el campo Price (precio de cada producto) en el campo de la visualización Sampling:

Violin Plot

La visualización nos indica que los beneficios provienen principalmente de la venta de productos cuyos precios rondan los 200€ y los 800€ (aproximadamente).

Podemos, además, desglosar el violín según otra dimensión, por ejemplo, la categoría de cada producto. Para ello podemos llevar el campo Category de nuestro modelo de datos al campo Category de la visualización:

Violin Plot

Podemos comprobar cómo de un simple vistazo es posible hacerse una idea de cómo se reparten nuestros beneficios según el precio del producto y de su categoría.

Es posible aplicar colores a cada uno de los violines en Formato > Data Colors > By Category:

Violin Plot

La visualización permite un alto grado de configuración: tipo de kernel a aplicar, el bandwidth, el criterio de ordenación de las categorías, el tipo de gráfica a mostrar en el interior del violín (que, por defecto, ya hemos visto que es una "caja"), se pueden personalizar los ejes, etc.

Se trata de una visualización muy completa y altamente personalizable.

Enviado por admin el Mié, 21/08/2019 - 21:31