Un poco de vocabulario

Repasemos el vocabulario que utiliza Tableau para todos estos conceptos: hemos visto que podemos leer datos (una o más tablas) de un fichero Excel, por ejemplo, y que el resultado será un modelo de datos normalizado, desnormalizado o mixto. Pues bien, Tableau llama a ese conjunto de datos fuente de datos. Ahora ya podemos decir que para crear una fuente de datos deberemos crear -al menos- una conexión a un fichero o a un servidor.

Una fuente de datos puede "alimentarse" a partir de un único fichero (o de un servidor), o de más de uno. O, dicho correctamente, una fuente de datos puede implicar una o más conexiones. Por ejemplo, podemos tener información de las ventas en un libro Excel, información de los productos en una base de datos Oracle, e información de los clientes en un servidor Salesforce. Si todas las tablas que seleccione de cada una de esas tres conexiones están relacionadas con la tabla de hechos (la tabla de ventas en el ejemplo que estamos viendo), el resultado será una fuente de datos.

Podemos cargar en Tableau más de una fuente de datos (para crear más de un modelo de datos), cada una con sus propias conexiones. Las fuentes de datos son, por defecto, independientes entre sí, pero si existe una relación lógica entre ellas (y campos comunes que permitan relacionarlas de forma efectiva) es posible configurar una fuente de datos como primaria y el resto como secundarias.

Es importante añadir que el nombre de fuente de datos se utiliza en Tableau de forma un tanto confusa. Si pienso en una fuente de datos me imagino el fichero o servidor en el que se encuentran los datos originales, no en un conjunto de ficheros o servidores en los que se reparte la información que me interesa, ni pienso en el resultado de la combinación de diferentes tablas potencialmente procedentes de diferentes orígenes. Trabajando con Tableau debemos interpretar el concepto de fuente de datos como "fuente" que va a alimentar los informes que generemos, fuente que estará compuesta por una o más conexiones, cada una a un fichero o a un servidor.

A lo largo de este tutorial usaremos el término fuente de datos tanto para referirnos a ese conjunto de conexiones como al modelo de datos resultante.