Projeto Maestro – Tableau – Preparação de Dados

Projeto Maestro – Tableau – Preparação de Dados

Fonte: SENTURUS

 

Você já precisou fazer um pouco mais do que o que é fornecido na guia Fonte de Dados do Tableau? Se você não é um especialista em SQL, como você faz a preparação necessária para tornar seu quadro de dados amigável? No passado, você recorreu ao dumping de dados para um arquivo .csv ou Excel e usando o Excel para "limpeza" antes de trazer dados para o Tableau? E se você tiver várias fontes? Certo, algumas coisas podem ser feitas no Tableau Desktop usando recursos como junções de banco de dados cruzados e pivôs, mas pode ser difícil gerar etapas repetitivas que podem ser usadas para transformar seus dados. E as etapas manuais podem ser difíceis de documentar e compartilhar com os outros. Se esses cenários são dolorosamente familiares para você, o Project Maestro pode ser exatamente o que o médico (Tableau) ordenou.

Projeto Maestro foi anunciado pelo Tableau na conferência TC17 (Tableau Conference 2017). De acordo com o Tableau, "o Projeto Maestro tornará possível para mais pessoas, desde TI a usuários empresariais, preparar facilmente seus dados com uma abordagem direta e visual".

Eu tive recentemente a chance de participar do programa Beta para o Projeto Maestro. Embora talvez não seja tão caracterizado como algumas ferramentas ETL (extrato, transformação e carga), como a Informatica e a Alteryx, o Projeto Maestro tem alguns recursos realmente agradáveis ​​que facilitam a vida para cenários ETL relativamente simples. Para lhe dar uma ideia do que está por vir com o Maestro, aqui está uma lista dos meus 10 recursos favoritos.

  1. Juntando fontes de dados dispersas. Por algum tempo, um dos pontos fortes de Tableau foi sua capacidade de se juntar a várias fontes de dados. Com o Tableau Desktop, você pode combinar fontes por "unir" ou "misturar". Da mesma forma, com o Maestro você pode combinar uma tabela Oracle, uma tabela do SQL Server e uma planilha do Microsoft Excel em uma fonte de dados com apenas alguns cliques. A diferença entre Maestro e Tableau Desktop está na apresentação e na quantidade de opções disponíveis. Com Maestro você adiciona conexões. Se a conexão for um banco de dados, como o SQL Server, você especifica o esquema, as tabelas e quais as colunas em que deseja inserir. Uma vez que você tenha configurado suas origens, trace uma linha entre elas e adicione uma associação. Isso é semelhante à forma como outras ferramentas ETL se juntam. Deve salientar-se que fazer estas junções é frequentemente mais fácil de dizer do que de fazer. Quando não lida com dados simples como Supermercado de amostra do Tableau, as junções podem ser complicadas. Isto é muitas vezes devido a diferenças no nível de detalhes, dados incompatíveis, etc. Mas se você tiver um cenário relativamente simples, juntar-se a fontes diferentes pode ser realizado no Maestro. Nota: Atualmente, a seleção inicial de esquemas e tabelas não é tão intuitiva quanto com algumas fontes de dados como a Oracle, mas este é um produto Beta. Como é o caso do Tableau Desktop, estou certo de que cada versão verá melhorias nesta área.
  2. Participe e resultados da união. Com Tableau Desktop você pode juntar dados de dados e de união. Ao fazer uma união ou união no Tableau Desktop, a parte inferior da guia Fonte de dados mostrará o resultado. Mas muitas vezes você quer ver os resultados do que se juntou (dada sua condição de junção) E o que não fez. No Maestro, você obtém um Resumo dos Resultados de Junção que mostra valores incomparáveis. Esse recurso pode ser muito útil para avaliar / eliminar condições de junção e para validar dados.

 

  • Abra uma amostra no Tableau. Depois de ter feito um "passo" para transformar seus dados, você pode usar Abrir uma amostra no Tableau para verificar os dados no Tableau Desktop. Este recurso fornece uma maneira rápida de validar os dados produzidos pela etapa. Nota: eu encontrei alguns problemas aqui. Algumas etapas pareciam ter um problema na abertura da área de trabalho mesmo após 30 minutos ...

  • Dados agregados. O Tableau Desktop oferece várias maneiras de agregar ou resumir dados. Por exemplo, você pode criar um extrato de Tableau e selecionar Dados Agregados para dimensões visíveis , ou você pode usar conjuntos ou grupos para agregar dados e resumir em algo como Total de Vendas por Região. Mas, se você quiser apenas uma rápida agregação de seus dados para armazenar em uma fonte de dados ou TDE, você pode fazer isso facilmente com o Projeto Maestro. No Maestro, você pode adicionar um passo para agregar e simplesmente arrastar e soltar seus campos agrupados e seus campos agregados. No exemplo abaixo, cada " Descrição " possui uma linha que resume as " Peças " e " Quantidade Vendida ".
  • Wildcard Union. Às vezes você quer combinar arquivos semelhantes em uma fonte de dados (ou seja, arquivos de vendas mensais). No Tableau Desktop você pode fazer uma União para realizar isso. O Maestro leva isso para o próximo nível fornecendo Uniões de curinga . Com Uniões curingas, você especifica um caminho ou diretório de arquivo e unia todos os arquivos que estão nesse local ( arquivos irrelevantes podem ser excluídos ). Você pode então mesclar esses arquivos em um.

    O arquivo mesclado resultante contém uma coluna de Caminhos de Arquivos que contém o caminho do arquivo da fonte original. Ao fazer sindicatos, você também pode mesclar campos similares com nomes diferentes. Veja abaixo um exemplo que descreve vários arquivos .csv de aprovação presidencial que foram mesclados usando o recurso Wildcard Union. As duas colunas na extrema direita são as mesmas (apenas denominadas de forma diferente). Por isso, eles podem ser selecionados e mesclados usando Mesclar Campos.
  • Pivô para tabelas de banco de dados. No Tableau Desktop, você pode girar dados em arquivos Excel ou .csv. Se você deseja reestruturar ou dinamicar dados armazenados em um banco de dados, como o SQL Server ou o Oracle, você deve criar uma nova tabela ou usar o CUSTOM SQL. No Maestro, "pivô" parece ser uma opção válida para tabelas de banco de dados. Abaixo estão exemplos de pivôs usando uma tabela do SQL Server e uma tabela do Oracle como fontes de dados.
  • Editar ou Limpar Dados. Este é um grande, e tem muitos casos de uso. Muitas vezes, quando você traz dados no Tableau, os problemas de integridade dos dados se tornam evidentes. Não seria bom limpar rapidamente seus dados antes de trazê-lo para o Tableau? Digamos que a maioria dos seus estados foram colocados usando uma abreviatura de capital de 2 caracteres como o AZ, mas alguns estados foram totalmente esclarecidos. Idealmente, você corrigiria os problemas de integridade de dados na fonte. Mas às vezes você só precisa de uma solução rápida. Com Maestro agora você pode editar valores. Ver abaixo:
  • Agrupe e Substitua. Digamos que você tenha os seguintes valores "EUA", "Estados Unidos" e "EUA" etc. Você sabe que estes são todos os EUA e eles devem ser agrupados. Atualmente, você pode agrupar estes no Tableau Desktop ou corrigir seus dados na fonte. Com o Project Maestro, você também tem uma opção para Agrupar e Substituir , salvando seu novo agrupamento como parte de sua fonte de dados. Veja abaixo um exemplo.
  • Perfil de dados. No painel Fonte de dados do Tableau Desktop, os dados do nível da linha são exibidos na parte inferior da tela, mas você não pode ver como os dados são distribuídos. Com o Projeto Maestro, a tela é dividida em três painéis: o painel superior possui um fluxo de dados ou uma representação gráfica do fluxo de trabalho, o painel do meio possui um resumo ou perfil de dados e o painel inferior exibe os dados do nível da linha. A seção de perfil no meio tem histogramas para descrever a freqüência de valores dentro das colunas, tornando muito fácil ver como os dados são distribuídos. Ver abaixo:
  • Representação gráfica das etapas tomadas para transformar dados. Como você pode ver acima, as etapas tomadas para transformar os dados são representadas graficamente e colocadas em um fluxo auto-documentado. Você também pode clicar em qualquer uma das etapas para ver como os dados se parecem em qualquer etapa de transformação. Isso é o que as ferramentas ETL mais complexas têm feito há anos e é realmente útil. Essas etapas podem ser compartilhadas e executadas como um "fluxo", que cria um Extrato de Dados do Tableau ou TDE.
Clique para conhecer o curso de TABLEAU na Aprenda Virtual

 

 

Nenhum Comentário

Escrever um Comentário