← Voltar ao Curso

Aula 4 - Guia do Instrutor

25/09

Limpeza e Transformação de Dados

Guia completo para instrutor iniciante - Técnicas avançadas do Power Query

Aula 4
Duração: 2 horas

Cronograma da Aula (120 minutos)

0-15 min

Revisão e Introdução

15-45 min

Técnicas de Limpeza

45-75 min

Transformações de Colunas

75-105 min

Operações com Linhas

105-120 min

Exercícios e Revisão

IMPORTANTE: Preparação Antes da Aula

1

Prepare arquivo com dados "sujos":

Crie 'dados_vendas_sujos.xlsx' com valores nulos, duplicatas, tipos incorretos e colunas desnecessárias

2

Teste as transformações:

Pratique todas as operações que ensinará: remover duplicatas, dividir colunas, alterar tipos

3

Prepare dados de exemplo:

Tenha exemplos de dados com problemas comuns: datas em formato texto, nomes com espaços extras

Script de Introdução (0-15 min)

Fale exatamente assim:

"Bom dia, pessoal! Na aula passada aprendemos sobre Power Query e modos de conectividade. Quem lembra qual é a diferença entre Import e DirectQuery?"

(Aguarde respostas e reforce: Import traz dados para o Power BI, DirectQuery consulta direto na fonte)

"Perfeito! Hoje vamos aprender algo fundamental: como limpar e transformar dados. Vocês sabiam que 80% do trabalho de um analista de dados é limpar os dados?"

"Imaginem que vocês receberam uma planilha do setor comercial. Tem nomes de clientes com espaços extras, datas escritas como texto, valores duplicados... É um caos! Mas não se preocupem, o Power Query vai resolver tudo isso."

"Hoje vocês vão aprender a ser 'faxineiros de dados' profissionais. Vamos transformar dados bagunçados em informações limpas e organizadas!"

Técnicas de Limpeza de Dados (15-45 min)

Demonstração 1: Removendo Valores Nulos (8 min)

Diga aos alunos: "Vamos abrir nosso arquivo com dados sujos. Vejam que temos várias células vazias."

Passo a passo:

  1. "Cliquem na seta da coluna que tem valores vazios"
  2. "Vejam que aparece '(null)' na lista. Desmarquem essa opção"
  3. "Cliquem OK. Pronto! Removemos todas as linhas com valores vazios"
  4. "Observem que apareceu uma nova etapa: 'Linhas Filtradas'"

💡 Dica: Explique que também podem usar 'Remover Linhas' > 'Remover Linhas Vazias'

Demonstração 2: Removendo Duplicatas (7 min)

Explique: "Agora vamos remover linhas duplicadas. Isso é muito comum em dados reais."

Instruções:

  1. "Vão na aba 'Início' do Power Query"
  2. "Cliquem em 'Remover Linhas' > 'Remover Duplicatas'"
  3. "Vejam que o Power Query automaticamente removeu as linhas idênticas"
  4. "Observem o número de linhas antes e depois na parte inferior"

⚠️ Atenção: Explique que duplicatas são baseadas em TODAS as colunas

Demonstração 3: Limpando Texto (8 min)

Cenário: "Vejam que os nomes dos clientes têm espaços extras no início e fim."

Solução passo a passo:

  1. "Selecionem a coluna com nomes"
  2. "Vão na aba 'Transformar'"
  3. "Cliquem em 'Formato' > 'Cortar'"
  4. "Pronto! Removeu espaços extras do início e fim"
  5. "Também podem usar 'Limpar' > 'Limpar Texto' para casos mais complexos"

💡 Outras opções: Maiúsculas, Minúsculas, Primeira Letra Maiúscula

Demonstração 4: Alterando Tipos de Dados (7 min)

Problema comum: "Vejam que a coluna 'Data' está como texto, não como data."

Como corrigir:

  1. "Cliquem no ícone do tipo de dados na coluna (ABC123)"
  2. "Escolham 'Data' na lista"
  3. "Se der erro, é porque o formato está diferente"
  4. "Nesse caso, usem 'Transformar' > 'Data e Hora' > 'Analisar'"

🔧 Tipos comuns: Texto, Número Inteiro, Número Decimal, Data, Data/Hora

Transformações de Colunas (45-75 min)

Operação 1: Dividir Colunas (10 min)

Cenário: "Temos uma coluna 'Nome Completo' e queremos separar em 'Nome' e 'Sobrenome'."

Demonstração:

  1. "Selecionem a coluna 'Nome Completo'"
  2. "Vão em 'Transformar' > 'Dividir Coluna' > 'Por Delimitador'"
  3. "Escolham 'Espaço' como delimitador"
  4. "Marquem 'Na primeira ocorrência do delimitador'"
  5. "Cliquem OK. Agora temos duas colunas!"

💡 Outros delimitadores: vírgula, ponto e vírgula, hífen, caractere personalizado

Operação 2: Mesclar Colunas (8 min)

Cenário: "Agora vamos fazer o contrário: juntar 'Cidade' e 'Estado' em 'Localização'."

Passo a passo:

  1. "Selecionem as colunas 'Cidade' e 'Estado' (Ctrl+clique)"
  2. "Vão em 'Transformar' > 'Mesclar Colunas'"
  3. "Escolham ' - ' como separador"
  4. "Nomeiem a nova coluna como 'Localização'"
  5. "Cliquem OK"

🔧 Separadores comuns: espaço, hífen, vírgula, sem separador

Operação 3: Renomear Colunas (5 min)

Importância: "Nomes de colunas claros facilitam a criação de relatórios."

Como fazer:

  1. "Duplo clique no nome da coluna"
  2. "Digite o novo nome"
  3. "Pressione Enter"
  4. "Ou clique com botão direito > 'Renomear'"

📝 Dica: Use nomes descritivos sem espaços especiais ou acentos

Operação 4: Adicionar Colunas Calculadas (7 min)

Exemplo: "Vamos criar uma coluna 'Faturamento' multiplicando 'Quantidade' por 'Preço'."

Procedimento:

  1. "Vão na aba 'Adicionar Coluna'"
  2. "Cliquem em 'Coluna Personalizada'"
  3. "Nomeiem como 'Faturamento'"
  4. "Na fórmula, digitem: [Quantidade] * [Preço]"
  5. "Cliquem OK"

⚡ Operações: +, -, *, /, & (concatenar), funções como Date.Year([Data])

Operações com Linhas (75-105 min)

Operação 1: Filtrar Dados (10 min)

Cenário: "Queremos ver apenas vendas acima de R$ 1.000."

Como filtrar:

  1. "Cliquem na seta da coluna 'Valor'"
  2. "Escolham 'Filtros de Número' > 'Maior que'"
  3. "Digitem 1000"
  4. "Cliquem OK"
  5. "Vejam que só aparecem vendas acima de R$ 1.000"

🔍 Outros filtros: Igual a, Diferente de, Entre, Primeiros N, Últimos N

Operação 2: Classificar Dados (8 min)

Objetivo: "Vamos ordenar por data, da mais recente para a mais antiga."

Passos:

  1. "Cliquem na seta da coluna 'Data'"
  2. "Escolham 'Classificar em Ordem Decrescente'"
  3. "Para classificação múltipla: 'Início' > 'Classificar' > 'Classificar Colunas'"
  4. "Adicionem critérios secundários se necessário"

📊 Dica: Classificação múltipla é útil para ordenar por região, depois por vendedor

Operação 3: Agrupar Dados (12 min)

Exemplo: "Vamos agrupar vendas por vendedor e calcular o total."

Procedimento detalhado:

  1. "Vão em 'Transformar' > 'Agrupar Por'"
  2. "Em 'Agrupar por', escolham 'Vendedor'"
  3. "Em 'Nova coluna', digitem 'Total_Vendas'"
  4. "Em 'Operação', escolham 'Soma'"
  5. "Em 'Coluna', escolham 'Valor'"
  6. "Cliquem OK"

📈 Operações disponíveis: Soma, Média, Mínimo, Máximo, Contar Linhas, Contar Valores Distintos

Exercícios Práticos (105-120 min)

Exercício Final: Limpeza Completa (15 min)

Desafio: "Agora vocês vão limpar um arquivo completo sozinhos!"

Tarefas a realizar:

  1. Remover linhas com valores nulos na coluna 'Cliente'
  2. Remover duplicatas
  3. Dividir coluna 'Endereço Completo' em 'Rua' e 'Número'
  4. Alterar tipo da coluna 'Data_Venda' para Data
  5. Criar coluna 'Lucro' = Valor - Custo
  6. Filtrar apenas vendas do último trimestre
  7. Agrupar por 'Produto' e somar 'Quantidade'

⏰ Tempo: 15 minutos. Circulem pela sala ajudando quem precisar!

Solução de Problemas Comuns

Problema: "Erro ao alterar tipo de dados"

Solução: Primeiro limpe o texto (remover espaços, caracteres especiais), depois altere o tipo.

Problema: "Divisão de coluna não funcionou"

Solução: Verifique se o delimitador está correto. Use 'Por Posições' se o delimitador for inconsistente.

Problema: "Agrupamento retornou valores estranhos"

Solução: Verifique se a coluna de valores está no tipo correto (número, não texto).

Problema: "Muitas etapas aplicadas, como desfazer?"

Solução: Clique na etapa anterior em 'Etapas Aplicadas' ou delete etapas desnecessárias.

Perguntas Frequentes

P: "Posso desfazer uma transformação depois de aplicar?"

R: Sim! Clique na etapa anterior em 'Etapas Aplicadas' ou delete a etapa indesejada.

P: "As transformações afetam o arquivo original?"

R: Não! O Power Query nunca altera o arquivo original. Todas as transformações ficam salvas no arquivo .pbix.

P: "Posso aplicar as mesmas transformações em outros arquivos?"

R: Sim! Você pode copiar etapas entre consultas ou criar funções personalizadas.

P: "O que acontece se os dados originais mudarem?"

R: Basta clicar em 'Atualizar' no Power BI que todas as transformações serão reaplicadas automaticamente!

Dicas Importantes para o Instrutor

1

Sempre demonstre primeiro:

Faça cada transformação na sua tela antes de pedir para os alunos repetirem.

2

Enfatize o conceito de etapas:

Explique que cada ação vira uma etapa e pode ser desfeita. Isso reduz o medo de errar.

3

Use dados realistas:

Dados com problemas reais (nulos, duplicatas, tipos errados) tornam o aprendizado mais relevante.

4

Circule pela sala:

Durante os exercícios, caminhe entre os alunos para identificar dificuldades rapidamente.

Dados de Exemplo para Prática

Arquivo: dados_vendas_sujos.xlsx

Crie este arquivo Excel antes da aula com dados propositalmente "sujos":

Cliente Produto Quantidade Preço Data_Venda Vendedor
João Silva Notebook 1 2500 15/03/2024 Ana
Maria Santos Mouse 2 50 16-03-2024 Carlos
Teclado 1 150 17/03/24 Ana
João Silva Notebook 1 2500 15/03/2024 Ana
Pedro Costa Monitor dois 800 18/03/2024 Carlos

Problemas incluídos propositalmente:

  • Espaços extras nos nomes (" João Silva ")
  • Linha com cliente vazio
  • Linha duplicada (João Silva)
  • Formatos de data inconsistentes
  • Quantidade como texto ("dois")
  • Tipos de dados incorretos
← Aula Anterior

Aula 4 de 16

Limpeza e Transformação de Dados

Próxima Aula →