Limpeza e Transformação de Dados
Guia completo para instrutor iniciante - Técnicas avançadas do Power Query
Cronograma da Aula (120 minutos)
0-15 min
Revisão e Introdução
15-45 min
Técnicas de Limpeza
45-75 min
Transformações de Colunas
75-105 min
Operações com Linhas
105-120 min
Exercícios e Revisão
IMPORTANTE: Preparação Antes da Aula
Prepare arquivo com dados "sujos":
Crie 'dados_vendas_sujos.xlsx' com valores nulos, duplicatas, tipos incorretos e colunas desnecessárias
Teste as transformações:
Pratique todas as operações que ensinará: remover duplicatas, dividir colunas, alterar tipos
Prepare dados de exemplo:
Tenha exemplos de dados com problemas comuns: datas em formato texto, nomes com espaços extras
Script de Introdução (0-15 min)
Fale exatamente assim:
"Bom dia, pessoal! Na aula passada aprendemos sobre Power Query e modos de conectividade. Quem lembra qual é a diferença entre Import e DirectQuery?"
(Aguarde respostas e reforce: Import traz dados para o Power BI, DirectQuery consulta direto na fonte)
"Perfeito! Hoje vamos aprender algo fundamental: como limpar e transformar dados. Vocês sabiam que 80% do trabalho de um analista de dados é limpar os dados?"
"Imaginem que vocês receberam uma planilha do setor comercial. Tem nomes de clientes com espaços extras, datas escritas como texto, valores duplicados... É um caos! Mas não se preocupem, o Power Query vai resolver tudo isso."
"Hoje vocês vão aprender a ser 'faxineiros de dados' profissionais. Vamos transformar dados bagunçados em informações limpas e organizadas!"
Técnicas de Limpeza de Dados (15-45 min)
Demonstração 1: Removendo Valores Nulos (8 min)
Diga aos alunos: "Vamos abrir nosso arquivo com dados sujos. Vejam que temos várias células vazias."
Passo a passo:
- "Cliquem na seta da coluna que tem valores vazios"
- "Vejam que aparece '(null)' na lista. Desmarquem essa opção"
- "Cliquem OK. Pronto! Removemos todas as linhas com valores vazios"
- "Observem que apareceu uma nova etapa: 'Linhas Filtradas'"
💡 Dica: Explique que também podem usar 'Remover Linhas' > 'Remover Linhas Vazias'
Demonstração 2: Removendo Duplicatas (7 min)
Explique: "Agora vamos remover linhas duplicadas. Isso é muito comum em dados reais."
Instruções:
- "Vão na aba 'Início' do Power Query"
- "Cliquem em 'Remover Linhas' > 'Remover Duplicatas'"
- "Vejam que o Power Query automaticamente removeu as linhas idênticas"
- "Observem o número de linhas antes e depois na parte inferior"
⚠️ Atenção: Explique que duplicatas são baseadas em TODAS as colunas
Demonstração 3: Limpando Texto (8 min)
Cenário: "Vejam que os nomes dos clientes têm espaços extras no início e fim."
Solução passo a passo:
- "Selecionem a coluna com nomes"
- "Vão na aba 'Transformar'"
- "Cliquem em 'Formato' > 'Cortar'"
- "Pronto! Removeu espaços extras do início e fim"
- "Também podem usar 'Limpar' > 'Limpar Texto' para casos mais complexos"
💡 Outras opções: Maiúsculas, Minúsculas, Primeira Letra Maiúscula
Demonstração 4: Alterando Tipos de Dados (7 min)
Problema comum: "Vejam que a coluna 'Data' está como texto, não como data."
Como corrigir:
- "Cliquem no ícone do tipo de dados na coluna (ABC123)"
- "Escolham 'Data' na lista"
- "Se der erro, é porque o formato está diferente"
- "Nesse caso, usem 'Transformar' > 'Data e Hora' > 'Analisar'"
🔧 Tipos comuns: Texto, Número Inteiro, Número Decimal, Data, Data/Hora
Transformações de Colunas (45-75 min)
Operação 1: Dividir Colunas (10 min)
Cenário: "Temos uma coluna 'Nome Completo' e queremos separar em 'Nome' e 'Sobrenome'."
Demonstração:
- "Selecionem a coluna 'Nome Completo'"
- "Vão em 'Transformar' > 'Dividir Coluna' > 'Por Delimitador'"
- "Escolham 'Espaço' como delimitador"
- "Marquem 'Na primeira ocorrência do delimitador'"
- "Cliquem OK. Agora temos duas colunas!"
💡 Outros delimitadores: vírgula, ponto e vírgula, hífen, caractere personalizado
Operação 2: Mesclar Colunas (8 min)
Cenário: "Agora vamos fazer o contrário: juntar 'Cidade' e 'Estado' em 'Localização'."
Passo a passo:
- "Selecionem as colunas 'Cidade' e 'Estado' (Ctrl+clique)"
- "Vão em 'Transformar' > 'Mesclar Colunas'"
- "Escolham ' - ' como separador"
- "Nomeiem a nova coluna como 'Localização'"
- "Cliquem OK"
🔧 Separadores comuns: espaço, hífen, vírgula, sem separador
Operação 3: Renomear Colunas (5 min)
Importância: "Nomes de colunas claros facilitam a criação de relatórios."
Como fazer:
- "Duplo clique no nome da coluna"
- "Digite o novo nome"
- "Pressione Enter"
- "Ou clique com botão direito > 'Renomear'"
📝 Dica: Use nomes descritivos sem espaços especiais ou acentos
Operação 4: Adicionar Colunas Calculadas (7 min)
Exemplo: "Vamos criar uma coluna 'Faturamento' multiplicando 'Quantidade' por 'Preço'."
Procedimento:
- "Vão na aba 'Adicionar Coluna'"
- "Cliquem em 'Coluna Personalizada'"
- "Nomeiem como 'Faturamento'"
- "Na fórmula, digitem: [Quantidade] * [Preço]"
- "Cliquem OK"
⚡ Operações: +, -, *, /, & (concatenar), funções como Date.Year([Data])
Operações com Linhas (75-105 min)
Operação 1: Filtrar Dados (10 min)
Cenário: "Queremos ver apenas vendas acima de R$ 1.000."
Como filtrar:
- "Cliquem na seta da coluna 'Valor'"
- "Escolham 'Filtros de Número' > 'Maior que'"
- "Digitem 1000"
- "Cliquem OK"
- "Vejam que só aparecem vendas acima de R$ 1.000"
🔍 Outros filtros: Igual a, Diferente de, Entre, Primeiros N, Últimos N
Operação 2: Classificar Dados (8 min)
Objetivo: "Vamos ordenar por data, da mais recente para a mais antiga."
Passos:
- "Cliquem na seta da coluna 'Data'"
- "Escolham 'Classificar em Ordem Decrescente'"
- "Para classificação múltipla: 'Início' > 'Classificar' > 'Classificar Colunas'"
- "Adicionem critérios secundários se necessário"
📊 Dica: Classificação múltipla é útil para ordenar por região, depois por vendedor
Operação 3: Agrupar Dados (12 min)
Exemplo: "Vamos agrupar vendas por vendedor e calcular o total."
Procedimento detalhado:
- "Vão em 'Transformar' > 'Agrupar Por'"
- "Em 'Agrupar por', escolham 'Vendedor'"
- "Em 'Nova coluna', digitem 'Total_Vendas'"
- "Em 'Operação', escolham 'Soma'"
- "Em 'Coluna', escolham 'Valor'"
- "Cliquem OK"
📈 Operações disponíveis: Soma, Média, Mínimo, Máximo, Contar Linhas, Contar Valores Distintos
Exercícios Práticos (105-120 min)
Exercício Final: Limpeza Completa (15 min)
Desafio: "Agora vocês vão limpar um arquivo completo sozinhos!"
Tarefas a realizar:
- Remover linhas com valores nulos na coluna 'Cliente'
- Remover duplicatas
- Dividir coluna 'Endereço Completo' em 'Rua' e 'Número'
- Alterar tipo da coluna 'Data_Venda' para Data
- Criar coluna 'Lucro' = Valor - Custo
- Filtrar apenas vendas do último trimestre
- Agrupar por 'Produto' e somar 'Quantidade'
⏰ Tempo: 15 minutos. Circulem pela sala ajudando quem precisar!
Solução de Problemas Comuns
Problema: "Erro ao alterar tipo de dados"
Solução: Primeiro limpe o texto (remover espaços, caracteres especiais), depois altere o tipo.
Problema: "Divisão de coluna não funcionou"
Solução: Verifique se o delimitador está correto. Use 'Por Posições' se o delimitador for inconsistente.
Problema: "Agrupamento retornou valores estranhos"
Solução: Verifique se a coluna de valores está no tipo correto (número, não texto).
Problema: "Muitas etapas aplicadas, como desfazer?"
Solução: Clique na etapa anterior em 'Etapas Aplicadas' ou delete etapas desnecessárias.
Perguntas Frequentes
P: "Posso desfazer uma transformação depois de aplicar?"
R: Sim! Clique na etapa anterior em 'Etapas Aplicadas' ou delete a etapa indesejada.
P: "As transformações afetam o arquivo original?"
R: Não! O Power Query nunca altera o arquivo original. Todas as transformações ficam salvas no arquivo .pbix.
P: "Posso aplicar as mesmas transformações em outros arquivos?"
R: Sim! Você pode copiar etapas entre consultas ou criar funções personalizadas.
P: "O que acontece se os dados originais mudarem?"
R: Basta clicar em 'Atualizar' no Power BI que todas as transformações serão reaplicadas automaticamente!
Dicas Importantes para o Instrutor
Sempre demonstre primeiro:
Faça cada transformação na sua tela antes de pedir para os alunos repetirem.
Enfatize o conceito de etapas:
Explique que cada ação vira uma etapa e pode ser desfeita. Isso reduz o medo de errar.
Use dados realistas:
Dados com problemas reais (nulos, duplicatas, tipos errados) tornam o aprendizado mais relevante.
Circule pela sala:
Durante os exercícios, caminhe entre os alunos para identificar dificuldades rapidamente.
Dados de Exemplo para Prática
Arquivo: dados_vendas_sujos.xlsx
Crie este arquivo Excel antes da aula com dados propositalmente "sujos":
| Cliente | Produto | Quantidade | Preço | Data_Venda | Vendedor |
|---|---|---|---|---|---|
| João Silva | Notebook | 1 | 2500 | 15/03/2024 | Ana |
| Maria Santos | Mouse | 2 | 50 | 16-03-2024 | Carlos |
| Teclado | 1 | 150 | 17/03/24 | Ana | |
| João Silva | Notebook | 1 | 2500 | 15/03/2024 | Ana |
| Pedro Costa | Monitor | dois | 800 | 18/03/2024 | Carlos |
Problemas incluídos propositalmente:
- Espaços extras nos nomes (" João Silva ")
- Linha com cliente vazio
- Linha duplicada (João Silva)
- Formatos de data inconsistentes
- Quantidade como texto ("dois")
- Tipos de dados incorretos