Ir para o conteúdo principal
Ir para o painel
Não sabe por onde começar? Faça um pequeno teste para receber recomendações personalizadas.
Aula 11 de 16
Google Sheets: Limpeza de dados
Jornalismo de Dados
Guia Rápido de Pesquisa em Conjunto de Dados
Public Data Explorer: Acesse um mundo de dados.
Google Trends: Entendendo os dados.
Google Data GIF Maker
Google Sheets: Visualização de dados
Visualizando os Dados: Modelos do Flourish.
Fonte de Dados: Global Forest Watch
Google Sheets: Extração de dados da internet
Visualizando os Dados: Tilegramas Avançados.
check_box_outline_blank Jornalismo de Dados: Take the Quiz
Curso
0% concluído
5 minutos para concluir

Google Sheets: Limpeza de dados

CleaningData_Overview_1pa7Mmc.jpg

Prepare seus dados para análise e visualização.

CleaningData_Overview_1pa7Mmc.jpg

Visão global da aula

CleaningData_Overview.jpg

Aprenda a limpar os dados na preparação para visualização.


Na aula anterior, Google Sheets: Extração de dados da internet, aprendemos como importar uma tabela da internet usando o importHTML. Nesta aula, vamos aprender como limpar os dados para prepará-los para análise e visualização.

  1. Tornar os dados editáveis.
  2. Editar os dados. 
  3. Editar em lote com Encontrar e substituir.


Para mais aulas sobre Jornalismo de Dados, visite:

newsinitiative.withgoogle.com/training/course/data-journalism


CleaningData_Overview.jpg

Tornar os dados editáveis.

“Limpar os dados” significa torná-los utilizáveis para trabalho assegurando-se que a tabela possui integridade, está livre de inconsistências e está estruturada de uma forma que os computadores possam entender. Isto quer dizer que vamos remover linhas duplicadas, deletar caracteres indesejáveis e assegurar que as colunas possuam somente um tipo de dados, por exemplo, números ou texto, mas não ambos. Primeiro, precisamos tornar os dados editáveis.


Esta tabela mostra o resultado de importHTML. Neste formato, qualquer mudança na fonte dos dados (a página da Wikipedia) será automaticamente refletida aqui, sendo atualizada pelo menos uma vez por hora. No entanto, não podemos editar os valores nas células para remover caracteres indesejados. Nós usaremos colar especial no Google Sheets para criar um instantâneo estático dos dados. Assim, perderemos a habilidade de atualizar automaticamente a tabela através do importHTML. mas conseguiremos editá-la. 


Selecione todos os dados clicando com o lado esquerdo do mouse no retângulo superior esquerdo na sua planilha. Quando todas as células estiverem selecionadas, clique em Editar > Copiar. Selecione Editar > Copiar especial > Copiar somente valores.  Agora podemos editar a tabela. 


Para tornar a edição mais fácil, vamos congelar a linha com o nome das colunas. Posicione o cursor do mouse na linha acima da linha 1, sobre a barra cinza. Você notará que o cursor se transformará em uma luva. Arraste a barra para o final da linha 1 e deixe-a aí. Agora a linha está congelada.

Editar os dados.

importHTML importará caracteres sobressalentes da tabela da Wikipedia que são úteis para as pessoas, mas não para os computadores. Vamos removê-los e deixar a nossa tabela mais limpa!


Como não precisamos da coluna F para este exercício, clique como o lado direito do mouse sobre a letra F no topo da coluna e selecione Deletar.


Há uma letra “F” ao lado do número 13 na linha A14, e um “TS3” ao lado do número 4 na célula B27. Vamos remover estes caracteres de forma que permaneçam somente os números 13 e 4.


Remova as letras extras nas células B40 e B48, permanecendo somente os números 19 e 8. Faça o mesmo na célula D17 para remover o “F8” inicial.

Editar em lote com Encontrar e substituir.

Agora, dê uma olhada na coluna C. Vamos remover o caractere * inicial e final em lote, em vez de linha por linha, usando a funcionalidade Encontrar e substituir.


Selecione a coluna C clicando com o lado esquerdo do mouse sobre a letra C no topo da coluna. Selecione Editar > Encontrar e substituir.


Digite o símbolo * na primeira caixa de texto (este é o caractere que queremos encontrar na coluna C). Deixe a caixa de texto Substituir por vazia para que os asteriscos sejam substituídos por nada, o que quer dizer que serão deletados. 


Assegure-se que a opção Buscar mostra Intervalo específico e que o intervalo reflete a coluna que você acabou de selecionar. Deixe as caixas de seleção em branco. 


Selecione Substituir todos.Note que o Google Sheets informará que 100 ocorrências de * foram substituídas por (nada). Isto quer dizer que você removeu com sucesso 100 caracteres em 50 linhas com apenas uns poucos cliques! 


Selecione Concluído. Agora, nossa tabela está limpa e pronta para ser usada. Na próxima aula, desenvolveremos visualizações e tiraremos conclusões sobre os dados. 

Parabéns!

VisualizingData_overview.jpg

Você completou “Google Sheets: Limpeza de dados.”

Para continuar desenvolvendo suas habilidades de jornalismo digital e para trabalhar para conseguir a certificação da Google News Initiative, acesse o nosso site do Centro de Treinamento e faça outra aula:


Para mais aulas sobre Jornalismo de Dados, visite:

newsinitiative.withgoogle.com/training/course/data-journalism


VisualizingData_overview.jpg
Parabéns! Você terminou Google Sheets: Limpeza de dados Sim, está em andamento
Recomendado para você
Como você classifica esta aula?
Seu feedback nos ajuda a continuar melhorando as aulas.
Sair e perder o progresso?
Ao sair desta página, você perderá todo o progresso dessa aula. Você quer mesmo continuar e perder seu progresso?