Do curso: Python para Ciência de Dados: Formação Básica

Acesse o curso completo hoje mesmo

Cadastre-se hoje mesmo e acesse mais de 23.100 cursos criados por especialistas.

Usando DBSCan para detectar outliers

Usando DBSCan para detectar outliers

O método da DBSCAN encontra clusters baseado na densidade de observações em determinada região, ou seja, quanto maior o aglomerado de observação juntas, mais provável que elas façam parte de um mesmo subgrupo. Dessa forma, todas as observações que estão separadas das demais podem ser consideradas Outliers. Isso também resulta em o DBSCAN ser um ótimo método para encontrar grupos de Outliers, apenas lembre-se de certificar que os Outliers não passam de 5% do seu total de observações. Antes de partirmos para demonstração de código, eu quero te mostrar 2 parâmetros importantes do DBSCAN, que são: EPS e Min-samples. O EPS define a distância máxima entre 2 amostras e você vai querer começar com um valor bem pequeno, como ponto1. Já o Min-samples é o parâmetro que define a quantidade mínima de amostras na vizinhança para que uma observação se classifique como ponto central, aqui também você vai querer definir como um valor pequeno para começar. Um…

Conteúdos