Do curso: Python para Ciência de Dados: Formação Básica

Acesse o curso completo hoje mesmo

Cadastre-se hoje mesmo e acesse mais de 23.200 cursos criados por especialistas.

Método KMeans

Método KMeans

Neste capítulo, nós vamos ver 3 métodos de clusterização: K-Means, clusterização hierárquica e KNN. Mais tarde eu vou explicar o funcionamento de cada um deles, mas vamos começar pelo k-Means. K-Means é um método não supervisionado que permite a identificação de grupos nos nossos dados. Um ponto importante em relação ao K-Means é que você precisa ter ideia da quantidade de clusters que os seus dados vão formar antes de usar o modelo. As predições do K-Means são baseadas em 2 fatores: 1, o número de centroides, ou seja, o número de grupos que você está querendo encontrar e 2, na medida da distância entre o centroide e as observações. É possível usar o K-Means em casos de modelagem de custo de mercado, segmentação de usuário e caso de detecção de fraude em pedidos de seguro. É importante lembrar que ao usar o K-Means que você precisa: 1, colocar as variáveis em escala antes de customizar seus dados e 2, caso você não faça ideia de quantos clusters…

Conteúdos