Do curso: Python para Ciência de Dados: Formação Básica

Acesse o curso completo hoje mesmo

Cadastre-se hoje mesmo e acesse mais de 23.200 cursos criados por especialistas.

 Investigando a dispersão de uma variável

Investigando a dispersão de uma variável

Agora, vamos ver como usar o Pandas para fazer a estatística descritiva da dispersão de uma variável. Para começar, vamos importar a nossa biblioteca e, em seguida, ler mais uma vez o nosso "dataset" sobre carros. Vamos aproveitar e calcular o desvio padrão para todas as nossas variáveis. Para isso, nós podemos usar o método chamado STD, que significa "Standard Deviation". Assim como os métodos da aula passada, esse também é um método embutido do meu DataFrame. Agora, vamos ver como calcular a variância dos meus dados. Veja bem, a variância é um cálculo para dizer o quão disperso estão os meus dados, quanto espalhados eles estão em relação ao todo. O desvio padrão, por sua vez, é calculado como a raiz quadrada da variância. A vantagem de usar o desvio padrão ao invés da variância é que o desvio padrão geralmente está na mesma medida que os seus dados. Você pode notar, por exemplo, que a variância do "disp" é um número muito mais elevado do que o…

Conteúdos