Do curso: Python para Ciência de Dados: Formação Básica

Acesse o curso completo hoje mesmo

Cadastre-se hoje mesmo e acesse mais de 23.200 cursos criados por especialistas.

Transformando distribuições de dados

Transformando distribuições de dados

Para finalizar esse capítulo, vamos falar sobre colocar os nossos dados em escala. Colocar os dados em escala ajuda a evitar que variáveis com grandezas diferentes, levam a conclusões erradas. Por exemplo, imagine que você quer medir o impacto das estratégias de marketing para as campanhas de fim de ano nas vendas de uma loja. Para isso, você está comparando as vendas diárias de dezembro de 1990 e dezembro de 2016. Você percebe que em 1990, a média de valor gasto por venda aumenta, diariamente, 20 reais, e em 2016, a média de gasto diário, aumenta, diariamente, 200 reais. Será que essa diferença de 180 reais é resultado das campanhas de marketing de 2016 apenas? Não. Existem outros fatores, como o aumento do poder aquisitivo, inflação e o aumento da confiança na marca, que influenciam esses valores. Ao comparar valores de 1990 e 2016, puramente, você está tentando comparar maçãs e laranjas, porque você não colocou as suas variáveis em escala.…

Conteúdos