Estatísticas tem ferramentas como esta

Na imagem acima, vemos um gráfico. Um gráfico é uma representação pictórica que mostra o relacionamento de uma variável em relação a outra.

Os gráficos são úteis porque nos permitem organizar os dados para que possamos ver rapidamente tendências e relacionamentos entre os dados. Um gráfico é apenas uma ferramenta que podemos usar para visualizar e analisar dados.

A estatística é um ramo da matemática que nos permite ter uma maneira sistemática de classificar, analisar e interpretar dados. Isso é importante porque, com as estatísticas, temos uma coleção de ferramentas prontas para fazer cada uma dessas coisas.

Imagine se você precisava reinventar uma serra sempre que precisava cortar um pedaço de madeira. Muitas pessoas chamariam serras com nomes diferentes, mesmo que fizessem a mesma coisa. Para evitar esse problema, demos à serra um nome pelo qual todos podem se referir a ela.

O mesmo acontece nas estatísticas – temos ferramentas bem conhecidas com as quais todos estão familiarizados. Uma dessas ferramentas é a média.

Embora a média seja perfeitamente capaz de se manter por conta própria, geralmente é ensinada como parte de um trio, que inclui o modo, mediana e média.

Vejamos um grupo de números para entender o que está acontecendo aqui. Imagine que você tem os números abaixo:

1, 2, 3, 3, 4, 6, 9

Digamos que queremos expressar qual número ocorre mais vezes. Seria 3, e o nome que damos a essa propriedade é mode. O modo é o número que é mais frequente em um conjunto que estamos examinando.

O número no meio de um conjunto ordenado é chamado de mediana. Para encontrar a mediana de um conjunto numérico, organize os números do menor para o maior e, em seguida, observe o número no meio. O conjunto de números acima já está organizado do menor para o maior, então o número médio também é 3.

Finalmente, a média é outra maneira de se referir à média do conjunto. Para encontrar a média, basta adicionar todos os números e dividir pelo número total de elementos no conjunto. No caso dos números acima, se somarmos todos, obteremos 28. O número total de itens no conjunto é 7, então nossa média é 4.

Por que precisamos da média?

Portanto, nesse ponto, você deve estar se perguntando por que precisamos encontrar a média de um número de qualquer maneira.

O fato é que até as próprias estatísticas são subdivididas em vários grupos. Assim como você tem ferramentas usadas para trabalhar com madeira e outras para trabalhar com metal, algumas ferramentas estatísticas são agrupadas em classes, pois são usadas para uma finalidade semelhante.

Um desses grupos nas estatísticas é chamado de estatísticas resumidas. Uma das maneiras pelas quais as estatísticas são usadas é descrever dados, e as estatísticas resumidas são uma coleção de ferramentas usadas para esse fim. Um dos itens nessa classe de ferramentas é a média.

A média é importante devido a nos ajudar a analisar o que é conhecido como distribuição. Nas estatísticas, uma distribuição é um método que usamos para examinar uma variável sobre a qual queremos informações. Usando uma distribuição, veremos os valores dessa variável e com que frequência ela ocorre.

Se coletarmos dados, um tipo comum de distribuição que vemos é a distribuição normal, que assume a forma da curva de sino:

A distribuição normal

Ou seja, a variável terá um valor comum para o qual tende, bem como um ponto de partida e um ponto final.

O que a média faz é que ela permite uma distribuição como essa e observar a tendência central da variável, que é o ponto no qual os valores da variável tendem a se agrupar.

Assim, podemos dizer que a média descreve a tendência central da distribuição.

Cálculo da média em Python

Podemos calcular manualmente a média, se tivermos um pequeno conjunto de dados numéricos, temos alguns valores para trabalhar. No entanto, quando temos centenas ou milhares de valores em um conjunto de dados, torna-se impossível calculá-lo manualmente.

Como o Python é uma linguagem “baterias incluídas”, a maneira como podemos fazer isso é usar o mean função do módulo de estatísticas no Python.

Vamos usar o mean para calcular a média do conjunto de dados numéricos que tivemos anteriormente no post:


# 1. import the statistics module
import statistics

# 2. list containing our numerical data set
numerical_data_set = [1, 2, 3, 3, 4, 6, 9]

# 3. calculate the mean
calc_mean = statistics.mean(numerical_data_set)

# 4. print our calculated mean
print("Mean is: ", calc_mean)

Nosso código consiste em uma sequência de quatro etapas que podemos usar para calcular a média:

  1. Importamos o módulo de estatísticas que contém nossa função média
  2. Criamos uma lista Python contendo o conjunto de dados numéricos do qual gostaríamos de calcular a média
  3. Calculamos a média e armazenamos o resultado em uma variável, calc_mean
  4. Produzimos nossa média calculada para que possamos obter feedback visual

Quando executamos o código, obteremos a seguinte saída:

Nosso resultado

O programa gera o mesmo valor que nossos cálculos manuais. Quando estivermos trabalhando com grandes conjuntos de dados, essa função poderá ser dimensionada para lidar com o que pudermos lançar nela.

Empacotando

Neste post, vimos o mean função em Python. Começamos discutindo as estatísticas como um todo, depois mergulhávamos profundamente na média.

Agora que você tem um sólido entendimento de estatística e os mean função no Python, você pode usá-lo em seus próprios programas.

Se você gostou deste artigo, também pode estar curioso para aprender sobre estruturas e algoritmos de dados. Se você deseja um guia passo a passo simples e claro para aprender sobre estruturas e algoritmos de dados sem precisar escrever uma única linha de código, consulte o livro Estruturas de dados sem código e algoritmos.

Leia o livro aqui:

Estruturas de dados sem código e algoritmos – Aprenda DSA sem escrever uma única linha de código | Armstrong Subero | Apress

Este livro traz uma nova perspectiva sobre algoritmos e estruturas de dados, completamente sem código. Aprenda sobre algoritmos de estrutura de dados (DSAs) sem precisar abrir seu editor de código, usar um compilador ou examinar um ambiente de desenvolvimento integrado (IDE).

Armstrong SuberoMenu de pesquisa Carrinho V Seu carrinho está vazio no momento. Acesso de prateleira apressado