Entenda o que é Estatística: Definição, Tipos e a Importância

estatística é o campo da matemática que estuda fatos e números havendo um conjunto de métodos que possibilita a coleta de dados e analise destes, sendo assim, cria a possibilidade de realizar alguma interpretação deles, algo que começou a ser estudado pelos matemáticos franceses Pierre de Fermat e Blaise Pascal em 1654.

A estatística pode ser dividia em dois conceitos: estatística descritiva e inferencial. A estatística descritiva é caracterizada pela organização, análise e apresentação dos dados, enquanto a estatística inferencial tem como característica o estudo de uma amostra de determinada população e, com base nela, a realização de análises e a apresentação desses dados. Você pode conferir outros assuntos relacionados a matemática no nosso site e, se ficar com alguma dúvida, é só deixar nos comentários.

Definição Histórica

A probabilidade e a estatística, os ramos da matemática relacionados com as leis que regem os eventos aleatórios, incluindo a coleta, análise, interpretação e exibição de dados numéricos. A probabilidade tem sua origem no estudo do jogo e do seguro no século XVII, e agora é uma ferramenta indispensável das ciências sociais e naturais. Pode-se dizer que as estatísticas têm sua origem em censos feitos há milhares de anos; como uma disciplina científica distinta, no entanto, foi desenvolvida no início do século 19 como o estudo de populações, economias e ações morais e mais tarde naquele século como a ferramenta matemática para analisar tais números.

Os jogadores de cartas (theodor rombouts - 1597-1637, bélgica)
Os Jogadores de Cartas (Theodor Rombouts – 1597-1637, Bélgica)

A matemática moderna do acaso é geralmente datada de uma correspondência entre os matemáticos franceses Pierre de Fermat e Blaise Pascal em 1654. Sua inspiração veio de um problema sobre jogos de azar, proposto por um jogador notavelmente filosófico, o Chevalier de Méré. De Méré perguntou sobre a divisão adequada das apostas quando um jogo de azar é interrompido. Suponha que dois jogadores, A e B, estão jogando um jogo de três pontos, cada um apostando 32 pistolas, e são interrompidos depois que A tem dois pontos e B tem um. Quanto cada um deve receber?

Fermat e Pascal propuseram soluções um pouco diferentes, embora concordassem com a resposta numérica. Cada um se comprometeu a definir um conjunto de casos iguais ou simétricos e, em seguida, a responder ao problema comparando o número de A com o de B. Fermat, no entanto, deu sua resposta em termos de chances, ou probabilidades. Ele raciocinou que mais dois jogos seriam suficientes em qualquer caso para determinar a vitória. Existem quatro resultados possíveis, cada um igualmente provável em um jogo de azar justo. A pode ganhar duas vezes, A A; ou primeiro A depois B pode vencer; ou B então A; ou B B. Dessas quatro sequências, apenas a última resultaria em vitória para B. Assim, as probabilidades para A são 3:1, implicando uma distribuição de 48 pistolas para A e 16 pistolas para B.

Pascal achou a solução de Fermat pesada e propôs resolver o problema não em termos de chances, mas em termos da quantidade agora chamada de “expectativa”. Suponha que B já tenha vencido a próxima rodada. Nesse caso, as posições de A e B seriam iguais, cada um com duas vitórias, e cada um teria direito a 32 pistolas. A deve receber sua parte em qualquer caso. Os 32 de B, ao contrário, dependem da suposição de que ele venceu o primeiro turno. Esta primeira rodada pode agora ser tratada como um jogo justo para esta aposta de 32 pistolas, de modo que cada jogador tenha uma expectativa de 16. Portanto, o lote de A é 32 + 16, ou 48, e o de B é apenas 16.

Jogos de azar como este forneceram problemas modelo para a teoria das chances durante seu período inicial e, de fato, continuam sendo a base dos livros didáticos. Um trabalho póstumo de 1665 de Pascal sobre o “triângulo aritmético” agora ligado ao seu nome, mostrou como calcular números de combinações e como agrupá-los para resolver problemas elementares de jogo. Fermat e Pascal não foram os primeiros a dar soluções matemáticas para problemas como esses.

Mais de um século antes, o matemático, médico e jogador italiano Girolamo Cardano calculou probabilidades para jogos de sorte contando casos igualmente prováveis. Seu pequeno livro, porém, só foi publicado em 1663, quando os elementos da teoria das chances já eram bem conhecidos dos matemáticos da Europa. Nunca se saberá o que teria acontecido se Cardano tivesse publicado na década de 1520. Não se pode presumir que a teoria da probabilidade teria decolado no século XVI. Quando começou a florescer, fê-lo no contexto da “nova ciência” da revolução científica do século XVII, quando o uso do cálculo para resolver problemas complicados ganhou uma nova credibilidade.

Cardano, além disso, não tinha muita fé em seus próprios cálculos de probabilidades de jogo, pois acreditava também na sorte, principalmente na sua. No mundo renascentista de monstruosidades, maravilhas e similitudes, o acaso — aliado ao destino — não era prontamente naturalizado, e o cálculo sóbrio tinha seus limites.

Por que as estatísticas são importantes?

As estatísticas são importantes porque ajudam as pessoas a tomar decisões informadas. Governos, organizações e empresas coletam estatísticas para ajudá-los a acompanhar o progresso, medir o desempenho, analisar problemas e priorizar. Por exemplo, o Censo do IBGE coleta informações de pessoas sobre onde elas moram e sua idade. Essas informações podem ajudar as cidades a decidir onde devem construir um novo hospital se descobrirem que há uma grande população idosa em uma área ou uma nova escola, se descobrirem que há muitas famílias com crianças pequenas.

Em um nível pessoal, as estatísticas podem ser uma ótima maneira de aprimorar seu argumento em um trabalho de pesquisa ou apresentação. Eles mostram que há evidências para apoiar sua reivindicação e podem adicionar credibilidade ao seu trabalho. As estatísticas geralmente criam uma resposta emocional em seu público. Pense em como você se sente quando alguém pode fazer backup de seu argumento com estatísticas? As estatísticas não fazem você se sentir mais forte com o argumento?

Princípios da estatística

Para entender e saber como fazer estatística, é necessário conferir a existência de alguns princípios básicos de estatística. Com base neles, será possível definir conceitos mais sofisticados, separados em população ou universo:

População ou universo

A população ou universo estatístico é o conjunto formado por todos esses elementos que participam de um determinado tema estudado, confira no exemplo:

  • Em uma cidade, todos os habitantes pertencem ao universo estatístico
  • Em um dado de seis faces, a população é dada pelo número de faces

Sendo eles {1, 2, 3, 4, 5, 6}

Dado estatístico

O dado estatístico é um dos elementos que pertencem ao conjunto dessa população geral, esse dado precisa estar ligado ao tema da pesquisa:

PopulaçãoDado estatístico
Dado de seis faces4
Campeões Brasileiros de Mountain BikeHenrique Avancini

Amostra

Chamamos então de amostra o subconjunto, ou seja, um grupo limitado formado com base no universo estatístico. As amostras são utilizadas quando a população é muito grande ou infinita, sendo assim, impossibilitada de alcançar todos os indivíduos. Nesses casos, são utilizadas as amostras como referencial dentro do grupo estudado.

A escolha da amostra é de extrema importância para uma pesquisa porque ela deve representar de maneira incontestável a população estudada. Um exemplo palpável clássico da utilização das amostras em uma pesquisa é na realização do censo demográfico IBGE, por exemplo.

Variável

O que chamamos de variável no estudo da estatística se trata do tema que a pesquisa pretende estudar. Por exemplo, ao estudar-se as características de uma cidade, o número de habitantes pode ser uma variável, assim como o volume de chuva em determinado período ou até mesmo a quantidade de ônibus para o transporte público. O conceito de variável em estatística depende sempre do contexto da pesquisa.

A organização dos dados em estatística é feita em etapas, como um processo organização. Inicialmente é escolhido o tema a ser pesquisado, e depois é pensado o método para a coleta dos dados da pesquisa, e por último, a execução da coleta. Em seguida, se faz a análise do que foi coletado, e assim, com base na interpretação, se busca resultados.

Rol

Em casos em que os dados podem ser representados por números, ou seja, quando a variável é quantitativa, utiliza-se o rol para organização desses dados. Um rol pode ser crescente ou decrescente. Caso uma variável não seja quantitativa, ou seja, caso seja qualitativa, não é possível utilizar-se o rol, por exemplo, se os dados são sentimentos sobre determinado produto.

Exemplo

Em uma sala de aula, foram coletadas as alturas dos alunos em metros. São elas: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.

Como o rol pode ser organizado de maneira crescente ou decrescente, segue que:

rol: {1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}

Observe que, com o rol já montado, é possível encontrar um dado com mais facilidade.

A estatística tem por objetivo coletar, organizar, analisar e interpretar as informações de um problema em estudo
A estatística tem por objetivo coletar, organizar, analisar e interpretar as informações de um problema em estudo
Tabela de distribuição de frequência

Quando há muitos elementos no rol e muitas repetições de dados, o rol pode se tornar obsoleto, pois a organização desses dados fica inviável. Quando isso ocorre, as tabelas e a distribuição de frequências servem como ferramenta de organização.

Na tabela de distribuição de frequência absoluta, colocamos a frequência em que cada dado aparece, ou seja, a quantidade de vezes que ele aparece. Confira a tabela de distribuição de frequência absoluta das idades, em anos, dos alunos de uma determinada classe:

Distribuição de frequências absolutas
IdadeFrequência (F)
82
912
1012
1114
121
Total (FT)41

Podemos pela tabela obter as seguintes informações: na classe temos 2 alunos com a idade de 8 anos, 12 alunos com 9 anos, e mais 12 alunos com 10 anos, e assim sucessivamente, alcançando o total de 41 alunos. Na tabela de distribuição de frequências acumuladas, devemos somar a frequência da linha anterior. Confira a tabela de distribuição de frequência acumulada das idades da mesma classe do exemplo anterior:

Distribuição de frequências acumuladas
IdadeFrequência (F)
82
914
1026
1140
1241
Total (FT)41

Na tabela de distribuição de frequências relativas, utilizamos a porcentagem em que cada dado aparece. Os cálculos são baseados na tabela de distribuição de frequência absoluta. Sabemos que 41 corresponde a 100% dos alunos da classe, logo, para determinar a porcentagem de cada idade, basta dividirmos a frequência da idade por 41 e multiplicarmos o resultado por 100, para, assim, escrevermos na forma de porcentagem.

2 : 41 = 0,048 · 100 → 4,8%

12 : 41 = 0,292 · 100 → 29,2%

12 : 41 = 0,292 · 100 → 29,2%

14 : 41 = 0,341 · 100 → 34,1%

1 : 41 = 0,024 · 100 → 2,4%

Distribuição de frequências relativas
IdadeFrequência (F)
84,8%
929,2%
1029,2%
1134,1%
122,4%
Total (FT)100%

Você pode conferir mais sobre porcentagem nesta matéria no nosso site.

Classes

Em casos em que a variável é contínua é necessário agrupá-los em intervalos reais. Esses intervalos são chamados de classes.

Na tabela de distribuição de frequências em classes, colocamos os intervalos na coluna da esquerda, com seu devido título, e na coluna da direita, devemos colocar a frequência absoluta de cada um dos intervalos, confira:

Altura dos alunos da classe do 3º ano do Ensino Médio de uma escola.

Distribuição de frequência em classes
Altura (metros)Frequência absoluta (F)
[1,40; 1,50]1
[1,50; 1,60]4
[1,60; 1,70]8
[1,70; 1,80]2
[1,80; 1,90]1
Total (FT)16

Analisando a tabela de distribuição de frequência em classes, podemos ver que, existe 1 estudante que possui altura entre 1,40 m e 1,50 m, 4 estudantes com altura entre 1,50 e 1,60 m, e assim por diante. Os estudantes possuem altura entre 1,40 m e 1,90 m, a diferença entre essas medidas é chamada de amplitude.

A diferença entre o limite superior e o limite inferior de uma classe é chamada de amplitude da classe, assim, a segunda, que possui 4 alunos com alturas entre 1,50 metro (inclusos) e 1,60 metro (não inclusos), possui amplitude de:

1,60 – 1,50

0,10 metro

Medidas de posição

As medidas de posição são utilizadas em casos em que é possível construir-se um rol numérico com os dados ou uma tabela de frequência. Essas medidas indicam a posição dos elementos em relação ao rol. As três principais medidas de posição são:

Média

Considere o rol com os elementos (a1, a2, a3, a4, …, an), a média aritmética desses elementos é dada por:

Exemplo média
Exemplo média

Confira o exemplo:

Em um grupo de dança, as idades dos integrantes foram coletadas e representadas no rol a seguir:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

De acordo com a fórmula, devemos somar todos os elementos e dividir esse resultado pela quantidade de elementos do rol, sendo assim:

Exemplo média
Exemplo média

Portanto, a idade média dos integrantes é de 22 anos.

Mediana

A mediana é dada pelo elemento central de um rol que possui uma quantidade ímpar de elementos. Caso o rol possua uma quantidade par de elementos, devemos considerar os dois elementos centrais e calcular a média aritmética entre eles.

Por exemplo

(2, 2, 3, 3, 45, 6, 7, 9)

Veja que o elemento 4 divide o rol em duas partes iguais, logo, ele é o elemento central.

Sendo assim, ao aplicarmos no exemplo anterior, devemos tomar dois elementos centrais e realizar a média aritmética desses valores.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Exemplo mediana
Exemplo mediana

Moda

Moda é o elemento do rol que possui maior frequência. O elemento que mais aparece no exemplo é o 21, portanto, a moda é igual a 21.

Gráficos de moda média e mediana
Gráficos de moda média e mediana

Medidas de dispersão

As medidas de dispersão são utilizadas nos casos em que a média não é suficiente.

As medidas de dispersão indicam o quanto os elementos de um rol numérico estão afastados da média aritmética. Sendo assim, possuímos duas importantes medidas de dispersão:

Variância (σ2)

Vamos chamar de variância a média aritmética dos quadrados da diferença entre cada elemento do rol e a média aritmética desse rol. A variância é representada por: σ2.

Considere o rol (x1, x2, x3, …, xn) e que ele possua média aritmética x. A variância é dada por:

Exemplo variância
Exemplo variância

Desvio-padrão (σ)

O desvio-padrão é dado pela raiz da variância, ele indica o quanto um elemento está disperso em relação à média. O desvio padrão é denotado por σ. Confira no exemplo:

Determine o desvio-padrão do conjunto de dados (4, 7, 10). Para fazê-lo, é necessário determinar primeiro a variância, sendo necessário antes o cálculo da média desses dados. Sendo assim:

Exemplo desvio-padrão
Exemplo desvio-padrão

Substituindo esses dados na fórmula da variância, temos:

Exemplo desvio-padrão
Exemplo desvio-padrão

Para determinar o desvio-padrão, extraímos a raiz da variância.

Exemplo desvio-padrão
Exemplo desvio-padrão

Probabilidade

A probabilidade é um assunto que lida com a incerteza. Na terminologia cotidiana, a probabilidade pode ser pensada como uma medida numérica da probabilidade de ocorrência de um determinado evento. Os valores de probabilidade são atribuídos em uma escala de 0 a 1, com valores próximos a 0 indicando que é improvável que um evento ocorra e aqueles próximos a 1 indicando que é provável que um evento ocorra. Uma probabilidade de 0,50 significa que um evento tem a mesma probabilidade de ocorrer ou não ocorrer.

Eventos e suas probabilidades

Muitas vezes, as probabilidades precisam ser calculadas para eventos relacionados. Por exemplo, anúncios são desenvolvidos com a finalidade de aumentar as vendas de um produto. Se ver o anúncio aumenta a probabilidade de uma pessoa comprar o produto, dizemos que os eventos “ver o anúncio” e “comprar o produto” são dependente. Se dois eventos forem independentes, a ocorrência de um evento não afeta a probabilidade de ocorrência do outro evento. Quando dois ou mais eventos são independentes, a probabilidade de sua ocorrência conjunta é o produto de suas probabilidades individuais. Dois eventos são ditos mutuamente exclusivos se a ocorrência de um evento significa que o outro evento não pode ocorrer; neste caso, quando ocorre um evento, a probabilidade do outro evento ocorrer é zero.

Variáveis Aleatórias e Distribuições de Probabilidade

Uma variável aleatória é uma descrição numérica do resultado de um experimento estatístico. Uma variável aleatória que pode assumir apenas um número finito ou uma sequência infinita de valores é chamada de discreto; aquele que pode assumir qualquer valor em algum intervalo na reta numérica real é chamado de contínuo. Por exemplo, uma variável aleatória representando o número de automóveis vendidos em uma determinada concessionária em um dia seria discreta, enquanto uma variável aleatória representando o peso de uma pessoa em quilogramas seria contínua.

A distribuição de probabilidade para uma variável aleatória descreve como as probabilidades são distribuídas sobre os valores da variável aleatória. Para uma variável aleatória discreta, x , a distribuição de probabilidade é definida por um função de massa de probabilidade, denotada por f ( x ). Esta função fornece a probabilidade para cada valor da variável aleatória. No desenvolvimento da função de probabilidade para uma variável aleatória discreta, duas condições devem ser satisfeitas:

  • f ( x ) deve ser não negativa para cada valor da variável aleatória
  • a soma das probabilidades para cada valor de a variável aleatória deve ser igual a um.

Uma variável aleatória contínua pode assumir qualquer valor em um intervalo na reta numérica real ou em uma coleção de intervalos. Como existe um número infinito de valores em qualquer intervalo, não faz sentido falar sobre a probabilidade de a variável aleatória assumir um valor específico; em vez disso, considera-se a probabilidade de que uma variável aleatória contínua esteja dentro de um determinado intervalo.

No caso contínuo, a contrapartida da função de massa de probabilidade é a função de densidade de probabilidade, também denotada por f ( x ). Para uma variável aleatória contínua, a função de densidade de probabilidade fornece a altura ou valor da função em qualquer valor particular de x ; não fornece diretamente a probabilidade da variável aleatória assumir um valor específico. No entanto, a área sob o gráfico de f ( x ) correspondente a algum intervalo, obtida calculando a integral de f ( x ) nesse intervalo, fornece a probabilidade de que a variável assuma um valor dentro desse intervalo. Uma função de densidade de probabilidade deve satisfazer dois requisitos: (1) f( x ) deve ser não negativo para cada valor da variável aleatória e (2) a integral sobre todos os valores da variável aleatória deve ser igual a um.

FAQ – Perguntas frequentes

O que é estatística?

estatística é o campo da matemática que estuda fatos e números havendo um conjunto de métodos que possibilita a coleta de dados e analise destes, sendo assim, cria a possibilidade de realizar alguma interpretação deles.

Qual o principio da estatística?

Para entender e saber como fazer estatística, é necessário conferir a existência de alguns princípios básicos de estatística. Com base neles, será possível definir conceitos mais sofisticados, separados em população ou universo.

O que são medidas de posição?

As medidas de posição são utilizadas em casos em que é possível construir-se um rol numérico com os dados ou uma tabela de frequência. Essas medidas indicam a posição dos elementos em relação ao rol. As três principais medidas de posição são média, mediana e moda.

Quais são os 3 tipos de estatística?

São eles: Média, Mediana e Moda. Estatística é o estudo da coleta, análise, interpretação, apresentação e organização de dados de uma maneira específica.

Se gostou do conteúdo, não deixe de conferir mais estudos relacionados a matemática no nosso site. Você pode também nos seguir nas redes sociais para ficar de olho em outros diversos assuntos. Compartilhe com seus amigos.

Deixe um comentário