Distribuições de Probabilidade
Em 1809, Carl Friedrich Gauss estava a estudar os erros de observação em astronomia. Notou que quando múltiplos astrónomes mediam a mesma posição de uma estrela, os erros seguiam sempre o mesmo padrão: muitas medições próximas do valor real, poucas muito afastadas — e o padrão era sempre simétrico.
A curva que Gauss descreveu matematicamente — a distribuição normal, ou "curva em sino" — acabaria por aparecer em toda a parte: altura humana, inteligência, preços de ações, erros de medição, distribuição de notas. O motivo: o Teorema do Limite Central.
Variável Aleatória
Uma variável aleatória X é uma função que associa um número real a cada resultado possível de um experimento.
- Discreta: assume valores enumeráveis (ex: número de caras em 10 lançamentos de moeda)
- Contínua: assume qualquer valor num intervalo (ex: altura de uma pessoa)
Esperança matemática (valor médio):
Variância e desvio padrão:
Distribuição de Bernoulli e Binomial
Ensaio de Bernoulli: experiência com apenas dois resultados — "sucesso" (prob. p) e "insucesso" (prob. 1−p).
Distribuição Binomial B(n, p): número de sucessos em n ensaios independentes de Bernoulli.
Distribuição Normal N(μ, σ²)
A distribuição normal com média μ e desvio padrão σ tem a famosa curva em sino:
Propriedades:
- Simétrica em torno de μ
- 68% dos dados estão em [μ−σ, μ+σ]
- 95% em [μ−2σ, μ+2σ]
- 99,7% em [μ−3σ, μ+3σ]
Esta regra 68-95-99,7 (ou "regra empírica") é fundamental em controlo de qualidade, medicina e ciências.
Normalização: Variável Z
Para calcular probabilidades em qualquer N(μ, σ²), transformamos em N(0,1) (normal padrão):
As probabilidades de Z lêem-se na tabela da distribuição normal (tabela Z).
Exemplo: A altura dos portugueses do sexo masculino é N(173, 49) [média 173 cm, σ=7 cm]. Probabilidade de ter mais de 187 cm:
Teorema do Limite Central
Por que a normal está em todo o lado? O Teorema do Limite Central responde:
Se somarmos n variáveis aleatórias independentes com qualquer distribuição (de média μ e variância σ²), a soma converge para uma distribuição normal quando n → ∞.
A altura humana é a soma de centenas de factores genéticos e ambientais → normal. Os erros de medição são a soma de pequenas perturbações independentes → normal. É o teorema mais poderoso da estatística.