Estatística: Dar Sentido aos Dados
Em Março de 2020, Portugal começou a publicar diariamente o número de novos casos de COVID-19. A partir de 30 de Janeiro de 2023, esse número passou a ser semanal. Todos os dias, jornalistas, políticos e cidadãos interpretavam estes números: "a média da última semana foi X", "a mediana de novos casos é Y".
Esses conceitos — média, mediana, dispersão — são a base da estatística descritiva: a arte de resumir e interpretar dados.
Medidas de Tendência Central
Média Aritmética
A média é afectada por valores extremos (outliers).
Mediana
O valor central quando os dados estão ordenados.
- Se n ímpar: o valor do meio
- Se n par: média dos dois valores centrais
Menos afectada por outliers do que a média.
Moda
O valor que aparece com mais frequência. Pode haver 0, 1 ou múltiplas modas.
Quando usar cada medida?
- Média: dados sem outliers (ex: alturas de alunos)
- Mediana: dados com outliers (ex: salários, preços de casas)
- Moda: dados qualitativos ou frequências (ex: cor preferida, sapato mais vendido)
Medidas de Dispersão
Amplitude
Desvio Padrão (abreviado)
Mede quanto os valores se afastam da média em média.
Um desvio padrão pequeno → dados concentrados perto da média. Um desvio padrão grande → dados muito dispersos.
Exemplo real: A turma A tem notas 10, 10, 10, 10 (média 10, desvio padrão 0). A turma B tem notas 0, 10, 10, 20 (média 10, desvio padrão alto). Mesma média, dispersão muito diferente!
Representações Gráficas
Histograma: barras cujas áreas representam frequências de intervalos de dados.
Diagrama de caule e folhas: organiza dados preservando os valores originais.
Diagrama de barras: frequências de dados categóricos.
Diagrama circular (gráfico de pizza): proporções de categorias.