Estatística descritiva: quartis, percentis e histograma
Cole uma lista de números e veja, de uma vez, a média, o desvio padrão, o coeficiente de variação, os quartis, um percentil à sua escolha, a amplitude interquartil e os valores discrepantes, além da tabela de frequência por classes e do histograma. A ferramenta usa a interpolação linear (método R-7) para os quartis e percentis. É grátis e roda no navegador.
Como ler os dados com a estatística descritiva
A estatística descritiva resume um conjunto de dados em poucos números que contam a sua história. As medidas de posição, como a média e a mediana, indicam onde os dados se concentram. As medidas de dispersão, como o desvio padrão, a amplitude e a amplitude interquartil, dizem o quanto eles variam. Juntas, elas evitam conclusões precipitadas: duas turmas podem ter a mesma média de notas e desempenhos muito diferentes, o que só aparece quando se olha a dispersão.
Os quartis e percentis são ferramentas de posição relativa. Dizer que um aluno está no percentil noventa significa que ele superou noventa por cento dos colegas. Os quartis recortam os dados em quatro blocos, e a amplitude interquartil mede a largura do miolo, ignorando as pontas. Por se apoiar nos quartis, ela resiste bem aos valores extremos, ao contrário da amplitude total, que depende só do menor e do maior valor. A cerca de Tukey, construída a partir do IQR, é o critério padrão para apontar valores discrepantes.
Para enxergar a forma da distribuição, agrupa-se os dados em classes e conta-se quantos caem em cada faixa, montando a tabela de frequência. A regra de Sturges dá um número razoável de classes em função da quantidade de dados. O histograma traduz essa tabela em barras e revela se a distribuição é simétrica, concentrada à esquerda ou à direita, ou se tem mais de um pico. É a ponte entre os números resumo e a intuição visual, muito cobrada no ENEM e em concursos.
Continue estudando
Aprofunde nas medidas de centro e dispersão. Veja a média aritmética e ponderada, a mediana e moda, o desvio padrão e variância e explore o portal de matemática.
Perguntas frequentes
- O que sao quartis e o que e a amplitude interquartil?
- Os quartis dividem os dados ordenados em quatro partes iguais. O primeiro quartil, Q1, deixa 25 por cento dos valores abaixo dele; o segundo, Q2, e a mediana; o terceiro, Q3, deixa 75 por cento abaixo. A amplitude interquartil, ou IQR, e a diferenca entre Q3 e Q1, e mede a dispersao dos 50 por cento centrais dos dados, sendo pouco afetada por valores extremos.
- Qual convencao de calculo dos quartis esta calculadora usa?
- Usamos a interpolacao linear conhecida como metodo R-7, a mesma das planilhas eletronicas. A posicao de um percentil P e dada por (n menos 1) vezes P sobre 100, e quando ela cai entre dois valores, interpola-se linearmente. Por isso o resultado pode diferir um pouco da convencao escolar da mediana das metades, que tambem e valida. A pagina deixa claro qual metodo foi aplicado.
- Como identificar valores discrepantes (outliers)?
- O criterio mais usado e a cerca de Tukey. Calculam-se dois limites: Q1 menos uma vez e meia o IQR, e Q3 mais uma vez e meia o IQR. Valores fora desse intervalo sao considerados discrepantes. Esse metodo e robusto porque se baseia nos quartis, que resistem bem a presenca de valores muito altos ou muito baixos.
- O que e o coeficiente de variacao?
- E o desvio padrao dividido pela media, geralmente em porcentagem. Ele permite comparar a dispersao de conjuntos com medias diferentes, ou em unidades diferentes, porque e adimensional. Quando a media e zero, o coeficiente de variacao nao e definido, pois envolveria uma divisao por zero, e a calculadora avisa nesse caso.
- Como e montada a tabela de frequencia e o histograma?
- O numero de classes segue a regra de Sturges, que sugere k igual a 1 mais 3,322 vezes o logaritmo de n na base 10, arredondado para cima. A faixa dos dados e dividida em classes de mesma amplitude, e conta-se quantos valores caem em cada uma, com as frequencias relativa e acumulada. O histograma representa essas contagens em barras, dando uma imagem da distribuicao.
- Os meus dados sao enviados para algum servidor?
- Nao. Todo o calculo acontece no seu navegador, sem cadastro e sem enviar nada para fora. Voce cola a lista de numeros e ve os resultados na hora, com a tabela de frequencia e o histograma. Os campos aceitam apenas numeros e virgulas, o que mantem a ferramenta segura.