Na estatística descritiva, um box plot ou boxplot é um método para representar graficamente grupos de dados numéricos através dos seus quartis. Os gráficos de caixas também podem ter linhas que se estendem verticalmente das caixas (bigodes) indicando variabilidade fora dos quartis superior e inferior, daí os termos box-and-wisker plot e box-and-wisker diagramas. Os outliers podem ser traçados como pontos individuais. Os gráficos de caixa são não paramétricos: eles mostram variação em amostras de uma população estatística sem fazer nenhuma suposição da distribuição estatística subjacente (embora o gráfico de caixa de Tukey assuma simetria para os bigodes e normalidade para o seu comprimento). Os espaçamentos entre as diferentes partes da caixa indicam o grau de dispersão (dispersão) e de enviesamento nos dados, e mostram aberturas. Além dos pontos em si, eles permitem estimar visualmente vários L-estimadores, notadamente o intervalo interquartil, meia-dobradiça, alcance, médio alcance e trimean. Os gráficos da caixa podem ser desenhados tanto horizontalmente como verticalmente. As parcelas de caixa receberam o seu nome da caixa no meio.

Tipos

Figura 2. Boxplot com bigodes do mínimo ao máximo

Figura 3. O mesmo Boxplot com bigodes com um máximo de 1,5 IQR

Os quartis da caixa e do assobio, e a faixa dentro da caixa é sempre o segundo quartil (a mediana). Mas as extremidades dos bigodes podem representar vários valores alternativos possíveis, entre eles:

o mínimo e o máximo de todos os dados[1] (como na figura 2)

o datum mais baixo ainda dentro de 1,5 IQR do quartil inferior, e o datum mais alto ainda dentro de 1,5 IQR do quartil superior (frequentemente chamado de Tukey boxplot) (como na figura 3)

um desvio padrão acima e abaixo da média dos dados o 9º percentil e o 91º percentil o 2º percentil e o 98º percentil.

Qualquer dado não incluído entre os bigodes deve ser plotado como um outlier com um ponto, pequeno círculo ou estrela, mas ocasionalmente isso não é feito.

Alguns gráficos de caixas incluem um carácter adicional para representar a média dos dados.

Em algumas parcelas de caixas é colocado um crosshatch em cada whisker, antes do final do whisker.

Raramente, os lotes de caixas podem ser apresentados sem bigodes.

Devido a esta variabilidade, é apropriado descrever a convenção que está sendo usada para os bigodes e outliers na legenda do enredo.

Os percentis incomuns 2%, 9%, 91%, 98% são às vezes usados para os whisker cross-hatches e whisker ends para mostrar o resumo dos sete números. Se os dados forem normalmente distribuídos, as localizações das sete marcas no gráfico da caixa serão igualmente espaçadas.

O tipo fundamental da trama do caso, utilizando um contentor para passar na ida interquartil, foi apresentado por Mary Eleanor Spear em 1952[6] e novamente em 1969[7].

Desde que o matemático John W. Tukey avançou com este tipo de espectáculo de informação visual em 1969, foram retratados alguns pequenos desvios da habitual trama de caixas. Dois dos mais amplamente reconhecidos são os lotes de caixas de largura variável e os lotes de caixas pontuados (ver Figura 4).

Os lotes de caixas de largura variável delimitam o tamanho de cada coleta cujas informações estão sendo plotadas, fazendo a largura da caixa em relação ao tamanho da coleta. Uma mostra principal é fazer a largura do recipiente em relação à base quadrada do tamanho do grupo [1].

As caixas pontuadas aplicam um “travessão” ou estreitamento da caixa ao redor do meio. As pontuações são úteis na oferta de um manual desagradável para a notabilidade da distinção das medianas; se os travessões de duas caixas não cobrem, isto oferece prova de um contraste crítico mensurável entre as medianas[1]. A largura dos travessões corresponde à extensão interquartil (IQR) do exemplo e, inversamente, à base quadrada do tamanho do exemplo. Seja como for, existe uma vulnerabilidade sobre o multiplicador mais adequado (já que isso pode mudar dependendo da similitude das diferenças dos exemplos

 Uma convenção é para usar

O gráfico do contentor permite uma avaliação gráfica rápida de pelo menos um índice informativo. Os lotes de caixas podem parecer mais grosseiros do que um histograma ou bit bit bit bitauge, no entanto eles têm alguns pontos de interesse. Eles ocupam menos espaço e são especialmente valiosos para a análise de disseminações entre algumas reuniões ou conjuntos de informações (veja a Figura 1 para um modelo). A decisão do número e largura dos sistemas de recipientes pode impactar intensamente a presença de um histograma, e a decisão da velocidade de transferência pode impactar vigorosamente a presença de um medidor de espessura de peça.

Uma vez que dar uma olhada em uma dispersão mensurável é mais típico do que dar uma olhada em um gráfico de contêineres, contrastar o gráfico do caso com o trabalho de espessura de probabilidade (histograma hipotético) para uma circulação N(0,σ2) comum pode ser um instrumento valioso para a compreensão do gráfico do caso (Figura 5).