As variáveis categóricas falam de tipos de informações que podem ser isoladas em reuniões. Instâncias de fatores diretos são raça, sexo, idade e nível instrutivo. Embora os dois últimos fatores possam igualmente ser considerados de forma numérica, utilizando qualidades cuidadosas para a idade e a avaliação mais elevada terminada, é freqüentemente cada vez mais útil classificar tais fatores em um número moderadamente modesto de reuniões.

A análise de dados categóricos geralmente inclui, na sua maioria, a utilização de tabelas de informação. Uma tabela de duas vias apresenta informações absolutas, totalizando o número de percepções que caem em cada coleta para dois fatores, um separado em linhas e o outro dividido em seções. Por exemplo, suponha que uma revisão foi dirigida a uma reunião de 20 pessoas, que foram abordadas para reconhecer o seu cabelo e sombreamento dos olhos. Uma tabela de duas vias introduzindo os resultados pode aparecer como perseguições:

Cor dos olhos

Hair Color     Blue    Green   Brown   Black   Total

—————————————————–

Blonde         2       1       2       1       6

Red            1       1       2       0       4

Brown          1       0       4       2       7

Black          1       0       2       0       3

—————————————————–

Total          5       2       10      3       20

Os agregados para cada classe, também chamados de circulações insignificantes, dão o número de pessoas em cada linha ou seção sem representar o impacto da outra variável (no modelo acima, o número completo de pessoas com olhos azuis, pagando pouca atenção ao sombreamento do cabelo, é 5).

Como as contagens simples são muitas vezes difíceis de analisar, as tabelas de duas vias são muitas vezes convertidas em percentagens. No modelo acima, há 4 pessoas com cabelo ruivo. Como havia uma soma de 20 percepções, isso implica que 20% das pessoas pesquisadas são ruivas. Da mesma forma, deve-se explorar as taxas dentro de uma dada classificação – das 4 ruivas, 2 (metade) têm olhos de cor escura, 1 (25%) tem olhos azuis, e 1 (25%) tem olhos verdes.

Para um modelo ponto por ponto, considere o conjunto de dados que o acompanha, “Loads of 1996 US Olympic Rowing Team”. O segmento principal dá o nome do remador, o segundo dá a sua ocasião, e o terceiro o seu peso. Existem 8 classes de ocasião distintas, com o peso dado como informação numérica.

Auth        LW_double_sculls     154  Klepacki     quatro                  205

Beasley     single_sculls        224  Koven        oito                 200

Brown       eight                214  Mueller      quad                  215

Burden      eight                195  Murphy       oito                 220

Carlucci    LW_four              160  Murray       quatro                  205

Collins,D   LW_four              155  Peterson,M par                  210

Collins,P   eight                195  Peterson,S LW_double_sculls      160

Gailes      quad                 205  Pfaendtner LW_four               160

Hall        four                 195  Schnieder    LW_four               158

Holland     pair                 195  Scott        quatro                  208

Honebein    eight                200  Segaloff     coxswain              121

Jamieson    quad                 210  Smith        oito                 207

Kaehler     eight                210  Jovem        quad                  207

Antes de criar uma tabela de duas vias para eventos e pesos, o analista deve primeiro dividir a coluna “peso” numérica em grupos, criando uma variável categórica. Usando o comando MINITAB “DESCRIBE” fornece as seguintes informações sobre os dados de peso:

Estatística Descritiva

Variável         N      Média    Mediana Tr Média Média     StDev SE Média

Peso          26    191,85    202,50    193,46     26,27      5,15

Variável       Mínimo       Máximo        Q1        Q3

Peso        121,00    224,00    160,00    210,00

Com base nestas informações, pode-se optar por dividir os valores de peso em 4 grupos, tais como abaixo de 150 libras, 150-175 libras, 175-200 libras, e mais de 200 libras.

 Uma vez categorizados os dados (o comando MINITAB “CODE” pode ser usado para realizar esta função), o comando MINITAB “TABLE” criará tabelas de duas vias, como se segue:

Filas: Colunas de eventos     : Classe_Peso

               <150 150-175     175-200    >200 Todos

 LW_doubl        0         2         0         0 0         2

 single_s         0         0 0         0         1         1

 oito            0         0 0         4         4         8

 LW_four         0         4         0         0 0         4

 quad             0         0 0         0         4         4

 quatro           0         0 0         1         3         4

 par             0         0 0         1         1         2

 timoneiro     1         0         0 0         0         1

 Todos             1         6         6        13        26

Usando o subcomando “ROWPERCENT” reproduz esta tabela com as percentagens de remadores em cada categoria de peso por evento:

 Filas: Colunas de eventos     : Classe_Peso

                 0         1         2         3       Todos

 LW_doubl      —     100.00       —        —     100.00

 single_s      —        —        —     100.00    100.00

 oito         —        —      50,00     50,00 50,00    100,00

 LW_four       —     100.00       —        —     100.00

 quad          —        —        —     100.00    100.00

 quatro          —        —      25,00     75,00    100,00

 par          —        —      50,00     50,00 50,00    100,00

 timoneiro 100.00       —        —        —     100.00

 Todos          3,85     23,08 23,08     23,08     50,00    100,00

Estes resultados demonstram que metade dos remadores estão na classe de peso superior, com o resto da divisão entre as duas classes trabalhadoras (excepto o timoneiro, que é o principal colega na recolha de peso mais leve). De forma correspondente, o sub-comando “COLPERCENT” dá o nível de remadores em cada ocasião classificação por peso.