Las variables categóricas hablan de tipos de información que podrían ser aislados en reuniones. Los ejemplos de factores directos son la raza, el sexo, la edad y el nivel de instrucción. Si bien los dos últimos factores pueden considerarse también de manera numérica utilizando cualidades cuidadosas para la edad y la evaluación más elevada terminada, con frecuencia es cada vez más útil clasificar esos factores en un número moderadamente modesto de agrupaciones.

El análisis de los datos categóricos generalmente incluye, en su mayor parte, la utilización de tablas de información. Un cuadro de dos direcciones presenta la información absoluta mediante el recuento del número de percepciones que caen en cada reunión por dos factores, uno separado en líneas y el otro dividido en secciones. Por ejemplo, supongamos que se dirigió un examen de una reunión de 20 personas, a las que se acercó para reconocer su cabello y su sombra de ojos. Una tabla bidireccional que presente los resultados puede aparecer como persecuciones:

                       Color de ojos

Hair Color     Blue    Green   Brown   Black   Total

—————————————————–

Blonde         2       1       2       1       6

Red            1       1       2       0       4

Brown          1       0       4       2       7

Black          1       0       2       0       3

—————————————————–

Total          5       2       10      3       20

Los agregados de cada clase, también llamados circulaciones insignificantes, dan el número de personas en cada línea o sección sin representar el impacto de la otra variable (en el modelo más, el número completo de personas con ojos azules, sin prestar atención al sombreado del cabello, es 5).

Como los recuentos simples son a menudo difíciles de analizar, las tablas bidireccionales se convierten a menudo en porcentajes. En el modelo anterior, hay 4 personas pelirrojas. Como había una suma de 20 percepciones, esto implica que el 20% de las personas encuestadas son pelirrojas. De la misma manera, uno debería explorar los porcentajes dentro de una clasificación dada – de los 4 pelirrojos, 2 (la mitad) tienen ojos de color oscuro, 1 (25%) tiene ojos azules, y 1 (25%) tiene ojos verdes.

Para un modelo progresivo punto por punto, considere el conjunto de datos que lo acompaña, “Cargas del equipo olímpico de remo de los EE.UU. de 1996”. El segmento principal da el nombre del remero, el segundo da su ocasión, y el tercero su peso. Hay 8 clases de ocasión distintivas, con el peso dado como información numérica.

Auth        LW_double_sculls     154  Klepacki     cuatro                  205

Beasley     single_sculls        224  Koven        ocho                 200

Brown       eight                214  Mueller      quad                  215

Burden      eight                195  Murphy       ocho                 220

Carlucci    LW_four              160  Murray       cuatro                  205

Collins,D   LW_four              155  Peterson, M par                  210

Collins,P   eight                195  Peterson,S LW_doble_sculls      160

Gailes      quad                 205  Pfaendtner LW_cuatro               160

Hall        four                 195  Schnieder    LW_cuatro               158

Holland     pair                 195  Scott        cuatro                  208

Honebein    eight                200  Contramaestre Segaloff                  121

Jamieson    quad                 210  Smith        ocho                 207

Kaehler     eight                210  El joven        quad                  207

Antes de crear una tabla de dos direcciones para eventos y pesos, el analista debe primero dividir la columna numérica de “peso” en grupos, creando una variable categórica. El uso del comando “DESCRIBE” de MINITAB da la siguiente información sobre los datos de peso:

Estadísticas descriptivas

Variable         N      Media    Media Tr Media     StDev SE Media

Peso          26    191.85    202.50    193.46     26.27      5.15

Variable       Mínima       Máxima        Q1        Q3

Peso        121.00    224.00    160.00    210.00

Uno podría elegir, basándose en esta información, dividir los valores de peso en 4 grupos, tales como menos de 150 libras, 150-175 libras, 175-200 libras y más de 200 libras.

 Una vez que los datos fueron categorizados (el comando “CÓDIGO” de MINITAB puede utilizarse para realizar esta función), el comando “TABLA” de MINITAB creará tablas de dos direcciones, como sigue:

Filas: Columnas de      eventos: Clase de peso

               <150 150-175     175-200    >200 Todos

 LW_doubl        0         2         0         0         2

 single_s        0         0         0         1         1

 ocho           0         0         4         4         8

 LW_cuatro         0         4         0         0 0         4

 quad            0         0         0         4         4

 cuatro            0         0         1         3         4

 par            0         0         1         1         2

 timonel        1         0         0         0         1

 Todos los             1         6         6        13        26

Usando el subcomando “REMO” reproduce esta tabla con los porcentajes de remeros en cada categoría de peso por evento:

 Filas: Columnas de      eventos: Clase de peso

                 0         1         2         3       Todos

 LW_doubl      —     100.00       —        —     100.00

 solteros     .       ..     100..       . 100…    100…

 ocho        ..       .      50…     50…    100…

 LW_cuatro      .    .. 100.00      .       ..     100.00

 quad          —        — —            100.00    100.00

 cuatro          —        —      25.00     75.00    100.00

 par          —        —      50.00     50.00    100.00

 Patrón 100.      .       .        100…     100…

 Todos          3.85     23.08     23.08     50.00    100.00

Estos resultados demuestran que la mitad de los remeros están en la clase de peso superior, y el resto de la división entre las dos clases de trabajadores (excepto el timonel, que es el principal colega en la reunión de peso más ligero). En consecuencia, el subcomando “COLPERCENT” da el nivel de remeros en cada ocasión clasificación por peso.