Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Los valores P se confunden regularmente, lo que causa numerosos problemas. No voy a repasar esos temas aquí ya que mi compañero Jim Frost ha detallado los temas requeridos con cierta extensión, sin embargo, la realidad sigue siendo que el valor P seguirá siendo uno de los aparatos más utilizados para elegir si un resultado es realmente enorme.

¿Conoces la vieja sierra sobre “falsedades, falsedades condenadas y medidas”, no es así? Suena exacto a la luz del hecho de que las mediciones realmente se trata tanto de la traducción y la introducción como de la aritmética. Eso implica que nosotros, los individuos que estamos examinando la información, con cada una de nuestras deficiencias y fallas, tenemos la oportunidad de sombrear y oscurecer la forma en que los resultados se anuncian.

Aunque en general prefiero aceptar que las personas deben ser directas y objetivas -en particular las personas entusiastas que preguntan e investigan información que puede influir en la vida de otras personas-, hay 500 elementos de prueba que contradicen esa convicción.

Volveremos a eso en un momento. En general, una rápida auditoría.

¿Qué es un valor P y cómo lo interpreto?

La mayoría de nosotros experimentamos por primera vez los valores p cuando dirigimos pruebas de especulación directas, a pesar de que también son indispensables para muchas estrategias progresivamente refinadas. Qué tal si usamos Minitab Statistical Software para hacer una rápida auditoría de cómo funcionan (en la remota posibilidad de que usted necesite rastrear y no tenga Minitab, el paquete completo es accesible gratuitamente por 30 días). Vamos a pensar en la utilización del combustible de dos tipos de calentadores para comprobar si hay un contraste entre sus métodos.

Vaya a Archivo > Abrir hoja de trabajo y pulse el botón “Buscar en la carpeta de datos de muestra de Minitab”. Abra la colección de información de ejemplo llamada Furnace.mtw, y elija Stat > Basic Statistics > 2 Sample t… en el menú. En el cuadro de intercambio, ingrese “BTU”. In” para Muestras, e introduzca “Damper” para Identificación de muestras.

Presiona OK y Minitab restaura el rendimiento acompañante, en el que he presentado la p-estima.

En la mayoría de las investigaciones, se utiliza un alfa de 0,05 como límite para la inmensidad. En el caso de que la p-estima esté por debajo de 0,05, descartamos la teoría inválida de que no hay distinción entre los métodos y la razón de que exista un contraste crítico. En el caso de que la p-estima sea mayor de 0,05, no podemos presumir que existe un contraste crítico.

Eso es totalmente directo, ¿no es así? Por debajo de 0,05, digno de mención. Por encima de 0,05, no es digno de mención.

“¡Se lo perdió por mucho!”

En el modelo terminado, el resultado es claro: una estimación p de 0,7 es tan grande que es superior a 0,05 que no se puede tener ningún razonamiento significativo para los resultados. Sea como fuere, imagina un escenario en el que tu p-estima está ridículamente cerca de 0,05.

Como, imagina un escenario en el que tuvieras una estimación de 0.06.

Eso no es enorme.

Qué amable. De acuerdo, ¿no debería decirse algo sobre el 0,055?

No es enorme.

¿Qué hay de 0.051?

Aún no es medible, y los examinadores de información deben hacer un esfuerzo para no imaginar otra cosa. Una p-estima no es un arreglo: si p > 0.05, los resultados no son críticos. Eso es todo.

Siendo las cosas como son, ¿qué sería aconsejable que dijera cuando tengo una p-estima superior a 0,05?

¿Qué hay de decir esto? “Los resultados no fueron críticos en cuanto a los hechos”. Si eso es lo que la información te hace saber, no hay nada malo en decir tanto.

Sin importar cuán delgada sea la rebanada, sigue siendo una tontería.

Esto me lleva de vuelta a la entrada del blog a la que me referí al principio. Lo leí, pero lo más importante es que el escritor clasificó 500 formas distintas en que los partidarios de los diarios lógicos han utilizado el lenguaje para oscurecer sus resultados (o la deficiencia en ese departamento).

Como suplente del lenguaje, admito que descubro el resumen fascinante… pero también molesto. Está mal: A estos partidarios se les enseña a individuos que seguramente comprenden A) lo que implica una p-estima superior a 0,05, y B) que controlar las palabras para suavizar ese resultado es intencionadamente difícil. O, por otro lado, ponerlo en palabras menos delicadas, es una maldita falsedad.

En cualquier caso, sucede la mayor parte del tiempo.

Aquí están sólo un par de mis principales selecciones de las 500 formas distintas en que los individuos han anunciado resultados que no eran dignos de mención, junto con las p-calidades a las que se aplicaron estas elucidaciones inventivas:

un patrón específico hacia la centralidad (p=0.08)

se movió hacia el borde de la esencialidad (p=0.07)

en el borde de la importancia mensurable (p<0,07)

cerca de ser medible significant (p=0.055)

no alcanzó la marca en cuanto a la importancia mensurable (p=0,12)

simplemente se perdió un poco el nivel de importancia (p=0.086)

importancia periférica cercana (p=0.18)

sólo algo no digno de mención (p=0,0738)

temporalmente enorme (p=0.073)

lo que es más, mi mejor opción:

semi enorme (p=0.09)

No sé lo que se espera que signifique “semicrítico”, pero suena semisignificante, siempre y cuando no se sospeche que es excesivamente duro. Sea como fuere, todavía no hay forma de evitar que una estimación de 0,09 sea cualquier cosa menos un resultado digno de mención.

El blogger no aborda el tema de si ocurre la circunstancia contraria. ¿Los benefactores alguna vez componen que una estimación de, estado, 0.049999 es:

semi sin importancia

sólo marginalmente digno de mención

temporalmente sin importancia

que casi no es digno de mención…

en el límite de la no importancia de los hechos

Lo pondré todo ahí fuera y pondré que retratar una p-estima apenas por debajo de 0,05 de maneras que disminuyan su importancia medible simplemente no ocurre. En cualquier caso, hacer a la luz de la no centralidad de los hechos tendría todas las características de ser prácticamente endémico.

Esa es la razón por la que localizo el puesto mencionado arriba tan humectante. Es preocupante que pueda reunir tan eficazmente un número tan significativo de casos de conducta terrible por parte de los examinadores de información que muy probablemente saben más.

Nunca podrías utilizar el lenguaje para intentar oscurecer el resultado de tu examen, ¿de acuerdo?

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.