Prueba T (definición, tipos) - Ejemplos de cálculo paso a paso

Tabla de contenido

¿Qué es la prueba T?

Una prueba T es un método utilizado para derivar una inferencia en estadística, cuyo objetivo es averiguar si existe alguna diferencia importante entre dos medias en las que los dos grupos considerados pueden estar relacionados entre sí.

Explicación

  • Está dirigido a la prueba de hipótesis, que básicamente se utiliza para probar una hipótesis perteneciente a una población determinada. Una prueba T considera el estadístico T, los valores de distribución T y los grados de libertad, que se utilizan para determinar la probabilidad de diferencia entre dos conjuntos de datos.
  • El funcionamiento básico detrás de la prueba T es que considera una muestra de cada uno de los dos conjuntos y construye un enunciado del problema al considerar una hipótesis nula en la que se establece que ambas medias son iguales.
  • Sobre la base de fórmulas equiparadas, los valores se extraen y comparan con los valores estándar, lo que conduce a la aceptación o rechazo de la hipótesis nula. El rechazo de la hipótesis nula indica que el conjunto de datos es bastante preciso y no por casualidad.

Tipos de prueba T

Existen principalmente cuatro tipos de prueba t, que son los siguientes:

# 1 - Prueba T de 1 muestra

Su objetivo es probar si la media del valor que uno ha apuntado es igual a la media de una sola población, por ejemplo, probar si el peso promedio de los estudiantes de la clase 5 es más de 45 kg

# 2 - Prueba T de 2 muestras

Su objetivo es probar si la media del valor que uno ha apuntado es igual a la media de dos poblaciones independientes, por ejemplo, probar si el peso promedio de los estudiantes varones de la Clase 5 es diferente del de las niñas de la Clase 5.

# 3 - Prueba T emparejada

Su objetivo es probar si la media del valor que uno ha apuntado es igual a la media de las diferencias entre las observaciones que son dependientes. Por ejemplo, comparar las calificaciones de los estudiantes antes y después de tomar las clases para cada materia nos ayuda a identificar si tomar las clases es lo suficientemente significativo como para mejorar las calificaciones de los estudiantes.

# 4 - Prueba T en la salida de regresión

Toma en consideración el coeficiente de la ecuación de regresión y prueba en qué grado difiere del valor cero. por ejemplo, si el puntaje del examen de ingreso es un factor significativo para determinar si un estudiante obtendrá un buen puntaje final.

Supuestos de la prueba T

  • La primera suposición para una prueba t está relacionada con la escala de medición. Esto está relacionado con si la escala sigue una escala continua u ordinal.
  • El segundo supuesto puede referirse a la naturaleza aleatoria de la muestra. Esto significa que los datos recopilados deben ser de naturaleza puramente aleatoria.
  • El tercer supuesto puede ser que cuando graficamos los datos relacionados con la distribución de la prueba t, debe seguir una distribución normal y producir un gráfico de curva de campana.
  • El cuarto supuesto puede ser que para la distribución t y específicamente para obtener una forma de la curva de campana, necesitamos tener un tamaño de muestra mayor.
  • La suposición final puede ser la de la prueba t. La varianza debe ser de naturaleza homogénea. mi. las desviaciones estándar son casi iguales.

¿Como calcular?

Funciona en dos escenarios diferentes, es decir, uno para la muestra independiente y otro para la muestra dependiente.

# 1 - Escenario de muestra independiente

  • Necesitamos calcular la suma, el tamaño de la muestra, que está determinado por “N”, y el valor de la puntuación para la media de cada una de las muestras independientes. Después de esto, es necesario calcular el grado de libertad para cada muestra independiente.
  • Esto se representa restando la muestra por uno, que denotamos como "n-1". Después de esto, es necesario calcular la varianza y la desviación estándar.
  • Se suman los grados de libertad de las muestras, lo que se denomina "gl-total". A continuación, necesitamos multiplicar el grado de libertad de cada muestra por la varianza de cada una. Necesitamos sumar las resultantes y luego dividir el total por "gl-total". El resultado obtenido se denomina varianza combinada.
  • Luego, la varianza combinada se divide por el n de las muestras. Luego se suma el resultado obtenido para todas las muestras. Se toma la raíz cuadrada de esto, y esto se denomina error estándar de la diferencia.
  • Por último, debemos restar la media más baja de la muestra de la media mayor de la muestra. La diferencia obtenida se divide por el error estándar de la diferencia y los resultados obtenidos se denominan valor T.

# 2 - Escenario de muestra dependiente

  • Se anotan las puntuaciones obtenidas de cada uno de los pares de conjuntos de datos, y debemos restarlo. Las diferencias obtenidas se suman y se denominan "D". Las diferencias de cada muestra se elevan al cuadrado y se suman para obtener un resultado llamado "D-Squared". Después de esto, debemos multiplicar la "N" o el número de puntuaciones emparejadas con la "D-cuadrado".
  • La resultante obtenida se resta del cuadrado del total "D". Este resultado se divide a su vez con "N-1". Se obtiene la raíz cuadrada de la resultante y se denomina divisor. Por último, necesitamos dividir el total "D" por el divisor, que nos da el valor t final.

Ejemplos de prueba T

Consideremos que tenemos puntuaciones para cada asignatura en el examen realizado durante dos trimestres.

Paso 1: reste la Fase 1 de la Fase 2

Paso 2: Sume toda la diferencia, es decir, -55

Paso 3: cuadra las diferencias

Paso 4: Sume todos los cuadrados de diferencia, es decir, 983

Paso 5: uso de la fórmula para calcular el valor de T

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9.16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • Valor T = -2,29

El valor de T obtenido se compara luego con el valor de T obtenido de la tabla utilizando el valor de p y el grado de libertad. Si el valor t calculado es mayor que el valor de la tabla en un nivel alfa predefinido específico, podemos rechazar la hipótesis nula diciendo que hay una diferencia entre las medias.

¿Cuándo se usa?

Se utiliza para comparar dos medias o proporciones. Además, utilizamos una prueba t cuando el usuario desconoce los parámetros de la población. En general, hay tres casos de uso de escenarios de prueba t, que son los siguientes:

  • Se utiliza una prueba t de muestra independiente cuando queremos comparar la media de dos grupos.
  • Se utiliza una prueba t de muestras pareadas cuando queremos comparar la media del mismo grupo pero en diferentes momentos.
  • La prueba t de una muestra se utiliza cuando necesitamos comparar la media de un grupo individual con una media desconocida.

Uso de la prueba T en Excel

  • En Excel, lo primero y más importante que necesitamos es la instalación de un complemento llamado Análisis de datos. Después de esto, debemos ir a "Datos" en la pestaña del menú y hacer clic en él. La opción "Análisis de datos" estará visible allí.
  • Para realizar una prueba T, necesitamos tener nuestros datos en un formato de columnas. Al hacer clic en "Análisis de datos", obtendremos una serie de pruebas estadísticas que podemos realizar y, de la lista, debemos elegir una prueba t y hacer clic en "Aceptar".
  • Aparece un cuadro de diálogo en el que debemos introducir los datos de la ruta 1 en el cuadro de rango variable 1 y también los datos de prueba 2 en los cuadros de rango variable 2. Por defecto, el valor de alfa permanece en 0.05, pero esto se puede cambiar según nuestras preferencias. Cuando todo esté bien, haga clic en "Aceptar".
  • Ahora podemos ver el resultado de nuestra prueba T en la hoja de Excel. El valor más importante a tener en cuenta es el valor P. Sobre lo que hemos seleccionado nuestro valor alfa, si nuestro valor P en Excel es menor que el valor alfa, podemos concluir que existe una diferencia material estadística entre las medias de nuestros dos conjuntos de valores.

Conclusión

La prueba T está dirigida a la prueba de hipótesis, que básicamente se utiliza para probar una hipótesis perteneciente a una población determinada. Nos dice el nivel de significancia de la diferencia entre los grupos, que generalmente se miden sobre la base de la media. Aquí básicamente averiguamos la diferencia entre las medias poblacionales y un valor hipotético.

Articulos interesantes...