### Guía Maestra: Pruebas de Hipótesis Paso a Paso Esta guía se centra en el "cómo" y el "de dónde" para la resolución de pruebas de hipótesis, incluyendo fórmulas de estadística descriptiva básica. --- ### 1. T de Student para Muestras Independientes **¿Cuándo usarla?** Cuando comparas dos grupos distintos (ej. Hombres vs. Mujeres) y tus datos son numéricos (escala de 0 a 100, tiempo, peso) y siguen una distribución normal. #### Ejercicio Resuelto 1: Tiempo de Reacción (Caso Clínico) **Enunciado:** Un investigador quiere saber si el consumo de cafeína afecta el tiempo de reacción. El **Grupo A (Cafeína)** tiene los siguientes tiempos (ms): $250, 260, 240$. El **Grupo B (Placebo)** tiene: $280, 290, 300$. ($\alpha = 0.05$). #### Paso 1: Extracción y Preparación de Datos Identificamos los valores crudos y calculamos lo básico para cada grupo: * **Grupo 1 ($n_1 = 3$):** $x_1 = \{250, 260, 240\}$ * **Media ($\bar{x}_1$):** $\frac{250+260+240}{3} = 250$ * **Varianza ($s_1^2$):** $\frac{(250-250)^2 + (260-250)^2 + (240-250)^2}{3-1} = \frac{0 + 100 + 100}{2} = 100$ * **Grupo 2 ($n_2 = 3$):** $x_2 = \{280, 290, 300\}$ * **Media ($\bar{x}_2$):** $\frac{280+290+300}{3} = 290$ * **Varianza ($s_2^2$):** $\frac{(280-290)^2 + (290-290)^2 + (300-290)^2}{3-1} = \frac{100 + 0 + 100}{2} = 100$ #### Paso 2: Planteamiento de Hipótesis * **Hipótesis Nula ($H_0$):** $\mu_1 = \mu_2$. "No existe diferencia significativa entre los tiempos de reacción de ambos grupos". * **Hipótesis Alterna ($H_1$):** $\mu_1 \neq \mu_2$. "Existe una diferencia significativa en los tiempos de reacción debido al consumo de cafeína". #### Paso 3: Cálculo del Estadístico $t$ 1. **Varianza Ponderada ($S_p^2$):** $$S_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} = \frac{(3-1)100 + (3-1)100}{3+3-2} = \frac{200+200}{4} = 100$$ 2. **Error Estándar de la diferencia:** $\sqrt{S_p^2 \cdot (\frac{1}{n_1} + \frac{1}{n_2})} = \sqrt{100 \cdot (\frac{1}{3} + \frac{1}{3})} = \sqrt{100 \cdot 0.666} \approx 8.16$ 3. **Valor de $t$ calculado ($t_c$):** $$t_c = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{S_p^2 (\frac{1}{n_1} + \frac{1}{n_2})}} = \frac{250 - 290}{8.16} \approx -4.90$$ #### Paso 4: Decisión e Interpretación * **Grados de Libertad ($gl$):** $n_1 + n_2 - 2 = 3+3-2 = 4$. * **Valor Crítico (Tabla $t$):** Para $gl=4$ y $\alpha=0.05$ (prueba bilateral), $t_{tab} = 2.776$. * **Comparación:** $|t_c| = |-4.90| = 4.90$. Como $4.90 > 2.776$. * **Conclusión:** Se rechaza $H_0$. Con un nivel de confianza del $95\%$, hay evidencia suficiente para afirmar que la cafeína afecta el tiempo de reacción. --- ### 2. U de Mann-Whitney (No Paramétrica) **¿Cuándo usarla?** Dos grupos independientes, pero los datos no son normales o son ordinales (ej. rangos de "muy bajo" a "muy alto"). #### Ejercicio Resuelto 1: Nivel de Estrés en Empleados **Enunciado:** Se mide el estrés (escala 1-10) en dos departamentos. **Ventas:** $9, 8, 7$. **Sistemas:** $4, 5, 3$. #### Paso 1: Extracción y Asignación de Rangos Juntamos todos los datos de menor a mayor para asignarles un puesto (rango): 1. Dato $3 \rightarrow$ Rango $1$ (Sistemas) 2. Dato $4 \rightarrow$ Rango $2$ (Sistemas) 3. Dato $5 \rightarrow$ Rango $3$ (Sistemas) 4. Dato $7 \rightarrow$ Rango $4$ (Ventas) 5. Dato $8 \rightarrow$ Rango $5$ (Ventas) 6. Dato $9 \rightarrow$ Rango $6$ (Ventas) * **Suma de Rangos Ventas ($R_1$):** $4+5+6 = 15$ * **Suma de Rangos Sistemas ($R_2$):** $1+2+3 = 6$ * $n_1 = 3, n_2 = 3$ #### Paso 2: Hipótesis * **$H_0$:** Las distribuciones de estrés en ambos departamentos son iguales. * **$H_1$:** El departamento de Ventas presenta niveles de estrés significativamente distintos a Sistemas. #### Paso 3: Cálculo de $U$ Calculamos $U$ para ambos grupos y nos quedamos con el menor: * $U_1 = n_1 n_2 + \frac{n_1(n_1+1)}{2} - R_1 = (3 \cdot 3) + \frac{3(3+1)}{2} - 15 = 9 + 6 - 15 = 0$ * $U_2 = n_1 n_2 + \frac{n_2(n_2+1)}{2} - R_2 = (3 \cdot 3) + \frac{3(3+1)}{2} - 6 = 9 + 6 - 6 = 9$ * **$U$ calculado = $\min(U_1, U_2) = 0$** #### Paso 4: Decisión * **Valor Crítico:** Para $n_1=3, n_2=3$, el $U$ crítico en tablas (para $\alpha=0.05$, bilateral) es $0$. * **Regla:** Si $U_{calc} \le U_{crit}$, se rechaza $H_0$. * **Conclusión:** $0 \le 0$, se rechaza $H_0$. El estrés en Ventas es significativamente mayor. --- ### 3. Prueba de Wilcoxon (Muestras Relacionadas) **¿Cuándo usarla?** Un solo grupo medido "Antes" y "Después" (muestras pareadas). #### Ejercicio Resuelto 1: Taller de Memoria **Enunciado:** Puntaje de memoria antes y después de un taller en 4 personas. **Sujeto 1:** Antes $10$, Después $15$. **Sujeto 2:** Antes $12$, Después $18$. **Sujeto 3:** Antes $14$, Después $13$. **Sujeto 4:** Antes $11$, Después $17$. #### Paso 1: Cálculo de Diferencias y Rangos Calculamos la diferencia ($D = \text{Desp} - \text{Ant}$) y les damos rango ignorando el signo ($|D|$). | Sujeto | Antes | Desp | $D$ | $|D|$ | Rango de $|D|$ | Signo | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 1 | 10 | 15 | $+5$ | 5 | 2 | $+$ | | 2 | 12 | 18 | $+6$ | 6 | 3.5* | $+$ | | 3 | 14 | 13 | $-1$ | 1 | 1 | $-$ | | 4 | 11 | 17 | $+6$ | 6 | 3.5* | $+$ | *\*Nota: Como el 6 se repite, promediamos los puestos 3 y 4: $(3+4)/2 = 3.5$* * **Suma Rangos Positivos ($W+$):** $2 + 3.5 + 3.5 = 9$ * **Suma Rangos Negativos ($W-$):** $1$ * **$T$ calculado (el menor de $W+$ o $W-$):** $1$ #### Paso 2: Hipótesis * **$H_0$:** El taller no genera cambios en la memoria ($\text{Mediana}_D = 0$). * **$H_1$:** El taller genera una mejora significativa en la memoria ($\text{Mediana}_D > 0$). #### Paso 3: Decisión * **Valor Crítico:** Para $n=4$ y $\alpha=0.05$ (prueba unilateral, ya que $H_1$ es "mejora"), el valor crítico para $T$ es $0$. * **Comparación:** $T_{calc} = 1$. Como $1 > 0$. * **Conclusión:** No se rechaza $H_0$ (en este caso extremo de muestra muy pequeña). Si el valor calculado fuera 0, sí habría diferencia. --- ### Guía Detallada de Resolución Estadística --- #### 1. T de Student para Muestras Independientes **Uso:** Comparar promedios de dos grupos distintos con datos numéricos normales. ##### Ejercicio 1: Rendimiento Académico (Método A vs. Método B) **Enunciado:** Se quiere saber si un nuevo método de estudio mejora las notas. El **Grupo 1** (Método Tradicional) tiene notas: $12, 14, 13$. El **Grupo 2** (Método Nuevo) tiene notas: $16, 18, 17$. ($\alpha = 0.05$). 1. **Extracción de Datos:** * Del texto extraemos los valores: $X_1 = \{12, 14, 13\}$ y $X_2 = \{16, 18, 17\}$. * Tamaños de muestra: $n_1 = 3$ y $n_2 = 3$. 2. **Cálculo de Descriptivos (Paso a paso):** * **Media $\bar{x}_1$:** $\frac{12+14+13}{3} = \frac{39}{3} = 13$ * **Media $\bar{x}_2$:** $\frac{16+18+17}{3} = \frac{51}{3} = 17$ * **Varianza $s_1^2$:** $\frac{(12-13)^2 + (14-13)^2 + (13-13)^2}{3-1} = \frac{1+1+0}{2} = 1$ * **Varianza $s_2^2$:** $\frac{(16-17)^2 + (18-17)^2 + (17-17)^2}{3-1} = \frac{1+1+0}{2} = 1$ 3. **Proposiciones de Hipótesis:** * **$H_0$ (Nula):** $\mu_1 = \mu_2$. "No existe diferencia significativa entre el promedio de notas del Método Tradicional y el Método Nuevo". * **$H_1$ (Alterna):** $\mu_1 \neq \mu_2$. "El promedio de notas del Método Nuevo es significativamente diferente al del Método Tradicional". 4. **Cálculo del Estadístico $t$:** * Varianza Ponderada ($S_p^2$): $\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} = \frac{(2 \cdot 1) + (2 \cdot 1)}{3+3-2} = \frac{4}{4} = 1$ * $t_c = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{S_p^2 (\frac{1}{n_1} + \frac{1}{n_2})}} = \frac{13 - 17}{\sqrt{1 \cdot (\frac{1}{3} + \frac{1}{3})}} = \frac{-4}{\sqrt{2/3}} \approx \frac{-4}{0.816} \approx -4.90$ 5. **Decisión:** Con $gl=4$, el valor de tabla ($t_{tab}$ para $\alpha=0.05$, bilateral) es $2.776$. Como $|t_c| = |-4.90| = 4.90 > 2.776$, **se rechaza $H_0$**. Las notas mejoraron significativamente. ##### Ejercicio 2: Tiempo de Respuesta (Hombres vs. Mujeres) **Enunciado:** Se mide el tiempo (seg) en una tarea de atención. **Hombres:** $5, 7$. **Mujeres:** $8, 10$. 1. **Extracción:** $n_1=2, n_2=2$. $X_1=\{5, 7\}, X_2=\{8, 10\}$. 2. **Descriptivos:** * $\bar{x}_1 = \frac{5+7}{2} = 6$; $s_1^2 = \frac{(5-6)^2+(7-6)^2}{2-1} = \frac{1+1}{1} = 2$ * $\bar{x}_2 = \frac{8+10}{2} = 9$; $s_2^2 = \frac{(8-9)^2+(10-9)^2}{2-1} = \frac{1+1}{1} = 2$ 3. **Hipótesis:** $H_0: \mu_H = \mu_M$ vs $H_1: \mu_H \neq \mu_M$. 4. **Estadístico:** $S_p^2 = \frac{(1\cdot 2)+(1\cdot 2)}{2+2-2} = \frac{4}{2} = 2$. $t_c = \frac{6-9}{\sqrt{2(\frac{1}{2}+\frac{1}{2})}} = \frac{-3}{\sqrt{2(1)}} = \frac{-3}{\sqrt{2}} \approx \frac{-3}{1.41} \approx -2.12$. 5. **Decisión:** Valor tabla ($gl=2$, $\alpha=0.05$, bilateral) es $4.303$. Como $|t_c| = |-2.12| = 2.12 #### 2. U de Mann-Whitney **Uso:** Comparar dos grupos independientes cuando los datos son ordinales o no normales. ##### Ejercicio 1: Calidad de Vida (Rural vs. Urbano) **Enunciado:** Escala del 1 al 5. **Rural:** $5, 4, 5$. **Urbano:** $2, 3, 1$. 1. **Extracción y Ordenamiento:** * Datos combinados ordenados: $\{1, 2, 3, 4, 5, 5\}$. * Asignamos rangos: * $1 \rightarrow 1$ (Urbano) * $2 \rightarrow 2$ (Urbano) * $3 \rightarrow 3$ (Urbano) * $4 \rightarrow 4$ (Rural) * $5 \rightarrow (5+6)/2 = 5.5$ (Rural) * $5 \rightarrow (5+6)/2 = 5.5$ (Rural) 2. **Suma de Rangos:** * $R_{\text{Rural}} = 4 + 5.5 + 5.5 = 15$ * $R_{\text{Urbano}} = 1 + 2 + 3 = 6$ * $n_R=3, n_U=3$. 3. **Hipótesis:** * **$H_0$:** La calidad de vida es igual en ambas zonas. * **$H_1$:** La calidad de vida en la zona rural es significativamente distinta a la urbana. 4. **Cálculo de $U$:** * $U_R = n_R n_U + \frac{n_R(n_R+1)}{2} - R_R = (3 \cdot 3) + \frac{3(4)}{2} - 15 = 9 + 6 - 15 = 0$ * $U_U = n_R n_U + \frac{n_U(n_U+1)}{2} - R_U = (3 \cdot 3) + \frac{3(4)}{2} - 6 = 9 + 6 - 6 = 9$ * $U_{\text{menor}} = \min(0, 9) = 0$. 5. **Decisión:** El $U$ crítico para $n_1=3, n_2=3$ (para $\alpha=0.05$, bilateral) es $0$. Como $U_{calc} = 0 \le U_{crit} = 0$, **se rechaza $H_0$**. ##### Ejercicio 2: Agresividad en Niños (Grupo Control vs. Experimental) **Enunciado:** Frecuencia de conductas. **Control:** $10, 12$. **Experimental:** $2, 4$. 1. **Rangos:** * Datos combinados ordenados: $\{2, 4, 10, 12\}$ * $2 \rightarrow 1$ (Exp) * $4 \rightarrow 2$ (Exp) * $10 \rightarrow 3$ (Control) * $12 \rightarrow 4$ (Control) 2. **Sumas:** $R_{exp} = 1+2=3$; $R_{cont} = 3+4=7$. * $n_{exp}=2, n_{cont}=2$. 3. **Hipótesis:** $H_0$: Las distribuciones de conductas son iguales. $H_1$: El grupo experimental tiene menos conductas. 4. **Cálculo:** * $U_{exp} = (2 \cdot 2) + \frac{2(3)}{2} - 3 = 4+3-3 = 4$. * $U_{cont} = (2 \cdot 2) + \frac{2(3)}{2} - 7 = 4+3-7 = 0$. * $U_{\text{menor}} = 0$. 5. **Decisión:** Valor crítico para $n=2,2$ (para $\alpha=0.05$, unilateral) es $0$. Como $U_{calc} = 0 \le U_{crit} = 0$, **se rechaza $H_0$**. --- #### 3. Prueba de Wilcoxon **Uso:** Comparar el mismo grupo "Antes" y "Después". ##### Ejercicio 1: Ansiedad Pre-Examen y Post-Examen **Enunciado:** 4 alumnos evaluados antes y después de una charla de relajación. | Sujeto | Antes | Después | Diferencia ($D = \text{Desp} - \text{Ant}$) | $|D|$ | Rango de $|D|$ | Signo | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | A | 20 | 15 | $-5$ | 5 | 3 | $-$ | | B | 18 | 10 | $-8$ | 8 | 4 | $-$ | | C | 15 | 14 | $-1$ | 1 | 1 | $-$ | | D | 12 | 10 | $-2$ | 2 | 2 | $-$ | 1. **Extracción:** Se restan los valores de cada fila. Se ignoran las diferencias de $0$. 2. **Hipótesis:** * **$H_0$:** La charla no reduce la ansiedad ($\text{Mediana}_D = 0$). * **$H_1$:** La charla reduce significativamente la ansiedad ($\text{Mediana}_D ### ¿De dónde saco los datos? (Checklist para el examen) 1. **$n$ (Tamaño de la muestra):** Cuenta cuántos números hay en cada lista o busca frases como "se evaluó a 15 personas". 2. **Medias ($\bar{x}$):** Si el ejercicio no te la da, suma los datos de ese grupo y divide entre su $n$. * **Fórmula:** $\bar{x} = \frac{\sum x_i}{n}$ 3. **Varianza ($s^2$):** Es la "dispersión". Si te dan la Desviación Estándar ($s$), elévala al cuadrado ($s^2$). Si no, calcula: * **Fórmula:** $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$ (para muestra) 4. **Diferencia ($D$):** Solo en Wilcoxon. Resta siempre la segunda columna (Después) menos la primera (Antes). * **Fórmula:** $D = X_{\text{Después}} - X_{\text{Antes}}$ 5. **Rangos:** Solo en Mann-Whitney y Wilcoxon. Ordena de menor a mayor los valores absolutos de las diferencias (Wilcoxon) o todos los datos combinados (Mann-Whitney). Si hay empate (ej. dos "5"), dales el promedio de sus posiciones.