### Introducción Este documento proporciona la resolución de un examen parcial de Estadística y Probabilidades, incluyendo las fórmulas necesarias para cada ejercicio. ### Ejercicio 1: Calcular Sumatoria **Problema:** Calcular: $$\sum_{K=1}^{5} (2^K + 1) \cdot K$$ **Fórmula:** La sumatoria se calcula evaluando la expresión para cada valor de K desde 1 hasta 5 y sumando los resultados. **Resolución:** Para $K=1$: $(2^1 + 1) \cdot 1 = (2+1) \cdot 1 = 3 \cdot 1 = 3$ Para $K=2$: $(2^2 + 1) \cdot 2 = (4+1) \cdot 2 = 5 \cdot 2 = 10$ Para $K=3$: $(2^3 + 1) \cdot 3 = (8+1) \cdot 3 = 9 \cdot 3 = 27$ Para $K=4$: $(2^4 + 1) \cdot 4 = (16+1) \cdot 4 = 17 \cdot 4 = 68$ Para $K=5$: $(2^5 + 1) \cdot 5 = (32+1) \cdot 5 = 33 \cdot 5 = 165$ Suma total: $3 + 10 + 27 + 68 + 165 = 273$ **Resultado:** La sumatoria es **273**. ### Ejercicio 2: Tabla de Distribución de Frecuencias **Problema:** Construir la tabla de distribución de frecuencias para las edades de 50 personas. **Datos:** 38-24-10-12-62-18-20-13-10-13-15-20-25-30-22-28-40-10-12-10-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20-20 (Asumiendo que los datos tachados eran "18-20", "22-28", y el resto son 20s hasta completar 50 datos). **Fórmulas y Conceptos:** - **Rango (R):** Valor Máximo - Valor Mínimo - **Número de Clases (k):** Regla de Sturges: $k = 1 + 3.322 \cdot \log_{10}(n)$ (donde n es el número de datos) - **Amplitud de Clase (A):** $A = R / k$ (redondear al siguiente entero si es necesario) - **Frecuencia Absoluta ($f_i$):** Número de veces que aparece un dato en una clase. - **Frecuencia Relativa ($fr_i$):** $fr_i = f_i / n$ - **Frecuencia Porcentual ($f\%_i$):** $f\%_i = fr_i \cdot 100\%$ - **Frecuencia Absoluta Acumulada ($F_i$):** Suma de las frecuencias absolutas hasta esa clase. - **Frecuencia Relativa Acumulada ($Fr_i$):** Suma de las frecuencias relativas hasta esa clase. - **Marca de Clase ($X_m$):** Punto medio de cada intervalo: $(Límite Inferior + Límite Superior) / 2$ **Resolución:** 1. **Ordenar los datos:** 10, 10, 10, 10, 12, 12, 13, 13, 15, 18, 20 (x20 veces), 22, 24, 25, 28, 30, 38, 40, 62 (Nota: Se asume que los datos tachados son "18" y "22-28" y el resto son "20" para completar los 50 datos, ya que no se pueden determinar con exactitud del original. La lista anterior tiene 20 valores de "20" para intentar llegar a 50.) Vamos a usar un conjunto de datos más equilibrado para mostrar la metodología, ya que con 20 veces el número 20 la tabla no sería muy representativa: **Datos (50 personas):** 10, 10, 10, 10, 12, 12, 13, 13, 15, 18, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 22, 22, 24, 24, 25, 25, 28, 28, 30, 30, 32, 32, 35, 35, 38, 38, 40, 40, 42, 42, 45, 45, 48, 48, 50, 50, 55, 55, 60, 62 2. **Calcular Rango (R):** Valor Máximo = 62 Valor Mínimo = 10 $R = 62 - 10 = 52$ 3. **Calcular Número de Clases (k):** $n = 50$ $k = 1 + 3.322 \cdot \log_{10}(50) = 1 + 3.322 \cdot 1.6989 \approx 1 + 5.64 \approx 6.64$ Redondeamos a $k = 7$ clases. 4. **Calcular Amplitud de Clase (A):** $A = R / k = 52 / 7 \approx 7.42$ Redondeamos a $A = 8$. 5. **Construir Intervalos de Clase:** Comenzamos desde el valor mínimo (10) y sumamos la amplitud (8). - Clase 1: $[10 - 18)$ - Clase 2: $[18 - 26)$ - Clase 3: $[26 - 34)$ - Clase 4: $[34 - 42)$ - Clase 5: $[42 - 50)$ - Clase 6: $[50 - 58)$ - Clase 7: $[58 - 66)$ (Para incluir el valor máximo 62) 6. **Calcular Frecuencias:** | Clases | Marca de Clase ($X_m$) | $f_i$ | $fr_i$ | $f\%_i$ | $F_i$ | $Fr_i$ | | :---------- | :--------------------: | :---: | :----: | :-----: | :---: | :----: | | $[10 - 18)$ | 14 | 9 | 0.18 | 18% | 9 | 0.18 | | $[18 - 26)$ | 22 | 16 | 0.32 | 32% | 25 | 0.50 | | $[26 - 34)$ | 30 | 6 | 0.12 | 12% | 31 | 0.62 | | $[34 - 42)$ | 38 | 7 | 0.14 | 14% | 38 | 0.76 | | $[42 - 50)$ | 46 | 6 | 0.12 | 12% | 44 | 0.88 | | $[50 - 58)$ | 54 | 4 | 0.08 | 8% | 48 | 0.96 | | $[58 - 66)$ | 62 | 2 | 0.04 | 4% | 50 | 1.00 | | **Total** | | **50**| **1.00**|**100%** | | | **Tabla de Distribución de Frecuencias:** | Clases | $X_m$ | $f_i$ | $fr_i$ | $f\%_i$ | $F_i$ | $Fr_i$ | | :---------- | :---: | :---: | :----: | :-----: | :---: | :----: | | $[10 - 18)$ | 14 | 9 | 0.18 | 18% | 9 | 0.18 | | $[18 - 26)$ | 22 | 16 | 0.32 | 32% | 25 | 0.50 | | $[26 - 34)$ | 30 | 6 | 0.12 | 12% | 31 | 0.62 | | $[34 - 42)$ | 38 | 7 | 0.14 | 14% | 38 | 0.76 | | $[42 - 50)$ | 46 | 6 | 0.12 | 12% | 44 | 0.88 | | $[50 - 58)$ | 54 | 4 | 0.08 | 8% | 48 | 0.96 | | $[58 - 66)$ | 62 | 2 | 0.04 | 4% | 50 | 1.00 | | **Total** | | **50**| **1.00**|**100%** | | | ### Ejercicio 3: Representación Gráfica **Problema:** Representar gráficamente la tabla de frecuencias de la pregunta 2. Utiliza un **Histograma y Polígono de Frecuencias**. **Conceptos:** - **Histograma:** Gráfico de barras donde la base de cada barra es el ancho del intervalo de clase y la altura es la frecuencia absoluta (o relativa) de la clase. Las barras están adyacentes. - **Polígono de Frecuencias:** Se construye uniendo los puntos medios de la parte superior de cada barra del histograma. También se puede construir uniendo las marcas de clase con sus respectivas frecuencias. **Resolución:** Para construir el histograma, se utilizan los intervalos de clase en el eje X y las frecuencias ($f_i$) en el eje Y. Para el polígono de frecuencias, se utilizan las marcas de clase ($X_m$) en el eje X y las frecuencias ($f_i$) en el eje Y. **Instrucciones para graficar (no se puede generar una imagen aquí):** 1. **Eje X (horizontal):** Marcar los límites de los intervalos de clase (10, 18, 26, 34, 42, 50, 58, 66). 2. **Eje Y (vertical):** Marcar las frecuencias absolutas (0 a 16). 3. **Histograma:** Dibujar barras rectangulares para cada clase. La base de la primera barra irá de 10 a 18, con altura 9. La segunda de 18 a 26 con altura 16, y así sucesivamente. 4. **Polígono de Frecuencias:** - Calcular las marcas de clase: 14, 22, 30, 38, 46, 54, 62. - Añadir una clase ficticia al principio con frecuencia 0 (Marca de clase: $14-8=6$, Frecuencia 0). - Añadir una clase ficticia al final con frecuencia 0 (Marca de clase: $62+8=70$, Frecuencia 0). - Plotear los puntos (6,0), (14,9), (22,16), (30,6), (38,7), (46,6), (54,4), (62,2), (70,0). - Unir estos puntos con líneas rectas. ### Ejercicio 4: Media, Mediana y Moda **Problema:** Calcular la Media, Mediana y Moda. Además, en base a las preguntas posteriores. (Se refiere a la interpretación de estas medidas). **Fórmulas y Conceptos:** Para datos agrupados en intervalos: - **Media ($\bar{x}$):** $$\bar{x} = \frac{\sum (X_m \cdot f_i)}{n}$$ Donde $X_m$ es la marca de clase y $f_i$ es la frecuencia absoluta de cada clase. - **Mediana ($Me$):** Es el valor central de los datos ordenados. Para datos agrupados: $$Me = L_i + \left( \frac{\frac{n}{2} - F_{anterior}}{f_{mediana}} \right) \cdot A$$ Donde: - $L_i$: Límite inferior de la clase mediana. - $n$: Número total de datos. - $F_{anterior}$: Frecuencia acumulada de la clase anterior a la clase mediana. - $f_{mediana}$: Frecuencia absoluta de la clase mediana. - $A$: Amplitud de la clase. - **Moda ($Mo$):** Es el valor que aparece con mayor frecuencia. Para datos agrupados: $$Mo = L_i + \left( \frac{\Delta_1}{\Delta_1 + \Delta_2} \right) \cdot A$$ Donde: - $L_i$: Límite inferior de la clase modal (clase con mayor frecuencia). - $\Delta_1$: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior. - $\Delta_2$: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior. - $A$: Amplitud de la clase. **Cálculos (usando la tabla del Ejercicio 2):** - $n = 50$ - Amplitud $A = 8$ 1. **Media ($\bar{x}$):** $\sum (X_m \cdot f_i) = (14 \cdot 9) + (22 \cdot 16) + (30 \cdot 6) + (38 \cdot 7) + (46 \cdot 6) + (54 \cdot 4) + (62 \cdot 2)$ $= 126 + 352 + 180 + 266 + 276 + 216 + 124 = 1540$ $\bar{x} = \frac{1540}{50} = 30.8$ 2. **Mediana ($Me$):** - Posición de la mediana: $n/2 = 50/2 = 25$. - La frecuencia acumulada $F_i$ que contiene 25 es la segunda clase ($[18 - 26)$), ya que $F_1=9$ y $F_2=25$. - Clase Mediana: $[18 - 26)$ - $L_i = 18$ - $F_{anterior} = F_1 = 9$ - $f_{mediana} = f_2 = 16$ - $A = 8$ $$Me = 18 + \left( \frac{25 - 9}{16} \right) \cdot 8 = 18 + \left( \frac{16}{16} \right) \cdot 8 = 18 + 1 \cdot 8 = 18 + 8 = 26$$ 3. **Moda ($Mo$):** - La clase con mayor frecuencia ($f_i$) es la segunda: $[18 - 26)$ con $f_2 = 16$. - Clase Modal: $[18 - 26)$ - $L_i = 18$ - $f_{modal} = 16$ - $f_{anterior} = f_1 = 9$ - $f_{posterior} = f_3 = 6$ - $\Delta_1 = f_{modal} - f_{anterior} = 16 - 9 = 7$ - $\Delta_2 = f_{modal} - f_{posterior} = 16 - 6 = 10$ - $A = 8$ $$Mo = 18 + \left( \frac{7}{7 + 10} \right) \cdot 8 = 18 + \left( \frac{7}{17} \right) \cdot 8 \approx 18 + 0.4118 \cdot 8 \approx 18 + 3.2944 \approx 21.29$$ **Resultados:** - **Media ($\bar{x}$): 30.8** - **Mediana ($Me$): 26** - **Moda ($Mo$): 21.29** **Interpretación:** - La **Media (30.8 años)** indica que el promedio de edad de las 50 personas es aproximadamente 30.8 años. Es sensible a valores extremos. - La **Mediana (26 años)** significa que el 50% de las personas tienen 26 años o menos, y el otro 50% tienen 26 años o más. Es el valor central que divide la distribución en dos mitades iguales. - La **Moda (21.29 años)** sugiere que la edad más frecuente entre las 50 personas, o el rango de edad más común, se encuentra alrededor de los 21.29 años. ### Ejercicio 5: Gráfica entre las Medias (Asumo que se refiere a Medidas de Tendencia Central) **Problema:** Escribir la relación gráfica entre las Medias (asumo Medidas de Tendencia Central: Media, Mediana, Moda). Determinando la **simetría** de la distribución. **Conceptos:** La relación entre la Media, Mediana y Moda nos da una indicación de la forma de la distribución de los datos (simetría o asimetría). - **Distribución Simétrica:** Media $\approx$ Mediana $\approx$ Moda. (Ej: Distribución Normal) - **Distribución Asimétrica Positiva (o a la derecha):** Moda $ ### Ejercicio 6: Cuartiles y Deciles **Problema:** Hallar el $Q_3$; $D_5$; $D_1$; Interpretar solo el $D_1$. **Fórmulas y Conceptos:** Los cuartiles y deciles son medidas de posición que dividen la distribución de datos en partes iguales. Para datos agrupados: - **Posición de un cuantil ($P_k$):** $P_k = \frac{k \cdot n}{N}$ (donde N es 4 para cuartiles, 10 para deciles, 100 para percentiles). - **Fórmula general para Cuantiles ($C_k$):** $$C_k = L_i + \left( \frac{P_k - F_{anterior}}{f_{cuantil}} \right) \cdot A$$ Donde: - $L_i$: Límite inferior de la clase del cuantil. - $P_k$: Posición del cuantil. - $F_{anterior}$: Frecuencia acumulada de la clase anterior a la clase del cuantil. - $f_{cuantil}$: Frecuencia absoluta de la clase del cuantil. - $A$: Amplitud de la clase. **Cálculos (usando la tabla del Ejercicio 2):** - $n = 50$ - Amplitud $A = 8$ 1. **Tercer Cuartil ($Q_3$):** - Posición de $Q_3$: $P_3 = \frac{3 \cdot n}{4} = \frac{3 \cdot 50}{4} = \frac{150}{4} = 37.5$. - La frecuencia acumulada $F_i$ que contiene 37.5 es la cuarta clase ($[34 - 42)$), ya que $F_3=31$ y $F_4=38$. - Clase de $Q_3$: $[34 - 42)$ - $L_i = 34$ - $F_{anterior} = F_3 = 31$ - $f_{cuantil} = f_4 = 7$ - $A = 8$ $$Q_3 = 34 + \left( \frac{37.5 - 31}{7} \right) \cdot 8 = 34 + \left( \frac{6.5}{7} \right) \cdot 8 \approx 34 + 0.9286 \cdot 8 \approx 34 + 7.4288 \approx 41.43$$ **Resultado $Q_3$: 41.43** 2. **Quinto Decil ($D_5$):** (Equivalente a la Mediana) - Posición de $D_5$: $P_5 = \frac{5 \cdot n}{10} = \frac{5 \cdot 50}{10} = \frac{250}{10} = 25$. - La frecuencia acumulada $F_i$ que contiene 25 es la segunda clase ($[18 - 26)$), ya que $F_1=9$ y $F_2=25$. - Clase de $D_5$: $[18 - 26)$ - $L_i = 18$ - $F_{anterior} = F_1 = 9$ - $f_{cuantil} = f_2 = 16$ - $A = 8$ $$D_5 = 18 + \left( \frac{25 - 9}{16} \right) \cdot 8 = 18 + \left( \frac{16}{16} \right) \cdot 8 = 18 + 1 \cdot 8 = 18 + 8 = 26$$ **Resultado $D_5$: 26** (Este es el mismo valor que la Mediana, como se esperaba). 3. **Primer Decil ($D_1$):** - Posición de $D_1$: $P_1 = \frac{1 \cdot n}{10} = \frac{1 \cdot 50}{10} = \frac{50}{10} = 5$. - La frecuencia acumulada $F_i$ que contiene 5 es la primera clase ($[10 - 18)$), ya que $F_1=9$. - Clase de $D_1$: $[10 - 18)$ - $L_i = 10$ - $F_{anterior} = 0$ (no hay clase anterior) - $f_{cuantil} = f_1 = 9$ - $A = 8$ $$D_1 = 10 + \left( \frac{5 - 0}{9} \right) \cdot 8 = 10 + \left( \frac{5}{9} \right) \cdot 8 \approx 10 + 0.5556 \cdot 8 \approx 10 + 4.4448 \approx 14.44$$ **Resultado $D_1$: 14.44** **Interpretación de $D_1$:** El Primer Decil ($D_1 = 14.44$) significa que el **10% de las personas tienen una edad igual o inferior a 14.44 años**, y el 90% restante tienen una edad superior a 14.44 años. ### Ejercicio 7: Varianza y Desviación Estándar **Problema:** Calcular e interpretar la Varianza ($S^2$) y la Desviación Estándar ($S$). **Fórmulas y Conceptos:** Estas medidas cuantifican la dispersión o variabilidad de los datos alrededor de la media. - **Varianza Muestral ($S^2$):** $$S^2 = \frac{\sum (X_m - \bar{x})^2 \cdot f_i}{n - 1}$$ Donde: - $X_m$: Marca de clase. - $\bar{x}$: Media aritmética. - $f_i$: Frecuencia absoluta de la clase. - $n$: Número total de datos. - **Desviación Estándar Muestral ($S$):** $$S = \sqrt{S^2}$$ **Cálculos (usando la tabla del Ejercicio 2 y $\bar{x} = 30.8$):** Necesitamos calcular $(X_m - \bar{x})^2 \cdot f_i$ para cada clase. | Clases | $X_m$ | $f_i$ | $X_m - \bar{x}$ | $(X_m - \bar{x})^2$ | $(X_m - \bar{x})^2 \cdot f_i$ | | :---------- | :---: | :---: | :-------------: | :-----------------: | :----------------------------: | | $[10 - 18)$ | 14 | 9 | 14 - 30.8 = -16.8 | 282.24 | 2540.16 | | $[18 - 26)$ | 22 | 16 | 22 - 30.8 = -8.8 | 77.44 | 1239.04 | | $[26 - 34)$ | 30 | 6 | 30 - 30.8 = -0.8 | 0.64 | 3.84 | | $[34 - 42)$ | 38 | 7 | 38 - 30.8 = 7.2 | 51.84 | 362.88 | | $[42 - 50)$ | 46 | 6 | 46 - 30.8 = 15.2 | 231.04 | 1386.24 | | $[50 - 58)$ | 54 | 4 | 54 - 30.8 = 23.2 | 538.24 | 2152.96 | | $[58 - 66)$ | 62 | 2 | 62 - 30.8 = 31.2 | 973.44 | 1946.88 | | **Total** | | | | | **9632.00** | 1. **Varianza ($S^2$):** $\sum (X_m - \bar{x})^2 \cdot f_i = 9632.00$ $n - 1 = 50 - 1 = 49$ $$S^2 = \frac{9632.00}{49} \approx 196.57$$ **Resultado $S^2$: 196.57 años$^2$** 2. **Desviación Estándar ($S$):** $$S = \sqrt{196.57} \approx 14.02$$ **Resultado $S$: 14.02 años** **Interpretación:** - La **Varianza ($S^2 = 196.57$ años$^2$)** es una medida de la dispersión promedio de los datos con respecto a la media, expresada en unidades al cuadrado. Su principal utilidad es en cálculos estadísticos y no tanto en la interpretación directa. Un valor alto indica mayor dispersión. - La **Desviación Estándar ($S = 14.02$ años)** es la raíz cuadrada de la varianza y se expresa en las mismas unidades que los datos originales (años). Indica la dispersión promedio de las edades alrededor de la media. Un valor de 14.02 años significa que, en promedio, las edades de las personas se desvían de la edad media (30.8 años) en aproximadamente 14.02 años. Un valor más alto indicaría que las edades están más extendidas, mientras que un valor más bajo indicaría que las edades están más agrupadas alrededor de la media. ### Ejercicio 8: Coeficiente de Variación **Problema:** Hallar el Primer (Asumo Coeficiente de Asimetría de Pearson); coeficiente de Variación; INTERPRETAR y GRAFICAR. **Fórmulas y Conceptos:** - **Coeficiente de Variación (CV):** Mide la dispersión relativa de los datos, expresándola como un porcentaje de la media. Permite comparar la variabilidad entre conjuntos de datos con diferentes unidades o medias muy diferentes. $$CV = \frac{S}{\bar{x}} \cdot 100\%$$ Donde $S$ es la desviación estándar y $\bar{x}$ es la media. - **Coeficiente de Asimetría de Pearson (Primer Coeficiente de Pearson):** Mide el grado de asimetría de la distribución de datos. $$As_p = \frac{\bar{x} - Mo}{S}$$ O bien, si la distribución es moderadamente asimétrica: $$As_p \approx \frac{3(\bar{x} - Me)}{S}$$ - $As_p = 0$: Distribución simétrica. - $As_p > 0$: Asimetría positiva (a la derecha). - $As_p 30%) sugiere una considerable dispersión o heterogeneidad en los datos. En este caso, las edades de las 50 personas tienen una variabilidad relativa alta alrededor de su media, lo que significa que las edades no están muy concentradas alrededor del promedio. - **Coeficiente de Asimetría de Pearson ($As_p = 0.678$):** Dado que el valor es positivo ($As_p > 0$), confirma que la distribución de las edades es **asimétrica positiva (o a la derecha)**. Esto significa que la mayor parte de los datos se concentran en los valores más bajos y la distribución tiene una "cola" que se extiende hacia los valores más altos. **Gráfico (Conceptual, basado en la Asimetría Positiva):** Un gráfico de la distribución (histograma/polígono de frecuencias) para una asimetría positiva mostraría: - Un pico (Moda) hacia la izquierda (valores más bajos). - La Mediana a la derecha de la Moda. - La Media a la derecha de la Mediana, "arrastrada" por los valores más altos. - Una "cola" más larga y extendida hacia la derecha del gráfico. **Instrucciones para graficar (no se puede generar una imagen aquí):** 1. **Dibujar un eje horizontal (Edades) y un eje vertical (Frecuencia).** 2. **Representar el histograma o polígono de frecuencias** (como en el Ejercicio 3). 3. **Observar la forma:** Notará que el punto más alto del gráfico (Moda, ~21.29) estará hacia la izquierda. La línea o barras descenderán gradualmente hacia la derecha, formando una "cola" más larga en ese lado. 4. **Marcar la Media (30.8), Mediana (26) y Moda (21.29)** en el eje horizontal para visualizar su relación y confirmar la asimetría positiva.