Sie sind auf Seite 1von 12
Caracterizacién de variables cuantitativas para datos no agrupados 2.1 Datos no agrupados ara caracterizar una variable cuantitativa, cuyos datos no estin agrupados, se utilizan: * Medidas de tendencia central. * Medidas de posicién. * Diagrama de cajas y bigotes. 2.1.1 Medidas de tendencia central ‘Las medidas de tendencia central son valores que suelen ubicarse hacia el centro dela cistribucidn de datos. Las principales medidas de tendencia central son: la media aritmética, la me- diana y la moda. * Media aritmética o promedio La media aritmética 0 promedio de un conjunto de datos es una medida de tendencia central porque tiende a ubicarse hacia el centro de los datos. Con frecuencia se toma ‘como el valor representative del conjunto de datos. Se simboliza X. Para hallar la media se suman los valores y, luego, se divide este resultado entre Ja cantidad de datos. Si se consideran 1 datos xy, xX, Xy -) Xy entonces: Ft yt yt ty, , Xa Artur ett, nes el nimero de datos Para ilustrar la forma de cflculo de la medida asimétrica consideremos la si- guiente situaci6n. Con el énimo de mejorar el servicio, una empresa de teléfonos ha creado una central de quejas por facturacién. La siguiente tabla muestra el ntimero de liamadas que recibié la central durante su primera semana de funcionamiento. ek 9 2 10 4 7 aeanfrong. QO Estindar mt Pensamiento aleatorio oO Para hallar la media se suman los siete datos y este resultado se divide entre siete. Asi se obtiene el promedio semanal, _OF1D4 1044474349 X~ Sw B= 771 Con este dato, se puede concluir que la central recibi6 un promedio de 8 Hama- das semanales relacionadas con quejas. * Mediana La mediana es el dato que civide un conjunto de datos en dos partes porcentualmente Jguales cuando el conjunto esté ordenado en forma ascendente 0 descendente. ‘se simboliza Para calcular la mediana se ordena el conjunto de datos de menor a mayor y luego, se ubica el valor que esté en el centro de ellos. ‘* Siel nimero de datos es impar, la mediana es el dato que se ubica en la mitad y siempre pertenece al conjunto. + Si el ntimero de datos es par, la mediana corresponde al promedio de los dos datos de la mitad. En algunos casos este valor no pertenece al conjunto. Para obtener la mediana en el conjunto de datos del que corresponden al ni- mero de Hamadas que recibié la central durante su primera semana, se procede dela siguiente manera: Primero, se ordena el conjunto de datos: 34799 0 2 Luego, como hay un nimero impar de datos se busca el dato que esté en la mitad. 4 7(9)9 10 12 Finalmente, se determina que la mediana es 9, por tanto, Como conclusién de la medida obtenida se tiene que: En la primera semana de funcionamiento, el 50% de los dias, la central recibi6 9 lamadas 0 menos y el otro 50% de los dias, la central recibi6 9 Hamadas 0 mas. * Moda La moda en un conjunto de datos no agrupados es el dato que més se repite. Se simboliza X Algunos conjuntos no tienen moda porque todos los valores aparecen sélo una vez y otros conjuntos pueden tener més de una moda. La moda correspondiente al ntimero de lamadas de Ia central es 9 puesto que ¢s el dato que més se repite. Luego, X =9, Nivel Amt Médulo2 Ejercicios resueltos El preparador fisico de un equipo de fitbol tomé el registro de la masa de 8 futbo- listas. La mase promedio del grupo es: 77 kg y las masas de 7 de los futbolistas son 71 kg, 83 kg, 73 kg, 72 kg, 79 kg, 82 kg y 80 kg, respectivamente. Hallar: 1. Lamasa del futbolista que falta 2. Lamediana del conjunto de datos e interpretarla. 3. Lamoda e interpretarta Solucion 11. Supongamos que m es el dato faltante. Ast: a aT Se plantea una ecuacién m+540=616 —Sesuman os términos del numeradoryy se despeja lavariable m m =616~540 m=76 Lego, a masa del futbolista que falta es 76 kg 2. Se organizan los datos de menor a mayor. 11, 72, 73, 76,79, 80, 82, 83 Como hay 8 datos, para hallar la mediana, se busca el promedio de los dos datos que estén en el centro. y+ as La mediana es 77,5 kg, lo cual indica que para el 50% de los futbolistas del equipo la masa es menor o igual que 77,5 kgy para el 50% de los futbolistas la masa es mayor o igual 77,5 kg. =75 El conjunto de datos carece de moda ya que la frecuencia de cada uno de los valores es igual a uno es decir que no hay un dato que se presente con mayor frecuencia, 1© Estandar m Pensamientoaleatorio GE sxindarm Pensamien leo Consideremos que en el conjunto 71, 72, 73, 76, 79, 80, 82, 83 si cambia el dato 83 por 90 se tiene que: Ku 71472473476 +79 +80+82 +90 7 X=77,9=80 Es decir que la media artimética aumenta, en tanto que la mediana no varia, es decir X = 77,5. 2.1.2 Medidas de posicién Las medidas de posicién dividen el conjunto de datos en partes porcentuales € iguales. Las medidas de posicién mas importantes son los cuartiles, los deciles y los percentiles. * Cuartiles Los cuartiles son valores de la variable que dividen el conjunto ordenado de datos en cuatro partes iguales. Cada una de estas partes incluye el 25% del total de los datos. Los cuartiles son tres y se simbolizan como Q,, Q, ¥ Qa. + El primer cuartil indica que a lo sumo el 25% de los datos son menores que 41, y a Io sumo el 75% de Ios datos son mayores que él. A continuacién se presenta esta representacién: 2, 25% delos datos 759% de os datos pS oe fi MM ee Bi * El segundo cuartil Q, es equivalente a la mediana y divide los datos en dos partes porcentualmente iguales cuando estén ordenados ascendente o des- cendente. * El tercer cuartil, Q,, indica que maximo el 75% de los datos son menores que 4, y maximo el 25% de los datos son mayores que él. @ 75% de los datos 125% de los datos a es, fe ee eee Para calcular el valor de los cuartiles se ordenan los datos y se encuentra la me- diana que corresponde al segundo cuartil Q,, con los datos menores o iguales que Q, se calcula una nueva mediana que corresponde a Q,; y con los datos mayores o iguales que Q, se calcula otra nueva mediana que corresponde a Q,. Los cuartiles correspondientes a las 8 masas de Ios futbolistas se calculan de la siguiente forma: Para el primer cuartil Q, se tlenen en cuenta los cuatro datos menores o iguales que la mediana: 71 72 73 76 AMM OR Posteriormente, se calcula la mediana de este grupo de datos. EI primer cuartil Q, es 72,5 e indica que para el 25% de los futbolistas la masa es menor 0 igual a 72,5 kg, EI segundo cuartil es el valor de la mediana, es decir: Q.=77,5 Para el tercer cuartil Q, se toman los cuatro datos mayores 0 iguales que la me- diana: 79 80 82 83 Posteriormente, se calcula la mediana para este grupo de datos, asf: 80 + 82 a) Luego, para el 75% de los futbolistas la masa es menor o igual a 81 kg. Ejercicios resueltos El departamento de ventas de un cinema ubi- cado en la ciudad desea hacer un estudio Teferente al éxito de la pelicula que se esté presentando a las 9:00 p.m. El registro de la asistencia a la funcién mencionada durante los Ultimos 11 dias es el siguiente: 142.150 120 «135 °« 102124 98 117 «136 «90 (106 ‘a. Analizar los datos usando la media y los cuartiles, b. El departamento piensa que si el promedio de asistencia en los 11 dias supera ‘125 personas, entonces, se proyectars la funcién tres dias ms. Es posible que se proyecte la funcién nuevamente? Solucién a. La media de los datos 142 + 150 + 120 + 135 + 102 + 124 + 98 +117 +136 + 90 + 106 i 1 = 1320 11 = 120 Para hallar los cuartiles, en primer lugar, se ordenan los datos de menor a mayor. Ast: 90 98 102 106 117 120 124 135 136 142 150 GO sind Pensamients latrio Como el conjunto esté formado por 11 datos, la mediana esté en la posicién 6. Luego, X =120=Q, Para calcular el primer cuartil Q,,se toman los datos menores que 120 es deci, 90 98 102 106 117 Luego, para los cinco datos ta mediana esté en la posicién 3. Ast: 9 98 102 106 117 Entonces Q, = 102 Para calcular el tercer cuartil Q,, se toman los datos mayores que 120 es decir, 124 135 136««142—«150. Nuevamente, para los cinco datos la mediana esté en la posicién 3. Asi 124 135136142150. Entonces Q, = 136 De estos resultados se obtienen las siguientes conclusiones: + Durante los 11 dias asistieron, en promedio, 120 personas ala funcién de las 9:00 pm. + £1'50% de los dias en que se observ la asistencia, 120 personas o menos presenciaron la funcién, + EL.25% de los dias en que se observé la asistencia, 102 personas o menos presenciaron la funcién. Mientras el 75% de los dias, mas de 102 personas, la presenciaron. + £1 75% de los dias en que se observé la asistencia, aproximadamente 136 personas o menos presenciaron la funcidn. Mientras el 25% de los dias, mas de 136 personas la presenciaron. bb La funcién no se proyectaré mas, ya que el promedio de asistencia es de 120 personas y esto es menor al valor esperado por el departamento de ventas. * Deciles Los deciles son nueve datos que se simbolizan: Dy Dy Dy Dy Dy Dey Dry Dy Dy Los deciles son valores que dividen el conjunto de datos en 10 partes iguales cuando ests cordenado en forma ascendente o descendente. Cada parte representa el 10% del total En el caso de los deciles el quinto, es decir, D; coincide con el valor de la me- diana, Ademés, se tiene que: E] 20% de los datos es menor o igual que el decil D,. EI 30% de los datos es mayor o igual que el decil D,, ae * Percentiles Los percentiles son valores que dividen un conjunto de datos en 100 partes porcentualmente iguales cuando estén ordenados en forma ascendente o descendents. Los percentiles son noventa y nueve datos que se simbolizan.P, ..., Pug EL primer percentil, P,, es el valor mayor o igual que el 1% de los datos. El percentil 10, P,», es igual al primer decil D,. EI percentil 20, P,», es igual al segundo decil D,. EI percentil 25, P,,, es igual al primer cuartil Q,. El percentil 30, Py, es igual al tercer decil Dy. El percentil 40, Py, es igual al cuarto decil D. EI percentil 50, P,», es igual al segundo cuartil o al quinto decil y por tanto igual a la mediana del conjunto de datos. El percentil 75, P,., es igual al tercer cuartil Q, de! conjunto de datos. Los percentiles son faciles de calcular cuando el ntimero de datos es un miiltiplo de 100. Es importante aclarar que los deciles y los percentiles se utilizan en contextos donde la cantidad de datos que se va a caracterizar es muy grande, 2.1.2 Diagrama de caja y bigotes I dlagrama de caja y bigotes es un resumen grafico en el que se describen caracteristicas destacadas de un conjunto de datos. Algunas de estas caracteristicas se relacionan con: + La dentificacién de datos representativos + La dispersin de los datos con respecto a los cuales. El diagrama de cajas y bigotes se construye usando los cuartiles, el procedi- miento se describe a continuacién: Primero. Se ubican los cuartiles en una recta numérica, la cual debe mostrat claramente el dato menor y el dato mayor. Segundo, Se determinan los extremos de la caja. Asf, la caja esté limitada por Jos cuattiles Q, y Q, y dentro de ella se ubica la mediana, es decir, Q.. La caja se seflala sobre la recta como un recténgulo. Los bigotes son dos lineas que se trazan teniendo en cuenta que: ‘+ El primer bigote va desde el dato menor hasta el extremo inferior de la caja. ‘+ El segundo bigote va desde el extremo superior de la caja hasta el dato mayor. 1O Estndari@ Pensamiento QO Estindar tm Pensamient aletoio El diagrama de caja y bigotes correspondiente a los datos del ejercicio resuelto de Ja pagina 15, relacionado con el registro de la asistencia a una funcion durante 11 dias, se muestra a continuacion: ee 0 109 m0 0 130 140 150 Gee ae ts 25% 25% 25% 25% Si los datos de la muestra estuvieran muy dlispersos la diferencia entre el dato mayor y el menor seria considerable. De igual forma, la diferencia entre Q, y Q, seria amplia. La mediana puede estar cercana a alguno de los cuartiles (0a ambos) cuando los datos obtenidos en la muestra estén cercanos. Por ejemplo, en el caso de la asistencia a la funcién se aprecia que los cuartiles estén relativamente cercanos puesto que Q, - Q, = 136-102 = 34. Esto indica que un 50% de los datos estuvo en un rango de 34 personas, lo cual es aceptable en relacién con la asistencia al cinema. Ejercicios resueltos Los siguientes diagramas de caja y bigotes corresponden a cuatro conjunto de 80 datos i t + Conjunto 4 4 4 Conjunto 2 Determinar el conjunto de datos para el cual. a. Es mayor la mediana, b. Hay mayor diferencia entre el mayor y el menor de los datos. &_Esmayor la diferencia entre el mayor de los datos y la mediana, Solucién a. La mediana es mayor para los conjuntos de los datos 1 y 3, 1b. La diferencia entre el mayor el menor de los datos es mayor para los conjuntos ay. & Ladiferencia entre el mayor delos datos y la mediana es mayor para el conjunto 2. continuas En la vida cotidiana existen magnitudes cuyos datos corresponden a variables continuas. Por ejemplo, las medictones de pesos y estaturas son valores que pertenecen al conjunto de los nimeros reales. Estas medidas, como el tiempo, el peso y la velocidad, entre otras, requieren de mayor precisi6n para obtener una mejor aproximaciOn a la realidad. 3.1 Variables continuas Las variables continuas se caracterizan con las medidas de tendencia central y las medidas de posicién, también se usa la ojiva. 3.1.1. Medidas de tendencia central Las medidas de tendencia central son las mismas usadas para caracterizar los datos no agrupados. Sin embargo, hay algunas variaciones cuando los datos estén agrupados. * Mediana La mediana de un conjunto de datos continuos se calcula mediante el método de interpolacién. El proceso consiste en determinar un valor tal que sea mayor que el o igual que el 50% de los datos y a la vez menor o igual que el otro 50% de los datos. + Media o promedio Sean xy) yy Xy «n)%y las marcas de clase de un conjunto de datos continues y f;, ry fry fy Sus tespectivas frecuencias. Entonces: 2ofet Gfyt + % fit het fete fa Es importante tener en cuenta que la suma de las frecuencias es igual al nimero total de datos del conjunto, es decir, * Clase modal La clase modal de un conjunto de datos continuos es el intervalo (o intervalos) ‘con mayor frecuencia. A continuaci6n explicaremos, a partir de un ejemplo, la caraterizacion de una variable continua. Caracterizacion de variables cuantitativas Variable continua: Una variable es ‘cuantitatva continua sisus valores pueden ser cualquier nimero natural. QO Estandar m Pensamiento aleatorio oo Ejercicios resueltos El duefio de un negocio de cabinas telefénicas desea hacer un estudio de la duracién en minutos de las diferentes llamadas que se realizan en un dia. La siguiente tabla de frecuencias muestra la duraci6n de 60 llamadas telefénicas. 5| 7610 | 101-125 9 Eee 1-25) 265 | 517 oe 10 4 16 u Para calcular las medidas de tendencia central se organiza la tabla de frecuencias con las columnas correspondientes a: + Marca de clase frecuencia. + Marca de clase por frecuencia, + Frecuencia acumulada, de la siguiente manera: 13 | 38) 4) Bz | 63 | 16 | woe | 40 76-10 as | om | 968 | st worizs | na) 9 | wir | 6 Para calcular la media o el promedio se hace la suma de la columna X: fy ese resul- tado se divide en el niimero total de datos. En la tabla que aparece a continuacién se han registrado estos célculos. oos2ss | 13 | 10 | 13 | 10 255505 | 38 | 14 | s3z | 24 sos755 | 63 | 16 | 1008 | 755-1005 | 88 " 968 | 51 woostass | 130) 9 1017 | 60 Suma | 3655 Luego, la media es: 09 minutos Lo cual indica que la duracién promedio de las 60 llamadas es 6,09 minutos. La mediana se calcula ast: + Se halla el 50% de la cantidad total de datos lo cual corresponde a 30 llamadas. + Se observa la tabla de frecuencias acumuladas y se ubica la clase en la cual esté el dato 30, la cual corresponde al intervalo 5,05-7,55. + En las clases anteriores hay acurnulados 24 datos, luego, hay que seleccionar 6 llamadas de las 16 que hay en la clase 5,05-7,55. + Se multiplica el cociente = por el tamafio del intervalo y se adiciona 5,05, ‘ya que 24 llamadas duraron 5,05 minutos 0 menos. NivelAmMédulo2 QO vel Am 2 ge Se realiza el célculo: oe: Pe 05 = 5: 7g" 25) + 505 = 599 Asi pues, el 50% de las llamadas duraron aproximadamente 6 minutos o menos. La lase modal es 5,1-7,5 puesto que la frecuencia es 16 y es la mayor de todas las frecuencias. 3.1.2. Medidas de posicion Las medidas de posicién mas importantes para datos continuos son los cuartiles y los percentiles. Dado que los datos estén agrupados en intervalos, el cilculo de los cuartiles, los deciles y los percentiles se hace por el método de interpolacién. Por ejemplo, los cuartiles correspondientes al anterior ejercicio resuelto son: Para el cuartil 1 * Se halla el 25% de la cantidad total de datos lo cual corresponde a 15 lama- das. Se observa la tabla de frecuencias acumuladas y se ubica la clase en la cual esta el dato 15, la cual corresponde al intervalo 2,55-5,05. En la clase anterior hay acumulados 10 datos, luego hay que seleccionar 5 lla- madas de las 14 que hay en la clase 2,55-5,05. ‘* Se multiplica el cociente 4 por el tamafio del intervalo y se adiciona 2,55, puesto que 10 lamadas duraron 2,55 minutos o menos Q, =F - 2,5) +2,55 ~ 3,44 minutos EI cuartil dos equivale a la mediana de los datos. El cuartil tres se halla con el mismo método del cuartil de la siguiente manera. + Se halla cl 75% de la cantidad total de datos lo cual corresponde a 45 llama- das. ‘+ Se observa la tabla de frecuencias acumuladas y se ubica la clase en la cual estd el dato 45. Este dato esti ubicado en la clase 7,55-10,05. ‘+ Em las clases anteriores hay acumulados 40 datos, luego hay que seleccionar 5 llamadas de las 11 que hay en la clase 7,55-10,05. ‘Se multiplica el cociente + por el tamafio real de la clase y se adiciona 7,55 puesto que 40 lamadas duraron 7,55 minutos o menos: Q,= & - @.5)+7,55 ~8,69 minutos GQ Esindart Pensamiento aletorio De lo anterior, se pueden proponer las siguientes conchusiones: E] 25% de las llamadas duraron 3,44 minutos o menos. E] 75% de las llamadas duraron 869 minutos 0 menos. Un 50% de las llamadas duraron entre 3,44 y 8,96 minutos. El cAlculo de los deciles y los percentiles se hace teniendo en cuenta el si- guiente procedimiento: Para hallar el percentil 32: * Se halla el 32% de 60 llamadas, el cual es 19,2. ‘* Luego, se multiplica el cociente a2 por el tamajio del intervalo y se adi- ciona 2,55 ya que 10 llamadas duraron 2,5 minutos © menos. Py= ap * 2S) + 2,55 ~ 4,19 minutos De lo anterior se pueden concluir que el 32% de las Hamadas duraron 4,19 mi- nutos 0 menos. 3.1.3 Usodela a ojiva facilita la aproximacién de los cuartiles, los deciles y los percentiles. Por ejemplo, en el caso de la duracién de las 60 llamadas, para obtener un valor aproximado de Q, se procede de la siguiente forma: * El 50% de 60 llamadas es 30. Luego, se ubica el 30 en el eje vertical y se traza una linea horizontal hasta cruzar la ofiva. ‘+ A partir de ese punto se traza una linea vestical hasta llegar al eje horizontal. El punto en el cual se cruza al eje horizontal corresponde a Q,. En la siguiente grafica se muestra el cuartil 2, Q,, que es aproximadamente 6, ‘como se calculé en la pagina anterior. (iva para la duracién de 60 lamadas 8 Numero de lamadas & 8 o 255 505% 755 10051285 Duracién (minutos)

Das könnte Ihnen auch gefallen