Introduccin: La estadstica es una rama de la Matemtica que se ocupa de la recoleccin,
organizacin, anlisis e interpretacin de datos. La informacin contenida en una gran cantidad de datos recolectados es muy difcil de obtener si no se realizan antes las tareas de organizacin, anlisis e interpretacin propios de la Estadstica. Es por esto que en muchas reas del conocimiento, actualmente la Estadstica resulta muy til, y en algunas, hasta indispensable. !or e"emplo, en las #iencias $ociales se requiere con frecuencia estudiar el comportamiento o la situacin de grupos humanos numerosos, y para ello, la Estadstica resulta ser una herramienta fundamental. Definiciones Bsicas: #on el ob"eto de definir algunos de los t%rminos elementales que se usan en Estadstica, se plantear el estudio de un fenmeno en particular, desde el punto de &ista estadstico. $upngase que se desea estudiar el fenmeno del rendimiento acad%mico de los estudiantes de a'o de #iencias de un cierto Liceo, en la asignatura de (sica. Poblacin: $e denomina )poblacin) del estudio estadstico, en este caso, al grupo de todos los estudiantes de a'o de #iencias del Liceo en cuestin. Es importante obser&ar que la palabra )poblacin), en Estadstica, puede referirse a un con"unto de ob"etos y no necesariamente a un con"unto de personas o seres &i&os en general. !or e"emplo, si se quiere hacer un estudio del estado en que se encuentran los pupitres de todo el Liceo, clasificndolos en tres categoras* inser&ible, reparable, y en buenas condiciones, en este caso la poblacin estara conformada por todos los pupitres que hay en el Liceo. Muestra: #uando la poblacin es muy numerosa, se hace difcil obtener y analizar la informacin pro&eniente de todos los indi&iduos, y en ese caso se seleccionan algunos indi&iduos representati&os de la poblacin para hacer el estudio estadstico. El grupo de indi&iduos seleccionados se denomina muestra. En el caso del estudio sobre el rendimiento acad%mico de los esudiantes de a'o de #iencias, si se tratara de un Liceo peque'o con slo una seccin de cada curso, se tomara toda la poblacin para el estudio. !ero si se tratara de un Liceo muy grande, con +, secciones de a'o de #iencias, probablemente se tomara una muestra, seleccionando unos -, +, +. estudiantes de cada seccin, segn las posibilidades del equipo que realiza el estudio. Variables estadsticas: Las &ariables estadsticas son los datos que proporcionan los indi&iduos de la poblacin /o muestra0 obser&ada. !ueden ser cuantitati&as, como en el caso del estudio del rendimiento acad%mico, si se usa el dato de la nota definiti&a que obtu&o cada alumno en la asignatura de (sica. $iempre que la informacin est% dada a tra&%s de nmeros, se considera que es una &airable cuantitati&a. En el caso del estudio sobre el estado de los pupitres del colegio, se tiene una &ariable cualitati&a, pues la informacin sobre cada pupitre no est dada en t%rminos num%ricos, sino que se ubica a cada uno en una de las categoras* inser&ible, reparable, en buenas condiciones. Organizacin de Datos: $e obtienen los siguientes datos al in&estigar acerca de las notas obtenidas en (sica por los 1- estudiantes de a'o de #iencias* +., ,2, +3, +,, ++, ++, +4, ,5, ,4, +,, ,5, +-, +1, ,1, +2, +., +2, +,, ,3, ,-, +,, +1, +3, ++, +., ,1, ,4, ,5, .,, +6, +2, +,, ,6, ,5, +3. 7n primer paso a tomar para la organizacin de esta informacin, de manera que se facilite su estudio, es el siguiente* se construye una tabla estadstica, llamada tabla de frecuencias, en la cual se apreciar el nmero de estudiantes que obtu&o cada nota, desde , hasta .,* /&er la siguiente tabla0 8 partir de esta tabla se pueden obtener representaciones grficas del fenmeno estudiado, como por e"emplo un histograma, que se construir ms adelante. $in embargo, hay &arios aspectos del rendimiento acad%mico del curso obser&ado, que se hacen e&identes al organizar los datos como en la tabla anterior. !or e"emplo, el nmero de alumnos que tienen una nota inferior a ,4 es - /. sacaron ,1, + sac ,6, + sac ,- y + sac ,20. 9e estos - alumnos se puede decir que no aprendieron lo que se esperaba durante el curso. $e puede considerar a los estudiantes con notas entre ,4 y ++ como el grupo que logr aprender una parte de lo que se di en el curso de (sica, pero una parte importante de lo que debi aprender, no est entre sus conocimientos. En un ni&el que podra llamarse satisfactorio, estaran los ++ estudiantes con notas entre +. y +4, y el ni&el de e:celencia, lo alcanzaron slo 6 estudiantes, con notas entre +3 y .,. Estas obser&aciones sugieren que tambi%n sera til organizar la tabla de frecuencias de la manera siguiente* Intervalos Frecuencia Absoluta ,;,4 - ,4;+. +- +.;+3 ++ +3;., 6 Este tipo de tabla suele llamarse una distribucin de frecuencias. En la columna de la izquierda se colocan inter&alos de nmeros que agrupan las notas que pueden ser obtenidas por los estudiantes. Los inter&alos indican que los nmeros a considerar en esa categora son* el e:tremo inferior y todos los mayores que %l y menores que el e:tremo superior. !or e"emplo, en el inter&alo ,;,4, se incluyen* ,,, ,+, ,., ,1, ,6, ,-, ,2. En el inter&alo +.;+3, se incluyen* +., +1, +6, +-, +2, +4. Los inter&alos son determinados por el criterio de quien hace el estudio estadstico. $e podran escoger de distintas maneras, por e"emplo* Intervalos Frecuencia absoluta ,,;,1 , ,1;,2 6 ,2;,5 6 ,5;+. +. +.;+- 2 +-;+3 - +3;., 6 Las distintas maneras de distribuir las frecuencias de ocurrencia de las &ariables /en este caso, las notas0 permiten obser&ar el fenmeno desde distintos puntos de &ista. El punto de &ista que interesaba en la primera distribucin, era el de la clasificacin del grupo en 6 categoras* deficiente, regular, satisfactorio y e:celente. En este ltimo e"emplo, la distribucin de frecuencias con inter&alos de longitud igual a 1 es necesaria para obtener una clasificacin ms detallada de los estudiantes. $e obser&a, por e"emplo, que el inter&alo /tambi%n llamado )clase)0 donde hay un mayor nmero de estudiantes es el ,5;+., esto es, el que incluye las notas ,5, +, y ++. Frecuencia elativa: En las tablas de frecuencia construidas, se obser&a que la columna de las frecuencias se denomina )(recuencia absoluta). El t%rmino )absoluta) se refiere a que se trata simplemente de la frecuencia con que las &ariables estadsticas toman el &alor o los &alores indicados. La frecuencia relati&a, por otra parte, se refiere a la proporcin de datos que caen en el inter&alo dado con respecto al total de datos. !or e"emplo, tomando el caso de la ltima tabla de frecuencias, el inter&alo ,5;+. tiene una frecuencia absoluta de +.< su frecuencia relati&a es, entonces, igual a* !ues el total de datos /notas de estudiantes0 es 1-. 8s, se tiene* (recuencia relati&a La frecuencia relati&a, como es una proporcin, proporciones permite establecer una comparacin entre la frecuencia de ocurrencia de ciertos datos y el nmero total de datos. !or e"emplo, sabiendo que la frecuencia relati&a del inter&alo +3;., es igual a , se puede concluir que una proporcin muy peque'a de estudiantes tienen notas entre +3 y .,. Frecuencia acu!ulada: La frecuencia acumulada de un cierto &alor o inter&alo de &alores /clase0 se define como la suma de todas las frecuencias absolutas que preceden a la clase ms la frecuencia absoluta de la clase en cuestin. !or e"emplo, en la tabla de frecuencias absolutas* "lase Frecuencia Absoluta ,,;,1 , ,1;,2 6 ,2;,5 6 ,5;+. +. +.;+- 2 +-;+3 - +3;., 6 $e obser&a que la suma de las frecuencias absolutas de las tres primeras clases es* < eso significa que la frecuencia acumulada de clase ,2;,5 es igual a 3. La frecuencia acumulada simplemente indica cuntos estudiantes tienen nota inferior a ,5 en el curso analizado. e#resentaciones $rficas Las distribuciones de frecuencias obtenidas en un estudio estadstico pueden representarse grficamente de di&ersas maneras. 7na de ellas es el histograma, el cual se utiliza cuando las &ariables estadsticas son cuantitati&as, y se han distribuido por inter&alos de clases. !ara construir un histograma, se utilizan los e"es de coordenadas cartesianas. En el e"e de las abscisas se indican los lmites inferiores de todos los inter&alos y el lmite superior del ltimo. En el caso de la distribucin que se est estudiando, se tendra lo siguiente*/=er figura de la derecha0 En el e"e de las ordenadas, se indican los &alores num%ricos que toman las frecuencias absolutas< en el e"emplo anterior, se tendra* /=er figura de la izquierda0 Luego, sobre cada inter&alo de clase, se le&anta un rectngulo de altura igual a su frecuencia. >omando en cuenta la tabla de distribucin de frecuencias obtenida en el e"emplo anterior, se construye el histograma siguiente*/=er figura de la derecha0 /En la figura se obser&a que la clase ,,;,1 se ha eliminado porque su frecuencia absoluta es igual a cero y est en una e:tremo0. $rfica #oligonal: Los datos que proporciona una distribucin de frecuencias pueden interpretarse desde el punto de &ista de las funciones. !or e"emplo, se obser&a la primera tabla elaborada a partir de las frecuencias absolutas de cada nota indi&idual, que es la siguiente* /=er la siguiente tabla0 #ada nota entre ,, y ., puede tratarse como una &ariable independiente y la frecuencia asociada como la &ariable dependiente / 0. 8s, por e"emplo etc. $e tiene ahora una funcin cuya representacin en el plano cartesiano es la siguiente* $i se unen los puntos consecuti&os a tra&%s de segmentos de rectas se obtiene una poligonal* ?tra manera de representar grficamente los resultados de un estudio estadstico es la grfica de sectores< %sta se utiliza para comparar dos grupos de datos. !or e"emplo, en el caso de las notas de los estudiantes, se puede di&idir el grupo completo de notas en dos grandes subgrupos* el de los que son mayores o iguales a +, y el de las que son inferiores a +,, es decir, los aprobados y los reprobados. $e tendra lo siguiente* @eprobados* +. 8probados* .1 #omo el nmero total de estudiantes es 1-, ahora se calcula el porcenta"e de aprobados y reprobados* Aay un de reprobados. !or lo tanto, hay un de aprobados. La grfica de sectores consiste en una representacin, en un crculo, de las proporciones en que se encuentra cada grupo en relacin al total de estudiantes. El total de estudiantes est representado por el crculo completo* !ara construir la grfica de sectores, debe calcularse el ngulo que corresponde a cada porcenta"e. !or e"emplo, para calcular el ngulo que corresponde a un sector que es del rea del crculo, se establece la igualdad de proporciones* Es decir* 8s, un ngulo de corresponde al sector circular que ocupa el del rea del crculo, y como , el ngulo que corresponde al sector circular que ocupa el del crculo es . !ara efectos de una presentacin de resultados a tra&%s de una grfica de sectores, no se colocan las medidas de los ngulos como en la ilustracin pre&ia. Basta con se'alar cul grupo corresponde a cada sector. Medidas de Posicin: #uando se realiza un estudio estadstico con &ariables cuantitati&as, las medidas de posicin permiten precisar algunas de las propiedades num%ricas ms importantes de la distribucin de frecuencias. Las medidas de posicin ms usadas son* +. #entro;recorrido. .. Moda. 1. Mediana. 6. Media aritm%tica. !ara ilustrar lo que cada una de estas medidas es y cmo se calcula, se utilizar el e"emplo dado anteriormente de la distribucin de frecuencias de notas obtenidas en (sica por un grupo de 1- estudiantes. +. "entro%recorrido: El centro;recorrido de una distribucin es el punto medio del inter&alo cuyos e:tremos son los &alores mnimo y m:imo de la &ariable estadstica. !or e"emplo, en la distribucin estudiada se tiene que los &alores mnimo y m:imo son ,1 y .,, respecti&amente. 8s, el centro;recorrido de esa distribucin es* #entro;recorrido .. 1. Moda: La moda de una distribucin es el dato que aparece con mayor frecuencia. En una distribucin puede haber &arias modas< en el caso que se est estudiando, se tiene que la moda es +,, pues es la nota que obtienen mayor nmero de alumnos /- alumnos0. $i se estudia una distribucin en la cual la &ariable est agrupada en clases, se habla de )clase modal) en lugar de )moda). ?bser&ando la distribucin obtenida al agrupar las &ariables en clases* "lase Frecuencia Absoluta ,1;,2 6 ,2;,5 6 ,5;+. +. +.;+- 2 +-;+3 - +3;., 6 6. $e concluye que la clase modal en esta distribucin es ,5;+.. -. Mediana: Aabiendo ordenado los &alores de la &ariable de menor a mayor, si hay un nmero impar de datos, hay uno central* el nmero de datos que le preceden es igual al nmero de datos que le siguen. El dato central es la mediana de la distribucin. En el caso que se est considerando, hay 1- datos /notas0. la nota que ocupa el lugar +3 es la mediana, pues hay +4 notas antes y +4 notas despu%s* $e ubican las notas en orden creciente*,1, ,1, ,6, ,-, ,2, ,4, ,4, ,3, ,5, ,5, ,5, ,5, +,, +,, +,, +,, +,, ++ , ++, ++, +., +., +., +1, +1, +6, +-, +2, +2, +2, +4, +3, +3, +3, .,. La mediana es ++, en este caso, pues ese es el dato que ocupa el lugar nmero +3. #uando se trata de una distribucin segn clases, de igual manera que antes, se busca el dato que ocupa el lugar de la mediana y se dice que la clase mediana es aqu%lla a la cual pertenece la mediana encontrada. En este caso, como ++ pertenece a la clase ,5;+., %sta es la clase mediana. $i el nmero de datos es par, ocurrir que hay dos datos centrales. la mediana es la semisuma de ambos. !or e"emplo, si en el estudio anterior se omite el estudiante que obtu&o ., puntos, la distribucin tiene 16 datos, el +, y el ++ ocupan los puestos centrales* ,1, ,1, ,6, ,-, ,2, ,4, ,4, ,3, ,5, ,5, ,5, ,5, +,, +,, +,, +,, +, , ++ , ++, ++, +., +., +., +1, +1, +6, +-, +2, +2, +2, +4, +3, +3, +3. Mediana* 2. La mediana es una medida que se refiere a la posicin de los datos, y en algunas distribuciones, representa una especie de promedio. 4. &a !edia arit!'tica: Es la medida de posicin ms usada en los m%todos estadsticos. $e obtiene sumando todos los datos y di&idiento por el nmero de ellos. !ara la distribucin de notas, se titene que la media aritm%tica es*
3. !ara realizar la suma del numerador, es preferible, cada &ez que un &alor, por e"emplo , se repite, colocar , donde es el nmero de &eces que se repite . !or e"emplo, en el caso anterior, se escribira* 5. 8qu la media aritm%tica es , casi coincidente con la mediana. Aay otras distribuciones en las que la mediana y la media aritm%tica difieren mucho. !or e"emplo, supngase que las notas de ++ alumnos son* ,6, ,-, ,-, ,2, ,3, ,3, +4, +4, +5, .,, .,. La mediana es ,3 y la media aritm%tica es +,. Medidas de Dis#ersin: Las medidas de dispersin de una distribucin de frecuencias indican cmo estn repartidos los datos alrededor de las medidas de posicin que se tienen. !or e"emplo, en dos cursos diferentes de (sica, secciones 8 y B, se toman a todos los estudiantes que obtu&ieron entre +, y +6 puntos, y se organizan las frecuencias en dos histogramas. Variancia: La &ariancia de una distribucin, designada por , se calcula as* $i los datos son , , ..., y la media aritm%tica es , la &ariancia ser igual a* !or e"emplo, en el caso de las dos distribuciones anteriores, se tiene* =ariancia en la seccin 8*
=ariancia en la seccin B* La diferencia entre las dos &ariancias / y 0 muestra en este caso la diferencia entre las dispersiones de las distribuciones respecti&as. La distribucin de la seccin 8 est ms concentrada alrededor de la media aritm%tica, segn se obser&a en el histograma* y por eso su &ariancia es menor / 0. !or otra parte, la distribucin de la seccin B est ms dispersa en relacin a la media aritm%tica* $u &ariancia es mayor / 0 por esa razn. Desviacin estndar: Esta medida de la dispersin de una distribucin de frecuencias no es ms que la raz cuadrada de la &ariancia, y se denota por * En los e"emplos anteriores, se calcul para las secciones 8 y B, obteni%ndose* /seccin 80 /seccin B0 8s, es la des&iacin estndar en la distribucin de la seccin 8. . Muchos de los fenmenos biolgicos y sociales que se estudian estadsiticamente, tienen una distribucin denominada )normal), cuyas caractersticas principales son* +. En el inter&alo estn apro:imadamente el de los datos. /8qu es la media aritm%tica y la des&iacin estndar0 .. En el inter&alo , estn apro:imadamente el de los datos. La grfica poligonal se aseme"a a una cur&a en forma de campana, que se llama cur&a de Causs o campana de Causs, como en la figura. $i se obser&a la grfica poligonal de la distribucin de frecuencias de notas de (sica del grupo de 1- alumnos, se detecta que la mayor diferencia que hay entre esa poligonal y la campana de Causs, en otras palabras, la mayor dificultad que se presenta para apro:imar esa poligonal a la campana de Causs, es el pico producido por 1 alumnos con +3 puntos* $i la distribucin de frecuencias fuese la siguiente* /=er la siguiente tabla0 La grfica poligonal sera* Es fcil &er que, en este caso la media aritm%tica es y que la des&iacin estndar es . En esta distribucin, hay .- estudiantes con notas entre ,4 y +- / y 0. Este nmero de alumnos /.-0 corresponde al del total, que es cercano al requerido para ser considerada una distribucin normal.