Beruflich Dokumente
Kultur Dokumente
1. CONCEPTOS PRELIMINARES
La Psicologa como Ciencia Emprica observa un conjunto de eventos del mundo real para descubrir las leyes que explican el comportamiento humano bajo determinadas circunstancias y llevar a cabo un proceso de induccin o generalizacin inductiva.
El clculo de probabilidades: aproximacin matemtica a los juegos de azar. Estadstica o ciencia del Estado: dedicada a llevar registros ordenados de los datos del estado.
2. DEFINICIN DE ESTADSTICA
Estudia cmo obtener conclusiones de la investigacin emprica mediante el uso de modelos matemticos. Definicin de Amn (1979): Una ciencia que recoge, ordena y analiza los datos de una muestra, extrada de cierta poblacin, y que, a partir de esa muestra, valindose del clculo de probabilidades, se encarga de hacer inferencias acerca de la poblacin. La estadstica se divide normalmente en dos partes: descriptiva e inferencial.
La estadstica descriptiva organiza, sintetiza y aclara la informacin contenida en un conjunto (muestra) de datos empricos a travs de una serie de procedimientos. La estadstica inferencial generaliza, infiere o induce las propiedades de un conjunto de datos empricos (muestra) al conjunto total de datos (poblacin) a los que representan, a travs de una serie de estrategias como son el clculo de probabilidades. Para poder extraer esta inferencia de la muestra a la poblacin, es preciso que se haya efectuado una seleccin de los datos adecuada, mediante las tcnicas de muestreo.
3. LA ESTADSTICA Y LA PSICOLOGA
La Estadstica es en s misma una ciencia que, por otro lado, sirve de instrumento metodolgico para el desarrollo de otras ciencias. En este sentido la Psicoestadstica debe ser entendida como una herramienta metodolgica al servicio de la investigacin emprica, siendo a travs de ella como se obtiene conocimiento cientfico.
Se dice que la variable es discreta cuando no admite un valor intermedio entre dos cualesquiera. Por ejemplo, el nmero de hijos. Se dice que es continua cuando admite un valor intermedio entre dos cualesquiera. Un ejemplo de este tipo puede darse cuando estamos midiendo un tiempo de respuesta o la altura de una persona. En estos casos el nmero de valores distintos ser en la prctica finito (en la prctica mediremos en segundos o en dcimas de segundo, o centsimas, o milsimas,...) pero la continuidad de esta variable aleatoria radica en el carcter continuo de lo que medimos, es decir, el hecho de que entre dos valores posibles podramos obtener infinitud de valores ms si tuvisemos aparatos de medida con la suficiente precisin. Este es el hecho primordial que diferencia a una variable discreta de una continua. Variables cualitativas Las variables cualitativas son aquellas que expresan una cualidad "no medible" cuyos valores no pueden ordenarse. Por ejemplo, el lugar de nacimiento o determinados sntomas de una enfermedad.
Nota Lengua 9 9 7 8
Nota Matemticas 8 8 5 5
2. TABLA DE FRECUENCIAS
Cuando se recogen los resultados de una observacin y confeccionamos la matriz de datos, observamos que, normalmente, existen valores que se repiten. A veces,
determinados valores se repiten con ms frecuencia que otros. Es el caso de las calificaciones de los alumnos, donde, en general, se producirn muchos ms 5, o 6 que 10. La relacin que existe entre los posibles valores de respuesta y la frecuencia con que se producen es lo que denominamos Distribucin de frecuencias. La distribucin de frecuencias se representa usualmente como un cuadro o tabla denominada tabla de frecuencias, donde en un eje se sitan los posibles valores de la variable y en el otro las frecuencias asociadas a ese valor. En nuestro ejemplo las notas de lengua seguiran la siguiente distribucin: Xi 7 8 9 1 1 2 ni
La Frecuencia absoluta (ni) es el nmero de casos que hay en cada opcin de la variable. La suma de todas las frecuencias absolutas es siempre igual a n, siendo n el nmero total de casos, y se expresa:
Frecuencia relativa ( fi ): Expresa los resultados en proporciones, comparando el nmero de casos de cada categora de la variable con un valor de referencia, (el 1). Nos informa si el nmero de casos en cada variable es grande o pequeo. Se calcula como la frecuencia absoluta relativa al total y se expresa como:
Porcentaje: Nos informa si el nmero de casos en cada variable es grande o pequeo, expresando los resultados en tantos por ciento, comparando el nmero de casos de cada categora de la variable con un valor de referencia, el 100.
fi%= (fi)100
Porcentaje acumulado: Nos indica el porcentaje de casos inferiores o iguales a un determinado valor de la variable. Se calcula acumulando (sumando) los porcentajes anteriores al porcentaje correspondiente a un determinado valor de la variable. Solamente tiene sentido si los valores son ordinales. En nuestro ejemplo, podemos construir la siguiente tabla de frecuencias: TABLA DE FRECUENCIAS Xi 7 8 9 ni 1 1 2 fi 0,25 0,25 0,50 Fi % 25% 50% 100%
Cada barra representa una categora de la variable que se est representando que ser ms o menos larga segn el nmero de casos. Es un diagrama adecuado para representar tanto variables cuantitativas discretas como cualitativas.
Se representan los valores o categoras de la variable en el eje de abscisas (eje X), y la frecuencia absoluta en el eje de ordenadas (eje Y) por medio de barras (rectngulos).
3.2. Histograma
Cuando la variable es cuantitativa continua, la representacin grfica adecuada es el histograma. Cada barra-rectngulo representa un intervalo de categoras de la variable que se est representando que ser ms o menos grande segn la proporcin de casos. Obsrvese que en los casos de variables continuas, los diagramas de barra no son los adecuados.
El nmero de tramos o intervalos en que se agrupa la informacin lo decide el analista de datos teniendo en cuenta que si los intervalos son muy pequeos, se pierde menos informacin pero la tabla se hace menos informativa de lo que realmente est ocurriendo. Si los intervalos son demasiado grandes, puede perderse excesiva informacin (imaginemos que tomamos intervalos de 50 kg, en cuyo caso casi toda la poblacin estara comprendida en el tramo de 50 a 100 kg con lo que poco podemos deducir).
4. ESTADSTICOS DESCRIPTIVOS
Los estadsticos descriptivos son medidas que resumen la informacin contenida en los datos observados sobre la variable estudiada.
La moda es el valor Xi que tiene la frecuencia ms elevada. Es el nico estadstico que se puede utilizar con variables nominales. La mediana resume, mediante un nmero, las caractersticas de una variable. Este nmero es el valor del caso que ocupa la posicin central de la distribucin. La mediana puede utilizarse con variables ordinales, ya que al tratarse de valores ordenados se puede calcular el valor que ocupa la posicin central. Si el nmero de casos de la muestra es impar, ser el valor Xi que queda en el puesto (n+1)/2. Si el nmero de casos de la muestra es par, ser la media entre los valores Xi que queden en los puestos n/2 y (n/2)+1.
La media resume en un valor las caractersticas de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. Si los datos estn agrupados, la media se calcula como la suma de todos los valores dividida entre el nmero total de casos.
Si los datos estn agrupados se calcula como la suma de todos los valores multiplicados por su correspondiente frecuencia absoluta, dividida entre el nmero total de casos.
0,0,0,0,10,10,10,10. La media y la mediana resultan ser 5, valor muy alejado de lo que sucede en realidad. Las medidas de variacin o dispersin muestran la variabilidad de una distribucin, indicando por medio de un nmero o estadstico si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayores son los valores de esos estadsticos ms variabilidad habr. Cuanto menores son, ms homogneas son las puntuaciones respecto a la media. De este modo se puede saber si todos los casos son parecidos o hay grandes diferencias entre ellos.
El rango o recorrido es la medida de la variabilidad de una distribucin ms sencilla. Mide la amplitud de una distribucin de frecuencias restndole al valor mayor el valor menor. Rango = Mximo - Mnimo La varianza sesgada o varianza (S2x) mide la distancia existente entre los valores de la muestra y la media. Se calcula como el promedio de las puntuaciones diferenciales elevadas al cuadrado.
Al obtenerse como suma de cuadrados, la varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la muestra alrededor de la media. Por el contrario, mientras mayor sea la varianza ms dispersos estn. La desviacin tpica sesgada o desviacin tpica (Sx) es muy til para el estudio de la variabilidad de los datos. Este valor acenta el efecto de las grandes desviaciones y es siempre superior a la desviacin media. Se calcula como la raz cuadrada de la varianza.
La mayor ventaja de la desviacin tpica se observar cuando estudiemos las distribuciones denominadas normales.
Las medidas de posicin son estadsticos que indican la posicin relativa que ocupa un sujeto en una distribucin de frecuencias.
Percentiles o Centiles Ck
Un centil es una puntuacin Xi que deja debajo de s un porcentaje acumulado K CK=Xi donde K=1, 2, ., 99 Los centiles son 99 valores de la variable X que dividen la distribucin en 100 secciones ( cada una con la centsima parte de las n observaciones) . Son tiles para hacer valoraciones de las puntuaciones de los sujetos en cuanto a su grupo de referencia. Estas puntuaciones indican la posicin relativa de un sujeto en su grupo de referencia Dependen de la forma de la distribucin de frecuencias. Xi 7 8 9 ni 1 1 2 fi 0,25 0,25 0,50 Fi % 25% 50% 100%
En el ejemplo la puntuacin 8 es el centil 50 . Un 50% de los sujetos no supera la puntuacin 8. Clculo de Centiles 1) Clculo directo a) En puntuaciones observadas b) En puntuaciones no observadas K xi = Fa 100
Fi -1 porcentaje acumulado del valor inmediatamente inferior 2) Clculo inverso Si se desea conocer la puntuacin correspondiente a un centil a) En puntuaciones observados CK=Xi b) En puntaciones no observadas
El recorrido Inter-cuartil (RIC) o amplitud Inter-cuartil es una medida que sirve para ver la diferencia entre el primer cuartil y el tercer cuartil de una distribucin de datos. Este estadstico se utiliza sobre todo en el anlisis exploratorio de los datos a partir de medidas de posicin. RIC = Tercer cuartil Primer cuartil
Puntuacin tpica
Zx es el valor Xi llevado a una escala de valores Zx, que son nuevas variables expresadas en unidades de desviacin tpica y se interpreta como el nmero de unidades de desviaciones estndar que tiene ese resultado por encima o por debajo de la media.
Zx < 0 : Puntuacin por debajo de la media Zx = 0 : Puntuacin igual a la media Zx > 0 : Puntuacin por encima de la media Las variables tipificadas tienen una serie de propiedades que las harn muy tiles para comparar resultados:
La media y la mediana coinciden y su valor es 0 y la varianza y desviacin tpica es igual a 1. Si la distribucin de la variable Z es normal, sus valores van desde - a + , aunque toma su valor asinttico (roza el eje X) a partir del -3 y +3 Se puede conocer la proporcin de casos en cualquier intervalo de la distribucin. Por ejemplo, entre la media y -2 a +2 unidades de DT (exactamente desde -1.96 a 1.96) estn comprendidos el 95% de los casos.
Proporciones, reas y probabilidad bajo la curva normal Si la distribucin de una variable es normal podemos asociar directamente una proporcin de la curva a una puntuacin. Eso es as debido al proceso de estandarizacin. En la siguiente figura se representa la distribucin normal con varios ejes de abcisas ,para una facilitar una mejor comprensin de las relaciones entre puntuaciones directas, estndar(o tpicas) , proporciones, reas, percentiles, e incluso categoras de puntuaciones directas.
El primer eje recoge las desviaciones estndar, y su necesaria coincidencia con el tercer eje ( puntuaciones z) . El segundo eje, ( equivalencia en percentiles) se encuentra relacionado con las lneas verticales presentados bajo la curva. De tal modo que, la suma acumulativa, de izquierda a derecha, de los porcentajes expresados dentro de la distribucin, coincide con la magnitud del percentil presentado en el tercer eje. El penltimo y ultimo eje de abcisas muestran los cociente intelectual de desviacin y C.I. . Se puede conocer proporciones, reas o probabilidades conociendo una o varias puntuaciones directas mediante el proceso de estandarizacin. Y a la inversa, partiendo de una proporcin o rea podemos obtener una puntuacin directa. a) Si tenemos una puntuacin directa para obtener la proporcin o porcentaje : 1) Calculamos en primer lugar la puntuacin Z 2) con esta puntuacin z calculada se acude la tabla que resume las proporciones de reas acumuladas hasta el punto z http://www.uv.es/meliajl/Docencia/Tablas/ZColaIzq.PDF
B) Si nos dan la proporcin o porcentaje : 1) Desde la tabla obtenemos la puntuacin z normalizada 2) Transformamos la puntuacin segn la ecuacin: Xi= z + Media Ejemplo de clculo de proporcin o porcentaje Ana acaba de ser evaluada con el WAIS y ha obtenido un resultado de 88. Qu porcentaje de la poblacin tiene mejores resultados que l? y qu porcentaje obtiene resultados ms bajos?. (El C.I se distribuye con Media 100 y desviacin 15) 1 Se estandariza la puntuacin z = (88-100)/15= - 0.8 2 En la tabla z buscamos la proporcin acumulada bajo la curva normal. La primera columna contiene las puntuaciones z con un decimal, mientras que la segunda columna incluye el segundo decimal. El punto de interseccin entre la columna y la fila recoge la proporcin acumulada hasta esa puntuacin z. La interseccin entre la fila -0.8 y la columna 0.0 da una proporcin de 0.2119. Si a la unidad le restamos lo que queda por debajo de la z sabremos lo que queda por encima de ese punto: 1 - 0.2119 = 0.781. Es decir que el 78% obtiene resultados ms elevados que Ana, frente a un 21% a los que supera Ana.
Ejemplo de clculo de puntuacin Entre qu valores se encuentra el 95% central de la poblacin general de C.I ? Necesitamos conocer la puntuacin z asociada al 95% central. Si observamos la tabla o el grfico observamos que el 95% est asociado a los valores -1,96, +1,96 Sustituyendo en la ecuacin Xi= z + Media Las puntuaciones son C.I.= 70,6 y C.I.= 129.4
El concepto de asimetra o sesgo se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmtica). Segn el grado de asimetra una distribucin puede ser:
Asimtrica positiva: si existe mayor concentracin de valores a la derecha de la media que a su izquierda.
Asimtrica negativa: si existe mayor concentracin de valores a la izquierda de la media que a su derecha.
Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra de Fisher, F1,,que viene definido: k ( xi X )3 ni
i =1
F1 =
N S3
Los resultados pueden ser los siguientes: F1 = 0 : Distribucin simtrica: igual que la normal F1 > 0 : Distribucin asimtrica positiva: desplazada hacia la derecha. F1 < 0 : Distribucin asimtrica negativa: desplazada hacia la izquierda. La Curtosis o apuntamiento analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. El patrn con el que se compara la forma del grfico es la distribucin normal. Segn el grado de curtosis, una distribucin pueden ser:
Mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable.
Leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.
Platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.
Para medir el nivel de curtosis se utiliza el Coeficiente de Curtosis, definido por la siguiente frmula: ( x x ) 4 ni i =1 N Cr = 3 Sx 4
K
Los resultados pueden ser los siguientes: Cr = 0 : Distribucin mesocrtica: igual que la normal. Cr > 0 : Distribucin leptocrtica: ms apuntada que la normal. Cr < 0 : Distribucin platicrtica: ms aplastada que la normal.