Sie sind auf Seite 1von 17

TEMA 1: INTRODUCCIN A LA PSICOESTADSTICA

1. CONCEPTOS PRELIMINARES
La Psicologa como Ciencia Emprica observa un conjunto de eventos del mundo real para descubrir las leyes que explican el comportamiento humano bajo determinadas circunstancias y llevar a cabo un proceso de induccin o generalizacin inductiva.

1.1 Observar y medir


Los eventos observables pueden verse influidos por numerosos factores o fuentes de variacin que pueden ser difciles de identificar, medir y controlar . Se necesita de una herramienta metodolgica especial, como es la estadstica y el conjunto de procedimientos que posee.

1.2 Por qu usamos la Estadstica?


En situaciones deterministas una misma causa produce siempre un mismo resultado. En situaciones aleatorias una misma causa puede producir cualquier resultado entre varios posibles. En las situaciones aleatorias es necesario recurrir a los procedimientos proporcionados por la estadstica para poder extraer conclusiones fiables.

1.3 El origen de la Estadstica


La estadstica nace de dos fuentes:

El clculo de probabilidades: aproximacin matemtica a los juegos de azar. Estadstica o ciencia del Estado: dedicada a llevar registros ordenados de los datos del estado.

En el siglo XIX se unen para constituir la nueva estadstica.

2. DEFINICIN DE ESTADSTICA
Estudia cmo obtener conclusiones de la investigacin emprica mediante el uso de modelos matemticos. Definicin de Amn (1979): Una ciencia que recoge, ordena y analiza los datos de una muestra, extrada de cierta poblacin, y que, a partir de esa muestra, valindose del clculo de probabilidades, se encarga de hacer inferencias acerca de la poblacin. La estadstica se divide normalmente en dos partes: descriptiva e inferencial.

La estadstica descriptiva organiza, sintetiza y aclara la informacin contenida en un conjunto (muestra) de datos empricos a travs de una serie de procedimientos. La estadstica inferencial generaliza, infiere o induce las propiedades de un conjunto de datos empricos (muestra) al conjunto total de datos (poblacin) a los que representan, a travs de una serie de estrategias como son el clculo de probabilidades. Para poder extraer esta inferencia de la muestra a la poblacin, es preciso que se haya efectuado una seleccin de los datos adecuada, mediante las tcnicas de muestreo.

3. LA ESTADSTICA Y LA PSICOLOGA
La Estadstica es en s misma una ciencia que, por otro lado, sirve de instrumento metodolgico para el desarrollo de otras ciencias. En este sentido la Psicoestadstica debe ser entendida como una herramienta metodolgica al servicio de la investigacin emprica, siendo a travs de ella como se obtiene conocimiento cientfico.

4. MEDIDA: DEFINICIN DE VARIABLE Y ESCALAS DE MEDIDA


Una variable es una caracterstica que puede tomar diferentes valores. Estos valores pueden ser de tipo cuantitativo, cualitativo . Variables cuantitativas Las variables cuantitativas son aquellas a las que puede asociarse un valor numrico. Pueden ser discretas o continuas.

Se dice que la variable es discreta cuando no admite un valor intermedio entre dos cualesquiera. Por ejemplo, el nmero de hijos. Se dice que es continua cuando admite un valor intermedio entre dos cualesquiera. Un ejemplo de este tipo puede darse cuando estamos midiendo un tiempo de respuesta o la altura de una persona. En estos casos el nmero de valores distintos ser en la prctica finito (en la prctica mediremos en segundos o en dcimas de segundo, o centsimas, o milsimas,...) pero la continuidad de esta variable aleatoria radica en el carcter continuo de lo que medimos, es decir, el hecho de que entre dos valores posibles podramos obtener infinitud de valores ms si tuvisemos aparatos de medida con la suficiente precisin. Este es el hecho primordial que diferencia a una variable discreta de una continua. Variables cualitativas Las variables cualitativas son aquellas que expresan una cualidad "no medible" cuyos valores no pueden ordenarse. Por ejemplo, el lugar de nacimiento o determinados sntomas de una enfermedad.

TEMA 2: ESTADSTICA DESCRIPTIVA UNIVARIADA


1. MATRIZ DE DATOS
La medicin de fenmenos aleatorios se inicia a partir de la clasificacin de las observaciones en una matriz de datos. En esta matriz cada fila corresponde a toda la informacin obtenida de cada uno de los casos observados y cada columna la respuesta obtenida en cada tipo distinto de informacin .

Nombre Edad Jorge Jess Luis Ana 7 8 12 11

Nota Lengua 9 9 7 8

Nota Matemticas 8 8 5 5

2. TABLA DE FRECUENCIAS
Cuando se recogen los resultados de una observacin y confeccionamos la matriz de datos, observamos que, normalmente, existen valores que se repiten. A veces,

determinados valores se repiten con ms frecuencia que otros. Es el caso de las calificaciones de los alumnos, donde, en general, se producirn muchos ms 5, o 6 que 10. La relacin que existe entre los posibles valores de respuesta y la frecuencia con que se producen es lo que denominamos Distribucin de frecuencias. La distribucin de frecuencias se representa usualmente como un cuadro o tabla denominada tabla de frecuencias, donde en un eje se sitan los posibles valores de la variable y en el otro las frecuencias asociadas a ese valor. En nuestro ejemplo las notas de lengua seguiran la siguiente distribucin: Xi 7 8 9 1 1 2 ni

La Frecuencia absoluta (ni) es el nmero de casos que hay en cada opcin de la variable. La suma de todas las frecuencias absolutas es siempre igual a n, siendo n el nmero total de casos, y se expresa:

Frecuencia relativa ( fi ): Expresa los resultados en proporciones, comparando el nmero de casos de cada categora de la variable con un valor de referencia, (el 1). Nos informa si el nmero de casos en cada variable es grande o pequeo. Se calcula como la frecuencia absoluta relativa al total y se expresa como:

Porcentaje: Nos informa si el nmero de casos en cada variable es grande o pequeo, expresando los resultados en tantos por ciento, comparando el nmero de casos de cada categora de la variable con un valor de referencia, el 100.

fi%= (fi)100

Porcentaje acumulado: Nos indica el porcentaje de casos inferiores o iguales a un determinado valor de la variable. Se calcula acumulando (sumando) los porcentajes anteriores al porcentaje correspondiente a un determinado valor de la variable. Solamente tiene sentido si los valores son ordinales. En nuestro ejemplo, podemos construir la siguiente tabla de frecuencias: TABLA DE FRECUENCIAS Xi 7 8 9 ni 1 1 2 fi 0,25 0,25 0,50 Fi % 25% 50% 100%

3. REPRESENTACIONES GRFICAS 3.1. Diagrama de barras


La representacin grfica ms simple de una distribucin de frecuencias es el diagrama de barras.
Notas en Lengua 2,5 2 1,5 ni 1 0,5 0 7 8 Valores de X 9

Cada barra representa una categora de la variable que se est representando que ser ms o menos larga segn el nmero de casos. Es un diagrama adecuado para representar tanto variables cuantitativas discretas como cualitativas.

Se representan los valores o categoras de la variable en el eje de abscisas (eje X), y la frecuencia absoluta en el eje de ordenadas (eje Y) por medio de barras (rectngulos).

3.2. Histograma
Cuando la variable es cuantitativa continua, la representacin grfica adecuada es el histograma. Cada barra-rectngulo representa un intervalo de categoras de la variable que se est representando que ser ms o menos grande segn la proporcin de casos. Obsrvese que en los casos de variables continuas, los diagramas de barra no son los adecuados.

El nmero de tramos o intervalos en que se agrupa la informacin lo decide el analista de datos teniendo en cuenta que si los intervalos son muy pequeos, se pierde menos informacin pero la tabla se hace menos informativa de lo que realmente est ocurriendo. Si los intervalos son demasiado grandes, puede perderse excesiva informacin (imaginemos que tomamos intervalos de 50 kg, en cuyo caso casi toda la poblacin estara comprendida en el tramo de 50 a 100 kg con lo que poco podemos deducir).

4. ESTADSTICOS DESCRIPTIVOS
Los estadsticos descriptivos son medidas que resumen la informacin contenida en los datos observados sobre la variable estudiada.

4.1. Medidas de tendencia central


Son un grupo de estadsticos que permiten ver lo dominante, lo tpico o la tendencia de una distribucin de datos en el sentido de cules son sus valores medios.

La moda es el valor Xi que tiene la frecuencia ms elevada. Es el nico estadstico que se puede utilizar con variables nominales. La mediana resume, mediante un nmero, las caractersticas de una variable. Este nmero es el valor del caso que ocupa la posicin central de la distribucin. La mediana puede utilizarse con variables ordinales, ya que al tratarse de valores ordenados se puede calcular el valor que ocupa la posicin central. Si el nmero de casos de la muestra es impar, ser el valor Xi que queda en el puesto (n+1)/2. Si el nmero de casos de la muestra es par, ser la media entre los valores Xi que queden en los puestos n/2 y (n/2)+1.

La media resume en un valor las caractersticas de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. Si los datos estn agrupados, la media se calcula como la suma de todos los valores dividida entre el nmero total de casos.

Si los datos estn agrupados se calcula como la suma de todos los valores multiplicados por su correspondiente frecuencia absoluta, dividida entre el nmero total de casos.

4.2. Medidas de variacin o dispersin


A veces ocurre que las medidas de tendencias central, como la media, "engaan" sobre la verdadera distribucin de la variable, en el caso de que sta sea muy dispersa. Imagine que en una asignatura con 8 alumnos las calificaciones son

0,0,0,0,10,10,10,10. La media y la mediana resultan ser 5, valor muy alejado de lo que sucede en realidad. Las medidas de variacin o dispersin muestran la variabilidad de una distribucin, indicando por medio de un nmero o estadstico si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayores son los valores de esos estadsticos ms variabilidad habr. Cuanto menores son, ms homogneas son las puntuaciones respecto a la media. De este modo se puede saber si todos los casos son parecidos o hay grandes diferencias entre ellos.

El rango o recorrido es la medida de la variabilidad de una distribucin ms sencilla. Mide la amplitud de una distribucin de frecuencias restndole al valor mayor el valor menor. Rango = Mximo - Mnimo La varianza sesgada o varianza (S2x) mide la distancia existente entre los valores de la muestra y la media. Se calcula como el promedio de las puntuaciones diferenciales elevadas al cuadrado.

Al obtenerse como suma de cuadrados, la varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la muestra alrededor de la media. Por el contrario, mientras mayor sea la varianza ms dispersos estn. La desviacin tpica sesgada o desviacin tpica (Sx) es muy til para el estudio de la variabilidad de los datos. Este valor acenta el efecto de las grandes desviaciones y es siempre superior a la desviacin media. Se calcula como la raz cuadrada de la varianza.

La mayor ventaja de la desviacin tpica se observar cuando estudiemos las distribuciones denominadas normales.

La varianza insesgada diferentes propiedades.

mide lo mismo que la varianza sesgada, aunque tienen

La desviacin tpica insesgada es por tanto:

4.3. Medidas de posicin


Estas medidas permiten conocer otros aspectos caractersticos de la distribucin que no son los valores centrales.

Las medidas de posicin son estadsticos que indican la posicin relativa que ocupa un sujeto en una distribucin de frecuencias.

Percentiles o Centiles Ck
Un centil es una puntuacin Xi que deja debajo de s un porcentaje acumulado K CK=Xi donde K=1, 2, ., 99 Los centiles son 99 valores de la variable X que dividen la distribucin en 100 secciones ( cada una con la centsima parte de las n observaciones) . Son tiles para hacer valoraciones de las puntuaciones de los sujetos en cuanto a su grupo de referencia. Estas puntuaciones indican la posicin relativa de un sujeto en su grupo de referencia Dependen de la forma de la distribucin de frecuencias. Xi 7 8 9 ni 1 1 2 fi 0,25 0,25 0,50 Fi % 25% 50% 100%

En el ejemplo la puntuacin 8 es el centil 50 . Un 50% de los sujetos no supera la puntuacin 8. Clculo de Centiles 1) Clculo directo a) En puntuaciones observadas b) En puntuaciones no observadas K xi = Fa 100

( x xi 1 ) ( Fxi +1 Fxi 1 ) + Fxi 1 K xi = i ( xi +1 xi 1 )


Donde xi es el valor cuyo centil se quiere determinar x i-1 valor observado inmediatamente inferior a xi x i+1 valor observado inmediatamente superior a xi Fi+1 porcentaje acumulado valor inmediatamente superior

Fi -1 porcentaje acumulado del valor inmediatamente inferior 2) Clculo inverso Si se desea conocer la puntuacin correspondiente a un centil a) En puntuaciones observados CK=Xi b) En puntaciones no observadas

( F Fxi 1 )( xi +1 xi 1 CK Xi = xi + X i 1 ( Fxi +1 Fxi 1 )


Otras puntuaciones equivalentes son los deciles , y cuartiles ( Q1=C25, Q2=C50, Q3=C75)

El recorrido Inter-cuartil (RIC) o amplitud Inter-cuartil es una medida que sirve para ver la diferencia entre el primer cuartil y el tercer cuartil de una distribucin de datos. Este estadstico se utiliza sobre todo en el anlisis exploratorio de los datos a partir de medidas de posicin. RIC = Tercer cuartil Primer cuartil

Puntuacin Diferencial o desviacin a la media,


Xi, es la diferencia de cada valor respecto a la media de la muestra en la que se incluye. Puntuacin diferencial < 0 : El valor Xi est por debajo de la media Puntuacin diferencial = 0 : El valor Xi es igual a la media Puntuacin diferencial > 0 : El valor Xi est por encima de la media

Puntuacin tpica
Zx es el valor Xi llevado a una escala de valores Zx, que son nuevas variables expresadas en unidades de desviacin tpica y se interpreta como el nmero de unidades de desviaciones estndar que tiene ese resultado por encima o por debajo de la media.

Frmula para la tipificacin de cualquier puntuacin o valor Xi:

Zx < 0 : Puntuacin por debajo de la media Zx = 0 : Puntuacin igual a la media Zx > 0 : Puntuacin por encima de la media Las variables tipificadas tienen una serie de propiedades que las harn muy tiles para comparar resultados:

La media y la mediana coinciden y su valor es 0 y la varianza y desviacin tpica es igual a 1. Si la distribucin de la variable Z es normal, sus valores van desde - a + , aunque toma su valor asinttico (roza el eje X) a partir del -3 y +3 Se puede conocer la proporcin de casos en cualquier intervalo de la distribucin. Por ejemplo, entre la media y -2 a +2 unidades de DT (exactamente desde -1.96 a 1.96) estn comprendidos el 95% de los casos.

Proporciones, reas y probabilidad bajo la curva normal Si la distribucin de una variable es normal podemos asociar directamente una proporcin de la curva a una puntuacin. Eso es as debido al proceso de estandarizacin. En la siguiente figura se representa la distribucin normal con varios ejes de abcisas ,para una facilitar una mejor comprensin de las relaciones entre puntuaciones directas, estndar(o tpicas) , proporciones, reas, percentiles, e incluso categoras de puntuaciones directas.

El primer eje recoge las desviaciones estndar, y su necesaria coincidencia con el tercer eje ( puntuaciones z) . El segundo eje, ( equivalencia en percentiles) se encuentra relacionado con las lneas verticales presentados bajo la curva. De tal modo que, la suma acumulativa, de izquierda a derecha, de los porcentajes expresados dentro de la distribucin, coincide con la magnitud del percentil presentado en el tercer eje. El penltimo y ultimo eje de abcisas muestran los cociente intelectual de desviacin y C.I. . Se puede conocer proporciones, reas o probabilidades conociendo una o varias puntuaciones directas mediante el proceso de estandarizacin. Y a la inversa, partiendo de una proporcin o rea podemos obtener una puntuacin directa. a) Si tenemos una puntuacin directa para obtener la proporcin o porcentaje : 1) Calculamos en primer lugar la puntuacin Z 2) con esta puntuacin z calculada se acude la tabla que resume las proporciones de reas acumuladas hasta el punto z http://www.uv.es/meliajl/Docencia/Tablas/ZColaIzq.PDF

B) Si nos dan la proporcin o porcentaje : 1) Desde la tabla obtenemos la puntuacin z normalizada 2) Transformamos la puntuacin segn la ecuacin: Xi= z + Media Ejemplo de clculo de proporcin o porcentaje Ana acaba de ser evaluada con el WAIS y ha obtenido un resultado de 88. Qu porcentaje de la poblacin tiene mejores resultados que l? y qu porcentaje obtiene resultados ms bajos?. (El C.I se distribuye con Media 100 y desviacin 15) 1 Se estandariza la puntuacin z = (88-100)/15= - 0.8 2 En la tabla z buscamos la proporcin acumulada bajo la curva normal. La primera columna contiene las puntuaciones z con un decimal, mientras que la segunda columna incluye el segundo decimal. El punto de interseccin entre la columna y la fila recoge la proporcin acumulada hasta esa puntuacin z. La interseccin entre la fila -0.8 y la columna 0.0 da una proporcin de 0.2119. Si a la unidad le restamos lo que queda por debajo de la z sabremos lo que queda por encima de ese punto: 1 - 0.2119 = 0.781. Es decir que el 78% obtiene resultados ms elevados que Ana, frente a un 21% a los que supera Ana.

Ejemplo de clculo de puntuacin Entre qu valores se encuentra el 95% central de la poblacin general de C.I ? Necesitamos conocer la puntuacin z asociada al 95% central. Si observamos la tabla o el grfico observamos que el 95% est asociado a los valores -1,96, +1,96 Sustituyendo en la ecuacin Xi= z + Media Las puntuaciones son C.I.= 70,6 y C.I.= 129.4

4.4. Medidas de la forma de la distribucin

El concepto de asimetra o sesgo se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmtica). Segn el grado de asimetra una distribucin puede ser:

Simtrica: si existe la misma concentracin de valores a la derecha y a la izquierda de la media.

Asimtrica positiva: si existe mayor concentracin de valores a la derecha de la media que a su izquierda.

Asimtrica negativa: si existe mayor concentracin de valores a la izquierda de la media que a su derecha.

Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra de Fisher, F1,,que viene definido: k ( xi X )3 ni
i =1

F1 =

N S3

Los resultados pueden ser los siguientes: F1 = 0 : Distribucin simtrica: igual que la normal F1 > 0 : Distribucin asimtrica positiva: desplazada hacia la derecha. F1 < 0 : Distribucin asimtrica negativa: desplazada hacia la izquierda. La Curtosis o apuntamiento analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. El patrn con el que se compara la forma del grfico es la distribucin normal. Segn el grado de curtosis, una distribucin pueden ser:

Mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable.

Leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.

Platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

Para medir el nivel de curtosis se utiliza el Coeficiente de Curtosis, definido por la siguiente frmula: ( x x ) 4 ni i =1 N Cr = 3 Sx 4
K

Los resultados pueden ser los siguientes: Cr = 0 : Distribucin mesocrtica: igual que la normal. Cr > 0 : Distribucin leptocrtica: ms apuntada que la normal. Cr < 0 : Distribucin platicrtica: ms aplastada que la normal.

Das könnte Ihnen auch gefallen