Sie sind auf Seite 1von 31

ANLISIS DE DATOS CAPITULO 1: CONCEPTOS BSICOS Y ORGANIZACIN DE DATOS 1.

INTRODUCCIN
Debemos diferenciar entre dos tipos de estadsticas:

Estadstica te !ica: Se ocupa de los aspectos formales y normativos Estadstica a"#icada: Constituye la aplicacin a un campo concreto. Ha tenido distintos nombres, entre ellos Anlisis de Datos

$. LA IN%ESTIGACIN EN PSICOLOG&A
S.'%II: !l m"todo cientfico se convierte en la fuente de conocimiento ms utili#ada. $a %sicolo&a utili#a el m"todo cientfico para acercarse a su ob'eto de estudio: La c()d*cta E# +,t(d( cie)t-ic(: Consiste en dar ra#n sistemtica, emprica y e(perimental de los fenmenos. Ca!acte!sticas


.ases -. .. 0. 1. 2.

Sistemtico: )iene etapas definidas *si&ue un sistema+ ,eplicable: $os datos obtenidos pueden ser utili#ados por otro investi&ador Definicin del %roblema Deduccin de /iptesis contrastables !stablecimiento de un procedimiento de reco&ida de datos Anlisis de resultados obtenidos *de este punto se ocupa la asi&natura+ Discusin de dic/os resultados y b3s4ueda de soluciones

6. !laboracin de un informe de investi&acin


A continuacin repito los puntos anteriores pero e'emplificados con el e'emplo de la p&ina -5. -. %osible influencia de las estrate&ias sobre el control del estr"s en la /ipertensin .. !l &rupo 4ue recibe terapia tendr unos niveles menores en la /ipertensin 0. !sco&er 16 pacientes y dividirlos en . &rupos de manera aleatoria 1 y 2: Se anali#an los niveles de los . &rupos para comprobar si realmente el &rupo 4ue /a recibido tratamiento tiene los niveles ms ba'os 4ue el &rupo 4ue no lo /a recibido.

6. !laboramos un informe para difundir los resultados. /. CONCEPTO IN.ERENCIAL Y .UNCIONES DE LA ESTAD&STICA: DESCRIPTI%A e

$a estadstica se ocupa de la sistemati#acin, reco&ida, ordenacin, y presentacin de los datos referentes a un fenmeno 4ue presenta variabilidad o incertidumbre para su estudio metdico, con ob'eto de /acer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. A partir de a4u obtenemos dos &randes reas: Estadstica descriptiva: Se or&ani#an y resumen con'untos de observaciones procedentes de una muestra o de la poblacin total, en forma cuantitativa. P!(cedi+ie)t(s *no entro en detalle por4ue dice 4ue los veremos en profundidad en los si&uientes temas+ %ara una variable 7 8ndices de tendencia central 7 !stadsticos de variabilidad 7 !stadsticos de asimetra %ara dos variables 7 Coeficientes de correlacin 7 !cuaciones de re&resin

Elisa Tarilonte Tern

ANLISIS DE DATOS
Estadstica I)-e!e)cia#: Se reali#an inferencias acerca de una poblacin basndose en los datos obtenidos a partir de una muestra. P!(cedi+ie)t(s : !l clculo de probabilidades C()ce"t(s i+"(!ta)tes P(0#aci ): !s el con'unto de todos los elementos 4ue cumplen una determinada caracterstica ob'eto de estudio.*se&3n el e'emplo de antes, la poblacin seran todas las personas 4ue padecen /ipertensin+ 1*est!a: !s un subcon'unto cual4uiera de una poblacin *las 16 personas esco&idas+ Pa!2+et!(: !s una propiedad descriptiva *una medida+ de una poblacin. *para una encuesta electoral 4ueremos conocer el porcenta'e de la poblacin 4ue respondera S a favor de una ley9 ese s sera el parmetro en este caso+ Estadstic(: !s una propiedad descriptiva *una medida+ de una muestra. *es el porcenta'e de la muestra 4ue responde s+. $as conclusiones obtenidas de una muestra solo servirn para el total de una poblacin si la muestra es !e"!ese)tati3a. %ara ase&urarnos 4ue la muestra es representativa se utili#an m"todos de +*est!e( "!(0a0i#stic(. Si 4ueremos saber 4u" porcenta'e de /ombres espa:oles se declaran se&uidores del ,eal ;adrid y la muestra 4ue esco&emos est formada por mu'eres, los resultados 4ue obten&amos no van a ser representativos. )ambi"n e(isten las +*est!as )( "!(0a0i#sticas como por e'emplo la muestra de conveniencia o incidental *personas cercanas al investi&ador, por lo cual acceder a ellas es muc/o ms fcil+.

4. 1EDICIN Y ESCALAS DE 1EDIDA


;edir la altura de una persona es al&o sencillo, sin embar&o en ocasiones la %sicolo&a debe medir cosas ms complicadas, como por e'emplo la timide# de una persona. %ara ello e(isten numerosas /erramientas 4ue nos ayudan. 1edici ): !s el proceso por el cual se asi&nan n3meros a ob'etos o caractersticas se&3n determinadas re&las. Ca!acte!stica: Cual4uier propiedad de ob'etos o personas 4ue deseamos estudiar. 1(da#idad: Distintas formas de presentarse esta caracterstica. %or $o tanto<Se asi&na un n3mero a cada una de las modalidades de una caracterstica. !'emplo: A las dos modalidades de la caracterstica se(o */ombre y mu'er+ le asi&namos los n3meros - y .. Ti"(s de esca#a de +edida: Se&3n las relaciones 4ue puedan verificarse empricamente entre las modalidades de las caractersticas, distin&uimos 1 tipos de escalas: 15 Esca#a N(+i)a#: Asi&nacin de n3meros o smbolos. %or lo tanto la 3nica relacin 4ue obtenemos es la de i6*a#dad o desi6*a#dad. !'emplo: Catlicos practicantes *-+ frente a catlicos no practicantes *.+. =o tiene sentido /acer relaciones como ->-?.. !sta escala solo nos dice si un su'eto es diferente o i&ual a otro. $5 Esca#a O!di)a#: Como su propio nombre indica, aparte de decirnos la i&ualdad o la diferenciacin, tambi"n nos indica el (!de) de las posiciones de lo 4ue est clasificado. =os permite establecer relaciones del tipo mayor 4ue o menor 4ue . !'emplo: !status socioconmico, ba'o *-+, medio *.+, alto *0+. $os n3meros no solo indican diferencia de modalidades sino tambi"n orden entre ellas. /5 Esca#a de i)te!3a#(: Adems de las caractersticas de la escala nominal *i&ualdad o desi&ualdad+ y de la escala ordinal *orden+, la escala de intervalo se identifica por4ue cada n3mero es una *)idad de +edici ), podemos sumarlos o restarlos obteniendo resultados co/erentes *a diferencia de la escala nominal+. !s importante se:alar 4ue en la escala de intervalo el ori&en es a!0it!a!i( !'emplo: !n el conocido test de inteli&encia, la escala comien#a en 6, pero este 6 es arbitrario ya 4ue si al&uien lo obtiene no si&nifica 4ue no ten&a absolutamente nada de inteli&encia. !sta arbitrariedad indica 4ue aun4ue una persona obten&a un coeficiente de @6 y otra -A6, no si&nifica 4ue la se&unda persona sea el doble de inteli&ente 4ue la primera.

Elisa Tarilonte Tern

ANLISIS DE DATOS
45 Esca#a de !a7 ): Adems de todas las caractersticas de las 0 escalas diferentes, supera a las dems en 4ue se puede establecer un punto de ori&en verdadero de valor 6 *a diferencia del 6 arbitrario de la escala de intervalo+. !s lo 4ue se conoce como valor a0s(#*t(. !'emplo: $a altura y el peso.. !n la p&ina .2 del libro tenemos un cuadro resumen 4ue e(plica todo lo anterior de manera bastante es4uemtica.

8. %ARIABLES: CLASI.ICACIN Y NOTACIN


%a!ia0#e: ,epresentacin num"rica de una caracterstica 4ue presenta ms de una modalidad *valor+ de un con'unto determinado. Si una caracterstica tiene una 3nica modalidad se llama c()sta)te. Se&3n el nivel de medicin tenemos tantas variables como escalas *variable nominal, ordinal, de intervalo, de ra#n+. Ti"(s de 3a!ia0#es A+=ominal *Cualitativa+

Dicotmica: 2 categoras se!o" #olitmica: $ %e 2 categoras nacionali%a%" Discreta: &alores 'i(os n)mero %e *i(os". Entre 1 + 2 *i(os no ,-e%en *a.er 1/0 *i(os. 1ontin-a: #-e%e *a.er me%i%as interme%ias entre los 2alores. #or e(em,lo el ,eso entre 34 + 45 ,o%emos tener 34/0.

B+ Crdinal *Cuasicuantitativa+

C+ De intervalos, ra#n *cuantitativa+ Aparte 7 7 7

de esta clasificacin e(isten ms clasificaciones: %a!ia0#e i)de"e)die)te: Cual4uier suceso 4ue sospec/amos es la causa de otro %a!ia0#e de"e)die)te: ;edida utili#ada para estudiar la variable independiente %a!ia0#e e9t!a:a: A4uellas 4ue pueden influir sobre la variable dependiente pero no nos interesa estudiar sus efectos.+

!'emplo de la /ipertensin visto anteriormente: 7 Dariable independiente: )ipo de tratamiento 7 Dalor - de la variable independiente: )ratamiento estndar 7 Dalor . de la variable independiente: )ratamiento estndar ms terapia 7 Dariable dependiente: Hipertensin arterial 7 Dariable e(tra:a: Cbesidad *sabemos 4ue la obesidad puede influir en la /ipertensin arterial pero no nos interesa estudiarla en este caso+ %ara referirnos a un valor cual4uiera de la variable ' se utili#a el subindice i ;'i 5< siendo n el n3mero de elementos 4ue componen la muestra:

6i sien%o i 7 1/2/8 9n =. DISTRIBUCIN DE .RECUENCIAS


Ena distribucin de frecuencias es una representacin de la relacin entre un con'unto de medidas e(/austivas y mutuamente influyentes y la frecuencia de cada una de ellas. .*)ci()es: 7 Cfrecer la informacin necesaria para reali#ar representaciones &rficas 7 Facilitar los datos para obtener los estadsticos muestrales !n este punto es necesario leer y comprender los &rficos de las p&inas .G y 06. Son tan sencillos 4ue ni si4uiera es necesario sacar la calculadora. De momento lo 4ue e(plica se comprende con la sola lectura. Ha tendremos tiempo de 4ue todo se compli4ue. C()ce"t(s .!ec*e)cia a0s(#*ta ;)i5: =3mero de veces 4ue se repite cada uno de los valores de una variable. $a suma de todas las frecuencias absolutas representa el total de la muestra *n+.

Elisa Tarilonte Tern

ANLISIS DE DATOS
P!("(!ci ) ( -!ec*e)cia !e#ati3a ;"i5: Cociente entre la frecuencia absoluta de cada valor de la variable *ni+ y el n3mero total de observaciones *n+. pi ? ni In P(!ce)ta>e ;Pi5: Dalor de la frecuencia relativa *pi+ multiplicado por cien: %i ? pi ( -66 .!ec*e)cia a0s(#*ta ac*+*#ada ;)a5: =3mero de veces 4ue se repita cada modalidad o cual4uiera de las modalidades inferiores. P!("(!ci ) ac*+*#ada ( -!ec*e)cia !e#ati3a ac*+*#ada ;"a5: Cociente entre la frecuencia absoluta acumulada de cada clase y el total de observaciones. p a ? na I n P(!ce)ta>e ac*+*#ad( ;Pa5: Dalor de la frecuencia relativa acumulada multiplicado por cien. %a? pa( -66 12s c()ce"t(s Si la variable cuantitativa es reducida *n3mero de /i'os+ no /ay problema, la utili#amos tal cual. %ero si ocurre 4ue puede ser muy amplia *edad+ debemos recurrir a la a&rupacin en i)te!3a#(s. $a a+"#it*d de los intervalos representa al n3mero de unidades 4ue tenemos dentro de cada intervalo. =o es lo mismo tener una amplitud de intervalos de -6 en -6 *--7.6+ *.-7 06+ *0-716+ 4ue de 2 en 2 *-27-G+ *.67.1+ *.27.G+. Cbviamente al establecer intervalos siempre se pierde informacin. %or lo tanto /ay 4ue buscar e4uilibrio entre la precisin 4ue buscamos y lo cmodo 4ue sea traba'ar con esos datos *si no estableci"semos intervalos podramos encontrarnos con tablas de -66 filas+ Aun4ue ten&amos un intervalo de edad *.2702+ *0A712+ no si&nifica 4ue no pueda /aber personas con 02,2 a:os. %or lo tanto los intervalos *.2702+ y *0A712+ reciben el nombre de #i+ites i)-(!+ad(s ( a"a!e)tes. *aparentan ser lo 4ue no son+ ya 4ue en realidad los lmites verdaderos son *.2,27 02,2+ y *02,2712,2+. !l #+ite s*"e!i(! e9act( del primer intervalo *02,2+ coincide con el #+ite i)-e!i(! e9act( del si&uiente *02,2+ Clculo de lmites e(actos L+ite e9act( ? Dalor informado *el 4ue nos /an dado+ >7 6,2 ( 8 8 ? 8nstrumento de medida. *en el caso de las edades 8 ? -+ P*)t( 1edi(: !s la semisuma del lmite superior e inferior del intervalo. Se calcula a trav"s de los lmites informados o de los lmites e(actos. !l libro asume 4ue /emos nacido con el concepto de la semisuma escrito en nuestros &enes ya 4ue no e(plica en 4u" consiste. Jui# soy la 3nica persona a la 4ue no le /an otor&ado este don de la naturale#a, pero lo e(plicar" por si /ay al&uien ms en mi situacin: Con un poco de sentido com3n el punto medio se /aya sumando los dos valores del intervalo y dividiendo el resultado entre . )omemos el intervalo *.A702+ ? .A > 02 ? A-I. ? 02,2. Ha sabemos lo 4ue es la semisumaK I)te!3a#( a0ie!t(: Son los intervalos finales 4ue se utili#an para no tener frecuencia nula. !'emplo de edad: *5A a:os o ms+

?. REPRESENTACIONES GR.ICAS
8mprescindible acompa:ar estos apuntes con el libro para comprender los conceptos &rficos. En &rfico es una forma rpida de visuali#ar un con'unto de datos o distribucin de frecuencias. !l sistema de coordenadas ms /abitual est formado por: E>e 3e!tica# ;(!de)ada ( e>e Y5 E>e @(!i7()ta# ;a0scisa ( e>e '5 O!i6e): %unto donde se 'untan ambos e'es Re"!ese)taci ) 6!2-ica de *)a 3a!ia0#e a5 Dia6!a+a de 0a!!as: Se utili#a para variables nominales, ordinales y cuantitativas discretas. 7 !n el e'e L se colocan los valores y en el H las frecuencias. Sobre cada valor de la variable se dibu'a un rectn&ulo o barra perpendicular cuya altura debe ser i&ual a la frecuencia. Dia&rama de barras acumulativo Dariedad del dia&rama de barras 4ue se utili#a en variables ordinales y cuantitativas discretas. !n el e'e L se sit3an los valores de la variable y en el e'e H las frecuencias acumuladas.

Elisa Tarilonte Tern

ANLISIS DE DATOS
05 Dia6!a+a de sect(!es: Se utili#a para variables cualitativas y cuasicuantitativas 7 ,epresentacin en forma de crculo. !l crculo se divide en secciones cuya superficie es proporcional a la frecuencia de la modalidad correspondiente. %ara determinar el n&ulo de los sectores de cada modalidad se multiplica la frecuencia relativa por 0A6, 4ue es el n3mero de &rados de una circunferencia. c5 Pict(6!a+a: Se utili#a para variables cualitativas 7 Son dibu'os alusivos al ob'eto de estudio. Son escalas 4ue deben ser proporcionales al valor 4ue representan. d5 Aist(6!a+a *parecido al dia&rama de barras pero no /ay espacio entre los rectn&ulos+ Se utili#a para variables cuantitativas continuas con datos a&rupados en intervalos 7 !n el e'e L se colocan los lmites e(actos de los intervalos y en el e'e H la frecuencia. e5 P(#6()( de -!ec*e)cias: Se utili#a para variables discretas 7 $a forma 4ue obtenemos es una lnea poli&onal cuya fi&ura se obtiene a partir de una dia&rama de barras o de un /isto&rama. 7 )ambi"n se puede utili#ar en frecuencias acumuladas *fi&ura p&ina 1-+ Re"!ese)taci ) 6!2-ica de d(s 3a!ia0#es a5 Dia6!a+a de 0a!!as c()>*)t(: Se utili#a cuando al menos una de las dos variables es cualitativa 7 $os datos se or&ani#an en una tabla de doble entrada. Se sit3an los valores de una variable en las filas y los valores de la otra variable en las columnas. 7 Ena ve# construida la tabla, se procede a dibu'ar los &rficos por columnas 05 Dia6!a+a de dis"e!si ) ( )*0e de "*)t(s: Se utili#a en el caso de dos variables cuantitativas 7 Ena variable se sit3a en el e'e L y la otra en el e'e H. %ara cada par de datos se locali#a la interseccin entre ambas variables y se marca con un punto. 7 !s una manera rpida de /allar relaciones #i)ea#es entre las dos variables.

B. PROPIEDADES DE LA DISTRIBUCIN DE .RECUENCIAS


a5 Te)de)cia ce)t!a#: Se refiere al lu&ar donde se centra una distribucin particular en la escala de valores. 05 %a!ia0i#idad: Se refiere al &rado de concentracin de las observaciones en torno al promedio. Ena distribucin de frecuencias ser: Homo&"nea *tiene poca variabilidad+. Si los valores de distribucin estn cercanos al promedio. *cuando /ay pocos rectn&ulos alrededor del central+ Hetero&"nea *tiene muc/a variabilidad+. Si los valores se dispersan muc/o en torno al promedio. *cuando /ay muc/os rectn&ulos alrededor del central+ c5 Asi+et!a ( ses6( *con calma 4ue es muy fcil pero cuesta un poco de entender al principio+. Se refiere al &rado en 4ue los datos se reparten e4uilibradamente por encima y por deba'o de la tendencia central. Diremos 4ue una distribucin ser si+,t!ica cuando al dividirla en dos a la altura de la media, las dos mitades se superponen. Si esto no ocurre decimos 4ue se produce asi+et!a. Hay dos tipos de asimetra: Asimetra positiva: Cuando la mayor concentracin de puntuaciones se produce en la parte ba'a de la escala. Asimetra ne&ativa: Cuando la mayor parte de puntuaciones se sit3a en la parte alta de la escala.

Elisa Tarilonte Tern

ANLISIS DE DATOS CAPITULO $: 1EDIDAS DE TENDENCIA CENTRAL Y POSICIN 1. 1EDIDAS DE TENDENCIA CENTRAL
$o importante en una tendencia central es calcular un valor central 4ue act3e como resumen num"rico para representar al con'unto de datos. !stos valores son las +edidas ( )dices de te)de)cia ce)t!a#. $as medidas de tendencia central ms utili#adas son 0.. 15 La +edia a!it+,tica 7 !s la ms utili#ada 7 !s el valor central alrededor del cual estn la mayora de las observaciones 7 Slo puede calcularse para variables cuantitativas *n3meros+ Se calcula sumando todos los valores de la variable divididos por el n3mero total de observaciones.

M L ? ;edia aritm"tica

' D ; 'i E )

N ? Smbolo sumatorio *indica 4ue se estn sumando todas las L 4ue /ay+ Li? Dalor 4ue toma la variable u observacin del su'eto i n ? =3mero total de observaciones Si el n3mero de observaciones es muy &rande, la media aritm"tica se puede calcular a partir de las -!ec*e)cias a0s(#*tas *ni+ o de las -!ec*e)cias !e#ati3as *pi+ *recordemos 4ue las frecuencias relativas tambi"n las llambamos proporciones+ %ara frecuencias absolutas: C %ara frecuencias relativas: C !n realidad da i&ual cual de los dos procedimientos esco'amos, ya 4ue ante una misma distribucin de frecuencias el resultado va a ser el mismo aun4ue se /a&a por la frmula de frecuencias absolutas o mediante la frmula de frecuencias relativas. ,ecordemos 4ue "i D )i E ) *esto lo vimos en el primer tema+ P!("iedades de #a +edia a!it+,tica -. !n una distribucin, la suma de las desviaciones de cada valor con respecto a su media es i&ual a cero. C

' D ; )i'i E ; )i ' D ; "i'i

; ;'iF'5 D G
Si a los valores de la variable L les aplicamos la si&uiente transformacin lineal: C C Yi D 0'i H a la media de los nuevos valores H ser Y D 0' H a Con tanta letra esto suena un poco dificil pero bsicamente e(plica 4ue si cada uno de los valores anti&uos *L+ lo multiplicamos por un n3mero cual4uiera y le sumamos otro n3mero, obtenemos nuevos valores *H+ pero con la misma proporcin anterior. !s decir, si tenemos dos valores: L?1 y L?@ y los multiplicamos por -6, tendremos H?16 y H?@6, pero la proporcin se si&ue manteniendo, el se&undo valor si&ue siendo el doble 4ue el primero. !l libro pone el e'emplo *p& A0+ ms e(tenso con el e'ercicio pero la idea bsica es esta. Li+itaci()es de #a +edia a!it+,tica a+ Cuando los datos estn a&rupados en intervalos, la media no se puede calcular si el intervalo m(imo no tiene lmite superior yIo el intervalo mnimo no lo tiene inferior. b+ %uede 4ue a la /ora de tomar los datos nos encontremos con valores muy e(tremos *asim"tricos+, en ese caso debemos valorar si son errores, entonces deberemos eliminarlos para reali#ar la media. %ero si por el contrario estos valores e(tremos son importantes para nuestro estudio, deberemos esco&er otros ndices de medicin, como por e'emplo la mediana 4ue veremos a continuacin. ..

Elisa Tarilonte Tern

ANLISIS DE DATOS
$5 La +edia)a 7 $a utili#aremos cuando la distribucin sea muy asim"trica. 7 $os valores e(tremos no le afectan *a diferencia de la media aritm"tica+ ya 4ue para su clculo slo se toman los valores 4ue ocupan posiciones centrales. 7 Se puede calcular para todo tipo de variables, e(cepto cualitativas. $a ;ediana de una variable L, representada por 1d, se define como el valor de la variable 4ue divide la distribucin de frecuencias en dos partes i&uales, conteniendo cada una el 26O de las observaciones. Clculo de mediana con pocos casos *muy fcil, %&. A2 y AA+ -P 7 Se ordenan las puntuaciones n de mayor a menor .P 7 Se Cbserva si el n3mero de observaciones n es par o impar 7 Si es impar, la mediana es el valor de la posicin central 7 Si es par, la mediana es la media aritm"tica de los dos valores centrales. Clculo de la mediana con muc/os casos *esto ya no es tan fcil<+ Al ser muc/os casos, los datos vienen presentados en intervalos. !l intervalo en el 4ue se encuentra la mediana se llama I)te!3a#( c!tic( y se corresponde con a4uel en el 4ue la frecuencia absoluta acumulada na es i&ual o superior a nI.. 1d D Li H ; )E$ F )d 5 I )c $i ? $mite e(acto inferior del intervalo crtico n ? =3mero de observaciones nd ? Frecuencia absoluta acumulada por deba'o del intervalo crtico nc ? Frecuencia absoluta del intervalo crtico 8 ? Amplitud del intervalo crtico !n la p&ina A@ /ay un e'emplo num"rico para /allar la mediana resuelto de dos maneras diferentes. $a primera manera consiste simplemente en aplicar la frmula, /acerlo paso por paso y comprendiendo 4u" es cada cosa es bastante sencillo. $a se&unda manera consiste en una re&la de tres. $os dos procedimientos dan el mismo resultado. Cas(s es"ecia#es *p& AG75-+ Si /emos entendido el caso anterior, esto es ms de lo mismo pero con un par de puntuali#aciones+ A+ Cuando se trata de una distribucin de frecuencias pero los datos no estn a&rupados en intervalos. Como los datos son unitarios, la amplitud *8+ ser ? !s prcticamente lo mismo 4ue el e'emplo anterior pero con 8 ? B+ =o se puede calcular la mediana cuando los datos estn a&rupados en intervalos y e(iste un intervalo abierto en el 4ue se encuentra la mediana. /5 La +(da *la ms fcil de todas las medidas de tendencia central+ 7 Se puede calcular para variables cualitativas y cuantitativas. 7 Se representa por 1( y se define como el valor o cate&ora de la variable con mayor frecuencia absoluta. 7 Si los datos estn a&rupados en intervalos, la moda se puede calcular e(cepto si el intervalo modal coincide con el intervalo abierto. 7 Si la variable es c*a#itati3a, la moda es la cate&ora con la m(ima frecuencia. 7 Si la variable es c*a)titati3a, la moda es el valor con la m(ima frecuencia absoluta. 7 Si la variables es c*a)titati3a con datos en i)te!3a#(s, se locali#a el intervalo modal *intervalo con la frecuencia m(ima+ y la moda es el punto medio de dic/o intervalo. %odemos tener distinto n3mero de modas en la distribucin *-? unimodal+ *.?bimodal+ *0?trimodal+9 etc. Dist!i0*ci ) a+(da# ? cuando no /ay moda ya 4ue todos los valores tienen la misma frecuencia absoluta.

Elisa Tarilonte Tern

<

ANLISIS DE DATOS
La e#ecci ) de *)a +edida de te)de)cia ce)t!a# 7 !n primer lu&ar probaremos con la +edia a!it+,tica *menos en los casos en 4ue la distribucin sea muy asim"trica, o el nivel de medida sea nominal u ordinal, o e(istan datos a&rupados en intervalos con intervalos abiertos. 7 Si vemos 4ue por al&una de estas ra#ones la media aritm"tica no funciona probaremos con la +edia)a. Sin embar&o la mediana no podremos utili#arla cuando el nivel de la variable sea nominal o la mediana se encuentre en el intervalo abierto. 7 !ntonces, descartando las dos medidas anteriores, probaremos con la +(da. Aun4ue no podremos calcularla si la distribucin es amodal o el intervalo abierto coincide con el intervalo modal. Hoy en da se recomienda calcular las 0 *siempre 4ue se pueda+. 7 Dariables cualitativas: Solo podremos calcular la moda 7 Dariables ordinales: moda y mediana 7 Dariables cuantitativas: %odemos calcular las 0.

$. 1EDIDAS DE POSICIN
$a medida de tendencia central buscaba un indicador para representar a un con'unto de datos. !n cambio, las medidas de posicin buscan un indicador para representar a un su'eto o a un dato en particular. 1edidas de te)de)cia ce)t!a#: =ota media de un e(amen en una clase de 06 ni:os 1edidas de "(sici ): QJu" nota debe sacar un alumno para superar al 26O de compa:erosR $as medidas o ndices de posicin *tambi"n llamados cuantiles+, informan acerca de la posicin relativa de un su'eto con respecto a su &rupo de referencia. Dependiendo de cuntos valores de la variable utilicemos para dividir la distribucin, /ablaremos de percentiles, cuartiles o deciles. Pe!ce)ti#es )ambi"n llamados centiles , son los GG valores de la variable 4ue dividen en -66 partes i&uales la distribucin de frecuencias. %ercentil S *%S +: !s un valor de la variable de inter"s 4ue de'a por deba'o de s un porcenta'e S de su'etos, donde S ? -,.<GG E>e+"#( P4G D $8 *.2 es la puntuacin en un e(amen+ Juiere decir 4ue los su'etos con L? .2 estn por encima del 16O de los su'etos. !n los percentiles, la mediana coincide con el percentil 26 *es 'usto la mitad+. %or esta ra#n el percentil lo calcularemos a partir de las frmulas para la mediana. Clculo de los percentiles Etili#aremos la misma frmula 4ue la mediana pero sustituyendo )IE1GG en lu&ar de )E$ PI D Li H ; )IE1GG F )d 5 I )c $i ? $mite e(acto inferior del intervalo crtico n ? =3mero de observaciones nd ? Frecuencia absoluta acumulada por deba'o del intervalo crtico nc ? Frecuencia absoluta del intervalo crtico 8 ? Amplitud del intervalo !'emplo num"rico en la p&ina 5@. )enemos 4ue tener en cuenta 4ue lo primero 4ue /ay 4ue /acer es /allar el intervalo crtico mediante la frmula *nSI-66+ a diferencia de cmo lo /allbamos para la mediana 4ue era mediante la frmula *nI.+ Aparte de /allar el valor de los percentiles, tambi"n puede ocurrir 4ue ya ten&amos un valor y 4ueramos saber 4u" posicin ocupa ese valor en la distribucin *es como lo de antes pero al rev"s, es decir, antes tena una posicin y 4uera /allar un valor. A/ora ten&o un valor y 4uiero /allar una posicin. %or lo tanto la frmula cambia un poco.

Elisa Tarilonte Tern

ANLISIS DE DATOS
I D ;PI F Li 5 )c E I H )d . 1GG ) Si el resultado de S es decimal se redondea. C*a!ti#es J deci#es C*a!ti#es: 0 valores de la distribucin 4ue dividen en 1 partes de i&ual frecuencia a la distribucin. %rimer Cuartil *J-+ ? De'a por deba'o de s al .2O y por encima al 52O *J- ? %.2+ Se&undo Cuartil *J.+ ? De'a por deba'o de s al 26O y por encima al 26O *J. ? %26 ? ;d+ )ercer Cuartil *J0+ ? De'a por deba'o de s al 52O y por encima al .2O *J0 ? %52+ %or lo tanto como cada cuartil se corresponde con un percentil, utili#aremos las frmulas de los percentiles para /allar cada cuartil. Deci#es: Son G valores 4ue dividen en -6 partes i&uales a la distribucin. Se representan por D-, D. <D G <y al i&ual 4ue los cuartiles, tambi"n se corresponden con cada percentil: D- ? %-6 9 D. ? %.6 etc< %or lo tanto tambi"n utili#aremos las frmulas de los percentiles "a!a ca#c*#a! #(s deci#es.

Elisa Tarilonte Tern

ANLISIS DE DATOS CAPITULO /: 1EDIDAS DE %ARIABILIDAD Y ASI1ETR&A 1. INTRODUCCIN


!n el tema - veamos 4ue la distribucin de frecuencias tiene tres propiedades: tendencia central, variabilidad y asimetra. $as medidas de tendencia central las /emos visto en el tema ., a/ora vamos a ver las medidas de las otras dos propiedades *variabilidad y asimetra+.

$. 1EDIDAS DE %ARIABILIDAD
$a 3a!ia0i#idad ( dis"e!si ) /ace referencia al &rado de variacin 4ue /ay en un con'unto de puntuaciones *e'emplo de &rficos con ms y menos dispersin T %&. G.+ Cuanto menor es la variabilidad en una distribucin, ms /omo&"nea es la muestra de su'etos en la variable 4ue estamos midiendo. !l caso e(tremo de m(ima /omo&eneidad es 4ue todos los valores seran i&uales entre s y no /abra variabilidad. %ara cuantificar la dispersin de los datos se distin&uen . tipos de ndices: 7 $os 4ue miden el &rado en 4ue las puntuaciones se aseme'an o diferencian entre s: A+"#it*d t(ta# ( !a)6( J a+"#it*d se+iFi)te!c*a!ti# 7 $os 4ue la dispersin de mide con respecto a al&una medida de tendencia central como la media aritm"tica: %a!ia)7a J des3iaci ) t"ica. A+"#it*d t(ta# ( !a)6(: $a amplitud total, *A)+ de un con'unto de puntuaciones es la distancia 4ue /ay en una escala num"rica entre los valores 4ue representan la puntuacin m(ima y la puntuacin mnima. *e'emplo en p&ina G1, muy fcil. Hay 4ue tener en cuenta lo 4ue eran los lmites e(actos, superior e inferior, 4ue vimos en el primer tema+ AT D '+a9 K '+i) Sin embar&o esta medida slo aporta datos de los valores e(tremos, pero no nos dice la poca o muc/a dispersin 4ue pueda e(istir en el resto de valores. %a!ia)7a J des3iaci ) t"ica: $a medida de variabilidad tambi"n se puede basar en la distancia observada entre las puntuaciones y la media aritm"tica. %or lo tanto: 7 Ena distribucin con poca variabilidad es a4uella en la 4ue la mayora de las puntuaciones estn muy pr(imas a la media. 7 Ena distribucin con muc/a variabilidad tiene sus puntuaciones muy ale'adas del valor medio de la variable. A4u utili#aremos un ndice llamado des3iaci ) +edia: C

D1 D ; 8'i F '8 I n
!l libro dice 4ue este ndice se utili#a muy poco en la actualidad y 4ue apenas e(isten t"cnicas estadsticas basadas en este ndice. Sin embar&o conviene 4ue lo estudiemos en profundidad no vaya a ser 4ue en los pr(imos a:os se convierta en una /erramienta completamente fundamental y necesaria para desarrollar la profesin de psiclo&o. $a 3a!ia)7a de un con'unto n de puntuaciones en una variable L denotada por S (, se define como el promedio de los cuadrados de las desviaciones de las puntuaciones con respecto a la media. C S ( D ; *' i F ' + I n !sta otra frmula sirve para lo mismo: S 9 D ;; ' i E )5 K ' Aun4ue supon&o 4ue a estas alturas todo el mundo lo sabr, pero estas frmulas estn en la Addenda y nos de'an tenerla con nosotros durante el e(amen. Cuando los datos se presentan en tablas de distribucin de frecuencias, a&rupados o sin a&rupar en intervalos, la varian#a se puede calcular con las si&uientes frmulas. C S
$ 9 $ . .

D ; )i ;'i F '5 E ) *para frecuencias absolutas+ 15

Elisa Tarilonte Tern

7 ANLISIS DE DATOS
C

S 9 D ; )i ' i E )5 K ' *para frecuencias absolutas+ n ? n3mero total de observaciones *como siempre+ Li ? es el valor i de la variable L o el punto medio del intervalo =i ? es la frecuencia absoluta del valor o intervalo i Ctra frmula ms:
$

C
$ $

S 9 D ; "i ' i F ' *para frecuencias relativas+ pi ? Frecuencia relativa o proporcin de observaciones del valor o del intervalo i !'ercicios de e'emplo en la p&ina G@ y GG. 7 $a varian#a es un n3mero positivo 4ue se e(presa en las unidades de la variable al cuadrado. Si la variable L se mide en metros, la varian#a vendr e(presada en metros al cuadrado. %or lo tanto para encontrar una medida de dispersin 4ue ten&a las mismas unidades 4ue la variable, debemos /acer la ra# cuadrada de la varian#a *para 4uitarle el cuadrado+ y obtener un ndice llamado des3iaci ) t"ica. $a des3iaci ) t"ica de un con'unto de n puntuaciones, 4ue se representa pos SL, es la ra# cuadrada de la varian#a.

Sx 7

Xi>X" n

P!("iedades de #a 3a!ia)7a J #a des3iaci ) t"ica 7 %ara calcularlas las dos re4uieren la utili#acin de todas las puntuaciones de la distribucin. 7 $as dos miden la variabilidad de los datos con respecto a la media aritm"tica, por lo 4ue slo deben aplicarse si estamos utili#ando la media como medida central 7 Siempre son i&uales o mayores 4ue 6. 7 Si a una variable ' se le suma o resta una constante a, la varian#a y desviacin tpica de la variable ori&inal no se ven afectadas y si&uen siendo las mismas. !n cambio, cuando multiplicamos los valores de ' por una constante 0, la varian#a 4ueda multiplicada por la constante al cuadrado y la desviacin tpica por el valor absoluto de dic/a constante. En primo /ermano de la varian#a y 4ue se utili#a en inferencia estadstica es la c*asi3a!ia)7a: C S n7- D ; *'i F '+ I n 7 Al i&ual 4ue ocurra con la varian#a normal, en la cuasivarian#a tambi"n podemos medir la cuasidesviacin tpica 4ue es la rai# cuadrada de la cuasivarian#a *frmula en -6-+
.

2 n >1

Xi>X"?n>1

C(e-icie)te de 3a!iaci ) Se trata de un ndice de variabilidad relativa 4ue no depende de las unidades de medida. M CD ? *SLIL+ -66 Cuando comparamos dos con'untos de puntuaciones obtenidas de la misma variable, tambi"n es necesario el coeficiente de variacin para comparar la dispersin de ambas distribuciones Cuidado con el e'emplo 0.2 de la p&ina -6., ya 4ue /ay una errata 4ue me /a /ec/o perder unos cuantos minutos de ms *como si me sobraran+ !n concreto en el enunciado dice <y una varianza de 17,3, esto est mal, la varian#a es de 1=.

Elisa Tarilonte Tern

11

ANLISIS DE DATOS
A+"#it*d se+iFi)te!c*a!ti# ;L ( !a)6( se+iFi)te!c*a!ti#5: Como /emos dic/o antes, este ndice se utili#a cuando la distribucin es muy asim"trica. Se define como la distancia media entre el tercer y el primer cuartil. =o informa de la variabilidad del con'unto de puntuaciones sino del 26O de las mismas comprendidas entre el percentil .2 y el 52 de la distribucin. !l e'ercicio de la p&ina -617-62 4ue e'emplifica este ndice es muy fcil, lo dificil es calcular los percentiles 4ue ya lo vimos en el tema .. L D L K L1 E $ D P?8 K P$8 E $

/. INDICE DE ASI1ETR&A DE PEARSON


$a asi+et!a es una propiedad de la distribucin de frecuencias 4ue nos indica el &rado en el 4ue las puntuaciones de los su'etos se reparten por deba'o y por encima de la medida de tendencia central. E# )dice de Pea!s() es un ndice num"rico 4ue cuantifica el &rado de asimetra de una distribucin. C ASD ' F 1( E S9 7 !ste ndice es adi+e)si()a# *no tiene unidades de medida+ y se aplica a distrobuciones unimodales. 7 Cuando la distrubicin es si+,t!ica, la media y la moda coinciden, por lo 4ue el numerador se anula y el valor del ndice *As+ es ? 6. 7 !n distribuciones con asi+et!a "(siti3a, la media es mayor 4ue la moda, por lo tanto AS ser mayor 4ue 6. *recordamos 4ue asimetra positiva se produce cuando la mayor cantidad de puntuaciones se concentran en la parte ba'a de la tabla+ 7 !n distribuciones con asi+et!a )e6ati3a, la media es menor 4ue la moda, por lo tanto AS ser menor 4ue 6. *la asimetra ne&ativa se produce cuando la mayor cantidad de puntuaciones se sit3a en la parte alta de la tabla+ !'emplo 0.5 en la p&ina -6A. Debemos recordar cmo se obtenamos la moda, *;o+, cuando los datos estn a&rupados en intervalos, la moda es el punto medio del intervalo modal. H el intervalo modal es el intervalo con la frecuencia m(ima, es decir, a4uel donde ni es mayor.

4. PUNTUACIONES T&PICAS
Hasta a/ora /emos visto "*)t*aci()es di!ectas *nota de un su'eto en un test+, sin embar&o estas puntuaciones nos dan poca informacin ya 4ue no sabemos si se trata de un valor alto o ba'o, ya 4ue esto depende del promedio del &rupo. Si a una puntuacin directa Li le restamos la media de su &rupo obtenemos una "*)t*aci ) di-e!e)cia# ;9i5 C 9i D 'i K ' %ropiedades de las puntuaciones diferenciales 7 7 Su media es cero: $a varian#a de las puntuaciones directas:
C

9DG puntuaciones
$ $

diferenciales

es

i&ual

la

varian#a

de

las

S9DS9 Sin embar&o, dos puntuaciones diferenciales id"nticas pueden tener un si&nificado muy diferente en funcin de la media y de la varian#a de las distribuciones de las 4ue proceden. %ara solucionar este problema tenemos las "*)t*aci()es t"icas 4ue nos permiten no slo comparar las puntuaciones de un su'eto en dos variables distintas sino tambi"n comparar dos su'etos distintos en dos pruebas o variables distintas.

Elisa Tarilonte Tern

12

ANLISIS DE DATOS
C 7 9 D 9 E S9 D ' K ' E S9 Al proceso de obtener puntuaciones tpicas se llama puntuaciones tambi"n se llaman "*)t*aci()es ti"i-icadas. %ropiedades de las puntuaciones tpicas 7 Su media es cero: C 79 D GE)s9 D G
$

ti"i-icaci ).

%or

ello

estas

S 79 D 1 E>e!cici( e) e# e>e+"#( /.B "a!a c(+"!(0a! estas "!("iedades.

Su varian#a es i&ual a -

Elisa Tarilonte Tern

18

ANLISIS DE DATOS CAPITULO 4: ANALISIS CONMUNTO DE DOS %ARIABLES 1. INTRODUCCIN


!ste tema se centra en el estudio con'unto de dos variables. D(s 3a!ia0#es c*a#itati3as 7 )abla de datos 7 )abla de contin&encia 7 Dia&rama de barras 7 )abla de diferencias entre frecuencias empricas y tericas 7 Calculo de coeficiente L. 7 Clculo del coeficiente de contin&encia D(s 3a!ia0#es c*a)titati3as 7 )abla de datos con'untos 7 Dia&rama de dispersin 7 Clculo de covarian#a 7 Clculo del coeficiente de correlacin de %earson Si dos variables cuantitativas estn relacionadas linealmente utili#aremos la recta de re&resin.

$. CONCEPTOS PRE%IOS
As(ciaci ) JE( !e#aci ) e)t!e d(s 3a!ia0#es: Dos variables estn relacionadas entre s cuando ciertos valores de una de las variables se asocian con ciertos valores de la otra variable.

/. ASOCIACIN ENTRE DOS %ARIABLES CUALITATI%AS


,ecordamos 4ue la variable cualitativa era a4uella 4ue estaba medida en una escala nominal o de clasificacin *tema -+. Adems pueden ser: Dic(t +icas: Cuando solo representan dos cate&oras P(#it +icas: Cuando representan un mayor n3mero Cuando se dispone de los datos de dos variables cualitativas para todos los su'etos de una muestra, se puede elaborar la Ta0#a de c()ti)6e)cia y su correspondiente dia6!a+a de 0a!!as ;"26i)a 1$85. $os datos de esta tabla son las frecuencias empricas u observadas y se representan por *ne+ A/ora tenemos 4ue construir una nueva tabla con las frecuencias tericas *nt+. %ara ello utili#aremos la frmula: Frecuencia terica ? nt ?

Totalfila A x A totalcolumna n

Ena ve# creada esta se&unda tabla *p&ina -.A+ tenemos 4ue crear una tercera tabla 4ue muestra las diferencias entre la tabla - y la tabla .. !s decir, la ta0#a de di-e!e)cias entre las frecuencias empricas menos las frecuencias tericas. *p&ina -.5+ 7 !s importante 4uedarnos con el dato de 4ue la suma de las filas y las columnas de esta tercera tabla siempre es i&ual a 6, si sale otra cosa es 4ue al&o /emos /ec/o mal. Ena ve# 4ue tenemos la tabla debemos interpretarla: $a interpretacin 4ue /ace el libro se basa en anali#ar los 3a#(!es "(siti3(s *@+ como fuente de informacin. *parece ser 4ue los valores ne&ativos no nos aportan informacin+ .As tenemos un @ en S7D y en =o7;. %or lo tanto concluiremos 4ue los varones tienen mayor tendencia a padecer estr"s *S7D+ y las mu'eres tiene menos tendencia a padecer estr"s *=o7;+. Calculamos un estadstic( '$ !stadstico X. ? ne ? frecuencia emprica nt ? frecuencia terica

ne > nt " nt

Elisa Tarilonte Tern

1:

ANLISIS DE DATOS
%ara calcular el estadstico no /ace falta informacin nueva, ya 4ue e(traemos todos los n3meros de las tablas anteriores. Sin embar&o este estadstico nos da poca informacin por4ue desconocemos su lmite superior. Slo sabemos 4ue si nos da valor 6 no /ay relacin entre las dos variables. Sin embar&o si nos da un valor cual4uiera como por e'emplo -6,5@ *p&ina -.@+ no sabemos 4ue interpretar ya 4ue el lmite podra ser .6, 26 , -66 etc y lo desconocemos. %ara resolver este problema se calcula al&o 4ue s 4ue sabemos sus lmites y es el )dice ( C(e-icie)te de C()ti)6e)cia< C. *da valores entre 6 y -+ C(e-icie)te de c()ti)6e)cia D C D

X X $n
2

Adems del Coeficiente de Contin&encia tenemos tambi"n 4ue calcular su posteriormente poder comparar uno con otro +

+29i+(

*para

Cmx 7

k>1 k

I D =3mero de filas y n3mero de columnas *en el e'emplo 4ue vamos a ver a continuacin U?. por4ue tenemos mismo n3mero de filas *.+ 4ue de columnas *.+ Si&uiendo el e'emplo del libro, el Coeficiente de contin&encia nos da 6,0-. y su m(imo 6,565. %or lo tanto el coeficiente de contin&encia est prcticamente a la mitad de su m(imo y por ello diremos 4ue la relacin entre las dos variables es de ti"( +edi(. )ambi"n tenemos el e'emplo de tablas con distinto n3mero de filas y columnas, por lo tanto no podremos calcular el Cm(. H la informacin la e(traeremos directamente de C *e'emplo p&ina -.G7-06+ !n este e'emplo el procedimiento para calcular las tablas es el mismo 4ue el e(plicado en la primera parte, la 3nica diferencia es cuando lle&amos a C ya 4ue no podemos calcular su Cm(. Pa!a c()c#*i!: Ca!acte!sticas de# C(e-icie)te C 7 )iene valores entre 6 y 7 Cuando C ? 6 diremos 4ue no e(iste relacin entre ellas 7 C ? - nunca se puede dar 7 Cuanto mayor es C, mayor es la relacin entre las dos variables y viceversa 7 Cuando utilicemos C para comparar la relacin entre dos variables cuyos datos tenemos en dos tablas de contin&encia diferentes, tenemos 4ue vi&ilar 4ue tienen el mismo n3mero de filas y de columnas. De lo contrario los valores de C no permiten una comparacin vlida. 7 Cuando e(iste un valor elevado de C, no podemos afirmar con rotundidad 4ue una de las variables es causa de la otra, ya 4ue puede /aber una tercera variable 4ue est relacionando a ambas. 7 Cuando la tabla de contin&encia tiene i&ual n3mero de filas 4ue de columnas, podemos estimar un valor m(imo 4ue alcan#ar C.

4. CORRELACIN ENTRE DOS %ARIABLES CUANTITATI%AS


=os presentan una ta0#a de dat(s c()>*)t(s *p&ina -0.+. $o primero 4ue /acemos es elaborar el dia&rama de dis"e!si ) ( )*0e de "*)t(s *p&ina -00+ Ena ve# reali#ado el dia&rama y tan slo observndolo, podemos decir 4ue e(iste una !e#aci ) #i)ea# en las variables L e H. !s decir, a valores mayores de L correspondern valores mayores de H y viceversa. Ena ve# lle&ados a este punto calculamos . ndices 4ue nos permiten ponerle n3meros a todo esto 4ue llevamos anali#ado:

!l primero de estos ndices es la c(3a!ia)7a y /ace referencia a la variacin con'unta de dos

Elisa Tarilonte Tern

10

ANLISIS DE DATOS
variables. C(3a!ia)7a ? SXY 7

=
i i

X > XY

n
Li ? Dalor de la variable L en el caso i Hi ? Dalor de la variable H en el caso i X ? ;edia de la variable L

Y ? ;edia de la variable H
n ? n3mero de casos de la muestra Si el si&no de la covarian#a es "(siti3(, diremos 4ue e(iste !e#aci ) #i)ea# di!ecta. Si el si&no de la covarian#a es )e6ati3(, diremos 4ue e(iste !e#aci ) #i)ea# i)3e!sa. !n el e'emplo de la p&ina -01 observamos 4ue la covarian#a da A,1 *si&no positivo+ por lo tanto se cumple la relacin lineal directa 4ue ya /abamos observado en el dia&rama de dispersin. Sin embar&o la covarian#a tiene un problema y es 4ue no conocemos su ran&o *de la misma . manera 4ue con el estadstico L no sabamos su lmite superior y tenamos 4ue calcular el coeficiente de contin&encia+ , por lo tanto para la covarian#a calcularemos al&o llamado C(e-icie)te de C(!!e#aci ) de Pea!s() ;!9J5

rXY 7

SXY SX SY

SL ? Desviacin tpica de la variable L *tema 0+ SH ? Desviacin tpica de la variable H *tema 0+ SLH ? Covarian#a entre L e H P!("iedades de# c(e-icie)te de C(!!e#aci ) de Pea!s() 7 )oma valores comprendidos entre 7- y >7 Cuando vale 6 no e(iste relacin lineal entre L e H 7 Cuando vale e(actamente >- o 7- diremos 4ue una variable es una transformacin lineal de la otra 7 Cuanto mayor es el valor absoluto del coeficiente nos est indicando 4ue la relacin lineal entre las dos variables es ms fuerte. 7 Cuando el si&no es positivo, indica 4ue a valores mayores de la variable L, tienden a corresponder valores mayores de la variable H y a valores menores de la variable L tienden a corresponder valores menores de la variable H. !s una !e#aci ) di!ecta. 7 Cuando el si&no es ne&ativo, indica 4ue a valores mayores de la variable L, tienden a corresponder valores menores de la variable H, y a valores menores de la variable L tienden a corresponder valores mayores de la variable H. !s una !e#aci ) i)3e!sa. P26i)a 1/? J 1/B: E>e+"#(s de dia6!a+as de dis"e!si ) J )*0es de "*)t(s c() s*s c(!!es"()die)tes e9"#icaci()es. Cas( A 7 Coeficiente de correlacin positivo 7 ,elacin lineal directa bastante clara Cas( B 7 Coeficiente de correlacin ne&ativo 7 ,elacin lineal inversa Cas( C 7 Coeficiente de correlacin lineal cercano a 6 7 =o e(iste correlacin lineal Cas( D

Elisa Tarilonte Tern

16

ANLISIS DE DATOS
Coeficiente de correlacin lineal cercano a 6 =o e(iste una relacin lineal pero s e(iste una relacin curvilnea entre las dos variables. *sin embar&o el coeficiente de correlacin no puede detectar esto por lo tanto diremos 4ue es una de sus limitaciones+ Cuando rLH? >- o 7- , e(iste correlacin lineal perfecta Cuando rLH? 6 , e(iste ausencia total de correlacin lineal Qpero 4u" pasa cuando tenemos valores intermedios como por e'emplo 6,22R !n ese caso no podemos afirmar 4ue ese valor indica correlacin alta o ba'a ya 4ue depender del tipo de datos 4ue estemos anali#ando 7 Ser ba'a si se trata de dos tests similares 4ue estemos aplicando a los mismos su'etos o si tenemos pocos su'etos 7 Ser alta si se trata de tests bastante diferenciados o si tenemos muc/os su'etos. 7 7

4. REGRESIN LINEAL
Cuando e(iste relacin lineal podemos utili#ar la !ecta de !e6!esi ) para efectuar pronsticos de los valores de una variable a partir de otra variable. Y D a H 0' %ara /allar la recta tenemos 4ue calcular a y 0 con las si&uientes frmulas:

n = XY " > = X =Y b7 n= X 2 > a7Y>bX


$a recta pasa por el punto X /Y . $as puntuaciones obtenidas mediante la recta de re&resin las denominaremos "*)t*aci()es "!()(sticadas. A la diferencia entre la: puntuacin real o verdadera Yi y su pronstico Y lo llameremos e!!(! y lo representaremos por Ei
B

= X"

E7 Y>Y "
P!("iedades de #as "*)t*aci()es "!()(sticadas J de #(s e!!(!es F $a media de los errores es cero

E75

7 $a media de las puntuaciones pronosticadas coincide con la media de las verdaderas puntuaciones en H. Y 7 Y 7 $a varian#a de las puntuaciones en H es i&ual a la suma de la varian#a de los pronsticos, ms la varian#a de los errores:
2 2 2

SY 7 SY B $ SYX
Adems tambi"n se pueden comprobar las si&uientes i&ualdades:

Elisa Tarilonte Tern

1<

ANLISIS DE DATOS CAPITULO 8: NOCIONES BSICAS DE PROBALIDAD 1. INTRODUCCIN


!n cual4uier investi&acin es importante poder &enerali#ar o inferir nuestros resultados a un colectivo muc/o ms amplio al 4ue /emos denominado poblacin. %or esta ra#n estudiamos la probablidad.

$. CONCEPTOS PRE%IOS
E9"e!i+e)t( a#eat(!i( *0 caractersticas+: 7 )odos los resultados posibles son conocidos con anterioridad a su reali#acin 7 =o se puede predecir con certe#a el resultado 4ue vamos a obtener 7 !l e(perimento puede repetirse todas las veces 4ue se desee en id"nticas condiciones. Es"aci( +*est!a#: !s el con'unto de todos los resultados posibles de un e(perimento aleatorio. Se representa por la letra E. !n el e'emplo de tirar un dado, ! seran todos los valores del - al A. S*ces(: Son los resultados de un e(perimento aleatorio o subcon'untos del espacio muestral. %ueden ser: 7 !lementales: En solo resultado del espacio muestral *un cuatro en el dado+ 7 Compuestos: Dos o ms resultados del espacio muestral *n3mero par en el dado+ $as si&uientes tres letras muestran 0 sucesos distintos. A es elemental y B y C son compuestos. !ste e'emplo va a ayuda para comprender los conceptos si&uientes. A?1 B?.,1,A *n3mero par+ C?0,A *m3ltiplo de 0+ S*ces( se6*!(: !s sinnimo de !, siempre ocurre. S*ces( i+"(si0#e: =o puede ocurrir, se representa por C *con'unto vaco+ U)i ): Enin de dos sucesos A y B es el subcon'unto de ! formado por los sucesos elementales 4ue pertenecen a A, a B o a ambos a la ve#.

A B 7 2/ :/6
I)te!secci ): $a interseccin de dos sucesos A y B es el subcon'unto de ! formado solamente por los sucesos elementales 4ue pertenecen a A y a B a la ve#.

ADB7:
Si la interseccin no contiene incompatibles o e(cluyentes: elementos comunes diremos 4ue los sucesos son

ADB7EF7C
C(+"#e+e)ta!i(: De un suceso A es el subcon'unto de ! formado por todos los sucesos 4ue no pertenecen a A. Se representa por A

A ? -,.,0,2,A
Enin, 8nterseccin y complementario se pueden representar &rficamente mediante los dia6!2+as de %e)). *p& -A6+.

/. DE.INICIN DE PROBABILIDAD
0 tipos de definiciones De-i)ici ) c#2sica: $a probabilidad de un suceso es i&ual al cociente entre el n3mero de casos favorables de 4ue ocurra ese suceso y el n3mero de casos posibles en el supuesto de 4ue todos los casos ten&an la misma oportunidad de ocurrir. P!(0a0i#idad de *) s*ces( D NN+e!( de cas(s -a3(!a0#esE)N+e!( de cas(s "(si0#es %robabilidad de conse&uir un . en el dado ? -IA %robabilidad de conse&uir un n3mero par ? 0IA De-i)ici ) estadstica: $a probabilidad de un suceso es el lmite al 4ue tiende la frecuencia relativa de aparicin de un suceso A cuando el n3mero de ensayos, n, tiende a infinito:

Elisa Tarilonte Tern

13

ANLISIS DE DATOS P A" 7 lim


n GH

nA n

De-i)ici ) a9i(+2tica: $a probabilidad de un suceso A, definido en el espacio muestral E y 4ue desi&namos por %*A+, a un n3mero real 4ue asi&namos al suceso A, tal 4ue cumple las si&uientes propiedades:

5 I P A" I 1 P E"71 P A" 7 1 > A"


A estas propiedades se le a:ade el: Te(!e+a de #a s*+a: $a probabilidad de 4ue ocurra el suceso A o el suceso B es i&ual a la probabilidad de 4ue ocurra A ms la probabilidad de 4ue ocurra B, menos la probabilidad de 4ue ocurran ambos, A y B:

P A B" 7 P A " $ P B" P A B "


Si A y B son incompatibles, la re&la 4ueda as: P A B" 7 P A" $ P B"

4. PROBABILIDAD CONDICIONADA
Dos sucesos, A y B, son de"e)die)tes cuando la probabilidad de A est condicionada al suceso B. %*AIB+? %robabilidad de A condicionado a B. De-i)ici ): %ara dos sucesos cuales4uiera A y B, la probabilidad de A condicionado a B es i&ual a la probabilidad de la interseccin dividido por la probabilidad de la condicin B:

P A ? B" 7

P A D B" P B"
*siempre 4ue %*B+ no sea 6+

P A ? B" 7

P A D B" P B"
*siempre 4ue %*A+ no sea 6+

Si los sucesos A y B son independientes: %*AIB+ ? %*A+ y %*BIA+?%*B+

8. LA REGLA DEL PRODUCTO Y EL TEORE1A DE BAYES P A B" 7 P A" P( A / B) esto se conoce como la !e6#a ( te(!e+a de# "!(d*ct( P A B" 7 P A" P B" cuando los sucesos A y B son independientes
)odo esto se e'emplifica en los e'ercicios p& -A57-5.: Son bastante sencillos pero /ay 4ue verlos con calma. Ctra forma de e(presar el )eorema de Bayes: P A ? B" 7

P A " > P B ? A"


P * B+

Elisa Tarilonte Tern

14

ANLISIS DE DATOS TEJA 6. DISTKILM1IONES DIS1KETAS DE #KOLALILIDAD 2. Variable aleatoria: definicin y tipos: Mna 2aria.le aleatoria es -na '-ncin N-e asigna -n n)mero real/ + slo -no/ a ca%a -no %e los res-lta%os %e -n e!,erimento aleatorio. Las 2aria.les aleatorias se re,resentan ,or letras ma+)sc-las %e n-estro al'a.eto latino + -tiliOaremos las min)sc-las con s-.n%ices/ ,ara los 2alores concretos %e las 2aria.les. Las 2aria.les aleatorias ,-e%en ser %iscretas o contin-as. Discreta c-an%o la 2aria.le slo ,-e%e tomar -n con(-nto in'inito + n-mera.le %e 2alores los n)meros nat-rales" o 'inito %e 2alores n)mero %e s-cesos". P contin-a c-an%o ,-e%e tomar in'initos 2alores o -n con(-nto %e 2alores no n-mera.le. 3. Variables aleatorias discretas: Funcin de probabilidad Se llama '-ncin %e ,ro.a.ili%a% %e -na 2aria.le aleatoria %iscreta/ 6/ + se re,resenta ,or ' !"/ a aN-ella '-ncin N-e asocia a ca%a 2alor %e la 2aria.le la ,ro.a.ili%a% %e N-e Qsta a%o,te ese 2alor. Es %ecir: f(x) = P (X=x) Ejemplo:

Don%e: x f(x) 5 5/120 1 5/8<0 2 5/8<0 8 5/120

La '-ncin %e ,ro.a.ili%a% %e -na 2aria.le aleatoria %iscreta ,-e%e re,resentarse me%iante -n %iagrama %e .arras. Las %os ,ro,ie%a%es N-e %e.e c-m,lir la '-ncin %e ,ro.a.ili%a% son: 1. #ara c-alN-ier 2alor %e !/ siem,re toma 2alores ,ositi2os o n-los: x X f!x) " # 2. La s-ma %e to%as las ,ro.a.ili%a%es corres,on%ientes a ca%a 2alor %e ! es ig-al a -no: f!x) $ f!x%)&f!x')&(((&f!xn) $ % Funcin de di)tribucin La '-ncin %e %istri.-cin %e -na 2aria.le aleatoria 6/ se re,resenta ig-al N-e la %e ,ro.a.ili%a% ,ero en ma+)sc-la: F!x)* + e) a,uella funcin ,ue a)ocia a cada -alor de la -ariable la probabilidad de ,ue .)ta adopte e)e -alor o cual,uier otro inferior( F!x) $ P !X / x) De la misma 'orma: F!x) $ P !X / x) $ f!x%)&f!x')&(((&f!x) Ketoman%o el e(em,lo anterior calc-lamos F!#)0 F!%)0 F!') + F!1) F(0) = P(X < 0) = P(X = 0) = 0,125 F(1) = P (X < 1) = P (X = 0) + P (X = 1) = f(0) + f(1) = 0,125 + 0,375 = 0,5 Elisa Tarilonte Tern 25

ANLISIS DE DATOS F(2) = P (X < 2) = P (X = 0) + P (X = 1) + P (X = 2) = f(0) + f(1) + f(2) = = 0,125 + 0,375 + 0,375 = 0,875 F(3) = P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) = f(0) + f(1) + f(2) + f(3)= 0,125 + 0,375 + 0,375 +0,125 = 1 Las #ro,ie%a%es N-e %e.e c-m,lir son: 1. To%os los 2alores N-e toma la '-ncin %e %istri.-cin %e ,ro.a.ili%a% son ,ositi2os o n-los: x F!x) " # 2. F!x) es n-la/ 2ale 5/ ,ara to%o 2alor in'erior al menor 2alor %e la 2aria.le aleatoria/ x%: F!x) $ # )i x / x% 3. F!x) es ig-al a -no ,ara to%o 2alor ig-al o s-,erior al ma+or 2alor %e la 2aria.le aleatoria/ llaman%o a Qste R!ST: F!x) $ % )i x " xk 4. La '-ncin U !" es no %ecreciente +a N-e es -na ac-m-lacin o s-ma %e ,ro.a.ili%a%es N-e son siem,re ,ositi2as o n-las. 5. La ,ro.a.ili%a%/ #/ %e N-e la 2aria.le aleatoria 6 tome 2alores ! com,ren%i%os entre !1 + !2 !1 V ! V !2" es la %i'erencia entre los 2alores %e la '-ncin %e %istri.-cin corres,on%ientes a s- 2alor s-,erior menos s- 2alor in'erior. P !x% / x / x') $ F!x') 2 F!x%) 3edia + -arian4a de una -ariable aleatoria La me%ia/ W/ %e -na 2aria.le aleatoria %iscreta 6 2iene %e'ini%a ,or la sig-iente e!,resin: 5 $ 6 x(f!x) La me%ia %e -na 2aria.le 6/ tam.iQn se le conoce ,or es,eranOa matemtica o 2alor es,era%o %e 6 + se re,resenta ,or E 6". Ejemplo: x f!x) x(f!x) # % ' 1 #0%'7 #0187 #0187 #0%'7 #0### #0187 #087# #0187 1,5 = E(X) = x.f(x) =x0.f(x0) + x1.f(x1) + x2.f(x2)+ x3.f(x3) = = 0.0,125 + 1.0,375 + 2.0,750 + 3.0,375 = 1,5 2 2 2 La 2arianOa X %e -na 2aria.le aleatoria %iscreta 6 2iene %e'ini%a ,or: X 7 6 !x 2 5) ( f!x) 2 2 2 Otra alternati2aY a 2eces m-+ )til/ es: X 7 E!X ) 9 :E!X); 2 2 2 %on%e: E(X ) = x .f(x) + [E(X) es la me%ia ele2a%a al c-a%ra%o.

De la mism 2arianOa:

4. Distrib ciones discreta de probabilidad: #ara alg-nas %istri.-ciones %iscretas se em,lean -na serie %e ta.las N-e 'acilitan sa,licacin a -nos ,ro.lemas en concreto. En 1iencias Sociales + %e la Sal-% se tra.a(an con 2aria.les N-e toman slo %os 2alores Elisa Tarilonte Tern 21

ANLISIS DE DATOS %icotmicas 1 Z 5"Y En este caso se -tiliOa la !"#$%"&'(")* &"*om"+l. <a di)tribucin binomial El ensa+o anterior %e la mone%a al aire se %enomina Lerno-illi/ a-tor %e Qste. Mn e!,erimento .inomial consiste en re,etir RnT 2eces -n ensa+o Lerno-illi. Mna 2aria.le aleatoria 6 sig-e -na %istri.-cin .inomial con ,armetros n + ," si e!,resa el n)mero %e realiOaciones in%e,en%ientes RnT con la ,ro.a.ili%a% R,T + ,or tanto 1 Z ," %e o.tener 'racaso. Se re,resenta ,or L n/ ,"Y %on%e L in%ica .inomial/ n el n)mero %e ensa+os + , la ,ro.a.ili%a% %e Q!ito. Ejemplo: Si tiramo) tre) -ece) la moneda al aire + definimo) X como el n=mero de cara)0 e)ta -ariable )e>uir lo) parmetro) n $ 1 + p $ #07( <o mi)mo ,ue B!1* #07)( Las caractersticas '-n%amentales son: 1. U-ncin %e ,ro.a.ili%a%: n f!x) $ P!X $ x) $

p !, n[!

2. U-ncin %e %istri.-cin:

n F!x) $ P !X / x) $6 !

p ! , n[!

3. Je%ia: 5 $ np 2 :. &arianOa : ? $ np,* %on%e ! es el n-mero %e aciertos/ n el n)mero %e ensa+os/ , la ,ro.a.ili%a% %e Q!ito %e ca%aensa+o/ N la ,ro.a.ili%a% %e 'racaso 1[," + el n)mero com.inatorio n . / N-e se lee Rn so.re !T es ig-al a !\ n [ !"\ Ejemplo: A) Calcularemo) la probabilidad de obtener exactamente ' cara) 8 f!') $ P!X $ ')$ B) Calcularemo) la probabilidad de obtener do) cara) o meno) F!') $ P!X / ') $ f!#)&f!%)&f!') $ #0%'7 & #0187 & #0187 $ #0@87 pue)to ,ue

f!') $ P!X $ ') $ #0187 !-er apartado A) C) Calcular la probabilidad de obtener m) de do) cara) P!X " ') $ % 2 P!X /+ ') $ % 2 F!') $ % 2 #0@87 $ #0%'7 Podemo) calcular tambi.n la media + la -arian4a 5 $ np $ 1(#07 $ %07 2 ? $ np, $ 1(#07(#07 $ #087 Atra) di)tribucione) di)creta) Existen otros modelos de distribuciones discretas. El modelo Poisson de los sucesos raros!, "ue se utilizan en condiciones similares a las binomiales #ero con un elevado n$mero Elisa Tarilonte Tern 22

ANLISIS DE DATOS de ensayos y un valor # muy #e"ue%o.

Elisa Tarilonte Tern

28

ANLISIS DE DATOS Tema <. DISTKILM1IONES 1ONTINMAS DE #KOLALILIDAD 2. !a distrib cin normal: La %istri.-cin normal/ cam,ana %e ]a-ss o/ c-r2a normal/ tam.iQn %e'ini%a ,or De Joi2re. CaracterB)tica) + propiedade) La sig-iente 'rm-la recoge la '-ncin: %on%e W + X/ me%ia + %es2iacin t,ica/ son s-s ,armetros/ ^ 7 8/1:16 + e 7 2/<13 + .ase %e los logaritmos ne,erianos. Si -na 2aria.le 6 tiene -na %istri.-cin N-e se a(-sta a la 'rm-la anterior/ es -na %istri.-cin normal + se e!,resa 6 G NY in%ican%o N-e tiene -na %istri.-cin normal con ,armetros W + X. Si -na 2aria.le 6 le a,licamos -na trans'ormacin lineal P 7 .6$a/ la n-e2a 2aria.le se %istri.-ir normalmente ,ero con me%ia .W ! $ a + la %es2iacin t,ica _._X! . Si restamos la me%ia + %i2i%imos ,or la %es2iacin t,ica o.tenemos -na n-e2a 2aria.le ROT. #or tanto: P s- '-ncin %e ,ro.a.ili%a% ser:

Mna %istri.-cin normal es simQtrica a s- me%ia/ W/ coinci%e con s- me%iana + s- mo%a. La c-r2a normal tiene %os ,-ntos %e in'le!inY %os ,-ntos %on%e la c-r2a ,asa %e ser cnca2a a con2e!a. Estos ,-ntos estn a la %istancia %e -na %es2iacin t,ica %e la me%ia. Es asinttica en el e(e %e a.scisas/ se e!tien%e %es%e [ , *asta $ , sin tocar n-nca el e(e. Ca)o) de utili4acin de la) tabla) En el s-,-esto N-e la ta.la no reco(a el 2alor/ ,o%emos -tiliOar el ms ,r!imo. 1. 1lc-lo %e la ,ro.a.ili%a% ,ara 2alores menores o ig-ales N-e -na %etermina%a ,-nt-acin t,ica: En este caso se mira %irectamente en la ta.la. 2. 1lc-lo %e la ,ro.a.ili%a% ,ara 2alores ma+ores N-e -na %etermina%a ,-nt-acin: En este s-,-esto se mira en la ta.la la ,ro.a.ili%a% N-e esa ,-nt-acin %e(a ,or %e.a(o + se resta a 1. 3. 1lc-lo %e la ,ro.a.ili%a% entre %os ,-nt-aciones %etermina%as: AN- se restan las ,ro.a.ili%a%es N-e %e(an ,or %e.a(o %e s las %os ,-nt-aciones t,icas. Ci)to>rama + di)tribucin normal Si %is,onemos %e los %atos originales %e -na 2aria.le 6/ + s%istri.-cin es normal/ -tiliOaremos las ta.las III + I&/ ,ero anteriormente trans'ormaremos las ,-nt-aciones %irectas en ,-nt-aciones t,icas:

Aproximacin de la binomial a la normal 1-an%o las %istri.-ciones .inomiales s-,eran s-s 2alores %e 25/ se ,-e%e a,ro!imar a la .inomial normal. Tenien%o -na 2aria.le 6/ con %istri.-cin .inomial/ sme%ia es W 7 n, + s- %es2iacin t,ica X 7 n,N. #o%emos realiOar:

Ejemplo: -"%+mo# 20 .e(e# '*+ mo*e!+ +l +"%e/ 0('1l e# l+ p%o&+&"l"!+! !e 2'e #+l3+* 12 (+%+#4 Tenemo) ,ue n=mero de cara) x $ %'0 con n=mero) de intento) n $ '# + p $ #07( 3irando en la tabla D el -alor de la probabilidad de .xito e) #0%'#%( AEora calculamo) la media + la de)-iacin tBpica Elisa Tarilonte Tern 2:

2
n

6n

ANLISIS DE DATOS Para aproximar la di)tribucin binomial a la normal e)tablecemo) un inter-alo entre #07 a la i4,uierda + a la derecEa P :!%'9#07) / x /n !%'&#07); Con-ertimo) la) puntuacione) en tBpica) + ,uedarBa dndole -alor a 5 + ?

finalmente utili4amo) la) tabla) de di)tribucin normal # 5/6< V O V 1/12" 7 5/3636 Z 5/<:36 7 5/12 la aproximacin e) mu+ buena* Ea+ una diferencia de una die4mil.)ima para '# intento)( A medida ,ue aumenta n !intento)) meFora la aproximacin( S-mar + restar el 2alor 5/0 se llama (o%%e((")* po% (o*$"*'"!+!/ ,ermitien%o -tiliOar las ,-nt-aciones %iscretas como contin-as. 3. !a distrib cin "#$% #&'D('D)* de +earson: En la %istri.-cin %e 1*i c-a%ra%o %e #earson -na 2aria.le 6 con %istri.-cin 62 / 62 / .../ 62 2 2 ,asa a ser 6 7 6 . S- me%ia + 2arianOa 2al%rn W 7 n +/ X 7 2n. Esta %istri.-cin se -sa ,ara contrastar si la %istri.-cin %e -na 2aria.le se a(-sta a -na %istri.-cin %etermina%a. Entre s-s ,ro,ie%a%es se`alamos: 1. N-nca a%o,ta 2alores menores %e 5. 2. Es asimQtrica ,ositi2a ,ero a me%i%a N-e a-mentan s-s gra%os %e li.erta% se 2a a,ro!iman%o a la %istri.-cin normal. 3. #ara n a 85 la ,o%emos a,ro!imar a -na %istri.-cin N n/ 2n". 2 En la ta.la & se *allan alg-nos 2alores %e las %istri.-ciones 6 . Ejemplo: En una -ariable con 7 >rado) de libertad0 X G X 0 el -alor %%0#8 deFa por debaFo de )B una proporcin de #0H70 repre)entndo)e de la )i>uiente manera AEora )i ,ui)i.ramo) calcular P !X " %%0#8) P !X " %%0#8) $ % 2 P !X / %%0#8) $ % 2 #0H7$ #0#7 4. !a distrib cin "t* de ,t dent: #ara %e'inir estas %istri.-ciones/al ig-al N-e *emos *ec*o con el 1*i 1-a%ra%o/ em,learemos otras %istri.-ciones. Tenien%o %os 2aria.les 6 e P con -na %istri.-cin 5/1" + . La 2aria.le aleatoria T7 sig-e -na %istri.-cin RtTcon n gra%os %e li.erta% + se e!,resa: S- me%ia siem,re 2ale 5 + s- 2arianOa Elisa Tarilonte Tern 20

ANLISIS DE DATOS Mna %istri.-cin RtT es el cociente entre -na 2aria.le N 5/1" + la raO c-a%ra%a %e 6 %i2i%i%a ,or s-s gra%os %e li.erta%. S-s caractersticas son: 1. Es simQtrica/ con W 7 5. S- 'orma es m-+ ,areci%a a la N 5/1"/ a-nN-e menos a,-nta%a. 2. #-e%e tomar c-alN-ier 2alor [H $H". 3. A me%i%a N-e a-mentan los gra%os %e li.erta%/ la %istri.-cin se a,ro!ima ms a -na %istri.-cin normal. 4. La c-r2a es asinttica al e(e %e a.scisas. Se em,lea en esta%stica in'erencial en contrastes. En la ta.la &I se m-estran los 2alores %e esta 2 %istri.-cin. 5. !a distrib cin de "-* de ,nedecor: Se em,lea ,rinci,almente en el contraste %e *i,tesis. Sig-e -na %istri.-cin U con + n gra%os %e li.erta% n-mera%or + Rn2T los %el %enomina%orY s- me%ia + 2arianOa se %e'inen:

Sien%o Rn 1Tlos gra%os %el

Se caracteriOa ,or: 1. Es asimQtrica ,ositi2a ,or lo N-e n-nca toma 2alores menores N-e 5. 2. Si 6 es 2aria.le con %istri.-cin U con n1 + n2 gra%os %e li.erta%/ la 2aria.le P 7 1?6 es tam.iQn -na %istri.-cin U ,ro,ie%a% rec,roca": %on%e , es la ,ro,ie%a% asocia%a al 2alor %e la 2aria.le. Se em,lea ,ara calc-lar alg-nos ,ercentiles o ,ro.a.ili%a%es N-e no a,arecen la ta.la. En la ta.la &II slo a,arece la ,ro.a.ili%a% %e N-e 6 7 5/455Y 5/405Y 5/4<0 + 5/445. Ejemplo: 5*+ .+%"+&le X (o* !"#$%"&'(")* F5,10: A" 1alc-lar # 6V8/88"Y .-scamos el 2alor %e 0 gra%os %e li.erta% en el n-mera%or + 15 gra%os en el %enomina%or en la ta.la &II/ %on%e se enc-entra el 2alor8/88. O.ser2amos N-e se corres,on%e con -na ,ro.a.ili%a% %e 5/40Y ,or tanto 8/88 se corres,on%e con el ,ercentil 40. L" Determinar el 2alor %el ,ercentil 0 %e 6/ es %ecir: 5/50 U0/15Y en este caso *aremos -so %e la ,ro,ie%a% rec,roca:

En la ta.la &II 2emos N-e: 5/40U15/0 7 :/<:. #or tanto:

Elisa Tarilonte Tern

26

ANLISIS DE DATOS TEJA 3. ESTIJA1IbN 2. #onceptos pre.ios Poblacin + mue)tra +oblacin se re'iere al con(-nto total %e elementos N-e se N-ieren est-%iar -na o ms caractersticas. De.e estar .ien %e'ini%a. Llamaremos 6 al n)mero total %e elementos %e -na ,o.lacin. Tam.iQn se s-elen -tiliOar los tQrminos "*!"."!'o#, #'je$o# 7 (+#o# ,ara re'erirnos a los elementos %e la ,o.lacin. 1-an%o se %is,one %e -n censo lista%o" %e la ,o.lacin/ se ,-e%e est-%iar a to%os ellos. No siem,re es 'acti.le est-%iar a la totali%a% %e -na ,o.lacinY ,or lo N-e se est-%ia -n s-.con(-nto %e los elementos totalesY es %ecir/ -n m estra. Llamaremos * al n)mero %e los elementos %e -na m-estra. 3ue)treo El m-estreo es -n ,roceso %e seleccin con el 'in %e o.tener -na m-estra lo ms seme(ante ,osi.le a la ,o.lacin + as o.tener estimaciones ,recisas. El tama`o es -na caracterstica esencialY +a N-e %e.e ser lo s-'icientemente am,lia ,ara re,resentar a%ec-a%amente las ,ro,ie%a%es %e la ,o.lacin + re%-ci%a ,ara N-e ,-e%a ser e!amina%a en la ,rctica. El m-estreo p%o&+&"l8#$"(o se conoce la ,ro.a.ili%a% asocia%a a -na m-estra + ca%a elemento %e la ,o.lacin tiene -na ,ro.a.ili%a% conoci%a %e ,ertenecer a la m-estra. El *o9p%o&+&"l8#$"(o se %esconoce/ o no se tiene en c-enta/ la ,ro.a.ili%a% asocia%a a ca%a m-estra + se selecciona la N-e ms le ,areOca re,resentati2a al in2estiga%or. Mna 'orma %e o.tener -na m-estra %e -na ,o.lacin *omogQnea es -tiliOar: Z El m'e#$%eo +le+$o%"o #"mpleY ,or el c-al se garantiOa N-e ca%a elemento %e la ,o.lacin tenga la misma ,ro.a.ili%a% %e 'ormar ,arte %e la m-estra. #rimero se asigna -n n)mero a ca%a elemento + %es,-Qs me%iante alg)n me%io sorteo/ ,a,eletas/..." se eli(en tantos elementos como sea necesario ,ara la m-estra. 1-an%o los elementos estn or%ena%os o ,-e%en or%enarse se -tiliOa el m'e#$%eo #"#$em1$"(o. N Se selecciona al aOar entre los N-e oc-,an los l-gares . E(em,lo: N 7 155Y n 7 0Y 155?07 25Y escogeramos los elementos sit-a%os en las ,osiciones 25. El riesgo %e este m-estreo es la 'alta %e re,resentacinY N-e se ,-%iese %ar/ %el total %e los elementos. Z 1-an%o to,amos con -na ,o.lacin *eterogQnea/ -tiliOamos el m'e#$%eo e#$%+$"f"(+!o. Se em,lea c-an%o %is,onemos %e in'ormacin s-'iciente so.re alg-na caracterstica + ,o%emos elegir -na m-estra en '-ncin %el n)mero %e elementos seg)n estas caractersticas o estratos. Z Ante ,o.laciones %esor%ena%as + conglomera%as en gr-,os/ se em,lea el m'e#$%eo po% (o*3lome%+!o#Y %on%e se 2an seleccionan%o %e to%os los gr-,os/ s-.gr-,os/ clases9 + 'inalmente %e los elementos restantes la m-estra. Z De la -nin %el estrati'ica%o + %el conglomera%o/ s-rge otro m'e#$%eo el pol"e$1p"(o. En ocasiones el m-estreo es m-+ costoso + se rec-rre a mQto%os no ,ro.a.ilsticos: Z El m'e#$%eo po% ('o$+# acci%ental" se .asa en -n .-en conocimiento %e los estratos o in%i2i%-os ms re,resentati2os ,ara la in2estigacin. Similar al estrati'ica%o ,ero carente %el carcter aleatorio. Z El m'e#$%eo op"*1$"(o intencional" m-estra el interQs ,or incl-ir en la m-estra a gr-,os s-,-estamente t,icos. Z El (+'#+l inci%ental" seleccin %e los in%i2i%-os %e 'cil acceso. Z :ol+ !e *"e.eY %on%e -n elemento selecciona%o lle2a a otro + Qste a otro + as s-cesi2amente *asta com,letar la m-estra. Mna m-estra es re,resentati2a si e!*i.e internamente el mismo gra%o %e %i2ersi%a% N-e la ,o.lacin + es aleatoria si los elementos *an si%o e!tra%os al aOar %e la ,o.lacin.

Elisa Tarilonte Tern

2<

ANLISIS DE DATOS 3. %nferencia estad/stica El 2alor esta%stico o.teni%o %e -na m-estra como me%ia" no ser ig-al al 2alor %el ,armetro %e ,o.lacin. #ara in'erir -n ,armetro a ,artir %e -n esta%stico *a+ N-e a,licar *erramientas esta%sticas %e ti,o in'erencial como la e#$"m+(")* po% "*$e%.+lo inter2alos %e con'ianOa" o contraste %e *i,tesis. 4. Estimacin de la media La me%ia m-estral es -na 2aria.le aleatoria N-e toma -n 2alor seg)n la m-estra concreta N-e se o.tenga. Se %enomina !"#$%"&'(")* m'e#$%+l !e l+ me!"+ a s- '-ncin %e ,ro.a.ili%a%. La !"#$%"&'(")* m'e#$%+l !e '* e#$+!8#$"(o es -n conce,to central/ tanto %e la estimacin como %el contraste %e *i,tesis. Ii)tribucin mue)tral de la media Mna '-ncin %e ,ro.a.ili%a% N-e%a caracteriOa%a ,or s- 'orma/ s- me%ia + s- 2arianOa. La me%ia %e la %istri.-cin m-estral %e la me%ia W " es ig-al a la me%ia %e la ,o.lacin W". La 2arianOa %e la %istri.-cin m-estral %e la me%ia es + la %es2iacin t,ica %e la %istri.-cin m-estral %e la me%ia/ %enomina%a error t,ico %e la me%ia/ es La 'orma %e la %istri.-cin original %e la me%ia se ,arece a -na %istri.-cin normal a-nN-e la %istri.-cin original %e la 2aria.le en la ,o.lacin no es normal. Da%o el m-estreo aleatorio sim,le: c Si la %istri.-cin %e 6 en la ,o.lacin es normal con me%ia W + %es2iacin t,ica X/ entonces la %istri.-cin m-estral %e la 6 es normal c Si la %istri.-cin %e 6 en la ,o.lacin no es normal con me%ia W + %es2iacin t,ica X/ entonces la %istri.-cin m-estral %e la 6 tien%e a la normal a me%i%a N-e n crece -eo%em+ ;e*$%+l !el <8m"$e"/ sien%o la a,ro!imacin .-ena ,ara n a 85.

=e!"+, .+%"+*>+ 7 !e#."+(")* $8p"(+ !e l+ .+%"+&le ('+*$"$+$".+ X e* l+ po&l+(")* 7 e* l+ m'e#$%+, 7 !e l+ !"#$%"&'(")* m'e#$%+l !e l+ me!"+ (X).

<a media como e)timador Mn estima%or es -n esta%stico N-e se -tiliOa ,ara estimar -n ,armetro. #or lo N-e la me%ia %e la m-estra es -n estima%or %e la me%ia ,o.lacionalY + el 2alor %el estima%or en -na m-estra se %enomina e#$"m+(")* o e#$"m+(")* p'*$'+l. Elisa Tarilonte Tern 23

ANLISIS DE DATOS La me%ia m-estral 6 es -n estima%or "*#e#3+!o %e la me%ia ,o.lacional W". El error t,ico %e la me%ia es -n in%ica%or %e la ,recisin %e la estimacin %e la me%iaY c-anto menor es el error t,ico/ ma+or es la ,recisin. De,en%ien%o %e la %es2iacin t,ica %e la ,o.lacin + %el tama`o %e la m-estra. 5. Estimacin de la proporcin #ara la o.tencin %e la %istri.-cin m-estral %e la ,ro,orcin se ,-e%e *acer como la me%ia. Ii)tribucin mue)tral de la proporcin Sea 6 -na 2aria.le N-e slo toma 2alores 5 + 1/ la ,ro,orcin %e la m-estra # se %e'ine como: Da%o el m-estreo aleatorio sim,le/ el esta%stico ,ro,orcin #" se %istri.-+e seg)n -na .inomial: 1omo # es la me%ia %e los 2alores %e 6 en la m-estra/ seg)n el Teorema 1entral %el Lmite/ a me%i%a N-e el tama`o crece/ la %istri.-cin m-estral %ela ,ro,orcin tien%e a la normal con me%ia ^ + 2arianOa 1-anto ms ale(a%o estQ ^ %e 5/0/ ms elementos %e.e tener la m-estra ,ara realiOar la a,ro!imacin a la normal. =e!"+, .+%"+*>+ 7 !e#."+(")* $8p"(+ !e l+ .+%"+&le !"(o$)m"(+ o !"(o$om">+!+ (X) e* l+ po&l+(")* 7 e* l+ m'e#$%+, 7 !e l+ !"#$%"&'(")* m'e#$%+l !e l+ p%opo%(")* (P): Distrib cin m estral de la proporcin 1+2

+oblacin

0 estra

0edia

Varian3a

Des.iacin t/pica

<a proporcin como e)timador La ,ro,orcin m-estral ," es -n estima%or insesga%o %e la ,ro,orcin ,o.lacional ^". El error t,ico %e la ,ro,orcin/ es -n in%ica%or %e la ,recisin %e la estimacin %e la ,ro,orcin. 1-anto menor es el error t,ico/ ma+or es la ,recisin. 4. %nter.alos de confian3a Concepto La 'inali%a% %e -n inter2alo %e con'ianOa es estimar -n ,armetro %esconoci%o %e -na ,o.lacin a ,artir %e -na m-estra. Al estimar la me%ia %e la ,o.lacin a ,artir %e -na m-estra/ ,o%emos cometer -n error %e estimacin _6[ W_. La estimacin ,or inter2alo consiste en acotar el error con -na alta ,ro.a.ili%a% 1 Z d *".el !e (o*f"+*>+" %e 'orma N-e _6[ W_ no sea s-,erior a -n estima%o m!imo Em!". El error %e estimacin m!imo Em!" es '-ncin %e la 2aria.ili%a% %e la 2aria.le en la ,o.lacin/ %el ni2el %e con'ianOa n.c." + %el tama`o %e la m-estra: Elisa Tarilonte Tern 24

ANLISIS DE DATOS Don%e: c es '-ncin %el n.c. 7 1 Z d + se o.tiene en la ta.la %e la %istri.-cin normal ti,i'ica%a ta.la I&". c Es la %es2iacin t,ica %e la %istri.-cin m-estral %e la me%ia/ es %ecir/ el error t,ico %e la me%ia. c X es la %es2iacin t,ica %e la ,o.lacin N-e es conoci%a. c n es el tama`o %e la m-estra. A ,artir %e esta ec-acin %e%-cimos tanto el tama`o %e la m-estra como los lmites %el inter2alo %e con'ianOa. El tama`o %e la m-estra se o.tiene %es,e(an%o n %e la ec-acin: 2emos N-e n %e,en%e %e: c La %es2iacin t,ica %e la ,o.lacin. c El ni2el %e con'ianOa. c El error %e estimacin m!imo. Los l8m"$e# "*fe%"o% (<") 7 #'pe%"o% (<#) se o.tienen a ,artir %el Em!:

El n.c. o p%o&+&"l"!+! 1 ? @ signi'ica N-e si e!tra(Qsemos to%as las m-estras ,osi.les %e -na ,o.lacin/ calc-lsemos la me%ia en ca%a -na %e ellas + el inter2alo %e con'ianOa/ -na ,ro,orcin 1 Z d %e to%os los inter2alos %e con'ianOa conten%r la me%ia ,o.lacional + -na ,ro,orcin d no lo conten%r. TamaJo de la mue)tra Interesa N-e -n inter2alo sea lo ms estrec*o ,osi.le + con alta ,ro.a.ili%a%. A ma+or ni2el %e con'ianOa ma+or es el error %e estimacin m!imo/ ,or lo N-e ms am,lio ser el inter2alo + menos ,recisa ser la estimacin. Mna 'orma %e mantener + re%-cir el error %e estimacin m!imo %a%o + a-mentar el n.c./ es a-mentan%o n. Otro 'actor N-e inter2iene es la 2aria.ili%a% %e la 2aria.le/ c-anto ma+or sea la %es2iacin t,ica %e la ,o.lacin/ ma+or %e.e ser n ,ara alcanOar -na misma ,recisin. #ara calc-lar el tama`o %e la m-estra %esconocien%o X/ *a+ N-e s-stit-ir en la ec-acin/ la %es2iacin t,ica ,or la c-asi%es2iacin t,ica S " + ta.la &I". Aplicacione) Los ,asos ,ara a,licar -n inter2alo %e con'ianOa son los sig-ientes: c Esta.lecer -n error %e estimacin m!imo ,ara -n ni2el %e con'ianOa 1 Z d. c O.tener el tama`o %e la m-estra n ,ara el error %e estimacin m!imo es,eci'ica%o. c E!traer -na m-estra aleatoria %e tama`o n + me%ir la 2aria.le. c 1alc-lar el esta%stico es estima%or %el ,armetro" con las me%i%as o.teni%as. c 1alc-lar los lmites %el inter2alo %e con'ianOa.

Elisa Tarilonte Tern

85

ANLISIS DE DATOS Dnter-alo de confian4a para la media <8m"$e# !e lo# "*$e%.+lo# !e (o*f"+*>+ 7 #'p'e#$o# p+%+ l+ e#$"m+(")* !e l+ me!"+:

es la c-asi%es2iacin t,ica calc-la%a en la m-estra.

Dnter-alo de confian4a para la proporcin El error %e estimacin m!imo %e la ,ro,orcin es: %on%e: c O1[d?2 es '-ncin %el ni2el %e con'ianOa 1 Z d ta.la I&". c ^ 1[^" es el error t,ico %e la ,ro,orcin: X,. c ^ es la ,ro,orcin %e la ,o.lacin N-e no es conoci%a. c n es el tama`o %e la m-estra + se %e.e c-m,lir n^ 1[^" a 0 ,ara la a,ro!imacin a la normal. Los lmites in'erior + s-,erior %el inter2alo %e con'ianOa se o.tienen a ,artir %el error %e estimacin m!imo. 1omo %esconocemos ^/ N-e es lo N-e ,recisamente N-eremos estimar/ o,eramos con la ,ro,orcin m-estral #. As/ si en Em! s-stit-imos ^ ,or la ,ro,orcin m-estral #/ los lmites in'erior + s-,erior %el inter2alo %e con'ianOa son:

P la ,ro.a.ili%a% %e o.tener -n inter2alo %e con'ianOa N-e contenga al ,armetro ^ es:

Elisa Tarilonte Tern

81

Das könnte Ihnen auch gefallen