Sie sind auf Seite 1von 20

1

ESTADSTICA (1 pp)
Tema 1: EL ANLISIS DE DATOS SOCIOLGICOS

1. CONCEPTO DE ESTADSTICA La estadsti a t!ata de "#s a! #$ m%t&d& pa!a e'ami$a! (&s p!& es&s s& ia(es ) pa!a s#mi$ist!a! "ases a (as de isi&$es e$ (a i$*esti+a i,$. Es #$a ie$ ia- )a .#e t!ata de /a((a! !e+#(a!idades e$ (&s 0e$,me$&s s& ia(es- de ma$e!a .#e si!*a$ pa!a des !i"i! ) p!ede i!. Es (a &(e i,$ de m%t&d&s ie$t0i &s .#e pe!mite$ e( a$1(isis e i$te!p!eta i,$ de (a i$0&!ma i,$ $#m%!i a. Hay una actitud poco favorable hacia la estadstica que se produce paradjicamente en una sociedad en la que la informacin cuantitativa invade los aspectos ms ntimos de nuestra vida: paro, divorcio, gasto pblico, etc. Histricamente desde la ptica pagana o cristiana no haba a ar! todos los fenmenos obedecan a leyes divinas y no a la probabilidad. Hasta que "uropa no super la teologa y filosofa medieval no fue posible desarrollar el clculo de las probabilidades. #esde finales del siglo $%$ comien an a descubrirse regularidades en disciplinas tan diversas, como la gen&tica, biologa, meteorologa, economa, psicologa e incluso en las artes. 'a demografa y las compa(as de seguros ayudaron a desarrollar la estadstica! el primer censo de poblacin en "spa(a se refiere al a(o )*+,. 'as compa(as de seguros necesitan tablas de esperan a de vida. -arte del desprestigio de la estadstica es porque a veces se utili an datos num&ricos para apoyar ra onamientos falsos. 2. APLICACIONES DE LA ESTADSTICA EN LAS CIENCIAS SOCIALES 'as aplicaciones de la estadstica en las ciencias sociales son muy variadas: ). resumen de los datos y e.traccin de informacin relevante de los mismos, e.d., de las mediciones observadas! /. bsqueda y evaluacin de modelos y pautas que ofrecen los datos, pero que se encuentran ocultos por la inherente variabilidad aleatoria de los mismos! 0. contribuir al dise(o eficiente de e.perimentos y encuestas! 1. facilita la comunicacin entre los cientficos, ya que ser ms fcil comprender la referencia a un procedimiento estndar sin necesidad de mayor detalle. 3. ESTADSTICA DESC4IPTI5A 6 ESTADSTICA IN7E4ENCIAL 'a estadstica cumple dos funciones fundamentales, que se van a definir a su ve en dos tipos de estadstica: ). '2 "342#534%62 DESC4IPTI5A! conjunto de t&cnicas para la reduccin de datos cuantitativos y cualitativos de una poblacin o una muestra a un nmero ms peque(o y de lectura ms simple, de modo que podamos caracteri ar de forma resumida los valores adoptados por las variables de nuestro estudio. La p!i$ ipa( a!a te!sti a es .#e (as &$ (#si&$es $& s#pe!a$ e( (mite de( &(e ti*& est#diad&. /. '2 "342#534%62 IN7E4ENCIAL ! conjunto de t&cnicas para tomar decisiones acertadas que ayuden a los investigadores a hacer inferencias 78 deducciones9 de las muestras a las poblaciones y, en consecuencia, a comprobar hiptesis relativas a la naturale a de la realidad social mediante un proceso de deduccin : induccin. 3e ocupa de la forma en la que se pueden obtener muestras fiables y los resultados obtenidos en ellas se pueden hacer e.tensibles a la poblacin en general. La p!i$ ipa( a!a te!sti a es .#e (as &$ (#si&$es s#pe!a$ e( (mite de( &(e ti*& est#diad&. 2lgunos cientficos no distinguen entre las dos ramas mencionadas de la estadstica y qui desde un punto de vista estricto no e.ista tal divisin. 'a estadstica tiene una naturale a dual! de un lado representa una rama de las matemticas, de otro trabaja con conceptos abstractos. 8. 4ELACIN ENT4E ESTADSTICA 6 SOCIOLOGA Hemos de ser conscientes de las dificultades que plantea el anlisis estadstico del mundo social por varios factores, p.e. la medicin de fenmenos, la subjetividad. "n el tratamiento estadstico daremos el error con el que trabajaremos num&ricamente y la fiabilidad con que hacemos la investigacin.

2
Hemos de saber que la 6iencia "stadstica al dar el resultado de fenmenos sociales es acertada, e.d., no falla el instrumento si est bien utili ado. 3i el problema que nos ocupa no est tericamente bien definido, de poco servir la utili acin de un gran aparato estadstico. 'a estadstica es siempre una buena ayuda, pero nunca un sustituto para un buen ra onamiento terico y un buen quehacer metodolgico. "s un instrumento de la 3ociologa. 'os fundadores de la sociologa reconocieron la importancia de la obtencin de informacin cuantitativa relevante sobre los fenmenos sociales y de su tratamiento estadstico para construir una ciencia sobre la sociedad. ;'a estadstica e.presa cierto estado del alma colectiva; 7#ur<heim9. 2 finales del siglo $%$ los socilogos disponan de pocos datos pero de mucho genio creador para las bases tericas! hoy en da se dispone de un mar de datos sociolgicos, pero los avances tericos son muy pobres. "l anlisis multivariable puede suponer una gran ayuda. T%!mi$&s: "n los cuestionarios se incluyen preguntas sobre la edad, el nivel de educacin, religin, etc. "stos datos son denominados *a!ia"(es. "l ;objeto; de la variable es la unidad de anlisis, p.e. un individuo, familias, partidos polticos. =na p&"(a i,$ estadsti a & #$i*e!s& lo forman el conjunto de todos los valores de las variables que desea medir el investigador en todas las unidades de anlisis. -ueden ser finitas o infinitas. 'os socilogos seleccionan a un subconjunto de valores llamados m#est!a estadsti a. 2 la obtencin de muestras que sean suficientemente representativas de la poblacin que se pretende estudiar dedican los socilogos notables esfuer os, ya que se ahorra tiempo y costos. 'a estadstica debe medir el universo real y por ello se basa en medidas sujetas a error, pues en lo real nunca se puede alcan ar la e.actitud perfecta. =no de los mayores problemas es que el socilogo no influya e.cesivamente en la alteracin de los fenmenos con su presencia y sus instrumentos de medida. pa!1met!&s: observacin que se refieren a una poblacin! estadsti &s! observaciones que se refieren a una muestra.

Tema 2: EL P4O9LE:A DE LA :EDICIN EN SOCIOLOGA


1. EL P4O9LE:A DE LA :EDICIN EN SOCIOLOGA "n primer lugar hemos de medir los conceptos! hay que cuantificar las variables que definen el fenmeno social. 'a medicin sera la fase intermedia: ). ra onamiento terico /. medicin 0. introduccin de los m&todos estadsticos de investigacin. 'a combinacin ponderada de valores que toman cada uno de los i$di ad&!es 7p.e. nivel de ingresos, a(os de escuela y ocupacin9 forman un $di e 7status socioecmico9, que tomar valores num&ricos concretos. "l empleo de las herramientas estadsticas requiere que las variables sociolgicas sean cuantificadas siguiendo el nivel de medicin que las propiedades e.igen. "l procedimiento de medicin se busca fijndose en dos aspectos: la fiabilidad! propiedad del instrumento que le permite que al ser utili ado repetidas veces bajo id&nticas circunstancias produ ca iguales efectos. la validez! que el instrumento mida lo que realmente queremos medir. >alide interna: ?se obtendran resultados diferentes si se hubieran utili ado procedimientos diferentes@ >alide e.terna: ?cun generali able es el procedimiento utili ado@ C#a(.#ie! p!& es& de medi i,$ de"e se! e'/a#sti*&- e.d.- &$ ate+&!as s#0i ie$tes e$ (as .#e p#eda$ (asi0i a!se ada #$& de (&s as&s &$side!ad&s. Las ate+&!as de"e$ se! m#t#ame$te e' (#)e$tes- e.d.- .#e de"e se! p&si"(e (asi0i a! ada as& i$di*id#a( ta$ s,(& e$ #$a ate+&!a. Tam"i%$ de"e se! (& m1s p!e is& p&si"(e- e.d.#e /a)a e( ma)&! $;me!& de disti$ i&$es. 2. TIPOS DE :EDICIN

3
'os distintos niveles forman una escala acumulativa de tipo ascendente! el nivel ordinal posee las propiedades del nominal. =na de las metas ms perseguidas por los cientficos del comportamiento es la de obtener medidas, cuyas naturale as admitan el nivel de medicin intervalar. 1. Ni*e( $&mi$a( "s el nivel ms bajo de medicin y permite la (asi0i a i,$, p.e. religin, se.o, etc., sin que uno sea superior a otro. Ao puede tericamente reali arse directamente operaciones matemticas con ellas. 3e sustituyen los objetos reales por nmeros o smbolos indicando slo la diferencia respecto a una cualidad dada, para poder reali ar operaciones matemticas. 2. Ni*e( O!di$a( Aos encontramos con un nivel que permite (asi0i a i,$ y &!de$ de ma)&! a me$&! & *i e*e!sa, p.e. ingresos medios segn clase baja, media y alta. Ao ofrece ningn tipo de informacin sobre la magnitud de las diferencias entre las categoras, slo que 0 B / B ). 3. Ni*e( I$te!*a(a! "ste nivel nos (asi0i a, &!de$a ) $&s i$di a (a dista$ ia e$t!e disti$tas ate+&!as . 'o caracterstico es la e.istencia de una unidad de medida comn y constante que permite asignar un nmero real a todos los pares de objetos del conjunto ordenado, p.e. el coeficiente de inteligencia, grados de temperatura. En este nivel de medicin el punto cero est arbitrariamente determinado y no representa ausencia completa de la caracterstica que se mida. 3igue la discusin sobre la viabilidad del empleo de escalas de intervalo continuas, pues se argumenta que al tener en cuenta el factor psicolgico se pierde la propiedad de igualdad de las diferencias entre los intervalos, p.e. no es lo mismo ingresos de C, : D,.,,, que de C,, : C/,.,,,. -ero &ste es un hecho social que habr que tener en cuenta al interpretar los resultados, no al reali ar los clculos estadsticos. 8. Ni*e( de p!&p&! i,$ Es simi(a! a( a$te!i&!- )a .#e pe!mite (asi0i a i,$- &!de$ ) dista$ ia- pero el cero en este nivel es absoluto y representa la ausencia completa de la caracterstica que mide- p.e. e( pes&- (a masa- e( tiemp&. 'a distincin con la anterior es puramente acad&mica, ya que una ve establecida la magnitud de la unidad es casi siempre posible concebir , unidades. 3i se utili ara un procedimiento estadstico poco apropiado para niveles bajos de medicin con puntuaciones definidas a un nivel de medicin ms alto, no se cometera un error t&cnico, sino que se producira una p&rdida de informacin, dado que las propiedades de los niveles de medicin son acumulativas. 3ituacin laboral 7ocupado, jubilado, parado9 AEF%A2' -osicin ideolgica 7e.trema i q., i q., etc.9 EG#%A2' %ngresos mensuales de familias madrile(as %A4"G>2'E 78 proporcin9 3. TIPOS DE 5A4IA9LES 5a!ia"(e i$depe$die$te! son las que influyen en las dependientes! permiten conocer porqu& vara la variable dependiente de la forma en la que lo hace. 5a!ia"(e depe$die$te! es la que atrae primordialmente la atencin del investigador y cuya variacin trata de e.plicar. 5a!ia"(e i$te!*i$ie$te! se supone que tiene un efecto determinado sobre la variable dependiente que puede ser controlado por la variable independiente. "j.: estudio sobre las causas del divorcio. 'a situacin matrimonial es la variable dependiente, que habra que e.plicar a partir de otras variables independientes. Las *a!ia"(es s&$: H #a(itati*as: no pueden adoptar valores num&ricos H #a$titati*as: s pueden adoptar valores num&ricos: HH dis !etas! valores con nmeros enteros, nI hijos. HH &$ti$#as: con infinitos valores fraccionados, p.e., temperaturas. 'a mayora de las variables nominales son discretas.

Tema 3:

ESTADSTICA DESC4IPTI5A <NI5A4IA9LE

1. LA LGICA DEL ANLISIS CO:PA4ATI5O Hablamos de "stadstica #escriptiva =nivariable cuando es slo una variable la de estudio. 'a informacin utili ada en el anlisis sociolgico est basada muchas veces en la comparacin, p.e. el porcentaje de abstencin en una 66.22. fue mayor que en otra. 2. TIPOS DE CO:PA4ACIN: %nsistimos en que el anlisis estadstico slo puede ser relevante y fructfero una ve se hayan resuelto, al menos suficientemente, los problemas de teora, conceptuali acin, medicin y dise(o que toda investigacin comporta: e$t!e +!#p&s, dentro del mismo estudio o entre diferentes, p.e. entre un grupo e.perimental al que se le ha sometido a un tratamiento conocido 7p.e. alumnos educacin especial9 y un grupo de control no sometido a dicho tratamiento. e$t!e #$ i$di*id#& ) #$ +!#p&- p.e. nota de ) alumno y la media de una clase, delincuencia de una ciudad con la sociedad en general. 'o importante consiste en delimitar y definir las caractersticas del grupo que se compara con las correspondientes al individuo. e$t!e e( !es#(tad& de #$ est#di& ) #$& est1$da! , p.e. paro. 'a teora sociolgica est repleta de resultados que pueden servirnos para contrastar los halla gos de nuevas investigaciones. 4ales comparaciones servirn adems para contrastar en el sentido de modificar o recha ar la teora que sirve como comparacin estndar. 3. OPE4ACIONES 9SICAS DE CO:PA4ACIN 3.1. O!+a$i=a i,$ de dat&s =na ve se hayan obtenido los datos que nos interesan conviene ordenarlos segn algn criterio, que nos permitir observar con mayor facilidad la distribucin de los datos y el lugar dnde termina un grupo y comien a otro. 3.2. Tip&s de dist!i"# i&$es "l agrupamiento de datos no slo reporta ventajas, sino que presenta el inconveniente del ;error de agrupamiento;, que son las alteraciones que se producen al reali ar algunos agrupamientos al variar A. DIST4I9<CIN DE 74EC<ENCIAS> consiste en ordenar los datos de manera que en una columna apare ca la variable 7sea del tipo nominal, ordinal o intervalar9 y en la otra columna apare can las frecuencias absolutas 7e.d. el nmero de veces que se repite cada categora9. DIST4I9<CIN PO4CENT<AL ! primero hay que calcular la proporcin que es igual al nmero de casos en la categora dividida por el nmero total de casos en la distribucin 7p8aJA9. "l valor de una proporcin no puede ser mayor que ). 'os K se obtienen a partir de las proporciones multiplicado por ),,. 'a suma de los K es ),,. "n lugar de los valores absolutos en una distribucin de frecuencias se utili an los correspondientes K. Lacilita la comparacin y evita una importante fuente de error. "s conveniente que el valor de A sea superior a C,! si no es mejor ofrecer el nmero real de casos. 4ampoco los nmeros muy grandes son convenientes, p.e. en lugar de decir que los visitantes del a(o pasado aumentaron un )/,,K es mejor decir que aument )/ veces. DIST4I9<CIN AC<:<LADA ! se forma al indicar para cada categora el nmero de casos por debajo de dicha categora. 3on tiles para la comparacin cuando se desea comparar la forma en que los casos se distribuyen a lo largo de una escala. "dad acumulado de )* a /, de /) a /C de /+ a 0C n ), )1 /0 A 8 )/, 8. 4EGLAS GENE4ALES PA4A 7O4:A4 DIST4I9<CIONES DE 74EC<ENCIAS ). #istribucin de frecuencias para dat&s $&mi$a(es K *,0 )),D )M,/ Lrec. 2cumulada ), /1 1D K *,0 /,,, 0M,/

5
6onsiste en / columnas: . 7se.o9 Hombres Fujeres n /C /C n 8 A 8 C,

/. #istribucin de frecuencias para dat&s &!di$a(es 3e representa el grado en que est presente una caracterstica en particular: . 7estatus9 clase alta clase media clase baja n C 0, )C n 8 A 8 C,

0. #istribucin de frecuencias para dat&s i$te!*a(a!es "n una columna aparecen los valores de la variable y en otra las frecuencias. -ara facilitar la lectura se constituyen las dist!i"# i&$es de 0!e #e$ ias a+!#padas. . 7edad9 /, : 0, 0, : 1, 1, : C, n ), /, /, n 8 A 8 C, 'mite real )M,C : 0,,C 0,,C : 1,,C 1,,C : C,,C

n 8 frecuencia absoluta J A 8 frecuencia total J . 8 variable H %ntervalo de clase! cada grupo de valores de la variable en una distribucin. H 4ama(o o amplitud del intervalo de clase! diferencia entre el lmite superior e inferior (a? Ls @ Li)> puede ser id&ntico o diferente en cada intervalo. 0.). C&$*e!si,$ a una distribucin de frecuencias agrupadas 7variable discreta9 . 7edad9 n ), 0 )C / )+ + /, M /C + /+ + 0C )C 1, )+ 1C )D C, )* n 8 A 8 M* ). #efinir la diferencia entre el m.imo valor y el mnimo: Gv 8 C, : ), 8 1, /. AI de clases que desean formarse 7ideal entre C y )C9: 1, : C 8 * 0. . 7edad9 n ), : )* )) )* : /+ /) /+ : 01 , 01 : 1/ 0) 1/ : C, 0C n 8 A 8 M* A. DESA44OLLO DE LAS TA9LAS DE DIST4I9<CIN DE 74EC<ENCIA H Farca de clase 7.i9! es el punto medio entre el lmite superior e inferior del intervalo de clase: . n

6
),:/, ), Bi ? Ls C Li : 2 ? 1D C 2D : 2 ? 1A

6onsiste en de0i$iti*a e$ pasa! de (a *a!ia"(e de tip& &$ti$#& a #$a *a!ia"(e de tip& dis !et&. H 'mites reales de clase! 1. ' 2. ' 3. ' 8. ' )C : /, ), : /, )C : /, )C : )M,M /, : 0, /) : 0, /,,) : 0, /, : /M,M 0, : 1, 0) : 1, 0,,) : 1, 0, : 0M,M 'os ms utili ados son ). y /.! porque el valor /, en el primer caso ?dnde lo incluiramos@ "l segundo caso es el ms preciso. C.). 6uartiles, deciles y percentiles -odemos dividir las distribuciones, no ya en / partes que nos dejen el C,K a cada lado, sino en 1 7cuatriles9, en ), 7deciles9 y en ),, 7centiles9. E1 E2 E3 @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ 2AF 2AF 2AF E8 2AF

E1 8 valor de la variable que deja a su i quierda el /CK y a su derecha el DCK E2 8 Fe! valor de la variable que deja a su i quierda el C,K y a su derecha el C,K E3 8 valor de la variable que deja a su i quierda el DCK y a su derecha el /CK E8 8 coincide el ltimo valor de la variable, que deja a su i quierda el ),,K E' ? Li C N'G8 @ Na @ 1 @@@@@@@@@@@@@@@@@ H C $ N'G1D @ Na @ 1 @@@@@@@@@@@@@@@@@@@ H C $ N'G1DD @ Na @ 1 @@@@@@@@@@@@@@@@@@@@ H C $

D' ? Li C

C' ? Li C

C2D deIa p&! de"aI& de s# *a(&! #$ 2DF de (&s as&s. C./. Ga n -.e. si en un parlamento hay )+, diputados de i quierda, )C, de derechas y *, regionalistas, la ra n de los diputados de i quierda a los de derecha 8 )+,J)C,, y la ra n de los de i quierda y regionalistas a los de derecha 8 )+, N *,J)C,. nI de casos en una categora o valor Ga n 8 ::::::::::::::::::::::::::::::::::::::::::::::::::: nI de casos de otra 'as tasas son un tipo de ra n para nmeros grandes. 'as tasas de crecimiento relativo son muy utili adas, p.e. tasa de crecimiento de la renta per cpita que ha pasado en )M+, a )MD, de )C,, a /,,,. 3i el nmero es negativo es que hay una tasa de decrecimiento. /,,, : )C,, :::::::::::::::: )C,, 8 ,,00 . ),, 8 00K

J. TKCNICAS 9SICAS DE 4EP4ESENTACIN G47ICA 'a representacin grfica se reali a no tanto con fines analticos como para ofrecer una imagen asequible de los resultados de las investigaciones. 'a mayora de las mediciones en sociologa se reali an a escalas que parten desde , en direccin positiva, por lo que muchas veces se omiten los valores negativos.

7
1. List&+!ama 3i la variable es nominal, los rectngulos del histograma se separan ligeramente para visuali ar que se trata de categoras diferentes. 'os ordinales se tratan como los intervalares, juntando, si lo permite, los rectngulos. 2. P&(+&$&s "s una figura que se cierra al unir los puntos medios de cada intervalo a una altura proporcional a la frecuencia. "l polgono queda cerrado y el rea que contiene es igual al rea de la suma de los rectngulos del histograma. 3. OIi*as 3on polgonos de frecuencias acumuladas. "l primer punto vendr dado por el lmite real inferior del primer intervalo! para los restantes valores de O.O se utili an los valores del lmite real inferior de cada intervalo 7de 10 a 1C : menos de 1/,C! de 1+ a 1* : menos de 1C,C9. 3i los valores O.O son 10 o ms ! 1+ o ms se produce una ojiva de pendiente inversa. 8. L$ea de +!a0&s Fuestra el valor de una variable dependiente 7P9 para cada valor de la variable independiente 7$9. 'a lnea se tra a por los puntos, pero no se cierra sobre $, ya que el rea bajo la lnea no tiene ninguna importancia. 'o que interesa es la forma que adopta, como crece y decrece.

Tema 8: CA4ACTE4STICAS DE <NA DIST4I9<CIN <NI5A4IA9LE


1. CA4ACTE4STICAS DE <NA DIST4I9<CIN <NI5A4IA9LE La (asi0i a i,$ de dat&s #a$titati*&s ) (a &$st!# i,$ de #$a dist!i"# i,$ de 0!e #e$ ias &$stit#)e$ e( p!ime! pas& e$ e( t!a"aI& de &!+a$i=a i,$ ) a$1(isis. -ara ciertos fines la misma distribucin de frecuencias puede resumirse y condensarse, hasta quedar reducida a / 0 cifras significativas y representativas de la distribucin. 'a uniformidad en el comportamiento de masas de datos hace posible el desarrollo de un m&todo generali ado para organi ar, anali ar y comparar mediciones obtenidas de distintos campos de estudio cientfico. 'a comparacin de un grfico de lneas de grafos nos ayuda a ver que las distribuciones se conocen por su - Tendencia Central - Dispersin - Forma 'as medidas de TENDENCIA CENT4AL- $&s i$0&!ma$ s&"!e (a &$ e$t!a i,$ de $;me!& de as&s. 'as ms utili adas son: - Media y media ponderada - Mediana - Moda - Cuartiles, Deciles y ercentiles 'as medidas de DISPE4SIN nos van a mostrar la dispersin del nmero de casos: - !an"o o recorrido - Desviacin Media - #arian$a - Coe%iciente de variacin de earson 'as medidas de distribucin incluyen las llamadas de 7O4:A- que son las curvas de los datos. 2doptarn distintas formas segn las distribuciones sean normales 7concentracin en el centro9 o asim&tricas 7concentracin al e.tremo o por igual en todo el grfico9. 2. :EDIDAS DE TENDENCIA CENT4AL (s&$ estadsti &s) E$te$dem&s p&! Mte$de$ ia e$t!a(M (a te$de$ ia de (as &"se!*a i&$es a a+!#pa!se e$ t&!$& a #$ *a(&! pa!ti #(a!. Hay una medida de tendencia central adecuada a cada nivel de medicin. 2.1. :ODA($&mi$a(- &!di$a( e i$te!*a(a!) 5a(&! .#e se p!ese$ta &$ ma)&! 0!e #e$ ia> es e( $;me!& m1s dist!i"# i,$ 7el pico ms alto en un polgono9. "n las distribuciones a9 /000CC Foda 8 0! unimodal b9 +0//CC Foda 8 / y C! bimodal 7o multimodal9 &m;$ de (a

"n datos agrupados la moda est en el intervalo con ms frecuencia que se denomina (ase m&da(. #e M a )) ), #e D a * D De 8 a J 1A :&da ? A :& ? Li C Ls @@@@@@@@@ 2

'a Foda tiene la virtud de ser fcilmente reconocible, pero el inconveniente de no ser necesariamente nica 7p.e. multimodales9. :&da pa!a *a!ia"(e de tip& &$ti$#& &$ amp(it#d &$sta$te: :& ? $iC1 Li C @@@@@@@@@@@@@@@@@@@@@@@@@ H C $i C1 @ $i @1

9
'i 8 lmite inferior del intervalo modal ni N ) 8 frecuencia absoluta del intervalo posterior al intervalo modal ni : ) 8 frecuencia absoluta del intervalo anterior al intervalo modal 6 8 amplitud del intervalo modal :&da pa!a *a!ia"(e de tip& &$ti$#& &$ amp(it#d *a!ia"(e: :& ? $iC1 H Ci @ 1 Li C @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ HC $i C1 H Ci @ 1 C $i @1 H Ci C 1

6i : ) 8 amplitud del intervalo anterior al intervalo modal 6i N ) 8 amplitud del intervalo posterior al intervalo modal 2.2. :EDIANA (&!di$a( e i$te!*a(a!) Es e( *a(&! .#e deIa p&! e$ ima ) p&! de"aI& a (a mitad de (as p#$t#a i&$es de #$a dist!i"# i,$. -ara distribuciones intervalares: NG2 @ Na @ 1 :E ? Li C @@@@@@@@@@@@@@@ HC $ AJ/ 8 frecuencia total : / J Aa : ) 8 frecuencia acumulada anterior al intervalo mediano La) .#e #ti(i=a! e( i$te!*a(&- #)a 0!e #e$ ia a #m#(ada Na i$ (#)a NG2. "s poco influida por valores e.tremos, pues es slo el punto que divide todos los casos en /. 2.3. :EDIA A4IT:KTICA (i$te!*a(a!) Es (a s#ma de t&das (as p#$t#a i&$es de #$a dist!i"# i,$ di*idida p&! e( $;me!& de as&s. 3e denota por para muestras y para poblaciones. 4iene como ventaja que es bastante estable de una muestra a otra, e.d., que si tomamos varias muestras de una poblacin sus medias tienden a diferir menos que otras medidas de tendencia central. "s una buena medida para comparaciones. -ara datos agrupados: si la variable es de tipo continuo hay que calcular la marca de clase O.iO para despu&s utili ar la frmula. '$ ? @@@@@@@ N .n 8 sumatorio del producto de cada valor O.O por su correspondiente frecuencia OnO. A 8 frecuencia total. 3. CO:PA4ACIN ENT4E LAS DI5E4SAS :EDIDAS DE TENDENCIA CENT4AL Hay que pensar qu& se va a hacer una ve hallada la medida de tendencia central. Si se p#ede e(e+i! &$*ie$e (a p&! s# esta"i(idad ) s&"!e t&d& si pe$sam&s /a e! #$ est#di& p&ste!i&!. Hemos visto que la utili a ms informacin que la Fe, en el sentido de que todas las puntuaciones entran en el clculo de la , mientras que el clculo de la Fe tan slo implica la puntuacin del caso medio. -or ello la queda afectada por cambios en los valores e.tremos, cosa que no ocurre en el caso de la Fe. 'a media nos indica que repartida toda la distancia entre todos los alumnos de forma igual cada uno recorre *,M* Qm. 'a moda Fo indica que el nmero ms numeroso recorre *,,C Qm. 'a mediana Fe parte en dos el grupo de alumnos de forma que la mitad recorre menos de *,C <m. P la otra mitad ms de *,C Qm.

Tema A:

5A4IACIN O DISPE4SIN DE <NA DIST4I9<CIN

Las medidas de dispe!si,$ & *a!ia i,$ de"e$ a &mpaNa! a (as medidas de Te$de$ ia Ce$t!a( pa!a &$& e! /asta .#% p#$t& (a medida de Te$de$ ia Ce$t!a( e(e+ida !ep!ese$ta & $& a (a dist!i"# i,$ de 0!e #e$ ias.

10
C#a$t& me$&! sea (a medida de dispe!si,$ ma)&! se!1 (a !ep!ese$tati*idad de (a medida de Te$de$ ia Ce$t!a( ) *i e e!sa. 1. :EDIDAS DE 5A4IA9ILIDAD A9SOL<TA 1.1. 4ANGO "s la diferencia entre el mayor y el menor nmero. "s una medida muy simple y slo nos da el abanico de elementos que e.iste en la distribucin. "s poco fiable, pues no tiene en cuenta los valores medios. "dad 7.9 )C )+ )* /, 1.2. DES5IACIN :EDIA O' @ O @@@@@@@@@@@ N ?J

4 ? 2D @ 1A ? A

Dm ?

La des*ia i,$ media es e( p!&medi& de (as des*ia i&$es a (a media ) *ie$e dada e$ $;me!&s a"s&(#t&s. R/:+R N R1:+R N R+:+R N R*:+R N R),:+R R:1R N R:/R N R,R N R/R N R1R :::::::::::::::::::::::::::::::::::::::::::::: 8 ::::::::::::::::::::::::::::::::::: C C 1N/N,N/N1 #m 8 ::::::::::::::::::::::::: 8 /,1 C "l valor absoluto de un nmero es el mismo nmero sin asociarle signo alguno y se indica por R R. "n distribuciones de frecuencia, hay que calcular el punto medio: O'i @ O $ @@@@@@@@@@@@@@ N "n general cuanto mayor sea el valor de la O#mO mayor ser la variacin entre las diferentes puntuaciones. 1.3. DES5IACIN TPICA 6 5A4IANPA -uesto que la desviacin tpica refleja la dispersin de las puntuaciones, resulta en cierto sentido una estimacin del error. La des*ia i,$ tpi a es (a medida de dispe!si,$ & *a!ia"i(idad p&! e' e(e$ ia ) se #ti(i=a &$ (a > i$di a e( +!ad& de dispe!si,$ de (&s *a(&!es !espe t& a (a . 3e denota por cuando son parmetros y por 3 cuando son estadsticos. 3on medidas muy parecidas, pero en lugar de tomar los valores absolutos de las desviaciones toman el cuadrado de la mismas. 'os nmeros negativos al cuadrado son positivos. 3i dos distribuciones tienen la misma para diversa dispersin, resulta ms precisa la de menor desviacin estndar. Dm ? (' @ )2 $ S ? ? @@@@@@@@@@@@@@@@@ N
2 2

"j.: #m 8

5a!ia$=a:

"s el valor medio del cuadrado de las desviaciones: tiene el inconveniente de medir la desviacin en unidades cuadradas. (' @ )2 $

11
Des*ia i,$ tpi a: S ? ? @@@@@@@@@@@@@@@@@ N

"s la ra cuadrada de la varian a. P!&piedades de (a DES5IACIN TPICA: ). nos va a dar la homo: o heterogeneidad de una distribucin! /. si todos los valores en la distribucin son iguales, la desviacin tpica 3 8 ,! 0. es siempre un nmero positivo! 1. vara de distribucin a distribucin an con las mismas ! C. puesto que es la base de la inferencia, podemos decir que cuando la 3 es muy alta, las predicciones nunca pueden ser muy buenas. +. los valores e.tremos tienen un gran peso, ya que son elevados al cuadrado. 'os programas estndar de anlisis de datos sociolgicos, sobre todo, de los provenientes de encuestas, calculan ya como parte de su rutina, la y la 3. 2. :EDIDAS DE 5A4IA9ILIDAD 4ELATI5A >ienen en K y son ms fciles de interpretar y comprender. 3e utili an: ). cuando hablamos de unidades de medida desiguales, p.e. coeficiente de inteligencia! /. cuando son promedios desiguales, pero con iguales unidades de medida, p.e. edad en dos grupos. 2.1. COE7ICIENTE DE 5A4IA9ILIDAD DE PEA4SON 3e utili a cuando hay una , aunque no debe utili arse cuando est pr.ima a ,. Fide la dispersin relativa. "s til para comparar diversos grupos en relacin a su relativa homogeneidad cuando los grupos tienen diferentes. 5 ? C* ? S @@@ H 1DD ? Des*ia i,$ tpi a @@@@@@@@@@@@@@@@@@@@@@@@ :edia a!itm%ti a

"j.: 6atlicos frente al aborto Ao creyentes

> 8 /J0,C 8 ,,CD 8 CDK > 8 /,1JC,1 8 ,,11 8 11 K

'a desviacin tpica del grupo de catlicos es el CDK de la , valor superior al 11K de la que vale la desviacin tpica entre los no creyentes. 2.2. P<NT<ACIONES NO4:ALIPADAS O <NIDADES P Hasta ahora hemos visto procedimientos estadsticos que comparan grupo a grupo o con grupos tipo estndar. 3on ideales para comparaciones entre ) individuo y ) grupo. Es e( $;me!& de #$idades de des*ia i,$ tpi a .#e #$ i$di*id#& .#eda p&! e$ ima & p&! de"aI& de (a de s#D +!#p&. 'as puntuaciones que se han transformado o convertido en distancias de desviacin estndar, a partir de la , se conocen como puntuaciones S, e.d., S determina la posicin relativa de una puntuacin dentro de su propia distribucin. "n la puntuacin normali ada se elimina el efecto de la por sustraccin y se e.presa la diferencia en unidades de desviacin tpica al dividir por ella. 'as cantidades de las unidades S son adimensionales, e.d., son independientes de las unidades empleadas. '@ P? @@@@@@@ S 8 media aritm&tica de la distribucin 3 8 desviacin tpica de la distribucin P!&piedades de (as #$idades P:

12
). si se transforma una distribucin en unidades S, no vara la forma de la distribucin original 7si es asim&trica, lo seguir siendo9! /. 'a media de los valores de S 8 , 0. 'a 3/ 8 3 8 ). 0. S/ 8 A

Tema J:

7O4:A DE <NA DIST4I9<CIN

<$a dist!i"# i,$ de 0!e #e$ ias .#eda "asta$te "ie$ a!a te!i=ada #a$d& &$& em&s s# medida de te$de$ ia e$t!a( ) s# medida de *a!ia"i(idad- pe!& .#eda a;$ meI&! a!a te!i=ada si &$& em&s s# +!ad& de asimet!a ) s# ap#$tamie$t& & Q#!t&sise.d.- si &$& em&s (a 0&!ma de dist!i"# i,$. "stas medidas de asimetra que vamos a estudiar parten del hecho de que todos los valores de la curva normal terica se representan sim&tricamente distribuidas en torno a la media aritm&tica 79. 1. CA4ACTE4STICAS DE LA 7O4:A DE <NA DIST4I9<CIN 1.1. :EDIDAS DE ASI:ET4A "s fundamental conocer si las observaciones estn dispuestas respecto a un valor central o se dipersan asim&tricamente respecto a dicho valor. Si (a #!*a es sim%t!i a (? $&!ma() (a - :e ) :& &i$ idi!1$ e$ #$ p#$t&.

=nimodal y sim&trica Timodal Fultimodal ? :e ? :& 6orresponde al investigador decidir cuantas modas considera relevantes. Hay dos tipos de asimetra: 1. DI4ECTA O POSITI5A> m# /as p#$t#a i&$es "aIas ) p& as a(tas

:& R :e R 2. IN5E4SA O NEGATI5A> m# /as p#$t#a i&$es a(tas ) p& as "aIas

R :e R :& COE7ICIENTE DI4ECTO DE ASI:ET4A O SESGO "s el ms fiable y utili ado para medir la asimetra. (' @ )3 @@@@@@@@@@@@@ N 91 ? a3 ? @@@@@@@@@@@@@@@@ S3 -ara datos agrupados: ('i @ )3 $ @@@@@@@@@@@@@@@ N 91 ? a3 ? @@@@@@@@@@@@@@@@

13
a 8, a0 8 N a0 8 :
0

S3 88B simetra normal! 8 Fe 8 Fo 88B asimetra positiva! Fo U Fe U 88B asimetra negativa! U Fe U Fo

1.2. :EDIDAS DE AP<NTA:IENTO O C<4TOSIS :ide e( +!ad& de &$ e$t!a i,$ de 0!e #e$ ias e$ #$ p#$t& & i$te!*a(& de p#$t&s de (a dist!i"# i,$ ($&!ma(me$te (a :&). 4iene en cuenta la distribucin de las observaciones entre las clases pr.imas a la y las clases situadas en los e.tremos o colas de la distribucin. 6uando la curva presenta las puntuaciones ms normalmente distribuidas ??SS #!*a mes& ;!ti a

6uando la curva presenta un gran apuntamiento ??SS #!*a (ept& ;!ti a

6uando la curva es achatada, y por tanto no hay concentracin de frecuencias con respecto a un punto justo de la distribucin ??SS #!*a p(ati ;!ti a

COE7ICIENTE DE EBCESO "s la medida que nos permite conocer el grado de apuntamiento o curtosis. (' @ )8 @@@@@@@@@@@@@@@ N 92 ? a8 ? @@@@@@@@@@@@@@@@ @3 S8 -ara datos agrupados: ('i @ )8 $ @@@@@@@@@@@@@@@ N 92 ? a8 ? @@@@@@@@@@@@@@@@ @3 S8 a1 8 , 88BB mesocrtica! bien distribuida a1 8 N 88BB leptocrtica! mayor concentracin a1 8 : 88BB platicrtica! menor concentracin -uede presentarse una asimetra de i quierda y ser con respecto a la <urtosis platicrtica o leptocrtica y viceversa. 1.3. OT4AS 7O4:AS DE C<45AS 6urva V: 6asi todos los datos se concentran en un e.tremo de la escala. 6urva rectangular: 6uando una distribucin tiene id&nticas frecuencias en todas las categoras. 6urva en forma de =: 2parece en distribuciones bimodales con las modas en ambos e.tremos.

14

Tema T:

INT4OD<CCIN A LA ESTADSTICA IN7E4ENCIAL

1. ELE:ENTOS 9SICOS DE LA ESTADSTICA IN7E4ENCIAL La Estadsti a I$0e!e$ ia( se p#ede &$side!a! &m& e( est#di& de +!#p&s pe.#eN&s (m#est!as)- a 0i$ de sa a! &$ (#si&$es !espe t& a +!a$des +!#p&s de pe!s&$as (p&"(a i&$es). 'a utili acin de muestras es muy prctica para ahorrar tiempo y recursos. La s& i&(&+a aspi!a a esta"(e e! p!i$ ipi&s ie$t0i &s .#e $&s pe!mita$ p!ede i! (a &$d# ta s& ia(. 'as medidas resumen que hemos estudiado en la estadstica descriptiva no se pueden utili ar para obtener generali aciones que sean aplicables a individuos. "l valor de una teora cientfica radica en su capacidad para predecir ms all de los datos que sirvieron de base para formularla. 6uando nos referimos a las caractersticas de una poblacin, hablaremos de pa!1met!&s 7letras griegas! , 9 mientras que si nos refrimos a las caractersticas de una muestra tendremos estadsti &s 7letras latinas! , 39. 'os parmetros, que son valores fijos de la poblacin, suelen desconocerse! los estadsticos que varan de muestra a muestra se utili an para estimar los parmetros. 'a "stadstica %nferencial se basa en la (a te&!a de (as p!&"a"i(idades ) (a te&!a de( m#est!e&. =n 0e$,me$& se di e a(eat&!i& si puede dar lugar a varios resultados sin que pueda ser posible enunciar con certe a real cul va a ser el resultado del e.perimento. "l espa i& m#est!a( sera el conjunto de los posibles resultados de ese e.perimento aleatorio 7 9. 'a - enla a la estadstica descriptiva con la inferencial! permite que los datos obtenidos en una muestra puedan ser generali ados. 2. NOCIONES 9SICAS DE P4O9A9ILIDAD 6 DE7INICIN La p!&"a"i(idad matem1ti a ) (as (e)es de( a=a!- se !e0ie!e$ ta$ s,(& a s# es&s !epetid&s "aI& &$di i&$es dete!mi$adas ) &$sta$tes 7p.e. no tiene sentido ;es probable que ma(ana llueva;, porque no es un suceso repetitivo9. 3egn esta descripcin, tan slo se podran aplicar las probabilidades a sucesos tales como la tirada de dados, los juegos de a ar y otros sucesos en los que prevalece a largo pla o la variacin aleatoria. "l investigador tiene dos m&todos disponibles: el apriorstico y el emprico. "n casos como juegos de dados se utili a la probabilidad apriorstica, pero hay muchos otros casos dnde no se puede. 'as probabilidades empricas se basan en el supuesto de que la proporcin de aparicin de los sucesos observados en el pasado persistirn en el futuro, ej. las compa(as de seguros estiman las tasas de fallecimiento para establecer los baremos de las pli as de los seguros de vida. #efinicin: es el nmero que caracteri a la posibilidad de que se produ ca un suceso si hay OnO resultados igualmente probables! es la frecuencia relativa con la que ocurre dicho acontecimiento. P4OPIEDADES :ATE:TICAS DE LAS P4O9A9ILIDADES ). 3i -729 8 ) el acontecimiento 2 ocurrir seguro 3i -729 8 , no es posible que 2 tenga lugar. casos favorables -729 8 :::::::::::::::::::::: casos posibles D P(A) 1 2. 4EGLA DE LA ADICIN> saber qu& probabilidad hay de que ocurra 2 T 2.1. 7e$,me$&s m#t#ame$te e' (#)e$tes: P(A , 9 , C) ? P(A) C P(9) C P(C)- et . 'a probabilidad de que 2 no suceda ser: ) : -729 8 -7T9 N -769 2.2. 7e$,me$&s $& m#t#ame$te e' (#)e$tes: P(A , 9) ? P(A) C P(9) @ P(A9) -72T9 8 la probabilidad de obtener simultneamente 2 y T! se sustrae porque la probabilidad de ocurrencia conjunta se ha contado dos veces, p.e. en ) eleccin

15
e.traer a ) licenciado en polticas o a ) en derecho! puede darse una persona licenciada en derecho y en polticas. 3. 4EGLA DE LA :<LTIPLICACIN> nos permite saber si dos o ms sucesos pueden ocurrir a la ve . 3.1. 7e$,me$&s m#t#ame$te e' (#)e$tes: P(A ) 9) ? D no pueden suceder a la ve . 3.2. 7e$,me$&s $& m#t#ame$te e' (#)e$tes 3.2.1. S# es&s i$depe$die$tes> si el hecho de que ocurra 2 no tiene efecto sobre la probabilidad de que ocurra T. P(A ) 9 ) C) ? P(A) P(9) P(C) 3.2.2. S# es&s depe$die$tes> ? p!&"a"i(idades &$di i&$a(es: el hecho de que ocurra 2 afecta a la probabilidad de que ocurra el segundo. P(A ) 9) ? P(A) P(9GA) ? P(9) P(AG9) -7TJ29 significa la probabilidad que ocurra el suceso T una ve que ha ocurrido 2. P(A ) 9 ) C) ? P(A9) P(CGA9) ? P(A) P(9GA) P(CGA9) =n modelo que e.plica cmo se desarrollan los sucesos de un fenmeno dado en el tiempo se denomina un p!& es&! y si est regido por leyes de probabilidad se denomina p!& es& est& 1sti &. 'a palabra estocstico significa que los sucesos son probabilsticos en lugar de determinsticos, e.d., es posible asignar probabilidaddes a la ocurrencia de tales sucesos. 3. CO:9INATO4IA "l anlisis combinatorio se utili a para la obtencin de probabilidades de un suceso complejo, cuando la enumeracin de los casos resulta difcil y pesada! p.e. cuando se tira una moneda es fcil, pues slo hay dos soluciones. "s para lograr el nmero de casos posibles. 3.1. 5a!ia i,$ 3e refieren a los distintos grupos que se pueden formar con OmO elementos tomados de OnO en OnO, siendo n U m, con la condicin que dos grupos sern distintos si difieren en el orden o en la naturale a de sus elementos. mU 5m-$ ? @@@@@@@@@@ (m @ $)U nW 8 el producto de todos los nmeros naturales desde ) a n! ej. 1W es 1 H 0 H / H) 8 /1. ,W 8 ) 5a!ia i,$ &$ !epeti i,$> cuando se puede dar la repeticin de los elementos: 5m-$ ? m$ 3.2. Pe!m#ta i&$es (eI. p1+. 13D) 4enemos permutaciones cuando los grupos varan tan slo en el orden de los elementos que lo integran. -ueden considerarse como un caso particular de las variaciones cuando m 8 n. -m,n 8 nW -n,n 8 nW Pe!m#ta i&$es &$ !epeti i,$> nW -Gn8 ::::::::::: n)W n/W....n<W 3.3. C&m"i$a i&$es 6uando los grupos slo varan por la naturale a de sus elementos, sin tener en cuenta el orden, se obtienen combinaciones. 3e define como los distintos grupos que se pueden formar con OmO elementos tomados de OnO en OnO, siendo n U m, con la condicin de que dos grupos sean distintos si difieren en la naturale a de alguno de sus elementos. (m) mU >m,n Cm-$ ? (@@@@) ? @@@@@@@@@@@ 8 :::::::: ($) $U (m@$)U -n -ropiedades de las combinaciones: 7n9 nW nW nW 6n,n 8 7::9 8 ::::::::::: 8 :::::::::::: 8 ::::: 8 ) 7n9 nW 7n:n9W nW ,W nW 7n9

16
6n,, 8 :::: 8, 7,9 7n9 8n 7)9

6n,) 8

::::

Tema V:

DIST4I9<CIONES DE P4O9A9ILIDAD

L&s s# es&s p!&"a"i(sti &s &$stit#)e$ e$ s mism&s *a!ia"(es- )a .#e apa!e e$ "aI& di0e!e$tes 0&!mas .#e a( esta! !e+idas p&! e( a=a! s&$ &$& idas &m& *a!ia"(es a(eat&!ias- p.e. un dado es una variable de tipo cuantitativa con + 7):+9 formas mutuamente e.cluyentes entre s! una moneda es una variable cualitativa con dos posibles formas 7cara o cru 9. =n e.perimento aleatorio viene definido por: ). una variable /. las diferentes formas que puede adoptar representadas por valores num&ricos 0. las probabilidades asociadas a tales formas. 1. :edia: ? $p 2. 5a!ia$=a: 2 ? $p. 3. Des*ia i,$ tpi a: ? $p. n 8 tama(o de cada una de las muestras de la distribucin. E!!&! tpi &: .?1@p "l error tpico mide la variacin de las frecuencias muestrales de resultados favorables alrededor de la media de la distribucin muestral. ".iste una tabla especial que contiene las probabilidades asociadas a la prueba binomial cuando p 8 q 8 ,,C. 7ej. pg. )*, : )*)9. Ap!&'ima i,$ "i$&mia( a $&!ma(: 6uando p 8 q 8 ,,C y OnO es suficientemente grande la distribucin binomial se apro.ima a una distribucin normal. '@ P? @@@@@@@ ? @@@@@@@ ' @ $p $p.

".isten tablas que nos ayudan a saber el K de valores que se encuentran en un rea 7p.e. entre , y ),DC9. 'as tablas proporcionan el rea entre , 7la media9 y un nmero positivo. 2l resultar la curva normal sim&trica, el rea entre , y :),0 es igual al e.istente entre , y ),0. 'os topes estn en :0 y N0. 2l hacer clculos para unidades S, se resta ,,C al valor O.O cuando es superior a la media o se suma si es inferior. "ste factor corrige el error que resulta al apro.imar una distribucin discreta binomial a las variables continuas de la distribucin normal. (' &-A) @ $p P? @@@@@@@@@@@@@@@@@@ $p. 1. DIST4I9<CIONES DE P4O9A9ILIDAD DISC4ETA Dist!i"# i,$ "i$&mia( "s la que se aplica en aquellos e.perimentos aleatorios que cumplen las siguientes condiciones: ). "l mismo nmero de e.perimentos se efecta OnO veces. /. 6ada ensayo tiene slo / posibles resultados que denominamos ;&.ito; 7p9 y ;fracaso; 7q9! la suma 8 ). 0. "l resultado de cada ensayo es independiente de los dems que se realicen. 'a suma de las probabilidades p C . ? 1> p ? 1 @ .> . ? p @ 1. ".isten poblaciones que se pueden considerar que estn formadas por tan slo dos categoras, p.e. hombreJmujer, ruralJurbano, &.itoJfracaso. -or tanto, si pn es probabilidad de que un suceso ocurra y qn de que no suceda, entonces la probabilidad de que el suceso se presente e.actamente O.O veces en OnO ensayos, e.d, O.O &.itos y On:.O fallos viene dado por:

17
p(') p(') ? C$' H p' H .$@1 ? $U @@@@@@@@@@ H p' H .$@1 'U ($@')U

"jemplos: ). Xu& probabilidad hay de que el Fadrid gane C de )C partidos @ 73iendo p 8 ,,+ q8 ,,19 )CW p7.8C9 8 :::::::::::: H ,,+C H ,,1), 8 /,1 K CW 7)C:C9W /. Xu& probabilidad hay de que el Fadrid gane al menos )) @ p7. ))9 8 p7.8))9 N p7.8)/9 N p7.8)09 N p7.8)19 N p7.8)C9 0. Xu& probabilidad hay de que gane como m.imo 1 @ p7. 19 8 p7.8,9 N p7.8)9 N p7.8/9 N p7.809 N p7.819 1. Xu& probabilidad hay de que gane entre * y )) @ p7* . ))9 8 p7.8*9 N p7.8M9 N p7.8),9 N p7.8))9 A. C#1( es (a p!&"a"i(idad /a) de .#e de 1D ((amad&s a 0i(a- a( me$&s 2 sea$ &"Iet&!es W p(' 2) ? 1 @ Xp('?D) C p ('?1)Y 2. DIST4I9<CIN DE P4O9A9ILIDAD CONTIN<A Dist!i"# i,$ $&!ma( #entro de las distribuciones de frecuencias hay finitas e infinitas! la distribucin normal es infinita y los e.tremos de su curva nunca tocan el eje $. 'a curva es normal, pues es lo que normalmente sucede , dnde se encuentran la mayor parte de los casos. Hay e.cepciones p.e. la distribucin de la renta mundial. P!&piedades de (a dist!i"# i,$ $&!ma(: ). el rea bajo la curva 8 ). /. la curva es asinttica: se e.tiende indefinidamente en las dos direcciones sin tocar nunca el eje de abscisas. Hay una parte insignificante que se nos escapa! no cubre el ),,K. 0. la curva es sim&trica, unimodal, mesocrtica y la , Fe y Fo coinciden. "l C,K del rea est a un lado y el C,K al otro. "l punto de m.ima ordenada es la 8 ,. 1. "ntre N0 y :0 alrededor de la se encuentran la prctica totalidad de los casos de la distribucin normal. C. Hablaremos de unidades S cuando hablemos de la curva normal estandari ada. +. "n la curva normal estandari ada: Fedia 8, #esviac. tpica 8) >arian a / 8 ) 2simetra a0 8 , 6urtosis a1 8 , 0 -or medio de las tablas de la curva normal podemos conocer con e.actitud el rea 7probabilidad9 que e.iste bien por debajo o por encima de un cierto punto, o tambi&n, el rea comprendido dentro o fuera de un intervalo. Aos permite hallar la probabilidad de obtener un cierto valor de dicha distribucin tomado al a ar.

Tema Z: ASPECTOS GENE4ALES DEL :<EST4EO EN LA IN5ESTIGACIN SOCIOLGICA


La te&!a de( m#est!e& es #$ est#di& de (as !e(a i&$es e'iste$tes e$t!e #$a p&"(a i,$ ) #$a m#est!a e't!ada de esa p&"(a i,$. E$ (a i$0e!e$ ia estadsti a e( i$te!%s est!i"a e$ est#dia! #$a m#est!a ) /a e! i$0e!e$ ias a e! a de (a p&"(a i,$ de (a #a( se t&m,. "l #$i*e!s& +e$e!a( 7p.e. ejecutivos de las grandes empresas espa(olas9 es la poblacin abstracta y terica a la que el investigador desea generali ar sus resultados,

18
mientras que el #$i*e!s& !ea( 7p.e. ejecutivos de las ),, mayores empresas espa(olas9 es la operacionali acin concreta de ese universo general del que se va a obtener la muestra. Fuchas personas tienden a reali ar afirmaciones generales muy amplias a partir del conocimiento de casos muy particulares. "sto es lo que 3mith llama ;muestras en busca de universos;. 'as muestras sesgadas se producen porque el investigador se deja llevar inconscientemente por sus preferencias al elegir los casos. 1. TIPOS DE :<EST4EO E( diseN& de m#est!as de"e &m"i$a! (&s !ite!i&s de m1'ima si+$i0i a i,$ de (&s !es#(tad&s &$ e( m$im& &ste. 2l ser la t&cnica de la encuesta un procedimiento caro, resulta imprescindible dise(ar muestras. 1.1. :#est!e& a(eat&!i& Cada miem"!& de (a p&"(a i,$ tie$e (a misma p!&"a"i(idad de se! i$ (#id& e$ (a m#est!a- p.e. $;me!&s e$ #$a #!$a .#e se e(i+e$ a( a=a! . 3iempre que sea posible hay que preferir el muestreo aleatorio. 5e$taIas de( m#est!e& a(eat&!i&: ). se pueden reali ar inferencias estadsticas! /. es posible conocer el error! 0. se da la representatividad. :#est!e& a(eat&!i& simp(e "s el ms sencillo. 3e parte de un conjunto listado de elementos de la poblacin, y entonces se selecciona aleatoriamente OnO elementos para formar la muestra. 6ondiciones: ). cada elemento en la poblacin tiene id&ntica probabilidad de ser incluido en la muestra! /. cada posible combinacin de OnO elementos tiene la misma probabilidad de constituir la muestra. 'as tablas de nmeros aleatorios son muy tiles. 3i se toman los nmeros que se van seleccionando aunque alguno de ellos salga ms de una ve , diremos que se trata de una m#est!a &$ !eemp(a=amie$t&! F 8 Fn 3i una ve seleccionado un nmero se aparta es una m#est!a si$ !eemp(a=amie$t&. "n este segundo caso se da la primera condicin, pero no la segunda. 7F9 FW :::: 8 ::::::::::: 7n9 7F:n9W nW "l socilogo pocas veces recurre a las muestras aleatorias simples, no slo por la posibilidad de e.traer el mismo caso ms de una ve , sino porque la mayor parte de las veces no dispone del listado ordenado de las unidades que componen el universo de trabajo. -ero tiene gran inter&s estadstico por ser la t&cnica muestral bsica de la estadstica inferncial. 2. E44O4ES DE :<EST4EO 'o que se pretende al e.traer una buena muestra es que el error de muestreo sea lo ms peque(o posible, para que as el estimador sea tanto ms preciso. pa!a medias> E ? O @ O pa!a p!&p&! i&$es> E ? Op@PO "rror de muestreo8 :::: pq

A 2 partir de la estimacin del error de muestreo se pueden determinar los intervalos de confian a. 3e denominan as por el hecho de que el valor que se trata de estimar se encuentra dentro del citado intervalo con una ;confian a;, medida en t&rminos de probabilidad determinada por el valor que tiene S. "s la probabilidad con la que podremos asegurar que el valor que obtengamos no superar el error m.imo admitido. "l intervalo de confian a ser tanto ms peque(o cuanto mayor sea el tama(o muestral. 3e utili an los siguientes niveles de confian a: Ac S

19
MM,D0K MMK MC,1CK MC,CK MCK 0

/,C* / ),M+

3. DETE4:INACIN DEL TA:A[O :<EST4AL 4anto por la ley del clculo de probabilidades que rige la teora de las muestras como por el propio sentido comn, sabemos que cuanto mayor sea el nmero de elementos considerados, ms seguro ser el resultado. =na seleccin de C, personas en una gran ciudad no ser muy representativa, pero una de C,.,,, puede ser muy costosa. "n general se puede afirmar que se ha de utili ar la muestra que mejor represente el universo de trabajo con los medios materiales y econmicos de que dispone el investigador. 'as ms usuales suelen ser muestras de ),,, a )C,,! rara ve son superiores a ),.,,, o inferiores a ),,,. 2 partir del conocimiento del error absoluto prefijado, el margen de probabilidad deseado y el valor de OpO es posible determinar el tama(o OnO de la muestra en una poblacin de tama(o OnO conocido. C&$*ie$e a (a!a! .#e e( $;me!& de as&s M$M a &$side!a! e$ #$a m#est!a $& depe$de de (as dime$si&$es N de( #$i*e!s&- p#es p#ede pasa! .#e se $e esite id%$ti a m#est!a pa!a #$a i#dad de AD.DDD .#e pa!a #$a $a i,$ de 3D :i&. ".isten unas tablas que nos ayudan a determinar la cuanta de las muestras para poblaciones finitas. H H H 5 E 4 7 O 4 : < L A 4 I O H H H 8. OT4OS TIPOS DE :<EST4EO P4O9A9ILSTICO 1) :#est!e& p&! &$+(&me!ad&s & (#ste!s 6uando se debe reali ar grandes encuestas con gran dispersin geogrfica, se reducen costes utili ando este tipo de muestreo. -uede suceder que una simple e.traccin aleatoria produ ca enormes gastos al encontrarse las muestras repartidas por toda una geografa. 6uando es posible determinar los lmites geogrficos de los conglomerados el muestreo se denomina por reas. 2) :#est!e& est!ati0i ad& %nvolucra la divisin de la poblacin en subgrupos por estratos ms homog&neos, de los que se toman entonces muestras aleatorias simples. "j. ver como reacciona la poblacin a la planificacin familiar segn religin o estatus socioeconmico. 2 cada miembro del estrato se le da un nmero de identificacin y se muestrea mediante la tabla de nmeros aleatorios. Linalmente los miembros seleccionados de cada subgrupo se combinan para tener una muestra. 'a estratificacin se basa en la idea de que un grupo homog&neo requiere una muestra ms peque(a que un grupo heterog&neo. 'a muestra estratificada puede ser: H proporcional : se sigue la proporcin de los estratos del universoJpoblacin! H no proporcional : no se sigue la proporcin original de los estratos. "n el muestreo estratificado la reduccin del tama(o se consigue mediante la concentracin de unidades homog&neas, reduci&ndose por tanto la varian a. Ebjetivos: ). ofrecer estimaciones separadas para ciertas subpoblaciones! /. agrupar unidades de muestreo homog&neas entre s en estratos, con objeto de mejorar la precisin de las estimaciones globales! 0. utili ar m&todos diferentes de muestreo en los distintos estratos. "n las numerosas etapas del muestreo, el a ar interviene constantemente, con lo que se evita la introduccin de sesgos. A. TIPOS DE :<EST4EO NO P4O9A9ILSTICO N& t&d&s (&s e(eme$t&s de (a p&"(a i,$ tie$e$ (a misma p!&"a"i(idad de se! i$ (#id&s e$ (a m#est!a. 4iene unos costes ms bajos en la recoleccin de datos y evitan a menudo los problemas de e.traer muestras al a ar. 6on el muestreo no probabilstico se puede llegar a obtener una muestra muy representativa, pe!& $& se p&d!1 e*a(#a! a pa!ti! de e((a (&s m1!+e$es de e!!&! . 6onviene evitarlos.

20
a) :#est!e& p&! a ide$te 3e incluyen los elementos que son ms convenientes para el investigador! ej. se necesitan C personas para una entrevista y el investigador coge a C alumnos suyos. 'o nico que puede desearse es que la equivocacin no sea e.cesiva. ") :#est!e& sistem1ti & 3eleccionar cada ), personas no es probabilstico, ya que las personas ),, /,, 0,, etc. tienen un )K de posibilidad de ser elegidos y las otras no. ) :#est!e& p&! #&tas "s barato y muy utili ado por los analistas de mercado y de opinin pblica. 3e especifican las caractersticas deseadas en los sujetos y se deja libertad al entrevistador que los encuentre de acuerdo a lo requerido. "s rpido y barato. d) :#est!e& i$te$ i&$a( & de I#i i& 6uando se utili an la lgica y el sentido comn para seleccionar las muestras, ej. si deseamos estudiar una revista que refleje las caractersticas del lector de nivel cultural bajo elegimos & ronto&. 'os socilogos que estudian medios rurales o instituciones concretas siguen de algn modo un muestreo intencionado, ya que se basan en sus conocimientos subjetivos.

Das könnte Ihnen auch gefallen