Beruflich Dokumente
Kultur Dokumente
ESTADSTICA INFERENCIAL
III Semestre
Evaluaciones
Evaluaciones Parciales % 1 Control de Lectura 3 Guas Practicas 1 Presentacin Primera Prueba Solemne % Parte Prctica SPSS Parte Terica Segunda Prueba Solemne % Parte Prctica SPSS Parte Terica 30% 70% % curso 40% 30% 70% % curso 30% 30%
Irma Nocero de Len et al (2001) Hopkins y Glass (1997) Douglas Montgmery (1985)
La estadstica es la ciencia encargada de suministrar las diferentes tcnicas y procedimientos que permiten desde organizar la recoleccin de datos hasta su elaboracin, anlisis e interpretacin. Abarca dos campos fundamentales la estadstica descriptiva y la estadstica inferencial
el arte de tomar decisiones acerca de un proceso o una poblacin con base en un anlisis de la informacin contenida en una muestra tomada de la poblacin
ESTADSTICA
Investigacin Cientfica
Un procedimiento reflexivo, sistemtico, controlado y crtico, que permite descubrir nuevos hechos o datos, relacin o leyes, en cualquier campo del conocimiento humano (Ezequiel Ander-Egg, 1995)
1. Es un procedimiento mediante el cual se recogen nuevos conceptos de fuentes primarias, una investigacin existe cuando se ha pasado por el proceso de comprobacin y verificacin de un problema, el replantear lo ya conocido no se puede llamar investigacin 2. Una investigacin es un aporte importante para el descubrimiento de principios generales por su naturaleza inferencial 3. La investigacin es un trabajo de exploracin profesional, organizada o sistemtica y exacta. 4. Es lgica y objetiva. 5. En lo posible procura ofrecer resultados cuantitativos de los datos manejados. 6. El fin de una investigacin se expresa en un informe el cual presentar no solo la metodologa, resultados, experimentaciones, sino tambin las condiciones y recomendaciones finales
Describir la realidad
Explicar la realidad
Predecir la realidad
Descriptiva
Inferencial
Rama de la estadstica que trata sobre la descripcin y anlisis estadstico de una poblacin o muestra. Tiene como objetivo caracterizar los datos, de manera grfica o analtica, para resaltar las propiedades de los elementos bajo estudio
ESTADSTICA
Rama de la estadstica que estudia el comportamiento y propiedades de las muestras, y la posibilidad y lmites de la generalizacin de los resultados obtenidos a partir de aquellas a las poblaciones que representan. Se basa en la probabilidad. Comprende el conjunto de mtodo estadsticos que permiten deducir (inferir) cmo se distribuye la poblacin bajo estudio, a partir de la informacin que proporciona una muestra representativa obtenida de dicha poblacin. El propsito principal de los mtodos estadsticos es legitimar generalizaciones sobre poblaciones usando datos de muestras. Los mtodos estadsticos inferenciales emplean el razonamiento inductivo, es decir, razonan de lo particular a lo general.
Inferencia Estadstica
Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de otra. La estadstica, ciencia o rama de las Matemticas que se ocupa de recoger datos, analizarlos y organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes bsicas: a) Estadstica descriptiva: Bsicamente se ocupa de la 1 parte, es decir, a partir de ciertos datos, analizarlos y organizarlos. Es aqu donde tiene sentido calcular la media, mediana, moda, desviacin tpica, etc. b) Estadstica inferencial: Se ocupa de predecir, sacar conclusiones, para una poblacin tomando como base una muestra (es decir , una parte) de dicha poblacin. Como todas las predicciones, siempre han de hacerse bajo un cierto grado de abilidad o conanza.
FUNCIN
El propsito principal de los mtodos estadsticos es legitimar generalizaciones sobre poblaciones usando datos de muestras.
El uso principal de la inferencia estadstica en la investigacin del comportamiento es hacer inferencia acerca de un nmero grande personas, o de otras unidades observacionales, a partir de datos concernientes a un grupo relativamente pequeo de personas. Los mtodos estadsticos inferenciales emplean el razonamiento inductivo, es decir, razonan de lo particular a lo general, razonamiento de los estadgrafos de una muestra observada a los parmetros de la poblacin no observada.
Parte
TODO
MUESTRA
Azar - Probabilidad
POBLACIN
Aleatoria simple
Representativa
Sistemtica
Probabilsticas
Todos los elementos de la poblacin tiene la misma probabilidad de ser elegidos, donde esta probabilidad es distinta de 0 y 1. Estratificada
La seleccin de una muestra representativa y probabilstica permite hacer inferencias a partir de la informacin que se posee
Conglomerado
Muestra
- Subconjunto de elementos de la poblacin que mantienen las mismas caractersticas. - Se habla de muestra estadstica cuando es a lo menos el 5% de la poblacin
Muestras Probabilsticas Muestras no Probabilsticas
Aleatoria simple
Accidental
Intencionada
Estratificada
Por cuota
TEORA DE MUESTREO
MUESTRAS PROBABILSTICAS
Es aquella que se rige por cualquier sistema que garantice el azar o la aleatoriedad. Es aquella donde todos los elementos del universo tiene una probabilidad conocida de ser extrados y esta probabilidad es distinta de cero o de uno.
Las muestras probabilsticas son aquellas que permiten calcular el error de muestreo, lo que significa que se puede generalizar. Inferencia estadstica: Extrapolacin a la poblacin. Para generalizar, solo se puede trabajar con muestras probabilsticas. Permiten el contraste de hiptesis explicativas, correlacionales y descriptivas. Es aquella donde todos los elementos del colectivo tiene la misma probabilidad de ser escogidos y esta probabilidad es distinta de cero y de uno. De acuerdo con Webster (1998) una muestra aleatoria simple es la que resulta de aplicar un mtodo por el cual todas las muestras posibles de un determinado tamao tengan la misma probabilidad de ser elegidas. Tiene implcita la condicin de equiprobabilidad. a) b) Definir la poblacin de estudio. Enumerar a todas las unidades de anlisis que integran la poblacin asignndoles un nmero de identidad o identificacin (base de muestreo). Determinar el tamao de muestra ptimo para el estudio. Seleccionar la muestra mediante un procedimiento que garantice la aleatoriedad.
c) d)
TEORA DE MUESTREO
MUESTRAS PROBABILSTICAS 2 Muestra sistemtica
Similar a la muestra aleatoria simple, sin embargo se diferencia en que los elementos del universo van siendo extrados de acuerdo a un sistema, que en otras palabras no es ms que una constante sumadora. Este procedimiento de muestreo determina los estratos que conforman una poblacin de estudio para seleccionar y extraer de ellos la muestra. Es til cuando se trabaja con variables categricas o atributos que presentan categoras, sean estar artificiales o genuinas. Es til cuando la poblacin es susceptible a ser dividida en categoras o estratos donde se tiene un inters analtico y que por razones tericas y empricas presentan diferencias entre ellas (estado civil, edad, sexo).
Muestra estratificada
Estrato: todo subgrupo de unidades de anlisis que difieren en las caractersticas que se van a analizar en un investigacin. Es una categora exhaustiva y excluyente de la poblacin, donde las unidades que lo componen son muy parecidas dentro de si, pero diferente entre si.
Es aquella cuya estructura categorial replica las mismas caractersticas porcentuales del universo Es aquella donde no se aplica la estructura porcentual del universo, sino ms bien se toma la misma cantidad de personas de cada estrato colectivo con el objetivo de posibilitar las comparaciones
TEORA DE MUESTREO
MUESTRAS PROBABILSTICAS
Muestra estratificada Proporcional a) b) c) d) e)
f)
Es aquello que es til cuando se realizan investigaciones con universos extremadamente grandes tales como pases, naciones, etc., donde es prcticamente imposible conseguir o construir la base de muestreo. Se utiliza cuando el investigador esta limitado por factores de tiempo, distancia, fuentes de financiamiento, entre otros. Las unidades de anlisis se encuentran encapsuladas o encerradas en determinados lugares fsicos o geogrficos que se denominan racimos o conglomerados.
Conglomerados: Subconjunto exhaustivo y excluyente de la poblacin donde los elementos que lo configuran son muy diferentes dentro de si, pero similares entre s.
SISTEMTICA
Dado que tenemos que elegir 20 de 600, es decir, 1 de cada 30, se procede as: Se ordenan los estudiantes y se numeran, se elige uno al azar, por ejemplo el estudiantes 27. A partir de este, los dems se eligen a partir de este intervalo de 30 estudiantes.
ESTRATIFICADA
Si queremos que nuestra muestra sea representativa, debemos saber cuantos estudiantes hay por curso: Primero Medio 200, Segundo Medio 150, Tercero Medio 150 y Cuarto medio 100 estudiantes.
Curso Primero Segundo Tercero Poblacin 200 150 150 fraccin 0,3333 025 0,25 Muestra 7 5 5
CONGLOMERADO
Cambiemos el ejemplo: - Supongamos que necesitamos una muestra de los estudiantes de todo chile, lo cual es difcil tener la poblacin total, pero sabemos que se agrupan en Tipos de colegios, Colegios y niveles. - Entonces, seleccionamos al azar algunos tipos colegios, despus algunos colegios y, finalmente, algunos cursos. - Finalmente por azar simple seleccionamos a algunos estudiantes. - Los conglomerados son unidades amplias y heterogneas.
Cuarto
Total
100
600
0,1666
1
3
20
* POBLACIN CONOCIDA N
* POBLACIN CONOCIDA N
P = proporcin de casos que se consideran favorables en el universo Q = P 1 Proporcin de casos considerados como no favorables
Por un estudio anterior sabe que la prevalencia de droga es de 14,3%. l desea trabajar con 5% de significacin y 1% de error de muestreo. DETERMINE: 1. El tamao de la muestra general 2. El tamao de muestra por estrato
Estimacin de Parmetros
En estadstica se refiere a los valores o medidas que caracterizan a una poblacin como, por ejemplo, la media y la desviacin tpica de una poblacin () Son cantidades indeterminadas, constantes o fijas respecto a una condicin o situacin, que caracterizan a un fenmeno en un momento dado que ocurre en una poblacin (Sierra Bravo, 1991). Se contrapone al parmetro porque es un valor que se obtiene a partir de los valores mustrales. Se pueden obtener media y varianzas mustrales. En estadstica es la operacin mediante la cual se trata de determinar el valor del parmetro, utilizando datos incompletos procedentes de una muestra (Estadstico)
Parmetro
Estimacin
Estimaciones puntuales
Estimaciones de Intervalo
Estimacin de Parmetros
Estimaciones Puntuales
- Slo un valor numrico sirva para estimar el parmetro, es decir, asigna directamente al parmetro el valor obtenido para el estadstico
- Constituye la inferencia ms simple que se puede realizar: asignar al parmetro el valor del estadstico que mejor sirva para estimarlo. a) Carencia de Sesgo: Un estimador ser insesgado si su valor esperado coincide con el del parmetro a estimar
b) Consistencia: Un estimador ser consistente si, conforme aumenta el tamao muestral, su valor se va aproximando al del parmetro
c) Eficiencia: Dados dos posibles estimadores, diremos que el primero es un estimador ms eficiente que el segundo si se cumple que el primer estimador tiene una varianza menor que el segundo.
Estimacin de Parmetros
2
-
Estimaciones de Intervalos
Como el trmino lo sugiere, una estimacin de intervalo es un rango o banda de valores dentro del cual se dice que el parmetro est con un nivel de probabilidad establecido. Proporciona un intervalo, un rango de valores entre los que estar situado el parmetro con una cierta probabilidad. La estimacin puntual se utiliza poco, pues no tenemos datos suficientes para que nos indiquen el grado de fiabilidad de dato muestral hemos tomado. Lo que tiene ms sentido plantearse es cul es la probabilidad de que la media o proporcin poblacional pertenezcan a un intervalo determinado. Para comprender el fundamento de las estimaciones de intervalo se requiere un dominio del concepto de una distribucin de muestreo, especficamente, la distribucin de muestreo de la media (DMM) Dada una muestra, se puede calcular la Distribucin de muestreo de la media donde, con cierta seguridad, estar la media poblacional que se busca.
DISTRIBUCIONES MUESTRALES
Uno de los objetivos de la estadstica es conocer acerca del comportamiento de parmetros poblacionales tales como: la media ( ), la varianza ( ) o la proporcin ( p ). Para ello se extrae una muestra aleatoria de la poblacin y se calcula el valor de un estadstico correspondiente, por ejemplo, la media muestral ( X ), la varianza muestral (s ) o la proporcin muestral ( p ). El valor del estadstico es aleatorio porque depende de los elementos elegidos en la muestra seleccionada y, por lo tanto, el estadstico tiene una distribucin de probabilidad la cual es llamada la Distribucin Muestral del estadstico.
La distribucin muestral es la distribucin de los resultados que se presentan si en realidad se seleccionaron todas las muestras posibles
DISTRIBUCIONES MUESTRALES
- Es la distribucin de todas las medias posibles que surgen si en realidad se seleccionaran todas las muestras posibles de cierto tamao, es decir, es una distribucin de frecuencias, no de valores brutos, sino de medias de la muestra, donde cada media de la muestra est basada en una muestra aleatoria de n valores brutos
2 1 2 3
La media muestral es imparcial porque la media de todas las medias mustrales posibles (de una muestra dada con tamao n) es igual a la media poblacional . 3 El error estndar de la media, es el valor de la desviacin estndar de todas las medias mustrales posibles, es decir, expresa cunto vara la media muestral entre una muestra y otra.
DISTRIBUCIONES MUESTRALES
Si se est muestreando una poblacin que tiene una distribucin normal con media y desviacin estndar desconocida, la distribucin muestral de la media que se utilizar es la t de student siempre que el n sea inferior a 30. Cuando la muestra es mayor a ese nmero, la distribucin se asemeja a la distribucin normal y el contraste de hiptesis se realizacin con la distribucin z.
La prueba de Hiptesis para la media poblacional se realizar haciendo uso de los puntajes t de la curva t.
DISTRIBUCIONES MUESTRALES
1)
2) 3)
Para la mayor parte de las distribuciones poblacionales, sin importar su forma, la distribucin muestral de la media tiene una distribucin aproximadamente normal cuando se seleccionan muestras de por lo menos 30 elementos. Si la distribucin poblacional es bastante simtrica, la distribucin muestral de la media es aproximadamente normal en muestras tan pequeas como las de 5 elementos. SI la poblacin tiene una distribucin normal, la distribucin muestral de la media tambin tiene una distribucin normal, independientemente del tamao de la muestra.
La prueba de Hiptesis para la media poblacional se realizar haciendo uso de los puntajes z de la curva normal.
DISTRIBUCIONES MUESTRALES
La distribucin muestral de la proporcin generalmente sigue el modelo de una distribucin probabilstica para variables cuantitativas discretas denominada Distribucin Binomial, sin embargo cuando ocurre que n * P y n * Q son 5, la distribucin binomial puede aproximarse al modelo de la curva normal y en consecuencia realizar el contraste de hiptesis para la proporcin poblacional a travs de los puntajes z de la curva normal.
1 2 3 4 5 6 7
374,64
8
9 10
100
105 132 106,4
10000
11025 17424 116956 639,17
1- 0,95
663,16
19,35
Error tipo I Rechazar una Hiptesis nula (Ho) siendo esta verdadera. Tiene asociada una probabilidad
Error tipo II Aceptar una Hiptesis nula (Ho) siendo esta falsa. Tiene asociada una probabilidad .
Nivel de confianza
Es aceptar una Hiptesis nula (Ho) siendo esta verdadera por lo tanto es una decisin acertada; tiene asociada una probabilidad de 1 . Los niveles de confianza ms usados son el 0,99 (99%) y el 0,95 (95%)
Potencia de Prueba
Rechazar una Hiptesis nula (Ho) siendo esta falsa (Acierto). Tiene asociado una probabilidad que es 1 (Es la probabilidad de estar en potencia de prueba). Es un complemento al error tipo II.
CORRELACIONES
Procedimiento estadstico que intenta probar el grado de asociacin que hay entre dos o ms variables
Correlaciones Bivariadas
Correlaciones Mulivariadas
Es un nmero que nos dice hasta donde los cambios o variaciones que presenta una variable se explican por las variaciones o cambios que presenta otra variables (Juego de varianzas)
La correlacin no implica causalidad, la nica vez que yo puedo atribuir causalidad es cuando la correlacin es perfecta (-1 o +1).
Tiene que ver con la fuerza de la copelacin, las que pueden ser: fuertes (0,66 a 1), moderada (0,35 a 0,65) y dbiles (0 0,34)
direccin
Tiene que ver con el signo de la correlacin. Pueden ser positivas (directa) o negativas (inversa). No todos los coeficientes asumen valores positivos y negativos
COEFICIENTES DE CORRELACIN
- Dos variables cuantitativas continuas con un nivel de medicin a lo mnimo intervalar - La relacin de las variables debe ser de naturaleza lineal - Asume valores que van del -1 a +1, pasando por el 0 que significa ausencia de correlacin.
Pearson (rxy)
Spearman (rs)
Kendall ()
- Dos variables cuantitativas con un nivel de medicin a lo mnimo ordinal - La relacin de las variables debe ser de naturaleza lineal - Asume valores que van del -1 a +1, pasando por el 0 que significa ausencia de correlacin. - Spearman es un derivado de Pearson, Kendall no lo es. - Kendall se utiliza para determinar una correlacin parcial (control de variables intervinientes) - Spearman es aproximadamente 1,5 veces ms grandes que Kendall en el mismo conjunto de datos.
- Es un derivado de Pearson - Correlacin entre una variables dicotmica real o genuina (nominal) con otra variable que es cuantitativa continua medida a lo menos en una escala intervalar. - El signo no se interpreta, sino que hay que ver las medias de los grupos - En SPSS se realiza mediante el coeficiente de correlacin de Pearson
Biserial (rb)
- Es un derivado de Pearson - Correlacin entre una variable es que cuantitativa medida a lo menos en una escala intervalar con otra variable que es dicotmica aparente o artificial
COEFICIENTES DE CORRELACIN
- Sirve para calcular la correlacin entre dos variables dicotmicas reales o una dicotmica real y una aparente. - El signo no se interpreta, pues son variables cualitativas. Para interpretar hay que recurrir a la tabla de contingencia. - Condicin: Si existe una frecuencia esperada menor a 5, se interpreta mediante el estadstico exacto de Fisher (Chi cuadrado)
Phi (r)
Contingencia (C)
- Es un derivado de Pearson - Tradicionalmente se utiliza para calcular la correlacin entre 2 variables dicotmicas (reales o aparentes), dos policotmicas (reales o aparentes) o una dicotmicas y una policotmicas.. - Su uso se restringir a dos variables policotomicas o una policotmica y una dicotmica - Toma valores que van entre 0 y 1 - Condicin: si ms del 20% de las frecuencias esperadas son inferiores a 5, no se puede calcular.
Tetracorico (rt)
- Se utiliza para calcular la correlacin entre dos variables dicotmicas aparentes - Es derivado de Pearson - La dicotoma por lo general se realiza en la mediana.
COEFICIENTES DE CORRELACIN
10
Correlacin Mltiple
- Se utiliza para calcular la correlacin entre una variable (criterio) y 2 o mas variables (predictoras). - El coeficiente se denomina coeficiente de correlacin mltiple . - Asume valores que van de -1 a +1 pasando por el 0 - El signo no se interpreta, slo establece si existe o no correlacin.
11
Correlacin Parcial
- Se utiliza para calcular la correlacion entre dos variables cuantitativas continuas manteniendo controlada los efectos de una tercera variables que se sabe que influye (correlacin previa). - La correlacin parcial obtenida se denomina correlacin pura. - La influencia de la variables controlada puede ser: - Positiva: cuando esta controlada baja el monto de la correlacin - Negativa: cuando esta controlada aumenta el monto de la correlacin
CONFIABILIDAD
La confiabilidad es un proceso o una propiedad que se le atribuye a la medicin de la prueba, se relaciona con los conceptos de estabilidad y consistencia. Una prueba es confiable cuando sus resultados son similares en el tiempo tras sucesivas aplicaciones. Hay ciertos factores que atentan contra la confiabilidad: Historia, Maduracin, Mortalidad Experimental, Adivinacin o Azar. El valor mximo que accede el coeficiente de fiabilidad es 1.
Test - Retest
Formas Paralelas
Consiste en generar una prueba lo ms similar posible o equivalente a la que se est construyendo. Se aplica la prueba A, se deja pasar un tiempo y luego se aplica A. Si hay correlacin, ser confiable. Tambin se corrige por Spearman Brown.
Prueba de Significancia
CONFIABILIDAD
3
Consistencia Interna Consiste en correlacionar la prueba consigo misma. Esta basado en una sola aplicacin del instrumento, sin embargo constituyen una estimacin de la confiabilidad y no el clculo en s misma. Dos mitades Se va a dividir la prueba en 2 mitades cualquiera y esas 2 mitades se correlacionan. Si hay correlacin entre ambas, el instrumento es confiables. Lo ms comn es que se divida entre los tems pares e impares, se suman y se correlacionan mitad par con mitad impar. Se corrige con Spearman Brown, pero tambin se agrega el procedimiento de ruln (rttR) y Gutman y Flanagan (rttGF ) Independiente el procedimiento, los valores deben ser los mismos
Propiamente tal
Kuder Richardson = para variables dicotmicas (K.R(20) y K.R(21)) de Cronbach = para variables policotomicas y cuantitativas continuas