Sie sind auf Seite 1von 7

FACULTAD DE CIENCIAS SOCIALES

DEPARTAMENTO DE SOCIOLOGIA
ESTADISTICA INFERENCIAL
La Estadstica tiene bsicamente dos funciones: la descriptiva y la inferencial.

1. La estadstica descriptiva est constituida por los estadgrafos de tendencia central, dispersin y de
orden utilizados para resumir las distribuciones de las variables analizadas.

2. La estadstica inferencial se ocupa del proceso de generalizacin de las caractersticas de una muestra
hasta la poblacin que corresponde.
Una poblacin es el conjunto completo de individuos u objetos que son de inters para el
investigador.
Hay dos tipos de poblaciones: finitas e infinitas. Cuando todos los miembros de una poblacin
pueden ser fsicamente enumerados se dice que la poblacin es finita. Cuando la membreca en la
poblacin es ilimitada o esta no puede ser registrada se dice que es infinita.
Ejemplos:

Los libros de la biblioteca de la Universidad son una poblacin finita, porque el catlogo permite
un registro exacto de todos los libros.
El universo de los votantes en la eleccin presidencial es finita porque se pueden enumerar todos
los electores.
La poblacin de todas las personas que usan aspirina en el pas es infinita porque no existe un
registro definido. Lo mismo vale para las mujeres mayores de 30 aos que viven en la Regin
del Biobo.

Muestra: Es un subconjunto de la poblacin. Una muestra consiste de los individuos, objetos o medidas
seleccionadas por el recolector desde una poblacin.
Parmetro: Es el valor que describe una poblacin entera. La edad promedio de todos los estudiantes que
han asistido a la Universidad en los ltimos 10 aos es un parmetro. Se simbolizan con letras griegas: , .
Estadsticos o estadgrafos: Es la caracterstica numrica en una muestra. Un estadgrafo es un valor que
describe una muestra. Se simboliza con las letras del alfabeto arbigo: X, sx, r.
La estadstica inferencial es la parte de la estadstica que se ocupa de la generalizacin hacia la poblacin
basada en evidencias obtenidas desde una muestra de esa poblacin.
De la misma manera como se describen y sintetizan muestras con estadsticos tales como la media
aritmtica o la desviacin estndar, se pueden describir y sintetizar distribuciones poblacionales.
Los tres principales descriptores poblacionales son la media, la varianza y la desviacin estndar. Estos
descriptores son llamados parmetros poblacionales porque ellos son constantes en la poblacin. En las
muestras, por el contrario, la media, la desviacin estndar y la varianza son variables, porque varan de
muestra en muestra.
Por esta razn, los estadsticos son usados como estimadores de los parmetros.
Para hacer inferencias acerca de una poblacin, necesitamos discutir ms profundamente acerca de los
resultados de una muestra:

-Si se obtiene una media aritmtica (X) en una muestra, se puede esperar que ese valor sea
EXACTAMENTE igual que la media poblacional () ? NO !!
-Si se obtiene una segunda muestra y se calcula la media aritmtica, lo ms probable es que de nuevo ese
valor no sea el valor de la media poblacional. A lo sumo se debera esperar que ese valor fuese cercano al
poblacional. Qu debera ser considerado cercano ? La respuesta est en el concepto de distribucin de
muestreo.
Distribucin de muestreo de un estadgrafo:
Es la distribucin de valores para un estadgrafo muestral obtenido desde todas las muestras posibles de
una poblacin. Las muestras deben ser todas del mismo tamao y el estadgrafo puede ser cualesquiera
de aquellos conocidos: Media aritmetica, mediana, varianza, desviacin estandar, etc.
Muestras aleatorias: La teora involucrada en las distribuciones de muestreo corresponde a las
denominadas muestras aleatorias. Una muestra aleatoria es aquella que es obtenida dando a cada
individuo la misma probabilidad de ser seleccionado para la muestra.
La distribucin de muestreo ms importante es la distribucin de medias muestrales o distribucin
muestral de medias.
El teorema del lmite central se refiere a la distribucin de muestreo de medias de muestras aleatorias de
tamao n. Este teorema establece que:
Si se toman todas las muestras aleatorias posibles de tamao n en una poblacin normal con media
y desviacin estndar , la distribucin de muestreo de las medias:

1. Tendr una media aritmetica igual a .


2. Tendr una desviacin estndar igual a
3. Ser una distribucin normal.
La desviacin standard de una distribucin de muestreo tiene un nombre especial, se llama error estandar
y se simboliza
Estimacin estadstica:
1. La estimacin es parte muy importante de la inferencia estadstica. Se utiliza para determinar valores
poblacionales o paramtricos. Por ejemplo, Cul es la distancia promedio en cuadras que recorren
diariamente los estudiantes de la U. de Concepcin para asistir a clases?.
Para responder esta pregunta se debe tomar una muestra de la poblacin de estudiantes y calcular la media
de esa muestra. Supongase que se toma una muestra de 100 estudiantes y se determina un promedio de
10,22 cuadras. Este valor se denomina estimacin puntual del parmetro.
Estimacin puntual es el valor que se determina en una muestra para el parmetro en estudio. 10.22 es la
estimacin puntual del promedio poblacional de distancia recorrida por los estudiantes de la U. de
Concepcin. Ciertamente otra muestra dara otro valor puntual.
2. Para tener ms precisin en los resultados de la estimacin de un parmetro, se utiliza la estimacin
mediante intervalos de confianza.
La estimacin de intervalos de confianza opera mediante el calculo de 2 valores que se utilizan para
determinar una banda en la cual estara ubicado el parmetro con un nivel de error conocido. Los
estimadores que se utilizan para delimitar el intervalo son estadsticos calculados en la muestra
determinada.
Nivel de confianza (1 - ) es la probabilidad que la muestra seleccionada proporcione los valores de los
lmites del intervalo. El nivel de confianza se denomina tambin coeficiente de confianza.
Intervalo confidencial es la banda estimada de valores que incluye el parmetro con un nivel dado de
confianza.

El teorema del lmite central es la fuente de informacin para la construccin de intervalos de confianza
para la media.
Error mximo de la estimacin (E) es la mitad del ancho del intervalo confidencial. En general, E es un
mltiplo del error estandar.
El error de la estimacin se determina a partir del nivel de confianza, mediante los siguientes cuatro
pasos:
(1) Nivel de confianza: 1-

(2) el se debe dividir por 2: 2

(3) Se determina el valor que corresponde en la tabla de valores Z a 2 , esto se denomina Z(

2 ).

(4) Se multiplica por el error estndar ( n ), entonces la frmula es:



E = Z( 2 ) ( n )
El intervalo confidencial para estimar la media de una poblacin a partir de la media una muestra se
determina por la frmula:


Z( 2 ) ( n ) , o sea:

X -Z( 2 ) ( n ) que es el lmite inferior del intervalo de confianza
y


X +Z( 2 ) ( n ) que es el lmite superior del intervalo de confianza
EJEMPLO 1:
Para estimar el puntaje promedio poblacional de un examen de Sociologa, se obtiene una
muestra aleatoria de 38 examenes. En la muestra se obtiene una media=74.3 puntos.
Construya un intervalo confidencial de 98% para
la media. Utilice una desviacin estandar poblacional igual a 14.
Desarrollo:

1. Nivel de confianza:
1- = 0.98
= 1 - 0.98

0.02
2 = 2 = 0.01

= 0.02

2. Grfico: Para Z(0.01) tenemos z= 2.33 A=.4900


3. Error de la estimacin:
14

Z( 2 ) ( n ) = (2.33)( 38 ) = (2.33)(2.27) = 5.29
4. Intervalos de confianza:
4.1 Inferior:


X - Z( 2 ) ( n ) = 74.3 - 5.29 = 69.01
4.2 Superior:


X + Z( 2 ) ( n ) = 74.3 + 5.29 = 79.59
5. Resultado:
(69.01, 79.59) es el intervalo confidencial al 98% de significacin para la media.
EJEMPLO 2:
Una muestra de 100 estudiantes proporciona una media de 10.22 cuadras de recorrido diario
a la Universidad. Si se sabe que la desviacin standard poblacional es igual a 6 cuadras, se
pide determinar el intervalo confidencial dentro del cual est el valor verdadero del
parmetro con un 95% y un 99% de significacin.
Desarrollo (al 95% de confianza):

1. Nivel de confianza:
1-

= 0.95
= 1- 0.95 = 0.05

2. Grfico:

Z(0.025)

entonces

2 = 0.05/2 = 0.025

z= 1.96 A= 0.4750

3. Error de la estimacin

6

E = Z( 2 ) ( n ) = (0.025)( 100 )= (0.025)(0.6)= 1.176
4. Intervalos de confianza:

4.1 Inferior:


X - Z( 2 ) ( n ) = 10.22 - 1.176 = 9.04
4.2 Superior:


X + Z( 2 ) ( n ) = 10.22 + 1.176 = 11.396
5.Resultados:
(9.04, 11.396) es el intervalo confidencial al 95% para la media.
Desarrollo al 99%:

1. Nivel de confianza:
1-

= 0.99
= 1- 0.99 = 0.01

2. Grfico: Z(0.005)

2 = 0.01/2 = 0.005

z= 2.57

A= 0.495

3. Error de la estimacin:

6

E = Z( 2 ) ( n ) = (2.57)( 100 ) = (2.57)(0.6)= 1.542
4.Intervalos de confianza:

4.1 Inferior:


X - Z( 2 ) ( n ) = 10.22 - 1.542 = 8.678
4.2 Superior:


X + Z( 2 ) ( n ) = 10.22 + 1.542 = 11.762
5. Resultados:
(8.678, 11.762) es el intervalo confidencial al 99% de significacin para la
media.

Estimacin de la media de la poblacin cuando la de la poblacin es desconocida:


Cuando la desviacin estndar de la poblacin es desconocida (esto es lo ms habitual) se utiliza la
desviacin standard de la muestra Sx, en su reemplazo, esto implica utilizar en vez de la distribucin
normal (Tabla Z) la distribucin T de Student.
La frmula de clculo de los intervalos confidenciales es:
X t(gl, /2)(Sx/n)
En esta frmula gl es el concepto de grados de libertad que equivale a N-1. Despus debe usarse la Tabla
de T de Student para determinar el valor de t(gl, /2).
Ejemplo:
Una muestra aleatoria de tamao 20 es tomada de los pesos de los recin nacidos en el Hospital en el ao
1982. Para fines de comparacin internacional el peso es medido en libras y no en kilos. Se encontr una
media aritmetica en la muestra igual a 6.87 libras y una desviacin standard (Sx) igual a 1.76 libras.
Estime el peso promedio de los nios nacidos en el Hospital en 1982 mediante la creacin de intervalos
de confianza al 95 y 99% de significacin.
Desarrollo:

1. Nivel de confianza: (95 %)


1- = 0.95
= 1-0.95 = 0.05 /2 = 0.05/2 = 0.025

2. Grfico:
A= 0.50 - 0.025 = 0.475;

3. Error de la estimacin:
t(gl, /2)(Sx/n) =
t(19, 0.025)(1.76/20) =
t(2.093)(1.76/4.47) =
t(2.093)(0.39) =
.816

4. Intervalos de Confianza:
4.1 Inferior:
X - t(gl, /2)(Sx/n) =
6.87 - 0.816 = 6.054

4.2 Superior:
X + t(gl, /2)(Sx/n) =
6.87 + 0.816 = 7.686

5. Resultado:

gl =N-1 = 20-1= 19 t(gl, 0.025)=2.093

(6.054, 7.686) es el intervalo confidencial al 95% de significacin para la media poblacional. Esto
significa que se puede concluir que la media de la poblacin ( el peso de todos los nios nacidos ese
ao en el hospital) con un 5% de error mximo est entre los lmites del intervalo encontrado.
Desarrollo al 99%:

1. Nivel de confianza:
1 - = 0.99
= 1-0.99 = 0.01 /2 = 0.01/2 = 0.005

2. Grfico:
A= 0.50 - 0.005 = 0.495;

gl =N-1 = 20-1= 19 t(gl, 0.005)=2.86

3. Error de la estimacin:
t(gl, /2)(Sx/n) =
t(19, 0.005)(1.76/20) =
t(2.86)(1.76/4.47) =
t(2.86)(0.39) =
1.115

4. Intervalos de Confianza:
4.1 Inferior:
X - t(gl, /2)(Sx/n) =
6.87 - 1.115 = 5.755

4.2 Superior:
X + t(gl, /2)(Sx/n) =
6.87 + 1.115 = 7.985

5. Resultado:
(5.755, 7.985) es el intervalo confidencial al 99% de significacin para la media poblacional. Esto
significa que se puede concluir que la media de la poblacin ( el peso de todos los nios nacidos ese
ao en el hospital) con un 1% de error mximo est entre los lmites del intervalo encontrado.

Das könnte Ihnen auch gefallen