Sie sind auf Seite 1von 67

REPASO DE

ESTADISTICA
Estadstica Descriptiva
Medidas de Tendencia Central
Son indicadores estadsticos que
muestran hacia que valor (o valores se
agrupan los datos.

Medidas:
Media
Moda
Mediana
Tipos de Medidas
Media (promedio). Es la suma de todos los valores
divido para el numero de ellos (promedio simple).
MUESTRAL
n

X i
X i 1
n
Ventajas Desventajas
Es la medida de tendencia central
ms usada. Es sensible a los valores
extremos.
Es sensible a cualquier cambio en No es recomendable emplearla
los datos (puede ser usado como un en distribuciones muy
detector de variaciones en los datos). asimtricas.
Se emplea a menudo en clculos Si se emplean variables
estadsticos posteriores. discretas o cuasi-cualitativas, la
media aritmtica puede no
En la grfica de frecuencia pertenecer al conjunto de
representa el centro de gravedad. valores de la variable.
Tipos de Medidas
Mediana. Es un indicador en divide en dos partes
iguales la base de datos.
Para su calculo deben ordenarse primero los datos de
menor a mayor.
Luego dependiendo del nmero de datos se escoge la
tendencia.

Ventajas Desventajas
Es estable a los valores
extremos. No presenta todo el rigor
matemtico.
Es recomendable para
distribuciones muy asimtricas Se emplea solo en variables
cuantitativas
Tipos de Medidas.
Moda. Es el dato que ms se repite en la base
de datos.
En el caso de que dos valores presenten la misma
frecuencia, decimos que existe un conjunto de datos
bimodal. Para ms de dos modas hablaremos de un
conjunto de datos multimodal
Ventajas Desventajas
Es estable a los valores
extremos. Pueda que no se presente.
Puede existir ms de una moda.
Es recomendable para el En distribuciones muy
tratamiento de variables asimtricas suele ser un dato
cualitativas muy poco representativo.
Carece de rigor matemtico.
Tipos de Medidas.
Asimetra.- Mide el grado de asimetra de la distribucin con
respecto a la media. Un valor positivo de este indicador significa
que la distribucin se encuentra sesgada hacia la izquierda
(orientacin positiva). Un resultado negativo significa que la
distribucin se sesga a la derecha. La distribucin se considera
simtrica si el valor del coeficiente es cero.
Tipos de Medidas.
Curtosis.- Indica que tan apuntada o plana se encuentra una
distribucin respecto a un comportamiento normal (distribucin normal).
Si los datos estn muy concentrados hacia la media, la distribucin es
leptocrtica (curtosis mayor a 0). Si los datos estn muy dispersos, la
distribucin es platicrtica (curtosis menor a 0).
El comportamiento normal exige que la curtosis sea igual a 0
(distribucin mesocrtica).
Medidas de Posicin
Son indicadores estadsticos que muestran la frecuencia
acumulada hasta un valor k cualquiera.

Analizaremos tres medidas de posicin:


Percentiles
Deciles
Cuartiles

La base de estos indicadores es encontrar el valor de la


variable a partir de un porcentaje de datos acumulados,
de forma similar como se hizo con la mediana
Medidas de posicin
Percentiles: Los percentiles representan los valores de la variable
que estn por debajo de un porcentaje, el cual puede ser un valor
entre 1% y 100%. El total de los datos es divido en 100 partes
iguales.

La notacin empleada es: Pk


donde k es el porcentaje de datos acumulados, y Pk es el valor de
la variable que representa dicho porcentaje. Por ejemplo, P5 es el
valor de la variable que deja por debajo el 5%. P50 es el valor que
divide en dos parte iguales la cantidad de datos (es la mediana)

Al igual como sucede con la mediana, pueden existir problemas en


el cmputo de los percentiles, ya que puede existir el caso de que
no exista el dato que acumule un determinado porcentaje. De darse
esta situacin, el percentil se determinar en funcin a la distancia
de los valores por los que se ve rodeado, empleando una regla de
tres.
Medidas de posicin
Deciles: Los deciles, denotados por Dk, son derivaciones del
calculo de percentiles, ya que consisten en la divisin de los datos
en 10 partes iguales.

D1 P10 : Valor de la variable que agrupa el 10% de los datos.


D2 P20 : Valor de la variable que agrupa el 20% de los datos.
D3 P30 : Valor de la variable que agrupa el 30% de los datos.
D4 P40 : Valor de la variable que agrupa el 40% de los datos.
D5 P50 : Valor de la variable que agrupa el 50% de los datos.
D6 P60 : Valor de la variable que agrupa el 60% de los datos.
D7 P70 : Valor de la variable que agrupa el 70% de los datos.
D8 P80 : Valor de la variable que agrupa el 80% de los datos.
D9 P90 : Valor de la variable que agrupa el 90% de los datos.
D10 P100 : Valor de la variable que agrupa el 100% de los datos.
Medidas de posicin
Quartiles: Denotados por Qk, los cuales en cambio provienen de la
divisin de los datos en 4 partes iguales.

Q1 P25 : Valor de la variable que agrupa el 25% de los datos.


Q2 P50 : Valor de la variable que agrupa el 50% de los datos.
Q3 P75 : Valor de la variable que agrupa el 75% de los datos.
Q4 P100 : Valor de la variable que agrupa el 100% de los datos
Medidas de desviacin
Desviacin Media.- Equivale a la divisin de la sumatoria del valor
absoluto de las distancias existentes entre cada dato y su media
aritmtica, y el nmero total de datos.

X i X
Dm i 1
n
Medidas de desviacin
Varianza : Es el resultado de la divisin de la sumatoria de las
distancias existentes entre cada dato y su media aritmtica
elevadas al cuadrado, y el nmero total de datos.

MUESTRAL
2

X X
n

i
S2 i 1
n 1

Hay que tomar en cuenta que al elevar las distancias al cuadrado,


automticamente se elevan las unidades. Por ejemplo, si unidad
trabajada en los datos es centmetros, la varianza da como
resultados centmetros al cuadrado
Medidas de desviacin
Desviacin estndar tpica : Es igual a la raz cuadrada de la
varianza.
MUESTRAL

X X
n

i
S S 2 i 1

n 1
Habamos visto que la varianza transforma todas las distancias a
valores positivos elevndolas al cuadrado, con el inconveniente de
elevar consigo las unidades de los datos originales.

La desviacin estndar soluciona el problema obteniendo la raz


cuadrada de la varianza, consiguiendo as, un valor similar a la
desviacin media.
Medidas de desviacin
Coeficiente de variacin.- Permite comparar la dispersin entre
dos poblaciones distintas e incluso, comparar la variacin producto
de dos variables diferentes (que pueden provenir de una misma
poblacin).

El coeficiente de variacin elimina la dimensionalidad de las


variables y tiene en cuenta la proporcin existente entre una medida
de tendencia y la desviacin tpica o estndar.

Equivale a la razn entre la desviacin tpica o estndar y la media


S
Cv MUESTRAL
X

Tambin se puede calcular un coeficiente de variacin utilizando la


mediana, en ese caso se denomina coeficiente de variacin
mediano
Medidas de Asociacin
Se utilizan para medir la relacin existente
entre 2 variables.

Covarianza
Correlacin
Medidas de asociacin
Covarianza.- Es una medida de relacin entre 2 variables.

1 n
S xy
n 1 i 1
( X i X )(Yi Y )

Sin embargo, tiene un problema debido a que es el producto de la


multiplicacin de 2 variables.
Medidas de asociacin
Correlacin.- Mide el grado de relacin lineal entre las variables

Sxy
r xy
Sx2 Sy 2
Desaparece el problema de a-dimensionamiento.
Es un valor que se encuentra entre -1 y 1.
Coeficiente de Spearman
La correlacin de Spearman mide el grado de
asociacin entre dos variables cuantitativas que siguen
una tendencia siempre creciente o siempre decreciente.
Es ms general que el Coeficiente de correlacin de
Pearson, la correlacin de Spearman, en cambio se
puede calcular para relaciones exponenciales o
logartmicas entre las variables.
Estadstica inferencial
Probabilidades
Teora de la probabilidad: Se encarga del estudio de
los fenmenos o experimentos aleatorios

Experimento aleatorio: Es aquel ejercicio que cuando


se lo repite bajo las mismas condiciones iniciales, el
resultado que se obtiene no siempre es el mismo.

El ejemplo mas sencillo y cotidiano de un experimento


aleatorio es el de lanzar una moneda o un dado. En
principio, no se sabe cual ser el resultado del
experimento aleatorio, as que por lo menos conviene
agrupar en un conjunto a todos los resultados posibles.

Espacio muestral: Es el conjunto de todos los posibles


resultados de un experimento aleatorio ().

Evento: Es cualquier subconjunto del espacio muestral.


Probabilidades
Ejemplo.- Si un experimento aleatorio consiste en
lanzar un dado y observar el nmero que aparece en la
cara superior, cul es el espacio muestral?

Un evento de este espacio puede ser el conjunto {2,4,6},


que no es ms que obtener un nmero par como
resultado del experimento.
Probabilidades
Teora de conjuntos

Unin:

Interseccin:

Complemento:

Diferencia o exclusin:
Probabilidades
Teora de la probabilidad

La probabilidad de un evento representa una medida de


la frecuencia con la sucede el evento en un experimento
aleatorio.

Probabilidad Clsica: Sea A un subconjunto de (un


espacio muestral finito), entonces la probabilidad se
define como:
A
P A
Vlido para espacios
muestrales finitos

Probabilidades
Axiomas

P(A) 0
0 P(A) 1
P() = 1
P(A B) = P(A) + P(B), si A B =
P() = 0
P(Ac) = 1 P(A)
Si A B, P(A) P(B)
P(A B) = P(A) + P(B) P(A B), si A B
Probabilidades
Probabilidad condicional

Sean A y B dos eventos. Se define la probabilidad condicional del


evento A dado el evento B (denotado por P(A/B) de la siguiente
manera:
P A B
P A B
P B

Aqu, el evento B representa la informacin adicional acerca del


experimento aleatorio.

Por ejemplo, consideremos el experimento de lanzar un dado. Sean


los eventos A={2}, B={2,4,6}. Entonces la probabilidad de que salga
el nmero 2 dado solo el suceso de nmero pares es:
1/ 6
P( A / B) 1/ 3
3/ 6
Probabilidades
Probabilidad condicional
Se dice que dos eventos A y B son independiente si y solo si:
P A B P A P B
Lo cual implica:
P A B P A P B
P A B P A
P B P B
En otras palabras, no existe informacin adicional del evento que
aporte al conocimiento del suceso del evento.

Por ejemplo, si se asume que el hecho de tener altos ingresos es


independiente del sexo que posea el individuo, en una poblacin
donde individualmente estos eventos estn asociados al siguiente
esquema de probabilidad:
Probabilidades
Probabilidad condicional

Ingresos Sexo

Evento Descripcin Probabilidad Evento Descripcin Probabilidad

A Ingresos Bajos 0.75 A' Masculino 0.4

B Ingresos Altos 0.25 B' Femenino 0.6

Entonces, la probabilidad de ser hombre (evento A) y tener altos ingresos


(evento B) es:
P A ' B P A ' P B 0.4 0.25 0.1

O la probabilidad de ser mujer (evento B ) y tener bajos ingresos (evento A


) es:

P B ' A P B ' P A 0.6 0.75 0.45


Variables aleatorias
Una variable aleatoria transforma los eventos de un espacio muestral en
eventos numricos.

Una variable X se dice aleatoria cuando toma valores con determinadas


probabilidades

El conjunto de valores que una variable aleatoria puede tomar, se puede


clasificar en dos tipos: discretas y continuas.

Variables discretas.- Decimos que una variable aleatoria es discreta


cuando el conjunto de valores que sta variable toma puede asociarse a los
nmeros enteros.

Variables continuas.- Decimos que una variable aleatoria es continua


cuando el conjunto de valores que sta variable toma puede asociarse a los
nmeros reales.
Variables aleatorias
Funcin de densidad o de probabilidad de una variable discreta X: es
la funcin que asigna a cada valor que puede tomar la variable, la
probabilidad con la que eso sucede. Se puede expresar mediante una
frmula f(x), mediante una tabla. La funcin de densidad cumple:

1.- f(x)0 para todo valor que pueda tomar la variable.



2.- f ( x) 1
x

La funcin de distribucin de una variable discreta X es la funcin que


asigna a cada valor que puede tomar la variable, la probabilidad de que
tome ese valor, o cualquier valor inferior.

F ( xi ) P( X xi )
Esperanza matemtica
La esperanza matemtica o valor esperado de una variable aleatoria discreta es
la suma del producto de la probabilidad de cada suceso por el valor de dicho
suceso.

E X xi P( X xi ) xi p( xi )
i i

X P(X) X P(X)
-1 .1 -.1
0 .2 .0
1 .4 .4
2 .2 .4
3 .1 .3
1.0
Propiedades de la esperanza
Sean a, b y c constantes:

(1) E (c) c
(2) E ( X Y ) E ( X ) E (Y )
(3) E (aX b) aE( X ) b
Varianza matemtica
Se utiliza para estudiar el comportamiento de los valores de la variable aleatoria
en funcin de la media o valor esperado

2 Var( X ) E (( X ) 2 )
i(
i
x ) 2
P( X xi )

X ( X ) ( X ) P( X )
2 2
X P(X)

-1 .1 -2 4 .4
0 .2 -1 1 .2
1 .4 0 0 .0
2 .2 1 1 .2
3 .1 2 4 .4
1.2
Propiedades de la varianza
Sean a, b y c constantes:

(1) Var(c) 0

(2) Var( X Y ) Var( X ) Var(Y ), ssi X y Y son ind.

(3) Var(aX b) a 2Var( X )


Funciones Discretas Sencillas
Distribucin de Bernulli.- Se produce en experimentos sencillos
en los que solamente hay dos resultados posibles, tales como cara
y cruz, xito o fracaso, etc.

Distribucin de Binomial.- Consiste en contar el nmero de xitos


en n ensayos de Bernoulli

X B p, n

donde p constituye la probabilidad de xito y n el numero de


ensayos que se realizan

n x n x
P( X x) p q
x
Edwin Buenao - Estadstica II
PUCE
Funciones Discretas Sencillas
Distribucin de Poisson
Dado un suceso que aparece de espordicamente, en un intervalo de tiempo o
un espacio dado, cul es la probabilidad de que se haya dado x veces?

x
f ( x) e x 0,1,2,...
x!

: nmero medio o esperado de ocurrencias


Funciones Discretas Sencillas
Distribucin de Hipergeomtrica.- Una variable tiene distribucin
hipergeomtrica siempre y cuando proceda de una muestra n de
tamao n , sin reemplazamiento, de un conjunto finito de N
objetos donde existen K elementos con una caracterstica en
particular. Aqu, la variable cuenta el nmero de elementos con
dicha caracterstica obtenidos al realizar la muestra.
X H N, K

Aplicacin:
Por ejemplo, al momento de revisar deberes, cuando de un lote
pequeo de tamao N con K deberes con error se extrae una
muestra aleatoria de tamao n , la probabilidad de encontrar un
determinado nmero de deberes con error en lac muestra se puede
calcular mediante la distribucin hipergeomtrica.
k N k

x nx
P ( X x)
N
Edwin Buenao - Estadstica II
PUCE

n
Funciones Continuas
Dado que entre dos datos continuos siempre existe otro dato continuo, se puede
conseguir una agrupacin mas fina de los mismos mediante los intervalos de clase;
situacin que no sucede con los nmeros enteros
Este hecho permite conseguir una curva mas continua del polgono de frecuencias
Sin embargo, como el nmero de valores que puede tomar una variable continua es
infinito, la probabilidad puntual de que suceda uno de ellos es nula.
Por lo tanto, solo es posible determinar probabilidades de intervalos con este tipo de
variables

DEFINICION (Funcin de densidad): Dada una variable aleatoria


continua X decimos que f(x) es una funcin de densidad, si la
probabilidad de que X tome valores en el intervalo (a,b) es igual al
rea encerrada por la grfica de f(x), el eje x y las rectas x=a, x=b.
Se cumple:

1.- f(x)0 para todo valor de x



2.-

f ( x)dx 1
Funciones Continuas
En estas condiciones, P(a X b) (es decir, la probabilidad de que
la variable X est entre los valores a y b), se calcula como:

b
P ( a X b) f ( x ) dx
a

f(x)

a b
Funciones Continuas

DEFINICION (Funcin de distribucin): Dada una


variable aleatoria continua X, con funcin de densidad
f(x), la funcin de distribucin F(x) es la funcin que
para cada valor de la variable nos da la probabilidad de
que X tome ese valor, o cualquier otro inferior.

x
F ( x) P ( X x) f (t )dt
a
Funciones Continuas
La funcin de distribucin cumple:

1. La derivada de la funcin de distribucin,


es la funcin de densidad. F ' ( x) f ( x)

2. Se verifica:

P(a X b) F (b) F (a)


a, b

Funciones Continuas
Distribucin Uniforme.- Se produce en experimentos
cuando los posibles resultados pueden darse
equiprobablemente dentro de un determinado intervalo
de valores.
X U a, b

x
xa
P X x
ba
a, b

Funciones Continuas
Distribucin Normal.- Se produce en experimentos
cuando los posibles resultados pueden concentrarse
alrededor de un valor central y repartirse inferiormente
en los extremos
X N ,

x
x
1 1 x 2
P X x exp x
2 2
a, b

Funciones Continuas
Distribucin Normal Estandar.- Este tipo de
distribucin es simplemente una transformacin de la
variable normal, de manera que consiga media 0 y
desviacin 1:
X
Z N 0,1

a, b

Funciones Continuas
Distribucin muestral.- Si X1, X2, , Xn es una
muestra aleatoria de una poblacin normal con media x
y varianza x, entonces la media muestral sigue una
distribucin:

x N ( x ; / n)
2
x

Una distribucin muestral es una distribucin de


probabilidad donde la variable aleatoria es un estimador,
como la media muestral o la varianza muestral.
a, b

Funciones Continuas
Distribucin t-student.- Est estrechamente relacionada con la
distribucin normal
x N ( x ; x2 / n)
x x
Z N (0;1)
x / n
La variable Z sigue una distribucin normal estndar, siempre que
se conozca x y x. Suponiendo que slo conocemos x y
estimamos x a partir de su estimador muestral: n
( xi x ) 2
Sx
i 1 n 1

Sustituyendo x por Sx, es decir, la desviacin estndar de la


poblacin por la desviacin de la muestra, se obtiene una nueva
variable:
x x
t t( n 1)
Sx / n
a, b

Funciones Continuas
x x
t t( n 1)
Sx / n
Esta variable sigue una distribucin t de student con (n-1) grados de libertad (g.l)
La distribucin t tiene un nico parmeto que son los grados de libertad

Propiedades:
Es simtrica
La media es 0 y la varianza es k/(k-2), donde k representa los grados de libertad
a, b

Funciones Continuas
Distribucin Ji-Cuadrado.- El cuadrado de una variable normal
estndar se distribuye siguiendo una distribucin de probabilidad Ji-
cuadrado (c2) con un grado de libertad
Z 2 c (21)
Sean ahora Z1, Z2, Z3, .., Zn variables normales con media 0 y
varianza 1. Se puede demostrar que la suma de las Zi variables al
cuadrado, tambin sigue una distribucin Ji-Cuadrado
k

i 1 2
Z 2

i 1
Z 2
Z 2
..... Z 2
k c 2
(k )
a, b

Funciones Continuas
Propiedades.-

- La distribucin c2 solo asume valores positivos


- Es asimtrica, a medida que aumentan los g.l.
se torna simtrica
- El valor esperado (media) es k y la varianza 2k
- Si Z1 y Z2 son 2 variables c2 independientes, la
suma tambin es una variable c2
a, b

Funciones Continuas
Distribucin F.- Sean X1, X2, .., Xm una muestra aleatoria de
tamao m de una poblacin normal con media x y desviacin x. Y
sean Y1, Y2, , Yn una muestra aleatoria de tamao n de una
poblacin normal con media y y desviacin y.
Suponiendo que dichas muestras son independientes y se extraen
de poblaciones que se distribuyen normalmente y el inters radica
en conocer si las varianzas de estas 2 poblaciones son las mismas
x = y Si no se conoce las poblaciones y se utiliza los estimadores
muestrales de la siguiente manera:

m
( xi x ) 2 n
( yi y ) 2
S x2 S y2
i 1 m 1 i 1 n 1

S x2
F 2 F( m 1;n 1)
Sy
a, b

Funciones Continuas
S x2
F 2 F( m 1;n 1)
Sy
La teora muestra que si las varianzas son iguales, el coeficiente F
sigue una distribucin F con (m-1) g.l del numerador y (n-1) g.l del
denominador.
a, b

Funciones Continuas

Propiedades.-

La distribucin F es asimtrica a la derecha y toma valores entre 0 e


infinito.
Se aproxima a la distribucin normal a medida que aumentan los g.l
El cuadrado de una variable que sigue una distribucin t con k g.l;
sigue una distribucin F con 1 y k g.l
Una variable c2 dividida para sus g.l se aproxima a una variable F
con m g.l en el numerador y unos g.l muy elevados en el
denominador.
Estimacin
Estimacin: puntual y por intervalos

A partir de los estadsticos que hemos obtenido en la/s


muestra/s queremos tener una idea de los valores de los
parmetros en la poblacin.
Se trata de emplear los estadsticos para estimar los
parmetros.
Veremos DOS tipos de estimadores:
1) Estimacin puntual. Aqu obtendremos un punto, un valor,
como estimacin del parmetro.
2) Estimacin por intervalos. Aqu obtendremos un intervalo
dentro del cual estimamos (bajo cierta probabilidad) estar
el parmetro.
Estimacin puntual de parmetros
Un estimador puntual es simplemente un estadstico (media aritmtica,
varianza, etc.) que se emplea para estimar parmetros (media
poblacional, varianza poblacional, etc.).

Es decir, cuando obtenemos una media aritmtica a partir de una


muestra, tal valor puede ser empleado como un estimador para el valor
de la media poblacional.

Propiedades Mtodos de estimacin

1. Ausencia de sesgo 1. Momentos


2. Consistencia 2. Mximaversomilitud
3. Eficiencia
4. Suficiencia
Insesgado
1. Ser insesgado. Diremos que es un estimador insesgado de si la
esperanza de es . Es decir,E( )

La media muestral es un estimador insesgado de la media poblacional.


Pero la varianza muestral NO es un estimador insesgado de la varianza
poblacional, pero s lo es en cambio la cuasivarianza.

Eficiencia
Se emplea para COMPARAR estimadores.

Si tenemos dos estimadores 1 y 2 de un mismo parmetro , diremos que 1


es ms eficiente que 2 si tenemos que var( 1 )<var( 2)
Consistencia
Se dice que un estimador es consistente si se cumple que


lim P 0
n

Esta expresin indica que a medida que se incrementa el tamao muestral, la


diferencia entre el estimador y el parmetro ser menos que cualquier nmero
().
La consistencia es una propiedad asinttica.
Tanto la media muestral como la cuasivarianza son estimadores consistentes.
Nota: la varianza muestral ES un estimador consistente de la varianza
poblacional, dado que a medida que el tamao muestral se incrementa, el sesgo
disminuye y disminuye.
a, b

Intervalos de confianza para la


media
Varianza conocida.-
Si la varianza es conocida, la poblacin es normal o la muestra es
grande, podemos utilizar el estadstico Z para determinar el rango
del verdadero valor de la media, con una confianza de (1-a)100%

x Za / 2 x x Za / 2
n n
Varianza desconocida.-
Si la varianza es desconocida, el tamao de la muestra es pequeo
y la poblacin es normal, podemos utilizar el estadstico t para
determinar el rango del verdadero valor de la media, con una
confianza de (1-a)100%
S S
x ta / 2 x x ta / 2
n n
a, b

Intervalos de confianza para la


varianza
Si X1, X2, ., Xn es una muestra aleatoria de
una poblacin normal con media y varianza 2
entonces el estadstico (n-1)S2/2 tiene una
distribucin Ji-cuadrado con (n-1) g.l.
(n 1) s 2 (n 1) s 2
x2
ca2 / 2 c12a / 2
a, b

Intervalos de diferencia de medias


Varianza conocida.-
Si la varianza es conocida, la poblacin es normal o la muestra es grande,
podemos utilizar el estadstico Z para determinar el rango del verdadero valor
de la diferencia de medias, con una confianza de (1-a)100%

1 2 1 2
( x1 x2 ) Za / 2 ( ) 1 2 ( x1 x2 ) Za / 2 ( )
n1 n2 n1 n2

Varianza desconocida.-
Si la varianza es desconocida, la muestra es pequea y la poblacin es normal,
podemos utilizar el estadstico t para determinar el rango del verdadero valor de
la diferencia de medias, con una confianza de (1-a)100%

S1 S2 S1 S2
( x1 x2 ) ta / 2 ( ) 1 2 ( x1 x2 ) ta / 2 ( )
n1 n2 n1 n2
a, b

Pruebas de hiptesis
Es una declaracin acerca del valor de un parmetro poblacional. Se plantea
mediante 2 tipos:
H0: Hiptesis nula
H1: Hiptesis alternativa
La hiptesis nula plantea un determinado valor 0 para el parmetro , mientras que
la hiptesis alternativa propone cualquiera de la siguientes opciones.
Prueba bilateral: H0: =0
H1: 0 puede ser mayor o menor)
Prueba superior: H0: =0 (equivale a decir que es menor o igual)
H1: >0
Prueba inferior: H0: =0 (equivale a decir que es mayor o igual)
H1: <0
a, b

Pruebas de hiptesis
La decisin sobre cual es ms probable se realiza utilizando
informacin muestral.
Se pueden cometer 2 tipos de errores:
Error tipo I: Rechazar la hiptesis nula cuando es verdadero (a)
Error tipo II: Aceptar la hiptesis nula cuando es falsa (b)
a= P(rechazar H0 / H0 es verdadero)
b= P(aceptar H0 / H0 es falso)
RECHAZAR ACEPTAR
VERDADERO

Tipo I Correcto
FALSO

Correcto Tipo II

a y b se comportan de manera inversa, pero aumentando el tamao


de la muestra se puede reducir ambas probabilidades.
a, b

Pruebas de hiptesis para la media


Con varianza conocida
H0: =0
H1: a) 0
b >0
c) <0

Regin de rechazo de la hiptesis nula


a x 0 Za / 2 x 0 Za / 2
n n

b x 0 Za
n

c x 0 Za
n
a, b

Pruebas de hiptesis para la media


Con varianza desconocida
H0: =0
H1: a) 0
b >0
c) <0

Regin de rechazo de la hiptesis nula

S S
a x 0 ta / 2 x 0 ta / 2
n n
S
b x 0 ta
n
S
c x 0 ta
n
a, b

Pruebas de hiptesis para la varianza


H0: 2 = 20
H1: a) 2 20
b 2 > 20
c) 2 < 20

Regin de rechazo de la hiptesis nula

02 02
a s 2 c12a / 2 s 2 c12a / 2
(n 1) (n 1)
02
b s c
2 2
1a
(n 1)
02
c s c
2 2
1a
(n 1)
a, b

Pruebas de hiptesis para la proporcin


H0: p = p 0
H1: a) p p 0
b p > p 0
c) p < p 0

Regin de rechazo de la hiptesis nula

a pq pq
p p0 Za / 2 p p0 Za / 2
n n
b pq
p p0 Za
n
pq
c p p0 Za
n

Das könnte Ihnen auch gefallen