Beruflich Dokumente
Kultur Dokumente
1
19
Respuesta.-
Dada una variable bidimensional (X, Y), se definen las funciones de distribución
marginales de X e Y como:
F1(x) = P(X ≤ x, Y <+) y F2(y) = P(X ≤ +, Y ≤ y)
Mientras que la función de distribución condicionada de la variable aleatoria X, dado
Y = y es : F(x/y) = P(X≤x /Y=y).
Si (X,Y) es discreta:
PX x , Y y
i j
PY y j
F1(x) =
x x y y y x
UNED. ELCHE. i j j i
www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
Si (X,Y) es continua con función de densidad f(x,y): imozas@elx.uned.es
x
SEPTIEMBRE 2013. y RESERVA f ( x, y)dx
f ( x, y)dy dx ; F2(y) = f ( x, y)dx dy ; F(x/y)=
x
F1(x) =
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
f ( x, y)dx
Respuesta.-
Respuesta.-
50 Un Sea estimador
P la funciónT = T(X X2, …, Xn) esdefinida
de1, probabilidad suficienteparapara losun parámetro
sucesos de si
unla determinado
distribución
de (X , X
experimento
1 2 , …, X ) condicionada
aleatorio,
n por T = t, no depende de . E una aplicación que a cada
siendo E su espacio muestral. Sea X:www.innova.uned.es/webpages/Ilde/Web/index.htm
UNED. ELCHE.
suceso Significa,
elemental
TUTORÍA de forma
le haga
DE ESTADÍSTICA intuitiva(Código:
corresponder
EMPRESARIAL queun elnúmero
estimador
65022076) real̂yA.D.E.)
(2º GRADO utiliza
representemos por [X imozas@elx.uned.es
toda la información relevante
a] el suceso
contenida en la muestra sobre el parámetro
{xE/X(x) a}. Diremos que X es una variable aleatoria si existe la probabilidad P[Xx]puede
a estimar y que ningún otro estadístico para
proporcionar
todo número real más x. SEPTIEMBRE
información sobre dicho parámetro 2014. Reserva
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
Respuesta.-
Establece
Respuesta.- el máximo valor de la varianza del estimador ̂ de un parámetro . Si ̂ es
Si X es una variable aleatoria, se define la función de distribución F: /
insesgadoEn ycondiciones
su varianza bastante
coincide generales,
con la cota,los decimos que ̂ es
estimadores eficiente.por el método de los
obtenidos
F(x) = P[X x].
momentos son consistentes, asintóticamente normales y, en general, no son insesgados (sí lo
Si X es discreta y toma los valores {xi, i= 1, 2, 3, …, r}, se define la función de cuantía
son si se pretende estimar momentos poblacionales respecto del origen). Por tanto, en general
onodeson
probabilidad
eficientes.
Respuesta.- P(x i ) = P[X = x i ]. Se cumple que F(x) = P( x i ) .
x x
Los obtenidos
Cuando se tratapor el métodoside
de contrastar la la máxima
muestra verosimilitud
procede son consistentes,
de una población
i
normal denola son
que en
se
general Si X es continua
insesgados, pero y
desconocen la media y la varianza. f:
entonces es
son la función de densidad,
asintóticamente se
insesgados. cumple
Son que P[aXb]
asintóticamente =
b x
eficientes y asintóticamente normales.
= f ( x )dx y F(x) = f ( t )dt
a
Respuesta.-
Para un nivel de significación fijo, al aumentar el tamaño muestral disminuye el error
II, = P[Aceptar H0/H0 falsa], por tanto, aumenta la potencia del contraste 1 – =
de tipoRespuesta.-
= P[Rechazar H0/H0 falsa].
Una variable Si representamos
aleatoria X de Poisson de la curva
parámetro es una
de potencia paravariable
dos tamaños muestrales,
aleatoria discreta
p. ej. n = 25 y n = 100, se obtienen curvas del tipo: x
que toma los valores {0, 1, 2, 3, 4, .....} y tal que P(X x ) e mientras que una variable
x!
(n,p) –1/3–
1 Junio 2013. 1ª semana
aleatoria X Binomial de parámetros es unan=100
variable aleatoria discreta que toma los
n n=25
valores {1, 2, 3, ..., n} y tal que P(X x ) 2 p x (1 p) n x
x
= 0 1
JUNIO 2015- 2ª SEMANA
Respuesta.-
En la teoría de la probabilidad, si A y B son dos sucesos aleatorios, se definía la
PA B
probabilidad del suceso B condicionado por A como P(B/A) = , P(A) > 0.
PA
Por analogía, si (X, Y) es una una variable aleatoria bidimensional discreta, la función
de distribución condicionada de la variable X, dado Y = yj es:
PX x , Y y
xi x
i j
PY y j
F(x/yj) = P(X≤x/Y=yj) =
x
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
f ( x , y)dx
F(x/y) =
SEPTIEMBRE 2015. RESERVA
f 2 ( y)
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
un estimador ̂ de un parámetro se define el error cuadrático medio como
Para
Respuesta
E ˆ UNED.
2
La función
ELCHE.
. Su utilidad deestriba
distribución
en que se de una variable
considera que aleatoria X dese será define
www.innova.uned.es/webpages/Ilde/Web/index.htm
el mejor estimador aqueligual,
que
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO
independientemente de que la variable sea discreta o continua: F(x) = P(X ≤ x). Ahora bien, la A.D.E.) imozas@elx.uned.es
tenga el menor error cuadrático medio entre todos los posibles estimadores de .
gráfica de F(x), en el caso de queJUNIO X sea discreta
2016- 1ªes discontinua a trozos mientras que si X es
SEMANA
continua, la gráfica es continua. Por otra parte, la probabilidad de un valor particular de la
variablePRIMERA
es cero, si la variableCUESTIONES
PARTE: es continua y puede no serlo si es discontinua.
TEÓRICO-CONCEPTUALES
Respuesta.-
Lo veremos con un ejemplo. Supongamos una variable aleatoria normal N(, ) con
conocida. Si Z es la normal N(0,1), sea z 0, 025 tal que PZ z 0, 025 0,025 .
Respuesta
Si X1, yX
desconocida
2, ..., Xn son n variables aleatorias independientes e idénticamente distribuidas,
Respuesta.- X n S n E (S n )
Para
con E(X UNED.
muestras
En i)= ELCHE.
primer y de tamaño
Var(X
lugar,i) =
el
n,2 sabemos
,
concepto ambas de que la yvariable
finitas,
función
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO
siendo
de densidad S
n =A.D.E.)
no
i 1
n ise, entonces
X
existe distribuye
para variables n imozas@elx.uned.es
www.innova.uned.es/webpages/Ilde/Web/index.htm
Ynormal N(0,1),
discretas
Var (S n )
y
sí para continuas.
segundo la probabilidad
Xlugar, 1)
JUNIO 2017- n. puede no
tiende P
luego hacia
En z 0una
, 025
distribución n N(0, z 0, 025
al0aumentar
,95 deque P1ª
X laSEMANA
variable
z 0, 025 tome unXvalor z 0, 025puntual,
, es decir
ser cero,si la variable es discreta, pero es cero sila variable esn continua. n
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
pertenece
1. ¿Quéal intervalo X
es una variable z aleatoria?
0 , 025 , X z 0.,025 con probabilidad 0,95.
Respuesta
Respuesta.- n n
Sí. Sea
Respuesta.- X una variable aleatoria de una determinada población y {X , X2, ...,x X } una
Ahora
Sea P una bien,probabilidad
si elegimos definida una muestra en unconcreta
espacio cuya muestral media y sea 1 sea
E muestral su espacio, nya no
de
muestraCuando de tamaño dispongamos n. Se de denomina
una sucesión estimador,
{X } de a cualquier
variables función
aleatorias de la muestra
independientes
lasXtal x, cada suceso de lae
f X1 , X 2 Una , que
sucesos. n
podemos
idénticamente,..., Xvariable
asegurar aleatoria
queserá
ndistribuidas,
pertenezca
una
con
es una
variable
media
aplicación
al intervalo
aleatoria,
y desviación xX:serlo
al Eztípica ,i.xque,
ambas z 0finitas. con probabilidad
forma {e E / X(e) ≤ x} pertenece a .
0 , 025 .,025
n n
Efectuada una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
0,95. Diremos
estimador entonces
para esapara que
realización tal intervalo
muestral: posee un
f(x1cuadrático coeficiente de
, x2, ..., xn).medio de un estimador. confianza de 0,95 o un nivel
2. Indique
de confianza del 95%. qué se utiliza el error
Respuesta.-
Si es un parámetro y ̂ el estimador, se define el error cuadrático medio de ̂ :
Respuesta.-
Respuesta
Si ̂ es un estimador de un parámetro ( ̂ )–1/3– se
=,Ecuando
ˆdenomina
las hipótesis
2 sesgo del estimador al valor
Junio 2015. de
2ª semana
Un contraste de hipótesis es ECM
E ̂ .
parámetro
paramétrico
desconocido de la población (como por ejemplo , , ...).
se refieren al valor de un
Desarrollando
Si es la expresión anterior, sesobreestima
obtiene quealECM( ̂ ) = Var( ̂ ) caso
+ (Sesgo( ̂ ))2 lo
Es elnosesgo paramétrico positivo
cuando el estimador
las hipótesis se refieren parámetro
a características y, en contrario,
no paramétricas
Se considera que el mejor estimador de será aquel que tenga el menor error cuadrático medio
infraestima.
(forma de la distribución, localización, aleatoriedad de una muestra...)
entre todos los posibles estimadores de y, por lo tanto, los dos sumandos en que se
descompone, sean lo mínimos posible, aunque no siempre existirá tal estimador.
PROBLEMAS
3. En la estimación por intervalos de
Respuesta.- 3 confianza, ¿qué nos asegura un nivel de confianza
dado? Se utilizan para contrastar el valor de alguna medida de localización (cuantiles).
Respuesta.-
Sea una población con una variable aleatoria X, y sea Cp el cuantil de orden p
(0 < p Si
< 1).
el Los contrastes
nivel de localización
de confianza se pueden
es 100(1) %, yformular de cualquiera
el intervalo es , ,
de las siguientes
de confianza
Estadística Empresarial
Preguntas de exámenes Tema 2: Características de
las variables aleatorias
1
3
Respuesta.-
7
Puede utilizarse para calcular los momentos de la distribución de una variable aleatoria
d r g X (t)
de acuerdo con la fórmula r =
UNED. ELCHE.
r
Tambiénwww.innova.uned.es/webpages/Ilde/Web/index.htm
(2º. GRADO puede utilizarse para hallar la
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código:dt t 0
65022076) A.D.E.) imozas@elx.uned.es
Respuesta.-
El teorema
La Cov(X, Y) de Moivre establece que si Xpodría
= E[(XE(X))(YE(Y))] es unaconsiderarse
variable aleatoria
como una binomial
medida B(n,de p),
la
fuerza
11
de la relación lineal entre X np
X e Y. También el coeficiente de correlación lineal
entonces la variable aleatoria es asintóticamente normal N(0, 1), es decir, cuanto
Cov(X, Y)
XY UNED. ELCHE. . Pero lanp (1 p) es una magnitud cuya unidad es el producto de las
covarianza www.innova.uned.es/webpages/Ilde/Web/index.htm
Var (X
TUTORÍA DE)·
ESTADÍSTICA X np
Var (Y) EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
mayor sea n, más se aproxima la variable
unidades en que se expresan X e Y, mientrasnpque el a una normal N(0, 1). Suele
coeficiente de correlación lineal considerarse
carece de
(1 p )
unidades y permite comparar laSEPTIEMBRE fuerza de la2012 relación lineal de dos poblaciones
1 1
bidimensionales,
buena aproximación np >no5 permite
cosasique y p ≤ la covarianza.
o bien si n(1–p) > 5 y p >
PRIMERA PARTE: CUESTIONES 2 TEÓRICO-CONCEPTUALES 2
Respuesta.-
Respuesta.-
estimador lâ nvariable
Respuesta.- parámetroX , Xa
15 Un Consideremos de un aleatoria y sea obtenido
Y = de una muestra
, donde a y de
b sontamaño n, es
constantes,
Una variable aleatoria X sigue una distribución uniforme
consistente endeprobabilidad
UNED. ELCHE.
probabilidad si >a 0,
que X pertenezca X a Var (2º
un se cumple quedelim
subintervalo b
n d
na A.D.E.)
longitud es
en un intervalo
proporcional
1. a
[a,
d.
b], si la
P ˆwww.innova.uned.es/webpages/Ilde/Web/index.htm
XGRADO Var (X)
b 0. SeTUTORÍA
tieneDE que
ESTADÍSTICA
Var(Y)EMPRESARIAL
= Var (Código: 65022076) . Así pues, la varianza no se
imozas@elx.uned.es
También se dice que
Si es discreta, su función ̂ es b
consistente en b 2
media b
cuadrática
21
si lim E
de probabilidad es P(Xi) = , i =n 1, 2, 3,n ...n y cero en el
ˆ
2
0 .
n
ve afectada por el cambio de origen SEPTIEMBRE pero sí se 2012.
ve afectada RESERVA n
el cambio de escala de forma que si
resto. En ambos casos significa que, a mayor tamaño de2 la muestra, más se asemeja el
una variable se divide por b, su varianza se ve dividida por b .
estimadorPRIMERA(en probabilidad
PARTE:o CUESTIONES
en media cuadrática) al parámetro.
TEÓRICO-CONCEPTUALES
1
, axb
Si es continua, su función de densidad es f(x) = b a
Respuesta.-
Respuesta.- 0, resto
Se
Sea utiliza
X una para contrastar
variable aleatoria si de
dosuna poblaciones
determinada diferentes
población X ye {XY con funciones de
1, X2, ..., Xn} una
El coeficiente
distribución F(x) y de variación
F(y), de las que desePearson
han CV = sendas
obtenido es una medidaaleatorias
muestras de dispersión que puede
independientes,
muestra de tamaño n. Se denomina estimador, a cualquier función de la muestra
f X1 , Xla
tienen misma
2 ,...,
Respuesta.-
utilizarse para distribución,
X ncomparar
, que serálauna esvariable
decir, F(z)
dispersión de
= G(z)al. serlo las X .
aleatoria,
dos distribuciones dei probabilidad. Si X e Y son dos
Si el tamaño de laX muestra
Efectuada una Y
realización muestral {x ,
permanece1 fijo, x , ...,
2 entonces x n}, una estimaciónlasería
si disminuye el valor del
probabilidad de
variables
estimador
error de tipo aleatorias
para y
esa realización
I, aumenta la , diremos
muestral:de
probabilidad que
f(xerrorla
1, x2,de
dispersión
...,tipo
xn). II. de X es menor que la de Y.
X Y
Si el tamaño de la muestra aumenta, entonces, para un nivel de significación fijo, la
También nos puede indicar si la media es suficientemente representativa de la
probabilidad de error de tipo II disminuye
población. Si CV > 1, consideramos que la dispersión es grande y por tanto no representa
bien a laRespuesta.-
población.
Con un nivel de confianza dado, al aumentar el tamaño de la muestra, disminuye la
amplitud del intervalo de confianza-.
Respuesta.-
Respuesta.-
Es un contraste de comparación de más de dos poblaciones. La hipótesis nula es que
E ˆ1ªsemana
2
todas lasEl distribuciones
error cuadrático sonmedio
iguales y la hipótesis
(ECM) de un alternativâ que,
estimador de un menos dos,son
al parámetro es diferentes. .
Respuesta.- –1/2– Junio 2012.
Un estimador será mejor
Para contrastar cuanto
el valor demenor sea su de
las medidas ECM. posición, como los cuantiles.
ˆ
Si se desarrolla, E E PROBLEMAS
2
2 E E ˆ = Var( ̂ ) + Sesgo2( ̂ ), luego
ˆ ˆ 2 2
tendrá menor ECM aquel estimador cuya varianza y cuyo sesgo sean menores.
JUNIO 2013- 2ª SEMANA
28
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Respuesta.-
La tipificación convierte a laSEPTIEMBRE 2013en otra de media cero y desviación
variable aleatoria
típica 1 lo cual permite compararla con otras variables tipificadas.
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
Respuesta.-
Dada una variable aleatoria en una determinada población, parámetro es cualquier
Consideremos
constante poblacional la variable
referida a laXvariable
sobre la que efectuamos
aleatoria, como por un cambio
ejemplo de origen
cualquier y escala,
momento.
36
Seleccionado ahora X (X1, X2, ...,XY n) la avariable
X
obteniéndose la variable
UNED. ELCHE. Y un tamaño
= aX muestral CV
+ b. Entonces n y siendo
X = en muestral,
ywww.innova.uned.es/webpages/Ilde/Web/index.htm
CVY = donde se
se denomina estadístico a cualquier función de las variables
X
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) X 1 , X 2 , ...,
Y X n,a
como
X b por ejemplo
imozas@elx.uned.es
observa que si a>0 y b = 0, CVX = CVY y, en cualquier otro caso, CVX CVY.
la media muestral. Es por tanto una variable aleatoria.
Conclusión: el coeficiente JUNIO 2014-no1ªseSEMANA
de variación ve afectado por cambios escala (positivos)
y sí se ve afectado por cambios de origen.
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
45
Respuesta.-
Respuesta.-
UNED. ELCHE.
Si
Es
La (X 1,DE
aquellaXESTADÍSTICA
varianza
TUTORÍA
2, parte
...,esXuna )EMPRESARIAL
nde es
la una
medida muestra
estadística aleatoria
cuyo
de dispersión
(Código: desimple
objetivo
65022076) (2º
dewww.innova.uned.es/webpages/Ilde/Web/index.htm
laesvariable
GRADO obtener
A.D.E.)
tamaño n, usaremos
información
aleatoria. sobre
Su raíz el estadístico
el valor de
cuadrada, la
imozas@elx.uned.es
X
algún parámetro
desviación típica, poblacional,
se expresacomo como
en las por ejemplo la media o la varianza, o sobre la forma de la
n que se distribuye unamismas
t-Studentunidades
con n–1 que la variable
grados y, dividida por la media,
de libertad.
distribución
S de la variable aleatoria, SEPTIEMBRE
como por ejemplo 2014 la función
proporciona el coeficiente de variación de Pearson que es una medida relativa de la dispersión. de densidad o de cuantía.
PRIMERA PARTE:
Esta determinación se hace a CUESTIONES TEÓRICO-CONCEPTUALES
partir de la información contenida en una muestra aleatoria.
1.- Explicar cómo sería la covarianza en los siguientes casos:
Respuesta.-
Es un contraste de localización de la mediana. Las hipótesis son:
Respuesta
H0: Me = m
Respuesta.-
Un parámetro es una cantidad constante que representa alguna característica de la
un Me m
H1:parámetro y , del
Sea Por
población. ejemplo, losdesconocido
momentos respecto un intervalo
origen E(X) = , E(X2),alE(X
de confianza nivel
3 100(1–)%.
) ....o respecto
de la media E[X–], E[(X–) ], E[(X–) ].....Son notables E(X) = , media poblacional y
Supongamos que se desea 2 contrastar3 la hipótesis:
H0: poblacional.
= 0 PROBLEMAS
E[(X–)2] = 2, varianza
Dada una muestra H1: {X 10, X2, ..., Xn}, se denomina estadístico a cualquier función de las
con un nivel de significación . Entonces se rechazará H0 si y sólo
variables X1, X2, ..., Xn. Son notables la media muestral X 1
X siX2 ...
,
Xn
y la varianza
n
n
Respuesta.-
muestral S2
1
Es un contraste
Xi X
2
3
Respuesta.-
Un estimador ̂ de un parámetro es insesgado si E( ̂ ) = .
SEPTIEMBRE 2015
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
La covarianza es un momento bidimensional y como tal es una magnitud cuya unidad es
el producto de las unidades de las variables, mientras que el coeficiente de correlación, que
resulta UNED.
de estandarizar
ELCHE. la covarianza dividiéndola por el producto de las desviaciones típicas de
www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE
las variables, es,ESTADÍSTICA
como suEMPRESARIAL
nombre (Código:
indica,65022076) (2º GRADO A.D.E.)
un coeficiente y carece de unidades. Aunque ambas
imozas@elx.uned.es
miden la fuerza de la relación lineal de las variables, la covarianza no puede usarse para
JUNIO 2016- 2ª SEMANA
comparar la relación lineal de dos distribuciones bidimensionales distintas pues depende de las
unidades en que se expresen.
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
Respuesta.-
Consideremos una muestra aleatoria {x1, ..., xn} de tamaño n de una población con
En una distribución bidimensional de variables (X, Y), la covarianza es el momento
función de distribución F(x). Se define la función de distribución empírica como
11= Cov(X,Y) = E[(X-E(X))(YE(Y)] y es una medida de la fuerza de la relación lineal
N( x )
entre
Fn(x) X= e Y. , donde N(x) es el número de valores de la muestra, menores o iguales que x.
n
El coeficiente de correlación lineal resulta de estandarizar la covarianza, dividiéndola
Cov (X, Y)
por el UNED. ELCHE. de las desviaciones típicas de las variables:
producto XY
www.innova.uned.es/webpages/Ilde/Web/index.htm
, por lo
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
Respuesta.- Var (X(·Varimozas@elx.uned.es
(Y)
Es ladeprobabilidad
que carece de rechazar
magnitud. Proporciona unala medida
SEPTIEMBRE hipótesisnumérica
nula H0del
2016 . Sigrado
representamos
en que las por la
variables
probabilidad
están del error
relacionadas
PRIMERA de tipoCUESTIONES
linealmente.
PARTE: I, es decir la probabilidad de rechazar H0, siendo cierta y por la
TEÓRICO-CONCEPTUALES
probabilidad del error de tipo II, es decir, la probabilidad de aceptar H0, siendo falsa, entonces
, si H 0 cierta
del contraste es la función P =
Respuesta.-
la potencia
1 , si H 0 falsa
error cuadrático medio (ECM) de un estimador ̂ de un parámetro es E ˆ .
2
Respuesta.-
El
Si XELCHE.
UNED. esserá
unamejor
variable aleatoria
menor con ECM. y http://www.innova.uned.es/webpages/Ilde/Web/index.htm
media desviación típica , se llama variable
Un estimador cuanto sea su
Respuesta.-X
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)2 imozas@elx.uned.es
E ˆdice E ˆ que
E ˆ hemos
E ˆaplicado
2 2
Si se
tipificada a Ydesarrolla,
= . Se entonces =a Var( ̂ ) + Sesgo
la variable ̂ ), luego
X un2(cambio de
Supongamos dos muestrasJUNIO de dos poblaciones
2017- 2ª ySEMANAindependientes con distribuciones F(x) y
tendrá
F(y). Elmenor ECM
contraste aquel estimador cuya varianza cuyo sesgo sean menores.
origen y de escala dedeformala mediana
que E(Y) nos
= 0llevará
y DT(Y) a aceptar
=1 que las distribuciones son iguales
siemprePRIMERA
y cuando las medianas sean iguales. Es
PARTE: CUESTIONES TEÓRICO-CONCEPTUALES básicamente un contraste de igualdad de las
medianas de dos poblaciones independientes.
Respuesta.-
Respuesta.-
PROBLEMAS
Sea X
Sea , una
elvariable
El coeficiente intervalo
de
aleatoria cuya distribución
variacióndedeconfianza
Pearson CV para depende de alunnivel
una medida de
= unesparámetro
parámetro
de que
dispersión
. Sea
confianza
puede
P de = 1 . (si X es discreta) o de densidad (si X es continua)
{X1, X2, ..., Xn} una muestra aleatoria simple y representemos por
100(1)%,
L(x es)decir probabilidad
1, x2, ...,x
utilizarse para n, comparar
la función la dispersión
de la Supongamos
muestra, a laahora que que se deseade
llamaremos
dos distribuciones
efectuar
función eldecontraste de probabilidad. Si X e Y son dos
bilateral:
verosimilitud El método de la máxima
variables
verosimilitudaleatorias Hy0: en
consiste
X= Y
0elegir
, diremos
como que de de
la dispersión
estimador el Xvalor
es menor* queque maximiza
la de Y.
H :
X 0 Y
L(x1, x2, ...,xn, ) y al que denominaremos estimador de máxima verosimilitud del parámetro .
1
con un También nos puede indicar
nivel de significación . Entonces región dees
si lalamedia suficientemente
aceptación representativa
es el intervalo de la
de confianza.
población. Si CV > 1, consideramos que la dispersión es grande y por tanto no representa
bien a la población.
Solución.-
Respuesta.-
La variable X =” nº de prendas defectuosas de la muestra” se distribuye como una
Respuesta.-
binomialEn un
B(30;
Supongamoscontraste,
0,01),una sevariable
Luego: llama nivel de significación
aleatoria para la que el tamaño de que
se supone la región crítica o de
su distribución,
rechazo, es decir,
Respuesta.-
desconocida, el valor máximo de P(rechazar H /H es cierta)
se ajusta a un determinado modelo. 0Un0 contraste de bondad de ajuste permite
decidir, partiendo variable
Dada una de una muestra,aleatoriasien una determinada
la variable población,
se distribuye o no deparámetro
acuerdo con es elcualquier
modelo
constante poblacional
especificado.
Respuesta.- referida a la variable aleatoria, como por ejemplo cualquier momento.
–1/3– Septiembre 2015.
Seleccionado
Supongamos
El planteamiento ahora
dos un tamaño
muestras
general muestral
de dos
sería: n y siendo
poblaciones (X1, X2, ...,con
independientes Xn) distribuciones
la variable muestral,
F(x) y
se denomina
F(y). El Laestadístico
H0:contraste
muestra laa mediana
de aleatoriacualquier función
nos
procede depoblación
llevará
de una las variables
a aceptar Xfunción
que
con 1,las
X2,distribuciones
...,
deXdistribución
n, como por ejemplo
sonF(x)iguales
la media
siempre H1ymuestral.
cuando
: La Es por
las
muestra tanto una
medianas
aleatoria no variable
sean
procede dealeatoria.
iguales. Es básicamente
una población con unfunción
contraste de igualdad F(x)
de distribución de las
medianas de dos poblaciones independientes.
4
Respuesta.-
PROBLEMAS
Los factores son el coeficiente de confianza 1 y la amplitud del intervalo. Para un
coeficiente de confianza fijo, cuanto menor –1/3–
sea la amplitud del intervalo, másJunio
precisa será
2016. 2ª la
semana
estimación, o bien para una misma amplitud del intervalo, cuanto mayor sea el coeficiente de
SEPTIEMBRE 2017
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
Sea (X,Y) una variable aleatoria bidimensional tal que Var(X) y Var(Y) existen y son
Cov (X, Y)
distintas de cero. Se define el coeficiente de correlación: XY .Su valor
Var (X)·Var (Y)
está comprendido entre 1 y +1 y tiene sentido su cálculo cuando se desea medir la fuerza de
la relación lineal entre las variables aleatorias
Respuesta.-
Un estimador ̂ de un parámetro es insesgado si E( ̂ ) = .
Respuesta.-
Sea , el intervalo de confianza para un parámetro al nivel de confianza
100(1)%, es decir P = 1 .
Supongamos ahora que se desea efectuar el contraste bilateral:
H0: = 0
H1: 0
con un nivel de significación . Entonces la región de aceptación es el intervalo de confianza.
Respuesta.-
Las rachas se utilizan para contrastar la aleatoriedad de una muestra y ello porque el
número de rachas de la muestra puede usarse como estadístico para el análisis de la
aleatoriedad (por ejemplo, un número pequeño o un número grande de rachas indicará que
debemos rechazar la hipótesis de que la muestra es aleatoria)
–1/2– Septiembre 2017.
5
Estadística Empresarial Tema 3: Algunos modelos
Preguntas de exámenes de probabilidad de tipo
discreto
1
Tema 3:424Algunos modelos de probabilidad de tipo discreto
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
UNED. ELCHE.
TUTORÍA www.innova.uned.es/webpages/Ilde/Web/index.htm
DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
PROBLEMAS
JUNIO 2013- 2ª SEMANA
7
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Respuesta.-
La tipificación convierte aJUNIO 2012- aleatoria
la variable 2ª SEMANA en otra de media cero y desviación
típica 1 lo cual permite compararla con otras variables tipificadas.
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
La Cov(X,
Dada Y) = E[(XE(X))(YE(Y))]
una variable podría considerarse
aleatoria en una determinada población, como una medida
parámetro de la
es cualquier
fuerza Solución.-
depoblacional
constante la relaciónreferida
lineal aentre X e Y.
la variable También
aleatoria, comoel por
coeficiente
ejemplo cualquier de correlación lineal
momento.
Cov ( X
Seleccionado, Y ) ahora un tamaño muestral n y siendo (X , X , ..., X ) la variable muestral,
El número X de seguros decovarianza
. Pero la tipo A vendidos
es unaesmagnitud
binomial
1 B(15;
cuya 2 0,3).
unidad n Se tendrá:
es el producto de las
seXYdenomina
a)Var estadístico
P(X=7) = 0,0811
(X)·Var (Y) a cualquier función de las variables X 1 , X 2 , ..., Xn, como por ejemplo
la media P(Xque
≤ 5)
se=expresan
b) muestral.
unidades en
Es0,7216
por tanto una variable aleatoria.
X e Y, mientras que el coeficiente de correlación lineal carece de
unidades y permite P[X 4] la0,5155
comparar
c) P[X≤4/X≤6] = fuerza 0,de
5933la relación lineal de dos poblaciones
bidimensionales, cosa queP[no X 6] 0,la
permite 8686
covarianza.
Respuesta.-
Si (X1, X2, ..., Xn) es una muestra aleatoria simple de tamaño n, usaremos el estadístico
X
Respuesta.-
n que
Una se distribuye
variable como
aleatoria una t-Student
X sigue con n–1 grados
una distribución de libertad.
uniforme en un intervalo [a, b], si la
S
probabilidad de que X pertenezca a un subintervalo de longitud d es proporcional a d.
1
Si es discreta, su función de probabilidad es P(Xi) = , i = 1, 2, 3, ...n y cero en el
Respuesta.- n
resto. Es un contraste de localización de la mediana. Las hipótesis son:
H0: Me = m
1
H1: Me m , axb
Si es continua, su función de densidad es f(x) = b a
Solución.- PROBLEMAS 0, resto
El contraste es:
H0: Me ≤150
Respuesta.- H1: Me > 150
Si el tamaño de la muestra permanece fijo, entonces si disminuye la probabilidad 1de
Para un nivel de significación del 5% encontramos en la tabla de la binomial B 10,
error de tipo I, aumenta la probabilidad de error de tipo II. 2
que P(XSi >el 7)
tamaño
= 1 –de0,9453
la muestra aumenta,
= 0,0547. entonces,
Puesto que elpara un nivel
número de significación
de precios fijo,que
de la muestra la
Solución.-
probabilidad de error de tipo II disminuye
superan 150 es de 6, no podemos rechazar la hipótesis nula y, en conclusión, no podemos
afirmara)que
SealaXvivienda
el númeroseademás
impagos
cara decuatrimestrales,
lo que se cree. que seguirá una distribución de Poisson
de media 2. Luego P(X = 0) = (tablas) = 0,1353.
b) Sea Y el número de impagos anuales. P(Y > 9) = 1 – P(Y ≤ 9) = (tablas) =
Respuesta.-
= 1 – 0,7166 =0,2834
Es un contraste de comparación de más de dos poblaciones. La hipótesis nula es que
todas las distribuciones son iguales y la hipótesis alternativa que, al menos dos, son diferentes.
2 –2/2–
Junio 2012. 1ª semana
–1/2– Junio 2013. 2ª semana
=
f (x)dx
a
y F(x) =
f (t)dt
Respuesta.-
54
Una variable aleatoria X de Poisson de parámetro es una variable aleatoria discreta
x
UNED.
que toma valores {0, 1, 2, 3, 4, .....} y tal que P(X x )www.innova.uned.es/webpages/Ilde/Web/index.htm
losELCHE. e mientras que una variable
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) x! imozas@elx.uned.es
aleatoria X Binomial de parámetros (n,p) es una variable aleatoria discreta que toma los
JUNIO 2015- 1ª SEMANA
n x
valores {1, 2, 3, ..., n} y tal que P(X x ) p (1 p) n x
PRIMERA PARTE: CUESTIONES xTEÓRICO-CONCEPTUALES
Respuesta.-
dos estimadores insesgados ̂1 y ̂ 2 del parámetro , se define la eficiencia
Respuesta.-
Dados
Si X es binomial B(n, p) con n > 30
relativa de ̂1 a ̂ 2 como el cociente
Var
ˆ 1
y p ≤ 0,1, podemos considerar que X se distribuye
cocientees
aproximadamente como una variable de Poisson . Sideeste
parámetro = menor,
np. igual o mayor que 1,
Esto significa que si aumentamos Var ˆ
indefinidamente un número n de pruebas de Bernoulli
55 2
Respuesta.-
Sí. Si se conoce la distribución de la población, puede usarse el método pivotal o el
Solución.-
método general de Neyman. Si no se conoce–1/2–
Septiembre 2014. Reserva
la distribución puede utilizarse en
muchos 0,3casos
a) El número
la desigualdad de envíos perdidos se distribuye como una binomial B10000 ,
de Chebychev. y
5000
puesto que n > 30 y p < 0,1 podemos aproximar por una Poisson de
0,3 0,6 0 0,6
= 10000 · = 0,6. Luego la probabilidad de que no haya ningún envío perdido es e
5000
Respuesta.- 0!
0,5488
Para verificar si una muestra aleatoria procede de una población con una cierta
,6 0 0, 6 0,61 Si0es
distribución de0probabilidad. 0,6 2y {S
así, i}, i=1, 2..k es una partición del dominio de la
b) Será e e ,k6 e 0,26 0,9769
O2i ! E i se distribuye según una distribución 2 con k1
0! 1!
variable aleatoria, eln estadístico
4999 ,7 i 1
Ei
c) = 0,4066. Tomando logaritmos y despejando se obtiene n 14998
grados de libertad,
5000 donde Oi y Ei son el número de valores observados y esperados,
respectivamente, en0,3el subconjunto Si.
d) 14998 · 0,9
5000
Respuesta.-
Sea X una variable aleatoria cuya distribución depende de un parámetro . Sea
{X1, X2, ..., Xn} una muestra aleatoria simple y representemos por
L(x1, x2, ...,xn, ) la función de probabilidad (si X es discreta) o de densidad (si X es continua)
65
de la Solución.-
muestra, a la que llamaremos función de verosimilitud El método de la máxima
La variable X =” nº de prendas defectuosas de la muestra” se distribuye como una
UNED.
verosimilitud ELCHE. el valor * que maximiza
consiste en elegir como estimador de www.innova.uned.es/webpages/Ilde/Web/index.htm
binomial B(30; 0,01), Luego:
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
L(x1, x2, ...,xn, ) y al que denominaremos estimador de máxima verosimilitud del parámetro .
30
a) P(X = 0) = 0,010 ·0,99 30 0,7397
0 –1/3– Septiembre 2015.
Respuesta.- 30 30 30
b) P(X
En > 3) = 1 se
un contraste, P(X = 1 de
≤ 3)nivel
llama significación
0,010 ·0,99 30el
tamaño
0,01
1
·0de 29
,99la 0,crítica
región 012 ·0,99o28de
0
rechazo, es decir, el valor máximo de P(rechazar H0/H0 es cierta) 1 2
30
0,013 ·0,99 27 = (calculadora) 0,000223.
3 Respuesta.-
c) X es ahora dos
Supongamos binomial
muestrasB(100; 0,01)
de dos que es aproximadamente
poblaciones independientesde conPoisson P(1), luego:
distribuciones F(x) y
P(X <El
F(y). 4) = P (X ≤ 3)de= la
contraste 0.981
mediana
(tablas) nos llevará a aceptar que las distribuciones son iguales
siempred)yEn cuando las medianas
los apartados a) y sean iguales.
b) hemos Es básicamente
utilizado directamente un contraste
la binomial de igualdad
por que de no las
se
medianas de dos poblaciones
puede aproximar independientes.
por una de Poisson ni por una normal, ya que ni n > 30 ni np > 5; nq es > 5
pero p no es > ½. En el apartado c) ya se ha podido aproximar por una de Poisson pues n > 30
y p < 0,1.
PROBLEMAS
Plantearemos el contraste:
H0: = 15
H1: 15
Podemos considerar que n = 20 es suficientemente grande de forma que, bajo la
hipótesis nula, la media muestral X es aproximadamente normal N15, . Puesto que
20
desconocemos (desviación típica poblacional), tomaremos como una estimación la
desviación típica de la muestra, de forma que supondremos que X es aproximadamente
6
normal N15, N(15; 1,34).
20
a) El intervalo del 95% de confianza4 para la N(0,1) centrado en el origen es (tablas)
17 15
[1,96; 1,96]. Como 1,49 pertenece a dicho intervalo, podemos afirmar, con el 95%
1,34
de confianza, que los desarrolladores están en lo cierto.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Solución.-
Solución.-
El tamaño muestral para estimar la media de una población normal con conocida es
2
2
n = 4z 2 ,
2 L
De las tablas obtenemos que P[1,96 < Z < 1,96] = 0,95, luego z 1,96 . Además
2
5
Estadística Empresarial Tema 4: Algunos modelos
Preguntas de exámenes de probabilidad de tipo
continuo
1
Respuesta.-
Puede utilizarse para calcular los momentos de la distribución de una variable aleatoria
7
d r g X (t)
dt r t 0
de acuerdo
Tema 4: Algunos con la fórmula = . También puedecontinuo
utilizarse para hallar la
UNED. ELCHE. modelos de probabilidad de www.innova.uned.es/webpages/Ilde/Web/index.htm
tipo
r
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
distribución de una función de variables aleatorias: por ejemplo, se puede demostrar mediante
la función generatriz de momentos JUNIO que2012-si X2ª 1 ySEMANA
X2 son binomiales B(n1, p) y B(n2, p)
respectivamente, su suma X1+X2 es binomial B(n1+n2, p).
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
Respuesta.-
El teorema de Moivre establece que si X es una variable aleatoria binomial B(n, p),
La Cov(X, Y) = E[(XE(X))(YE(Y))] podría considerarse como una medida de la
X np
entonces
fuerza dela lavariable
relaciónaleatoria
lineal entre X e es Y.asintóticamente normal N(0,
También el coeficiente de 1), es decir, cuanto
correlación lineal
Cov(X, Y) np (1 p )
XY . Pero la covarianza Xesuna
np magnitud cuya unidad es el producto de las
Varn,(X
mayor sea )·Var
más se (aproxima
Y) la variable a una normal N(0, 1). Suele considerarse
unidades en que se expresan X e Y, mientrasnpque (1 el
p)coeficiente de correlación lineal carece de
unidades y permite comparar la 1 fuerza de la relación 1lineal de dos poblaciones
buena aproximación si np > 5 y p ≤ o bien si n(1–p) > 5 y p >
bidimensionales, cosa que no permite 2 la covarianza. 2
Respuesta.-
Un estimador ̂ n de un parámetro , obtenido de una muestra de tamaño n, es
Respuesta.-
Una en
consistente variable aleatoria
probabilidad si
X sigue
> 0, seuna distribución
cumple P ˆ n en un
que lim uniforme 1 .intervalo [a, b], si la
n
probabilidad de que X pertenezca a un subintervalo de longitud d es proporcional a2 d.
También se dice que ̂ n es consistente en media cuadrática 1 si lim E ˆ n 0 .
n
Si es discreta, su función de probabilidad es P(Xi) = , i = 1, 2, 3, ...n y cero en el
8 En ambos casos significa que, a mayor tamaño de lan muestra, más se asemeja el
resto.
estimador (en probabilidad o en media cuadrática) al parámetro.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADOA.D.E.)
1
, axb imozas@elx.uned.es
Si es continua, su función de densidad es f(x) = b a
Respuesta.-
Se utiliza para contrastar si dos poblaciones diferentes
PROBLEMAS
0, resto X e Y con funciones de
distribución F(x) y F(y), de las que se han obtenido sendas muestras aleatorias independientes,
tienen la misma distribución, es decir, F(z) = G(z) .
Respuesta.-
Si el tamaño de la muestra permanece fijo, entonces si disminuye la probabilidad de
error de tipo I, aumenta la probabilidad de error de tipo II.
Si el tamaño de la muestra aumenta, entonces, para un nivel de significación fijo, la
probabilidad de error de tipo II disminuye
Solución.-
1.- Sea
Respuesta.-Xi la variable aleatoria “nº de turismos matriculados el día i-ésimo”,
i = 1, 2,
Es…,un 250. Podemos
contraste considerar que
de comparación las variables
de más Xi son independientes.
de dos poblaciones. La hipótesisLuego,
nula es porqueel
250
X =–1/2–alternativa
todas las central
distribuciones son iguales y la hipótesis que, al menos Junio 2012. 1ª
dos, son diferentes.semana
teorema del límite, la variable X se distribuye aproximadamente
i normal
i 1
N 250·2190 , 250·90000 N(547500, 4743,4).
365
2.- La variable Y = X
i 1
i se distribuye aproximadamente normal
N 365·2190 , 365·90000 N(799350; 5731,49), luego P(Y ≤ 800000) = (tipificando) =
650
= P Z P(Z ≤ 0,1134) = (tablas) = 0,5451.
5731,49
2
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
PROBLEMAS
Solución.-
X 7,3 5 7,3
a) P[X < 5] = P = P[Z < – 1,53] = (tablas) = 0,0630, que
1,5 1,5
corresponde a un porcentaje del 6,3 %.
X 7,3 x 7,3 x 7,3
b) 0,1 = P[X < x]= P . De las tablas se obtiene que 1,28 ,
20
1,5 1,5 1,5
de donde x = 5,28.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
c) Obviamente, el 50% ya que la distribución es normal
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
y por tanto simétrica respecto
imozas@elx.uned.es
de la media.
PROBLEMAS
Solución.-
El número X de asistentes diarios al museo se distribuye según una Poison de = 120
que podemos aproximar por una normal N 120, 120 , luego:
Solución.- 100 120
a) P(X < 100) P Z P(Z < –1,83) = (tablas) = 0,0336. Luego el
El contraste solicitado
sería: 120
0:
porcentaje pedido esHdel = 59800
3,36%.
H1: 59800 150 120 200 120
b) P(150 < X 200) P
X <59800 Z P(2,74 < Z < 7,3) = (tablas) =
La variable 20 se 120
distribuye como120
una t-Student con 19 grados de libertad.
= 1 – 0,9969 = 0,0031.20030
Para un nivel de significación del 5%, el intervalo de aceptación sería 30
c) Si Xi es el número de asistentes el día i-ésimo, entonces Y = X i se distribuye
i 1
X 59800
–2,093 < 20 < 2,093 ↔ 50426 < X < 69174 4000 3600
como una Poisson de = 120·30 20030 = 3600, luego: P(Y ≥ 4000) = P Z
Puesto que la media muestral obtenida se encuentra dentro de este intervalo, no
3600
P(Z ≥ 6,67)
podemos = 0. al nivel de significación pedido, que las ventas medias sean mayores o
admitir,
Se ha considerado que eldel
menores que las ventas medias número
sector.de asistentes diarios al museo se distribuye según una
distribución de Poisson ya que se trata de un número de sucesos que ocurre de forma
independiente durante un intervalo de tiempo. Puesto que > 10, para los cálculos se ha
aproximado por una normal.
Podría haberse efectuado una corrección –2/2– por continuidad pero losSeptiembre 2012 Reserva
resultados son
prácticamente los mismos.
3
H1: Me m
PROBLEMAS
Solución.-
a) Sea X el número de impagos cuatrimestrales, que seguirá una distribución de Poisson
29
de media 2. Luego P(X = 0) = (tablas) = 0,1353.
UNED.
b) SeaELCHE. 9) = 1 – P(Y ≤ 9) = (tablas) =
Y el número de impagos anuales. P(Y > www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
= 1 – 0,7166 =0,2834 imozas@elx.uned.es
PROBLEMAS
Solución.-
El número X de personas que compran un día cualquiera, será una variable binomial
B(300; 0,3) que se distribuye aproximadamente normal N 300·0,3, 300·0,3·0,7 N 90, 63 .
Así pues:
100 90
a) P(X > 100) = P Z P(Z>1,26) = 1 – 0,8962 = 0,1038
63
50 90
b) P(X <50) = P Z P(Z < −5,04) = 0
63
50 90 150 90
c) P(50 < X < 150) = P Z P(−5,04 < Z < 7,56) = 1
63 63
Solución.-
Sea la venta media de nuestra compañía. Efectuaremos el contraste:
H0: = 90000
H1: 90000
X 90000
La variable 50 se distribuye como una t-Student con 49 grados de libertad.
15000
Para un nivel de significación del 5%, el intervalo de aceptación de H0 sería
4
X 90000
–2,009 < 50 < 2,009 ↔ 85737< X < 94263
15000
Puesto que la media muestral obtenida no se encuentra dentro de este intervalo,
debemos rechazar la hipótesis nula, es decir, hemos de admitir que las ventas medias de
PROBLEMAS
Solución.-
a) La variable X = “número de impagos en 300 préstamos” es binomial B(300; 0,094)
N 300·0,094; 300·0,094·0,906 N(28,2; 5,055). Luego:
P(X = 20) = (corrección por continuidad) = P(19,5 ≤ X ≤ 20,5) = (tipificando) =
19,5 28,2 20,5 28,2
= P Z = P(1,72 ≤ Z ≤ 1,52) = (tablas) = 0,0216
5,055 5,055
37 b) La variable X = “número de impagos en 60 préstamos” será binomial B(60; 0,094),
luego P(X = 0) = 0,90660 0,0027.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
c) En el
TUTORÍA DE apartado
ESTADÍSTICA a) se ha aproximado
EMPRESARIAL la binomial
(Código: 65022076) por la normal porque np imozas@elx.uned.es
(2º GRADO A.D.E.) = 28,2 > 5 y
p = 0,094 < ½.
PROBLEMAS
Solución.-
a) Tales intervalos tienen la forma: x z / 2
Solución.- , x z / 2 . Entonces:
n n
300
1800 1,65
distribuirá, , 1800 1,65 = [1706,66; 1893,34]
de acuerdo con el teorema central del límite, aproximadamente normal
200
200
N 300·3200 , 300·490000 N 960000 ,7000 3 N(960000;12124,36)
- Para = 0,05, de las tablas z / 2 = 1,96 , luego el intervalo es
800 800 60000 10000
1800 2.-
1,96P(900000
, 1800
< X 1<,96950000) == [1689,13
P ; 1910,87]
Z P(–4,95 < Z < –0,82)
200 200
12124 ,36 12124 ,36
800
0,2061
b) –Debe
0 = 0,2061.
ser 1,65· = 300, de donde n = 19,36 19.
n
3.- En las tablas de la normal N(0,1) encontramos que 0,98 = P(Z < 2,06), luego si x es
x 960000
el número de vehículos que buscamos se tendrá que 2,06 de donde se obtiene
–2/2– 12124 ,36 Septiembre 2013. Reserva
que x 984976
5
Respuesta.- JUNIO 2014- 2ª SEMANA
PRIMERA PARTE:
Porque deseamos CUESTIONES
construir TEÓRICO-CONCEPTUALES
un intervalo con una alta probabilidad (coeficiente de
confianza) de encontrar en él el parámetro desconocido.
Respuesta.-
Respuesta.-
Distribución
En un contraste ji-cuadrado de Pearson
de hipótesis con cierta
y supuesta n grados de libertad:
la hipótesis nula H0, se denomina p-valor
45
n
a la probabilidad
ELCHE. deXobtener un valor del estadístico de prueba que ysea al menos tan improbable
n
2 2
i , donde las variables Xi son independientes normales N(0,1)
como elUNED.
valor experimental observado. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
i 1 imozas@elx.uned.es
Distribución t de Student con n grados de libertad:
U
Respuesta.- SEPTIEMBRE 2014
t
PRIMERA , donde
PARTE: U y V son variables
CUESTIONES independientes, U normal N(0,1) y V 2n
TEÓRICO-CONCEPTUALES
Se n pretende contrastar el valor de alguna medida de posición (un cuantil como por
V cómo sería la covarianza en los siguientes
ejemplo1.-laExplicar
mediana)
n para localizar estadísticamente casos:
la distribución.
PROBLEMAS
Respuesta.-
Porque deseamos construir un intervalo con una alta probabilidad (coeficiente de
confianza) de encontrar en él el parámetro desconocido.
Respuesta.-
En un contraste de hipótesis y supuesta cierta la hipótesis nula H0, se denomina p-valor
a la probabilidad
Solución.-de obtener un valor del estadístico de prueba que sea al menos tan improbable
como elLavalor
variable X = “observado.
experimental número de clientes que compra el producto” se distribuye
aproximadamente normal N 2000·0,15; 2000·0,15·0,85 N(300 ;15,97). Luego:
Respuesta.-
a) P(X ≥ 450) = (tipificando) = P(Z ≥ 9,4) 0.
Respuesta.-
Se pretende
A) P(200
b) Existe Xcontrastar
<una el valor
< dependencia linealdeentre
400) = (tipificando) =algunalas medida
P(–6,26 < X < de
variables6,26) 1 que
deposición
forma (un cuando
cuantil xcomo crece,por y
ejemplo
42 c)la mediana)
E(X) = 300 para localizar
crece, luego la covarianza es positiva estadísticamente la distribución.
d) X se distribuye realmente binomial B(2000; 0,15)depero,
PROBLEMAS
B) Existe al que
ser np > 5 x ycrece,
p < ½y
UNED. ELCHE. una dependencia lineal entre las variables forma cuando
www.innova.uned.es/webpages/Ilde/Web/index.htm
podemos aplicar
TUTORÍA
decrece, el teorema
luegoDElaESTADÍSTICA de Moivre
varianzaEMPRESARIAL y aproximar X por
(Código: 65022076) (2º GRADO A.D.E.)
es negativa una normal, como hemos hecho.
imozas@elx.uned.es
Respuesta.-
Para muestras aleatorias de tamaño n suficientemente grandes el Teorema central del
límite Solución.-
permite considerar que la media muestral se distribuye aproximadamente de forma
normal.La variable X = “ número de clientes que compra el producto” se distribuye
aproximadamente normal N 2000·0,15; 2000·0,15·0,85 N(300 ;15,97). Luego:
a) P(X ≥ 450) = (tipificando) = P(Z ≥ 9,4) 0.
Respuesta.-
UnP(200
b) < X <̂ 400)
estimador de un= parámetro es= insesgado
(tipificando) P(–6,26 < si
X E(
< 6,26) 1
̂ ) = .
c) E(X) = 300
d) X se distribuye realmente binomial B(2000; 0,15) pero, al ser np > 5 y p < ½
podemos aplicar el teorema de Moivre y aproximar X por una normal, como hemos hecho.
Respuesta.-
Dados dos estimadores insesgados ̂1 y ̂ 2 del parámetro , se define la eficiencia
Solución.-
relativaSea
de X
̂1 ela gasto anual
̂ 2 como de una familia
Var ˆ 1 (hogar), que se distribuye normal N(27000, ). Se
tendrá:
el cociente
Var ˆ 2 . Si este cociente es menor, igual o mayor que 1,
51
Solución.-
–1/2– Septiembre 2014. Reserva
Sea Xi la variable aleatoria “ventas el día i-ésimo”, (i = 1, 2, ...., 90) de la que, por ser
10 15 25
uniforme en el intervalo [10, 15], sabemos que E(Xi) = y Var(Xi) =
2 2
15 10 2 25 . La variable X = 90 X será, por el teorema central del límite,
=
12 12 i 1
i
25 25
aproximadamente normal N 90 , 90 N(1125 ; 13,69). Luego:
2 12
Solución.-P(900 < X < 1250) = (tipificando) = P(16,43 < Z < 9,13) 1
Para la muestra dada, la media muestral es x 611,55 y la varianza muestral
11
1
s2 = x i x 2 3943,87 de donde s 62,8. Luego:
10 i 1
Solución.-
X
a) La variable n es tn1 y el intervalo de confianza tiene la forma
S
S S 7
X t ,X t . De las tablas de la t-Student con 59 grados de libertad y = 0,025
2 n 2 n 2
4000 4000
obtenemos que t = 2, luego el intervalo es 15000 ,15000
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
PROBLEMAS
Solución.-
0,3
a) El número de envíos perdidos se distribuye como una binomial B10000 , y
5000
puesto que n > 30 y p < 0,1 podemos aproximar por una Poisson de
0,3 0,6 0 0,6
= 10000 · = 0,6. Luego la probabilidad de que no haya ningún envío perdido es e
5000 0!
0,5488
0,6 0 0, 6 0,61 0, 6 0,6 2 0, 6
b) Será e e e 0,9769
0! 1! 2!
n
4999 ,7
c) = 0,4066. Tomando logaritmos y despejando se obtiene n 14998
5000
0,3
d) 14998 · 0,9
5000
Solución.-
8
La covarianza es un momento bidimensional y como tal es una magnitud cuya unidad es
el producto de las unidades de las variables, mientras que el coeficiente de correlación, que
PROBLEMAS
resulta de estandarizar la covarianza dividiéndola por el producto de las desviaciones típicas de
las variables, es, como su nombre indica, un coeficiente y carece de unidades. Aunque ambas
miden la fuerza de la relación lineal de las variables, la covarianza no puede usarse para
comparar la relación lineal de dos distribuciones bidimensionales distintas pues depende de las
unidades en que se expresen.
Respuesta.-
Consideremos una muestra aleatoria {x1, ..., xn} de tamaño n de una población con
función de distribución F(x). Se define la función de distribución empírica como
N( x )
Fn(x) = , donde N(x) es el número de valores de la muestra, menores o iguales que x.
n
Solución.-
Sea Xi la variable aleatoria “demanda del día i”, i = 1, 2, …, 100 que supondremos
Respuesta.- 100 100
Es la probabilidad
independientes.
Sea S = de Xrechazar
i . Se la
tiene hipótesis
que E(S) =
nula
probabilidad del error de tipoi 1I, es decir la probabilidad de rechazar
H0.ESi
i 1
X i representamos
= 300000 y por la
Var(S)
H0, siendo cierta y por la
=
100
probabilidad del error de tipo II, es decir, la probabilidad de aceptar H0, siendo falsa, entonces
= Var X i = 810000, de donde S = 810000
, si H 0=cierta
900. Entonces:
la potencia
i 1 del contraste es la función P =
a) de acuerdo con el teorema central 1 ,del
si H 0 falsa
límite, S se distribuye aproximadamente
normal N(300000, 900);
Respuesta.- 2000
b) P(S > 298000) = (tipificando) = P Z = p(Z > –2,22) = (tablas) = 0,9868.
Supongamos dos muestras de dos poblaciones 900independientes
con distribuciones F(x) y
F(y). El c) contraste
Sea n la de la mediana
producción nos llevará
de refrescos quea seaceptar
busca.que las distribuciones
Deberá ser P[S n]son iguales
= 0,99
siempre y cuando las medianas sean iguales. Es básicamente un contraste de igualdad de las
n 300000 n 300000
P Z de dos poblaciones
medianas = 0,99. Deindependientes.
las tablas se obtiene que 2,33 n = 302097.
900 900
PROBLEMAS
Solución.-
La variable X =” nº de prendas defectuosas de la muestra” se distribuye como una
binomial B(30; 0,01), Luego:
9
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
Respuesta imozas@elx.uned.es
Respuesta
Sí. Sea X una variable aleatoria de una determinada población y {X1, X2, ..., Xn} una
muestra de tamaño n. Se denomina estimador, a cualquier función de la muestra
f X1 , X 2 ,...,X n , que será una variable aleatoria, al serlo las Xi.
Solución.- una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
Efectuada
Plantearemos
estimador el contraste:
para esa realización muestral: f(x1, x2, ..., xn).
H0: = 15
H1: 15
Podemos considerar que n = 20 es suficientemente grande de forma que, bajo la
Respuesta
se15 al valor de un
Unnula,
hipótesis contraste de hipótesis
la media muestrales X
paramétrico cuando las hipótesis
es aproximadamente
–1/3– normal N refieren . Puesto
, Septiembre que
2015. Reserva.
parámetro desconocido de la población (como por ejemplo , , ...). 20
desconocemos (desviación
Es no paramétrico cuando las hipótesis
típica se refieren
poblacional), a características
tomaremos como unanoestimación
paramétricas la
(forma de latípica
desviación distribución, localización,
de la muestra, aleatoriedad
de forma de una muestra...)
que supondremos que X es aproximadamente
6
normal N15, N(15; 1,34).
PROBLEMAS 20
a) El intervalo del 95% de confianza para la N(0,1) centrado en el origen es (tablas)
17 15
[1,96; 1,96]. Como 1,49 pertenece a dicho intervalo, podemos afirmar, con el 95%
1,34
de confianza, que los desarrolladores están en lo cierto.
b) P(Z > 1,49) = 0,0681, luego el p-valor será 2·0,0681 = 0,1362. Observamos que
0,1362 > 0,05, es decir, no se rechaza la hipótesis nula.
–2/3– Septiembre 2015.
10
–1/3– Septiembre 2015. Reserva.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Solución.-
a) La variable X = “nº de visitas” es binomial B(100; 0,4) que se comporta
aproximadamente como una normal N 40, 24 N(40; 4,899). Luego P(45 < X < 50) =
5 10
= (tipificación) = P Z P(1,02 < Z < 2,02) = (tablas) = 0,1332
4,899 4,899
b)
Respuesta.-
En primer lugar, el concepto de función de densidad no existe para variables discretas y
sí para continuas.
En segundo lugar, la probabilidad de que la variable tome un valor puntual, puede no
ser cero, si la variable es discreta, pero es cero si la variable es continua.
Respuesta.-
Cuando dispongamos de una sucesión {Xn} de variables aleatorias independientes e
idénticamente distribuidas, con media y desviación típica ambas finitas.
Respuesta.-
Si ̂ es un estimador de un parámetro , se denomina sesgo del estimador al valor de
E ̂ Solución.-
.
Si Sea
a) X el tiempo
el sesgo de entrega
es positivo y = E(X)
el estimador el tiempoalmedio.
sobreestima El contraste
parámetro sería:
y, en caso contrario, lo
infraestima.
–2/3– Septiembre 2015. Reserva.
Respuesta.-
11
Se utilizan para contrastar el valor de alguna medida de localización (cuantiles).
Sea una población con una variable aleatoria X, y sea Cp el cuantil de orden p
(0 < p < 1). Los contrastes de localización se pueden formular de cualquiera de las siguientes
formas:
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
PROBLEMAS
Solución.-
La variable X = “tiempo que invierten los usuarios cada hora en realizar consultas”, se
distribuye normal N(2,5; ).
a) Calculemos en primer lugar . Tenemos que: 0,295 = P[X > 3] =(tipificamos) =
0,5 0,5
= P Z . De las tablas obtenemos que debe ser 0,54 de donde 0,9259.
1
Así pues, P[X > 3,5] = P Z P[Z > 1,08] =(tablas) = 0,1401
0,9259
b) La variable Y = “nº de usuarios de la muestra que invierten más de 3,5 minutos en
realizar consultas en la web” es binomial B(400; 0,1401), luego es aproximadamente normal
N 400·0,1401; 400·0,1401·0,8599 = N(56,04; 6,94). Luego:
80 56.04
P(Y > 80) P Z P(Z > 3,4) = 0,0003
6,94
Solución.-
a) Si p es la proporción de audiencia del programa, el contraste lo planteamos:
H0: p ≤ 0,2
H1: p > 0,2
12
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
origen y de escala de forma que E(Y) = 0 y DT(Y) = 1
PROBLEMAS
Respuesta.-
Sea X una variable aleatoria cuya distribución depende de un parámetro . Sea
{X1, X2, ..., Xn} una muestra aleatoria simple y representemos por
L(x1, x2, ...,xn, ) la función de probabilidad (si X es discreta) o de densidad (si X es continua)
de la muestra, a la que llamaremos función de verosimilitud El método de la máxima
verosimilitud consiste en elegir como estimador de el valor * que maximiza
L(x1, x2, ...,xn, ) y al que denominaremos estimador de máxima verosimilitud del parámetro .
Respuesta.-
En un contraste, se llama nivel de significación el tamaño de la región crítica o de
rechazo, es decir, el valor máximo de P(rechazar H0/H0 es cierta)
Solución.-
a) La variable X = X1 +X2 + X3 es normal N 59, 4 9 25 N 59, 38 . Se tiene que
Respuesta.-
Supongamos
dos muestras 75 59
P(X > 75) = (tipificando) = P Z de dos poblaciones independientes
P(Z > 2,60) = (tablas) =con
1 distribuciones F(x) y
0,9953 = 0,0047.
F(y). El contraste de la mediana nos
38 llevará a aceptar que las distribuciones son iguales
siempreb)yLa
cuando las medianas sean iguales. Es básicamente unnormales
variable Y, suma delas 18 variables independientes contraste de igualdad
N(26, de las
3) será normal
medianas de dos poblaciones independientes. 18 32
N 18·26, 18·9 N 468,9 2 , luego P[450 < Y < 500] = P Z
9 2 9 2
P[1,41 < Z < 2,51] = (tablas) = 0,9940 0,0793 = 0,9147
PROBLEMAS
Solución.-
X
a) La variable n se distribuye como una t-Student con n1 grados de libertad.
S
S S
El intervalo de confianza tendrá la forma X t , X t .
2 n 2 n
13
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Solución.-
Respuesta.-
El coeficiente
a) El número M dede variación
intentosde dePearson CV = esesuna
robo mensuales unavariable
medida aleatoria
de dispersión que puede
de Poisson con
= 2. Obtenemos de las tablas que P[M =0] = 0,1353.
utilizarse para comparar la dispersión de dos distribuciones de probabilidad. Si X e Y son dos
b) El número T de intentos de robo por trimestre será una variable de Poisson con = 6,
variables > 7] = 1 y P[TX ≤ 6]Y=, (tablas)
luego P[T aleatorias diremos= que1 0,6063 = 0,3937.
la dispersión de X es menor que la de Y.
c) El número B deXintentos Y de robo en 2 años será una variable de Poisson con = 48,
que es aproximadamente normal siN la
También nos puede indicar
48,media
48 es suficientemente
N(48; 6,9282), luego
población. Si CV > 1, consideramos que la dispersión es grande y por tanto no representa
representativa
P[B < 20] de la =
20 48
bien = P Z
a la población.
=(tipificando) P[Z < 4,04] 0
6,9282
d) El número de intentos de robo ocurren de manera independiente, a lo largo de un
periodoRespuesta.-
de tiempo, de ahí que se trate de una distribución de Poisson.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
Dada
En una
el DE
TUTORÍA variable
apartado ser (Código:
alaleatoria
c, EMPRESARIAL
ESTADÍSTICA > en
10,una
hemosdeterminada
65022076) (2º GRADO población,
aproximado la variable
A.D.E.) parámetro
de Poisson es cualquier
por una
imozas@elx.uned.es
constante
normal. poblacional referida a la variable aleatoria, como por ejemplo cualquier momento.
PRO BLEMAS
Seleccionado ahora un tamaño muestral n y siendo (X1, X2, ..., Xn) la variable muestral,
1.- Losestadístico
se denomina ingresos medios de lasfunción
a cualquier familiasdeporlas hogar
variablesen elX1año, X22014
, ..., Xfueron de 26.092 € al
n, como por ejemplo
año. Suponiendo normalidad y sabiendo
la media muestral. Es por tanto una variable aleatoria. que el porcentaje de hogares que tienen un ingreso
medio inferior a 13.340 euros es del 15,15%. Calcular cual es el porcentaje de hogares que
tienen un gasto entre 23.000 y 31.500 € anuales.
Solución.-
Sea la variable X = “ingresos de las familias por hogar en 2014”. Calculemos .
Respuesta.-
Los factores 1 y la= amplitud 13340 26092
Sabemos queson el coeficiente
0,1515 de confianza
= P[X < 13340] = (tipificando) P Z del intervalo. .Para un
En las
coeficiente de confianza fijo, cuanto menor sea la amplitud del intervalo,
Solución.- más precisa será la
media deuna
estimación, o bien para una misma amplitud 13340 del intervalo, cuanto mayor sea el coeficiente de
tablas El la
de tamaño muestral
N(0,1)seráencontramospara estimar
que debela ser 26092
población
= 1,03, normal
de dondecon seconocida
obtiene que es
confianza mayor la precisión. 2
2
= 12380,58. n = 4 z 2
,
2 L
Respuesta.- ≤ P[1,96
Luego
De las tablas
Cuando
P[23000
se trateobtenemos
de contrastarque X
si la muestra< ≤Zprocede
< 1,96] 31500]
de= una
0,95, =
luego
población z(tipificando)
1,96
normal de. laAdemás
que se
=
23000 26092 31500 26092 2
desconocen
= P100
= L la
y12380 media= y100 laZvarianza.
P[0,25 ≤ Z ≤ 0,44] = (tablas) =
= 2·50
,58 12380,58
Sustituyendo se obtiene que n = 15,3664, por lo que tomaremos n = 16.
= 0,67 0,4013 = 0,2687. luego el porcentaje es el 26,87%.
PROBLEMAS
2.- Unos inversores quieren comprar una web de contenidos cuyos dueños aseguran que
reciben al menos unas 10.000 visitas diarias. El analista externo contratado por los inversores
no está de acuerdo con dicho dato y por ello realiza un estudio, del cual y con una muestra
tornada durante 20 días se obtiene un resultado de 8.600 visitas medias diarias con una
varianza de 1.440.000. Con esta información y suponiendo un comportamiento normal de la
variable estudiada, los inversores buscan:
a) Contrastar a un nivel de significación del 0,05 el valor de las visitas medias diarias.
b) Y obtener el p-valor.
Solución.-
Sea X el número de visitas diarias. Como desconocemos , utilizaremos el estadístico
X –1/3– Junio 2017. 2ª semana
n que es t-Student con n1 grados de libertad.
s
a) El contraste sería:
H0: ≥ 10000
H1: < 10000 –2/2– Septiembre 2016.
Solución.-
El número de intervenciones diarias ocurre de manera independiente y aleatoria durante
un intervalo de tiempo (de un día). Por tanto la variable X = “número de intervenciones
diarias” cumple las características de una distribución de Poisson de parámetro 6. Luego:
a) P[X < 3] = P[X ≤2] = (tablas) = 0,0620
b) El hecho de que en un día se produzca alguna intervención es el suceso contrario de
que no se produzca ninguna, es decir, 1 P[X = 0] = (tablas) = 1 0,0025 = 0,9975
30
c) Sea Xi el número de intervenciones el día i-ésimo y sea S30 = X
i 1
i . Se tiene que
E(S30) = 30·6 = 180 y, como las Xi son independientes, Var(S30) = 30·6 = 180. Luego, por el
teorema central del límite, podemos considerar que la variable S30 es aproximadamente normal
N 180, 180 . Luego P[150 < S30 < 200] = (tipificamos) = P
150 180
Z
200 180
180
UNED. ELCHE. 180
www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
P[2,24 < Z < 1,49] = (tablas) = 0,9319 0,0125 = 0,9194
PROBLEMAS
Solución.-
a) Sea X el número de turismos matriculados mensualmente. Se tiene que
560 570 650 570
P560 X 650 = (tipificamos) = P Z P(1,15 < Z < 9,24)
75 75
1 0,1251 = 0,8749.
b) Sea x el número buscado. Se tendrá que 0,9 = P(X < x) = (tipificamos) =
Solución.-
x 570 570mensual
y el ingreso xmedio
X el volumen
= P ZSea . En lasdetablas
ingresos mensualesque
encontramos de debe
una empresa
ser aproximadamente = 1,29
75 X 75
de las empresas del sector. Sabemos que la variable T = n sigue una distribución
x 581 S
t-Student con n1 grados de libertad. Luego;
S S
a) El intervalo toma la forma X t ,X t . Para un nivel de confianza del
2 n 2 n
90% y n1 = 17 grados de libertad, t = (tablas) = 1,74. Luego el intervalo será:
2
30000 30000
185000 1,74 18 ,185000 1,74 18 [172696, 197304]
Solución.-
a) Sea el ingreso medio por filial en el mes de agosto. Planteamos el contraste de la
siguiente forma:
H0: > 5548
H1: ≤ 5548 –2/3– Junio 2017. 2ª semana
X 5548
Si X es la media muestral, 21 se distribuye aproximadamente t-Student con
1950
20 grados de libertad. De la tabla de la 15
t-Student con 20 grados de libertad obtenemos que
5520 5548
0,95 = P(t 20 > 1,725). Como 21 2,95 < 1,725, debemos rechazar la
1950
hipótesis nula y admitir que el ingreso medio por filial en el mes de agosto no supera los
Estadística Empresarial Tema 5: Estadísticos
Preguntas de exámenes muestrales y sus
distribuciones
1
p̂ z , p̂ z
2 n 2 n
Para = 0,05 z = 1,96, luego sustituyendo, el intervalo queda:
Tema 5: Estadı́sticos muestrales
2 y sus distribuciones
0,33·0,67 0,33·0,67
0,33 1,96 ,0,33 1,96 [0,301; 0.359]
1000 1000
28
SEPTIEMBRE 2013
PRIMERA
Solución.- PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
54 X
Si es el gasto medio poblacional y X el gasto medio muestral, sabemos que n
UNED. ELCHE.
www.innova.uned.es/webpages/Ilde/Web/index.htm
Respuesta.-
TUTORÍA DEnormal
se distribuye ESTADÍSTICA EMPRESARIAL
N(0,1). Se (Código:
desea65022076) (2º GRADO
que 0,95 = PA.D.E.)
Consideremos la variable X sobre la que efectuamos un cambio de origen y escala,
X 10 P 10 Ximozas@elx.uned.es
10 =
σ 30 JUNIO 10 2015- 1ª SEMANA
10 a obtenemos
= dividiendo
obteniéndose variable Y = aX
la por += P n CV
b. Entonces Z X = nX y. CV DeY las
= Ytablas X
en dondeque se
n n 30 30 X Y aX b
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
10
observa que si a>0 y b = 0, CV = CV y, en cualquier otro caso, CVX CVY.
n = 1,96 n 34,57, porXlo que Ytomaremos n = 35.
30 Conclusión: el coeficiente de variación no se ve afectado por cambios escala (positivos)
y sí se ve afectado por cambios de origen.
64
Respuesta.-
Si es binomial B(n, p) con n > 30 y p ≤ 0,1, podemos
X ELCHE.
UNED.
Respuesta.- considerar que X se distribuye
www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
aproximadamente comodeuna
Es aquella parte la variable
estadísticade cuyo
Poisson de parámetro
objetivo es obtener =información
np. imozas@elx.uned.es
sobre el valor de
Esto significa
algún parámetro que si aumentamos
poblacional, como por indefinidamente
ejemplo
SEPTIEMBRE 2015un
la media o la número n deo pruebas
varianza, sobre lade Bernoulli
forma de la
independientes,
distribución
PRIMERAde la con probabilidad
variable
PARTE: de como
aleatoria,
CUESTIONES éxito p,pordeejemplo
forma que = npdepermanece
la función
TEÓRICO-CONCEPTUALES densidad oconstante,
de cuantía. se
Esta determinación
n se hace a
partir x
de la información contenida en una muestra aleatoria.
verifica que lim p x 1 p e
n x
Respuesta.-
n x x!
La covarianza es un momento bidimensional y como tal es una magnitud cuya unidad es
Respuesta.-
el producto de las unidades de las variables, mientras que el coeficiente de correlación, que
Respuesta.-
resulta Sea un parámetro
de estandarizar
A la desviación
la covarianza
típica de la media
y , unpor
dividiéndola
desconocido
muestral
el producto
intervalo de las desviaciones
de confianza
X se ley llama error
típicas de
al nivel 100(1–)%.
estándar de la media. Su
las variables, es, como su nombre indica, un coeficiente
Supongamos que se desea contrastar la hipótesis: carece de unidades. Aunque ambas
midenesla fuerza
valor . = 0 lineal de las variables, la covarianza no puede usarse para
de Hla0: relación
1: 0
comparar lan relaciónHlineal de dos distribuciones bidimensionales distintas pues depende de las
unidades en que se expresen.
con un nivel de significación . Entonces se rechazará H0 si y sólo si ,
Respuesta.-
Respuesta.-
Respuesta.-
Consideremos
Es un contraste una muestra aleatoria
de localización {x1, ..., Las
de la mediana. xn} hipótesis
de tamañoson:n de una población con
Sí. Si
función de H se conoce la
distribución distribución de la población, puede
F(x). Se define la función de distribuciónusarse el método pivotalcomo
empírica o el
0: Me = m
método general de Neyman.
N( x ) H : Me m Si no se conoce –2/2–
la distribución puede utilizarse en Septiembre
muchos 2012
casos
Fn(x)
la =
desigualdad , de
donde N(x) es el número de valores de la muestra, menores o iguales que x.
1 Chebychev.
Paran realizar el contraste tomamos una muestra aleatoria simple (X1, X2, .., Xn) . Si H0
es cierta, el número de signos positivos de las diferencias Xi–m debe ser aproximadamente
n
. es decir, la distribución del número de signos positivos de las deferencias Xi–m se
igual aRespuesta.-
2
Es la probabilidad de rechazar la hipótesis nula H0. Si representamos por la
Respuesta.-
1 aleatoria procede de una población con una cierta
Paracomo
distribuirá
probabilidad verificar
del error si tipo
de ndecir
una I,muestra
una binomial Bes , . Con lo que el contraste
la probabilidad puede
de rechazar H0plantearse como:
, siendo cierta y por la
distribución de probabilidad. Si es
2así, y {S
probabilidad del error de tipo II, es decir, la probabilidad
i }, i=1, 2..k es una partición del dominio de la
de aceptar H0, siendo falsa, entonces
1 O i Ei, si Hdistribuye
k 2
H0: pel= estadístico 0 cierta
variable aleatoria,
la potencia del contraste2 es la función P = 1 se según una distribución 2 con k1
i
i 1
E , si H 0 falsa
1
H 1 : p
grados de libertad, donde
2
Oi y Ei son el número de valores observados y esperados,
2
respectivamente,
Respuesta.- en el subconjunto S i.
Supongamos dos muestras de dos poblaciones independientes con distribuciones F(x) y
F(y). El contraste de la mediana nos llevará a aceptar que las distribuciones son iguales
Estadística Empresarial
Preguntas de exámenes
Tema 6: Estimación puntual
1
X np
entonces
11 la variable aleatoria es asintóticamente normal N(0, 1), es decir, cuanto
np(1 p)
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
Tema 6: Estimación puntual X np
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
mayor sea n, más se aproxima la variable a una normal N(0, 1). Suele imozas@elx.uned.es
considerarse
np(1 p)
SEPTIEMBRE 2012
1 1
buena aproximación si np > 5 y p ≤ o bien si n(1–p) > 5 y p >
PRIMERA PARTE: CUESTIONES 2 TEÓRICO-CONCEPTUALES 2
15
15
Respuesta.-
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
UNED.
Un ELCHE.
estimador ̂ de un parámetro , obtenido a
www.innova.uned.es/webpages/Ilde/Web/index.htm
Xde
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º
Y = A.D.E.) una
GRADO A.D.E.) muestra
a y de tamaño n, es
imozas@elx.uned.es
Consideremos
TUTORÍA DE ESTADÍSTICA la variable
n
EMPRESARIALaleatoria X y sea
(Código: 65022076) (2º GRADO , donde b son constantes,
imozas@elx.uned.es
consistente en probabilidad si SEPTIEMBRE > 0, se cumple lim P ˆbn 1 .
que RESERVA
2012.
X RESERVA
a Var (X)
X a Var
SEPTIEMBRE 2012. n
b 0. Se tiene que Var(Y) = Var . Así pues,ˆ la varianza
2 no se
También se dice que ̂ es
consistente
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
n b en media
b 2
cuadrática
b 2
si lim E n 0.
n
PRIMERA
ve afectada PARTE:
por el casos
cambio de CUESTIONES
origenque, seTEÓRICO-CONCEPTUALES
peroa símayor ve afectada el cambio de escala
En ambos significa tamaño de 2
la muestra, másdeseforma asemejaque elsi
una variable se divide por b, su varianza se
estimador (en probabilidad o en media cuadrática) al parámetro. ve dividida por b .
Respuesta.-
Respuesta.-
El coeficiente de variación de Pearson CV = es una medida de dispersión que puede
coeficiente de variación de Pearson CV = es una medida de dispersión que puede
Respuesta.-
El
Respuesta.-
Se utiliza para contrastar si dos poblaciones diferentes X e Y con funciones de
utilizarse
Sea para
X comparar
una variable la dispersión
aleatoria de una
de dos distribuciones
determinada de probabilidad.
población y {X 1, Si X, ...,
e YXson dos
utilizarse para
distribución F(x)comparar
y F(y), lade dispersión
las que se de
han dos distribuciones
obtenido sendas de probabilidad.
muestras aleatorias SiXindependientes,
2X n} una
e Y son dos
muestra de tamaño n. X Se Ydenomina estimador, a cualquier función de la muestra
variables
tienen aleatorias
la misma distribución,
y X esY decir, , diremos
F(z) que la dispersión
= G(z) . de X es menor que la de Y.
f X1 , X 2 ,...,
variables X n , que
aleatorias X una
y será variable
, diremos que la al
aleatoria, dispersión
serlo las deXi.X es menor que la de Y.
X Y Y
Efectuada
También una nos realización
puede indicar muestral {x1, x2
si la media , ...,esxnsuficientemente
}, una estimación sería el valordedel
representativa la
También nos puede indicar si la media x ).es suficientemente representativa de la
estimador para esa realización muestral:
población. Si CV > 1, consideramos que la1 dispersión f(x , x 2 , ..., n es grande y por tanto no representa
población. Si CV > 1, consideramos que la dispersión es grande y por tanto no representa
bien a la población.
bien a la población.
Respuesta.-
Respuesta.-
Con un nivel de confianza dado, al aumentar el tamaño de la muestra, disminuye 2la
Respuesta.-
El del
amplitud error cuadrático
intervalo medio (ECM) de un estimador ̂ de un parámetro es E ˆˆ 2 .
de confianza-.
El error cuadrático medio (ECM) de un estimador ̂ de un parámetro es E .
Respuesta.-
Respuesta.-
Un estimador es eficiente si es insesgado y si su varianza es la mínima posible, es decir,
Un estimador
coincide con es Cramer-Rao:
la cota de eficiente si es insesgado y si su varianza es la mínima posible, es decir,
coincide con la cota de Cramer-Rao:
1
Var( ̂ ) = 1
Var( ̂ ) = ln f ( x, ) 22
nE ln f ( x, )
nE
Solución.-
Siendo p la proporción de personas que han comprado alguna vez usando internet, la
p(1 p)
muestral p̂ se distribuye aproximadamente normal N p,
Respuesta.-
proporción , por ser n
Respuesta.-
Supongamos una sucesión de n elementos que solamente toman n A o B. Por
el valor
Supongamos una sucesión de n elementos que solamente toman el valor A o B. Por
ejemplo:
suficientemente
ejemplo: grande. El intervalo de confianza por tanto tiene la forma:
AAAAAABBABBBBBBAAA
Se denomina racha, cada AAAAAABBABBBBBBAAA
una de las sucesiones formadas por una misma letra, hasta que
Se denomina racha, cada una de las
aparece otra letra distinta. En el ejemplo sucesiones
anterior hay tresformadas
rachas por una misma letra, hasta que
de Aes:
aparece otra letra distinta. En el ejemplo anterior hay
AAAAAA; A; AAAtres rachas de Aes:
y dos rachas de Bes: AAAAAA; –1/2– A; AAA Septiembre 2012
y dos rachas de Bes: BB; BBBBBB
BB;
2 BBBBBB
F11(x) =
ff (( x
x,, y dy dx
y))dy
dx ; F22(y) =
ff (( x
x,, y dx dy
y))dx
dy ; F(x/y)=
ff (( x
x,, y
y))dx
dx
Respuesta.-
24 Un estimador T = T(X11, X22, …, Xnn) es suficiente para un parámetro si la distribución
X22, …,
de (X11,UNED. Xn) condicionada por T = t, no depende de .www.innova.uned.es/webpages/Ilde/Web/index.htm
ELCHE. n
TUTORÍA DE ESTADÍSTICA
Significa, de forma EMPRESARIAL
intuitiva(Código:
que 65022076)
el estimador ̂̂ A.D.E.)
(2º GRADO utiliza toda la información relevante
imozas@elx.uned.es
contenida
28
en la muestra sobre el parámetro a estimar y que ningún otro estadístico puede
JUNIO 2013- 2ª SEMANA
proporcionar más información sobre dicho parámetro
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA
PRIMERA PARTE: EMPRESARIAL (Código: 65022076)
CUESTIONES (2º GRADO A.D.E.)
TEÓRICO-CONCEPTUALES imozas@elx.uned.es
32
Respuesta.-
Respuesta.-
Respuesta.-
Consideremos
se trataladeEMPRESARIAL
UNED. ELCHE.
Cuando variable
contrastarX sisobre la queprocede
la 65022076)
muestra efectuamos unpoblación
una cambio de origen
normal de yla escala,
dewww.innova.uned.es/webpages/Ilde/Web/index.htm
que se
TUTORÍA una
DE ESTADÍSTICA (Código: (2º GRADO A.D.E.)
Dada variable aleatoria
desconocen la media y la varianza. en una determinada X población, Y a X
parámetro imozas@elx.uned.es
es cualquier
obteniéndose
constante la variable
poblacional Y = aX
referida a la+ variable
b. Entonces CVX =como por
aleatoria, y CV Y =
ejemplo
cualquier en donde se
momento.
SEPTIEMBRE 2013. RESERVA
X Y aX b
Seleccionado ahora un tamaño muestral n y siendo (X1, X2, ..., Xn) la variable muestral,
observa
se que siestadístico
denomina a>0 y b = a0,cualquier
CVX = CV Y y, en
función decualquier otro caso,
las variables X1, XCV X CVY.
2, ..., Xn, como por ejemplo
PRIMERA
Conclusión: PARTE:
el CUESTIONES
coeficiente de variación TEÓRICO-CONCEPTUALES
no se ve afectado por cambios escala (positivos)
la media muestral. Es por tanto una variable aleatoria.
y sí se ve afectado por cambios de origen.
Respuesta.-
Respuesta.-
Sea P la función de probabilidad definida para los sucesos de un determinado
Es
experimentoaquella parte siendo
aleatorio,
Respuesta.- de la estadística cuyomuestral.
E su espacio objetivoSea X: E información
es obtener sobre el
una aplicación quevalor de
a cada
algún parámetro
suceso Si
elemental poblacional,
(X1, X2, le
...,haga como
Xn) corresponderpor
es una muestra ejemplo
unaleatoriala media
número simple o la varianza,
real y representemos por [X ela]estadístico
o sobre
de tamaño n, usaremos la forma de
el suceso la
distribución
X
{xE/X(x) de la variable aleatoria, como
a}. Diremos que X es una variable por
–1/3–ejemplo la función de densidad o
Junio
Junio de cuantía.
2013.
2013.
aleatoria si existe la probabilidad P[Xx] para
1ª semana
1ª semana
Esta n que se distribuye
determinación se hace como
a una
partir de t-Student
la con n–1
información grados de
contenida en libertad.
una muestra aleatoria.
todo
S número real x.
Respuesta.-
Respuesta.-
Sea
Es un contraste de localización de la mediana. Las hipótesis son:
un Me = m desconocido y , un intervalo de confianza al nivel 100(1–)%.
H0:parámetro
Respuesta.-
En condiciones
Supongamos
H1: Mequem bastante
se desea generales,
contrastar laloshipótesis:
estimadores obtenidos por el método de los
H0: = 0
momentos son consistentes, asintóticamente normales y, en general, no son insesgados (sí lo
H1: momentos
son si se pretende estimar 0 poblacionales
PROBLEMAS respecto del origen). Por tanto, en general
no son eficientes.
con un nivel de significación . Entonces se rechazará H0 si y sólo si ,
Los obtenidos por el método de la máxima verosimilitud son consistentes, no son en
general insesgados, pero entonces son asintóticamente insesgados. Son asintóticamente
Respuesta.-
eficientes y asintóticamente normales.
Es un contraste de localización de la mediana. Las hipótesis son:
H0: Me = m
H1: Me m
Solución.-
Respuesta.-
Para realizar el contraste tomamos una muestra aleatoria simple (X1, X2, .., X
den)Poisson
. Si H
a) SeaunXnivel
Para el número de impagos
de significación cuatrimestrales,
fijo, al aumentarque seguirá
el tamaño una distribución
muestral disminuye el error0
es cierta, 2.
de media el Luego
número P(Xde=signos positivos
0)H=/H(tablas) de las diferencias Xi–m debe ser aproximadamente
= 0,1353.
de tipo II,
n
= P[Aceptar 0 0 falsa], por tanto, aumenta la potencia del contraste 1 – =
igual
= ab) .Sea
P[Rechazar es HY/Hel la
decir, número Si de
distribución impagos anuales.
del número P(Y
de signos >positivos
9) = para– dos
1 de P(Y ≤ 9) = muestrales,
las deferencias(tablas)
Xi–m se =
0 0 falsa]. representamos la curva de potencia tamaños
= 1 – 2
0,7166 =0,2834
p. ej. n = 25 y n = 100, se obtienen curvas del tipo:
1
distribuirá como una binomial B n, . Con lo que el contraste puede plantearse como:
2
1
1 n=100
H0 : p = 3 n=25
2
1
H1 : p
2 = 0
–1/2– 1 Junio 2013. 2ª semana
36
= 0 1
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Para muestras
1discretaaleatorias devalores
tamaño{xn, suficientemente grandes el Teorema central del
Si SX2 es ytoma i i= 1, 2, 3, …, r}, se define la función de cuantía
2 los
muestral Xi X
límite permitenconsiderar que la media muestral se distribuye aproximadamente de forma
o de probabilidadi P(x
normal. 1 i) = P[X = xi]. Se cumple que F(x) = P( x i ) .
x i x
Respuesta.-
Dados dos estimadores insesgados ̂1 y ̂ 2 del parámetro , se define la eficiencia
Respuesta.-
Es un contraste de localización para 4 la mediana de una población supuestamente
simétrica, que tiene en cuenta el signo y la magnitud de las diferencias.
PROBLEMAS
UNED. ELCHE.
continua, la gráfica es continua. Por otra65022076)
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código:
F(x/y)
parte,
= la
)dx
f ( x , yprobabilidad
www.innova.uned.es/webpages/Ilde/Web/index.htm
(2º GRADO A.D.E.)
de un valor particular de la
imozas@elx.uned.es
variable es cero, si la variable es continua y puedef no serlo si es discontinua.
2 ( y)
JUNIO 2016- 1ª SEMANA
Respuesta
Respuesta.-
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Si X1, X2, ..., Xn son n variables aleatorias independientes e idénticamente distribuidas,
Para un estimador ̂ de un parámetro se define nel error cuadrático medio como
E
conˆ E(X
2
i)= . Suyutilidad = 2 , en
Var(Xi)estriba ambas que se finitas, y siendo
considera que Seln =
mejor
i 1
i , entonces
Xestimador de Y nserá
S E (S n )
naquel que
Var (S n )
menor error cuadrático medio entre todos los posibles estimadores de .
tenga elRespuesta.-
tiende hacia una distribución N(0, 1) al aumentar n.
En primer lugar, el concepto de función de densidad no existe para variables discretas y
sí para continuas.
En segundo lugar, la probabilidad de que la variable tome un valor puntual, puede no
Respuesta.-
UNED. ELCHE.
Respuesta www.innova.uned.es/webpages/Ilde/Web/index.htm
ser cero,Lo siveremos
la variable conesun discreta,
ejemplo. pero es cero si launa
Supongamos variable
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
variable es continua.
aleatoria normal N(, ) con
desconocida y conocida. Si Z es la normal N(0,1), sea z 0, 025 tal que PZ z 0, 025 0,025 .
imozas@elx.uned.es
Sí. Sea X una variable aleatoria de una determinada población y {X 1, X2, ..., Xn} una
muestra de tamaño n. Se denomina JUNIO 2016- estimador,
2ª SEMANA a cualquier función de la muestra
X1 ,muestras
fPara X 2 ,...,X n de , que variable aleatoria, al serlo X
tamaño n, sabemos que la variable las Xi. n se distribuye normal N(0,1),
será una
Respuesta.-
Efectuada una
PRIMERA realización
PARTE: CUESTIONESmuestral {xTEÓRICO-CONCEPTUALES
1, x2, ..., xn}, una estimación sería el valor del
Cuando dispongamos de una sucesión {X } de variables aleatorias independientes e
estimador para esa X
realización muestral: f(x1, x2, ..., xn).
n
luego P z
0, 025
idénticamente n
distribuidas, con mediaz 0 ,95 P
0 , 025 y desviación típica
X z
0 , 025 ambas finitas.X z 0, 025 , es decir
Respuesta.- n n
En una distribución
bidimensional
de variables (X, Y), la covarianza es el momento
pertenece al intervalo X z 0, 025
Respuesta , X z 0.,025 con probabilidad 0,95.
11= Cov(X,Y) = E[(X-E(X))(YE(Y)]
contraste de hipótesis es paramétrico cuando
n y es una n medida de la fuerza de la relación lineal
Un
entre XAhora
e Y. las hipótesis se refieren al valor de un
parámetro bien,
desconocido
Respuesta.- si elegimos una
de la población muestra concreta cuya, media
, ...). muestral sea x , ya no
El coeficiente de correlación lineal(como
resultapordeejemplo
estandarizar la covarianza, dividiéndola
Si ̂noesparamétrico
un queestimador de un las hipótesis,se
parámetro se denomina características no paramétricas
Es asegurar cuando
pertenezca z 0, 025 a, sesgo
x refieren x z 0.,del estimador ) al valor de
podemos al intervalo 025 Cov( X con
, Yprobabilidad
E ̂ TUTORÍA
por
(formael UNED.
producto
de
. laELCHE. de las
distribución, desviaciones
localización, típicas de
aleatoriedad
las variables:
de una
muestra...)
n XY n
www.innova.uned.es/webpages/Ilde/Web/index.htm
, por lo
DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) Var (X(·Varimozas@elx.uned.es
(Y)
0,95. Diremos
Si el sesgo entonces que talelintervalo
es positivo estimador posee un coeficiente
sobreestima de confianza
al parámetro y, en de 0,95
caso o un nivel
contrario, lo
que carece de
de confianza del 95%. magnitud. Proporciona una medida
SEPTIEMBRE 2016 numérica del grado en que las variables
infraestima.
están relacionadas
PROBLEMASPRIMERA linealmente.PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.- –1/3– Junio 2015. 2ª semana
(0 < p Si
tipificada se
aY
< 1). desarrolla,
Los= contrastes
. Se de
dice entonces que
localización hemos formular
se pueden aplicado de
a lacualquiera
variable Xde un
las cambio
siguientesde
tendrá menor ECM aquel estimador cuya varianza y cuyo sesgo sean menores.
formas:
origen y de escala de forma que E(Y) = 0 y DT(Y) = 1
I: H0: Cp = k0 II: H0: Cp ≤ k0 III: H0: Cp ≥ k0
Respuesta.-
Respuesta.-
En un contraste,
Supongamos unasevariable
llama nivel de significación
aleatoria el tamaño
para la que de que
se supone la región crítica o de
suJuniodistribución,
rechazo, es decir, el valor máximo de –1/3–
P(rechazar H /H es cierta)
desconocida, se ajusta a un determinado modelo. 0Un0 contraste de bondad de ajuste permite
2016. 1ª semana
SEPTIEMBRE
2. Indique para qué se utiliza el error cuadrático2017
medio de un estimador.
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Respuesta.-
Si es un parámetro y ̂ el estimador, se define el error cuadrático medio de ̂ :
Respuesta.-
Sea (X,Y) una variable aleatoria bidimensional
2
ECM ( ̂ ) = E ˆ talque Var(X) y Var(Y) existen y son
Cov (X, Y)
XY ̂) = Var( ̂ ) + (Sesgo(.Su
̂ ))valor
2
Desarrollando
distintas de cero. Se ladefine
expresión anterior, sedeobtiene
el coeficiente que ECM(
correlación:
Se considera que el mejor estimador de será aquel que tenga el menor Varerror
(X)·Var (Y)
cuadrático medio
entre
está comprendido entre 1estimadores
todos los posibles y, por
y +1 y tienedesentido lo tanto,
su cálculo los se
cuando dosdesea
sumandos
medir laenfuerza
que de se
descompone, sean lo mínimos posible, aunque
la relación lineal entre las variables aleatorias no siempre existirá tal estimador.
Respuesta.-
Sea , el intervalo de confianza para un parámetro al nivel de confianza
100(1)%, es decir P = 1 .
Supongamos ahora que se desea efectuar el contraste bilateral:
H0: = 0
H1: 0
con un nivel de significación . Entonces la región de aceptación es el intervalo de confianza.
–1/2– Junio 2017. 1ª semana
Respuesta.-
Las rachas se utilizan para contrastar la aleatoriedad de una muestra y ello porque el
número de rachas de la muestra puede usarse como estadístico para el análisis de la
aleatoriedad (por ejemplo, un número pequeño o un número grande de rachas indicará que
debemos rechazar la hipótesis de que la muestra es aleatoria)
6 –1/2– Septiembre 2017.
Estadística Empresarial
Preguntas de exámenes Tema 7: Estimación por
intervalos de confianza
1
Efectuada una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
Respuesta.-
estimador para esa realización muestral: f(x1, x2, ..., xn).
Sea X una variable aleatoria de una determinada población y {X 1, X2, ..., Xn} una
Tema muestra
7: Estimación
de tamaño por n. Seintervalos de confianza
denomina estimador, a cualquier función de la muestra
f X1 , X 2 ,..., X n , que será una variable aleatoria, al serlo las Xi.
Respuesta.-
Efectuada una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
Con
estimador para un esa
nivel de confianza
realización dado,f(x
muestral: al ,aumentar el tamaño de la muestra, disminuye la
1 x2, ..., xn).
amplitud del intervalo de confianza-.
Respuesta.-
Con contrastar
Para un nivel de confianza
el valor de lasdado, al aumentar
medidas el tamaño
de posición, decuantiles.
como los la muestra, disminuye la
amplitud del intervalo de confianza-. PROBLEMAS
Respuesta.-
Para contrastar el valor de las medidas de posición, como los cuantiles.
PROBLEMAS
Solución.-
Siendo p la proporción de personas que han comprado alguna vez usando internet, la
p(1 p)
proporción muestral p̂ se distribuye aproximadamente normal N p, , por ser n
n
12
Solución.-grande. El intervalo de confianza por tanto tiene la forma:
suficientemente
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
Siendo p la proporción de personas que han comprado
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
alguna vez usandoimozas@elx.uned.es
internet, la
p(1 p)
proporción
muestral p̂ se distribuye aproximadamente normal N p, , por ser n
p(1 p) p(1 p)
p̂ z , p̂ z (Al ser n grande podemos sustituirn p por p̂ )
n n –1/2–
suficientemente grande. El intervalo de confianza por tanto tiene la forma:
2 2
Septiembre 2012
0,33·0,67 0,33·0,67
0,33 1,96 ,0,33 1,96 [0,301; 0.359]
1000 1000
Solución.-
X
Si es el gasto medio poblacional y X el gasto medio muestral, sabemos que n
se distribuye normal N(0,1). Se desea que 0,95 = P X 10 P 10 X 10 =
σ 30 10 10
= dividiendo por = P n Z n . De las tablas obtenemos que
n n 30 30
10
n = 1,96 n 34,57, por lo que tomaremos n = 35.
30
2
aproximado por una normal.
Podría haberse efectuado una corrección por continuidad pero los resultados son
prácticamente los mismos.
24
Respuesta.- n n
para una
de t Dada una variable aleatoria en una determinada población,deparámetro
confianza del 90%, se puede calcular con la tabla la distribución normal
es cualquier
2
constante poblacional referida a la variable aleatoria, como por ejemplo cualquier momento.
1,65·10500
N(0,1),Seleccionado ahora
que proporciona ununvalor
tamaño muestral
de 1,65. Luego:n y 2siendo
· (X1, X5000
2, ...,, X
den) donde n ≥ muestral,
la variable 48,0249.
se denomina estadístico a cualquier función de las variables n X1, X2, ..., Xn, como por ejemplo
Asímedia
la pues muestral.
tomaremos Esnpor
= 49.
tanto una variable aleatoria.
Respuesta.-
Si (X1, X2, ..., Xn) es una muestra aleatoria simple de tamaño n, usaremos el estadístico
X
n que se distribuye como una t-Student con n–1 grados de libertad.
S
Respuesta.-
Es un contraste de localización de la mediana. Las hipótesis son:
H0: Me = m
H1: Me m
PROBLEMAS
Solución.- 3
a) Sea X el número de impagos cuatrimestrales, que seguirá una distribución de Poisson
de media 2. Luego P(X = 0) = (tablas) = 0,1353.
b) Sea Y el número de impagos anuales. P(Y > 9) = 1 – P(Y ≤ 9) = (tablas) =
c) En el apartado a) se ha aproximado la binomial por la normal porque np = 28,2 > 5 y
p = 0,094 < ½.
41
2n800
X 2
i , donde las
800 variables Xi son independientes y normales N(0,1)
1800 1,96 ,
i 1 1800 1,96 = [1689,13 ; 1910,87]
200 t de Student200
Distribución con n grados de libertad:
800
b) DebeUser 1,65· = 300, de donde n = 19,36 19.
tn , donde Un y V son variables independientes, U normal N(0,1) y V 2n
V
n
–2/2– Septiembre 2013. Reserva
Respuesta.-
Porque deseamos construir un intervalo con una alta probabilidad (coeficiente de
confianza) de encontrar en él el parámetro desconocido.
Respuesta.-
En un contraste de hipótesis y supuesta cierta la hipótesis nula H0, se denomina p-valor
a la probabilidad de obtener un valor del estadístico de prueba que sea al menos tan improbable
como el valor experimental observado.
Respuesta.-
Se pretende contrastar el valor de alguna medida de posición (un cuantil como por
ejemplo la mediana) para localizar estadísticamente la distribución.
PROBLEMAS
Solución.-
La variable X = “ número de clientes que compra el producto” se distribuye
4
aproximadamente normal N 2000·0,15; 2000·0,15·0,85 N(300 ;15,97). Luego:
a) P(X ≥ 450) = (tipificando) = P(Z ≥ 9,4) 0.
b) P(200 < X < 400) = (tipificando) = P(–6,26 < X < 6,26) 1
P(25000 < X < 35000) = (tipificando) = P Z = P(0,17 < Z < 0,67) =
12097 12097
= (tablas) = 0,7486 0,4325 = 0,3161
Solución.-
Para la muestra dada, la media muestral es x 611,55 y la varianza muestral
11
47 1
s2 = x i x 2 3943,87 de donde s 62,8. Luego:
10UNED.
i 1
ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
X
a) La variable n se distribuye–2/3–
t-Student con n–1 grados de libertad.Septiembre 2014.
Entonces,
S
para 10 grados de libertad obtenemos de las tablas el intervalo del 0,95 de probabilidad:
[–2,228 ; 2,228]
luego, con un 95% de confianza podemos afirmar que
611,55 2,228·62,8 2,228·62,8
2,228 11 2,228 611,55 611,55
62,8 11 11
569,36 < < 653,73
Así pues, 600000 sería un valor admisible para la audiencia media del programa, con un
95% de confianza.
b) La variable
n 1S2 se distribuye 2 con n–1 grados de libertad. Entonces, para 10
2
grados de libertad obtenemos de las tablas el intervalo del 0,95 de probabilidad:
[3,247 ; 20,48]
luego, con un 95% de confianza podemos afirmar que:
10·3943 ,87 10·3943 ,87 10·3943 ,87
3,247 20,48 2
2
20,48 3,247
1925,72 < 2 < 12146,20 43,88 < < 110,21. Es decir la desviación típica, con un
95% de confianza, estaría entre 43880 y 110210 espectadores. Luego no se puede dar por
cierta la afirmación de la productora.
5
aproximadamente normal N 90 , 90 N(1125 ; 13,69). Luego:
2 12
P(900 < X < 1250) = (tipificando) = P(16,43 < Z < 9,13) 1
54
PRIMERA
Solución.- PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
X
a) La variable n es tn1 y el intervalo de confianza tiene la forma
S
S S
X t Respuesta.-
,X t . De las tablas de la t-Student con 59 grados de libertad y = 0,025
2 n 2 n 2
Si X es binomial B(n, p) con n > 30 y p ≤ 0,1, podemos considerar que X se distribuye
= np. 4000 4000
aproximadamente
obtenemos que comot =una2,variable
luegode Poisson es 15000
de parámetro
el intervalo ,15000
Esto significa que 2 si aumentamos indefinidamente un número 60
n de pruebas 60
de Bernoulli
[14483,60 ; 15516,40].
independientes, con probabilidad de éxito p, de forma que = np permanece constante, se
n el contraste:
b) Planteamos x
verifica que lim pHx 1: p=17000
n x
e
0
n x x!
H1: 17000
El intervalo de 0,9 de probabilidad de la t-Student con 59 grados de libertad es
[1,671Respuesta.-
; 1.671] luego la región crítica es el exterior de este intervalo. Para los datos del
A la desviación típica de la media X muestral X se 17000
15000 le llama error estándar de la media. Su
problema, el estadístico de prueba n 60 7,75, luego, a este nivel
S 2000
valor es .
de significación,
n no puede aceptarse lo afirmado por el consenso general.
Respuesta.-
Sí. Si se conoce la distribución de la–2/2–
población, puede usarse el método pivotal
Septiembre o el
2014. Reserva
método general de Neyman. Si no se conoce la distribución puede utilizarse en muchos casos
la desigualdad de Chebychev.
Respuesta.-
Para verificar si una muestra aleatoria procede de una población con una cierta
distribución de probabilidad. Si es así, y {Si}, i=1, 2..k es una partición del dominio de la
O i E i 2 se distribuye según una distribución 2 con k1
k
6
0,3
d) 14998 · 0,9
5000
Solución.-
–2/3– s s
Junio 2015. 1ª semana
El intervalo de confianza para tendría la forma x t , x t , siendo t = 2,064
2 25 2 25 2
7
E ˆ . Su utilidad estriba en que se considera que el mejor estimador de será aquel que
2
tenga el menor error cuadrático medio entre todos los posibles estimadores de .
Respuesta.-
Lo veremos con un ejemplo. Supongamos una variable aleatoria normal N(, ) con
desconocida y conocida. Si Z es la normal N(0,1), sea z 0, 025 tal que PZ z 0, 025 0,025 .
X
Para muestras de tamaño n, sabemos que la variable n se distribuye normal N(0,1),
X
luego P z 0, 025 n z 0, 025 0,95 P X z 0, 025 X z 0, 025 , es decir
n n
pertenece al intervalo X z 0, 025 , X z 0.,025 con probabilidad 0,95.
n n
Ahora bien, si elegimos una muestra concreta cuya media muestral sea x , ya no
podemos asegurar que pertenezca al intervalo x z 0, 025 , x z 0.,025 con probabilidad
n n
0,95. Diremos entonces que tal intervalo posee un coeficiente de confianza de 0,95 o un nivel
de confianza del 95%.
8
y p < 0,1.
Solución.-
Plantearemos el contraste:
H0: = 15
H1: 15
Podemos considerar que n = 20 es suficientemente grande de forma que, bajo la
hipótesis nula, la media muestral X es aproximadamente normal N15, . Puesto que
20
desconocemos (desviación típica poblacional), tomaremos como una estimación la
desviación típica de la muestra, de forma que supondremos que X es aproximadamente
6
normal N15, N(15; 1,34).
20
a) El intervalo del 95% de confianza para la N(0,1) centrado en el origen es (tablas)
17 15
[1,96; 1,96]. Como 1,49 pertenece a dicho intervalo, podemos afirmar, con el 95%
1,34
de 66
confianza, que los desarrolladores están en lo cierto.
b) P(Z > 1,49) = 0,0681, luego el p-valor será 2·0,0681
UNED. ELCHE.
= 0,1362. Observamos que
www.innova.uned.es/webpages/Ilde/Web/index.htm
0,1362TUTORÍA
> 0,05,
DE es decir, no
ESTADÍSTICA se rechaza
EMPRESARIAL la hipótesis
(Código: 65022076) (2ºnula.
GRADO A.D.E.) imozas@elx.uned.es
9
Efectuada una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
Solución.-
estimador para esa realización muestral: f(x1, x2, ..., xn).
a) La variable X = X1 +X2 + X3 es normal N 59, 4 9 25 N 59, 38 . Se tiene que
75 59
P(X > 75) = (tipificando) = P Z P(Z > 2,60) = (tablas) = 1 0,9953 = 0,0047.
Respuesta 38
UnLa
b) contraste
variabledeY,hipótesis es paramétrico
suma delas 18 variables cuando las hipótesis
independientes se refieren
normales N(26, 3)al será
valornormal
de un
parámetro desconocido de la población (como por ejemplo , , ...).
N 18·26Es
no·9paramétrico
, 18
N 468,9 cuando las hipótesis
2 , luego P[450 se < refieren
Y < a500]
18
= P no paramétricas
características Z
32
(forma de la distribución, localización, aleatoriedad de una muestra...) 9 2 9 2
P[1,41 < Z < 2,51] = (tablas) = 0,9940 0,0793 = 0,9147
PROBLEMAS
Solución.-
X
a) La variable n se distribuye como una t-Student con n1 grados de libertad.
S
S S
El intervalo de confianza tendrá la forma X t , X t .
2 n 2 n
10
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
En las tablas de la t-Student no aparece t49. Un valor aproximado nos lo proporciona t50.
Para el 95% de confianza obtenemos que t 0,95 2,009 . Para los datos obtenidos de la muestra
UNED. ELCHE. 2 www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
0,1634
imozas@elx.uned.es
0,1634
será pues: 1,1721 2,009 , 1,1721 2,009 [1,1257 ; 1,2186].
Solución.- 50 50
b) Planteamos el contraste:
a) El número M de intentos de robo mensuales es una variable aleatoria de Poisson con
H0: ≥ 0,2
= 2. Obtenemos de las tablas que P[M =0] = 0,1353.
H1: < 0,2
b) El número T de intentos de 1S 2por trimestre será una variable de2 Poisson con = 6,
n robo
> 7] = 1 deP[T
El estadístico
luego P[T ≤ 6] es
prueba = (tablas) = 1que 0,6063
se distribuye según una con n1 grados de
= 0,3937.
2
c) El número B de intentos de robo en 2 años será una variable de Poisson con = 48,
libertad.
que esEnaproximadamente
las tablas de la 2 normal
no aparece N 48
249, . 48 N(48;
Un valor 6,9282),
aproximado nos luego P[B < 20]
lo proporciona 2 =
50 , de
20 48 el 90% de confianza, la región crítica sería el intervalo
cuya = P Z que, para
tabla obtenemos
=(tipificando) P[Z < 4,04] 0
,9282
[0; 37,69]. El valor del 6estadístico, para los datos de la muestra, suponiendo cierta H0, es
2
d) El
49·0,1634 número de intentos de robo ocurren de manera independiente, a lo largo de un
32,71, que pertenece a la región crítica, luego debemos rechazar H0, es decir, no
periodo 2 de tiempo, de ahí que se trate de una distribución de Poisson.
0,2UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
podemos En el DE
TUTORÍA apartado
admitir ESTADÍSTICA
que hay al ser (Código:
c, EMPRESARIAL
competencia,> 10, hemos deaproximado
65022076)
al nivel (2º la 90%.
GRADO A.D.E.)
confianza del variable de Poisson por una
imozas@elx.uned.es
normal.
JUNIO 2017- 1ª SEMANA
= 100Desarrollando
y L = 2·50 = la
100expresión anterior, se obtiene que ECM( ̂ ) = Var( ̂ ) + (Sesgo( ̂ ))2
Se considera que el mejor
Sustituyendo estimador
se obtiene que n de será aquel
= 15,3664, por loqueque
tenga el menorn error
tomaremos = 16.cuadrático medio
entre todos los posibles estimadores de y, por lo tanto, los dos sumandos en que se
descompone, sean lo mínimos posible, aunque no siempre existirá tal estimador.
E(S30) = 30·6 = 180 y, como las Xi son independientes, Var(S30) = 30·6 = 180. Luego, por el
teoremaRespuesta.-
central del límite, podemos considerar que la variable S30 es aproximadamente normal
Los factores son el coeficiente de confianza 1 y la amplitud del intervalo. Para un
N 180, 180de. confianza
coeficiente Luego P[150 fijo,<cuanto
S30 < menor
200] = sea
(tipificamos)
la amplitud= del
150 180
P intervalo, más
200 180
Z precisa será la
estimación, o bien para una misma amplitud del intervalo, cuanto mayor 180 de
180 sea el coeficiente
P[2,24 mayor
confianza < Z < 1,49] (tablas) = 0,9319 0,0125 = 0,9194
será la= precisión.
Respuesta.-
Cuando se trate de contrastar si la muestra procede de una población normal de la que se
desconocen la media y la varianza.
PROBLEMAS
Solución.-
Sea X el volumen de ingresos mensuales de una empresa y el ingreso medio mensual
–1/3– X Junio 2017. 2ª semana
de las empresas del sector. Sabemos que la variable T = n sigue una distribución
S
t-Student con n1 grados de libertad. Luego;
S S
a) El intervalo toma la forma X t ,X t . Para un nivel de confianza del
2 n 2 n
90% y n1 = 17 grados de libertad, t = (tablas) = 1,74. Luego el intervalo será:
2
30000 30000
185000 1,74 18 ,185000 1,74 18 [172696, 197304]
UNED. ELCHE. http://www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
b) Plantearemos el contraste:
H0: = 170000
H1: 170000
De acuerdo con las tablas de la t-Student para 17 grados
–2/3– Junio 2017. 2ª semana
de libertad, la región crítica para el 95% de confianza es
t > 2,11. Como el estadístico de prueba
X 185000 170000
n 18 2,1213 debemos rechazar
S 30000
la hipótesis nula.
12
Estadística Empresarial
Preguntas de exámenes Tema 8: Contrastes de
hipótesis paramétricas
1
1
Si es discreta, su función de probabilidad es P(Xi) = , i = 1, 2, 3, ...n y cero en el
n
Tema resto.
8: Contrastes de hipótesis paramétricas
Solución.-
1.- Sea Xi la variable aleatoria “nº de turismos 1 matriculados el día i-ésimo”,
i = 1, 2, , axb
Si …, 250. Podemos
es continua, considerar
su función que lasesvariables
de densidad f(x) = bXi ason independientes. Luego, por el
teorema central del límite, la variable X = X i se0distribuye
250
, resto aproximadamente normal
i 1
N 250·2190 , 250·90000 N(547500, 4743,4).
365
2.- La variable Y = X i
Respuesta.- se distribuye aproximadamente normal
Si el tamaño de la muestra permanece i 1 fijo, entonces si disminuye la probabilidad de
error
N 365de tipo, I, 365
·2190 aumenta
·90000la probabilidad
N(799350;de5731,49),
error de tipo II. P(Y ≤ 800000) = (tipificando) =
luego
Si el tamaño de la muestra aumenta, entonces, para un nivel de significación fijo, la
650 de tipo II disminuye
P Z
probabilidad
= P(Z ≤ 0,1134) = (tablas) = 0,5451.
de error
5731,49
Respuesta.-
Es un contraste de comparación de más de dos poblaciones. La hipótesis nula es que
todas las distribuciones son iguales y la hipótesis alternativa que, al menos dos, son diferentes.
Solución.-
Si p es la proporción real de clientes que genera el 80% de las ventas, las hipótesis a
contrastar son:
H0: p = 0,2
H1: p ≠ 0,2
p̂ 0,2 p̂ 0,2
y el estadístico de prueba que se distribuye aproximadamente normal
0,2·0,8 –1/2–
0,02 Junio 2012. 2ª semana
400
N(0, 1).
Para = 0,05, los valores críticos son z0,025 = 1,96 y z0,025 = 1,96.
97
0,2
0,2425 0,2
Como zexp = 400 = 2,125 > 1,96, se rechaza la hipótesis nula.
0,02 0,02
El p-valor = P[Z>2,125] = 2·0,017 = 0,034, lo que también indica que se rechaza H0,
pues p-valor < 0,05.
2
c) Obviamente, el 50% ya que la distribución es normal y por tanto simétrica respecto
de la media.
Solución.-
El contraste solicitado sería:
H0: = 59800
H1: 59800
X 59800
La variable 20 se distribuye como una t-Student con 19 grados de libertad.
20030
Para un nivel de significación del 5%, el intervalo de aceptación sería
X 59800
–2,093 < 20 < 2,093 ↔ 50426 < X < 69174
20030
Puesto que la media muestral obtenida se encuentra dentro de este intervalo, no
podemos
25 admitir, al nivel de significación pedido, que las ventas medias sean mayores o
menores que las ventas medias del sector.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Solución.-
Planteamos el contraste:
H0: = 1960
H1: 1960
X 1960
Bajo la hipótesis nula, la variable 150 es normal N(0,1). En las tablas de la
300
normal N(0,1) encontramos que 0,05 = P(|Z|> 1,96), que define la región crítica. Como
1820 1960
150 5,72, debe rechazarse la hipótesis dada por el INE
300
3
Solución.-
distribución de la variable aleatoria, como por ejemplo la función de densidad o de cuantía.
El número Xsedehace
Esta determinación personas
a partirque
de lacompran un díacontenida
información cualquiera, serámuestra
en una una variable binomial
aleatoria.
B(300; 0,3) que se distribuye aproximadamente normal N 300·0,3, 300·0,3·0,7 N 90, 63 .
Así pues:
Respuesta.- 100 90
P(X > 100) = P Z P(Z>1,26) = 1 – 0,8962 = 0,1038
a)
Sea un parámetro desconocido
63 y , un intervalo de confianza al nivel 100(1–)%.
Supongamos quese desea50 90
contrastar la hipótesis:
b) P(X <50) = P Z P(Z < −5,04) = 0
H0: = 0 63
H1: 0 50 90 150 90
c) P(50 < X < P Entonces
150) = .
con un nivel de significación
63 63
P(−5,04
Zserechazará H < Z < 7,56) = 1
0 si y sólo si ,
32
Respuesta.-
Para un nivel de significación fijo, al aumentar el tamaño muestral disminuye el error
de tipo II, = P[Aceptar H0/H0 falsa], por tanto, aumenta la potencia del contraste 1 – =
= P[Rechazar H0/H0 falsa]. Si representamos la curva de potencia para dos tamaños muestrales,
p. ej. n = 25 y n = 100, se obtienen curvas del tipo:
1
n=100
n=25
= 0 1
Respuesta.- 4
Un estimador ̂ n de un parámetro , obtenido de una muestra de tamaño n, es
consistente en probabilidad si > 0, se cumple que lim P ˆ 1 .
n
n
N 300·3200
muestral
1
Xi X2 N 960000 ,7000 3 N(960000;12124,36)
S2 , 300·490000
n i 1
60000 10000
2.- P(900000 < X < 950000) = P Z P(–4,95 < Z < –0,82)
12124 ,36 12124 ,36
0,2061 – 0 = 0,2061.
Respuesta.-
3.- En las tablas
Utilizaremos de la normal
un intervalo N(0,1) encontramos
de confianza que 0,98
cuando deseemos = P(Z
hacer una<estimación
2,06), luego
delsivalor
x es
de un determinado parámetro de la distribución. x 960000
el número de vehículos
Utilizaremos que buscamos
el contraste se tendrá
de hipótesis cuando 2,06
quedeseemos aceptar de donde
o rechazar unasehipótesis
obtiene
12124 ,36
acerca de alguna característica (por ejemplo el valor de un parámetro) de la población.
que x 984976
Respuesta.-
Supongamos una variable aleatoria para la que se supone que su distribución,
desconocida, se ajusta a un determinado modelo. Un contraste de bondad de ajuste permite
decidir,
41 partiendo de una muestra, si la variable se distribuye o no de acuerdo con el modelo
especificado.
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Respuesta.-
Solución.-
Distribución ji-cuadrado de Pearson con n grados de libertad:
a) Sea lan venta media semanal. Planteamos el contraste de la siguiente forma:
38
0: X
2n H ≤ i230000
, donde las variables Xi son independientes y normales N(0,1)
H1:i 1 > 30000
UNED. ELCHE. –1/3– www.innova.uned.es/webpages/Ilde/Web/index.htm
Junio 2014. 1ª semana
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
Distribución t de Student con n grados de libertad:
U X 30000 –2/3– Junio 2014. 1ª semana
t , donde U
Si nX es la media muestral, y V son variables independientes, U normal N(0,1)
15 se distribuye aproximadamente y V 2nt-Student
V 12000000
con 14 grados de n libertad. De la tabla de la t-Student con 14 grados de libertad obtenemos que
37000 30000
0,95 = P(t14 < 1,761). Como 15 7,83 > 1,761, debemos rechazar la hipótesis
12000000
nula y admitir que las ventas medias semanales son mayores que 30000.
Respuesta.-
b) p-valor
Porque 7,83) 0. un intervalo con una alta probabilidad (coeficiente de
= P(t14 > construir
deseamos
confianza) de encontrar en él el parámetro desconocido.
Respuesta.-
En un contraste de hipótesis y supuesta cierta la hipótesis nula H0, se denomina p-valor
a la probabilidad de obtener un valor del estadístico de prueba que sea al menos tan improbable
como el valor experimental observado.
Respuesta.-
Se pretende contrastar el valor de alguna medida de posición (un cuantil como por
ejemplo la mediana) para localizar estadísticamente la distribución.
PROBLEMAS
5
N 90 , 90
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
2 12 imozas@elx.uned.es
Respuesta.-
El test de signos no utiliza mucha de la información contenida en los datos pues se basa
sólo en el signo de las diferencias entre cada observación y la mediana, mientras que el test de
rangos-signos de Wilcoxon tiene en cuenta el signo y la magnitud de las diferencias.
PROBLEMAS
Solución.-
X
a) La variable n es tn1 y el intervalo de confianza tiene la forma
S
S S
X t Solución.-
,X t . De las tablas de la t-Student con 59 grados de libertad y = 0,025
n
Sea Xi la variable
2 2 n
aleatoria “demanda del día i”, i = 1, 2, …, 100 que supondremos
2
100 100 4000 4000
obtenemos que t = 2, luego el intervalo es 15000 ,15000
independientes. Sea S2 = X i . Se tiene que E(S) = EX i = 300000
60 60 =
y Var(S)
[14483,60
100
; 15516,40]. i 1 i 1
= i 1
Var X i = 810000,
b) Planteamos
H
el contraste:
0 :
de donde S = 810000 = 900. Entonces:
= 17000
a) de acuerdo 1conel17000
H : teorema central del límite, S se distribuye aproximadamente
normalEl intervalo900);
N(300000, de 0,9 de probabilidad de la t-Student con 59 grados de libertad es
[1,671 ; 1.671] luego la región crítica es el exterior 2000 de este intervalo. Para los datos del
b) P(S > 298000) = (tipificando) = P Z
X 15000 = p(Z > –2,22) = (tablas) = 0,9868.
17000
problema, el estadístico de prueba n 900 60 7,75, luego, a este nivel
c) Sea n la producción de refrescos S busca. Deberá ser P[S n] = 0,99
que se 2000
de significación,
n 300000no puede aceptarse lo afirmado por el consenso
n 300000 general.
P Z = 0,99. De las tablas se obtiene que 2,33 n = 302097.
900 900
6
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
64
Solución.-
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
El contraste
TUTORÍA sería: EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
DE ESTADÍSTICA imozas@elx.uned.es
H0: < 18
SEPTIEMBRE 2015
H1: ≥ 18
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Podemos considerar que n = 50 es suficientemente grande de forma que, bajo la
hipótesis nula, la media muestral X es aproximadamente normal N18,
Respuesta.- . Puesto que
50
La covarianza es un momento bidimensional y como tal es una magnitud cuya unidad es
desconocemos
el producto de las unidades
(desviación típica
de las poblacional),
variables, mientrastomaremos como una
que el coeficiente estimaciónque
de correlación, la
desviación típica de lala muestra,
resulta de estandarizar covarianzadedividiéndola
forma que por supondremos
el productoque es aproximadamente
de lasXdesviaciones típicas de
las
variables, 13
es,
como su nombre indica, un coeficiente y carece de unidades. Aunque ambas
normal N18, N(18; 1,84).
miden la fuerza50de la relación lineal de las variables, la covarianza no puede usarse para
comparar la relación
a) Para un nivellineal de dos distribuciones
de significación del 0,05% bidimensionales
= 0,0005distintas
y de las pues
tablasdepende de las
de la normal
unidades en que se expresen.
N(0, 1) obtenemos que el valor crítico es 3,27.
19,4 18
El estadístico de prueba es 0,76, luego no se puede rechazar la hipótesis nula
Respuesta.- 1,84
ya que Consideremos
no se supera el una valormuestra
crítico. aleatoria {x1, ..., xn} de tamaño n de una población con
PZ 0,76 = 0,2236. EnSeeste
funciónb) de distribución F(x). define la función
caso tampoco de distribución
se rechaza la hipótesis empírica
nula por que como el
p-valor N ( x )
Fn(x) = 0,2236, donde
> 0,001N(x) es el número de valores de la muestra, menores o iguales que x.
n
Respuesta.-
Es la probabilidad de rechazar la hipótesis nula H0. Si representamos por la
probabilidad del error de tipo I, es decir la probabilidad de rechazar H0, siendo cierta y por la
probabilidad del error de tipo II, es decir, la probabilidad de aceptar H0, siendo falsa, entonces
, si H 0 cierta
la potencia del contraste es la función P =
1 , si H 0 falsa
Respuesta.-
Supongamos dos muestras de dos poblaciones independientes con distribuciones F(x) y
F(y). El contraste de la mediana nos llevará a aceptar que las distribuciones son iguales
siempre y cuando las medianas sean iguales. Es básicamente un contraste de igualdad de las
medianas de dos poblaciones independientes.
PROBLEMAS
Solución.-
La variable X =” nº de prendas defectuosas de la muestra” se distribuye como una
binomial B(30; 0,01), Luego:
–3/3– Junio 2015. 2ª semana
7
y p < 0,1.
Solución.-
Plantearemos el contraste:
H0: = 15
H1: 15
Podemos considerar que n = 20 es suficientemente grande de forma que, bajo la
hipótesis nula, la media muestral X es aproximadamente normal N15, . Puesto que
20
desconocemos (desviación típica poblacional), tomaremos como una estimación la
desviación típica de la muestra, de forma que supondremos que X es aproximadamente
6
normal N15, N(15; 1,34).
20
a) El intervalo del 95% de confianza para la N(0,1) centrado en el origen es (tablas)
17 15
[1,96; 1,96]. Como 1,49 pertenece a dicho intervalo, podemos afirmar, con el 95%
1,34
de 66
confianza, que los desarrolladores están en lo cierto.
b) P(Z > 1,49) = 0,0681, luego el p-valor será 2·0,0681
UNED. ELCHE.
= 0,1362. Observamos que
www.innova.uned.es/webpages/Ilde/Web/index.htm
0,1362TUTORÍA
> 0,05,DEes decir, no se rechaza la hipótesis nula.
ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
8
Efectuada una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
estimador para esa realización muestral: f(x1, x2, ..., xn).
Respuesta
Un contraste de hipótesis es paramétrico cuando las hipótesis se refieren al valor de un
parámetro desconocido de la población (como por ejemplo , , ...).
Es no paramétrico cuando las hipótesis se refieren a características no paramétricas
(forma de la distribución, localización, aleatoriedad de una muestra...)
PROBLEMAS
71
Solución.-
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
a) Sea X el tiempo de entrega y = E(X) el tiempo medio. El contraste sería:
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
–1/3– Septiembre 2015. Reserva.
H1: ≤ 20
X X 20
Como X es normal, la variable n 21 , bajo la hipótesis nula, es
S 5
aproximadamente t.Student con 20 grados de libertad: En la tabla de la t20 encontramos que
X 20 17 20
0,05 = P(t20 < 1,725). Puesto que el estadístico de prueba 21 21 2,75 <
5 5
< 1,725, debería no admitirse la hipótesis nula.
b) El p-valor es P(t20 < 2,75). De las tablas de la t20 obtenemos que P(t20 < 2,845) =
Pt 20 2,75 0,005 0,01 0,005
= 0.005 y P(t20 < 2,528) = 0,01. Interpolando: de
2,75 2,845 2,528 2,845
donde P(t20 < 1,725) 0,0065.
9
80 56.04
P(Y > 80) P Z P(Z > 3,4) = 0,0003
6,94
Respuesta.-
En una distribución bidimensional de variables (X, Y), la covarianza es el momento
11= Cov(X,Y)
Solución.-= E[(X-E(X))(YE(Y)] y es una medida de la fuerza de la relación lineal
entre Xa)e Si
Y.p es la proporción de audiencia del programa, el contraste lo planteamos:
H0: p ≤ 0,2
El coeficiente de correlación lineal resulta de estandarizar la covarianza, dividiéndola
H1: p > 0,2
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
Cov (X, Yimozas@elx.uned.es
)
por el TUTORÍA
productoDE ESTADÍSTICA EMPRESARIAL (Código:
de las desviaciones típicas65022076)
de las(2ºvariables: XY
GRADO A.D.E.) , por lo
Var (X(·Var (Y)
p̂ p 0 p̂ 0,2 p̂ 0,2
que carece de magnitud.
El estadístico Proporciona
de prueba zexp =una medida
numérica del grado enesque las variables
normal N(0,1),
están relacionadas linealmente. p 0 1 p 0 0,2·0,8 0,0283
n 200
–2/3– Junio 2016. 1ª semana
luego, Respuesta.-
para un 5% de significación, la región crítica es el intervalo [1,65; +[. Como
48
200
0El,2error cuadrático medio (ECM) de un estimador ̂ de un parámetro es E ˆ . 2
1,41,
seráno podemos
cuantorechazar la hipótesis
su ECM.nula.
Un estimador mejor menor sea
0,0283
ˆ E ˆ E ˆ 2 E ˆ 2 = Var( ̂ ) + Sesgo2( ̂ ), luego
2
Si El
b) se p-valor
desarrolla,
sería E P(Z
> 1,41) = (tablas) = 0,0793
tendrá menor ECM aquel estimador cuya varianza y cuyo sesgo sean menores.
Respuesta.-
Sea , el intervalo de confianza para un parámetro al nivel de confianza
100(1)%, es decir P = 1 .
Supongamos ahora que se desea efectuar el contraste bilateral:
H0: = 0
H1: 0
con un nivel de significación . Entonces la región de aceptación es el intervalo de confianza.
Respuesta.-
Supongamos una variable aleatoria para la que se supone que su distribución,
desconocida, se ajusta a un determinado modelo. Un contraste de bondad de ajuste permite
decidir, partiendo de una muestra, si la variable se distribuye o no de acuerdo con el modelo
especificado.
El planteamiento general sería:
H0: La muestra aleatoria procede de una población con función de distribución F(x)
H1: La muestra aleatoria no procede de una población con función de distribución F(x)
10
–1/3– Junio 2016. 2ª semana
9 2 9 2
P[1,41 < Z < 2,51] = (tablas) = 0,9940 0,0793 = 0,9147
Solución.-
X
a) La variable n se distribuye como una t-Student con n1 grados de libertad.
S
S S
El intervalo de confianza tendrá la forma X t , X t .
UNED.
UNED. ELCHE.
ELCHE. 2 n n
www.innova.uned.es/webpages/Ilde/Web/index.htm
www.innova.uned.es/webpages/Ilde/Web/index.htm
2
TUTORÍA
TUTORÍA DE
DE ESTADÍSTICA
ESTADÍSTICA EMPRESARIAL
EMPRESARIAL (Código:
(Código: 65022076)
65022076) (2º
(2º GRADO
GRADO A.D.E.)
A.D.E.) imozas@elx.uned.es
imozas@elx.uned.es
SEPTIEMBRE
En las tablas de la t-Student no aparece t49. Un2016
valor aproximado nos lo proporciona t50.
–2/3– Junio 2016. 2ª semana
Para elPRIMERA PARTE:
95% de confianza CUESTIONES
obtenemos 2,009
que t 0,95TEÓRICO-CONCEPTUALES
. Para los datos obtenidos de la muestra
2
0,1634 0,1634
será pues: 1,1721 2,009 , 1,1721 2,009 [1,1257 ; 1,2186].
Respuesta.- 50 50
Si X es una variable
b) Planteamos aleatoria con media y desviación típica , se llama variable
el contraste:
X 0: ≥entonces
0,2
tipificada a Y = . SeHdice que hemos aplicado a la variable X un cambio de
H1: < 0,2
origen y de escala de forma que E(Y)
El estadístico de prueba es
n =10Sy2 DT(Y) =1
que se distribuye según una 2 con n1 grados de
2
libertad.
En las tablas de la 2 no aparece 249 . Un valor aproximado nos lo proporciona 50
Respuesta.- 2
, de
Sea X una variable aleatoria cuya distribución depende de
cuya tabla obtenemos que, para el 90% de confianza, la región crítica sería el intervalo un parámetro . Sea
{X , X , ...,
[0; 137,69].2 El valor del X n estadístico, para los datos de la muestra, suponiendo cierta H0, por
} una muestra aleatoria simple y representemos es
L(x 1 , x 2 , 2 n, ) la función de probabilidad (si X es discreta) o de densidad (si X es continua)
...,x
49·0,1634
de la muestra, 32,71,
a la que
quepertenece
llamaremosa la región
funcióncrítica, luego debemos
de verosimilitud El rechazar
método Hde0, es
la decir,
máximano
0,2 2
verosimilitud consiste en elegir como estimador de el valor que maximiza *
podemos admitir que hay competencia, al nivel de confianza del 90%.
L(x1, x2, ...,xn, ) y al que denominaremos estimador de máxima verosimilitud del parámetro .
Respuesta.-
En un contraste, se llama nivel de significación el tamaño de la región crítica o de
rechazo, es decir, el valor máximo de P(rechazar H0/H0 es cierta)
Respuesta.-
Supongamos dos muestras de dos poblaciones independientes con distribuciones F(x) y
F(y). El contraste de la mediana nos llevará a aceptar que las distribuciones son iguales
siempre y cuando las medianas sean iguales.
11 Es básicamente un contraste de igualdad de las
medianas de dos poblaciones independientes.
12380,58 12380,58
= 0,67 0,4013 = 0,2687. luego el porcentaje es el 26,87%.
2.- Unos inversores quieren comprar una web de contenidos cuyos dueños aseguran que
reciben al menos unas 10.000 visitas diarias. El analista externo contratado por los inversores
no está de acuerdo con dicho dato y por ello realiza un estudio, del cual y con una muestra
tornada durante 20 días se obtiene un resultado de 8.600 visitas medias diarias con una
varianza de 1.440.000. Con esta información y suponiendo un comportamiento normal de la
variable estudiada, los inversores buscan:
a) Contrastar a un nivel de significación del 0,05 el valor de las visitas medias diarias.
b) Y obtener el p-valor.
Solución.-
Sea X el número de visitas diarias. Como desconocemos , utilizaremos el estadístico
X
n que es t-Student con n1 grados de libertad.
s
a) El contraste sería:
H0: ≥ 10000
H1: < 10000
En la tabla de la t-Student con 19 grados de libertad encontramos que 0,05 =
8600 10000
= P[t19 < 1,729]. El estadístico de prueba 20 5,22 < 1,729, luego
1440000
debemos rechazar la hipótesis nula.
b) p-valor = PX 8600 Pt19 5,22 0
12
180 180
P[2,24 < Z < 1,49] = (tablas) = 0,9319 0,0125 = 0,9194
Solución.-
Sea X el volumen de ingresos mensuales de una empresa y el ingreso medio mensual
X
de las empresas del sector. Sabemos que la variable T = n sigue una distribución
S
t-Student con n1 grados de libertad. Luego;
S S
a) El intervalo toma la forma X t ,X t . Para un nivel de confianza del
2 n 2 n
90% y n1 = 17 grados de libertad, t = (tablas) = 1,74. Luego el intervalo será:
2
30000 30000
185000 1,74 18 ,185000 1,74 18 [172696, 197304]
UNED. ELCHE. http://www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
b) Plantearemos el contraste:
H0: = 170000
H1: 170000
De acuerdo con las tablas de la t-Student para 17 grados
–2/3– Junio 2017. 2ª semana
de libertad, la región crítica para el 95% de confianza es
t > 2,11. Como el estadístico de prueba
X 185000 170000
n 18 2,1213 debemos rechazar
S 30000
la hipótesis nula.
13
Solución.-
Respuesta.-
a) Sea X el número de turismos matriculados mensualmente. Se tiene que
Sea , el intervalo de confianza
560 570
para un 650 570 al nivel de confianza
parámetro
P560 X 650 = (tipificamos) = P Z P(1,15 < Z < 9,24)
100(1)%, es decir P = 1 . 75 75
1 0,1251
Supongamos ahora que se desea efectuar el contraste bilateral:
= 0,8749.
0 : = 0 buscado. Se tendrá que 0,9 = P(X < x) = (tipificamos) =
b) Sea x el Hnúmero
x 570 H1: 0 x 570
= P Z
con un nivel 75 . En las
de significación tablas encontramos que debe ser aproximadamente
. Entonces la región de aceptación es el intervalo de 75 = 1,29
confianza.
x 581
Respuesta.-
Las rachas se utilizan para contrastar la aleatoriedad de una muestra y ello porque el
número de rachas de la muestra puede usarse como estadístico para el análisis de la
aleatoriedad (por ejemplo, un número pequeño o un número grande de rachas indicará que
debemos rechazar la hipótesis de que la muestra es aleatoria)
–1/2– Septiembre 2017.
Solución.-
a) Sea el ingreso medio por filial en el mes de agosto. Planteamos el contraste de la
siguiente forma:
H0: > 5548
H1: ≤ 5548
X 5548
Si X es la media muestral, 21 se distribuye aproximadamente t-Student con
1950
20 grados de libertad. De la tabla de la t-Student con 20 grados de libertad obtenemos que
5520 5548
0,95 = P(t 20 > 1,725). Como 21 2,95 < 1,725, debemos rechazar la
1950
hipótesis nula y admitir que el ingreso medio por filial en el mes de agosto no supera los
5548 €.
b) El p-valor es p = P(t20 < 2,95). En la tabla de la t-Student encontramos que
P(t20 < 3,552) = 0,001 y P(t20 < 2,854) = 0,005. Luego, por interpolación:
0,005 0,001 p 0.001
3,552 2,845 3,552 2,95
obtenemos que p 0,004.
14
Estadística Empresarial Tema 9: Contrastes no
Preguntas de exámenes paramétricos y de bondad
de ajuste
1
Un
UNED.estimador
ELCHE. ̂ n de un parámetro , obtenido de una muestra de tamaño n, es
www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
consistente en probabilidad si > 0, se cumple que lim P ˆ n 1 . imozas@elx.uned.es
Tema 9: Contrastes no paramétricos JUNIO 2012-y2ªde bondad
n
SEMANA de ajuste 2
También se dice que ̂ n es consistente en media cuadrática si lim E ˆ n 0 .
n
PRIMERA
En ambos casos PARTE: CUESTIONES
significa que, a mayor TEÓRICO-CONCEPTUALES
tamaño de la muestra, más se asemeja el
estimador (en probabilidad o en media cuadrática) al parámetro.
Respuesta.-
Solución.-
La
El Cov(X,XY)
número de =seguros
E[(XE(X))(YE(Y))]
de tipo A vendidos podría considerarse
es binomial comoSeuna
B(15; 0,3). medida de la
tendrá:
Respuesta.-
fuerza a)deP(X=7)
la relación lineal entre X e Y. También el coeficiente de correlación lineal
Se utiliza =para 0,0811 contrastar si dos poblaciones diferentes X e Y con funciones de
b) P(XF(x)
Cov ≤ 5)y =F(y),
( X , Y ) 0,7216
XY
distribución .de las la
Pero que se han obtenido
covarianza sendas muestras
es una magnitud aleatorias
cuya unidad es el independientes,
producto de las
Var ( X )·Var ( Y ) 4decir,
P[X es ] 0,5155
tienen la misma distribución,
c) P[X≤4/X≤6] = F(z) = 0,5933
G(z) .
unidades en que se expresan P[X X 6e]Y, 0mientras
,8686 que el coeficiente de correlación lineal carece de
unidades
11 y permite comparar la fuerza de la relación lineal de dos poblaciones
bidimensionales,
UNED. ELCHE.
cosa que no permite la covarianza. www.innova.uned.es/webpages/Ilde/Web/index.htm
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
SEPTIEMBRE 2012
Respuesta.-
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
Una variable aleatoria X sigue una distribución uniforme en un intervalo [a, b], si la
probabilidad de que X pertenezca a un subintervalo de longitud d es proporcional a d.
Respuesta.-
–1/2–es P(Xi) = 1 , i = 1, 2, 3, ...n Junio 2012. 1ª semana
Si es discreta, su función de probabilidad X an y cero en el
Consideremos la variable aleatoria X y sea Y = , donde a y b son constantes,
resto. b
X a Var X a Var ( X)
0. Se tiene que Var(Y) = Var
bSolución.- 1 ,2 a .Así x pues,
b la varianza no se
2
Si es continua,
El contraste es: su función de b
densidad es b
f(x) = b ab
ve afectada por el cambio H0: Mede≤150origen pero sí se ve afectada 0, el resto
cambio de escala de forma que si
2
una variable se divide H1por
: Me b,>su150
varianza se ve dividida por b .
1
Para un nivel de significación del 5% encontramos en la tabla de la binomial B 10,
Respuesta.- 2
que P(X Respuesta.-
Si >el 7) = 1 –de
tamaño la muestra
0,9453 permanece
= 0,0547. Puestofijo,
queentonces
el número si de
disminuye
precios la
de probabilidad
la muestra que de
error Sea
de tipo X I, una variable
aumenta la aleatoria
probabilidad dedeuna determinada
error de tipo II. población
superan 150 es de 6, no podemos rechazar la hipótesis nula y, en conclusión, no podemos y {X 1 , X 2 , ..., X n} una
muestra
afirmarSiquedela
el tamaño
tamaño de n.
vivienda la Se
másdenomina
seamuestra aumenta,
cara estimador,
entonces,
de lo que a cualquier
se cree.para un nivel defunción de la muestra
significación fijo, la
probabilidad
f X1 , X 2 ,..., Xden error
, que de
será unaIIvariable
tipo disminuyealeatoria, al serlo las Xi.
Efectuada una realización muestral {x1, x2, ..., xn}, una estimación sería el valor del
estimador para esa realización muestral: f(x1, x2, ..., xn).
Respuesta.-
Es un contraste de comparación de más de dos poblaciones. La hipótesis nula es que
todas las distribuciones son iguales y la hipótesis alternativa que, al menos dos, son diferentes.
Respuesta.-
Con un nivel de confianza dado, al aumentar el tamaño de la muestra, disminuye la
amplitud del intervalo de confianza-.
–2/2– Junio 2012. 1ª semana
Respuesta.-
Para contrastar el valor de las medidas de posición, como los cuantiles.
PROBLEMAS
Solución.-
Siendo p la proporción de personas que han comprado alguna vez usando internet, la
1
2
ln
f( x, )
2
3
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
n
b Utilizaremos el2 contraste
x de hipótesis cuando deseemos aceptar o rechazar una hipótesis
= f
acerca( x ) dx 2
yF(x) =
X , f
de alguna característica
n i
( t
donde) dt las
(porvariables
JUNIO
ejemplo Xi
el son
2015- independientes
1ª SEMANA
valor y normales
de un parámetro) N(0,1)
de la población.
a
i 1
DistribuciónPARTE:
PRIMERA t de Student con n grados de
CUESTIONES libertad:
TEÓRICO-CONCEPTUALES
U
tn , donde U y V son variables independientes, U normal N(0,1) y V 2n
Respuesta.- V
Supongamos
Respuesta.- una variable aleatoria para la que se supone que su distribución,
n
desconocida, se ajusta
Una variable a un determinado
aleatoria X de Poisson modelo. Un contraste
de parámetro es una de variable
bondad de ajuste discreta
aleatoria permite
46 Respuesta.-
decidir, partiendo de una muestra, si la variable se distribuye ox no de acuerdo con el modelo
que Si X
toma
especificado.losesvalores
binomial {0, B(n,
1, 2, p)3, con n > 30
4, .....} y taly pque
≤ 0,1, x ) considerar
P(Xpodemos e mientras queque
X se distribuye
una variable
UNED. ELCHE. www.innova.uned.es/webpages/Ilde/Web/index.htm
x!= np.
aproximadamente
Respuesta.- como una variable de Poisson de parámetro
TUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.) imozas@elx.uned.es
aleatoria
Esto X significa
Binomialque de parámetros (n,p) es una variable aleatoria discreta que toma los
Porque deseamos siconstruir
aumentamos indefinidamente
un intervalo con una un alta
número n de
probabilidadpruebas de Bernoulli
(coeficiente de
independientes, con probabilidad de éxito n
p, de forma que = np permanece constante, se
confianza)
valores {1, de encontrar
2, 3, ..., n} y en
tal él
que el parámetro p (1 p)
P(X x ) desconocido.x n x
n x
x
verifica que lim p x 1 p e
n x
Respuesta.-
Respuesta.-
n x x!
El
En número de rachas
un contraste se utiliza
de hipótesis como estadístico
y supuesta para contrastar
cierta la hipótesis nula H0la, sealeatoriedad de una
denomina p-valor
muestra. Y ello
a la probabilidad
Respuesta.- es por que un número pequeño o un número muy grande
de obtener un valor del estadístico de prueba que sea al menos tan improbable de rachas indicará que
la Respuesta.-
muestra
como elDados no es
valor dos aleatoria.
experimental observado.
A la desviación
PROBLEMAS estimadores
típica de insesgados ̂1 y ̂X
la media muestral 2 se llama error,estándar
delleparámetro se definede la eficiencia
la media. Su
de ̂1. a ̂ 2 como el cociente
Var ˆ 1
–1/3–
. Si este cociente es menor, igual Junio 2014. 1ª semana
valor esRespuesta.-
relativa o mayor que 1,
n Var ˆ
Se pretende contrastar el valor de 2alguna medida de posición (un cuantil como por
diremos
ejemplo que ̂1 es menos,
la mediana) igual o más
para localizar eficiente que la
estadísticamente ̂ 2 distribución.
, respectivamente.
PROBLEMAS
Respuesta.-
Respuesta.-
Solución.-
Sí. Si se conoce la distribución de la población, puede usarse el método pivotal o el
métodoEs
Sea un
X elcontraste
general gasto de localización
anual
de Neyman. de
Si una
no se familia para
conoce laladistribución
(hogar), mediana de una utilizarse
que se distribuye
puede población
normal en supuestamente
muchos).
N(27000, Se
casos
simétrica,
tendrá: que tiene en
la desigualdad de Chebychev.cuenta el signo y la magnitud de las diferencias.
12000 27000
0,1075 = P(X< 12000) = (tipificando)PROBLEMAS = P Z . De las tablas de la N(0,1)
15000
obtenemos que
Respuesta.- 1,24 12097. Luego:
Solución.-
Para verificar si una muestra aleatoria procede de una población con una cierta
La variable X = “ número Si es así,de= y clientes
2000 que compra 8000 el producto” se distribuye
P(25000 < Xde< probabilidad.
i=1, 2..k
Z es
una partición
distribución 35000) = (tipificando) {S
Pi}, = P(0,17 del <dominio
Z < 0,67)de la =
aproximadamente normal N 2000·0,15 Oi E i
; 2000 ·0,15 ·0
12097 ,85 N(300
12097
;15,97). Luego:
k 2
variable
a)aleatoria,
≥ 450)el estadístico
=0,4325 = P(Z 9,4)sedistribuye según una distribución con k1 2
P(X
= (tablas) = 0,7486 (tipificando)
= 0,3161
i 1
E i ≥ –1/2– 0. Septiembre 2014. Reserva
60 b) P(200 < X < 400) = (tipificando) = P(–6,26 < X < 6,26) 1
grados de libertad, donde Oi y Ei son el número de valores observados y esperados,
c) E(X) = 300
UNED. ELCHE. en el subconjunto Si.
respectivamente, www.innova.uned.es/webpages/Ilde/Web/index.htm
d) X se
TUTORÍA distribuyeEMPRESARIAL
DE ESTADÍSTICA realmente binomial
(Código: 65022076)B(2000; 0,15) pero, al ser np > imozas@elx.uned.es
(2º GRADO A.D.E.) 5 y p < ½
podemos aplicar el teorema de Moivre y aproximar X por una normal, como hemos hecho.
–1/2– Junio 2014. 2ª semana
Respuesta.-
El test de signos no utiliza mucha de la información contenida en los datos pues se basa
sólo en el signo de las diferencias entre cada observación y la mediana, mientras que el test de
rangos-signos de Wilcoxon tiene en cuenta el signo y la magnitud de las diferencias.
PROBLEMAS
–1/3– Junio 2015. 1ª semana
Solución.-
Para la muestra dada, la media muestral
4 es x 611,55 y la varianza muestral
Solución.-
Sea X = “notas de estadística en 2013”. Calculamos la media y la desviación típica:
Notas Marca de clase xi Estudiantes ni xini xi2ni
De 0 a 2 1 43 43 43
De 2 a 4 3 93 279 837
De 4 a 6 5 150 750 3750
De 6 a 8 7 109 763 5341
De 8 a 10 9 67 603 5427
462 2438 15398
2
2438 15398 2438
De donde x 5,28 ; s' 2 5,48 s’ 2,34
462 462 462
Si F(x) es la función de distribución de X, el contraste a efectuar es:
H0: F(x) se distribuye normal N(5,28 ; 2,34)
H1: F(x) no se distribuye normal N(5,28 ; 2,34)
Tipificamos las clases y usando las tablas de la normal N(0,1) calculamos las
probabilidades teóricas de cada clase:
Desviaciones n i np i
2
Clases tipificadas Probabilidades teóricas Frecuencias
(Li-1, Li] pi = F(Li)–F(Li–1) esperadas npi (ni–npi)2 np i
[–2,25 ; –1,40] 0,0687 31,74 126,76 3,99
(–1,40 ; –0,55] 0,2119 97,91 24,07 0,25
(–0,55 ; 0,31] 0,3285 151,78 3,18 0,02
(0,31 ; 1,16] 0,2563 118,43 88,83 0,75
(1,16 ; 2,02] 0,1006 46,47 421,60 9,07
14,08
El número de grados de libertad es 5 – 2 – 1 = 2
Como 22, 0,95 5,99 14,08 rechazamos la hipótesis nula.
5
por el producto de las desviaciones típicas de las variables: XY , por lo
, si H 0 cierta Var ( X (·Var ( Y )
la potencia del contraste es la función P =
que carece de magnitud. Proporciona una1medida , si H 0numérica
falsa del grado en que las variables
están relacionadas linealmente.
Respuesta.-
Respuesta.-
Si ̂ es un estimador
Supongamos de undeparámetro
dos muestras , se denomina
dos poblaciones sesgo del
independientes con estimador
distribucionesal valor
F(x)dey
Respuesta.-
E ̂ El. error cuadrático medio (ECM) de un estimador ̂ de un parámetro es E ˆ 2 .
F(y). ElUNED. ELCHE.
contraste de la mediana nos llevará a aceptar www.innova.uned.es/webpages/Ilde/Web/index.htm
que las distribuciones son iguales
siempreTUTORÍA DE ESTADÍSTICA EMPRESARIAL (Código: 65022076) (2º GRADO A.D.E.)
Siyelcuando
sesgo las medianaselsean
es positivo iguales.
estimador Es básicamente un contraste
y, en de
imozas@elx.uned.es
igualdad de las
sea susobreestima al parámetro caso contrario, lo
Un estimador será mejor cuanto menor ECM.
medianas
infraestima. de dos poblaciones independientes.
SEPTIEMBRE 2016
Si se desarrolla, E ˆ E ˆ E ˆ E ˆ = Var( ̂ ) + Sesgo ( ̂ ), luego
2 2 2
2
PRIMERA PARTE: CUESTIONES TEÓRICO-CONCEPTUALES
tendrá PROBLEMAS
menor ECM aquel estimador cuya varianza y cuyo sesgo sean menores.
Respuesta.-
Respuesta.-
Se
Si utilizan
X es una para contrastar
variable el valor
aleatoria con demedia
algunamedida de localización
y desviación típica ,(cuantiles).
se llama variable
Respuesta.-
Sea una población con una variable aleatoria X, y sea C el cuantil de orden p
X
p
tipificada
(0 < p Sea a Y, contrastes
< 1). Los = . Se
el intervalo dice entonces
de confianza
de localización que hemos aplicado
para unformular
se pueden a
parámetro la al nivel
variable
de cualquiera X un
de cambio
de las confianza
siguientes de
formas:
100(1)%, es decir
origen y de escala P que
de forma = 1 =.0 y DT(Y) = 1
E(Y)
I: H 0 : C p = k 0
Supongamos ahora que se desea efectuar II: Cp ≤ k0 bilateral:
Hel0:contraste III: H0: Cp ≥ k0
Solución.- H0: = 0
La variable
H1: CpXH =”
k0 nº de prendas defectuosas H1: Cp de> kla
0 muestra” se distribuye H1:como
Cp < kuna
1: 0
0
binomialRespuesta.-
B(30; 0,01), Luego:
con un nivel de significación . Entonces la región de aceptación es el intervalo de confianza.
Sea X una variable aleatoria cuya distribución depende de un parámetro . Sea
{X1, X2, ..., Xn} una muestra aleatoria simple y representemos por
L(x1, x2, ...,xn, ) la función de probabilidad (si X es discreta) o de densidad (si X es continua)
de la Respuesta.-
muestra, a la que llamaremos función –1/3–de verosimilitud El método de Septiembre la máxima
2015.
Supongamos
verosimilitud consiste una envariable
elegir aleatoria para la que
como estimador de se elsupone
valorque * suquedistribución,
maximiza
desconocida, se ajusta a un determinado modelo. Un contraste de bondad de ajuste permite
L(x1, x2, ...,xn, ) y al que denominaremos estimador de máxima verosimilitud del parámetro .
decidir, partiendo de una muestra, si la variable se distribuye o no de acuerdo con el modelo
especificado.
El planteamiento general sería:
Respuesta.-
H0: La muestra aleatoria procede de una población con función de distribución F(x)
H1: un
En La contraste,
muestra aleatoriase llamanonivel
procede de una población
de significación de de
con función
el tamaño distribución
la región críticaF(x)o de
rechazo, es decir, el valor máximo de P(rechazar –1/3–H0/H0 es cierta)
Junio 2016. 1ª semana
Respuesta.-
Supongamos dos muestras de dos poblaciones independientes con distribuciones F(x) y
F(y). El contraste de la mediana nos llevará a aceptar que las distribuciones son iguales
siempre y cuando las medianas sean iguales.–1/3– Junio 2016. 2ª semana
Es básicamente un contraste de igualdad de las
medianas de dos poblaciones independientes.
PROBLEMAS
Respuesta.-
Las rachas se utilizan para contrastar la aleatoriedad de una muestra y ello porque el
número de rachas de la muestra puede usarse como estadístico para el análisis de la
aleatoriedad (por ejemplo, un número pequeño o un número grande de rachas indicará que
debemos rechazar la hipótesis de que la muestra es aleatoria)
–1/2– Septiembre 2017.