Sie sind auf Seite 1von 16

CUESTIONARIO ESTADISTICA APLICADA

MODULO 1

La distribución normal se caracteriza por:


¡Correcto!
 Se define completamente por la media y la desviación estándar
 El promedio es siempre mayor que la mediana de la distribución
 La distribución está totalmente definida por su promedio aritmético o media
 El promedio es siempre igual a la mediana y no posee moda
 El máximo valor es siempre el doble del mínimo valor

Una variable aleatoria Y toma los valores 10, 15, 25 y 35 y las probabilidades de
ocurrencia conocidas son P(Y=10) = 0.3; P(Y=15) = 0.2; P(Y=25) = 0.4. Luego el valor
de P(Y=35) es:

 0.2
 0.3
 0.4
 0.1
 1

La moda de una distribución corresponde a:

 El valor con menos frecuencia de observación


 La diferencia entre el mayor y el menor valor observado
 El valor medio de la distribución
 El valor más frecuentemente observado
 El punto medio de las observaciones ordenadas de mayor a menor

Respecto de las medidas de tendencia central, podemos concluir que:

 Los parámetros son complementarios


 La moda es la medida más representativa
 La mediana es la medida más representativa
 La media es la medida más representativa
 La moda es la medida menos representativa
Si la distribución de las notas de un curso de economía respecto del 100% de los
estudiantes está dado por:
Mayor o igual que 1.0 y menor que 3.0: 10%
Mayor o igual que 3.0 y menor que 4.0: 15%
Mayor o igual que 4.0 y menor que 5.0: 35%
Mayor o igual que 5.0 y menor o igual que 7.0: 40%
La proporción de los alumnos aprobó el curso es de:

 0.40
 0.35
 0.75
 25
 0.15

Si la mediana de una distribución es de 12, eso quiere decir:

 Que la mitad de la población es 12


 Que hay 12 sujetos por debajo y 12 por sobre
 Que el 12% de la población está por debajo
 Que hay tantos sujetos por debajo de 12 como por encima
 Que el 12 es el valor más frecuente

Se dice que una variable es continua cuando:

 Puede tomar infinitos valores


 Pueden tomar cualquier valor entre una serie de categorías definidas
 Puede tomar cualquier valor dentro de un intervalo
 La función que lo cuantifica es continua
 Puede tomar tanto valores positivos como negativos

Una variable es de carácter discreto cuando:

 Puede tomar infinitos valores


 Pueden tomar un número definido y acotado de resultados
 Puede tomar cualquier valor dentro de un intervalo
 Toma tanto valores numéricos como alfabéticos
 Puede tomar tanto valores positivos como negativos
En una distribución normal se cumple que:

 Aproximadamente el 95% de las observaciones se encuentran a tres desviaciones


estándar de la media
 Aproximadamente el 99% de las observaciones se encuentran a tres desviaciones
estándar de la media
 Aproximadamente el 90% de las observaciones se encuentran a dos desviaciones
estándar de la media
 Aproximadamente el 99% de las observaciones se encuentran a dos desviaciones
estándar de la media
 Aproximadamente el 99% de las observaciones se encuentran a cuatro
desviaciones estándar de la media

Una variable aleatoria X toma los valores 1, 3, 5, con probabilidades P(X=1) = 4/6,
P(X=3) = 1/6, P(X=5) = 1/6. El valor de su media aritmética es:

 4
 3
 3,5
 2
 1

La distribución normal se caracteriza por:

 El promedio es siempre mayor que la mediana de la distribución


 El máximo valor es siempre el doble del mínimo valor
 La distribución está totalmente definida por su promedio aritmético o media
 El promedio es siempre igual a la mediana y no posee moda
 Se define completamente por la media y la desviación estándar

La desviación estándar de una variable considera en su cálculo:

 Solo los valores máximo y mínimo de la muestra


 Todos los valores observados de la variable
 Solo los valores positivos de la muestra
 Los valores mayores a la media aritmética
 Los valores en valor absoluto de la muestra
Si la distribución de las notas de un curso de economía respecto del 100% de los
estudiantes está dado por:
Mayor o igual que 1.0 y menor que 3.0: 10%
Mayor o igual que 3.0 y menor que 4.0: 15%
Mayor o igual que 4.0 y menor que 5.0: 35%
Mayor o igual que 5.0 y menor o igual que 7.0: 40%
La proporción de los alumnos aprobó el curso es de:

 0.35
 0.75
 25
 0.15
 0.40

El cálculo de la varianza utiliza el valor cuadrático de las desviaciones respecto de


la media:

 Para obtener valores más altos


 Para asegurar valores positivos y negativos
 Para evitar que valores positivos se cancelen con los negativos
 Para poder aplicar luego la raíz cuadrada en el cálculo de la desviación estándar
 Para lograr una medida más representativa

¿Cuál de los siguientes son ejemplos de variables discretas?

 La tasa de variación del dólar


 Las Regiones de Chile
 La edad de un grupo de estudiantes
 El ingreso familiar durante los meses del año
 El peso de un grupo de estudiantes

La ventaja de utilizar la desviación estándar por sobre la varianza es que:

 No es necesario calcular la raíz cuadrada


 solo utiliza valores extremos en su cálculo
 Siempre tiene valores positivos
 Esta expresada en la misma de unidad de medida que la variable original
 Toma valores positivos y negativos

¿Cuál de los siguientes son ejemplos de variables continuas?


¡Correcto!
 La tasa de desempleo nacional
 Las Regiones de Chile
 El género de un grupo de estudiantes
 Los meses del año calendario
 La carrera elegida por un grupo de estudiantes
MODULO 2

La hipótesis alternativa representa:

 La afirmación respecto de un parámetro que se asume cierta al final del estudio.


 La afirmación que anula los parámetros obtenidos.
 La característica de una serie de parámetros que son necesarias en el estudio.
 La característica del parámetro que es de interés de la persona que elabora el
estudio.
 La afirmación respecto de un parámetro que se asume cierta al inicio del estudio.

En el caso de una hipótesis simple, rechazaremos la hipótesis nula si:

 El valor del estadístico de contraste es mayor al valor del estadístico asociado al


nivel de significancia
 El valor del estadístico de contraste es mucho mayor al valor del estadístico
asociado al nivel de significancia
 El valor del estadístico de contraste es igual al valor del estadístico asociado al
nivel de significancia
 El valor del estadístico de contraste es distinto al valor del estadístico asociado al
nivel de significancia
 El valor del estadístico de contraste es menor al valor del estadístico asociado al
nivel de significancia

El proceso de prueba de hipótesis se puede resumir en comparar dos números, z y


z que provienen:

 El valor de z proviene de los datos muestrales en tanto z proviene de la


distribución asumida de los datos. El primero es el estadístico de contraste
 El valor de z proviene de los datos muestrales en tanto z 
proviene de la distribución asumida de los datos. El segundo es el estadístico de
contraste
 El valor de z proviene de los datos poblacionales en tanto z 
proviene de la distribución asumida de los datos. El primero es el estadístico de
contraste
 El valor de z proviene de los datos muestrales en tanto z proviene de la
distribución asumida de los datos. El segundo es el estadístico de contraste
 El valor de z proviene de los datos muestrales en tanto z 
proviene de la distribución asumida de los datos. El primero es el estadístico de
contraste

Si usted dispone datos de una muestra de datos de ingresos de los trabajadores de


dos empresas y quiere saber si los niveles de desigualdad de sueldos en ambas
empresas son similares, usted llevara a cabo un test para contrastar:

 El valor de la media
 Diferencia de medias asumiendo varianza conocida
 Diferencia de varianzas
 Diferencia de medias asumiendo varianza desconocida
 Igualdad de medias
Según una encuesta, el candidato A tiene el 31% de las preferencias versus el
candidato B que muestra el 29% de las preferencias, La encuesta tiene un nivel de
error del 3%. Luego podemos concluir que:

 La encuesta es deficiente
 La encuesta tiene un grado de error muy alto
 Existe un empate técnico
 El candidato A es claramente el favorito
 La encuesta tiene un grado de error muy acotado

La inferencia estadística corresponde al proceso de:

 Sacar conclusiones validas a partir de una muestra.


 Obtener una muestra representativa de la población.
 Obtener una muestra con el menor error posible.
 Sacar conclusiones con el menor error posible.
 Obtener el intervalo de confianza más amplio posible con los datos muestrales.

La hipótesis nula representa:

 La afirmación que anula los parámetros obtenidos.


 La característica del parámetro que es de interés de la persona que elabora el
estudio.
 La característica de una serie de parámetros que son necesarias en el estudio.
 La afirmación respecto de un parámetro que se asume cierta al inicio del estudio.
 La afirmación respecto de un parámetro que se asume cierta al final del estudio.

El error tipo 1 es:

 Rechazar H0 cuando H0 es cierta


 No rechazar H0 cuando H0 es cierta
 Rechazar H0 cuando H0 es falsa
 No rechazar H0 cuando H0 es falsa
 Rechazar H0 cuando H0 es incierta

El teorema central del límite establece que:

 A medida que aumenta el tamaño de una muestra, la varianza de un conjunto de


variables tiende a una distribución normal
 A medida que disminuye el tamaño de una muestra, la media aritmética de un
conjunto de variables tiende a una distribución normal
 A medida que aumenta el tamaño de una muestra, la media aritmética de un
conjunto de variables tiende a una distribución normal
 A medida que disminuye el tamaño de una muestra, la varianza de un conjunto de
variables tiende a una distribución normal
 A medida que aumenta el tamaño de una muestra, la media aritmética de un
conjunto de variables tiende a una distribución uniforme
Si estamos interesados en saber si cierto canal de publicidad aumenta o no las
ventas de la empresa y comparamos el nivel de ventas del último año con su nivel
previo, el test de hipótesis correcto será:

 Diferencia de varianzas
 Test de diferencia de medias, prueba de dos colas
 Test de diferencia de medias, prueba de una cola
 Contraste para la media, prueba de dos colas
 Contraste para la media, prueba de una cola

Una encuesta llevada a cabo entre los trabajadores de la empresa indica que el 50%
realiza alguna actividad física al menos una vez a la semana. Luego se realiza una
nueva encuesta por varios días, pero esta vez pregunta si en la última semana se ha
realizado alguna actividad física. Para sacar conclusiones respecto del real nivel de
actividad física de los empleados debiera considerarse la siguiente prueba de
hipótesis:

 Test de diferencia de varianzas


 Test de diferencia de medias, prueba de dos colas
 Test de diferencia de medias, prueba de una cola
 Contraste para la media, prueba de dos colas
 Contraste para la media, prueba de una cola

El proceso de prueba de hipótesis se puede resumir en comparar dos números, z y


z que provienen:

 El valor de z proviene de los datos muestrales en tanto z 


proviene de la distribución asumida de los datos. El primero es el estadístico de
contraste
 El valor de z proviene de los datos muestrales en tanto z 
proviene de la distribución asumida de los datos. El segundo es el estadístico de
contraste
 El valor de z proviene de los datos muestrales en tanto z proviene de la
distribución asumida de los datos. El primero es el estadístico de contraste
 El valor de z proviene de los datos muestrales en tanto z proviene de la
distribución asumida de los datos. El segundo es el estadístico de contraste
 El valor de z proviene de los datos poblacionales en tanto z 
proviene de la distribución asumida de los datos. El primero es el estadístico de
contraste

Las hipótesis siempre son aseveraciones respecto de:

 Una muestra obtenida en forma aleatoria


 Una muestra obtenida en forma controlada
 La población en estudio, cuya distribución es desconocida
 La población en estudio, cuya distribución es conocida
 Una muestra obtenida de tal forma que sea representativa
El nivel de significancia de la prueba de hipótesis corresponde a:

 El valor mínimo tolerable de cometer error tipo 1


 El valor mínimo tolerable de cometer error tipo 2
 El valor máximo tolerable de cometer error tipo 1
 El valor máximo tolerable de cometer error tipo 2
 El valor máximo tolerable de cometer error tipo 1 y 2

Si estamos analizando la relación entre el nivel de consumo y de ingreso, estamos


frente a un test de hipótesis que contrasta:

 Igualdad de medias
 Diferencia de medias
 Igualdad de varianzas
 El valor de la media
 Diferencia de varianzas

El error tipo 2 es:

 Rechazar H0 cuando H0 es cierta


 No rechazar H0 cuando H0 es cierta
 Rechazar H0 cuando H0 es falsa
 No rechazar H0 cuando H0 es falsa
 Rechazar H0 cuando H0 es incierta

En el procedimiento de prueba de hipótesis para dos varianzas poblacionales se


utiliza:

 El estadístico t
 El estadístico z
 El estadístico F
 La distribución normal
 La distribución uniforme

MODULO 3

La etapa de planteamiento de la teoría en el análisis de regresión permite:

 Proyectar con el mínimo error posible.


 Establecer con claridad la relación causal entre variables.
 Establecer claridad respecto del tamaño muestral necesario.
 Asegurar un valor óptimo de los parámetros.
 Especificar el modelo correctamente.
La solución a través de mínimos cuadrados estableces que:

 Considera el valor cuadrático medio como indicador de eficiencia de la solución.


 El óptimo se puede lograr al considerar al minimizar el valor de la variable
independiente al cuadrado.
 La optima solución implica un modelo cuadrático con dos posibles soluciones.
 El óptimo se puede lograr al considerar al minimizar el valor del error al cuadrado.
 El óptimo se puede lograr al considerar al minimizar el valor de la variable
dependiente al cuadrado.

Asuma que se estima el siguiente modelo que relaciona el ingreso con el consumo:

El siguiente intervalo para el parámetro asociado a la variable ingreso (β 1), no nos


permitirá rechazar la hipótesis nula respecto de la hipótesis
alternativa .

 (0.63, 1.03)
 (0.73, 0.93)
 (0.53, 1.13)
 (-0.07, 1.73)
 (0.33, 1.33)

El supuesto de homoscedasticidad se puede interpretar como:

 La varianza de la muestra se distribuye normal.


 La varianza de la muestra es constante respecto de la variable dependiente.
 La varianza de la muestra es una función creciente respecto de la variable
independiente.
 La varianza de la muestra es una función creciente respecto de la variable
dependiente.
 La varianza de la muestra es constante respecto de la variable independiente.

La metodología de estimación de parámetros en la regresión lineal simple, se basa


en:

 Maximizar la distancia vertical entre los valores observados y estimados.


 Minimizar la distancia entre los parámetros estimados.
 Maximizar la distancia horizontal entre los valores observados y estimados.
 Minimizar la distancia vertical entre los valores observados y estimados.
 Minimizar la distancia horizontal entre los valores observados y estimados.

Las siguientes NO son fuentes que explican el término irregular o error:

 Teoría incompleta
 Falta de información
 Error del analista.
 Error de especificación.
 Error de medición de las variables.
La solución a través de mínimos cuadrados estableces que:

 Considera el valor cuadrático medio como indicador de eficiencia de la solución.


 La optima solución implica un modelo cuadrático con dos posibles soluciones.
 El óptimo se puede lograr al considerar al minimizar el valor de la variable
dependiente al cuadrado.
 El óptimo se puede lograr al considerar al minimizar el valor de la variable
independiente al cuadrado.
 El óptimo se puede lograr al considerar al minimizar el valor del error al cuadrado.

En un modelo que plantea una relación entre ventas e inversión publicitaria de la


empresa, cuya especificación es se lleva a cabo un
test de significancia sobre los parámetros y el resultado es
que β0 es significativo, pero β1 no lo es, esto implica que:
Respondido
 Las ventas serán más altas a mayor publicidad.
 Las ventas serán más bajas a mayor publicidad.
 Las ventas serán más altas a menor publicidad.
 Las ventas serán son independientes de la publicidad.
 Las ventas son constantes en el tiempo.

Un parámetro estimado será aceptable si:

 Tiene una baja volatilidad.


 Su intervalo de confianza es lo suficientemente amplio.
 Su intervalo de confianza es lo suficientemente reducido.
 Su estadístico t es lo más bajo posible.
 Su estadístico t permite aprobar el test de hipótesis.

Considere que usted construye un modelo plantea la relación entre ventas de la


empresa y publicidad, donde la primera es la variable dependiente y la segunda la
variable independiente. Si el modelo estimado es y
usted está interesado si en realidad la inversión publicitaria tiene un efecto positivo
en las ventas, el test de hipótesis que debiera realizar es:






Suponga un modelo que relaciona el cambio en el valor del dólar a partir del cambio
en el valor del precio del cobre cuya estimación es . Luego los
parámetros pueden interpretarse como:

 Si el precio del cobre se mantiene constante, el precio del tipo de cambio caerá en
un peso.
 Si el precio del cobre se mantiene constante, el precio del tipo de cambio se
mantendrá constante.
 Si el precio del cobre sube en un 1%, el precio del tipo de cambio se mantendrá
constante.
 Si el precio del cobre sube en un 1%, el precio del tipo de cambio caerá en un 1%.
 Si el precio del cobre sube en un 1%, el precio del tipo de cambio caerá en un
0.5%.

En términos de la aplicación en software analizada, en términos generales, un


parámetro será significativo al 95% de confianza si:

 El valor del parámetro es suficientemente alto.


 El intervalo de confianza es suficientemente amplio.
 El estadístico t tiene un valor sobre 2.
 El estadístico t tiene un valor menor a 2.
 El estadístico t tiene un valor sobre 2.3.

El primer paso en el proceso de estimación de un modelo de regresión lineal, es:

 Obtener la mayor cantidad de datos posibles.


 Establecer a qué valores queremos llegar en la predicción a realizar.
 Establecer la teoría o hipótesis.
 Plantear la correcta especificación del modelo.
 Estimar correctamente los parámetros.

El valor estimado por el modelo equivale a:

 El valor observado en la muestra.


 El valor observado en la muestra más el componente de error.
 El valor observado en la muestra menos el componente de error.
 El promedio de valores observados en la muestra.
 El valor mínimo observado en la muestra.

Si a partir de una muestra de trabajadores con escolaridad entre 8 y 16 años se


estima un modelo que relaciona el ingreso con el nivel de escolaridad con una
especificación , la interpretación del parámetro β0 es:

 El ingreso de una persona sin educación.


 El aumento del ingreso explicado por la educación
 Igual a cero
 No tiene interpretación económica.
 El salario mínimo.
El intervalo de confianza de un parámetro será más reducido en la medida de que:

 Se cuente con un mayor tamaño muestral.


 Se cuente con un menor tamaño muestral.
 La varianza sea mayor.
 El valor del nivel de confianza sea mayor.
 El error de estimación sea mayor.

La metodología de estimación de parámetros en la regresión lineal simple, se basa


en:

 Minimizar la distancia vertical entre los valores observados y estimados.


 Minimizar la distancia horizontal entre los valores observados y estimados.
 Minimizar la distancia entre los parámetros estimados.
 Maximizar la distancia vertical entre los valores observados y estimados.
 Maximizar la distancia horizontal entre los valores observados y estimados.

MODULO 4

La solución óptima de parámetros en el caso multivariado difiere de la solución en


el caso simple en que:

 En el caso multivariado se requiere encontrar un conjunto de parámetros que


minimicen la media de los errores
 En el caso multivariado se requiere encontrar un conjunto de parámetros que
minimicen la suma de los estadísticos t implícitos
 En el caso multivariado se requiere encontrar un conjunto de parámetros que
minimicen la suma de los valores absolutos de los errores
 En el caso multivariado se requiere encontrar un conjunto de parámetros que
minimicen la suma de los errores al cuadrado
 En el caso multivariado se requiere encontrar un conjunto de parámetros que
minimicen la suma de los errores

La incorporación de variables discretas en conjunto con variables continuas


permite para estas últimas incorporar:

 Diferencia en el intercepto respecto de la variable dependiente


 Facilidades de interpretación en los resultados
 Mayores niveles de intervalo de confianza
 Diferencias en el intercepto y/o en la pendiente respecto de la variable
dependiente
 Facilidades en el cálculo de los parámetros
El parámetro que nos permitirá evaluar si un modelo es mejor que otro, es:

 El coeficiente de determinación
 El coeficiente de correlación
 El valor del estadístico t
 El parámetro beta
 El valor de probabilidad o p-value

En términos de la implementación en software, la incorporación de variables


discretas:

 No presenta mayor diferencia


 Facilita la generación de resultados
 Requiere más datos
 No es factible sin variables continuas
 Facilita el procedimiento

Al incorporar una variable discreta como género, la diferencia entre considerar una
u otra categoría con el valor 1 o 0 implicará:

 Ninguna Diferencia
 Una diferencia en la interpretación de los resultados de intervalos de confianza
 Una diferencia en el coeficiente de determinación
 Una diferencia en la interpretación de los parámetros
 Un cambio en las predicciones realizadas

Respecto de los supuestos de la regresión lineal simple, en el procedimiento de


regresión lineal multivariada, los supuestos que ya no aplican son:

 Linealidad en los parámetros y no autocorrelación de errores


 Normalidad en los errores y correcta especificación
 Normalidad en los errores y no autocorrelación de errores
 Ninguno
 No hay multicolinealidad perfecta

En el caso de variables independientes de tipo continuas, el valor del parámetro


obtenido podrá interpretarse como:

 La diferencia que existe entre cada categoría de la variable


 La representatividad de cada categoría
 Una estimación de la significancia de la variable
 La tasa de cambio de la variable independiente respecto de la variable
dependiente
 La tasa de cambio de la variable dependiente respecto de la variable
independiente
Usted está analizando los determinantes del ingreso de un trabajador e incorpora
variables como Edad, educación, profesión y género. En el caso de la variable
género, esta toma el valor 1 en el caso de mujer y cero en el caso de hombre. El
correcto test de hipótesis para evaluar esta variable, es:





 1

La incorporación de variables discretas en conjunto con variables continuas


permite para estas últimas incorporar:

 Diferencia en el intercepto respecto de la variable dependiente


 Diferencias en el intercepto y/o en la pendiente respecto de la variable
dependiente
 Mayores niveles de intervalo de confianza
 Facilidades en el cálculo de los parámetros
 Facilidades de interpretación en los resultados

En el caso de incorporar una variable discreta en el modelo, se deberán incorporar:

 Tantas variables como categorías tenga la variable discreta


 Un numero de variables igual al número de categorías de la variable discreta más
uno
 Un numero de variables igual al número de categorías de la variable discreta
menos uno
 Una sola variable es suficiente
 Dependerá del número de observaciones de la variable

En el caso de regresión múltiple, el supuesto de media cero del componente de


error:

 Se mantiene
 Se mantiene siempre que no se incorporen variables discretas
 Ya no es válido dado el mayor número de variables explicativas
 Dependerá de la calidad de los datos presentes en el modelo
 Solo será posible si existe un número suficiente de observaciones para la
estimación

La función de estadístico t en el análisis de regresión multivariada, es:

 Comparar distintos modelos


 Establecer el nivel de error de la predicción
 Realizar test de hipótesis para el modelo como un todo
 Realizar test de hipótesis para cada variable particular
 Minimizar el intervalo de confianza de la proyección
En términos de la implementación en software, la incorporación de variables
discretas:

 Facilita el procedimiento
 No es factible sin variables continuas
 Requiere más datos
 No presenta mayor diferencia
 Facilita la generación de resultados

Frente a dos modelos multivariados con distintas combinaciones de variable


independientes, el criterio utilizado para elegir uno por sobre otro será:

 Será elegible el modelo que tenga más variables predictoras


 Será elegible el modelo que tenga el mayor valor de suma explicada de cuadrados
 Será elegible el modelo que tenga menos variables predictoras
 Será elegible el modelo que tenga más variables predictoras significativas
 Será elegible el modelo que tenga menos variables predictoras significativas

La regresión multivariada es preferible a la regresión simple.

 Siempre
 Solo en los casos que el software lo permita
 Siempre que la variable en estudio sea compleja y requiera más de una variable
independiente
 Solo si hay datos suficientes
 Siempre que se disponga del tiempo para realizar el mayor análisis

Usted está analizando un modelo para determinar los determinantes del ingreso y
obtiene la siguiente especificación: . La
variable de género toma el valor de 1 en el caso de mujer y cero en el caso de
hombre. Luego el intervalo de confianza para la variable género que implica una
diferencia significativa en el ingreso a favor del hombre será:

 (25.000, 35.000)
 (-25.000, 35.000)
 (25.000, -35.000)
 (-25.000, -35.000)
 (0, 35.000)

El coeficiente de determinación nos permitirá en el caso de una regresión múltiple:

 Reducir el nivel de error del modelo


 Reemplazar el estadístico t para evaluar el resultado del modelo
 Establecer el número correcto de variables a considerar en el modelo
 Comparar dos modelos con distintas especificaciones
 Establecer proyecciones más precisas

Das könnte Ihnen auch gefallen