Sie sind auf Seite 1von 35

UNIVERSIDAD NACIONAL

DE UCAYALI

MAG. ING. FRANKIE AMILCAR FIGUEROA MUOZ


Diferencia entre estadstica aplicada y
inferencial
ESTADSTICA DESCRIPTIVA analiza las caractersticas de una poblacin o muestra definindose unas
propiedades acerca de su estructura y composicin.
Es decir, trata del recuento ordenacin y clasificacin de los datos obtenidos por las observaciones. Se
construyen tablas y se representan grficos que permiten simplificar la complejidad de los datos que
intervienen en la distribucin.
Vamos de forma sencilla describe un conjunto de datos con indicadores estadsticos o estadgrafos. Es
el mtodo de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el
conocimiento proporcionado por stos.
ESTADSTICA INFERENCIAL basndose en los resultados obtenidos de una muestra induce o estima las
leyes reales de comportamiento de la poblacin de la que proviene dicha muestra
Se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, poblacin,
partiendo de lo especfico, muestra.
Es el conjunto de tcnicas que se utiliza para obtener conclusiones que sobrepasan los lmites del
conocimiento aportado por los datos, busca obtener informacin de un colectivo mediante un
metdico procedimiento del manejo de datos de la muestra.
Ejemplo

Estadstica descriptiva:
Los datos del Censo de poblacin de un ao determinado.
La cantidad de robos ocurridos el ltimo mes en una ciudad concreta.
La cantidad de pacientes atendidos en el Hospital municipal el ltimo ao.
Para ello, construimos las tablas de distribuciones de frecuencia, grficos de
distribucin de frecuencias, Diagramas de cajas, estadsticos de posicin
(media,..), de dispersin (varianza, ..) y de asociacin.
Estadstica inferencial:
Una encuesta desarrollada por una empresa en marzo del 2010, dice que el rating
de radio en Madrid esta encabezado por OC con un 10,5% seguido de RNE con
9,18%.
De acuerdo con una encuesta desarrollada por una empresa sobre telefona
residencial en el 2009, el gasto mensual promedia por cliente es de 90,30 euros
por cliente.
El INI inform que la Encuesta Permanente de Hogares del mes de marzo 2010
reporto la tasa ms alta de desempleo que ascendi al 20% a nivel nacional.
Descripcin
Regresin lineal, mltiple
LINEAL : Una tcnica estadstica que establece una ecuacin para estimar el
valor desconocido de una variable, a partir del valor conocido de otra
variable, (en vez de valores de muchas otras variables) se denomina anlisis
de regresin simple.
MULTIPLE : El anlisis de regresin mltiple es una tcnica de anlisis
multivariable en el que se establece una relacin funcional entre una variable
dependiente o a explicar y una serie de variables independientes o
explicativas, en la que se estiman los coeficientes de regresin que
determinan el efecto que las variaciones de las variables independientes
tienen sobre el comportamiento de la variable dependiente.
REGRESIN LINEAL SIMPLE

Es el proceso general de predecir una variable (Y) a partir de otra (X).


Las relaciones entre las variables pueden ser directas o tambin inversas.

Relacin directa: la pendiente de esta lnea es positiva, por que la variable Y


crece a medida que la variable X tambin lo hace.
Relacin inversa: La pendiente de esta lnea es negativa, por que a medida
que aumenta el valor de la variable Y, el valor de la variable X disminuye.
DEPENDENCIA ENTRE VARIABLES X E Y

VARIABLE INDEPENDIENTE (X)


En el anlisis de regresin una variable cuyo valor se suponga conocido y que se utilice
para explicar o predecir el valor de otra variable de inters se llama variable
independiente; se simboliza con la letra X.
Otros nombres alternativos para la variable independiente (X), son variable
explicatoria, variable predictora y en ocasiones variable regresora.
VARIABLE DEPENDIENTE (Y)
En el anlisis de regresin una variable cuyo valor se suponga desconocido y que se
explique o prediga con ayuda de otra se llama variable dependiente y se simboliza con
la letra Y.
La variable dependiente, al igual que la variable independiente es llamada de
diferentes maneras algunas de ellas son: variable explicada o variable pronosticada.
DIAGRAMAS DE DISPERSIN
Un diagrama de dispersin es una ilustracin grfica que se usa en el anlisis
de regresin. Consta de una dispersin de puntos tal que cada punto
representa un valor de la variable independiente (medido a lo largo del eje
horizontal), y un valor asociado de la variable dependiente (medido a lo largo
del eje vertical).
METODO DE MINIMOS CUADRADOS

El mtodo que por lo comn se utiliza para ajustar una lnea a los datos
muestrales indicados en el diagrama de dispersin, se llama mtodo de
mnimos cuadrados. La lnea se deriva en forma tal que la suma de los
cuadrados de las desviaciones verticales entre la lnea y los puntos
individuales de datos se reduce al mnimo.
El mtodo de mnimos cuadrados sirve para determinar la recta que mejor se
ajuste a los datos muestrales, y los supuestos de este mtodo son:
El error es cero.
Los datos obtenidos de las muestra son estadsticamente independientes.
La varianza del error es igual para todos los valores de X.
Una lnea de regresin calculada a partir de los datos muestrales, por el
mtodo de mnimos cuadrados se llama lnea de regresin estimada o lnea de
regresin muestral.
Dicha lnea recta es la que mejor se ajusta al conjunto de datos (X, Y) y es
aquella en que la distancia que hay entre los datos y la supuesta recta es la
menor posible, y se calcula mediante la siguiente formula:

Para calcular el valor de b (pendiente), que representa el grado de inclinacin


que tiene la recta, se emplea la siguiente formula:
Para calcular el valor de a (ordenada al origen), que representa el punto en
que la recta corta al eje de las Y, se emplea la siguiente formula:

Las variables a y b son constantes numricas que son las que se calculan
mediante el mtodo de mnimos cuadrados.
ERROR ESTANDAR DE ESTIMACIN

El siguiente proceso que se necesita en el anlisis de la regresin lineal simple


es cmo medir la confiabilidad de la ecuacin de estimacin que hemos
desarrollado.
El error estndar de estimacin mide la variabilidad o dispersin de los
valores observados alrededor de la lnea de regresin y se representa como
Se. Su formula es la siguiente:
Cuanto mayor sea el error estndar de la estimacin, ms grande ser la
dispersin (o esparcimiento) de puntos alrededor de la lnea de regresin.
Por el contrario, si Se= 0, se espera que la ecuacin de estimacin sea un
estimador perfecto de la variable dependiente, en este caso todos los
puntos caeran directamente sobre la lnea de regresin y no habra puntos
dispersos, como se muestra en la siguiente figura:
PROCEDIMIENTO PARA REALIZAR UN
ANLISIS DE REGRESIN LINEAL SIMPLE
1. Obtencin de los datos muestrales.

2. Los datos obtenidos se tabulan. (tener cuidado en determinar correctamente


quien es la variable independiente y dependiente)
3. La informacin se grfica en un diagrama de dispersin, establecindose la
posible relacin entre las dos variables.

4. Se calcula la pendiente.
5. Se calcula la ordenada al origen.

6. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.

7. Se traza la lnea estimada en el diagrama de dispersin.

8. Se calcula el error estndar de estimacin.


EJEMPLO

Una cadena de Pizzeras toma una muestra de diez de sus sucursales para tratar
de encontrar un modelo matemtico que le permita predecir sus ventas y obtuvo
los siguientes datos: la poblacin de personas en miles fue de 2, 6, 8, 8, 12, 16,
20, 20, 22, 26; y las ventas trimestrales en miles de soles fue de: 58, 105, 88,
118, 117, 137, 157, 169, 169, 149, 202.
Realice una regresin para estimar las ventas de dos sucursales que tienen 14,000 y
30,000 personas como potenciales clientes respectivamente.
Solucin
Datos n=10
X: Poblacin de personas en miles
Y: Ventas trimestrales en miles de soles
1. Tabular los datos obtenidos:

2. Graficar los datos en un diagrama de dispersin y determinar la posible


relacin entre las variables X Y.
3. Realizar los clculos correspondientes

4. Calculo de la pendiente.

Por lo tanto la pendiente es


5. Calculo de la ordenada al origen.

6. Obtener la ecuacin que mejor se ajuste.

7. Trazar la lnea estimada.


8. Calcular el error estndar de estimacin.

Tiene un error de estimacin de 12,210 soles.

Para una N = 14,000

Para una N = 30,000


CORRELACIN SIMPLE

Una tcnica estadstica que establece un ndice que proporciona, en un solo


nmero, una medida de la fuerza de asociacin entre dos variables de
inters, se llama anlisis de correlacin simple.
El anlisis de correlacin es la herramienta estadstica de que nos valemos
para describir el grado de relacin que hay entre dos variables.

Existen dos medidas para describir la correlacin entre dos variables: el


coeficiente de determinacin y el coeficiente de correlacin.
COEFICIENTE MUESTRAL DE
DETERMINACIN
La medida ms importante de que tambin ajusta la lnea de regresin
estimada en los datos muestrales en los que esta basada, es el coeficiente de
determinacin muestral, este es igual a la proporcin de la variacin total de
los valores de la variable dependiente, Y, que puede explicarse por medio
de la asociacin de Y con X medida por la lnea de regresin estimada.
El coeficiente de determinacin es la manera primaria de medir el grado, o
fuerza, de la relacin que existe entre dos variables, X y Y. El coeficiente de
determinacin muestral se representa como r 2 , y mide exclusivamente la
fuerza de una relacin lineal entre dos variables.
COEFICIENTE MUESTRAL DE
CORRELACIN
El coeficiente de correlacin muestral es la segunda medida con que puede
describirse la eficacia con que una variable es explicada por otra, as pues el
signo de r indica la direccin de la relacin entre las dos variables X y Y.
El calculo del coeficiente de correlacin muestral se lleva a cavo con la
siguiente formula:
INTERVALO DE CONFIANZA

Debido a que la recta estimada de regresin, no es del todo real, es necesario


elaborar un intervalo de confianza que le de seguridad a nuestros clculos.
Como se ha visto, cuando se utilice el mtodo de mnimos cuadrados, los
coeficientes de regresin, a y b son estimadores insesgados, eficientes y
consistentes de y , tambin aqu es muchas ocasiones es deseable
establecer intervalos de confianza.
Los intervalos de confianza se calculan con la siguiente frmula:
INTERVALO DE PREDICCIN

El intervalo de prediccin, como su nombre lo indica, se utiliza para predecir


un intervalo de valores de Y, dado un valor de X. El intervalo de prediccin
se calcula con la siguiente frmula:
EJEMPLO

Un gerente de ventas reuni los datos siguientes relacionados con las ventas
anuales en miles de soles y los aos de experiencia de diez vendedores.
Estime las ventas anuales para un vendedor con 7 aos de experiencia.

Solucin
1. Obtencin y tabulacin de los datos mustrales.
X: Aos de experiencia

Y: Ventas anuales en miles de soles.


2. Diagrama de dispersin.
3. Realizar los clculos correspondientes y determinar la pendiente y ordenada
al origen.
4. Ecuacin que mejor se ajusta.
Para un vendedor con 7 aos de experiencia, sus ventas estimadas seran:

y = 80 + 4(7) = 108 ventas anuales

5. Trazo de la lnea estimada en el diagrama de dispersin


6. Calcular el error estndar de estimacin

7. Calcular el Coeficiente de Determinacin

El 93% de las ventas anuales se deben a la experiencia de los vendedores y el 7%


restante de debe a otros factores.

8. Calcular el Coeficiente de Correlacin

Este nmero nos indica que las variables X Y tienen una correlacin positiva intensa.
9. Determinar el intervalo de confianza al 95%.

Se puede asegurar con un nivel de confianza del 95% que las ventas de los
vendedores con 7 aos de experiencia estn entre 104.6 y 111.4 miles soles
anuales.
10. Determinar el intervalo de prediccin para un vendedor con 9 aos de
experiencia se tiene :

Se puede asegurar con un nivel de confianza del 95% que las ventas
pronosticadas de un vendedor con 9 aos de experiencia estn entre 96.71 y
119.3 miles soles anuales.

Das könnte Ihnen auch gefallen