Sie sind auf Seite 1von 7

Estadística 2

Docente: Alejandro Guerrero Salazar

Matilde Juarez Jaimez

Licenciatura en Matematicas

ES1821001796

Actividad 3

Unidad 2
Actividad 3. Comprobación de supuestos en el análisis de regresión lineal simple

Indicaciones.

1.- Para cada caso obtener el modelo lineal correspondiente y en una gráfica representar ambos
modelos: a ¿ y=3 x 2
Ahora para el caso b

b ¿ y=−5 x 3
2.- Realiza las siguientes actividades de ajuste por mínimos cuadrados, elaborando en cada caso
las gráficas correspondientes, tanto para los datos como para el modelo lineal que se pide, así
como el modelo de ajuste lineal. Adicionalmente, con el modelo obtenido, calcula los valores
x y
1117 33.46
2433 5.68
4724 22.9
627 34.06
367 83.68

cliente x y cliente x y
1 2612 46.53 26 2797 13.34
2 1076 58.01 27 2769 2.14
3 1484 27.26 28 1202 28.76
4 1869 90.74 29 1436 2.87
5 2470 53.37 30 1130 27.03
6 4624 4.04 31 2301 79.45
7 3290 24.65 32 3452 10.26
8 461 5.65 33 1462 5.71
9 2198 31.22 34 3092 95.17
10 3494 24.72 35 1365 28.24
11 550 20.31 36 882 27.1
12 4832 67.73 37 4312 22.99
13 2895 39.84 38 616 7.31
14 4195 43.52 39 3451 14.36
15 1116 7.95 40 1346 1.13
16 232 1.46 41 2059 52.09
17 3731 11.93 42 1012 2.95
18 3531 76.7 43 3260 14.56
19 3787 14.59 44 247 8.28
20 402 13.66 45 1832 11.5
21 4103 10.66 46 4550 77.8
22 617 4.04 47 4016 27.45
23 4552 0.31 48 2042 23
24 309 29.11 49 2011 3.34
25 386 40.29 50 3640 14.04

Con los datos anteriores podemos visualizar gráficamente los puntos de dispersión
Procedemos a realizar los cálculos mediante el metodo de mínimos cuadrados apoyado [ CITATION
var20 \l 2058 ]

Calculamos las medias de los valores de x  y los valores de y, la suma de los cuadrados de los
valores de x, y la suma de cada valor de x  multiplicado por su valor correspondiente y  .
115098 1349.16 3477346 361355650

Calculamos la pendiente.

m=∑ xy −¿ ¿ ¿ ¿

(115 098 )( 1349.16 )


3 477 346−
50 371 633.6464
m= ≈ =0.00385
( 115 098 ) 2
96 404 657.92
361355 650−
50
Calculamos la intercepción en y.

x́=
∑ x = 115 098 =2301.96 ý = 1349.16 =26.9832
n 50 50
Usamos la fórmula para calcular la intercepción en y.

b= ý−m x́
b=26.9832−( 0.00385∗2301.96 )=26.9832−8.862546=18.12
Usamos la pendiente y la intercepción en y  para formar la ecuación de la recta que mejor se
ajusta.

La pendiente de larecta es 0.00385 y la intercepcion en y=18.12


Por lo tanto, la ecuación es y=0.00385 x +18.12
Graficamos la recta con los puntos dados
x y
1117 33.46
2433 5.68
4724 22.9
627 34.06
367 83.68

3.- Con los datos anteriores calcula un intervalo de estimación para β 0 , β 1, σ 2 al

Los datos que se tienen son


n
X́ 2 =5299019.842 S xx =96 404 657.92 ∑ ( y− ý)2=31 020.09589 MSE=616.4057041
i=1

Para

a. 95% de confianza
t 0.05 =t 0.025,48 =2.0106
,50−2
2

PROCEDIMIENTO:

18.12−2.0106∗6.79777 ≤ β 0 ≤ 18.12+ 2.0106∗6.79777

4.45240363 ≤ β 0 ≤ 31.78759

0.00385−2.0106∗0.00252≤ β1 ≤ 0.00385+2.0106∗0.00252

−0.004681712 ≤ β 1 ≤ 0.005451712
2
Para el intervalo de σ 2 se necesita el cuantil χ 0.05 = χ 20.25,48 buscando en la tabla de la Ji-
,50−2
2
cuadrada se observa que no se encuentra el cuantil exacto con 48 grados de libertad, así que se
toma el cuantil más próximo, en este caso es

χ 20.25,40=¿59.342 y χ 2
=24.433¿
0.975,40

48∗616.4057041 2 48∗616.4057041
≤σ ≤
59.342 24.433

498.5924606 ≤ σ 2 ≤1210.963606
Ésos son los intervalos a 95% de confianza, se observa que ninguno cruza por el 0, así que se
puede suponer que los estimadores son significativos para el modelo.

b. 98% de confianza

Los datos que se tienen son


n
X́ =5299019.842 S xx =96 404 657.92 ∑ ( y− ý)2=31 020.09589 MSE=616.4057041
2

i=1

t 0.02 =t 0.001,48 =3.3069


, 50−2
2

PROCEDIMIENTO:
18.12−3.3069∗6.79777 ≤ β 0 ≤18.12+3.3069∗6.79777

−4.359545≤ β 0 ≤ 40.599545

0.00385−3.3069∗0.00252 ≤ β1 ≤ 0.00385+ 3.3069∗0.00252

−0.00448338 ≤ β1 ≤0.01218338
2
Para el intervalo de σ 2 se necesita el cuantil χ 0.02 = χ 20.001,48 buscando en la
,50−2
2
tabla de la Ji-cuadrada se observa que no se encuentra el cuantil exacto con
48 grados de libertad, así que se toma el cuantil más próximo, en este caso es

χ 20.01,40=¿63.691 y χ 2
=17.917¿
0.999,40

48∗616.4057041 2 48∗616.4057041
≤σ ≤
63.691 17.917

464.5471699 ≤ σ 2 ≤1651.363163
Ésos son los intervalos a 98% de confianza, se observa que ninguno cruza por
el 0, así que se puede suponer que los estimadores son significativos para el
modelo.

4 .- Prueba de las hipótesis

Hipótesis 𝐻0: β0 = 0 𝑣𝑠 𝐻1: β0 ≠ 0

Estadística de prueba
^β 0−β 0
t 0=
1 x́ 2
√ [ ]
MSE∗ +
n S xx

18.12−0 18.12
t 0= = =2.665580036
1 5299019.842 6.79777
√ 616.457041∗ [ +
50 96 404 657.92 ]
Regla DE decisión

Rechaza H 0 si|t 0|>t 0.025,48 . Como 2.6655>2.0106 se rechaza H 0 y por lotanto β 0 es

Significativo para el modelo.

Ahora se prueba la significancia para la regresión

HIPOTESIS

𝐻0: β1 = 0 𝑣𝑠 𝐻1: β1 ≠ 0

Estadística de prueba
^β 1−β 1 0.00385−0 0.00385
t 0= = = =1.527777
MSE 616.457041 0.00252
√ S xx √ 96404657.92

Regla de decisión
Rechaza H 0 si|t 0|>t 0.025,48 . Como 1.527777>2.0106 se acepta H 0 y por lo tanto β 1 no es

Significativo para el modelo.

5.- Calcular el coeficiente de determinación para los datos del punto 2 y explicar su significado.

Apoyado [ CITATION Una209 \l 2058 ]


ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Regresión 1 1432.624462 1432.624462 2.32415853
Residuos 48 29587.47143 616.4056547
Total 49 31020.09589

Se probará la significación de la regresión a nivel de significancia α =0.05

Hipótesis

2 SSE 29587.47143
𝑅2 = R =1− =1− =0.046183753
SST 31020.09589
Por lo tanto la variabilidad explicada por el modelo es de 4.6183754%. En realidad, el ajuste no es

muy bueno, se ha visto en las secciones anteriores que se acepta la significancia de la

regresión, es decir, β1 ≠ 0, Es posible que existan otras variables que estén afectando el modelo,
que no se mida y por eso no se esté explicando una mayor variabilidad.

El coeficiente de determinación no solo idea la capacidad explicativa de un modelo, si no que nos


permite elegir entre el modelo adecuado, es decir los modelos tienen las mismas variables
dependientes y con este coeficiente de determinación nos será más elegir el mayor.

Referencias

Unadm. (2020). Contenido Nuclear Unidad 2 . Mexico.

varsitytutors.com/hotmath. (13 de octubre de 2020). Obtenido de varsitytutors.com/hotmath:


https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/line-of-best-fit

Das könnte Ihnen auch gefallen