Sie sind auf Seite 1von 13

Universidad de San Carlos de Guatemala

Centro Universitario Solol CUNSOL


Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Estadstica inferencial.

Lic. Luis Gabriel Rodrguez Arias.

JHERSSON Alexander Julajuj Bixcul.

201642996

Tercer semestre.
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Introduccin.

Parte de la Estadstica corresponde a la Estadstica Inferencial y dentro de ella los captulos de


correlacin y regresin son muy usados en la Investigacin Cientfica, una herramienta muy til
cuando se trata de relacionar 2 o ms variables, relacionadas entre s, como por ejemplo. nivel de
hemoglobina y embarazo en el mbito de las Ciencias de la Salud, la Correlacin implica el grado de
dependencia de una variable respecto a otra y la Regresin es otra tcnica que ayuda en la
investigacin de la salud Psicologa costos de una Empresa etc.
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Regresin lineal.

Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar la relacin
que puede ser observada cuando se grafica un diagrama de puntos dispersos correspondientes a
dos variables, cuya tendencia general es rectilnea; relacin que cabe comprender mediante una
ecuacin.

Formula:

y = a + bx.

En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical en el grfico
(ordenada); en tanto que x indica la magnitud de la coordenada sobre el eje horizontal (abscisa). El
valor de a (que puede ser negativo, positivo o igual a cero) es llamado el intercepto; en tanto que el
valor de b (el cual puede ser negativo o positivo) se denomina la pendiente o coeficiente de
regresin.

Serie de datos para el clculo de una regresin (a y b) y del coeficiente de


correlacin (r)

Nmero Valores de x Valores de y Nmero Valores de x Valores de y


1 9,0 0,50 7 6,7 1,00
2 9,4 0,50 8 8,4 0,50
3 7,4 1,23 9 8,0 0,50
4 9,7 1,00 10 10,0 0,50
5 10,4 0,30 11 9,2 0,50
6 5,0 1,50 12 6,2 1,00
13 7,7 0,50

El procedimiento para obtener valores de a y b para una serie de pares de datos de x y de y


(tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:

Paso 1. Calcule, para cada par de valores de x e y, las cantidades x, y, y x.y.


Paso 2. Obtenga las sumas () de estos valores para todos los pares de datos de x e y, as
como las sumas del total de los valores de x e y. Los resultados de los Pasos 1 y 2
aparecern en forma similar a la siguiente:
Nmero de pares de datos x x y y x.y
1
2
3


Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural


n
Monto de las sumas x x y y xy
Paso 3. Estime la pendiente (b) por medio de la relacin:

Paso 4. Estime el intercepto (a) por medio de la relacin:

A partir de esos valores de a y de b obtenidos mediante las Ecuaciones 2 y 3, es posible trazar a


lo largo de los puntos dispersos de un grfico la lnea recta mejor ajustada a los mismos, y verificar
visualmente si tales puntos estn bien expresados.

Correlacin: La correlacin, mtodo por el cual se relacionan dos variables se pude graficar con
un diagrama de dispersin de puntos, a la cual muchos autores le llaman nubes de puntos,
encuadrado dentro de un grfico de coordenadas X Y en la cual se pude trazar una recta y cuyos
puntos ms cercanos de una recta hablaran de una correlacin ms fuerte, ha esta recta se le
denomina recta de regresin, que puede ser positiva o negativa, la primera contundencia a aumentar
y la segunda en descenso o decreciente.

Tambin se puede describir un diagrama de dispersin en coordenadas cartesianas valores como en


la distribucin variante, en donde la nube de puntos representa los pares de valores.

La correlacin entre dos variables es - otra vez puesto en los trminos ms simples - el grado de
asociacin entre las mismas. Este es expresado por un nico valor llamado coeficiente de
correlacin (r), el cual puede tener valores que oscilan entre -1 y +1. Cuando r es negativo, ello
significa que una variable (ya sea x o y) tiende a decrecer cuando la otra aumenta (se trata
entonces de una correlacin negativa, correspondiente a un valor negativo de b en el anlisis de
regresin). Cuando r es positivo, en cambio, esto significa que una variable se incrementa al
hacerse mayor la otra (lo cual corresponde a un valor positivo de b en el anlisis de regresin).

Los valores de r pueden calcularse fcilmente en base a una


serie de pares de datos de x e y, utilizando la misma tabla
y montos.
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Figura 1a Diagrama de puntos dispersos correspondientes


a pares de valores de x y de y. Ntese que y tiende a
decrecer con el aumento de x, lo cual sugiere coeficientes
de regresin y de correlacin negativos (basado en la Tabla
1).

Figura 1b Los mismos datos que en 1a Fig. 1a, pero ajustados en


base a la regresin y = 2,16 - 0,173x, con r = 0,75

La cual proporciona el valor del coeficiente de determinacin (r). Entonces, lo


nico necesario es calcular

Es decir, tomar la raz indicada del coeficiente de determinacin a los fines de obtener el valor
absoluto de r, y luego agregar el signo (+ o -) de acuerdo a que la correlacin sea positiva o
negativa (lo cual puede ser establecido visualmente a partir del grfico, o bien en base al clculo del
valor de b de la correspondiente regresin y utilizando para r el mismo signo).

Cuando se calculan los valores de r se querr saber, sin embargo, hasta qu punto la correlacin
identificada pudiera haber surgido nicamente por casualidad. Esto puede ser establecido
verificando si el valor estimado de r es significativo, es decir si el valor absoluto de r
es mayor o igual que un valor crtico de r indicado en las tablas estadsticas (ver Tabla de valores
crticos de r en el Apndice 1).

Ejercicio: Calcule a, b y r a partir de los datos presentados en la Tabla 1 y verifique, por medio
de la Tabla del Apndice 1, hasta qu punto el valor estimado de r es significativo para
valores de P = 0,01 y de P = 0,05

Transformacin Lineal en la Regresin: Como se indicara anteriormente, tanto el anlisis de


regresin como el de correlacin se basan en la asuncin de una relacin lineal entre las dos
variables de referencia (lo cual significa que la mejor lnea de ajuste es una recta). Hay muchos
casos en biologa pesquera, sin embargo, en los cuales la relacin entre ambas variables no es
lineal, y un buen ejemplo de ello es la relacin largo-peso, donde:

W = Lb

Ecuacin que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud (L) (ver
Figura 2a).
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Los datos largo-peso, sin embargo, pueden ser ajustados a una regresin lineal si se toma el
logaritmo de ambos miembros, de manera que:

log10W = a + b log10L

Los logaritmos de la longitud y del peso se ajustan extremadamente bien a una regresin lineal,
donde:

y = log10W

x = log10L

Ejercicios regresin y correlacin lineal resueltos

Una compaa de seguros considera que el nmero de vehculos (y) que circulan por una
determinada autopista a ms de 120 km/h , puede ponerse en funcin del nmero de accidentes (x)
que ocurren en ella. Durante 5 das obtuvo los siguientes resultados:

Accidentes xi 5 7 2 1 9

Nmero de vehculos yi 15 18 10 8 20

/font>

Calcula el coeficiente de correlacin lineal.


Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que circulaban por la
autopista a ms de 120 km / h?
Es buena la prediccin?

Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno. Debemos conocer la
media aritmtica de las dos variables, las varianzas, las desviaciones tpicas y la covarianza.

font font
Media aritmtica Varianza Covarianza
> >
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

font
fi xi yi xi2 yi2 xi . yi
>

font
1 5 15 25 225 75
>

font
1 7 18 49 324 126
>

font
1 2 10 4 100 20
>

font
1 1 8 1 64 8
>

font
1 9 20 81 400 180
>

5 24 71 160 1113 409

font>
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

EJERCICIOS REGRESION Y CORRELACION LINEAL RESUELTOS

Correlacin y regresin

El nmero de espaoles (en millones) ocupados en la agricultura, para los aos que se
indican, era:

Ao 1980 1982 1984 1986 1988 1990 1992 1994


Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16

a) Podra explicarse su evolucin mediante una recta de regresin?

b) Qu limitaciones tendran las estimaciones hechas por esa recta?

[sol] a) Si; b) No vale para hacer estimaciones alejadas de los aos considerados.

2. Asocia las rectas de regresin y = x +16, y = 2x 12, y = 0,5x + 5 a las nubes de puntos
siguientes:

3. Asigna los coeficientes de correlacin lineal r = 0,4, r = 0,85 y r = 0,7, a las nubes del problema
anterior.

[sol] a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)

Tipo II. Clculo de la correlacin y regresin

4. [S] a) Calcula la recta de regresin de Y sobre X en la distribucin siguiente realizando todos los
clculos intermedios.

X 10 7 5 3 0

Y 2 4 6 8 10

b) Cul es el valor que correspondera segn dicha recta a X = 7?

[sol] a) y = 0,8276x +10,138; b) 4,3448.

5. [S] El nmero de bacterias por unidad de volumen, presentes en un cultivo despus de un cierto
nmero de horas, viene expresado en la siguiente tabla:
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

X: N de horas 0 1 2 3 4 5

Y: N de bacterias 12 19 23 34 56 62

Calcula:

a) Las medias y desviaciones tpicas de las variables, nmero de horas y nmero de


bacterias.

b) La covarianza de la variable bidimensional.

c) El coeficiente de correlacin e interpretacin.

d) La recta de regresin de Y sobre X.

6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio
dedicadas a su preparacin y las horas que vieron la televisin los das previos al examen.

Nota 5 6 7 3 5 8 4 9

Horas de estudio 7 10 9 4 8 10 5 14

Horas de TV 7 6 2 11 9 3 9 5

a) Representa grficamente los diagramas correspondientes a nota-estudio y nota-TV.

b) Se observa correlacin entre las variables estudiadas? De qu tipo? En qu caso estimas que
es ms fuerte?

[sol] b) S. Directa; inversa.

7. Con los datos del problema anterior, halla el coeficiente de correlacin de nota-estudio y nota-TV.
Qu puede deducirse con ms precisin conociendo la nota que obtuvo una persona en el examen:
el tiempo que dedic al estudio o el que dedic a ver la televisin?
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

[sol] 0,943382 y (0,846283. El tiempo que dedic al estudio.

8. Con los mismos datos, halla las rectas de regresin correspondientes y estima para un alumno
que sac un 2 en el examen:

a) Las horas que estudi.

b) Las horas que vio la TV.

[sol] a) Est = (0,246753 + 1,46753 ota; 2,7 h. b) TV = 14,1299 ( 1,2987 ota; 11,5 h.

Tipo III. Estimacin a partir del a recta de regresin

9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:

Padre 170 173 178 167 171 169 184 175

Hijo 172 177 175 170 178 169 180 187

a) Calcula la recta de regresin que permita estimar la altura de los hijos dependiendo de la del
padre; y la del padre conociendo la del hijo.

b) Qu altura cabra esperar para un hijo si su padre mide 174? Y para un padre, si su hijo mide
190 cm?

[sol] a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181 cm.

10. [S] Durante su primer ao de vida han pesado a Marta cada mes. En la tabla siguiente se dan
sus pesos:

x 1 2 3 4 5 6 7 8 9 10 11 12

y 3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5

En esta tabla, x representa la edad en meses e y el peso en kilogramos.

a) Calcula la media y la desviacin tpica de los pesos.


Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

b) Determina la ecuacin de la recta de regresin de y sobre x, explicando detalladamente los


clculos que haces y las frmulas que utilizas.

[sol] a) 6,225; 1,7181 b) y = 0,48706x + 3,05909

11. [S] Utilizando la recta de regresin de x sobre y correspondiente a la distribucin siguiente:

x = altura sobre el nivel del mar 0 184 231 481 911

y = temperatura media en C 20 18 17 12 10

Calcula la altitud de una ciudad en la que la temperatura media es de 15


Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural

Conclusiones.

Las tcnicas de regresin y correlacin cuantifican la asociacin estadstica entre dos o ms


variables. La regresin lineal simple expresa la relacin entre una variable dependiente Y y una
variable independiente X, en trminos de la pendiente y la interseccin de la lnea que mejor se
ajuste a las variables.

La correlacin simple expresa el grado o la cercana de la relacin entre las dos variables en
trminos de un coeficiente de correlacin que proporciona una medida indirecta de la variabilidad de
los puntos alrededor de la mejor lnea de ajuste Ni la regresin ni la correlacin dan pruebas de
relaciones causa efecto.

http://www.monografias.com/trabajos82/regresion-y-correlacion-lineal/regresion-y-correlacion-
lineal2.shtml#conclusioa

Das könnte Ihnen auch gefallen