Beruflich Dokumente
Kultur Dokumente
Estadstica inferencial.
201642996
Tercer semestre.
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural
Introduccin.
Regresin lineal.
Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar la relacin
que puede ser observada cuando se grafica un diagrama de puntos dispersos correspondientes a
dos variables, cuya tendencia general es rectilnea; relacin que cabe comprender mediante una
ecuacin.
Formula:
y = a + bx.
En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical en el grfico
(ordenada); en tanto que x indica la magnitud de la coordenada sobre el eje horizontal (abscisa). El
valor de a (que puede ser negativo, positivo o igual a cero) es llamado el intercepto; en tanto que el
valor de b (el cual puede ser negativo o positivo) se denomina la pendiente o coeficiente de
regresin.
n
Monto de las sumas x x y y xy
Paso 3. Estime la pendiente (b) por medio de la relacin:
Correlacin: La correlacin, mtodo por el cual se relacionan dos variables se pude graficar con
un diagrama de dispersin de puntos, a la cual muchos autores le llaman nubes de puntos,
encuadrado dentro de un grfico de coordenadas X Y en la cual se pude trazar una recta y cuyos
puntos ms cercanos de una recta hablaran de una correlacin ms fuerte, ha esta recta se le
denomina recta de regresin, que puede ser positiva o negativa, la primera contundencia a aumentar
y la segunda en descenso o decreciente.
La correlacin entre dos variables es - otra vez puesto en los trminos ms simples - el grado de
asociacin entre las mismas. Este es expresado por un nico valor llamado coeficiente de
correlacin (r), el cual puede tener valores que oscilan entre -1 y +1. Cuando r es negativo, ello
significa que una variable (ya sea x o y) tiende a decrecer cuando la otra aumenta (se trata
entonces de una correlacin negativa, correspondiente a un valor negativo de b en el anlisis de
regresin). Cuando r es positivo, en cambio, esto significa que una variable se incrementa al
hacerse mayor la otra (lo cual corresponde a un valor positivo de b en el anlisis de regresin).
Es decir, tomar la raz indicada del coeficiente de determinacin a los fines de obtener el valor
absoluto de r, y luego agregar el signo (+ o -) de acuerdo a que la correlacin sea positiva o
negativa (lo cual puede ser establecido visualmente a partir del grfico, o bien en base al clculo del
valor de b de la correspondiente regresin y utilizando para r el mismo signo).
Cuando se calculan los valores de r se querr saber, sin embargo, hasta qu punto la correlacin
identificada pudiera haber surgido nicamente por casualidad. Esto puede ser establecido
verificando si el valor estimado de r es significativo, es decir si el valor absoluto de r
es mayor o igual que un valor crtico de r indicado en las tablas estadsticas (ver Tabla de valores
crticos de r en el Apndice 1).
Ejercicio: Calcule a, b y r a partir de los datos presentados en la Tabla 1 y verifique, por medio
de la Tabla del Apndice 1, hasta qu punto el valor estimado de r es significativo para
valores de P = 0,01 y de P = 0,05
W = Lb
Ecuacin que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud (L) (ver
Figura 2a).
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural
Los datos largo-peso, sin embargo, pueden ser ajustados a una regresin lineal si se toma el
logaritmo de ambos miembros, de manera que:
log10W = a + b log10L
Los logaritmos de la longitud y del peso se ajustan extremadamente bien a una regresin lineal,
donde:
y = log10W
x = log10L
Una compaa de seguros considera que el nmero de vehculos (y) que circulan por una
determinada autopista a ms de 120 km/h , puede ponerse en funcin del nmero de accidentes (x)
que ocurren en ella. Durante 5 das obtuvo los siguientes resultados:
Accidentes xi 5 7 2 1 9
Nmero de vehculos yi 15 18 10 8 20
/font>
Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno. Debemos conocer la
media aritmtica de las dos variables, las varianzas, las desviaciones tpicas y la covarianza.
font font
Media aritmtica Varianza Covarianza
> >
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural
font
fi xi yi xi2 yi2 xi . yi
>
font
1 5 15 25 225 75
>
font
1 7 18 49 324 126
>
font
1 2 10 4 100 20
>
font
1 1 8 1 64 8
>
font
1 9 20 81 400 180
>
font>
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural
Correlacin y regresin
El nmero de espaoles (en millones) ocupados en la agricultura, para los aos que se
indican, era:
[sol] a) Si; b) No vale para hacer estimaciones alejadas de los aos considerados.
2. Asocia las rectas de regresin y = x +16, y = 2x 12, y = 0,5x + 5 a las nubes de puntos
siguientes:
3. Asigna los coeficientes de correlacin lineal r = 0,4, r = 0,85 y r = 0,7, a las nubes del problema
anterior.
4. [S] a) Calcula la recta de regresin de Y sobre X en la distribucin siguiente realizando todos los
clculos intermedios.
X 10 7 5 3 0
Y 2 4 6 8 10
5. [S] El nmero de bacterias por unidad de volumen, presentes en un cultivo despus de un cierto
nmero de horas, viene expresado en la siguiente tabla:
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural
X: N de horas 0 1 2 3 4 5
Y: N de bacterias 12 19 23 34 56 62
Calcula:
6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio
dedicadas a su preparacin y las horas que vieron la televisin los das previos al examen.
Nota 5 6 7 3 5 8 4 9
Horas de estudio 7 10 9 4 8 10 5 14
Horas de TV 7 6 2 11 9 3 9 5
b) Se observa correlacin entre las variables estudiadas? De qu tipo? En qu caso estimas que
es ms fuerte?
7. Con los datos del problema anterior, halla el coeficiente de correlacin de nota-estudio y nota-TV.
Qu puede deducirse con ms precisin conociendo la nota que obtuvo una persona en el examen:
el tiempo que dedic al estudio o el que dedic a ver la televisin?
Universidad de San Carlos de Guatemala
Centro Universitario Solol CUNSOL
Programa de Formacin Inicial Docente
Profesorado en Educacin Primaria Bilinge Intercultural
8. Con los mismos datos, halla las rectas de regresin correspondientes y estima para un alumno
que sac un 2 en el examen:
[sol] a) Est = (0,246753 + 1,46753 ota; 2,7 h. b) TV = 14,1299 ( 1,2987 ota; 11,5 h.
a) Calcula la recta de regresin que permita estimar la altura de los hijos dependiendo de la del
padre; y la del padre conociendo la del hijo.
b) Qu altura cabra esperar para un hijo si su padre mide 174? Y para un padre, si su hijo mide
190 cm?
10. [S] Durante su primer ao de vida han pesado a Marta cada mes. En la tabla siguiente se dan
sus pesos:
x 1 2 3 4 5 6 7 8 9 10 11 12
y 3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5
y = temperatura media en C 20 18 17 12 10
Conclusiones.
La correlacin simple expresa el grado o la cercana de la relacin entre las dos variables en
trminos de un coeficiente de correlacin que proporciona una medida indirecta de la variabilidad de
los puntos alrededor de la mejor lnea de ajuste Ni la regresin ni la correlacin dan pruebas de
relaciones causa efecto.
http://www.monografias.com/trabajos82/regresion-y-correlacion-lineal/regresion-y-correlacion-
lineal2.shtml#conclusioa