Sie sind auf Seite 1von 6

UNIVERSIDAD SANTIAGO DE CALI

FACULTAD DE CIENCIAS BÁSICAS


Pág.1/6
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

UNIDAD 4: CORRELACIÓN Y REGRESIÓN


OTROS MODELOS DE REGRESIÓN

2. MODELO LOGARÍTMICO
Es un modelo de regresión, que se emplea cuando la
dependencia entre las variables 𝑌 (variable dependiente) y 𝑋
(variable independiente) es de forma logarítmica, en cuyo caso
se ajusta a la nube de puntos del diagrama de dispersión una
función del tipo:

𝑌 = 𝑎 + 𝑏ln(𝑋)

Donde 𝒂 y 𝒃 son los parámetros o coeficientes del modelo de regresión logarítmico


y ln es la función logaritmo natural.

Ejemplo: Se quiere identificar la relación que puede existir entre el tiempo de


duración en horas de las pruebas de estado y el nivel de agotamiento en la prueba
(0: Sin agotamiento y 10: Agotamiento extremo), para esto se tomó una muestra
aleatoria de los evaluados donde se observaron los siguientes resultados:

Tiempo 0.5 0.9 1.2 1.7 2.2 2.7 3.2 3.6 3.9
Agotamiento 1.9 3.4 4.4 5.2 5.7 5.4 6.1 7.2 6.8

Regresión lineal Regresión logarítmica


8.0 8.0

7.0 7.0

6.0 6.0
Nivel de agotamiento

Nivel de agotamiento

5.0 5.0

4.0 4.0
y = 1.2807x + 2.2904 y = 2.3444ln(x) + 3.6892
3.0 R² = 0.8745 3.0 R² = 0.9574

2.0 2.0

1.0 1.0

0.0 0.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Tiempo de duración Tiempo de duración
Figura 1: Diagramas de dispersión entre las variables nivel de agotamiento (𝑌) y
tiempo de duración (𝑋), con dos modelos diferentes ajustados.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.2/6
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

En la figura 1 se observa que el modelo de regresión logarítmico presenta un mejor


ajuste para este conjunto de datos puesto que el valor del coeficiente de
determinación 𝑅 2 es mayor. Las estimaciones de los coeficientes son las siguientes:

Regresión lineal Regresión logarítmica


𝑎 2.2904 3.6892
𝑏 1.2807 2.3444

A partir de estos resultados se pueden obtener predicciones, por ejemplo: ¿Cuánto


sería el nivel de agotamiento si el tiempo de duración de la prueba es de 2 horas?
• Con el modelo de regresión lineal se tiene que: 𝑌 = 2.2904 + 1.2807𝑋
Por lo tanto, si 𝑋 = 2, entonces: 𝑌 = 2.2904 + 1.2807 ∗ (2) = 4.8518
Es decir, aproximadamente 4.9.
• Con el modelo de regresión logarítmico se tiene que: 𝑌 = 3.6892 + 2.3444ln(𝑋)
Por lo tanto, si 𝑋 = 2, entonces: 𝑌 = 3.6892 + 2.3444 ∗ ln(𝑋) = 5.3142
Es decir, aproximadamente 5.3.
Como se puede apreciar la información obtenida por el modelo logarítmico parece
más confiable de acuerdo con lo observado en los gráficos de la figura 1.

2.1. ¿CÓMO OBTENER EL MODELO DE REGRESIÓN LOGARÍTMICO?


Las fórmulas para encontrar las estimaciones de los coeficientes y el procedimiento
empleado pueden resultar complejos para realizarlos manualmente, por tal motivo
es recomendable apoyarse en las herramientas computacionales como Excel para
hacer esta labor. Los pasos empleados se explicarán por medio del siguiente
ejemplo.

Ejemplo: Se realizo un estudio cuyo objetivo fue evaluar el consumo de oxígeno


(en mg.kg.hr) de cachama blanca (Piaractus brachypomus) durante diferentes
etapas de desarrollo (peso corporal en gramos), los datos obtenidos a partir de una
muestra aleatoria son los siguientes:

Peso corporal 10 50 100 200 300 500


Consumo de oxigeno 578 380 294 271 192 191

Se requiere calcular el modelo de regresión logarítmico del consumo de oxígeno a


partir del peso corporal. Y utilizar ese modelo para predecir el consumo de oxigeno
si el peso corporal de la cachama blanca es de 400 gramos.

Lo primero es ingresar los datos en un archivo de Excel, en una primera columna


se ingresa la información de la variable 𝑋 (Peso) y en una segunda columna la
información de la variable 𝑌 (Oxígeno), para luego hacer un diagrama de dispersión.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.3/6
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

En el gráfico obtenido el eje horizontal corresponde a los valores de la variable 𝑋 y


el eje vertical corresponde a los valores de la variable 𝑌. Para garantizar que los
valores de la variable 𝑋 queden en el eje horizontal y los valores de la variable 𝑌
queden en el eje vertical, se deben ingresar en Excel los datos de la variable 𝑋
siempre en una columna antes a la columna donde se ingresan los datos de la
variable 𝑌.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.4/6
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Se da clic derecho en cualquiera de los puntos del gráfico y se da un clic en la


ventana emergente en la opción: Agregar línea de tendencia…

Inmediatamente el Excel traza la línea de regresión (línea punteada) y muestra una


información importante en una ventana al lado derecho de la pantalla.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.5/6
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Se seleccionan algunas de las opciones de la ventana del lado derecho, por


ejemplo: Logarítmica, la cual genera el modelo de regresión logarítmico en lugar del
modelo de regresión lineal, Presentar ecuación en el gráfico, la cual muestra la
ecuación del modelo de regresión. Otra opción es: Presentar el valor R cuadrado en
el gráfico, la cual muestra el valor del coeficiente de determinación. Para esto se da
un clic en las casillas en blanco al lado izquierdo de cada una de las opciones.

Si la ecuación se sobrepone a los puntos en el gráfico esta se puede seleccionar y


desplazarla a otro lugar dentro del gráfico, además se puede aumentar el tamaño
de la letra para apreciarla mejor.

Como se puede apreciar en la ventana del lado derecho de la figura anterior, en las
opciones de línea de tendencia se pueden elegir diferentes modelos de regresión,
un criterio de selección de modelos seria elegir aquel que tenga el mayor valor
de 𝑹𝟐 , pues esto indicaría que se ajusta mejor a ese conjunto de datos.

Finalmente, para predecir el consumo de oxigeno si el peso corporal de la cachama


blanca es de 400 gramos, se reemplaza este valor en la variable 𝑋, de la ecuación
obtenida en la figura anterior:
• El modelo de regresión logarítmico es: 𝑌 = 791.3 − 101.4ln(𝑋)
Por lo tanto, si 𝑋 = 400, entonces: 𝑌 = 791.3 − 101.4 ∗ ln(𝑋) = 183.7655
Es decir, aproximadamente 184.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.6/6
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

A continuación, se presenta el anterior cálculo por medio de Excel.

La función logaritmo natural se obtiene en Excel por medio de la formula


=ln(número), donde número es el valor al cual se va a calcular su logaritmo natural.

Das könnte Ihnen auch gefallen