Sie sind auf Seite 1von 4

Tarea.

Hacer un estudio descriptivo de las variables que intervienen en el


estudio.
Tomamos datos de la siguiente publicacin:
"Using Cigarette Data for an Introduction to Multiple Regression", by Lauren Mcintyre
in Volume 2, Number 1, of the Journal of Statistics Education.
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido
de alquitrn y nicotina de los cigarrillos vienen acompaados por incrementos en el
monxido de carbono emitido al fumar. Partimos de estos datos y nos planteamos el
siguiente objetivo:

OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que nos permita
estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrn, Nicotina y
Peso del cigarrillo

PARTE 1: Genere un breve informe estadstico descriptivo, a partir de la salida de


ordenador que se adjunta (tmese el espacio que necesite pero sea breve), en el que
seale:
Estos datos demuestran que los aumentos en el contenido de alquitrn y la nicotina
de un cigarrillo estn acompaados por un aumento en el monxido de carbono
emitido desde el humo del cigarrillo.
1) el tamao muestral,
El tamao muestral en esta investigacin es de 25 por cada variable: Alquitrn,
Nicotina y Peso del cigarrillo, que determinan la cantidad de MONOXIDO de
CARBONO
Es una regresin mltiple considerando cul de las variables es ms significativa,
adems que los datos se ingresaron en forma simultnea.
N = 25 datos por variable por cada caracterstica

2) cul es la variable con mayor variabilidad,


El Alquitrn es la variable de mayor variabilidad pues demuestra una desviacin
tpica hacia la media de 5.87634. Por otro lado tambin la cantidad de monxido
de carbono que es la variable dependiente tiene una dispersin de 4.73968 en su
desviacin tpica.
Por otro lado la nicotina no es significativo de acuerdo a estos datos

3) cul de las medias es ms representativa de los datos y


En este caso si consideramos el estadstico vendran a ser los datos en la
regresin del Alquitrn y el monxido de carbono.
3) cul de las medias es ms estable.
El peso tiene una desviacin tpica de 0.087 eso significa que la variabilidad
de los datos con respecto a la media es baja y las cantidades estn cerca

Parte 2. Analice los percentiles a partir de la tabla correspondiente que aparece


debajo.

Las medidas de dispersin deben ser siempre acompaados con el recorrido


intercuartlico esto significa que los resultados de la mediana sern la referencia con los
cuartiles 3 y 1 cuya diferencia representa el recorrido intercuartlico y para cada variable
seria de la siguiente manera
Variable

Recorrido intercuartlico

Monxido de carbono

15.6600 9.7500 = 5.9

Alquitrn

15.1500 7.9000 = 7.25

Nicotina

1.0300 0.6800 = 0.23

Peso

1.016850 0.920550 = 0.0963

De los datos se puede apreciar que cada una de las variables establece un intervalo de
recorrido entre los cuartiles 1 y 3 lo que muestra una variacin con respecto a la mediana
Variable

mediana

Monxido de carbono

13.00 representatividad 5.9

Alquitrn

12.40 representatividad 7.25

Nicotina

0.90 representatividad 0.23

Peso

0.95730 representatividad 0.0963

Parte 3. Analice los Box plot (diagramas de caja) que se adjuntan y saque las
conclusiones ms relevantes. Debe escribir, al menos, sobre la posible asimetra y la
existencia, o no, de outliers

Monxido de carbono
15.6600 9.7500 significa que la mediana se acerca
para el lmite superior de la caja lo que demuestra que no es asimtrico puesto que la
mediana es de 13.00
Alquitrn
15.1500 7.9000 en cuanto a esta variable su media es 12.4
que tambin tiene un acercamiento para el lmite superior
Nicotina
1.0300 0.6800 tambin observamos que la mediana es
0.90 tambin tiene un acercamiento a lmite superior se ven puntos en el exterior que
deben tener tratamiento para que no distorsione la mediana
Peso
1.016850 0.920550 son los limites d la caja en este caso
la mediana esta un tanto cerca a el lmite inferior de la caja con bigotes 0.9573

Das könnte Ihnen auch gefallen