Beruflich Dokumente
Kultur Dokumente
W
pensamiento a medida que examinamos los datos. Los siete capítulos de la Parte I presenta los
principios y las herramientas de análisis estadístico de los datos. Que equiparlo con las
habilidades que son inmediatamente útiles siempre que tratar con números.
Estos capítulos reflejan el fuerte énfasis en explorar datos que caracteriza la moderna- Statis
tics. A veces esperamos sacar conclusiones que se aplican a un valor que va más allá de los datos
en la mano. Esta es la inferencia estadística, el tema de gran parte del resto del libro. El análisis
de los datos es esencial si hemos de confiar en los resultados de la inferencia, pero el análisis de
los datos no es sólo la preparación para la inferencia. A grandes rasgos, que siempre se puede
hacer el análisis de datos, pero requiere un poco de inferencia condiciones especiales.
Uno de los principios de organización del análisis de datos es primero mirar una cosa a la
vez y, a continuación, en las relaciones interpersonales. Nuestra presentación sigue este
principio. En los capítulos 1, 2 y 3 se estudian variables y sus distribuciones. Los capítulos 4, 5 y
6 se refieren a las relaciones entre variables. El capítulo 7 revisa esta parte del texto.
Getty Images/Discovery Channel
imágenes
1
Esta página se ha dejado intencionadamente en blanco.
AP Photo/Mary Altaffer
Las distribuciones se
describiera con
gráficos
INTHISCHAPTER
ESCOVER...
Estadística es la ciencia de los datos. El volumen de datos disponibles para Los individuos y las variables
nosotros es abrumar- ing. Por ejemplo, la Oficina del Censo recopila los datos Las variables categóricas:
de la encuesta sobre la Comunidad Estadounidense de 3.000.000 unidades de gráficos circulares y gráficos de
vivienda cada año. Los astrónomos que trabajan con datos de decenas de barras
millones de galaxias. La desprotección de escáneres en 6500 Wal-Mart Stores
Las variables cuantitativas:
en 15 países registrar cientos de millones de transacciones cada semana, todos histogramas
guardan para informar tanto a Wal-Mart y sus proveedores. El primer paso
Interpretación de los histogramas
para hacer frente a esa avalancha de datos es organizar nuestro pensamiento
acerca de los datos. Afortunadamente, podemos hacerlo sin mirar a millones Las variables cuantitativas: stemplots
de puntos de datos. Parcelas de tiempo
Los individuos son los objetos descritos por un conjunto de datos. Los individuos
pueden ser personas, pero también pueden ser animales o cosas.
3
Esta página se ha dejado intencionadamente en blanco.
Esta página se ha dejado intencionadamente en blanco.
4 Capítulo 1 • Distribuciones describiera con gráficos
Un estudiante del colegio de la base de datos, por ejemplo, incluye datos sobre
cada estudiante. Los estudiantes son los individuos descritos por el conjunto de
datos. Para cada individuo, los datos que contienen los valores de variables tales
como fecha de nacimiento, la elección de los principales, y el promedio de
calificaciones. En la práctica, cualquier conjunto de datos se acompaña por
información que nos ayuda a comprender los datos. Cuando planee un estudio
estadístico o explorar los datos del trabajo de los demás, hágase las siguientes
preguntas:
1. ¿Quién? Lo que hacen los individuos describir los datos? Cuántas personas
aparecen en los datos?
2. ¿Qué? Cómo muchas variables no contienen los datos? ¿Cuál es el exacto
def- initions de esas variables? ¿En qué unidad de medida es cada variable
registrada? Pesas, por ejemplo, podrían registrarse en libras, en miles de libras,
o en kilogramos.
3. ¿Por qué? ¿Qué utilidad tienen los datos? Esperamos dar respuesta a algunas
preguntas concretas? ¿Queremos respuestas para estas personas o por algún
¿Qué es ese número?
grupo mayor que estos individuos se supone que representan? Son los
Usted podría pensar que los
individuos y las variables adecuadas para la finalidad?
números, a diferencia de las
palabras, son universales. Piénselo
de nuevo. Un "mil millones" en los
Algunas variables, como el sexo de una persona o colegio mayor, simplemente
Estados Unidos significa
1.000.000.000 (9 ceros). En coloque a los individuos en categorías. Otros, como la altura y el puntaje promedio
Europa, un "Mil Millones" es de de tomar valores numéricos para que podamos hacer operaciones aritméticas. No
1.000.000.000.000 (doce ceros). tiene sentido dar un ingreso promedio de los empleados de una empresa, pero no
Bien, esas son las palabras que tiene sentido dar un "promedio" de sexo. Sin embargo, podemos contar el número
describen los números. Pero las de los hombres y las mujeres empleados y realizar operaciones aritméticas con estas
comas en grandes números son
períodos en muchos otros idiomas.
cuentas.
Esto es tan confuso que los
estándares internacionales exigen
espacios en lugar, de modo que un
americano millones está escrito 1
000 000 000. Una variable categórica coloca a una persona en uno de varios grupos o categorías.
Y el punto decimal del mundo de Una variable cuantitativa toma valores numéricos para que las operaciones
habla inglesa es la coma aritméticas como adición y un promedio de sentido. Los valores de una variable
decimal en muchos otros idiomas,
cuantitativa usualmente se graban en una unidad de medida como segundos o
de modo que 3.1416 en los
kilogramos.
Estados Unidos se convierte en
3,1416 en Europa. Entonces,
¿cuál es el número 10,642.389?
Depende de donde usted se
encuentra.
Figura 1.1.
APLSSSURKNOWLEDGE
La distribución de una variable nos indica qué valores toma y con qué frecuencia se
toma estos valores.
Los valores de una variable categórica son etiquetas de las categorías. La distribución
de una variable categórica enumera las categorías y da el recuento o el porcentaje
de individuos que entran en cada categoría.
Es una buena idea comprobar datos de coherencia. Los porcentajes deben añadir al
100%. De hecho, agregan al 99,7%. ¿Qué ha sucedido? Cada uno por ciento se
redondea a la decena más cercana.
Los porcentajes exactos añadiría a 100, pero los porcentajes redondeados sólo se acercan. Este
Es error roundoff. Errores Roundoff no apunten a errores en nuestro trabajo, sólo para el efecto Error roundoff
De redondear los resultados.
Columnas de números, tómese tiempo para leer. Puede utilizar un gráfico circular
o un gráfico de barras para mostrar la distribución de una variable categórica con
mayor intensidad. Las figuras 1.2 y 1.3 muestran estas pantallas para la distribución
de especializaciones universitarias.
Los gráficos circulares muestran la distribución de una variable categórica como un "pastel" cuyo Gráfico de tarta
Cortes están dimensionados por los recuentos o porcentajes para las categorías. Los gráficos circulares son torpes
Para hacer a mano, pero el software hará el trabajo por usted. Un gráfico de tarta
debe incluir todas las categorías que conforman un todo. Utilice un gráfico de tarta
sólo cuando desee destacar cada categoría la relación con el todo. Necesitamos el
"otras majors"categoría Ejemplo 1.2
8 CHAPTER 1 • Picturing Distributions with Graphs
20
17,4%
Por ciento de estudiantes que
10
15
15
planean grandes 5
planean grandes 5
0
Campo de Campo de
estudio estudio
(b)
Figura 1.3
Los gráficos de barras de la distribución de carreras más de los estudiantes que ingresan a la
universidad. En (a), los bares siguen el orden alfabético de los campos de estudio. En (B), los
mismos aparecen barras en orden de altura.
• Categorical variables: pie charts and bar graphs 9
No podemos hacer un gráfico para mostrar estos datos. Cada uno por ciento de la tabla
se refiere a un dispositivo o servicio diferente, no a las partes de un todo único. La figura
1.4 es un gráfico de barras comparando los nueve dispositivos y servicios. De nuevo
hemos organizado las barras en orden de altura.
Figura 1.4
APLSSSURKNOWLEDGE
Formato Cuota de
audiencia
País El 12,6%
Noticias/Hablar/información 10,4%
Contemporáneo adulto 7,1%
Pop Hit contemporáneo 5,5%
Classic Rock 4,7%
Contemporáneo rítmico 4,2%
golpear
Urbana Contemporánea 4,1%
Urbano contemporáneo adulto 3,4%
Oldies 3,3%
Hot contemporánea para 3,2%
adultos
Música Regional Mexicana 3,1%
(a) ¿Cuál es la suma de las cuotas de audiencia para estos formatos? ¿Qué
porcentaje de los oyentes escucha emisoras con otros formatos?
(b) Hacer un gráfico de barras para mostrar estos datos. Asegúrese de incluir una
categoría "Otro formato".
(c) ¿Sería correcto para mostrar estos datos en un gráfico de tarta? ¿Por qué?
1.4 ¿Cuánto los estudiantes beben? Penn State University informa de los
siguientes datos sobre el número promedio de bebidas consumidas cuando "juerga"
para diversos grupos de sus estudiantes. 4 Al menos, estos son los promedios de lo
que los estudiantes afirmó cuando se le preguntó.
(a) Explicar por qué no es correcto utilizar un gráfico para mostrar estos datos.
(b) Hacer un gráfico de barras de los datos. Observe que debido a que los datos
contraste de grupos como los hombres y las mujeres es mejor mantener estos
bares uno al lado del otro, en lugar de organizar las barras en orden de altura.
• Quantitative variables: histograms 11
1.5 Nunca en Domingo? Los nacimientos no son, como se podría pensar, distribuida
uniformemente en los días de la semana. Aquí están los números promedio de niños
nacidos en cada día de la semana en 2005: 5
Día Nacimie
ntos
Domingo 7374
Lunes 11,704
Martes 13,169
Miércoles 13,038
Jueves 13,013
Viernes 12.664
Sábado 8,459
Presentar estos datos en un gráfico de barras bien etiquetados. Podría también ser
correctos para hacer un gráfico de tarta? Sugerir algunas posibles razones por las que
hay menos nacimientos durante los fines de semana.
Tabla 1.1 por ciento de la población del estado nacido fuera de los Estados Unidos
Estado Por Ciento Estado Por Ciento Estado Por
Ciento
Paso 2. Contar los individuos de cada clase. Aquí están los recuentos:
La clase Conta
r
0.1 a 5.0 20
5.1 A 10.0 13
10.1 a 15.0 10
15.1 a 20.0 5
20.1 a 25.0 2
25.1 a 30.0 1
Verificar que los recuentos añadir a 51, el número de individuos en los datos (los 50
estados y el Distrito de Columbia).
Paso 3. Dibujar el histograma. Marcar la escala de la variable cuya distribución se están
mostrando en el eje horizontal. Ese es el porcentaje de habitantes del estado nacidos en
el extranjero. La escala va de 0 a 30 porque esa es la duración de las clases que escogimos.
El eje vertical contiene la escala de recuentos. Cada barra representa una clase. La base
de la barra cubre la clase y la altura de la barra es el recuento de clase. Dibujar las barras
con ningún espacio horizontal entre ellos, salvo que una clase está vacío, de modo que su
bar tiene altura cero. La figura 1.5 es nuestro histograma.
Aunque los histogramas se asemejan a los gráficos de barras, sus detalles y usos son
diferentes. Una su- togram muestra la distribución de una variable cuantitativa. El eje
horizontal de un histograma está marcado en las unidades de medida de la variable. Un
bar
• Quantitative variables: histograms 13
Figura 1.5
Histograma de la distribución del
20
porcentaje de residentes nacidos en
el extranjero en los 50 estados y el
Este bar tiene altura 13
Distrito de Columbia, por ejemplo,
porque 13 Estados
1.4.
15
10 25
0
APLSSSURKNOWLEDGE
1.6 Viajar al trabajo. ¿Durante cuánto tiempo debe viajar cada día para ir al trabajo o a
la escuela? El cuadro 1.2 muestra el promedio de los tiempos de viaje de trabajo para los
trabajadores en cada estado que son
14 CHAPTER 1 • Picturing Distributions with Graphs
Cuadro 1.2 Promedio de tiempo de viaje al trabajo (minutos) para los adultos
que trabajan fuera del hogar
Estado Tiem Estado Tiem Estado Tiempo
po po
Figura 1.6
Otro histograma de la distribu- ción
15
del porcentaje de residentes nacidos en
el extranjero, con clases medias tan
amplia como en la Figura 1.5.
Histogramas con más clases muestran
más detalles, pero pueden tener un
10
patrón menos claro.
Número de
5miembros
0
10 25
una distribución sesgada hacia la derecha si el lado derecho del histograma (que
contienen la mitad de las observaciones con valores mayores) se extiende mucho más
allá de la izquierda. Es un sesgo a la izquierda si el lado izquierdo del histograma se
extiende mucho más allá de la parte derecha.
Figura 1.7
Histograma del examen Iowa
vocabu- lary decenas de séptimo
grado todos los estudiantes en Gary,
Indiana, por ejemplo
12
10
0
Figura 1.8
Histograma del por ciento de
25
estudiantes graduados de la escuela
secundaria en cada Estado que
tomaron la prueba de razonamiento
20
SAT, por ejemplo 1.7. El gráfico
muestra dos grupos de estados:
actuar unidos (donde pocos
estudiantes tomar el SAT) en la
15
izquierda y SAT unidos a la derecha.
Número de
miembros
10 5
Los datos sobre los ingresos de las personas son generalmente fuertemente
sesgados a la derecha. Hay muchos ingresos moderados, algunos grandes
ingresos, y unos enormes ingresos. Muchos dis- tributions con formas
irregulares que no son simétricas ni sesgada. Algunos datos muestran otros
patrones, como los dos picos en la Figura 1.8. Usar tus ojos, describir el patrón
puede ver y, a continuación, tratar de explicar el patrón.
APLSSSURKNOWLEDGE
1.8 Viajar al trabajo. En el ejercicio 1.6, usted hizo un histograma de la media de los
tiempos de viaje para trabajar en el cuadro 1.2. La forma de la distribución es un
poco irregular. Es más simétrica o asimétrica? Acerca de dónde está el centro
(punto medio) de los datos? ¿Qué es la propagación en términos del menor y el
mayor de los valores?
1.9 Las mujeres solteras. La figura 1.9 muestra la distribución de los porcentajes de
estado de las mujeres mayores de 15 años que nunca han estado casados.
Figura 1.9
Histograma del estado porcentajes de
14
mujeres mayores de 15 años que nunca
han estado casados, para el ejercicio
12
1.9.
10
Número de
4 miembros
2
0 6 8
Figura 1.10
1 289
Stemplot del porcentajes de residentes 2 12778 9
nacidos en el extranjero en los Estados 3 2368899
Unidos, por ejemplo 1.8. Es un
4 1249
porcentaje cada tallo y hojas son
5 14669
décimas del uno por ciento.
6 369
7 0
8 13
9 27
10 113
11
12 24679
13 8
14 1
15 19
16 3 El 15 de tallo contiene
17 los valores de 15,1 y
18 9 15,9 para Arizona
19 1
20 1
21 6
22
23
24
25
26
27 2
Sólo observaciones sobre este tallo. Organizar las hojas en orden, de modo
que 15|19 es una fila en el stemplot. La figura 1.10 es la completa stemplot para los
datos de la tabla 1.1.
Un stemplot luce como un histograma activado. Comparar la stemplot en Fig ura-
1.10 con los histogramas de los mismos datos en las figuras 1.5 y 1.6. La stemplot
es como un histograma con muchas clases. Puede elegir las clases en un histograma.
Las clases (tallos) de un stemplot son dados a usted. Los tres gráficos muestran una
distribución que tiene un pico y está sesgada a la derecha. Las figuras 1.6 y 1.10
tienen las clases suficientes para demostrar que el Estado de California (27,2%) está
ligeramente separados de la larga cola derecha de la distribución sesgada. Los
histogramas son más flexibles que stemplots porque puede elegir las clases. Pero el
stemplot, a diferencia del histograma, preserva el valor real de cada
observación. Stemplots no funcionan bien para grandes conjuntos de datos, donde
cada tallo debe mantener un gran número de hojas. No intente hacer una stemplot
de un conjunto grande de datos, tales como los 947 Iowa puntajes en la Figura 1.7.
Del estudio es que "la variación es en todas partes."Aquí hay datos de un estudiante típico
ejercicio de laboratorio: la carga en libras necesarias para separar las piezas de abeto
Douglas 4 pulgadas de largo y
1,5 pulgadas cuadradas.
332 319 326 265 333 323 330 320 305 327
230 309 327 337 323 241 302 313 287 319
Ahora podemos hacer un stemplot con los dos primeros dígitos (miles de libras) como
tallos y el tercer dígito (cientos de libras) como las hojas. La figura 1.11 es el stemplot.
Ro- tate el stemplot hacia la izquierda de modo que se asemeja a un histograma, con 230
en el extremo izquierdo de la escala. Esto deja claro que la distribución está sesgada a
la izquierda. El punto medio es de alrededor de 320 (32.000 libras) y la propagación es
de 230 a 337. Debido a la fuerte inclinación, somos reacios a llamar al menor
observaciones outliers. Parecen formar parte de la larga cola izquierda de la distribución.
Antes de utilizar la madera como esta en construcción, deberíamos preguntar por qué
algunas piezas son mucho más débil que el resto.
Figura 1.11
23 0
Stemplot de su resistencia a la rotura
24 1
de las piezas de madera, redondeado
25
al próximo- est 100 libras, por
26 5 ejemplo 1.9. Los tallos son miles de
27 libras y las hojas son cientos de
28 7 libras.
29
30 259
31 399
32 033677
33 0237
32 033
32 677
33 023
33 7
Redondeo y dividir los tallos son asuntos para el juicio, como elegir las clases en un
histograma. La fuerza de la madera requieren datos redondeo pero no necesitan
dividir- ting tallos. La única variable Calculadora de estadística sobre el texto de
CD y sitio Web le permite decidir si desea dividir los tallos, de modo que es fácil
ver el efecto.
APLSSSURKNOWLEDGE
1.10 Viajar al trabajo. Hacer un stemplot del promedio de los tiempos de viaje para trabajar
en el cuadro 1.2. Utilizar minutos como sus tallos. Porque el stemplot conserva los
valores reales de las observaciones, es fácil encontrar el punto medio (26 de las 51
observaciones en orden) y la propagación. ¿Qué son?
1.11 El gasto en salud. El cuadro 1.3 muestra el gasto anual por persona en el cuidado
de la salud en los países más ricos del mundo. 11 realizar una stemplot de los datos
después del redondeo al más cercano a 100 dólares (de modo que los tallos son
miles de dólares y hojas son cientos de dólares). Dividir los tallos, poner las hojas
0 a 4 en el primer tallo y hojas de 5 a 9 en el segundo vástago del mismo valor.
Describir la forma, el centro y la propagación de la distribución. Qué país es el alto
outlier?
Cuadro 1.3 el gasto anual per cápita en salud (en dólares de EE.UU.)
País Dólares País Dólares País Dólares
Parcelas de tiempo
Muchas de las variables que se miden en intervalos a lo largo del tiempo.
Podríamos, por ejemplo, medir la altura de un niño en crecimiento o el precio
de un stock al final de cada mes. En estos ejemplos, nuestro interés principal es
el cambio en el tiempo. Para mostrar cambiar a través del tiempo, hacer
una parcela de tiempo.
Cuando examine una parcela de tiempo, mirar una vez más a un patrón global
y para
Fuertes desviaciones del patrón. La figura 1.12 muestra un fuerte ciclos regulares, arriba Ciclos
Y abajo los movimientos en el nivel de agua. Los ciclos muestran los efectos de la
Florida la temporada húmeda (alrededor de junio a noviembre y la temporada seca
de Diciembre a Mayo (aproximadamente). Los niveles de agua son más altas en el
otoño atrasado. En abril y mayo de 2001 y 2002, los niveles de agua fueron menos
de cero-el agua la mesa estaba por debajo del nivel del suelo y la superficie estaba
seca. Si se mira de cerca, se puede ver la variación de año tras año. La temporada
seca en 2003 terminó temprano, con la primera tormenta tropical de abril. En
consecuencia, el nivel de agua en la estación seca en 2003 nunca cayó por debajo
de cero.
Otro patrón común en una parcela de tiempo es una tendencia a largo plazo hacia arriba Tendencia
O El movimiento descendente a lo largo del tiempo. Muchas variables
económicas muestran una tendencia ascendente. Los ingresos, los precios de la
vivienda y (por desgracia) Colegio matrículas generalmente tienden a
desplazarse hacia arriba a través del tiempo.
Tiempo de histogramas y gráficos indican diferentes tipos de información sobre una variable.
La hora solar en la figura 1.12 presenta los datos de series de tiempo que muestran el cambio Los datos de series de tiempo
En el nivel de agua en una ubicación a lo largo del tiempo. Un histograma muestra transversal Datos transversales
Los datos, tales como los niveles de agua en muchos lugares de los Everglades
al mismo tiempo.
APLSSSURKNOWLEDGE
1.12 El costo de la universidad. Aquí están los datos sobre el promedio de la matrícula
y las tasas aplicadas a los estudiantes en el estado por colleges y universidades
públicas de cuatro años, de 1976 a 2007
24 CHAPTER 1 • Picturing Distributions with Graphs
Figura 1.12
Tiempo parcela de la profundidad del
0.8
agua en una estación de vigilancia en
el Parque Nacional Everglades durante
un período de casi tres años, por
ejemplo, 1.10. Los ciclos anuales
0.6
reflejan la Florida estaciones húmeda
y seca.
0.4
La profundidad del
0.0 (metros)
agua 0.2 0.2
0.4
Años académicos. Porque casi cualquier variable medido en dólares aumenta con
el tiempo debido a la inflación (la caída del poder adquisitivo de un dólar), los
valores se dan en "dólares constantes", ajustada para tener el mismo poder
adquisitivo que el dólar había en 2007 13.
CHAPTER1 SUMAMARS
CHE C K YS U R SKILLS
1.13 Aquí están las primeras líneas de un conjunto de datos del profesor al final de un curso de estadísticas:
6 8
7
8 8
9 79
10 08
11 1 5566
12 012223444 457888 99 9
13 01 233333444899
14 02666
15 23
16 8
Chapter 1 Exercises 27
CHAPTER1 EXCERISES
1.23 Los estudiantes de medicina. Los alumnos que han terminado la escuela
médica están asignados a res- idencies en hospitales para recibir más capacitación
en una especialidad médica. Aquí se parte de una base de datos hipotéticos de los
estudiantes que buscan posiciones de residencia. USMLE es el puntaje del
estudiante en el paso 1 del examen para la licencia médica nacional.
1.25 ¿De qué color es tu coche? Los colores más populares para automóviles y
camionetas cambian con el tiempo. Plata verde pasó en 2000 a ser el color más
popular en todo el mundo, a continuación, dio paso a tonos de blanco en 2007.
Aquí está la distribución de colores para vel.- cles vendidos en América del Norte
en 2007:14
Color Popularid
ad
Blanco 19%
Silver 18%
Negro 16%
Rojo 13%
Gris 12%
Blue 12%
Beige, marrón 5%
Otros colores
(a) Explicar por qué no es correcto utilizar un gráfico para mostrar estos datos.
(b) Hacer un gráfico de barras de los datos.
1.27 Las muertes entre los jóvenes. Entre personas de 15 a 24 años en los Estados
Unidos, las principales causas de muerte y el número de muertes en 2005 fueron:
accidentes, 15,567; homicidio, suicidio; 5359, 4139, 1717; cáncer; enfermedad
cardiaca, 1067; anomalías congénitas, 483 16.
(a) Hacer un gráfico de barras para mostrar estos datos.
(b) Para hacer un gráfico de tarta, necesita una pieza adicional de información. ¿Qué es?
1.28 Orígenes hispanos. La figura 1.13 es un gráfico de tarta preparada por la
Oficina del Censo para mostrar el origen de los más de 43 millones de hispanos
en los Estados Unidos en 2006. 17 acerca de qué tanto por ciento de los hispanos
son mexicanos? Puertorriqueño? Se puede ver que es difícil determinar el número
de un gráfico circular. Los gráficos de barras son mucho más fáciles de utilizar.
(La Oficina del Censo no incluyen los porcentajes en su gráfico de tarta).
Chapter 1 Exercises 29
Figura 1.13
Distribución porcentual de los
hispanos por tipo: 2006 Gráfico de tarta de los orígenes
nacionales de los residentes hispanos
Puerto Rican de los Estados Unidos, para el
Cuban ejercicio 1.28.
América Central
Otro hispano de
Mexicana
América del Sur
Hacer dos gráficos de barras de estos porcentajes, uno con barras ordenadas como en
la tabla (alfa- betically) y la otra con barras en orden desde el más alto hasta el más
corto. Las comparaciones son más fáciles si usted ordena las barras por la altura.
1.30 Las muchachas adolescentes comer fruta? Todos sabemos que la fruta es
buena para nosotros. Muchos de nosotros no come lo suficiente. La figura 1.14 es un
histograma del número de porciones de frutas al día reclamada por 74 de 17 años, niñas
en un estudio realizado en Pensilvania.19 describen la forma, el centro y la
propagación de esta distribución. ¿Qué porcentaje de estas chicas comían menos
de dos porciones por día?
1.31 IQ test scores. La figura 1.15 es un stemplot de IQ test scores de 78 estudiantes
de séptimo grado en una escuela del medio oeste rural20.
(a) Cuatro alumnos tuvieron puntuaciones bajas que pueden considerarse
atípicos. Ignorar estas, describir la forma, el centro y la propagación de la
distribución. (Observe que se ve aproximadamente en forma de campana).
(b) A menudo leemos que las puntuaciones de CI para grandes poblaciones están
centradas en el 100. ¿Qué porcentaje de estos 78 estudiantes tienen
puntuaciones superiores a 100?
1.32 Devuelve sobre las acciones comunes. El retorno de un stock es el cambio en su
precio de mercado, además de los pagos de dividendos. Rendimiento total se expresa
generalmente como un porcentaje
30 CHAPTER 1 • Picturing Distributions with Graphs
Figura 1.14
La distribución de consumo de fruta
15
en una muestra de 74, de 17 años,
niñas, para ejercer de 1,30.
10
Número de temas
5
0
Figura 1.15
7 24
La distribución de las puntuaciones
7 79
de CI para 78 estudiantes de séptimo
8
grado, para el ejercicio 1.310.
8 69
9 01 33
9 6778
10 0022333344
10 555666777789
11 00001111222233344
11 55688999
12 003344
12 677888
13 02
13 6
Chapter 1 Exercises 31
Figura 1.16
La distribución mensual de por
80
ciento devuelve en acciones
comunes de EE.UU. desde enero de
1985 hasta septiembre de 2007,
Ejercicio 1.32.
60
Número de meses
40
20
(b) ¿Qué es el centro aproximado de esta distribución? (Por ahora, tome el centro
sea el valor con aproximadamente la mitad de los meses habiendo menores
retornos y mitad tener retornos más altos).
(c) Aproximadamente, ¿qué eran los más pequeños y mayores retornos mensuales,
dejando fuera los outliers? (Esta es una manera de describir la propagación de
la distribución).
(d) Un retorno inferior a cero significa que las existencias perdió valor en ese
mes. Acerca de qué porcentaje de todos los meses se vuelve menos de cero?
1.33 Nombre de esa variable. Una encuesta de una gran clase de la universidad a las
siguientes preguntas:
1. ¿Hembra o macho? (En los datos, macho , hembra = 0 = 1).
2. ¿Diestro o zurdo? (En los datos, a la derecha , a la izquierda = 0 = 1).
3. ¿Cuál es su altura en pulgadas?
4. ¿Cuántos minutos estudio sobre una típica noche?
La figura 1.17 muestra los histogramas de las respuestas del estudiante, en orden y
revueltos con las marcas de escala-. Histograma que va con cada variable? Explicar el
motivo- ing.
1.34 Los aceites de los alimentos y la salud. Los ácidos grasos, a pesar de su nombre
desagradables, son necesarias para la salud humana. Dos tipos de ácidos grasos,
llamados omega-3 y omega-6, no son producidos por nuestro cuerpo, por lo que deben
obtenerse de los alimentos. Aceites alimentos, ampliamente utilizados en el
procesamiento de alimentos y la cocina, son las principales fuentes de estos
compuestos. Existe cierta evidencia de que una dieta saludable debe tener más omega-
3 que omega-6. Tabla
1.4 ofrece la proporción de omega-3 y omega-6 en algunos aceites alimenticios
comunes.22 Los valores mayores de 1 indican que un aceite tiene más omega-3 que
omega-6.
(a) Realizar un histograma de estos datos, el uso de clases delimitada por los
números enteros de 0 a 6.
32 CHAPTER 1 • Picturing Distributions with Graphs
(b)
(d)
Figura 1.17
Los histogramas de cuatro distribuciones, para el ejercicio 1330.
Tabla 1.4 Los ácidos grasos Omega-3 como una fracción de los
ácidos grasos omega-6 en aceites de alimentos
El aceite RATIO El aceite RATIO
Cuadro 1.6 Las emisiones de dióxido de carbono (toneladas métricas por persona).
País CO2 País CO2 País CO2
1.38 ¿Las mujeres estudian más que los hombres? Preguntamos a los estudiantes
en una gran clase de primer año de la universidad cuántos minutos han estudiado
en una típica noche de la semana. Aquí están las respuestas de muestras aleatorias
de 30 mujeres y 30 hombres de la clase:
Las Hom
mujeres bres
180 120 180 360 240 90 120 30 90 200
120 180 120 240 170 90 45 30 120 75
150 120 180 180 150 150 120 60 240 300
200 150 180 150 180 240 60 120 60 30
120 60 120 180 180 30 230 120 95 150
90 240 180 115 120 0 200 120 120 180
(a) Examinar los datos. ¿Por qué no sorprende que la mayoría de las respuestas
son múltiplos de 10 minutos? Hemos eliminado un estudiante que reclamó al
estudio de 30.000 minutos por noche. Hay otras respuestas que consideres
sospechosa?
(b) Hacer un back-to-back stemplot para comparar las dos muestras. Es decir, utilice uno Espalda con espalda stemplot
Conjunto de tallos con dos conjuntos de hojas, uno a la derecha y otro a la
izquierda de los tallos. (Dibuje una línea a cada lado de los tallos para separar
los tallos y las hojas.) para ambos conjuntos de hojas en el tallo de menor a
mayor distancia del tallo. Informe los puntos medios aproximados de ambos
grupos. Parece que las mujeres estudian más que los hombres (o, al menos,
afirman que lo hacen)?
1.39 Rock lenguado en el Mar de Bering. Hacer una hora solar del rock datos de
contratación exclusiva en ejercicio 1.37. ¿Cuál es el momento de demostrar que
su trazado stemplot en ejercicio 1.37 no muestran? Cuando tenga los datos de
series de tiempo, una parcela de tiempo es a menudo necesaria para entender lo
que está sucediendo.
1.40 La marihuana y los accidentes de tráfico. En Nueva Zelandia los
investigadores entrevistaron a 907 conductores en los 21 años de edad. Se disponía
de datos sobre accidentes de tráfico y pidieron a los conductores sobre el uso de la
marihuana. Aquí hay datos sobre el número de accidentes causados por estos
controladores a la edad de 19 años, desglosados por el uso de la marihuana a la
misma edad:26
(a) Explicar cuidadosamente por qué un útil gráfico deben comparar las
tasas (accidentes por cada controlador) en lugar de los recuentos de los
accidentes en las cuatro clases de uso de marihuana.
(b) Hacer un gráfico que muestra la tasa de accidentes para cada clase. ¿Qué pro-
clude? (No se puede concluir que el uso de la marihuana causa accidentes,
porque los tomadores de riesgo son más propensas a conducir de forma
agresiva y a usar la marihuana).
1.41 Fechas en las monedas. Hacer un boceto de un histograma para una
distribución que está sesgada hacia la izquierda. Suponga que usted y sus amigos
vaciar tus bolsillos de monedas y registrada el año marcado en cada moneda. La
36 CHAPTER 1 • Picturing Distributions with Graphs
distribución de las fechas sería un sesgo a la izquierda. Explicar por qué.
Chapter 1 Exercises 37
1.42 El Nin˜ o y el monzón. La tierra está interconectada. Por ejemplo, parece que El
Nin˜ o, el calentamiento periódico de el Océano Pacífico al oeste de América
del Sur, afecta las lluvias del monzón, que son esenciales para la agricultura en
la India. Aquí están las lluvias del monzón (en milímetros) para el 23 de fuerte
El Nin˜ o años entre 1871 y 2004:27
628 669 740 651 710 736 717 698 653 604 781 784
790 811 830 858 858 896 806 790 792 957 872
(a) Para hacer una de estas stemplot las cantidades de lluvia, ronda los datos hasta el
próximo 10 de modo que los tallos son cientos de milímetros y hojas son decenas
de milímetros. Hacer dos stemplots, con y sin dividir los tallos. Parcela que
prefiere?
(b) Describir la forma, el centro y la propagación de la distribución.
(c) El promedio de las lluvias monzónicas para todos los años desde 1871 a 2004 es
de unos 850 mil- limeters. ¿Qué efecto tiene El Nin˜ o parecen tener sobre las
lluvias del monzón?
1.43 Ver esas escalas! La impresión de que una parcela de tiempo da depende de las
escalas que se utilizan en los dos ejes. Si se estira el eje vertical y comprima el eje de
tiempo, el cambio parece ser más rápido. Comprimir el eje vertical y el eje del tiempo
de estiramiento hacen cambiar aparecen más lento. Hacer dos parcelas más tiempo de
la matrícula universitaria datos en ejercicio 1.12 (página 24), que hace aparecer la
matrícula para aumentar muy rápidamente y uno que sólo muestra un ligero aumento.
La moraleja de este ejercicio es: preste mucha atención a las escalas cuando observas
una parcela de tiempo.
Figura 1.18
Parcela de tiempo el recuento
mensual de nuevas viviendas
160
Ene. Ene.
1990 1995
Hora