Sie sind auf Seite 1von 18

Ejercicios de estadística descriptiva

Luis Arturo García Navarro

 Economía
 06.08.2009
 4 minutos de lectura

economía matemáticaestadística

A continuación encontrarán un un trabajo del área de estadística para ayuda a los


procesos de producción.

I.- Objetivo

Aplicar las técnicas estadísticas para el manejo de datos que nos permitan obtener
gráficos, medidas de tendencia y calcular probabilidades.

II.- Antecedentes

1. Estadística: es la rama de la matemática que nos permite recoger, organizar y


analizar datos. Existen dos conceptos importantes dentro de la estadística que
nos permiten analizar y estudiar dichos datos, estos son: población y muestra.
2. Población: es el conjunto de datos que caracteriza el fenómeno que se desea
estudiar.
3. Muestra: es un subconjunto de la población a estudiar, el cual es necesario que
sea representativo de toda la población.
4. Gráfica: es una representación de la relación entre variables, muchos tipos de
gráficos aparecen en estadística, según la naturaleza de los datos involucrados y
el propósito de la gráfica, es la de representar los valores tabulados obtenidos de
los muestreos o los datos del total de la población.
5. Distribución de frecuencia: Al resumir grandes colecciones de datos, es útil
distribuirlos en clases o categorías, y determinar el número de individuos que
pertenecen a cada clase llamado frecuencia de clase. Una disposición tabular de
los datos por clases junto con las frecuencias correspondientes de clase se llama
distribuidores de frecuencia o tablas de frecuencia.
6. Medidas de dispersión: Describen la cantidad de dispersión o variabilidad que se
encuentra entre los datos. Datos bastante agrupados poseen valores
relativamente pequeños, y datos más dispersos tienen valores más grandes. El
agrupamiento más extenso ocurre cuando los datos carecen de dispersión.

III.- Material Utilizado

1. Lápiz
2. Cuaderno de apuntes

IV.- Herramienta, Equipo

1. Calculadora
2. Computadora

V.- Desarrollo

Efectuar los siguientes ejercicios:

1. Los datos que se muestran a continuación representan el costo de la energía eléctrica


durante el mes de julio del 2006 para una muestra aleatoria de 50 departamentos con
dos recamaras en una ciudad grande.

Costo de energía eléctrica en dólares.

96 171 202 178 147 102 153 197 127 82


157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 206 175 130 143 187 166 139 149
108 119 150 154 114 135 191 137 129 158

a) Determine una tabla de frecuencias, para K = 7

Limites de clase
K F Xi Fi Hi Hi
Ls li
1 81 100 4 90.5 4 0.08 0.08
2 101 120 8 110.5 12 0.32 0.32
3 121 140 12 130.5 24 0.8 0.8
4 141 160 8 150.5 32 1.44 1.44
5 161 180 10 170.5 42 2.28 2.28
6 181 200 4 190.5 46 3.2 3.2
7 201 220 4 210.5 50 4.2 4.2
Σf = 50

b) Elabore un histograma de frecuencias y polígono de frecuencias con los datos.


c) Alrededor de qué cantidad parece concentrarse el costo mensual de energía eléctrica.

R = alrededor de 148 (valor de la media)

2. Se identificó una muestra de estudiantes que poseía automóviles producidos por la


General Motors y se registró la marca de cada automóvil. A continuación se presenta la
muestra que se obtuvo (Ch = Chevrolet, P = Pontiac, O = Oldsmobile, B = Buick, Ca =
Cadillac):

Ch B Ch P Ch O B Ch Ca Ch
B Ca P O P P Ch P O O
Ch B Ch B Ch P O Ca P Ch
O Ch Ch B P Ch Ca O Ch B
B O Ch Ch O Ch Ch B Ch B

a) Encuentre el número de automóviles de cada marca que hay en la muestra.


n = 50

Marca del automovil Frecuencia


Ch 19
P 8
O 9
B 10
Ca 4
Total = 50

b) ¿Qué porcentaje de estos automóviles son Chevrolet, Pontiac, Oldsmobile,


Buick, Cadillac?

Marca del automovil Frecuencia Porcentaje (%)


Ch 19 38
P 8 16
O 9 18
B 10 20
Ca 4 8
Total = 50 Total = 100

c) Trace una gráfica de barras que muestre los porcentajes encontrados en el inciso b).

3. Un policía de una ciudad, usando radar, verificó la velocidad de los automóviles que
circulaban por una calle de la ciudad:

272322384324
252322523130
292827252928
2633252725
2123241823

Elabore una gráfica de puntos para estos datos.


4. Los siguientes son los números de torsiones que se requirieron para cortar 12 barras
de aleación forjada: 33, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 27. Determine:

a) La media

x̄ = Σx/n = 410/12

x̄ = 34.17

b) La mediana

x̃ = 33.50

c) El rango promedio

Rango promedio = (Vmenor + Vmayor)/2

Rango promedio = 38.50

5. Por un error, un profesor borró la calificación obtenida por uno de diez alumnos. Si
los otros nueve estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92 y la media de
las diez calificaciones es 67, ¿Qué calificación borró el profesor?

Σx (de 9 datos) = 605

x̄ de 10 datos = 67

x̄ = Σx/n; Σx (de 10 datos) = (x̄)(n) = 67 x 10 = 670

Calificación = x = 670 – 605 = 65

Calificación = 65

6. En los siguientes ejercicios, calcule el rango, el rango promedio, la varianza y la


desviación estándar para los datos que se dan.

a) Los valores que se dan son pesos (en onzas) de carnes listadas en el menú de un
restaurante como cortes “Porterhouse de 20 onzas” (basados en datos recolectados por
un estudiante del autor).

17202118202020181919
20192120182020191819

n = 20

Σx = 386

Rango = Valor mayor – Valor menor = 21 – 17

Rango = 4
Rango promedio = (Valor menor + Valor mayor)/2 = (17 + 21)/2

Rango promedio = 19

s2 = 1.168

s = 1.081

b) Dígitos seleccionados en la lotería Maryland Pick Three:

073627666381787
168695215039907

n = 30

Σx = 148

Rango = Valor mayor – Valor menor = 9 – 0

Rango = 9

Rango promedio = (Valor menor + Valor mayor)/2 = (0 + 9)/2

Rango promedio = 4.5

s2 = 8.754

s = 2.959

c) Concentraciones de alcohol en la sangre de 15 conductores implicados en accidentes


mortales y luego condenados a prisión (basados en datos del departamento de Justicia
de Estados Unidos).

0.27 0.17 0.17 0.16 0.13 0.24 0.29 0.24


0.14 0.16 0.12 0.16 0.21 0.17 0.18

n = 15

Σx = 2.81

Rango = Valor mayor – Valor menor = 0.29 – 0.12

Rango = 0.17

Rango promedio = (Valor menor + Valor mayor)/2 = (0.12 + 0.29)/2

Rango promedio = 0.205

s2 = 0.00262
s = 0.0512

7. La concentración de sólidos suspendidos en agua de un río es una característica


ambiental importante. Un artículo científico reportó sobre la concentración (en partes
por millón, o ppm) para varios ríos diferentes. Supongamos que se obtuvieron las
siguientes 50 observaciones para un río en particular:

55.860.937.091.365.8
42.333.860.676.069.0
45.939.135.556.044.6
71.761.261.547.274.5
83.240.031.736.762.3
47.394.656.330.068.2
75.371.465.252.658.2
48.061.878.839.865.0
60.777.159.149.569.3
69.864.927.187.166.3

a) Calcule la media

n = 50

Σx = 2927

x̄ = Σx/n = 2927/50

x̄ = 58.54

b) Calcule la media recortada al 25% y la media recortada al 10%

Media recortada al 25%

50 x 0.25 = 12.5 = 13

n = 50 – (13 valores mínimos + 13 valores máximos) = 50 – 26 = 24

Σx (de 24 datos) = 1423

x̄ = Σx/n = 1423/24

x̄ = 59.31

Media recortada al 10%

50 x 0.10 = 5

n = 50 – (5 + 5) = 50 – 10 = 40

Σx (de 40 datos) = 2333.90


x̄ = Σx/n = 2333.90/40

x̄ = 58.35

c) Calcule la varianza y la desviación estándar

s2 = 270.85

s = 16.46

8. Use los datos del ejercicio 7 (50 observaciones de un río) y calcule lo siguiente:

a) Q1, Q2 y Q3

Para Q1

np = 50 x ¼ = 12.5 = 13

Q1= (45.9 + 47.2)/2 = 46.55

Q1= 46.55

Para Q2

np = 50 x 1/2 = 25

Q2 = (60.7 + 60.9)/2 = 60.8

Q2 = 60.8

Para Q3

np = 50 x 3/4 = 37.5 = 38

Q3 = (69.3 + 69.8)/2 = 69.55

Q3 = 69.55

b) Realice un diagrama de caja con estos datos


c) Calcule P15, P20, P25

P15 = (k/100)n = (15/100) x 50 = 7.5 = 8

P15 = 39.1

P20 = (k/100)n = (20/100) x 50 = 10

P20 = 40

P25 = (k/100)n = (25/100) x 50 = 12.5 = 13

P25 = 45.9

9. Use los datos del ejercicio 1 (costos de energía eléctrica para una muestra de 50
departamentos) y calcule lo siguiente:

a) Q1, Q2 y Q3

Para Q1

np = 50 x ¼ = 12.5 = 13

Q1= (127 + 128)/2 = 127.5

Q1= 127.5

Para Q2

np = 50 x 1/2 = 25

Q2 = (148 + 149)/2 = 148.5

Q2 = 148.5
Para Q3

np = 50 x 3/4 = 37.5 = 38

Q3 = (171 + 172)/2 = 171.5

Q3 = 171.5

b) Calcule el percentil correspondiente a: 191, 70 y 175

Percentil de 191 = 44/50 = 0.88

Percentil de 191 = 0.88

Percentil de 70 = No existe

Percentil de 175 = 39/50 = 0.78

Percentil de 175 = 0.78

c) Realice un diagrama de caja

10. Los siguientes son los números de los minutos durante los cuales una persona debió
esperar el autobús hacia su trabajo en 15 días laborales: 10, 1, 13, 9, 5, 2, 10, 3, 8, 6, 17,
2, 10 y 15. Determine:

a) La media

x̄ = Σx/n = 111/14
x̄ = 7.93

b) La mediana

x̃ = 8.50

c) Trace un diagrama de caja.

Para Q1

np = 14 x ¼ = 3.5 = 4

Q1= (3 + 5)/2 = 4

Q1= 4

Para Q2

np = 14 x 1/2 = 7

Q2 = (8 + 9)/2 = 8.5

Q2 = 8.5

Para Q3

np = 14 x 3/4 = 10.5 = 11

Q3 = (10 + 13)/2 = 11.5

Q3 = 11.5

VI.- Anexos (Diagramas, dibujos, formulas, ayuda visual, etc.)


VII.- Registro de datos, parámetros, cuestionarios y observaciones

VIII.- Conclusiones y reporte de resultados

IX.- Bibliografía utilizada

Estadística elemental.

Mario f. Triola.

Pearson educación.

Probabilidad y estadística para ingenieros de Miller y Freund

Richard A Johnson.

Prentice Hall.

Conceptos de Estadística

Se llama estadística al conjunto de procedimientos destinados a recopilar, procesar y


analizar la información que se obtiene con una muestra para inferir las características o
parámetros de una población o de un problema determinado.

En la practica, el investigador se encuentra con muchas limitaciones reales para conocer


con detalle un problema o situación que le preocupa, por lo que debe deducir las
características principales utilizando los procedimientos estadísticos.

La muestra es una parte, generalmente pequeña, que se toma del conjunto total para
analizarla y hacer estudios que le permitan al investigador inferir o estimar las
características de un problema.

La persona interesada en resolver un problema no tiene siempre a la mano toda la


información, por lo que debe conformarse con pequeños detalles, carentes de precisión,
que le ayuden a tomar decisiones bajo riesgo.

A un paciente que debe ser operado quirúrgicamente se le analiza su sangre tomando


una muestra pequeña para conocer el grado de coagulación. No es necesario extraerle
toda la sangre.

El industrial que desea saber si en alambre que produce tiene la resistencia necesaria a
la tensión deseada, toma solamente una muestra de su producción, debido a que el
alambre que se destruye con la prueba y de otra manera tendría que destruir toda la
existencia.

Generalmente, los resultados obtenidos en una muestra son satisfactorios y permiten al


investigador tener un conocimiento aceptable del problema.

La información o características que se encuentran en la muestra se llaman estimadores


y sirven para deducir cómo son las características llamadas parámetros de la población.

Al investigador le puede interesar conocer de la población, entre otras cosas, lo


siguiente:

 El valor medio.
 El grado de dispersión de los valores incluidos.
 La proporción de una característica.
 Si hay una causa que origina la variación.
 El grado de influencia en las variables.
 Si las variaciones son aleatorias.
 La probabilidad de ocurrencia de un valor.
 Un valor fututo o un valor anterior.
 La diferencia entre dos o más poblaciones.

Poblaciones

En estadística, población es el conjunto de cosas, personas, animales o situaciones que


tiene una o varias características o atributos comunes, por ejemplo: los habitantes de El
Salvador en el presente año, las personas menores de edad en el año 2001; los
estudiantes de la Universidad, las reacciones de un nuevo medicamento, las diferencias
entre los tratamientos de diferentes formulaciones de insecticidas, entre otras.

Población Finita: es el conjunto compuesto por una cantidad limitada de elementos,


como el número de especies, el numero de estudiantes, el número de obreros.

Población Infinita: es la que tiene un número extremadamente grande de componentes,


como el conjunto de especies que tiene el reino animal.

Población Real: es todo el grupo de elementos concretos, como las personas que en
Europa se dedican a actividades artísticas.

Población Hipotética: es el conjunto de situaciones posibles imaginables en que puede


presentarse un suceso, como por ejemplo las formas de reaccionar de una persona ante
una catástrofe.
Población estable: es aquella en que sus calores o cualidades no presentan variaciones,
o éstas, por pequeñas que sean, son despreciables, como la rotación de la tierra o la
velocidad de la luz.

Población inestable: es la que contienen los valores en constante cambio.


Prácticamente la totalidad de las poblaciones corresponden a este tipo. El cambio de los
valores se presentan en el tiempo o en el espacio.

Población aleatoria: es la que presenta cambios en sus calores debidos al azar, sin que
exista una causa aparente, como las variaciones en el contenido del producto.

Población dependiente: es la que cambia sus valores debido a una causa determinada y
medida. La dependencia puede ser total, como las variaciones obtenidas en una función
matemática, la regresión lineal, por ejemplo. La dependencia es parcial cuando la causa
influye en la variable dependiente en una proporción menor a la total, por ejemplo, el
incremento en las ventas proveniente de una mayor gasto publicitario. Esta última
influencia no es proporcional.

Población binomial es aquella en la que se busca la presencia o ausencia de una


característica, por ejemplo, la presencia de ozono en el aire.

Población polinomial: es la que tiene varias características que deben ser definidas,
medidas o estimadas, como la obediencia, la inteligencia y la edad de los alumnos de
postgrado.

Tipos de variables

La variable es una medida en un experimento, representada por una (x) o por una (y)
que puede tomar un valor de un conjunto de valores.

Como ejemplos de variables se pueden mencionar: la agresividad, la memoria, la


formación de grupos sociales, la oferta y la demanda, la calidad de los productos, el
nivel del mar, la duración de los objetos, la inteligencia, la velocidad del viento, el
grado de contaminación, el clima, el nivel de ingresos, el números de accidentes, la
observación en un tratamiento, entre otros.

Variable aleatoria: es la que toma al azar los probables resultados de un experimento.

Variable dependiente: es la que toma los valores correspondientes de un modelo


matemático o que los toma debido a la influencia de otra variable independiente.

Variable continua: es la que puede tomar cualquier valor decimal, del intervalo de una
recta, como consecuencia de una medición.
Variable discreta: es la que puede tomar, por conteo, cualquier valor.

Variable cuantitativa: es la que se expresa en cantidades, por ejemplo: 18.9, 3, 75.4,


98891, etc.

Variable cualitativa: es la que se manifiesta en atributos, como pueden ser, bueno,


malo, peor, regular, aceptable, defectuoso, feo, bonito, etc.

Medición de variables

La medición de las variables puede hacerse por: clasificación, ordenación, intervalo y


proporción.

a) Clasificación. Los objetos, personas o asuntos se distribuyen por clases, rotulando


cada clase con un nombre o número distintivo que indica las características de dicha
clase.

Como ejemplo de esta medición se pueden mencionar los hoteles que se clasifican en
establecimientos de una, dos, tres, cuatro y cinco estrellas de acuerdo a los servicios que
proporcionan al público.

Los artículos almacenados pueden clasificarse en materias primas, materiales,


accesorios, lubricantes, artículos de aseo, productos terminados, etcétera.

Según el estado civil, las personas se clasifican en solteros, casados, separados, unión
libre, viudos, dejados, entre otros.

Los objetos o personas que están asignadas en una clase determinada se pueden contar.
El total de cada clase representa la Frecuencia de clase.

La frecuencia dividida entre el total de los objetos o personas clasificados constituye la


frecuencia relativa o proporción de elementos existentes en la clase.

Ejercicio 1.- Clasificar los siguientes sabores de comida:

Salado Dulce Acido Amargo Dulce Acido Amargo Salado Dulce Dulce
Acido Dulce Salado Amargo Amargo Salado Dulce Dulce Acido Salado
Salado Salado Acido Salado Dulce Acido Amargo Acido Salado Dulce
1.- Se cuentan los elementos que forman el conjunto de datos: El total da 30

2.- Se identifica cada uno de los elementos, para el caso de este ejemplo se utilizará un
color para cada sabor de comida.

Salado Dulce Acido Amargo Dulce Acido Amargo Salado Dulce Dulce
Acido Dulce Salado Amargo Amargo Salado Dulce Dulce Acido Salado
Salado Salado Acido Salado Dulce Acido Amargo Acido Salado Dulce

3.- Se va a formar una tabla con cada uno de los sabores, cada sabor se coloca en un
renglón diferente, por ejemplo:

Salado
Dulce
Acido
Amargo

4.- Se agregan dos columnas a la derecha de los sabores y un renglón en la parte


superior:

Salado
Dulce
Acido
Amargo

5.- En el primer renglón coloque Frecuencia de clase y Frecuencia relativa como se


muestra a continuación:

Frecuencia de clase Frecuencia relativa


Salado
Dulce
Acido
Amargo

6.- Para llenar la columna de Frecuencia de clase cuente en la primera tabla las veces
que aparece la palabra Salado y escriba el resultado. Se debe repetir este proceso para
las palabras Dulce, Acido y Amargo.

Frecuencia de clase Frecuencia relativa


Salado 9
Dulce 9
Acido 7
Amargo 5

7.- Para llenar la columna de Frecuencia relativa repita el número obtenido en la


Frecuencia de clase y divídalo entre el número de elementos como se muestra en la
tabla siguiente:

Frecuencia de clase Frecuencia relativa


Salado 9 9 / 30
Dulce 9 9 / 30
Acido 7 7 / 30
Amargo 5 5 / 30

b) Ordenación. Se colocan los valores de menor a mayor o de mayor a menor


formando una sucesión. En esta serie no existen equidistancias ni proporciones,
solamente indican orden de valor, de importancia o de jerarquía, desde el primer valor
hasta el último.

Ejemplo 2.- Ordenar las estaturas tomadas de 10 alumnos en metros

1.67 1.87 1.65 1.56 1.94 1.47 1.54 1.43 1.79 1.74
Los datos ordenados de menor a mayor son las siguientes:

1.43 1.47 1.54 1.56 1.65 1.67 1.74 1.79 1.87 1.94

c) Intervalos. Se usa para indicar distancias relativas entre dos puntos. Por ejemplo: La
escala de grados Centígrados.

d) Proporción. A esta medición se le llama de razón por establecer proporciones a


partir del cero absoluto. Por ejemplo el sistema decimal.

Programa de Estadística del ISEI, CP


Página Web elaborada por M. en C. José Luis García Cué agosto 1999, revisada en Mayo del 2002

Das könnte Ihnen auch gefallen