Beruflich Dokumente
Kultur Dokumente
Capítulo 1
ESTADÍSTICA DESCRIPTIVA.
Los administradores aplican algunas técnicas estadísticas a virtualmente todas las ramas
de las empresas públicas y privadas. Estas técnicas son tan diversas que los estadísticos,
por lo general, la dividen en dos grandes categorías: estadística descriptiva y estadística
inferencial.
La inferencia estadística comprende aquellas técnicas por medio de las cuales se toman
decisiones sobre un universo basados en una muestra. Debido a que esas decisiones se
toman en condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad.
Considerando que las características medidas en una muestra se denominan estadísticas
muestrales, las características medidas en un universo se llaman parámetros
poblaciones. El proceso de medir las características de todos los miembros de un
universo definido recibe el nombre de censo.
Población. Por otra parte, el universo viene definido por la investigación estadística a
realizarse. Y como la medición de la característica especificada por la investigación se
• Una variable discreta sólo puede tener valores observados en puntos aislados a lo
largo de una escala. Esta información suele presentarse a través del proceso de
conteo; de ahí que los valores se expresen generalmente como números enteros
(positivos). Como ejemplo de datos discretos se cita el número hijos, Número de
pacientes atendidos, Número de camas, El número de leucocitos (en miles) en la
sangre de los pacientes de un hospital, y el número de tubos de ensayos fabricados
que se han encontrado defectuosos.
• Variable cualitativa nominal: Son aquellas que surgen cuando se definen categorías
y se cuenta el número de observaciones pertenecientes a cada categoría y no lleva
ninguna ordenación en las posibles modalidades.
Por ejemplo, la variable cualitativa “color de las bebidas gaseosas” con las posibles
modalidades: Negro, Rojo, Naranja, es una variable cualitativa nominal.
Son ejemplos de variables cualitativas: “Sexo”, “Lugar de procedencia”,
“Nacionalidad”, entre otras.
• Variable cualitativa ordinal: Son aquellas que agrupan a los objetos, individuos, en
categorías ordenadas, para establecer relaciones comparativas.
Ejemplos:
- La variable “Nivel de pobreza” con sus modalidades: No pobre, pobre, muy pobre,
extremadamente pobre es una variable cualitativa ordinal.
- Grado de Instrucción: Primaria, secundaria, superior
b) Escala Ordinal. En esta escala, los números reflejan el orden o la jerarquía de los
individuos u objetos. Las medidas ordinales se disponen de la más alta a la más baja
o viceversa. Al emplear esta escala, las personas de un grupo pueden ordenarse
según rasgos físicos, características mentales, por su mayor o menor talla, etc. Pero
tales medidas no expresan cuánto más alto es un individuo respecto a otro.
La variable “orden de mérito” cuyas modalidades son 1º, 2º, 3º, etc. mide las
calificaciones de las unidades estadísticas en escala ordinal.
Ejemplos:
VARIABLE TIPO ESCALA MEDIDA ESTADISTICA
En algunas situaciones, no es posible obtener datos en forma directa, sino que, más
bien, la información debe obtenerse a partir de respuestas individuales. Una encuesta
estadística es el proceso de recopilar datos pidiendo a personas que proporcionen
información. Los datos pueden obtenerse con métodos como la entrevista personal o
telefónica, o través de un cuestionario escrito.
Si se tienen pocos datos, y estos son valores discretos, entonces conviene presentar una
distribución de frecuencias sin intervalos; pero si se tiene valores continuos o muchas
valores discretos, conviene presentar una distribución de frecuencia por intervalos.
Ejemplo 1.1. Supóngase que ante la pregunta del número de hijos por familia (variable
X) una muestra de 20 hogares, marcó las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Gráfico.
La representación gráfica más común para este tipo distribución de frecuencias es el
diagrama de barras que consiste en trazar en cada valor distinto de la variable,
segmentos de líneas proporcionales a su frecuencia.
6
Número de familias
0
0 1 2 3 4
Númer o de hijos
38 43 58 61 70 42 58 59 60 55 57 49 61 69 43 46 69 44 59 62
66 71 70 65 59 40 61 65 56 38 31 48 50 52 56 32 55 48 52 50
53 58 50 34 62 58 40 49 57 60
Solución.
1º. Debemos de determinar el rango ( R ) de variación de los datos que se define por:
R = Xmax - Xmin
2º. Tenemos que calcular ¿cuantas clases deben formarse? para eso se usa la fórmula de
Sturges:
K = 1 + 3.322 log n
donde:
K = número de clases
n = número de elementos en la muestra (tamaño de la muestra).
Está formula es muy útil porque orienta al principiante. Sin embargo, es un poco
conservador y tiende a dar un número de clases un poco menor del que se utiliza en la
practica.
3º. La idea es resumir los valores con el fin de percibir algunas características o
propiedades de los datos que no aparecen a simple vista. Para esto vamos a clasificar los
50 autobuses en 7 clases, de acuerdo con la formula de Sturges.
La amplitud de cada intervalo de clase que representamos con la letra c, se obtiene por
R
medio de la formula: c=
K
40
c= = 5.7142
7
Redondeamos a 6.
4º. Teniendo en cuenta que este recorrido es mayor que el recorrido original,
buscaremos el exceso:
Exceso = 42 - 40= 2 años
Debemos repartir este exceso a los dos extremos del recorrido original, mitad a cada
lado, en este caso 1 a cada extremo. Sumamos el número 1 al valor máximo: 71 + 1 =
72 y restamos el número 1 al valor mínimo: 31 - 1 = 30.
30 36 42 48 54 60 66
72
Figura 1.2
Sin embargo, una dificultad se presenta cuando algunos de los datos coinciden con
cualquiera de los puntos de división: 36, 42, 48, 54, 60 y 66.
Para aclarar está ambigüedad adoptamos, el intervalo abierto por la izquierda que no
incluye al valor 30 (límite inferior del intervalo) y cerrado por la derecha que incluye al
valor 36 (límite superior del intervalo). Este tipo de intervalo se representa
matemáticamente por: ( Yi−1 − Yi , donde Yi−1 representa el límite inferior del intervalo
y Yi representa el límite superior.
Así, en nuestro ejemplo el primer intervalo lo escribiremos como ( 30 − 36.
Nota.- También existen otros dos tipos de intervalos de clases, definidas como:
[ Yi−1 − Yi ) Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda (incluye
al límite inferior del intervalo) y abierto por la derecha (no incluye al límite superior del
intervalo).
Yi−1 − Y Intervalo cerrado. Este intervalo incluye a ambos límites del intervalo.
6º. Es conveniente que todos y cada uno de los datos que se hallen dentro de un mismo
intervalo, estén representados por un mismo valor. Este valor caracteriza a la clase y por
eso se llama marca de clase, se obtiene promediando los límites de cada intervalo. Una
formula para calcular la marca de clase de un intervalo es:
Yi−1 + Yi
Yi =
2
7º. A continuación debemos realizar la clasificación y conteo de los datos (ver tabla
1.2), es decir, colocar cada uno de ellos dentro de su clase, todos representados por un
mismo signo: una tarja.
Tabla 1.2.
Intervalo de Marca de clase Conteo Frecuencia
clase Yi ni
Total
Propiedad.- N i = N i −1 + n i , de donde n i = N1 − N i −1
k
Propiedad.- h 1 + h 2 + ····+ h k = h i = 1
i =1
N
n j i nj i
n = h j
j=1
Hi = i = =
n n j=1 j=1
Propiedad.- H i = H i −1 + h i
Interpretación.-
n2 =
N4 =
h3 =
H5 =
N6 - N2 =
a) Histograma.
Es una representación gráfica de una distribución de frecuencias agrupadas en
intervalos de clase, mediante una serie de rectángulos contiguos que tienen:
- sus bases sobre un eje horizontal y cuya longitud será igual al tamaño de los
intervalos de clase.
- Las alturas proporcionales a la frecuencia (absoluta o relativa).
15
10
0
30 36 42 48 54 60 66 72
Edad (en años)
Figura 1.3. Histograma de la distribución de las edades de los pacientes con cáncer pulmonar
de la tabla 1.3.
b) Polígono de frecuencias.
Cuando la variable está agrupada en intervalo de clase, el polígono de frecuencia se
obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el
histograma.
15
Número de pacientes
12
0
27 33 39 45 51 57 63 69 75
Edad (en años)
Figura 1.4. Polígono de frecuencias de las edades de los pacientes con cáncer pulmonar de la tabla 1.3.
50
Número de pacientes
40
30
20
10
0
30 36 42 48 54 60 66 72
Edad (en años)
Ejemplo 1.5. En una encuesta de opinión acerca de las preferencias de una marca de
bebidas gaseosas por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores
dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.
Solución.
La tabulación de estos datos, donde la variable cualitativa es X: Color de bebida
gaseosa, es la distribución de frecuencias de la tabla 1.4.
Tabla 1.4. Distribución de personas por su color preferido de una marca de bebida
gaseosa.
Color de Número de Frecuencias Frecuencias
Bebida Consumidores: relativas: hi Porcentajes:
ni hi(%)
Blanco (B) 8 0.40 40
Negro (N) 9 0.45 45
Rojo (R) 3 0.15 15
Total 20 1.00 100
Gráficos.
Los gráficos más comunes para la distribución de frecuencias de variable cualitativa son
el de diagrama de rectángulos y el de sectores circulares.
10
8
Número de personas
6
0
Blanco Negro Rojo
Colores de las bebidas gaseosas
En un gráfico circular, los datos de cada categoría se representan por un sector circular.
Es utilizado principalmente cuando se pretende comparar cada valor de la variable con
el total. Para construir se divide el circulo en sectores, cuyas áreas serán proporcionales
a los valores de la variable. Está división es obtenida a través de la regla de 3 simples.
Total → 360o
Parte → xo
Rojo
15%
Blanco
40%
Negro
45%
Tabla 1.6. Pacientes con cáncer pulmonar según lugar de residencia y por sexo.
Hospital Regional de Trujillo. 2003
A B C D
Femenino 4 3 2 1 10
Masculino 7 3 5 5 20
Total 11 6 7 6 30
8
Número de pacientes.
7
7
6
5
5 5
4
4
3
3 3
2
2
1
1
0
A B C D
Ciudad de procedencia
Femenino Masculino