Capitulo I-Estadistica-I

Cap. 1. Estadística descriptiva.
Capítulo 1
ESTADÍSTICA DESCRIPTIVA.
1.1 Definición de la Estadística.
Definimos la estadística, como la ciencia que nos proporciona un conjunto de métodos,

técnicas o procedimientos mediante las cuales se recopilan, organizan (clasifican,
agrupan), representan y analizan datos. A partir de este análisis se extraen conclusiones
que sirven de base para tomar decisiones.
1.2 Estadística descriptiva y estadística inferencial.
Los administradores aplican algunas técnicas estadísticas a virtualmente todas las ramas
de las empresas públicas y privadas. Estas técnicas son tan diversas que los estadísticos,
por lo general, la dividen en dos grandes categorías: estadística descriptiva y estadística
inferencial.
La estadística descriptiva incluye las técnicas que se relacionan con el resumen y la

descripción de datos numéricos. Estos métodos pueden ser tablas (o gráficos) o pueden
incluir análisis mediante cálculos de determinadas medidas estadísticas, como: medidas
de posición, medidas de variabilidad e índices.
La inferencia estadística comprende aquellas técnicas por medio de las cuales se toman
decisiones sobre un universo basados en una muestra. Debido a que esas decisiones se
toman en condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad.
Considerando que las características medidas en una muestra se denominan estadísticas
muestrales, las características medidas en un universo se llaman parámetros
poblaciones. El proceso de medir las características de todos los miembros de un
universo definido recibe el nombre de censo.
1.3.- Población y muestra.
Universo. Se denomina universo, a un conjunto de elementos (que consiste de personas,

objetos, etc.) que contienen una o más características observables de naturaleza
cualitativa o cuantitativa que se pueden medir en ellos.
Unidad de análisis. Llamada también elemento de la población; es la unidad de cual se
obtiene el dato estadístico; y es el objeto de estudio.
Por ejemplo, los estudiantes del primer ciclo de la Universidad Nacional de Piura,
Semestre II-2004, constituyen un Universo en la que cada estudiante (unidad de
análisis), tiene muchas características a ser observadas, como, por ejemplo: Estatura,
peso, frecuencia cardiaca, número de leucocitos en la sangre, etc. (característica cuantitativa)
o sexo, lugar de procedencia, especialidad que estudia, etc. (característica cualitativa).
El resultado de medir una característica observable de una unidad de análisis, se

denomina dato estadístico o valor observado o simplemente observación.
Población. Por otra parte, el universo viene definido por la investigación estadística a
realizarse. Y como la medición de la característica especificada por la investigación se
Dr. César Haro Díaz

Cap. 1. Estadística descriptiva. 2
hace a cada unidad de análisis, se puede considerar a la población como la totalidad de

valores posibles de una característica particular especificada por la investigación
estadística.
Parámetro. Se denomina parámetro a una medida descriptiva que resume una

característica de la población, tal como la media (  ) o la varianza (2), calculada a
partir de los datos observados de toda la población.
Muestra. Es una parte extraída de la población, con el fin de obtener información

acerca de la población de la cual proviene. La muestra debe ser seleccionada de manera
que sea representativa de la población.
Estadística o estadígrafo: Es una medida descriptiva que resume una característica de

la muestra, tal como la media ( X ) o la varianza (S2) calculada a partir de los datos
observados de una muestra aleatoria.
1.4. Variables estadísticas.

Una variable estadística es una característica que poseen las unidades de análisis
(elementos u objetos) y que puede tomar diferentes valores. Las variables estadísticas
generalmente se denotan con las letras X, Y, Z, etc.
Las variables se clasifican en: cuantitativas y cualitativas:
a) Variable Cuantitativa.- Son aquellas variables que se obtienen como resultado de
mediciones y conteos. Son variables cuantitativas: Edad de un paciente, peso de las
personas, temperatura, el salario mensual, el número de personas por hogar, estancia
hospitalaria (en días), etc. Las variables cuantitativas puede ser discreta y continua.
• Una variable discreta sólo puede tener valores observados en puntos aislados a lo
largo de una escala. Esta información suele presentarse a través del proceso de
conteo; de ahí que los valores se expresen generalmente como números enteros
(positivos). Como ejemplo de datos discretos se cita el número hijos, Número de
pacientes atendidos, Número de camas, El número de leucocitos (en miles) en la
sangre de los pacientes de un hospital, y el número de tubos de ensayos fabricados
que se han encontrado defectuosos.
• Una variable continua puede tomar cualquier valor dentro de un intervalo

especificado. Los datos continuos se generan por el proceso de medición.
Ejemplo de datos continuos son el salario, la edad de las mujeres que utilizan
anticonceptivos, la presión sanguínea, el nivel de ácido úrico en el suero de suero
de un varón sano y el tiempo de duración de la intervención quirúrgica.
b) Variable Cualitativa.- Son variables cuyos valores consisten en categorías de

clasificación, o sea se refiere a la cualidad que presenta la población, que no lleva
clasificación numérica. Por ejemplo, la variable "estado civil" puede adoptar las
modalidades: soltero, casado, divorciado, viudo, etc. También son ejemplos de
variables cualitativas, "color de ojos" con las posibles modalidades: Negro, marrón,
azul, verde, etc.
La variable cualitativa puede ser: nominal u ordinal.

• Variable cualitativa nominal: Son aquellas que surgen cuando se definen categorías
y se cuenta el número de observaciones pertenecientes a cada categoría y no lleva
ninguna ordenación en las posibles modalidades.
Por ejemplo, la variable cualitativa “color de las bebidas gaseosas” con las posibles
modalidades: Negro, Rojo, Naranja, es una variable cualitativa nominal.
Son ejemplos de variables cualitativas: “Sexo”, “Lugar de procedencia”,
“Nacionalidad”, entre otras.
• Variable cualitativa ordinal: Son aquellas que agrupan a los objetos, individuos, en
categorías ordenadas, para establecer relaciones comparativas.
Ejemplos:
- La variable “Nivel de pobreza” con sus modalidades: No pobre, pobre, muy pobre,
extremadamente pobre es una variable cualitativa ordinal.
- Grado de Instrucción: Primaria, secundaria, superior
1.4.1. Escalas de medición.

Las variables no solo se clasifican, sino también es necesario medirlas. La medición se
hace con el fin de diferenciar por comparación, un elemento de otro, en las
características de la variable. Este se hace a través de niveles o escalas, entre las cuales
tenemos:
a) Escala nominal. Se utilizan como medida de identidad. Los números sirven como
etiquetas para identificar o clasificar personas, objetos o clases. En esta escala las
categorías solo se nombran o se enumeran, pero no se comparan.
Ejemplos:
- Los números que los jugadores llevan en la espalda,
- Los números de las historias clínicas” entre otras.
- Una muestra de pacientes clasificados por sexo, lugar de procedencia, estado civil.
b) Escala Ordinal. En esta escala, los números reflejan el orden o la jerarquía de los
individuos u objetos. Las medidas ordinales se disponen de la más alta a la más baja
o viceversa. Al emplear esta escala, las personas de un grupo pueden ordenarse
según rasgos físicos, características mentales, por su mayor o menor talla, etc. Pero
tales medidas no expresan cuánto más alto es un individuo respecto a otro.
La variable “orden de mérito” cuyas modalidades son 1º, 2º, 3º, etc. mide las
calificaciones de las unidades estadísticas en escala ordinal.
c) Escala de Intervalo. Es el tercer nivel de medición, entre cuyos diversos

valores que toma la variable existen a la vez, clasificación, orden y grados de distancias
iguales entre las diferentes categorías, es decir, los intervalos son considerados como
equivalentes y con un origen convencional (la unidad de medida no necesariamente
empieza de cero; sólo sirve como punto o valor de comparación).
Por ejemplo, sea la variable X: Coeficiente de Inteligencia
d) Escala de Razón o Proporción: Es el nivel más alto de medición y donde la

variable supone o comprende a la vez todos los casos anteriores: clasificación, orden,
distancia y origen único natural.
Los posibles valores se representan con números que varían en forma continua, por
ejemplo La concentración de hemoglobina en mg/100 ml.; La edad en años de un
paciente, etc. Esta escala tiene las mismas características de la escala de intervalo más
un hecho adicional: la existencia de un cero verdadero.

A esta escala se aplica todas las operaciones matemáticas y estadísticas usuales.
Ejemplos:
VARIABLE TIPO ESCALA MEDIDA ESTADISTICA
Edad del paciente Cuantitativa Razón μ (promedio)

Estancia hospitalaria Cuantitativa Razón μ (promedio)
Estado civil Cualitativa Nominal P (proporción)
Nivel de Instrucción Cualitativa Ordinal P (proporción)
Nivel de desnutrición. Cualitativa Ordinal P (proporción)
1.5. Obtención de datos a través experimentos y encuestas.
Una manera de obtener datos es a través de la observación directa. Un experimento

estadístico es una forma de observación directa en la que se controlan algunos o todos
los factores que pueden influir sobre la variable que se estudia.
En algunas situaciones, no es posible obtener datos en forma directa, sino que, más
bien, la información debe obtenerse a partir de respuestas individuales. Una encuesta
estadística es el proceso de recopilar datos pidiendo a personas que proporcionen
información. Los datos pueden obtenerse con métodos como la entrevista personal o
telefónica, o través de un cuestionario escrito.
1.6. Presentación de los datos.
Después de obtener un conjunto de datos, es necesario presentarlos en forma tal, que

facilite su compresión y su posterior análisis y utilización. No servirá de nada que estas
medidas se presenten en un simple listado. Lo mejor será ordenarlos en tablas o cuadros
y luego representarlo en gráficos.
Si se tienen pocos datos, y estos son valores discretos, entonces conviene presentar una
distribución de frecuencias sin intervalos; pero si se tiene valores continuos o muchas
valores discretos, conviene presentar una distribución de frecuencia por intervalos.
1.6.1. Distribución de frecuencias sin intervalos:
Ejemplo 1.1. Supóngase que ante la pregunta del número de hijos por familia (variable
X) una muestra de 20 hogares, marcó las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2,

3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribución de frecuencias de
X se da en el tabla 1.1.

Tabla 1.1.- Distribución de frecuencias del número de hijos por familia.

Número de Frecuencias Frecuencias Frecuencias
hijos Absolutas Relativas Porcentajes
Xi ni hi hi (%)
0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100
Fuente.- Datos obtenidos de los formularios de la encuesta.
Gráfico.
La representación gráfica más común para este tipo distribución de frecuencias es el
diagrama de barras que consiste en trazar en cada valor distinto de la variable,
segmentos de líneas proporcionales a su frecuencia.
Número de hijos por familia

8
6
Número de familias
0
0 1 2 3 4
Númer o de hijos
Figura 1.1. Diagrama de barras para los datos de la tabla 1.1.
1.6.2. Distribución de frecuencias por intervalos.
La distribución de frecuencia por intervalos o clases se usa cuando la variable

estadística es continúa o cuando el número de valores distintos de una variable discreta
es grande.
Elaboración de las tablas de frecuencias.
Ejemplo 1.2. Para esclarecer la construcción de la tabla de frecuencias para datos

agrupados en intervalos de clase, desarrollaremos un ejemplo, tomando como datos las

observaciones de las edades de 50 personas con cáncer pulmonar hospitalizadas en el

hospital regional de Trujillo, en 2003.
38 43 58 61 70 42 58 59 60 55 57 49 61 69 43 46 69 44 59 62
66 71 70 65 59 40 61 65 56 38 31 48 50 52 56 32 55 48 52 50
53 58 50 34 62 58 40 49 57 60
Se pide representar los datos en una tabla de frecuencias.
Solución.
1º. Debemos de determinar el rango ( R ) de variación de los datos que se define por:
R = Xmax - Xmin
En nuestro ejemplo, tenemos:

Valor mínimo Xmin = 31
Valor máximo Xmáx = 71
Luego el rango es R= 71 - 31= 40 años
2º. Tenemos que calcular ¿cuantas clases deben formarse? para eso se usa la fórmula de
Sturges:
K = 1 + 3.322 log n
donde:
K = número de clases
n = número de elementos en la muestra (tamaño de la muestra).
Está formula es muy útil porque orienta al principiante. Sin embargo, es un poco
conservador y tiende a dar un número de clases un poco menor del que se utiliza en la
practica.
En nuestro ejemplo: K=?

n = 50
Aplicando la fórmula tenemos:
K = 1 + 3.322 log 50 = 6.644
redondeando al entero inmediato mayor por que, como ya se indico, la formula es un
poco conservadora, obtenemos:
K = 7.
Nota.- Por razones extraídas de la práctica, se adoptan los siguientes límites para K.
5  K  15
3º. La idea es resumir los valores con el fin de percibir algunas características o
propiedades de los datos que no aparecen a simple vista. Para esto vamos a clasificar los
50 autobuses en 7 clases, de acuerdo con la formula de Sturges.
La amplitud de cada intervalo de clase que representamos con la letra c, se obtiene por
R
medio de la formula: c=
K
Aplicando los datos a la fórmula anterior, se tiene:

40
c= = 5.7142
7
Redondeamos a 6.
Luego c = 6 y por tanto, el nuevo recorrido será:

R  = c  K = 6  7 = 42
4º. Teniendo en cuenta que este recorrido es mayor que el recorrido original,
buscaremos el exceso:
Exceso = 42 - 40= 2 años
Debemos repartir este exceso a los dos extremos del recorrido original, mitad a cada
lado, en este caso 1 a cada extremo. Sumamos el número 1 al valor máximo: 71 + 1 =
72 y restamos el número 1 al valor mínimo: 31 - 1 = 30.
A partir de este valor 30 agregamos sucesivamente la amplitud 6 y obtenemos los

puntos de división que determinan los 7 intervalos (ver figura 1.2).
30 36 42 48 54 60 66
72
Figura 1.2
Sin embargo, una dificultad se presenta cuando algunos de los datos coinciden con
cualquiera de los puntos de división: 36, 42, 48, 54, 60 y 66.
5º Supongamos que un dato es 36 ¿dónde lo colocamos? ¿en el primer intervalo cuyos

extremos son 30 y 36?.- (ver Fig. 2.1) ó ¿en el segundo intervalo que tiene por extremos
36 y 42?.-
Para aclarar está ambigüedad adoptamos, el intervalo abierto por la izquierda que no
incluye al valor 30 (límite inferior del intervalo) y cerrado por la derecha que incluye al
valor 36 (límite superior del intervalo). Este tipo de intervalo se representa
matemáticamente por: ( Yi−1 − Yi , donde Yi−1 representa el límite inferior del intervalo
y Yi representa el límite superior.
Así, en nuestro ejemplo el primer intervalo lo escribiremos como ( 30 − 36.
Por tanto, los intervalos de clase quedan definidos como:

Intervalo
de clases
Nota.- También existen otros dos tipos de intervalos de clases, definidas como:
[ Yi−1 − Yi ) Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda (incluye
al límite inferior del intervalo) y abierto por la derecha (no incluye al límite superior del
intervalo).
Yi−1 − Y Intervalo cerrado. Este intervalo incluye a ambos límites del intervalo.

6º. Es conveniente que todos y cada uno de los datos que se hallen dentro de un mismo
intervalo, estén representados por un mismo valor. Este valor caracteriza a la clase y por
eso se llama marca de clase, se obtiene promediando los límites de cada intervalo. Una
formula para calcular la marca de clase de un intervalo es:
Yi−1 + Yi
Yi =
2
7º. A continuación debemos realizar la clasificación y conteo de los datos (ver tabla
1.2), es decir, colocar cada uno de ellos dentro de su clase, todos representados por un
mismo signo: una tarja.
Tabla 1.2.
Intervalo de Marca de clase Conteo Frecuencia
clase Yi ni
A continuación presentamos la tabla 1.3, conocida como tabla de distribución de

frecuencias absolutas.
Tabla 1.3. Distribución de frecuencias de 50 personas con cáncer pulmonar

según su edad, en el Hospital Regional de Trujillo, durante 2003.
Intervalo de Marca de Frecuenc Frecuenc Frecuenc Frecuencia
clase clase ia ia ia acumulada
( Yi−1 − Yi Yi ni relativa acumula
da
Total
Fuente.- Registro de admisión del Hospital Regional de Trujillo, durante el año

2003.
• Frecuencia absoluta: (ni )

Llamaremos frecuencia absoluta de un valor xi de la variable estadística X, al

número de veces aparece repetido dicho valor en el conjunto de las
observaciones realizadas.
k
Propiedad.- n 1 + n 2 + ····+ n k =  n i = n
i =1
• Frecuencia absoluta acumulada: (Ni )

La frecuencia absoluta de un valor xi de la variable X es igual a la suma de los
valores inferiores o iguales a dicho valor evidentemente. Así, la frecuencia
absoluta acumulada del ultimo valor será n (donde n = número de observaciones
realizadas).
i
N i = n 1 + n 2 + ···+ n i =  n j
j=1
Propiedad.- N i = N i −1 + n i , de donde n i = N1 − N i −1
• Frecuencia relativa: (hi )

Llamaremos frecuencia relativa de un valor observado xi de la variable X, al
cociente entre su frecuencia absoluta y el número de observaciones realizadas
(n), y se denota por:
n
hi = i , 0  h i  1 ,  i = 1, 2, ..., k..
n
k
Propiedad.- h 1 + h 2 + ····+ h k =  h i = 1
i =1
• Frecuencia relativa acumulada: (Hi )

Se llama frecuencia relativa acumulada de un valor xi de la variable X, al
cociente entre su frecuencia absoluta acumulada y el número de observaciones
realizadas (n), y se denota por:
i
N
n j i nj i
n = h j
j=1
Hi = i = =
n n j=1 j=1
Propiedad.- H i = H i −1 + h i
Interpretación.-
n2 =
N4 =
h3 =
H5 =
N6 - N2 =

Gráfico de la distribución por intervalos.
Los gráficos más usados son: Histograma, Polígono de frecuencias y polígono de

frecuencias acumuladas u ojiva.
a) Histograma.
Es una representación gráfica de una distribución de frecuencias agrupadas en
intervalos de clase, mediante una serie de rectángulos contiguos que tienen:
- sus bases sobre un eje horizontal y cuya longitud será igual al tamaño de los
intervalos de clase.
- Las alturas proporcionales a la frecuencia (absoluta o relativa).
Histograma de las edad de los pacientes con cáncer pulmonar

20
Número de pacientes
15
10
0
30 36 42 48 54 60 66 72
Edad (en años)
Figura 1.3. Histograma de la distribución de las edades de los pacientes con cáncer pulmonar
de la tabla 1.3.
b) Polígono de frecuencias.
Cuando la variable está agrupada en intervalo de clase, el polígono de frecuencia se
obtiene uniendo los puntos medios de las bases superiores de cada rectángulo en el
histograma.

Poligono de frecuencias de las edad de los pacientes con cáncer pulmonar
15
12
0
27 33 39 45 51 57 63 69 75
Edad (en años)
Figura 1.4. Polígono de frecuencias de las edades de los pacientes con cáncer pulmonar de la tabla 1.3.
c) Polígono de frecuencias acumuladas u ojivas.
Está representación es válida para variables estadísticas agrupadas en intervalos de

clase. En el eje de las abscisas representamos los distintos intervalos de clase que han de
estar naturalmente traslapados. En el extremo superior de cada intervalo se levanta una
vertical con altura igual a la frecuencia (absoluta o relativa) acumulada, luego se unen
los extremos superiores de las verticales con segmentos rectilíneos. Así el polígono de
frecuencias acumuladas absolutas alcanzará su máxima altura en el último intervalo.
Poligono de frecuencias acumuladas de las edad de los pacientes con cáncer.
50
40
30
20
10
0
30 36 42 48 54 60 66 72
Edad (en años)
Figura 1.5. Polígono de frecuencias acumuladas de las edades de los

Pacientes con cáncer pulmonar de la tabla 1.3.

1.6.3. Distribución de frecuencias: Variable cualitativa

Consideremos el siguiente ejemplo:
Ejemplo 1.5. En una encuesta de opinión acerca de las preferencias de una marca de
bebidas gaseosas por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores
dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.
Construir la distribución de frecuencias.
Solución.
La tabulación de estos datos, donde la variable cualitativa es X: Color de bebida
gaseosa, es la distribución de frecuencias de la tabla 1.4.
Tabla 1.4. Distribución de personas por su color preferido de una marca de bebida
gaseosa.
Color de Número de Frecuencias Frecuencias
Bebida Consumidores: relativas: hi Porcentajes:
ni hi(%)
Blanco (B) 8 0.40 40
Negro (N) 9 0.45 45
Rojo (R) 3 0.15 15
Total 20 1.00 100
Fuente.- datos obtenidos de la encuesta realizada.
Gráficos.
Los gráficos más comunes para la distribución de frecuencias de variable cualitativa son
el de diagrama de rectángulos y el de sectores circulares.
En un Diagrama de rectángulos los datos de cada una de las modalidades (caracteres

cualitativos) se representa por un rectángulo vertical (u horizontal), cuya altura (o largo)
es proporcional a su frecuencia (absoluta o relativa). Los rectángulos se dibujan dejando
un espacio entre ellos.

Diagrama de rectangulos de las bebidas gaseosas de acuerdo a su color
10
8
Número de personas
6
0
Blanco Negro Rojo
Colores de las bebidas gaseosas
Figura 1.6. Diagrama de rectángulos para los datos de la tabla 1.4.
En un gráfico circular, los datos de cada categoría se representan por un sector circular.
Es utilizado principalmente cuando se pretende comparar cada valor de la variable con
el total. Para construir se divide el circulo en sectores, cuyas áreas serán proporcionales
a los valores de la variable. Está división es obtenida a través de la regla de 3 simples.
Total → 360o
Parte → xo
Diagrama de sectores circulares de las preferencias de las

gaseosas por su color.
Rojo
15%
Blanco
40%
Negro
45%
Figura 1.7. Gráfica circular para los datos de la tabla 1.4.

1.6.4. Tablas de clasificación cruzada.
Hasta ahora, hemos visto como organizar y resumir informaciones correspondientes a

una única característica o variable de una población. Sin embargo, en la práctica muchas
veces estamos interesados en analizar el comportamiento conjunto de dos o más
variables de cada elemento. Por ejemplo, podríamos observar la estatura y el peso de
cada alumno de un colegio.
Los distintos valores que pueden adoptar estos caracteres en estudio forman un conjunto
de pares, que denotaremos por (X, Y), y que llamaremos variable estadística
bidimensional.
La variable bidimensional (X, Y), puede representar las situaciones siguientes:

1) Dos variables cualitativas.- Por ejemplo, Lugar de residencia y sexo de un
paciente.
2) Dos variables cuantitativas.- Estas pueden ser:
a) Las dos cuantitativas discretas: Por ejemplo, número de admisiones y

número de médicos en un hospital durante un mes.
b) Uno discreto y el otro continuo: Por ejemplo, número de hijos y edad del
jefe de familia.
c) Las dos continuas: Por ejemplo, peso y altura de un paciente.
3) Uno cualitativo y el otro cuantitativo.- Estas pueden ser:

a) Uno cualitativo, otro cuantitativo discreto: Por ejemplo, nivel educativo y
número de hijos de una persona.
b) Uno cualitativo, otro cuantitativo continuo: Localización del tumor y
edad de los pacientes en un centro oncológico.
A continuación, se presenta la clasificación de los pacientes con cáncer pulmonar,

según edad y peso, en la tabla 1.5.
Tabla 1.5. Pacientes con cáncer pulmonar según edad y sexo.

Hospital Regional de Trujillo. 2003
Sexo
Edad Femenino Masculino Total
(años)
30 - 36 0 1 1
36 - 42 2 5 7
42 - 48 1 2 3
48 - 54 1 3 4
54 - 60 6 2 8
60 - 66 2 6 8
Total 12 18 30
Fuente. Departamento de estadística del Hospital Regional de Trujillo. 2003.

Tabla 1.6. Pacientes con cáncer pulmonar según lugar de residencia y por sexo.
Hospital Regional de Trujillo. 2003
SEXO CIUDAD Total
A B C D
Femenino 4 3 2 1 10
Masculino 7 3 5 5 20
Total 11 6 7 6 30
Fuente. Departamento de estadística del Hospital Regional de Trujillo. 2003.
Gráfico 1.8. Pacientes con cáncer pulmonar, según lugar de

procedencia y por sexo.
8
Número de pacientes.
7
7
6
5
5 5
4
4
3
3 3
2
2
1
1
0
A B C D
Ciudad de procedencia
Femenino Masculino

Capitulo I-Estadistica-I

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Capitulo I-Estadistica-I

Hochgeladen von

Copyright:

Verfügbare Formate

Cap. 1. Estadística descriptiva.

1.1 Definición de la Estadística.

Definimos la estadística, como la ciencia que nos proporciona un conjunto de métodos,

1.2 Estadística descriptiva y estadística inferencial.

La estadística descriptiva incluye las técnicas que se relacionan con el resumen y la

1.3.- Población y muestra.

Universo. Se denomina universo, a un conjunto de elementos (que consiste de personas,

El resultado de medir una característica observable de una unidad de análisis, se

Dr. César Haro Díaz

hace a cada unidad de análisis, se puede considerar a la población como la totalidad de

Parámetro. Se denomina parámetro a una medida descriptiva que resume una

Muestra. Es una parte extraída de la población, con el fin de obtener información

Estadística o estadígrafo: Es una medida descriptiva que resume una característica de

1.4. Variables estadísticas.

• Una variable continua puede tomar cualquier valor dentro de un intervalo

b) Variable Cualitativa.- Son variables cuyos valores consisten en categorías de

Dr. César Haro Díaz

1.4.1. Escalas de medición.

c) Escala de Intervalo. Es el tercer nivel de medición, entre cuyos diversos

d) Escala de Razón o Proporción: Es el nivel más alto de medición y donde la

Dr. César Haro Díaz

A esta escala se aplica todas las operaciones matemáticas y estadísticas usuales.

Edad del paciente Cuantitativa Razón μ (promedio)

1.5. Obtención de datos a través experimentos y encuestas.

Una manera de obtener datos es a través de la observación directa. Un experimento

1.6. Presentación de los datos.

Después de obtener un conjunto de datos, es necesario presentarlos en forma tal, que

1.6.1. Distribución de frecuencias sin intervalos:

Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2,

Dr. César Haro Díaz

Tabla 1.1.- Distribución de frecuencias del número de hijos por familia.

Fuente.- Datos obtenidos de los formularios de la encuesta.

Número de hijos por familia

Figura 1.1. Diagrama de barras para los datos de la tabla 1.1.

1.6.2. Distribución de frecuencias por intervalos.

La distribución de frecuencia por intervalos o clases se usa cuando la variable

Elaboración de las tablas de frecuencias.

Ejemplo 1.2. Para esclarecer la construcción de la tabla de frecuencias para datos

Dr. César Haro Díaz

observaciones de las edades de 50 personas con cáncer pulmonar hospitalizadas en el

Se pide representar los datos en una tabla de frecuencias.

En nuestro ejemplo, tenemos:

Luego el rango es R= 71 - 31= 40 años

En nuestro ejemplo: K=?

Aplicando los datos a la fórmula anterior, se tiene:

Dr. César Haro Díaz

Luego c = 6 y por tanto, el nuevo recorrido será:

A partir de este valor 30 agregamos sucesivamente la amplitud 6 y obtenemos los

5º Supongamos que un dato es 36 ¿dónde lo colocamos? ¿en el primer intervalo cuyos

Por tanto, los intervalos de clase quedan definidos como:

Dr. César Haro Díaz

A continuación presentamos la tabla 1.3, conocida como tabla de distribución de

Tabla 1.3. Distribución de frecuencias de 50 personas con cáncer pulmonar

Fuente.- Registro de admisión del Hospital Regional de Trujillo, durante el año

• Frecuencia absoluta: (ni )

Dr. César Haro Díaz

Llamaremos frecuencia absoluta de un valor xi de la variable estadística X, al

• Frecuencia absoluta acumulada: (Ni )

• Frecuencia relativa: (hi )

• Frecuencia relativa acumulada: (Hi )

Dr. César Haro Díaz

Gráfico de la distribución por intervalos.

Los gráficos más usados son: Histograma, Polígono de frecuencias y polígono de

Histograma de las edad de los pacientes con cáncer pulmonar