Sie sind auf Seite 1von 73

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

UNIVERSIDAD NACIONAL DEL CENTRO DEL


PER
FACULTAD DE CIENCIAS APLICADAS

FACILITADOR:

Ing. Claudio LIMAYMANTA SULCA


TARMA - 2014
1

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

ESTADSTICA I
INTRODUCCIN
Hoy en da vemos alguna variedad de
la Estadstica, as como la probabilidad de
ganar una lotera, proporcin de electores
que apoyan a un candidato, ndice de precios
al consumidor, ndice de nacimiento y
mortandad, rendimiento universitario, etc.
Estas estadsticas nos ayudan a resolver
una gran variedad de situaciones, en la toma
de decisiones.
Dependemos de la Estadstica por
que es una de las formas ms convenientes
de

expresar

hechos

en

trminos

de

nmeros.
Esta separata aborda los temas en forma tal como casi nos han expuesto en libros de
estadstica, sobre todo a su presentacin clara y sencilla, usando las tcnicas de mapas
conceptuales, pretendindose con ello que sean captados fcilmente por el estudiante.
Espero que esta separata sea de mucha utilidad para el estudiante, justificando de esta
manera el logro en su formacin profesional.
Recomendaciones:
1. Frente a una realidad de aprendizaje significativo, el rol que toca cumplir a los alumnos y
docentes deben ser de cambio constante, crtico, reflexivo y creativo.
2. Este documento permite al alumno aprender en forma analtica, realizando acciones que
logren en l su propio enriquecimiento acadmico.
3. Al final de cada tema tratado esta incluido los problemas resueltos y problemas
propuestos, los cuales debes de desarrollarlo, el cual permitir el grado de avance y
rendimiento en tu curso.
4. Es recomendable el uso permanente de otras bibliografas los cuales enriquecern tu saber
cientfico.

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

I CAPTULO
La estadstica es el rea de las matemticas que permite recoger, organizar, resumir,
presentar y analizar datos sobre fenmenos y procesos. Pero, el trabajo del especialista en
estadstica no consiste slo en reunir y tabular los datos, sino sobre todo en el proceso de la
interpretacin de esa informacin para obtener conclusiones y tomar decisiones basadas en
esos anlisis. Su aplicacin es muy amplia, por ejemplo, en la interpretacin de fenmenos
fsicos, meteorolgicos, biolgicos, de las ciencias sociales, ciencias administrativas y de las
organizaciones. El avance de la computacin numrica y el desarrollo de la teora de la
probabilidad han aumentado el alcance de las aplicaciones de la estadstica.
Competencia
Utiliza los conceptos de la estadstica descriptiva, as como elabora, describe, grafica e
interpreta las distribuciones de frecuencias tanto para datos agrupados y para datos no
agrupados en intervalos de clase, de esta manera el alumno reconoce el valor de la estadstica
como herramienta de investigacin para las diversas disciplinas de la ciencia y la tecnologa.
CONTENIDOS CONCEPTUALES
-

Estadstica.

Poblacin y muestra.

Trminos usuales en la
estadstica.

Escalas de medicin.

Distribuciones

de

frecuencias.
-

Grficas estadsticas.

ESTADSTICA.ciencia

que

Es

proporciona

una
un

conjunto de mtodos que se


utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los
datos con respecto a una caracterstica, materia del estudio o investigacin. En primera
instancia se encarga de obtener informacin, describirla y luego usa esta informacin a fin de
predecir algo respecto a la fuente de informacin (Muestra o Poblacin).

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

I. DIVISIN DE LA ESTADSTICA
El campo de la estadstica generalmente est dividido en dos grandes reas: Estadstica
Descriptiva y Estadstica Inferencial.
a)

ESTADSTICA DESCRIPTIVA.Es el conjunto de mtodos que implican la recoleccin, presentacin y caracterizacin


de un conjunto de datos a fin de describir en forma apropiada las diversas
caractersticas de stas. Es decir, un estudio estadstico se considera descriptivo
cuando solo se analiza y describe los datos.
Ejemplo 1.
Un Jefe de Personal, desea conocer las aptitudes de 5 secretarias que trabajan en una
determinada rea de la planta de procesamiento de una Industria Azucarera. Se aplica
una prueba de aptitudes a los 5 secretarias y las calificaciones son: 85, 90, 93, 82, y 95
puntos. Suponiendo que la medida estadstica que aplica el Jefe de personal es la
Aptitud Promedio o Media aritmtica, entonces la calificacin promedio es:

X =

85 + 90 + 93 + 82 + 95

= 445/5

= 89 puntos

5
El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna
generalizacin acerca de las aptitudes de las secretarias de otras reas de la misma
planta industrial.
b) ESTADSTICA INFERENCIAL.La Inferencia Estadstica
es el conjunto de mtodos
o tcnicas que posibilitan la
generalizacin o toma de
las decisiones en base a
una

informacin

obtenida

parcial
mediante

tcnicas descriptivas.
Es decir, un estudio estadstico, se considera inferencial cuando se pretende inferir o
predecir conclusiones que ataen a toda la fuente de informacin de donde provienen
los datos.
Ahora bien, esta prediccin se hace con un cierto grado de confianza; este grado de
confianza se mide por la probabilidad. Por tanto el clculo de probabilidades, piedra

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

angular de la inferencia estadstica est como puente entre las dos partes de la
Estadstica.
Aunque la Estadstica descriptiva es importante para caracterizar y presentar
informacin de los datos, sin embargo, el desarrollo de la inferencia estadstica es la
que ha conducido a la gran expansin en la aplicacin de los mtodos estadsticos.
Del ejemplo 1.
El Jefe de Personal decide usar la aptitud promedio de las 5 secretarias para estimar
la aptitud promedio de todas las secretarias de la industria azucarera. El proceso de
estimar esta aptitud promedio global ser un problema de inferencia estadstica.
Ejemplo 2.
Cuatro fluorescentes de marca A, dejaron de funcionar despus de 1100, 980, 900, y
1020 horas de uso continuo. Cinco fluorescentes de marca B dejaron de funcionar
despus de 960, 1050, 1065, 845 y 980 horas de uso contino. Se llega a las siguientes
conclusiones:
a) La duracin promedio de los 4 fluorescentes marca A es de 1000 hs. Mientras que la
duracin promedio de las fluorescentes marcas B es de 980 hs.
b) La duracin promedio de todas las fluorescentes marcas A es mayor que la de todas
los fluorescentes marca B.
c) La diferencia entre los dos promedios es de 20 horas.
d) La diferencia entre los dos promedios es demasiado pequeo para llegar a la
conclusin de que los fluorescentes marca A son mejores que los fluorescentes
marca B.
e) Si se selecciona y prueba otro fluorescente marca A, probablemente durar ms que
el promedio de los fluorescentes marca B.
f) Ud. Decide comprar fluorescentes marca A en vez de fluorescentes marca B.
Cual de las conclusiones provienen de la estadstica descriptiva y cual de la inferencia
estadstica?

Conclusiones
para la
poblacin

Clculo de
parmetros y anlisis
probabilstico

Conclusiones
para la
muestra

Respuestas:
a)

Estadstica descriptiva.

d) Estadstica inferencial.

Poblacin
b) Estadstica inferencial.
c)

Estadstica descriptiva.

e)

Estadstica inferencial.

f)

Estadstica inferencial.

Muestr
a
Recoleccin
de datos

Organizac
in de
datos

Clculo de
Estadgrafos

Anlisis e
interpreta
cin

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

ESTADSTICA INFERENCIAL

ESTADSTICA DESCRIPTIVA
II. POBLACIN Y MUESTRA
POBLACIN.- Es un conjunto de elementos bien
definidos

(personas,

objetos,

datos)

que

contienen una o ms caractersticas observables


de naturaleza cuantitativa o cualitativa que se
pueden medir entre ellos, por otra parte, la
poblacin consiste de un conjunto de datos
estadsticos que se agrupan de acuerdo con la
formulacin de una investigacin estadstica.
Ejemplo:
-

Las edades de los alumnos del sistema


universitario peruano.

Los alumnos de educacin secundaria del Per.

Poblacin Objeto.- Es el conjunto de elementos materia de estudio.


Poblacin Objetivo.- Las diferentes medidas de la caracterstica que nos interesa de la
poblacin objeto.

Ejemplo:
Al estudiar el rendimiento acadmico de los alumnos en el sistema universitario; La
poblacin objeto, esta constituida por los alumnos del sistema universitario; y la poblacin
objetivo, por las notas que miden el rendimiento acadmico.

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

POBLACIN FINITA (n).- Es aquella que tiene un nmero limitado de componentes o


elementos. Ejm. Las edades de los alumnos del III semestre de Administracin de
Empresas de la UNCP.
POBLACIN INFINITA (N).- Es aquella que no tiene lmites o cotas, es decir un nmero
ilimitado de elementos. Ejm. La calidad de todas las unidades producidas mediante un
proceso manufacturero.
POBLACIN ACCESIBLE DESCONOCIDA: Conjunto de personas, elementos cosas o
valores que cumplen con las caractersticas o criterios preestablecidos y que pueden ser
accesibles al investigador para el estudio, pero su nmero no es conocido.
Ejemplo: Todos los docentes de las Universidades de la regin Junn susceptibles a ser
evaluados para su ascenso durante el periodo de estudio.
POBLACIN ACCESIBLE CONOCIDA: Conjunto de personas, elementos cosas o valores
que cumplen con las caractersticas o criterios preestablecidos y que pueden ser accesibles
al investigador para el estudio, cuando el nmero es conocido.
Ejemplo: Los 5784 docentes de las universidades A, B, C.., X de la Regin Lima que
fueron evaluados en los ltimos concursos que ingresaron al sistema universitario.
A continuacin se dan algunos ejemplos:
Universo o Poblacin
Estudiantes matriculados en
Instituciones

Superiores

durante el ao acadmico 2009


Egresados
de
maestra
de

las

Elemento
Estudiantes

Algunas Caractersticas
Edad, sexo, grado de estudio,

Matriculados

modalidad y turno

la

Egresados

Edad, sexo, mencin, promocin,

Universidad A durante el periodo 2000

tiempo

2005
Docentes

graduacin.
Edad, sexo, tiempo de servicio,

nombrados

en

las

Universidades durante el periodo X.


Pacientes con fiebre tifoidea del
Hospital

susceptibles

de

ser

Docentes
nombrados
Pacientes con
fiebre tifoidea

de

permanencia,

aos de aportacin, nivel


Edad, sexo, ocupacin,
estado

de

nutricin,

raza,
estado

estudiados en el periodo Y.
socioeconmico.
PARMETRO.- Es una medida resumen que describe las caractersticas medibles de una
poblacin y naturalmente para determinar su valor, es necesario utilizar la informacin de
toda

la

poblacin.

(Media

poblacional,

Varianza

poblacional,

Desviacin

estndar

poblacional)

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo. La edad promedio de los universitarios del primer semestre de las universidades
del Per.
Los parmetros ms usados son:

La media poblacional.

= Xi / n

Proporcin poblacional

= dato parcial/ dato total

Desviacin estndar poblacional

= 2

Tamao de la poblacin finita

=N

MUESTRA.- Es una parte o un subconjunto representativo de la poblacin, y al proceso de


obtener la muestra se le denomina Muestreo.
La seleccin y el estudio de una muestra, tiene por objeto la extraccin de conclusiones
que sean vlidas para la poblacin del cual se obtuvo dicha muestra. En otras palabras
nuestro objeto es conocer la poblacin, para lo cual se extrae una muestra de sta.
Los Estadgrafos ms usados son:

La media de la muestra X = Xi / n

Varianza de la muestra = s2

Desviacin estndar muestra = s

Tamao de la muestra = n

Proporcin de la muestra = p

Ejemplo.
Para determinar la proporcin de partes defectuosas producidas en un cierto proceso de
fabricacin, los tcnicos de control de calidad examinan un lote de unidades producidas
para determinar el nmero de unidades defectuosas contenidas en l. (Generalmente un
lote de este tipo, el cual constituye una muestra, se toma en intervalos regulares de
tiempo). As en un lote de 300 unidades producidas en el proceso, el ingeniero encuentra
45 defectuosas, entonces la proporcin de defectuosas en la muestra ser:
45/300 = 0,15 (15 %)
La proporcin de la Poblacin la cual es un parmetro que se desconoce, es la proporcin
de todas las unidades defectuosas producidas en el proceso.
La Proporcin de la muestra, la cual es la proporcin de las unidades defectuosas
contenida en la muestra.

ESTADGRAFO.- Es una medida resumen que describe una caracterstica de la muestra.


Ejemplo.
Suponga que los ingresantes al primer ao de su universidad constan de 3000 estudiantes,
todos los cuales han dado un examen nico de seleccin que se aplic a todos los

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

estudiantes que han ingresado al primer ao de universidad en el pas. Explique las


circunstancias bajo las cuales las calificaciones recibidas por los estudiantes ingresantes al
primer ao de su universidad puede considerarse como. A) Una muestra B) una poblacin.
Solucin.
A) Puede haber ms de una circunstancia. As, si se quiere conocer la calificacin promedio
de todos los ingresantes a las universidades del pas, la poblacin estara formada por
las calificaciones de todos los ingresantes a primer ao de universidad en el pas,
entonces las calificaciones de los ingresantes a su universidad sera una muestra.
B) Tambin puede haber varias circunstancias. As, si se quiere conocer la calificacin
promedio de todos los ingresantes a su universidad. La poblacin estara compuesta por
las calificaciones de todos los ingresantes a su universidad.

III. TRMINOS USUALES EN LA ESTADSTICA


TIPOS DE DATOS
DATO ESTADSTICO.- Es el resultado de medir una caracterstica observable de una
unidad elemental.
Ejemplo. Edad de 5 docentes.
DATOS: Son los valores recopilados como resultado de las observaciones de una
caracterstica o variable, llamados tambin series estadsticas.
Como hay dos tipos de variables (Cualitativas y Cuantitativas), diremos tambin que hay
dos tipos de datos: Datos Cualitativos y Datos Cuantitativos. Los datos cuantitativos se
pueden considerar tambin como Datos Discretos y Datos Continuos.
VARIABLES ESTADSTICAS
Es una caracterstica general de una muestra o de la poblacin que se va a investigar y
que puede tomar diferentes valores, se clasifica de la siguiente manera:

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

VARIABLE CUALITATIVA.- Es cuando expresa una caracterstica cualitativa cuyos


valores son cualidades que presenta la poblacin, se expresan en escalas nominal u
ordinal, con estos valores no se pueden realizar operaciones aritmticas.
Ejemplo.
Variable
Religin: Mormon, catlico, protestante, budista, etc.
Profesin: Profesor, Ingeniero, psiclogo, abogado, fsico, economista, etc.
A. Variable Cualitativa nominal.- Aquella que establece la distincin de los
elementos en las categoras sin implicar orden entre ellas.
Ejemplo:

Clasificar a un grupo de individuos; por tamao, alto, bajo. Por sexo;

Masculino, femenino; Por estado civil, soltero, casado, viudo, divorciado.


B. Variable cualitativa Ordinal.- Aquella que agrupa a los objetos, individuos, en
categoras ordenadas, para establecer relaciones comparativas, que son
susceptibles de ordenacin pero no de medicin cuantitativas.
Ejemplo:

Clasificar a un grupo de alumnos por su hbito de estudiar


Alumno estudioso
Alumno poco estudioso
Alumno moderado

Clasificar a un grupo de personas por su hbito de jugar ftbol.


Jugador bueno
Jugador malo
Jugador regular
Jugador excelente

Clasificar a un grupo de individuos por su grado de instruccin.


Primaria, secundaria, superior

VARIABLE CUANTITATIVA.- Es aquella caracterstica cuantitativa que se


expresa numricamente, estas surgen cuando se puede establecer cuanto o en que
cantidad se posee una determinada caracterstica.
Ejemplo: Ingreso por familia, nmero de accidentes de trnsito, longitud, tiempo,
etc. Se dividen en:
a) Variable Cuantitativa Discreta.- Es aquella variable cuantitativa que toma
solo valores enteros positivos, surgen solo por el procedimiento de conteo.

10

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo: Nmero de alumnos de un centro educativo, Nmero de docentes de la


UNCP, Nmero de habitantes por distrito, Nmero de hijos de una familia.
b) Variable Cuantitativa Continua.- Es aquella variable que puede tomar
cualquier valor comprendido entre dos valores extremos (cualquier valor dentro
de un intervalo). Ejemplo: Talla, peso, longitud, volumen, salario, presin arterial.
Unidad Estadstica.- Es el elemento u objeto indivisible de la poblacin que ser
analizado.
Ejemplo:

Si se quiere estudiar el tipo de arroz que consume Tarma, la unidad

estadstica sern las familias.


EJERCICIOS PARA RESOLVER POR EL ESTUDIANTE
1. Clasifique las siguientes caractersticas, en variables cualitativas y cuantitativas
continuas o discretas:
a) Consumo de corriente (Kw.) mensual en un ao.
b) El nmero de panes producidos en una panadera en un mes.
c) Estado civil, opinin pblica, lugar de nacimiento de las personas que viven en
Tarma.
d) Marca y pas de procedencia de los automviles vendidos durante el ao en el Per.
2. En cada aparato que produce una empresa de equipos elctricos se incluye una pliza
de garanta para el cliente. Adems de validar la garanta y proporcionar a la compaa el
nombre y domicilio del cliente, la pliza pide otra informacin complementaria que se
emplea en los estudios de mercado. Para cada uno de los blancos numerados de la pliza,
determine las caractersticas ms probables de las categoras que utilizar la compaa
para registrar la informacin. En particular:
a) Sern cuantitativas o cualitativas?
b) Continuas o discretas?

Nombre...................................................

Estado civil.............. (3)...............

Domicilio................................................

Donde se compro el equipo?

Ciudad................... Estado....................
Cdigo postal.........................................

------------------ (4) --------------Porque compro el equipo?

Edad.... (1).......
Ingreso Anual.....
(2)...representa
-------------(5) -----------------3.- Cules
de los siguientes
enunciados
el esquema
ms exacto para clasificar
datos?

11

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

a) Mtodos cuantitativos.
b) Mtodos cualitativos.
c) Una combinacin de mtodos cuantitativos y cualitativos.
d) El esquema se determina solo mediante la informacin concreta sobre la
situacin.
4.- Para cada uno de los siguientes enunciados, identifique la unidad estadstica:
a) El alcalde de una ciudad desea estimar el porcentaje de votantes en su distrito
que estar a favor de la aprobacin de una ley municipal.
b) Una cadena de supermercados desea conocer la opinin de sus empleados acerca
de un plan de seguro mdico patrocinado por la compaa.
c) Un ejecutivo de mercadotecnia de una compaa desea hacer una encuesta entre
los compradores para determinar su actitud hacia una nueva lnea de productos.
5.- En los siguientes enunciados identifique usted: La poblacin, la muestra, la variable, el
tipo de variable, la unidad estadstica y el parmetro.
a) Se va ha realizar un estudios de la cantidad de azcar vendida por semana, en un
supermercado de cierto sector de Tarma, para el ao 2007, para lo cual se
utilizar el promedio de ventas de ese ao, los registros se hacen en kg/semana.
b) Una firma industrial, comprometida en la produccin de aceros, produce tornillos
para los cuales existen estrechos mrgenes de tolerancia.
IV. APLICACIONES DE LA ESTADSTICA
La Estadstica proporciona un conjunto de mtodos aplicables en
todas las reas cientficas donde se acumulan, se analizan y se
interpretan datos. Resulta pues muy difcil nombrar reas donde
no se aplica. Citaremos aqu brevemente algunos campos en los
cuales los mtodos estadsticos juegan un papel principal, como:
Salud y Medicina; biologa, economa, administracin, contabilidad,
ingeniera, etc. y en la Investigacin Cientfica.
1. SALUD Y MEDICINA: Las estadsticas de salud incluyen
toda informacin numrica relacionada de modo directo con los problemas de salud,
concebidos en una escala social. Podemos citar muchos ejemplos que muestran lo
necesario que son las estadsticas de salud con los mtodos para su anlisis e
interpretacin para fomentar y desarrollar una poltica sanitaria adecuada; de acuerdo
a las siguientes interrogantes:
Cul es la causa ms importante de muerte en esta regin; el cncer, la
tuberculosis, los accidentes de trnsito, etc?
A que edad resulta ms alta la mortalidad y por cul enfermedad?

12

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

En que zona, un determinado tipo de enfermedad presenta una incidencia mucho


ms elevada que la incidencia promedio? Qu condiciones prevalecen en esa zona?
existen algunas reas especficas o algunas pocas en que se registran
preferentemente brotes de alguna enfermedad?
Mencionaremos algunos usos principales de las estadsticas de
salud:
Describir el nivel de salud de una comunidad.
Diagnosticar las enfermedades de una comunidad.
Encontrar soluciones a los problemas de salud.
Determinar prioridad para los programas de salud, etc.
2. ECONOMA: La estadstica constituye uno de los pilares de la aplicacin de la
teora econmica. Se utiliza en la descripcin de fenmenos econmicos, en la
estimacin de las relaciones econmicas, en la verificacin, prediccin y previsin de
las variables econmicas.
3. BIOLOGA: La estadstica se puede utilizar para estimar el tamao real de la
poblacin de una especie animal en particular, la propagacin de bacterias, en
mejorar la raza de los animales.
4. LA INVESTIGACIN CIENTFICA:
El desarrollo del conocimiento en la ciencia, se caracteriza porque su ejecucin
se lleva a cabo segn un mtodo: El Mtodo Cientfico. La aplicacin de este
mtodo es lo que diferencia al conocimiento cientfico del conocimiento
ordinario.
Las etapas del Mtodo Cientfico, segn el matemtico filsofo Bertrand Russel,
son tres:
1. La Observacin del Fenmeno que se estudia.
2. La formulacin de una o varias hiptesis mediante la cual puedan explicarse
los hechos observados.
3. La verificacin de las hiptesis mediante nuevas observaciones.
Esta divisin en etapas, sugiere que el mtodo cientfico este definido por un
proceso de observacin, de racionalizacin y de experimentacin. La estadstica
desempea un papel importante en cada una de las tres etapas de que consta el
mtodo cientfico de investigacin.
En la primera etapa interviene, mediante la presentacin, en forma
sinptica y resumida los resultados de la observacin, facilitando su anlisis

13

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

e interpretacin. En esta primera etapa, la estadstica cumple una funcin


esencialmente descriptiva.
En la segunda etapa; interviene, proporcionando el lenguaje adecuado para
la formulacin rigurosa de la hiptesis de investigacin.
En la tercera etapa; la utilizacin del mtodo estadstico es decisiva, no
solo en cuanto a la planificacin y adecuado diseo del experimento, sino
tambin en la seleccin del procedimiento de anlisis y en la interpretacin
de los resultados que se obtenga al aplicar dicho procedimiento.
El Papel de la Estadstica en la Investigacin, es funcionar como una herramienta
en el diseo de investigacin, en el anlisis de datos y en la extraccin de
conclusiones a partir de ellos.
Otras aplicaciones de la estadstica: En Control estadstico de calidad, en
poltica para orientar la estrategia electoral de un partido poltico, en educacin
ayuda a interpretar un test de inteligencia; en los negocios, ayuda a juzgar las
ventas respecto a la demanda potencial de un producto mediante un estudio de
mercado; en la Industria, ayuda a decidir si un proceso industrial funciona o no
adecuadamente de acuerdo con las especificaciones.
4.1. EL MTODO ESTADSTICO
El Mtodo Cientfico de Investigacin se basa en dos tipos de
razonamiento, el Inductivo y el Deductivo; el Mtodo Inductivo se basa en
sacar conclusiones de las observaciones Particulares de ciertos fenmenos
e intenta deducir unas reglas generales aplicables a todos ellos. El Mtodo
Deductivo procede de lo general a lo particular y utiliza especialmente el
razonamiento

matemtico,

se

establecen

hiptesis

generales

que

caracterizan un problema y se deducen ciertas propiedades particulares


por razonamientos lgicos.
La Investigacin Estadstica se desarrolla utilizando el ciclo deductivo
inductivo en las siguientes cuatro etapas:
a) Planteamiento del problema
El primer paso de la investigacin es definir claramente los objetivos
del estudio y relacionar este objetivo con los valores numricos de las
variables observables. La investigacin cientfica es una actividad con
propsito (Finalidad, meta) y como tal para quedar enteramente
caracterizado debe dar respuesta a las siguientes interrogantes
fundamentales:
1. En qu consiste el problema, objeto de la investigacin? O bien
Qu se quiere conocer?
2. Porqu o para qu se plantea una investigacin?

14

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

3. Sobre quin recae la investigacin?


4. Cmo se va a investigar?
5. Quin va a realizar la investigacin?
6. Dnde se va a realizar?
7. Cundo se va a realizar?
Solo cuando se esta en condiciones de dar respuestas a todos y cada uno
de estas interrogantes, se puede redactar el Plan de un trabajo de
investigacin, que es el documento bsico.
Los objetivos surgen al contestar la pregunta acerca de Para que se va a
realizar

la

investigacin?

estn

directamente

vinculados

la

justificacin e importancia de la investigacin proyectada.


La Hiptesis es una conjetura (o un supuesto, o proposicin) acerca de
determinados hechos que va ms all (trasciende) de los datos (evidencia
emprica) que intenta explicar.
Cuando se ha considerado un problema cientfico y se ha logrado formular
una hiptesis en relacin al mismo, la labor investigativa posee un grado
de lucidez y de claridad considerablemente mayor. Es precisamente esta
claridad la que permite definir los objetivos con mucha mayor precisin y
orientar la realizacin de los experimentos o la prctica de las
observaciones con un alto grado de especificidad.
b) Recoleccin de la informacin
La recoleccin correcta de los datos es de extrema importancia para el
investigador, que tiene que ser realizada o vigilada por ste; esta etapa
consiste en determinar los mtodos de recoleccin adecuado, preparar
los instrumentos de recoleccin, prueba del mtodo y de los
instrumentos de recoleccin seleccionados y realizar la recoleccin de
los datos.
c) Organizacin y clasificacin de los datos
Aqu se debe de hacer un anlisis de consistencia y ajuste de los datos.
Se trata de asegurar la validez y confiabilidad de los datos recopilados.
Luego se debe clasificar y tabular los datos y finalmente presentarlos
en cuadros estadsticos y grficas.

d) Anlisis e interpretacin de los resultados


En esta etapa se calculan indicadores y medidas resumen que describen
al conjunto de datos; tambin se establecen relaciones entre variables

15

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

de modelos estadsticos que nos permitan aceptar o rechazar los


modelos.
V. MUESTREO
La muestra es el subconjunto de la poblacin. Para que un sector de la poblacin sea
considerado como muestra, se requiere que todos los elementos de ella pertenezcan a la
poblacin. No sern muestras cuando algunos sujetos de la muestra no pertenecen a la
poblacin.
La seleccin de la muestra esta ntimamente relacionado con la estimacin que se har
posteriormente, a partir de ella, de los parmetros poblacionales, razn por la cual en el
presente capitulo abordaremos los conceptos bsicos que se deben tener en cuenta para la
seleccin de la muestra y las estimaciones poblacionales.
En ocasiones, el muestreo es una necesidad, como cuando estamos en presencia de
poblaciones virtuales o infinitas, o poblaciones finitas grandes. Tambin es obligado en
situaciones como las que se presentan en el Control de Calidad de productos farmacuticos,
ingreso de turistas a un pas, cantidad de dinero prestado por un banco, etc. En otras
ocasiones muestrear constituye una alternativa frente al estudio de todo el universo; la
alternativa de muestrear es favorable porque ello ahorra tiempo, recursos y esfuerzo.
A continuacin se ver algunos usos del muestreo en diversos campos:

1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinin pblica y el apoyo en las elecciones.

2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan


para determinar la eficiencia de una tcnica o programa de enseanza.

3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la
calidad.

4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban


la eficacia de una tcnica o de un frmaco nuevo.

5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la


produccin los efectos de un fertilizante nuevo.

6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
5.1. Desventaja del empleo de Muestras

16

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Una de las principales desventajas, es que el empleo de muestras introduce el llamado


error de muestreo, que tiene su origen en la variabilidad de los elementos que
componen la poblacin, muestras del mismo tamao arrojan resultados diferentes.
Supongamos por ejemplo que tenemos una poblacin formada por cuatro personas,
cuyas estaturas en centmetros son 158, 160, 166 y 172, respectivamente, la talla
promedio de las personas de esta poblacin es de:
158 160 166 172

164
4
Si no se conociera dicho promedio poblacional, podramos estimar esta estatura
promedio como una muestra, por ejemplo, solo dos individuos. Los resultados serian
como se muestra en el cuadro siguiente:
Personas
1, 2
1, 3
1, 4
2, 3
2, 4
3, 4

Valores Muestrales Estatura Promedio


158 160
158, 160
159
2
158 166
158, 166
162
2
158 172
158, 172
165
2
160 166
160, 166
163
2
160 172
160, 172
166
2
166 172
166, 172
169
2

Como vemos, a cada muestra le corresponde un valor promedio diferente y


diferente a su vez del verdadero promedio de la poblacin. Esta diferencia entre el
valor promedio que arroja la muestra y el valor promedio de la poblacin, se llama Error
de Muestreo.
El error de muestreo, desde luego, solo puede estimarse a condicin de que la
muestra sea adecuadamente seleccionada, y adems, puede disminuirse cuando se
desee, aumentando el tamao de la muestra. Este hecho hace que el muestreo sea un
arma muy poderosa y por consiguiente, una alternativa a valorar particularmente cuando
se trata de poblaciones grandes cuyo estudio exhaustivo es difcil y costoso.
5.2. Condiciones de una buena muestra
Aunque cualquier parte o subconjunto de una poblacin constituye una muestra,
parece intuitivamente evidente que no cualquier muestra resulta til para hacer

17

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

inferencias adecuadas en relacin con la poblacin. Las muestras deben cumplir


determinadas condiciones que son dos:
a) La relativa al Tamao Muestral
b) La Calidad Muestral
De lo que se trata a menudo es pues, de tener una muestra suficientemente grande,
pero no mayor de lo necesario. Esto depende generalmente de la frecuencia con que el
fenmeno o caracterstica en estudio se encuentre en la poblacin y de la variabilidad
de sta.
Sin embargo, el tamao de la muestra por si solo no puede garantizar que la muestra
sea til o adecuado. Por ejemplo que ocurrira si para estudiar la presencia del clera
en la poblacin de la ciudad de Lima, tomaramos una muestra del cercado de Lima.
Esta muestra, an cuando fuese tan grande que cubriera toda la poblacin del
cercado, no sera una muestra representativa de la poblacin. Entonces la condicin
de calidad solo se garantiza con muestras representativas, que son las que reproducen
las caractersticas esenciales que posee la poblacin que se desea estudiar, y con
muestras exentas de errores sistemticos, que son originados al no tener en cuenta
determinados principios de seleccin.
Por qu se sacan Muestras?
Son muchas las razones por las cuales no se trabaja con toda la poblacin, sino
con una parte representativa de ella, pero lo ms importante a nuestro entender son los
siguientes:

Mayor exactitud: Al reducir el volumen del trabajo, se puede capacitar a un


nmero de personal que realizar un mejor trabajo. Mejor supervisin y
procesamiento de datos.

Menor Costo: Los menores costos se derivan de un menor esfuerzo para la


obtencin de datos, pues se trabaja con un pequeo sector de la poblacin. Si se
realiza un censo completo, los esfuerzos y los costos seran mayores. Al trabaja
con una muestra implica reducir los costos y hacer que la investigacin sea
factible

Ms

posibilidad

de

Aplicacin:

Las tcnicas censales requieren de la

participacin de personal altamente capacitado, de equipos especializados, de


procesamiento de informacin, etc. Por eso las tcnicas de muestreo tienen ms
posibilidades de aplicacin porque flexibilizan el trabajo, al permitir trabajar
con personal no necesariamente con altas calificaciones ni especializacin.

Mayor Rapidez: Al trabajar con pequeas cantidades, los datos pueden


obtenerse ms rpidamente. Cuando se requiere la informacin con urgencia esta
ventaja es inapreciable.

18

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Tiempo: El trabajar con una muestra nos permite un uso adecuado del tiempo de
tal manera que la investigacin sea factible y asimismo tenga vigencia en el
tiempo. Por ejemplo: si trabajamos con toda la poblacin estudiantil del III y IV
semestre de estudios universitarios del Per, para determinar su nivel de
rendimiento acadmico, cabra la posibilidad de que al finalizar el semestre
acadmico no se haya terminado de evaluar a todos los miembros de la poblacin,
quedando la investigacin truncada, ya que estos estudiantes ya han cambiado de
semestre o estn en otras universidades.

Cmo se determinan las muestras?


Las muestras pueden ser extradas de diferentes formas, dependiendo estas de
las caractersticas de la poblacin, de los objetivos y de la naturaleza del trabajo de
investigacin, as como los recursos disponibles. Las muestras pueden ser seleccionadas
con o sin reemplazo y en forma probabilstica y no probabilstica.
Se denomina Muestras Probabilsticas a las que se obtienen por procedimientos
del azar o de la probabilidad. Para que el hecho sea considerado del azar, se requiere
que cumpla:
1. Igualdad de oportunidades.
2. Independencia en la ocurrencia de los eventos
La igualdad de oportunidades significa que todos los sujetos tienen la misma
oportunidad que los dems y la independencia significa que la ocurrencia de un evento
no anticipa la ocurrencia del siguiente.
Lo contrario a estos casos es la intencin o el sesgo. Azar e intencin son, en
consecuencia, dos extremos de un mismo continuo que nos interesa por igual en el caso
de la investigacin de la conducta. As, cuando los eventos suceden por el azar, se dice
que el muestreo es probabilstico. De lo contrario, si los eventos se producen por la
intencin del investigador el muestreo es intencionado o llamado no probabilstico.
MUESTRA PROBABILSTICA: Son aquellas en que todos los elementos de la poblacin
tienen una posibilidad (una probabilidad conocida) de ser incluida en la muestra.
Naturalmente no es necesario que todos tengan la misma posibilidad, basta que tengan
alguna posibilidad.
MUESTRA NO PROBABILISTICA: Llamada tambin, muestras de conveniencias o de
juicio, se basan en el conocimiento y la opinin personal para identificar los elementos
de la poblacin que van a incluirse en la muestra. Una muestra seleccionada a juicio se
basa en el conocimiento de la poblacin por parte de una persona que generalmente es
un experto en la materia.

19

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

5.3. TIPOS DE MUESTREO PROBABILSTICO


5.3.1. SORTEO: Este es el muestreo probabilstico ms conocido. Para realizar un
muestreo es necesario que todos los sujetos de la poblacin estn
identificados por un cdigo y cuando se ejecuta el sorteo, todos los sujetos
deben tener la misma oportunidad de ser sorteados.
5.3.2. MUESTREO ALEATORIO SIMPLE: Para realizar muestreos de este tipo es
necesario disponer de una tabla de
nmeros aleatorios. Esta tabla es una
secuencia de dgitos que se generan en el
ms completo desorden, es decir, sin que
entre ellos exista ninguna correlacin. Se
realiza

desde

el

tradicional

procedimiento que consiste en escribir


en papelitos los cdigos de los sujetos de
la poblacin y hasta los mtodos ms sofisticados mediante la computadora.
Para seleccionar una muestra por este mtodo, deben darse las siguientes
condiciones:
Ser posible la enumeracin o codificacin de todos los miembros de la
poblacin en estudio.
Las caractersticas en estudio deben distribuirse en forma homognea
en toda la poblacin.
Si el tamao de la poblacin es una cifra de 3 dgitos, los nmeros se
leern de 3 en 3, si el tamao de la poblacin es una cifra de 4 dgitos,
los nmeros se leern de 4 en 4 y as respectivamente segn los dgitos
del tamao de la poblacin.
La lectura de los nmeros se puede realizar partiendo de cualquier fila
o columna de la tabla.
Supongamos

que

estuviramos

interesados

en

determinar

el

coeficiente

intelectual (CI) promedio de los alumnos de la Facultad de Ciencias Aplicadas de la


UNCP. Para realizar finalmente la seleccin, podramos utilizar una tabla de
Dgitos Aleatorios de nmeros como la que public Rand Corporation en 1955, de la
cual podramos utilizar una parte del milln de dgitos:
00000 10097 32533 76520 13586 34673 54876 80959 09117
00001 37542 04805 64894 74296 24805 24037 20636 10402

20

ESTADSTICA I

00002
00003
00004
00005
00006
00007
00008
00009

FACAP UNCP - 2015

08422
99019
12807
66065
31060
85269
63573
73796

68953
02529
99970
74717
10805
77602
32135
45753

19645
09376
80157
34072
45571
02051
05325
03529

09303
70715
36147
76850
82406
65692
47048
64778

ING. CLAUDIO LIMAYMANTA SULCA

23209
38311
64032
36697
35303
68665
90553
35808

02560
31165
36653
36170
42614
74818
57548
34282

15953
88676
98951
65813
86799
73053
28468
60935

34764
74364
16877
39885
07439
85247
28709
20344

Ejemplo:
Supongamos que queremos seleccionar una muestra aleatoria simple de 30 alumnos
de un total de 600, debemos asignar a cada alumno un nmero desde 001 hasta
600, luego elegimos al azar cualquier nmero de la tabla, el cual ser nuestro
punto de partida, por ejemplo, 37542, elegimos la direccin en que vamos a elegir
el segundo nmero (puede ser hacia la derecha o izquierda, hacia arriba o hacia
abajo) la cual se debe mantener para el 3er, el 4to y as sucesivamente hasta
completar los 30 estudiantes. En este caso elegimos hacia abajo.
Como los nmeros asignados de nuestra poblacin tienen solo tres cifras y la
mayor es 600, entonces tomamos cada vez las tres primeras cifras que sean
menores a 600. Como el nmero elegido es 37542, entonces el primer nmero de la
muestra ser: 375, el segundo 084, el tercero 128, etc.
Por lo tanto, los alumnos que pertenecern a nuestra muestra son los siguientes:
375
108
455
361
366

084
321
020
470
353

128
457
053
346
358

310
196
035
248
548

325
093
135
232
240

025
340
093
383
311

Si se requiere extraer varias muestras de una misma poblacin, es aconsejable


cambiar el punto de partida en la tabla.
5.3.3. MUESTREO SISTEMTICO: El muestreo sistemtico es una tcnica
diferente a la anterior. Para el caso se requiere listados de los sujetos que
puedan estar identificados por sus nombres o por sus cdigos numricos.
Para ello es preciso conocer el tamao de la poblacin (P) y el tamao de la
muestra (m). Este tipo de muestreo consiste en dividir a la poblacin entre
el nmero de la muestra requerida. En este caso
P
k
m

21

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo: Si tuviramos una poblacin de 950 y quisiramos seleccionar de ella


una muestra de 50 sujetos, procederamos de la siguiente manera:
950
k
19
50
El tamao de los intervalos que vamos a seleccionar es 19, es decir, tendremos
50 intervalos de tamao 19 cada uno.
Seleccionamos al azar un nmero entre 1 al 19; digamos que se eligi el nmero
12.
Seguidamente se aplica la constante a partir del 12, es decir, los otros
elementos de la muestra se obtendrn sumando 19 al anterior.
As, el segundo elemento de la muestra se obtiene sumando: 12 + 19 = 31
Luego el tercero sumando:

31 + 19 = 50

La muestra estar constituida por los elementos:


12
202
392
582
772

31
221
411
601
791

50
240
438
620
810

69
259
448
639
828

88
278
468
658
848

107
297
487
677
867

126
316
506
696
886

145
335
525
716
905

164
354
544
734
924

183
373
563
753
943

ste mtodo tiene la gran ventaja de entresacar a los sujetos de la muestra de


manera uniforme en toda la poblacin
5.3.4. MUESTREO ESTRATIFICADO:
El muestreo estratificado consiste en reducir la poblacin segn los
estratos que se hayan identificado, es decir, la poblacin esta dividido en
subconjuntos disjuntos marcadamente diferentes con relacin a las
variables en estudio. Cuando eso ocurre, para que la muestra sea
representativa se debe seleccionar

sujetos de cada uno de los

subconjuntos donde debe dividirse de acuerdo a las caractersticas del


objeto de estudio.
Ejemplo:
Sea el caso de la poblacin estudiantil de una universidad y se desea
estudiar las actitudes de afiliacin poltica de los estudiantes. Adems,
estratificar la poblacin sobre la base a que partido poltico pertenece:
Estrato 1: Accin Popular
Estrato 2: Partido Popular Cristiano.
Estrato 3: Per Posible
Estrato 4: Partido Aprista Peruano

22

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Estrato 5: Otros
Si todos los estratos son iguales, se seleccionarn el mismo nmero de
elementos para cada estrato, en caso contrario, la aportacin de cada
estrato es proporcional al tamao de ste con relacin a la poblacin.
Ejemplo:
Sea el caso de la poblacin escolar de la ciudad de Junn; se desea
estratificar la poblacin a partir de dos variables: Sexo de los estudiantes
y tipo de gestin de los Centros Educativos.
Cada variable tiene dos valores, entonces tendremos 4 estratos:
Estrato 1: Varones de los I. E. Estatales
Estrato 2: Mujeres de las I. E. Estatales
Estrato 3: Varones de las I. E. Particulares
Estrato 4: Mujeres de las I. E. Particulares
Estos estratos tienen cada uno sus respectivos tamaos, es decir, no todos
son iguales. Por ejemplo, si deseamos obtener una muestra de 300
estudiantes de una poblacin que ha sido dividida en 4 estratos como:
En el estrato 1 el 35 % de la poblacin
En el estrato 2 el 30 % de la poblacin
En el estrato 3 el 19 % de la poblacin
En el estrato 4 el 16 % de la poblacin
Por lo tanto, la muestra se conformara de la siguiente manera:
105 estudiantes en el estrato 1
90 estudiantes en el estrato 2
57 estudiantes en el estrato 3
48 estudiantes en el estrato 4
Como habr podido notar, el muestreo estratificado se utiliza cuando las
caractersticas en estudio no se distribuyen en forma homognea en toda
la poblacin, pero si en cada subconjunto disjunto o estrato.
5.3.5. MUESTREO POR CONGLOMERADOS:
Este tipo de muestreo que es para poblaciones muy grandes, consiste en
definir y delimitar los conglomerados y luego seleccionamos en forma
aleatoria uno de ellos para finalmente de l seleccionar tambin en forma
aleatoria los elementos que conformarn la muestra.
La diferencia de este tipo de muestreo con el estratificado radica en que
en este ltimo los sujetos se distribuyen en forma homognea en cada uno

23

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

de los estratos, siendo diferente los estratos, razn por la que se


seleccionan sujetos y datos de cada uno de ellos, y en el muestreo por
conglomerados se seleccionan los elementos que conformarn la muestra,
de un solo subconjunto, porque se considera que en cada uno de ellos se dan
todas las caractersticas de la poblacin.
Ejemplo:

Si

estamos

interesados

en

determinar las

preferencias

vocacionales de los estudiantes del quinto grado de educacin secundaria


de las I. E. nacionales de la Regin Centro, podramos seleccionar al azar
una de la Instituciones de esta regin y de l seleccionamos a los
estudiantes del quinto de secundaria.
5.4. TIPOS DE MUESTREO NO PROBABILSTICO
5.4.1. MUESTREO POR CUOTAS
Consiste en un muestreo de juicio, con la restriccin de que la muestra
incluye un nmero mnimo de cada subgrupo especfico dentro de la
poblacin; es cuando se desea obtener una muestra de una poblacin
organizada, piramidal o arborescente, como es el caso del sistema
educativo nacional, a cada escaln de la organizacin se le asigna cuotas.
Ejemplo: Se desea conocer el nmero de hijos de los padres de familia que
estudian en las regiones: Junn, Pasco, Huanuco, Huancavelica y Ayacucho,
con ese fin se realizar un muestreo por cuotas en las capitales de cada
regin. Se cuenta con los siguientes datos:
Capitales
Huancayo
Cerro de Pasco
Huanuco
Huancavelica
Ayacucho

Porcentajes N de hijos
20
47
20
25
20
63
20
15
20
42
100
191
El porcentaje de capitales no tiene que ser necesariamente igual
Ejemplo: Se desea hacer una investigacin a nivel nacional, sobre el
aprendizaje significativo durante los tres ltimos aos de los estudiantes
de educacin secundaria de menores, se estima que la poblacin estudiantil
sobrepasa los 2 millones y medio de estudiantes y se desea obtener una
muestra de 8000 estudiantes. Procedemos de la siguiente manera:

24

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Sabemos que el Per esta dividido en 25 regiones, asignamos cuotas a cada


una de las regiones, estas cuotas pueden ser proporcionales a la
importancia del nmero de alumnos matriculados o bien pueden ser iguales
para todos.
Supongamos que para el caso que se decidiera que fueran iguales, entonces
(8000/25 = 320) se asignan cuotas de 32 alumnos para cada regin;
seguidamente en cada una de las regiones, se asignarn nuevas cuotas para
ser cubiertas por cada una de las UGEL; luego, las autoridades haran el
reporte inverso, de abajo hacia arriba, y se lograra sumando las cuotas de
las regiones, para obtener la muestra de los 320 estudiantes para el
estudio.
5.4.2. MUESTREO POR CRITERIO O JUICIO DE EXPERTOS
La caracterstica principal de este tipo de muestreo es que tanto el tamao
de muestra como la eleccin de los elementos estn sujetos al juicio del
investigador, esto es, para realizar un estudio mediante este tipo de
muestreo debe recurrirse a la experiencia que se tenga. El xito y la
eficacia dependen de la opinin del investigador que haya seleccionado los
elementos.
Hay situaciones en las que el muestreo de juicio es til y aconsejable,
cuando el muestreo probabilstica no es factible o resulta costoso.
El juicio de expertos es el criterio de seleccin que maneja un profesional
especializado. El experto decide que sujetos van a participar en la muestra.
Si por ejemplo se convoca a nivel de la Regin Junn un Concurso de
Matemtica, sern los profesores de matemtica quienes debern emitir su
opinin o seleccionar ellos a los mejores estudiantes.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilstica
Muestreo

CARACTERISTICAS

VENTAJAS

INCONVENIENTES

25

ESTADSTICA I

FACAP UNCP - 2015

Se selecciona una muestra de


tamao n de una poblacin de
N unidades, cada elemento
tiene una probabilidad de
Aleatorio simple inclusin igual y conocida de
n/N.

ING. CLAUDIO LIMAYMANTA SULCA

Sencillo

de

fcil Requiere que se posea


de antemano un listado

comprensin.

Clculo rpido de medias completo


poblacin.

y varianzas.
Se

basa en la teora trabaja


paquetes no

Cuando

con

la
se

muestras

represente

la

para poblacin

informticos

adecuadamente.

analizar los datos


Conseguir un listado de los N

Fcil de aplicar.

elementos de la poblacin

No siempre es necesario muestreo est asociada

Si

Determinar tamao muestral

tener un listado de toda con

n.

la poblacin.

Definir un intervalo k= N/n.

la

constante

el

de

fenmeno

de

inters,

las

Cuando la poblacin est estimaciones obtenidas

Elegir un nmero aleatorio, r,

ordenada siguiendo una a partir de la muestra

entre 1 y k (r= arranque

tendencia

aleatorio).

asegura una cobertura de de seleccin

Seleccionar los elementos de

unidades de todos los

la lista.

tipos.

En ciertas ocasiones resultar


conveniente
muestra

estratificar
segn

la

ciertas

conocida, pueden contener sesgo

Tiende a asegurar que la Se ha de conocer la


muestra

represente distribucin

adecuadamente

en

la poblacin

la

de

las

variables de inters. Para ello

poblacin en funcin de variables utilizadas para

debemos

unas

conocer

la

composicin estratificada de
la poblacin objetivo a hacer
Estratificado

toda

estadstica, y por tanto pequeas es posible que


existen

Sistemtico

de

un

muestreo.

Una

vez

calculado el tamao muestral

variables la estratificacin.

seleccionadas.
Se obtienen estimaciones
ms precisa.
Su objetivo es conseguir

apropiado, este se reparte de

una

manera proporcional entre los

semejante posible a la

distintos estratos definidos

poblacin en lo que a la o

en la poblacin usando una

las

simple regla de tres.

estratificadoras

muestra

lo

ms

variables
se

refiere.
Se realizan varias fases de Es muy eficiente cuando
muestreo

sucesivas

(polietpico)
Conglomerados

la

poblacin

es

muy

grande y dispersa.

El error estndar es
mayor

que

muestreo

en

aleatorio

La necesidad de listados de No es preciso tener un

simple

las unidades de una etapa se

listado

estratificado.

limita a aquellas unidades de

poblacin,

muestreo seleccionadas en la

unidades

etapa anterior.

muestreo.

de

toda

la

de

las

primarias

de

slo

el
o

El clculo del error


estndar

es

complejo.

26

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

ACTIVIDADES PARA RESOLVER POR LOS ALUMNOS


1. Son representativas las siguientes muestras? Explique

a. El editor de una revista desea predecir el resultado de la siguiente eleccin


presidencial y con esta finalidad entrevista a 1000 suscriptores de su revista para
determinar sus preferencias al votar.
b. Se entrevista a los estudiantes de una clase de estadstica acerca de sus actitudes
hacia la legalizacin del aborto; sus respuestas se utilizarn para predecir la opinin
de la comunidad universitaria en lo referente a este problemas.
2. Una organizacin no lucrativa est efectuando una encuesta domiciliaria de opinin sobre
los servicios que presta la municipalidad a la comunidad. La organizacin a ideado un
esquema para realizar el muestreo aleatorio de las casas y planea efectuar la encuesta
los das laborables desde las 12 a.m. hasta las 5 p.m. Producir este esquema una
muestra aleatoria?
3. Debera utilizarse muestreo estratificado o muestreo por conglomerados, y como? para
obtener una muestra aleatoria en cada una de las siguientes situaciones.
a. Se realiza un estudio para determinar el patrn de gastos familiares en cierta ciudad.
b. SE realiza una encuesta para determinar la actitud de los estudiantes universitarios
del Per, con respecto a la pena capital.
4. El Centro Federado de Estudiantes de la facultad de Ciencias Aplicadas informa que el
50 % de las alumnas de la Facultad se han casado con sus profesores. Existe algn
defecto en la informacin?

II CAPTULO
II.

ORGANIZACIN Y CLASIFICACIN DE DATOS


Frente a un conjunto de datos, el primer paso a dar,
debe ser expresarlo y clasificarlo de acuerdo a criterios
convenientes, en alguna forma simple que permita ver
rpidamente todas las caractersticas posibles para
obtener conclusiones tiles, ya sea directamente o por
medio de clculos posteriores. Se consideran los
siguientes pasos:

27

ESTADSTICA I

a)
b)
c)

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Revisin y correccin de los datos.


Construccin de Tablas de Frecuencias
Representacin tabular o cuadros estadsticos y grficos.

II.1. REVISIN Y CORRECCIN DE LOS DATOS


Ningn anlisis estadstico, por acabado y seguro que sea es capaz de suministrar
respuestas adecuadas a un problema de estudio, si aquel se basa en una informacin
incorrecta. De aqu que la revisin y correccin de la informacin recolectada debe ser
obligatoriamente el paso previo a la clasificacin y computacin de los datos.
Una regla emprica ampliamente contrastada (Huber 1984) es esperar entre un 2 % y un
5 % de observaciones con errores de medicin, trascripcin, etc. Por tanto antes de
utilizar los datos muestrales conviene aplicar tcnicas simples para probarlos, como dar
respuestas a las siguientes preguntas:
1. Los datos apoyan o contradicen otra evidencia que tengamos?
2. Es lgica la conclusin? Hemos obtenido conclusiones que no estn sustentados
por los datos?
3. Cuntas observaciones se tiene? Ellas representan a todos los grupos que se
desea estudiar?
II.2. DESCRIPCIN Y ELABORACIN DE UNA TABLA DE FRECUENCIAS
Al realizar las observaciones de un hecho estadstico, se obtienen un conjunto de datos
desordenados y en estos casos no se puede realizar un juicio razonable de dicho
fenmeno, si los datos que se disponen son numerosos, es necesario clasificarlos en un
cuadro o tabla resumen de las observaciones originales, para tratar dicho fenmeno se
puede actuar de dos maneras:
Elaborar una tabla de Frecuencias para datos discretos en clases
Elaborar una tabla de Frecuencias para datos no agrupados en intervalos de clase.
Elaborar una tabla de frecuencias para datos agrupados en intervalos de clase.
Tabulacin: puede ser a travs de una serie simple, con la presentacin de los datos
recogidos en forma de tabla ordenada, o a travs de la agrupacin de datos, este mtodo
se utiliza cuando el nmero de observaciones es muy grande.
Ejemplo: En un curso de 40 alumnos, se desea estudiar el comportamiento de la variable
estatura, registrndose los siguientes valores:

28

ESTADSTICA I

FACAP UNCP - 2015

II.2.1.

ING. CLAUDIO LIMAYMANTA SULCA

TABLA DE DATOS CON VARIABLES DISCRETAS.


Es aquel dato de una variable cuantitativa que toma solo valores enteros positivos,
surgen solo por el procedimiento de conteo. 0,1,2,.n.
Sean x1, x2, ., xn un conjunto de n observaciones discretas y sean y1, y2, ., ym el
conjunto de valores diferentes que toman los datos originales (mn).
Si los datos que se disponen son numerosos, es indispensable clasificarlos en un
cuadro o tabla resumen de las observaciones originales, a las que en adelante
llamaremos Tabla de Distribucin de Frecuencias o simplemente Tabla de
Frecuencias.
Ejemplo de Variables Discretas: Nmero de alumnos de un centro educativo,
Nmero de docentes de la UNCP, Nmero de habitantes por distrito, Nmero de
hijos de una familia.

Clculos realizados en una Tabla de Distribucin de Frecuencias:


a) Frecuencia Absoluta (ni fi): Se llama frecuencia absoluta del valor yi, al nmero de
veces que se repite este valor en el conjunto de observaciones. Donde: i = 1, 2, 3, 4,...m.
Entonces la tabla de distribucin de frecuencias absolutas toma la forma siguiente:
Valores Diferentes
Observados (yi)
m

n
j 1

y2 n
.
.
ym

Total

Frecuencias Absolutas
(ni)
n1
n2
.
.
nm
n

b) Frecuencia Absoluta Acumulada Menor que (Ni Fi): correspondiente al valor yi, al
nmero de observaciones menores o iguales a yi, donde:
Ni = n1 + n2 + n3 + ......+ nm
m

Ni n j
j 1

As tenemos:

29

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

N 1 n j n1

N 2 n j n1 n 2 N1 n2

j 1

j 1

N 3 n j n1 n 2 n3 N 2 n3

N 4 n j n1 n2 n3 n4 N 3 n4

j 1

j 1

c) Frecuencia Absoluta Acumulada Mayor que (Ni* Fi*): correspondiente al valor yi, al
nmero de observaciones mayores o iguales a yi.
Se denota por:
Ni* = ni + ni+1 + ..... + nm
m

N i* n j

En notacin de sumatoria:

j 1

As tenemos:
5

N 1* n j n1 n2 n3 n4 n5

N 2* n j n2 n3 n4 n5

j 1

j 2

N 3* n j n3 n 4 n5

N 4* n j n 4 n5

j 3

j 4

N 5* n j n5
j 5

d) Frecuencia Relativa (hi): Correspondiente al valor yi, es el cociente de la Frecuencia


absoluta ni, y el nmero total de observaciones (n).
m

n
hi i
n

h
j 1

As tenemos:

h1

n1
n

h2

n2
n

h3

n3
n

h4

n4
n

h5

n5
n

e) Frecuencia Relativa Acumulada Menor que (Hi): Correspondiente al valor yi, a la


frecuencia relativa total de las observaciones menores o iguales a yi.
Se denota por:

H i h1 h2 .... hm

n1 n2
n
n n2 .... nm
.... m 1
n n
n
n

Por notacin de sumatoria.


m

Hi hj
j 1

f) Frecuencia Relativa Acumulada Mayor que (Hi*): Correspondiente al valor yi, a la


frecuencia total de las observaciones mayores o iguales a yi.
Se denota por:
H i* hi hi 1 hi 2 .... hm

30

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

H i* h j

En notacin de sumatoria:

j 1

As tenemos:
5

H 1* h j h1 h2 h3 h4 h5

H 2* h j h2 h3 h4 h5

j 1
5

H 3* h j h3 h4 h5
j 3

j 2

H 4* h j h4 h5

H 5* h j h5

j 4

j 5

g) Frecuencia Relativa Porcentual (hi%): Es la frecuencia relativa hi multiplicada por 100 y


representa el porcentaje de observaciones que corresponde al valor yi.
La frecuencia porcentual estar comprendida entre 0 y 100 y se denota por:
Pi = 100 hi
%h1 = 100.h1
%h3 = 100.h3
%h5 = 100.h5
%h2 = 100.h2
%h4 = 100.h4
h) Frecuencia Relativa Acumulada Porcentual (Hi): a la frecuencia relativa acumulada Hi
multiplicada por 100. Es decir, 100.%Hi, y representa el porcentaje de observaciones
menores o iguales a yi.
Ejemplo:
%Hi = 100 Hi
%H1 = 100.H1
%H2 = 100.H2

%H3 = 100.H3
%H4 = 100.H4

%H5 = 100.H5

Problema Resuelto
1. Se realiza la encuesta a un conjunto de 16 familias sobre el nmero de hijos que tienen; los
resultados en el orden obtenido es:
x1 = 2
x9 = 2

x2 = 1
x10 = 1

x3 = 3
x11 = 2

x4 = 1
x12 = 3

x5 = 2
x13 = 4

x6 = 1
x14 = 1

x7 = 3
x15 = 1

x8 = 0
x16= 2

a) Construya una tabla de distribucin de frecuencias para estos datos discretos.


b) Interprete cada frecuencia obtenida.
Solucin:
a)
Vemos que el conjunto de observaciones (N de datos) es de tamao 16, o sea: n = 16
Luego identificamos el nmero de observaciones diferentes, m = 5
y1 = 0
y2 = 1
y3 = 2
y4 = 3
y5 = 4
Los cuales se ubican en el orden de arriba hacia abajo en la Tabla de frecuencias

31

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Hallamos ahora el nmero de repeticiones de cada dato, o sea, determinamos la frecuencia


absoluta (ni):
n1 = 1
n2 = 6
n3 = 5
n4 = 3
n5 = 1
b) Interpretacin de las frecuencias:

n1 = 1; significa que, una familia encuestada no tiene ningn hijo


n2 = 6; significa que, 6 familias encuestadas tienen un hijo cada una
N2 = 7, familias encuestadas tienen 1 hijo cada una o menos.
N4 = 15, familias encuestadas tienen 3 hijos cada una o menos.
N3* = 9, familias tienen 2 hijos o ms.
h5 = 0,0623, es la proporcin de familias que tienen 4 hijos cada una.
h2 = 0,3750, es la proporcin de familias que tienen un hijo cada una.
H3 = 0,75, es la proporcin de familias que tienen 2 hijos o menos.
H2* = 0,9375, es la proporcin de familias que tienen un hijo cada una o ms.
H3% = 31,25; es el porcentaje de familias que tienen 2 hijos cada una.
H4% = 93,75; es el porcentaje de familias que tienen 3 hijos o menos.

2. Problema:
Sean los calificativos de veinte estudiantes en la asignatura de Estadstica: 13, 06, 15, 10, 14,
10, 10, 13, 12, 12, 09, 12, 15, 09, 11, 09, 11, 07, 11, 12. Elabore la tabla de Frecuencias de datos
discretos.

PROPIEDADES DE LAS FRECUENCIAS


A. Las frecuencias absolutas y las frecuencias acumuladas son siempre enteros no negativos.
Es decir:
ni 0
Ni 0
N i* 0
Para: i = 1, 2, 3, ., m
B. La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de
observaciones, o sea:
m

n
i 1

n1 n 2 n3 ..... nm = n

C. Las frecuentas relativas y las frecuencias relativas acumuladas son siempre nmeros
fraccionarios no negativos, no mayores que uno. Es decir:
0 hi 1
0 Hi 1
0 H i* 1
Para: i = 1, 2, 3, .., m

D. La frecuencia absoluta acumulada MENOR QUE correspondiente al valor ym coincide con el


nmero total del conjunto de observaciones. O sea:
m

N m ni n
i 1

32

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

E. La frecuencia absoluta acumulada MAYOR QUE correspondiente al valor y1 coincide con el


nmero total del conjunto de datos. Es decir:
m

N 1* ni n
i 1

F. La frecuencia relativa acumulada MENOR QUE correspondiente al valor ym coincide con la


unidad. Es decir:
m

H m hi 1
i 1

G. La frecuencia relativa acumulada MAYOR QUE correspondiente al valor y1 coincide con la


unidad, o sea:
m

H 1* hi 1
i 1

H. La frecuencia absoluta acumulada MENOR QUE correspondiente al valor y1 es n1. Es decir:


1

N1 ni n1
i 1

I. La frecuencia absoluta acumulada MAYOR QUE correspondiente al valor ym es nm. O sea:


m

N m* ni nm
i 1

J. La frecuencia relativa acumulada MENOR QUE correspondiente al valor y1 es h1. Es decir:


m

H 1 hi h1
i 1

K. La frecuencia relativa acumulada MAYOR QUE correspondiente al valor ym, es hm. O sea:
m

H m* hi hm
i 1

El conocimiento de estas propiedades sirve para controlar la correcta confeccin de las tablas de
frecuencia.

Problemas para Resolver por el alumno


Ejercicio 1: En la tabla de frecuencias que se da a continuacin faltan algunos datos compltala
utilizando las propiedades mencionadas:

Yi
ni Ni hi
0
2
1
5
2
9
3
14
4
0,2
5
total

Hi

0,70

33

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejercicio 2: Un Administrador de Empresas visita 25 Cooperativas Agrarias de naranjas en el valle


de La Merced y en cada una de ellas anoto el nmero de miles de soles que se emplean para la
produccin de cada una de ellas, los datos son los siguientes:
15
16
18
19
19

20
17
18
16
18

25
18
19
17
19

15
20
16
17
18

18
18
17
17
15

a)
b)
c)
d)

Diga que tipos de datos son estos.


Construya una tabla de distribucin de frecuencias, adecuada a este conjunto de valores.
Cuntas cooperativas, tienen a lo ms 20 mil soles en produccin de naranjas?
Cuntas cooperativas agrarias tiene por lo menos 17 mil soles en la produccin de
naranjas?
e) Qu proporcin de cooperativas bajo estudio tienen una produccin de 18 mil soles en su
produccin?
f) Qu proporcin de cooperativas tienen 18 mil o menos en la produccin de naranjas?
g) Qu porcentaje de cooperativas tienen 18 mil o menos en su produccin de naranjas?

II.2.2.

TABLA DE DATOS CON VARIABLES CONTINUAS


Es el conjunto original de datos u observaciones por x 1, x2, ...., xn, siendo n el
tamao del conjunto (tamao muestral) y donde estos datos son del tipo continuo.
En este caso debido a que la magnitud de las caractersticas pueda tomar, no es tan
simple elaborar una tabla de distribucin de frecuencias, es ms bien un problema
de clasificacin de datos donde el investigador o estadista debe tomar decisiones.
Clases: Se denomina clases a cada uno de los grupos en que se divide el conjunto
de datos.
El primer paso para resolver este problema de clasificacin, es decidir cules y
cuntas han de ser las clases a considerarse. Para ellos normalmente se empieza
por determinar la observacin que tiene el valor mximo Xmax y la observacin
que tiene el valor mnimo Xmin; con estos valores obtendremos el Recorrido o
Rango del conjunto de observaciones.
* Intervalos de clase (m).- Es cada uno de los grupos en que se divide el conjunto
de datos. En la cual: i = 1, 2, 3,., m
Variable
Conteo ni Ni hi Hi %hi %Hi
'
y i 1
--

y 0'

y 0' --- y1'


34

ESTADSTICA I

FACAP UNCP - 2015

y1'

ING. CLAUDIO LIMAYMANTA SULCA

---

y 2'
y 2'

---

y 3'
:
'
ym
1

:
---

'
ym
Total

* Recorrido o Rango (R).- Es la amplitud o longitud del recorrido del conjunto de


datos.
R = xmax x min.
* Nmero de Intervalos de clase (m).- Es la cantidad de filas m del conjunto de
datos.
yi-1 yi
Donde: i = 1, 2, ...., m.
m se puede hallar de diferentes maneras:
1) m n
2) Regla de Sturges: m = 1 + 3,3 log (n)

recomendable para: 5 m 20

* Marca de Clase (yi).- Es el punto medio del intervalo que representa a dicha clase.

yi

y i' 1 y i'
2

Donde: i = 1, 2, 3,., m

* Amplitud de Clase (c): Es la longitud del intervalo que define la clase. Es decir:
ci y i' y i' 1
Donde:
i = 1, 2, 3, ., m
As:
c1 y1' y 0'

Longitud del primer intervalo de clase

c2 y y

Longitud del segundo intervalo de clase

'
2

'
1

Si los intervalos tienen igual longitud c, entonces:

R
m

CONSTRUCCIN DE LOS INTERVALOS DE CLASE:


'
Los intervalos de clase se construyen partiendo de x min o y 0 , luego se va asignando

consecutivamente a las clases, lmite inferior y superior de clases (yi-1 yi), de la siguiente
manera:
Lmite Inferior
Lmite Superior
'
'
y1 x min c y 0' c
1er Int. y 0 x min
'
'
2) y1 x min c y 0 c

y 2' x min 2c y1' c

'
'
3) y 2 x min 2c y 0 2c

y 3' x min 3c y 2' c

'
'
4) y 3 x min 3c y 2 c

y 4' x min 4c y 3' c

'
'
5) y 4 x min 4c y 3 c

y 5 x min 5c y 4' c

35

ESTADSTICA I

FACAP UNCP - 2015

'
m) y m 1 x min ( m 1)c

Variable
'
[ y i 1 --

ING. CLAUDIO LIMAYMANTA SULCA

y m' x min mc x max


Marca de Clase
yi

ni

Ni

hi

Hi

%hi

Y1
Y2
Y3
Y4
:
:
ym

ni
n2
n3
n4
:
:
nm

N1
N2
N3
N4
:
:
Nm

h1
h2
h3
h4
:
:
hm

H1
H2
H3
H4
:
:
Hm

%h1
%h2
%h3
%h4
:
:
%hm

'
0

y >

y 0'

---

y1'
y1'

---

y 2'
y 2'

---

y 3'
:
:
'
y m 1 -'
ym
Total

II.2.3.

REGLA GENERAL PARA ELABORAR


FRECUENCIAS DE DATOS CONTINUOS
1.

LAS

DISTRIBUCIONES

DE

Decidir el nmero de clases (m) a determinar.


Respecto al nmero de clases (m) no existe un consenso unnime entre los
autores, Bradford Hill seala que debe tomarse un nmero de clases
comprendido entre 10 y 20, mientras que Camel indica que el nmero
apropiado es entre 8 y 15. Sin embargo el sentido comn nos dice que el
nmero de clases no deben ser pocas debido a que la condensacin sera
mucha y con ello habra prdidas de informacin fuerte en relacin con la
contenida en el conjunto de datos originales. Por otra parte un nmero excesivo
de clases, si bien produce poca prdida de informacin no reduce o simplifica el
trabajo, siendo en ocasiones preferible el trabajo con los propios datos
originales. Tambin algunas pueden resultar vacas o con frecuencias nulas.
Mencionaremos algunas reglas:

a) m = 2n, igualar el resultado al entero ms prximo. n = nmero de datos.


b) m n, donde n = nmero de observaciones.
c) Regla de Sturges; m = 1 + 3,3 log (n) donde; n = nmero de observaciones.
En general se recomienda que el nmero de clases este entre:
5 m 20
2. Determinar el recorrido o rango de los datos y la amplitud (l) del recorrido.
R = xmax. - x min

36

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

3. Determinar la amplitud o la longitud de los intervalos de clase.


C = R/m
4. Determinar los lmites de clase, de manera que cada observacin se clasifique sin
ambigedades en una sola clase.
y0 = xmin.
y3 = y2 + c
y1 = y0 + c
y4 = y3 + c
y2 = y1 + c
y5 = y4 + c
5.

Determinamos las marcas de clases (yi):

y1
6.

y 0' y1'
2

y2

y1' y 2'
2

y3

y 2' y 3'
2

y4

y 3' y 4'
2

Por ltimo determinamos la frecuencia absoluta de cada clase, teniendo en cuenta que
estamos considerando intervalos de clase abiertos a la derecha y cerrados a la
izquierda, es decir:
yi-1 - yi [ yi-1 , yi >
*
Al elaborar la tabla de frecuencias de datos de variables continuos, siempre hay una
ligera prdida de informacin, que ocurre al no considerar ms los datos individuales, sino
la marca de clase (punto medio de cada clase) como un valor representativo de cada clase.
As, yi representa a todas las observaciones mayores o iguales a y0 y menores que yi. Sin
embargo esta prdida de informacin queda compensada por la ganancia en concisin,
sencillez y claridad.
Ejercicio para resolver por el docente:
En el mercado de Tarma se realiz una inspeccin en pesos (Kg.) de 50 sacos de papas, para
saber si contenan el peso completo (100 Kg.), la muestra fue obtenida de la produccin
semanal del distrito de Huasahuasi, de acuerdo a estos datos el alumno elaborar y clasificar
una tabla de frecuencias con 5 clases de amplitud (m) y con los resultados que son
representativos de toda la poblacin de produccin de papas de dicho distrito, el alumno
informar lo siguiente:
a) Cual es el mayor tanto por ciento de sacos que pesan entre 93,5 y 94,5.

b) Si el peso apropiado de los sacos para su aceptacin en el mercado es como mnimo 93,5
Kg. (de la columna 100H3), que har con el resto la comunidad?
94,3
92,9
94,2
94,7
94,1

93,7
92,7
95,7
93,6
93,0

94,7
95,0
94,2
95,7
95,5

94,3
93,0
93,8
93,7
95,3

92,4
94,0
92,7
94,8
92,9

94,5
93,9
94,4
93,7
93,9

92,8
93,6
96,2
92,7
92,7

95,4
93,3
91,6
93,2
94,6

93,6
92,3
93,6
93,7
94,6

95,5
93,7
91,9
96,4
94,4

Ejemplos para resolver por el alumno:


Ejemplo 1. Suponer que la siguiente tabla de distribucin de frecuencias representa los salarios de
los trabajadores de construccin civil de la ciudad de Tarma, el sindicato de construccin civil

37

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

solicita que en el nuevo pacto colectivo se establezca un salario mnimo de S/. 14,00, que
porcentaje de trabajadores se beneficia con este pacto, construya la tabla de frecuencias.
SALARIOS DIARIOS (s/. )
De 8
a
12
De 12
a
16
De 16
a
20
De 20
a
24
De 24
a
28

FRECUENCIA
36
42
51
66
57

Lmites Reales o verdaderos de intervalos de clase.- El lmite real de un intervalo de clase es


igual al valor aparente ms o menos la mitad de la medida utilizada.
Ejemplo 2
Con las cuotas anuales (en soles) de 40 compaas para un seguro de vida de S/. 25 000, para
hombres de 60 aos de edad se ha formado una tabla de frecuencias cuyos intervalos de clases
son:
82 87; 87 92; 92 97; 97 102; 102 107; 107 112
Determine los nmeros reales de clase.
La cuota de S/. 82 se interpreta como el valor al cual se han redondeado cuotas comprendidas
entre S/. 81,50 y 82,49, similarmente los otros lmites de clase. Entonces los 6 intervalos
reales de clase son:
81,5 87,5 ; 87,5 92,5 ; 92,5 97,5 ..etc.
Ejemplo 3.
En la siguiente tabla de frecuencias que se da, faltan algunos datos, compltalas:
yi-1 - yi
30 - 34
--------------50

yi

Ni

hi

Ni

11

Hi
0,10
0,25
0,55
0,85
1.00

Ejemplo 4.
En cierta tabla de frecuencias se perdi informacin del ingreso diario en cientos de soles de una
agencia de turismo y solo quedaron algunos datos, reconstruir la tabla de frecuencias:
H3 h2 = 0,26

c = constante

H5 = 0, 20

h6 = 4 / 100 = H1

y2 = 550
m=6

h2 = 0,14

y5 = 850

H4 = 0, 76

Ejemplo 5.
La inversin real en miles de soles anuales de un grupo de pequeas empresas fueron:

38

ESTADSTICA I

FACAP UNCP - 2015

10
16
13
0
12

12
20
17
14
6

8
25
21
6
5

40
28
7
8
5

6
30
6
9
6

8
26
8
11
8

ING. CLAUDIO LIMAYMANTA SULCA

10
30
14
13
7

30
4
7
15
12

2
6
15
18
15

8
10
19
20
36

6
18
27
30
39

14
17
22
60
52

Se pide:
a. Formar una tabla de todas las distribuciones de frecuencias con intervalos de amplitud
constante.
b. El nmero de pequeas empresas con inversiones menores de 40 mil soles.
c. El nmero de pequeas empresas que han invertido 40 mil soles o ms.
d. El nmero de pequeas empresas que invirtieron 10 mil soles o ms pero menos de 35 mil
soles.
e. La proporcin de pequeas empresas con inversiones menores de 8 mil soles
f. La proporcin de pequeas empresas que invirtieron por lo menos 20 mil soles, pero a lo mas
38 mil soles.
g. El porcentaje de pequeas empresas que han invertido entre 6 mil soles y 30 mil soles
inclusive.
h. El porcentaje de pequeas empresas que invirtieron ms de 64 mil soles.

Ejemplo 6:
En la tabla de frecuencias que se da a continuacin faltan algunos datos, compltalas:

y i' 1
y i'
20 24
24 28
28 32
32 36
36 - 40

-- yi ni Ni

11

hi Hi

%hi %Hi

0,10
0,25
0,55
0,85
1.00

II.2.4. SIMETRIA DE UNA TABLA DE DISTRIBUCIN DE FRECUENCIAS

1) Una tabla de distribucin de frecuencias que tiene un nmero impar de (m = 2k 1) clases,


se dice que es simtrica, si las clases equidistantes de la clase central tienen frecuencias
iguales. Es decir, si las frecuencias absolutas cumplen la relacin:
nk j nk j
, 1 j k 1
2) Una tabla de distribucin de frecuencias que tiene un numero par (m = 2k) de clases, se
dice que es simtrica, si las dos clases centrales tienen frecuencias iguales y las clases
equidistantes de stas centrales tienen tambin frecuencias iguales.

39

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo: En una tabla de distribucin simtrica con siete intervalos de clases de igual amplitud, se
conocen los datos siguientes:
c = 10;
n1 = 8
y3n3 = 1260,
n2 + n5 = 62,
h3 = 0,21 y H4 = 0,96
Se pide reconstruir la tabla de distribucin de frecuencias
Solucin:
1. Datos:

m = 7 = 2k -1,

Entonces para:
n 41 n3 n5 n 41
j = 1;
n 4 2 n 2 n6 n 4 2
j=2
n 43 n1 n7 n 43

j=3

Por tanto: n1 = n7 = 8
2. Evidentemente, en tablas simtricas de distribucin de frecuencias, las relaciones entre las
frecuencias relativas son las mismas que hay entre las frecuencias absolutas. Es decir, en este
caso:
hk j hk j
1 j k 1,
con: k = 4
As pues, para:

j = 1;
j = 2;
j = 3;
Luego:

h3 = h5
h2 = h6
h1 = h7
h3 = h5 = 0,21

3. Hallando las frecuencias relativas:

Por propiedades:

1 = H7 = H6 + h7 = 0,96 + h7
De donde:
h7 = 1 0,96 = 0,04
Es decir:
h1 = h7 = 0,04
4. Hallando el Nmero total de datos:

h1

n1 8
0,04
n n

De donde:

8
200
0,04

5. Hallando las Frecuencias Absolutas:


De 2) y la ecuacin: ni = nhi
Se tiene:

n3 = n5 = 200 (0,21) = 42

6. Hallando las frecuencias relativas faltantes:

40

ESTADSTICA I

FACAP UNCP - 2015

De datos y 5):
n2 + n5 = n2 + 42 = 62
Por tanto:
h2 = h6 = 20/200 = 0,10

ING. CLAUDIO LIMAYMANTA SULCA

de donde:

n2 = n6 = 20

7. Completando las frecuencias relativas simples y acumuladas:


As:

0,96 = H6 = H5 + h6 = H5 + 0,10

Es decir: H5 = 0,96 0,10 = 0,86

0,86 = H5 = H4 + h5 = H4 + 0,21

De donde:

H4 = 0,86 0,21 = 0,65


0,65 = H4 = H3 + h4 = 0,35 + h4

Luego:

h4 = 0,65 0,35 = 0,30

Por tanto:

n4 = nh4 = 200(0,30) = 60

8. Hallando los intervalos de clases:


De los datos:
1260 = y3n3 = y3(42)
luego:
y3 = 1260/42 = 30
Pero:

60 2 y 0' 50
Como:

y 2' y 3' y 0' 2c y 0' 3c 2 y 0' 5c


30 y3

2
2
2
De donde:

y 0' 5 y

y 0' 5

c =10,

Se construye los intervalos de clases, quedando:

y i' 1 --

yi

Ni

hi

Ni

Hi

y i'
5 15
15 25
25 35
35 45
45 55
55 65
65 75
Totales

10
20
30
40
50
60
70

8
20
42
60
42
20
8
200

0,04
0,10
0,21
0,30
0,21
0,10
0,04
1.00

8
28
70
130
172
192
200

0,04
0,14
0,35
0,65
0,86
0,96
1.00

%hi %Hi

Ejercicio para el estudiante:


De una tabla de distribucin de frecuencias absolutas con 5 intervalos de clase de igual amplitud
se sabe:
a) Sus marcas de clase forman una progresin aritmtica cuya suma es 45 y ltimo termino 15.
b) Las 3 primeras frecuencias absolutas forman una progresin geomtrica y las tres ltimas una
progresin aritmtica.
c) El producto de la primera y la tercera frecuencia absoluta es 100.
d) El producto de la tercera y quinta frecuencia absoluta es 480.
e) La diferencia comn de la progresin aritmtica y la razn de la progresin geomtrica son
iguales.

41

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Reconstruir la tabla de distribucin de frecuencias.


II.2.5. TABLA DE DATOS CON VARIABLES CUALITATIVAS
Este tipo de variables representan una cualidad o atributo que clasifica a cada caso
en varias categoras. La situacin ms sencilla es aquella en la que se clasifica cada
caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son
datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de
clasificacin no es suficiente y se requiere de un mayor nmero de categoras (color
de los ojos, grupo sanguneo, profesin, etctera).
En el caso de datos cualitativos, la tabla de distribucin de frecuencias adoptar la
forma siguiente:
Variable

Frecuencia Frecuencia Frecuencia


Absoluta
Relativa
Relativa
Porcentual
Caracterstica A
nA
hA
%hA
Caracterstica B
nB
hb
%hB
:
:
:
:
:
:
:
:
Caracterstica Z
nZ
hZ
%hZ
Ejemplo: Una revista muy conocida efectu una encuesta respecto a lo adecuado de la proteccin
policial de patrimonios culturales en la ciudad. Se seleccion un total de 419 personas en una
muestra aleatoria simple. Los siguientes datos reflejan las respuestas de las personas
encuestadas a la pregunta Es adecuada la proteccin policial de patrimonios culturales en su
ciudad?
Respuestas
Si
No
No opina
Total

Frecuencia
Absoluta
293
80
46
419

a) Qu proporcin de personas no opinan?


b) Qu porcentaje de personas contestaron Si?

Problemas para resolver por el alumno:


1. Cuando se construye una distribucin de frecuencias, el nmero de clases que se usan
depende de:
a) Nmero de datos
b) Intervalos de los datos reunidos
c) Tamao de la poblacin
d) Todas las anteriores
2. Explique la diferencia entre distribuciones de frecuencias relativas y de porcentajes.

42

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

3. A continuacin se transcriben las edades de 50 integrantes de un programa de Servicio Social


del Gobierno Peruano:

81
66
43
39
92

53
88
54
87
72

67
67
76
76
82

60
65
70
97
80

80
52
97
86
70

64
72
68
45
65

56
74
82
60
50

54
65
75
45
58

91
73
79
65
70

61
69
60
76
56

Construya con estos datos las distribuciones de frecuencia relativa usando 7 y 13 intervalos de
clases iguales. Las polticas estatales de los programas de servicio social exigen que
aproximadamente el 40 % de los participantes del programa sean mayores de 50 aos.
a) Se ajusta el programa a esa poltica?
b) Cul de las distribuciones de frecuencia relativa le ayuda a contestar mejor la parte a)
c) Suponga que el Director de los servicios sociales quiera conocer la proporcin de
participantes en la empresa cuya edad flucta entre 45 y 80 aos. Con cul de las dos
distribuciones podra estimar mejor la respuesta el director?
4. La compaa SPEEDY, una empresa situada en Arequipa, muestre sus registros de
embarque durante cierto da, obteniendo los siguientes resultados:
TIEMPO TRANSCURRIDO DESDE LA RECEPCIN DE LA ORDEN HASTA LA
ENTREGA (EN DAS)
4 12 8 14 11 6
7 13 13 11
11 20 5 19 10 15 24 7 29 6
Construya una distribucin de frecuencias para los datos anteriores y una distribucin
de frecuencia relativa. Use intervalos de 6 das.
a. Qu afirmacin puede hacer sobre la eficacia del procesamiento de pedidos a
partir de la distribucin de frecuencia?
b. Si la compaa quiere asegurarse de que la mitad de sus entregas se realicen en 10 a
menos das, Puede usted determinar mediante la distribucin de frecuencias si la
compaa ha alcanzado su meta?
5. Las marcas de clase de una distribucin de frecuencias con intervalos de clase de igual
amplitud son: 46, 55, 64, 73, 82, 91. Halle:
a) El intervalo de clase
c) El rango

b) Los lmites de clase


c) los lmites reales de clase

6. Se tiene una distribucin de frecuencias con cuatro intervalos de clase de igual amplitud y
los siguientes datos:
y1 = 10

y4 = 22

h1 = 0,30

h4 = 17,5 %

H2 = 0,45

Reconstruir la tabla de frecuencias

43

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

7. Los puntajes de 50 alumnos se clasifican en un cuadro de distribucin de frecuencias de


cuatro intervalos de clase de amplitud constante, sabiendo que: y 2 = 50, n1 = 4 N2 = 20, n3
= 25, c = 62.
Reconstruir el cuadro
8. En cada uno de los siguientes casos, determine si son consistentes o no, los datos:
a) m = 6, h1 = 0,2

9.

h4 = 0,2

H2 = 0,6

b) H4 = 0,30

n = 10

n1 = 0,31

c) h2 = 0,40

n = 50

n1 = 20

d) h1 = 4 %

h3 = 12 %

H4 = 15 %

e) H5 = 0,36

N4 = 30

h5 = 6

H3 + H4 = 1,9

n = 50

Suponga que la siguiente tabla de distribucin representa los salarios de los trabajadores
de construccin civil de Tarma.
Salarios Frecuencia
S/.
8 12

N
360

12 16

420

16 20

510

20 24

660

24 28

570

28 32
Total

480
3000

a) El sindicato de construccin civil solicita que en el nuevo pacto colectivo se


establezca un salario diario mnimo de S/. 14. Qu porcentaje de trabajadores se
beneficiarn con este pacto?
b) Los trabajadores que reciben mas de 30 soles diarios, se supone son muy calificados
(maestros de obra). Qu porcentaje de trabajadores se supone son muy
calificados?
c) Estime el nmero de trabajadores que ganan entre 15 y 27 soles diarios.
10. Los siguientes datos indican el nmero de minutos que ocuparon sus asientos 50 turistas
en un restaurante:
73
75
58
43
49

65
67
75
51
47

82
65
89
59
55

70
60
70
38
60

45
75
73
65
76

50
87
55
71
75

70
83
61
75
69

54
40
78
85
35

32
72
89
65
45

75
64
93
85
63

a) Cuntos turistas ocuparon entre 35 y 52 minutos sus asientos?


b) Cuntos turistas ocuparon ms de una hora los asientos?

44

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

c) Qu porcentaje ocuparon los asientos menos de 92 minutos?


11.

Richard que es un Jefe de Prctica muy divertido, pierde los exmenes de Estadstica.
Pero recuerda que las 120 notas tenan una distribucin simtrica con 7 intervalos de
clase de amplitud constante. Adems en sus archivos encuentra la siguiente
informacin:
7

h1 = 5 %

h3 = 15 %

y4 = 72

H 3* 85%

y
i 3

400

a) Reconstruya la tabla de distribucin de frecuencias.


b) Si para aprobar el examen se necesita obtener por lo menos 70 puntos. Cuntos
desaprobaron dicho examen?
12.

En una investigacin agrcola en el valle de Tarma, se determin la produccin total en


kilogramos de un cierto cultivo, el cual fue sembrado en 20 parcelas experimentales.
Los resultados obtenidos fueron:
40 35 38 40 41 37 41 40 38 20
25 33 27 25 28 44 22 20 29 36
a) Construya una distribucin de frecuencias con cinco clases
b) Si el 80 % de los pesos estn por arriba de los 30 kilogramos se recomendara su
cultivo en el valle. A la vista de los resultados se recomendar su cultivo?

13.

Una compaa tiene 60 trabajadores. El sueldo mnimo de un trabajador es 100 Euros y


el mximo 590 euros mensuales. El 80 % de los trabajadores ganan por lo menos 210
euros; 18 perciben sueldos inferiores a 390 euros mensuales, 20 % son profesionales y
perciben un haber de por lo menos 490 euros, se pide:
a) Construir la tabla de distribucin de frecuencias relativas.
b) Cuntos ganan ms de 450 euros mensuales?
c) Qu porcentaje de trabajadores tienen un sueldo de 300 euros ms pero menos
de 500 euros mensuales?

14.

El contenido de nicotina en miligramos de 40 cigarrillos de cierta marca se registraron


de la siguiente manera:
1,09
1,58
1,64
1,37

1,92
2,03
0,72
1,93

2,31
1,70
1,69
1,40

1,79
2,17
1,85
1,64

2,28
2,55
1,82
2,09

1,74
2,11
1,79
1,75

1,47
1,86
2,46
1,63

1,97
1,90
1,88
2,37

0,85
1,68
2,08
1,75

1,24
1,51
1,67
1,69

45

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

a) Construya la tabla de distribucin de frecuencias absolutas y relativas e interprete:


n1, N2, h3, H4, %h5, %H3.
2.4. REPRESENTACIONES GRFICAS DE DATOS ESTADSTICOS
Un grfico es la representacin de un fenmeno estadstico por medio de figuras
geomtricas

(crculos,

rectngulos,

paraleleppedos,

puntos,

lneas,

etc)

cuyas

dimensiones son proporcionales a la magnitud de los datos presentados. El objetivo


principal es la representacin de los datos en forma grfica, que permita a simple vista
darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y
caractersticas. El grfico es un auxiliar del cuadro estadstico al cual no lo sustituye
sino lo representa.
Es de vital importancia puesto que basta con observar un grfico para interiorizar con
facilidad los cambios que se efectan en las variables involucradas.
Un conjunto de observaciones o medidas realizadas en una poblacin, atendiendo a una o
ms caractersticas determinadas, es llamado tambin Serie Estadstica. Las Series
Cronolgicas o temporales se ocupan del comportamiento de los hechos a lo largo del
tiempo.
Una vez que se ha efectuado la investigacin y se ha recolectado y clasificado la
informacin o serie estadstica, resulta imprescindible representarlo de manera
adecuada, de tal forma que nos permita hacer un anlisis til. Existen dos tipos de
presentacin mediante los Cuadros Estadsticos y Grficos.

2.4.1. CUADROS ESTADSTICOS


Un cuadro estadstico es un arreglo ordenado de filas y columnas de los datos o
series estadsticas, por lo tanto tiene dos entradas o ms. En ellas pueden
representarse caractersticas cualitativas, cuantitativas o una combinacin de
ambas. Se puede tambin considerar variables discretas, continuas o de ambos
tipos. La finalidad es, ofrecer informacin resumida de fcil lectura,
comparacin e interpretacin. Segn su objetivo, las lneas (horizontales) y
columnas (verticales) de un cuadro se deben organizar de modo que pongan en
evidencia los aspectos que interesa mostrar y resalten las comparaciones que se
desean hacer notar.

46

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

La tabla de distribucin de frecuencias es un caso especial de un cuadro


estadstico.
PARTES DE UN CUADRO ESTADSTICO: Las partes de un cuadro estadstico
son:
1. Nmero: Es el Cdigo de identificacin del cuadro. Este nmero se escribe a
continuacin de la palabra Cuadro. Por ejemplo: Cuadro N 2.5; indica el
quinto cuadro del capitulo dos.
2. Ttulo: Es la indicacin que preside a la tabla y es colocada en la parte
superior de la misma. El Ttulo debe reunir las condiciones siguientes:
Completo y Conciso.
a) COMPLETO: Un ttulo completo debe indicar claramente cul es el
contenido del Cuadro Estadstico. Debe responder a las preguntas:
Qu, cmo, dnde y cundo?

QUE: Se refiere al contenido de la tabla. Cul es el universo que


se investiga.

COMO: Cmo se estudia; de acuerdo a cuales caractersticas se


clasifican los individuos u objetos estudiados. Las variables
ubicadas en las filas se identifican con la proposicin Por y las de
las columnas con la proposicin Segn.

CUANDO: Momento o periodo de tiempo a que se refiere el


estudio.

DONDE: Lugar a que se refiere la informacin.

b) CONCISO: El ttulo debe ser breve, lo ms conciso posible, aunque no


debe sacrificarse la claridad a la concisin.

Ejemplo: En el Cuadro 2.1, indicar si el ttulo contiene las 4 preguntas bsicas


del cuadro estadstico:
Cuadro 2.1

Per: Distribucin de las mujeres de 15 a 49 aos, por rea


urbana, rural y regin natural. Segn estado conyugal: 2008

Estado

Total

Conyugal
TOTAL
Soltera
Casada
Conviviente

4999
1760
2004
895

REA
Urbana Rural
3406
1335
1335
491

1593
425
668
405

REGION NATURAL
AML Costa Sierra Selva
1491
660
640
185

1331
481
495
266

1561
473
676
304

516
147
193
138

47

ESTADSTICA I

FACAP UNCP - 2015

Viuda
Divorciada
Separada

70
20
250

34
20
191

35
0
60

ING. CLAUDIO LIMAYMANTA SULCA

13
14
79

9
3
77

37
5
66

10
0
28

Qu?:
Cmo?:
Cundo?:
Dnde?:
Ejemplo: Cul sera el Ttulo adecuado para este enunciado?
CUADRO

QUE

MUESTRA

LA

DISTRIBUCIN

DE

LAS

DEFUNCIONES EN LA PROVINCIA DE LIMA, DURANTE EL AO 1990


CLASIFICADOS DE ACUERDO CON LA EDAD Y EL SEXO DE LOS
FALLECIDOS
3. CUADRO PROPIAMENTE DICHO:
Es la parte del cuadro que contiene la informacin y consta de un conjunto de
casillas o celdas, dispuestas en filas y columnas. Sus elementos esenciales
son: Encabezamiento de las columnas, Columna principal o Matriz y Cuerpo.
ENCABEZAMIENTO: Es la primera fila del cuadro, en el se explica las
categoras y el objeto de cada una de las columnas, es decir, indica la
naturaleza de los datos inscritos en cada celda que se hallan debajo. Deben
ser breves y explcitos.
Por ejemplo en el Cuadro 2.1: El Encabezamiento, es el rea, urbana y rural y
la regin natural, subdividida en AML, Costa, Sierra y Selva, y el Estado
Conyugal.
COLUMNA PRINCIPAL O MATRIZ: Es aquella en que se anotan las
categoras o las diferentes clases de la escala de clasificacin utilizada. Por
ejemplo: en el Cuadro 2.1.: La columna principal esta constituida por el
Estado Conyugal: Soltera, Casada, etc.
CUERPO: Es el conjunto de de celdas o casillas que son las intersecciones de
filas y columnas, donde estn anotados los datos numricos.
4. NOTAS EXPLICATIVAS: Contiene habitualmente la Fuente de los datos
representados y cualquier nota aclaratoria sobre el contenido del cuadro.
FUENTE: Es la indicacin al pie del cuadro que sirve para nombrar la entidad
responsable de donde se obtuvieron los datos.
2.4.2. REPRESENTACIN GRFICA
REGLAS PRINCIPALES PARA EL TRAZADO DE GRFICAS LINEALES

48

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

1.- Por lo general las frecuencias se ponen en el eje vertical (ordenadas) y el mtodo de
clasificacin en el eje horizontal (abscisas).
2.- Las dos escalas deben guardar proporcin de tal forma que el grfico no de
impresiones de fluctuaciones muy lentas o muy exageradas. Se acepta una proporcin
de 1 a1 o de 1 a 2; por ejemplo si la ordenada mide 5 unidades, la abcisa debe medir
entre 5 y 10 unidades.
15 10 5 0
60

61

62

63

64

65

3.- La escala que representa la frecuencia debe empezar por cero. Cuando no puede
aparecer de forma normal se parte la escala con una lnea en zigzag.
4.- El ttulo se coloca generalmente en la parte superior del grfico, fuera del mismo y
explicara lo ms claro y preciso posible el contenido que expone.
5.- Cada escala debe ser rotulada de tal manera que se comprenda fcilmente qu
representa; edad en aos o meses, kilos o libras en peso, etc.
6.- El grfico progresa generalmente de izquierda a derecha y de abajo hacia arriba.
7.- Las lneas del propio grfico deben dibujarse mas gruesas que las escalas.
8.- El grfico generalmente debe ir acompaado de la tabla que le dio origen.
9.- El grfico no debe contener ms lneas o smbolos que los que el ojo pueda seguir
cmodamente.
A. TIPOS DE GRFICOS
Es la representacin grfica de un conjunto de datos estadsticos, en la cual el
estadstico o investigador elegir la ms conveniente que se adapten a un tipo de series
estadsticos. Estos son:
1. Diagrama de Barras: Sencillas, dobles, mltiples, proporcionales.
2. Pictogramas.
3. Grficas de sectores o circular de pastel.
4. Diagramas de frecuencias.
5. Histogramas de frecuencias.
6. Polgono de frecuencias absolutas y relativas.
7. Polgono de frecuencias acumuladas u ojivas.
8. Grficos de lnea o aritmtico simple.

49

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

9. Grficos de pirmides.
10. Cartogramas.
1) GRAFICO DE BARRAS
Es aquella que se representa por una serie de barras o paraleleppedos o
rectngulos, los cuales pueden dibujarse horizontal o verticalmente. Este grfico se
utiliza para representar variables de tipo cualitativo o cuantitativo discreto.
Reglas para su construccin:
No existen reglas estrictas y se graficaran por criterio propio.
1.- Todas las barras, rectngulos o paraleleppedos deben tener el mismo grosor.
2.- El espacio entre las barras deben tener la misma magnitud.
3.- Las barras, por esttica deben ordenarse de mayor a menor cuando se pueda.
4.- La escala de la frecuencia debe empezar por cero.
5.- Deben dibujarse a buen criterio, lneas de fondo en la grfica, ellas facilitan la
lectura de los valores.
6.- Si el grfico tiene muchas barras es preferible reemplazarlo por un diagrama
lineal.

2. GRFICOS DE SECTORES O DE PASTEL


Este sistema de representacin es de la misma naturaleza que el grfico de
barras. Se utiliza para representar datos cualitativos o cuantitativos discretos.
Su uso ms frecuente es con fines comparativos, cuando se quiere mostrar las
diversas componentes de una serie de valores de la variable comparada con el
total.
Para construir el grafico de sector, se utiliza una circunferencia, cuyo circuito
se divide en sectores tales que sus medidas angulares centrales y por tanto la
superficie del sector circular sean proporcionales a las magnitudes de los valores
de la variable que representan. Al total le corresponde el crculo completo, es
decir, los 360 de la circunferencia y por una regla de tres simple se encontrar
el nmero de grados que le corresponde a cada parte:

50

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Total (n) ---------- 360


Parte (ni) --------- x
Entonces el nmero de grados que corresponde a una parte, ser en general:
x nmero" grados

parte (360 )
total

Observe que: Parte/total = ni/n, que es la frecuencia relativa del suceso que le
corresponde la frecuencia absoluta ni.
Ejemplo:
Construya un grfico de sector para los gastos de publicidad, por medio de
difusin en cierto pas en el ao 2005.
Medio de Difusin Cantidad Vendida
Peridicos

en Soles
4936

Revistas

1061

Televisin

2853

Radio

1128

Correo

2548

Aparadores

839

Otros
Total

941
ni =

Solucin:
Al realizar la sumatoria de los ni obtenemos:

ni =14306 -------- 360

Aplicando la frmula anterior se obtiene:


4936(360 )
x
124,2 124
Para peridicos:
14306
1061(360 )
x
26,7 27
Para Revistas:
14306
2853(360 )
x
71,8 72
Para Televisin:
14306
1128 (360 )
x
28,4 28
Para Radio:
14306
2548(360 )
x
64,1 64
Para Correo:
14306

51

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

839(360 )
21,1 21
14306
941(360 )
x
23,7 24
Para Otros:
14306
Se puede comprobar que la suma de los siete sectores da 360
Para Aparadores:

Los grficos de sectores, se utilizan muy frecuentemente para representaciones


grficas de distribuciones porcentuales. En este caso el total representado por
el 100 % le corresponde los 360 del crculo; la Regla general ser:
100 % --------- 360
Parte % --------- x
Nmero de Grados =

x = parte % (3,6)

Ejemplo:
Dado el siguiente cuadro, construir el grfico de sectores para los accidentes de
trnsito sucedidos en el ao 2008:
PERU: INTERVENCIONES EN ACCIDENTES DE TRNSITO REGISTRADOS POR
LA POLICIA NACIONAL SEGN CAUSA: 2004 2008
CAUSA
Exceso de Velocidad

2004
12328

2005
13725

2006
13862

2007
11095

2008
12479

Ebriedad del Conductor

5257

5533

6125

4518

5353

Imprudencia del conductor

19516

26369 29780 21632

23789

Imprudencia del peatn

7508

4300

5287

3740

5695

Desacato de seales

2168

2405

2873

2378

2458

52

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Falla mecnica

1589

Otros

10851 12893 12322 8459


14047
60547 67721 73283 53017 65455

Total

1473

1707

1195

1634

FUENTE: MINISTERIO DEL INTERIOR Oficina de Estadstica. Tomado de Compendio Estadstico: 2004
2008

3. DIAGRAMA DE FRECUENCIAS (ABSOLUTAS Y RELATIVAS)


Se usa para representar los diferentes tipos de distribuciones de frecuencias
de datos discretos. Si se desea representar grficamente las distribuciones de
frecuencias absolutas o las frecuencias relativas, se llevar sobre un eje
horizontal los valores de y1, y2, ym; y levantar sobre cada uno de ellos, un
segmento vertical de longitud igual a la frecuencia absoluta o frecuencia relativa
correspondiente al valor dado.

4. HISTOGRAMA DE FRECUENCIAS
Se utiliza para representar grficamente las distribuciones de frecuencias
absolutas o relativas de datos cuantitativos continuos agrupados en clases. El
fenmeno estudiado queda representado por una serie de rectngulos
semejantes a los del diagrama de barras, sin embargo las barras del Histograma
se colocan solo verticalmente y debe ir uno al lado del otro sin que haya un
espacio que los separe. La base de cada rectngulo es la amplitud de la clase de
la variable correspondiente.

53

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

5. POLGONOS DE FRECUENCIAS
Los polgonos de frecuencias absolutas o relativas, se obtienen uniendo los
puntos medios de las bases superiores de los rectngulos en el histograma de
frecuencias absolutas o relativas respectivamente.

Utilidad de las grficas:


Las grficas de la distribucin de frecuencias absolutas y relativas son tiles por
que ponen en relieve y aclaran las tendencias que se captan fcilmente en las tablas.
Atraen la atencin del lector sobre la tendencia de los datos. Nos permiten estimar
algunos valores con una simple ojeada y nos brindan una verificacin grfica de la
veracidad de nuestras soluciones.
Ejercicios para resolver por el estudiante
1. En la oficina del diario El Peruano, el tiempo que se tarda en imprimir la primera plana fue
registrado durante 50 das. A continuacin se transcriben los datos aproximados a
dcimas de minuto:
20,1

20,8 22,8 21,9

22,0 20,7 20,9 25,0 22,2 22,8

54

ESTADSTICA I

FACAP UNCP - 2015

19,5
21,8
23,9
22,7

25,3
23,7
21,3
19,7

20,7
20,3
21,5
24,2

22,5
23,6
23,1
23,8

21,2
19,0
19,9
20,7

ING. CLAUDIO LIMAYMANTA SULCA

23,8
25,1
24,2
23,8

23,3
25,0
24,1
24,3

20,9
19,5
19,8
21,1

22,9
24,1
23,9
20,9

23,5
24,2
22,8
21,6

a) Construya con los datos una distribucin de frecuencia absoluta y una acumulativa
menor que, usando intervalos de 0,8 minutos de amplitud.
b) Construya con los datos un polgono de frecuencias.
c) Construya con los datos una ojiva de frecuencias menor que
d) Por medio de la ojiva estime que porcentaje de las veces la primera plana del diario
puede imprimirse en menos de 24 minutos.
2. La siguiente tabla representa la distribucin de las edades de las personas hospitalizadas
en una sala de ciruga. Dibuje el histograma y el polgono correspondiente:
Edad
27 32

Frecuencia
2

32 37

37 47

47 62
Total

3
16

3. Para la siguiente distribucin de las tasas de mortalidad infantil, dibujar su histograma y


el polgono de frecuencias:
Aos
00 0,20

Mortalidad %
50

0,20 0,50

30

0,50 1,00

12

1,00 2,00

2,00 3,00

4. Se han medido mediante pruebas adecuadas los coeficientes intelectuales de un grupo de


80 estudiantes, viniendo los resultados agrupados en 6 intervalos de amplitud variable. Si
estas amplitudes son: c1 = 4, c2 = 12, c3 = 4,

c4 = 12, c5 = 8, c6 = 20. Si las

frecuencias relativas acumuladas son: H1 = 0,20, H2 = 0,20, H3 = 0,50, H4 = 0,70 y H5


= 0,85.
a) Construir la tabla de distribucin de frecuencias absolutas (relativas, absolutas
acumuladas y relativas acumuladas), si el lmite inferior de la primera clase es 80.
b) Dibujar un Histograma de Frecuencias.
c) Dibujar una ojiva mayor o igual que y menor que.
d) Determine el punto de interseccin de las ojivas.

55

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

5. De un hospital de infantes se tiene el siguiente informe de atencin por da: hasta de 2 a


meses de edad, 40 nios; de 2 a 6 meses, 60 nios; de 6 a 1 ao, 60 nios, de 1 a 2 aos,
96 nios y de 2 a 3 aos, 72 nios. Represente esta distribucin en un histograma de
frecuencias y dibuje el polgono de frecuencias.

CAPTULO III
III. MTODO PARA EL ANLISIS DESCRIPTIVO DE DATOS CUALITATIVOS
Para tener un mejor entendimiento de las distribuciones de frecuencias, cualquiera que
sea el tipo de datos, debe resumirse para propsitos descriptivos, de anlisis o de
comparacin. En ciertos casos y para determinados fines las frecuencias absolutas de
las caractersticas observadas son de gran importancia, pero sin embargo stas no son
suficientes para mayor parte de las necesidades a las que se destinan los datos
cualitativos, siendo conveniente calcular las distribuciones de frecuencias relativas,
incluyndose bajo esta denominacin, las razones, las proporciones, los porcentajes,
ndices y tasas.
La importancia de las frecuencias relativas radica en que ellas ponen ms fcilmente en
evidencia, las relaciones que existen entre dos o ms cifras de los datos que se
estudian, facilitando la comparacin de los diversos resultados y trabajando ms con las
razones y proporciones.
3.1. RAZONES.
Cuando se compara el nmero de elementos de una caracterstica cualitativa, con
el nmero de elementos de otra caracterstica cualitativa, estamos en presencia
de una razn. Esta comparacin se puede hacer por:
Razn por Diferencia.- Se dice que la razn es aritmtica o por diferencia.
Razn por Cociente.- la razn es geomtrica o por cociente, es decir si a y b son
dos nmeros, la frmula general de una razn ser el cociente de dividir uno de
ellos entre el otro.

56

ESTADSTICA I

FACAP UNCP - 2015

a
b

ING. CLAUDIO LIMAYMANTA SULCA

Donde, a y b se refieren a diferentes hechos, relacionando de esta

manera el nmero de elementos de una categora con el nmero de elementos de


otra categora.
Ejemplo 1:
En la Sede Facap -Tarma de la UNCP, la poblacin estudiantil de la Especialidad de
Hotelera y Turismo es de 350, de las cuales se dividen en 150 mujeres y 200
hombres, cual ser la razn de los hombres contra las mujeres.
Solucin:
Sea,

a = 200, nmero de mujeres

Entonces:

b = 150, nmero de hombres

R = 200 / 150 = 1.33

Ejemplo 2.
En un estudio de anlisis de bebidas, de 600 botellas analizadas, 300 resultaron
con impurezas, la razn es de:
R = 600 / 300 = 2
Lo cual representa de cada 2 botellas buenas, 1 resulta infectada.
Otras relaciones usadas comnmente son:
Razn de natalidad mortalidad = total de nacidos vivos / total de defunciones
Razn de mortinatalidad = Total de nacidos muertos / total de nacidos vivos
Velocidad = km / hr
Poblacin = habitantes / km2
3.2. NDICES (I).
Representa la razn multiplicada por 100, es decir:
a
x100
ndice =
b
Los diferentes tipos de ndices son:
ndice vital = total de nacimientos / total de defunciones x 100
ndice de mortinatalidad = total de nacidos muertos / total de nacidos vivos x
100
ndice de fertilidad = total de fecundadas / total de no fecundadas x 100
3.3. PROPORCIN (P).
Es la relacin que existe entre el nmero de casos observados en un grupo
particular de objetos con una caracterstica y el total de objetos que poseen la
caracterstica. La proporcin se distingue de la razn por que el numerador es
parte integrante del fenmeno que constituye el denominador (se compara una
parte con el todo).
P

a
ab

57

ESTADSTICA I

FACAP UNCP - 2015

Ejemplo:

ING. CLAUDIO LIMAYMANTA SULCA

En una poblacin compuesta por 1200 estudiantes de ingeniera

agroindustrial, hay 300 mujeres y 900 hombres, la proporcin de


hombres es:

P hombres = 900 / 300 + 900 = 900 / 1200 = 3 / 4

Esto significa que, de cada 4 estudiantes de ingeniera agroindustrial, 3 son


hombres.

3.4. PORCENTAJES (%).


Es una proporcin multiplicada por 100.

a
x100
ab

La ventaja de los porcentajes, es que nos permite comparar dos o ms series


estadsticas cuyos totales son diferentes, pues quedan reducidos a 100. As,
mientras que la proporcin expresa el tanto por uno, el porcentaje expresa el
tanto por cien.
Ejemplo:

El jefe de control de calidad de una planta industrial cont en la

produccin semanal 1500 piezas buenas y 120 defectuosas. Entonces el


porcentaje de piezas defectuosas sera:
120
%
x100 7,4%
1500 120
Ejemplo: Un comerciante mayorista compra un producto determinado en S/. 736
y lo vende en S/. 920. El sostiene que su ganancia es de solo 20 %. Explique:

a) Sobre que base lo calcul?


b) cul es su ganancia real?
Solucin:
Utilidad Obtenida = 920 736 = S/. 184
a) El sostiene que su ganancia es el 20 %, esto se hizo tomando como base el
precio de venta:

(184/920)100 = 20 %

b) Puesto que la ganancia del comerciante se debe calcular sobre su inversin


que fue de S/. 736, se debe tomar esta cantidad como base, luego la ganancia
real es:
(184/736)100 = 25 %
3.5. PORCENTAJE DE CAMBIO
El porcentaje de cambio es el que indica la diferencia entre dos cantidades en
forma porcentual. Hay dos tipos de porcentaje de cambio: Porcentaje de
aumento y porcentaje de disminucin.

58

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Si M y m son dos cantidades tales que m < M, entonces:


M m
M
x100
x100 100
Porcentaje de Aumento =
m
m
M m
m
x100 100
x100
Porcentaje de Disminucin =
M
M
Observe que la diferencia entre dos porcentajes, llamada puntos porcentuales
de cambio no se debe interpretar como porcentaje de cambio.
Ejemplo 1: La fbrica de ladrillos REX, vende ladrillos de techo de 30 x 15 x 15
a S/. 200 el millar. Por Fiestas Patrias la fbrica hace una oferta, bajando a S/.
120 el millar; Qu porcentaje disminuy el precio de los ladrillos?
Solucin:
M = S/. 200

m = S/. 120
200 120
x100 40%
Porcentaje de Disminucin =
200
Ejemplo 2: Los productores de leche evaporada aumentan el precio del tarro de
S/. 1,60 a S/. 2,00 y sostienen que aumentaron el precio en solo 20 %. Explicar:
a) Sobre que base calcularon el porcentaje de aumento.
b) Cul es el aumento real?
Solucin:
Cambio en el precio = 2,00 1,60 = 0,40
Los productores sostienen que aumentaron el precio en 16,7 % el cual se ha
calculado de la siguiente manera:

0,40
x100 20%
2,00

3.6. PORCENTAJE DE ERROR


El porcentaje de Error se obtienen dividiendo la diferencia del valor aproximado
y el exacto, entre el valor exacto, multiplicado por 100.
Si a es el valor aproximado y b es el valor exacto, entonces:
ab
x100
% Error =
si a > b
b
ba
x100
% Error =
Si a < b
b
Ejemplo: La compaa de sondeo de opiniones OPINO, pronostic que el
candidato a la presidencia MM en las elecciones presidenciales pasadas, ganara
con el 42 %. Perdi con el 28 %. Cul es el porcentaje de error de estimacin?
Solucin: Aplicando directamente la formula dada:
Porcentaje de Error = (42 28/28) x 100 = 50 %

59

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

CAPTULO IV
IV. MTODO PARA EL ANLISIS DESCRIPTIVO DE DATOS CUANTITATIVOS
INTRODUCCIN
Las tablas o cuadros estadsticos, los distintos tipos de grficos y tambin la Razn, los
ndices, las Proporciones, Porcentajes y Tasas, que se han estudiado en los captulos
anteriores, constituyen diversos modos de resumir o reducir un conjunto de datos a unas
pocas cifras, que aisladamente, o dispuestas en forma tabular o grfica, sirven para
transmitir las caractersticas principales de la informacin representada en los datos y
contienen elementos descriptivos que hacen innecesario el examen de todos los datos.
Las cifras descriptivas que se obtienen como funcin de una muestra (x 1, x2, x3, ., xn), es
decir como una funcin de un conjunto de datos (que representa un subconjunto de la
poblacin), se llama Estadgrafo o Estadstico.
Existen cuatro tipos de estadgrafos: De Posicin, Dispersin, Concentracin y de Forma.
Los estadsticos de Posicin, son aquellos que describen la posicin que ocupa la
distribucin de frecuencia respecto a un valor de la variable. Se distinguen dos tipos: Los
estadgrafos de Tendencia Central y los de Localizacin.
Los Estadgrafos de Posicin deben su nombre al hecho de que sus valores tienden a
ocupar posiciones centrales o intermedias entre el menor y mayor valor del conjunto de
datos, a partir de la cual se calculan estos estadgrafos; es decir, brindan de alguna forma,
informacin sobre el centro de la distribucin. Los ms importantes y muy usados son: La
Media Aritmtica o Media, la Media Geomtrica, la Media Armnica, la Media
Cuadrtica y la Mediana.
Los Estadgrafos de Localizacin sealan la ubicacin de los valores ms frecuentes o de
valores extremos. Los ms usados son: La Moda, los Cuartiles, etc.

60

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

En relacin con los Estadgrafos de Dispersin, indican cuan dispersos estn los datos;
mientras mayor sea su valor, ms dispersos se encuentran las observaciones. Las ms
utilizadas son aquellas que indican la concentracin de los valores del conjunto de datos
alrededor de su valor medio o promedio. El ms importante de ellos es la Varianza y otros,
asociados a sta como la Desviacin Tpica (o Desviacin Estndar) y el Coeficiente de
Variacin.
Los Estadgrafos de Concentracin, indican el grado de concentracin o de desigualdad de
una distribucin.
Las caractersticas de Forma, indican la forma de la curva (o Polgono) de distribucin de
frecuencias y en especial su Simetra o Asimetra (que significa no tener simetra) y forma
ms o menos aplastada o en punta.
Aunque al estudio de las medidas de cada una de estas caractersticas se les dar por
separado especial atencin, es interesante hacer notar que un estudio conjunto de todas
estas caractersticas permite obtener una visin completa y al mismo tiempo concentrado
de fenmeno que se est estudiando.
4.1.

ESTADGRAFOS DE POSICIN
4.2.1. MEDIA ARITMTICA (DATOS NO TABULADOS o SIN AGRUPAR)
La Media Aritmtica es la medida de tendencia central ms conocida,
familiar a todos nosotros y de mayor uso, tambin fcil de calcular; cuando
se habla de media aritmtica hablaremos de Salario Medio, Nmero Medio
de Accidentes, Rendimiento medio de un obrero, ganancia media, etc.
DEFINICIN: La media aritmtica o promedio de una muestra x 1, x2, x3, .,
_

xn de un tamao n de una variable o caracterstica x, se denota por X o M(X)


y se define como la suma de todos los valores observados en la muestra,
dividida por el nmero total de observaciones n, es decir:

Usando la notacin de sumatoria:


n

X M ( x)

x
i 1

61

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo: Una persona que trabaja en forma independiente gana en un mes


S/. 200,00; otro mes S/. 600,00 y otro mes S/. 400,00. Cunto gana en
promedio mensual?
Solucin:
1. En este caso:

x1 = 200

x2 = 600

x3 = 400

n=3

2. Aplicando la frmula de la definicin, ha ganado en promedio:


_

x1 x 2 ..... x n 200 600 400 1200

S / .400
n
3
3

La interpretacin sera que: La persona debe esperar ganar cada mes S/.
400,00. Claro esta que hay meses que ganar menos o ms.
La Media Aritmtica acta como un punto de equilibrio o balanceo del
conjunto de valores, de modo que las observaciones que son menores se
equilibran con las mayores. Es decir, la interpretacin fsica de la media
aritmtica es como el centro de gravedad.
Ejemplo:

La cantidad de sujetos que figuran como personal de servicio en

ocho escuelas, esta dada por la serie: 14, 7, 13, 12, 11, 10, 8, 13, hallar su
media aritmtica.
14 + 7 + 13+ 12 + 11 + 10 + 8 + 13
_

X =

88 / 8 = 11 personas

8
El porque del nombre de media aritmtica, porque es el valor central de una
progresin aritmtica que tiene un numero impar de trminos.
Una progresin aritmtica es una sucesin de valores tales que la diferencia
entre cada trmino (empezando por el segundo) y el anterior es siempre la
misma, cualquiera que sea el trmino
4.2.2. MEDIA ARITMTICA (DATOS AGRUPADOS TABULADOS)
Si los datos han sido clasificados en m clases en una tabla de distribucin
de frecuencias con Marcas de Clase (yi) y Frecuencias Absolutas (ni), la
media aritmtica de estos datos esta definida por:

y M ( y)

y n y 2 n 2 ..... y m n m
1 1
n

Empleando la notacin de sumatoria la media aritmtica de datos


agrupados se escribe:

62

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

y i ni

y M ( y)

i 1
m

n
i 1

yn

i i

i 1

Tambin se puede escribir como:


m
ni

y i hi
n i 1

y M ( y ) yi
i 1

Es decir: La Media Aritmtica, en el caso de datos tabulados, se escribe


m

y M ( y ) hi y i

en forma equivalente como:

i 1

OBSERVACIONES:
4.1. Cuando los datos tabulados son discretos, se puede comprobar fcilmente que la
media aritmtica del conjunto original de los datos x 1, x2, ., xn, coincide con la media
de los datos agrupados, pues en este caso no hay prdida de informacin, es decir:
y M ( x) y M ( y )

4.2. Cuando los datos tabulados son continuos, hay prdida de informacin en relacin
al conjunto original de los datos y esto afecta a los estadgrafos calculados a partir de
los datos agrupados, luego la media:

= M(y), es una aproximacin a la media aritmtica

del conjunto original: x1, x2, ., xn; x M ( x ) , porque se considera en el calculo de

, las

marcas de clase yi, como representante de la clase i; i = 1, 2, 3, ., m. Es decir estamos


suponiendo que las frecuencias de cada clase estn condensadas en la marca de clase.
La hiptesis es aceptable cuando las clases no son muy amplias, Salvo en el caso que los
datos estn uniformemente distribuidos en cada intervalo de clase, lo cual justificara
que se tome al punto medio del intervalo como valor representativo de todos los valores
de dicho intervalo. Entonces en general:
[yi-1 - yi>
[30 --- 40>
[40 --- 50>
[50 --- 60>

yi
35
45
55

ni
3
2
5
10

y M ( y)

y i ni
i 1
m

n
i 1

yi n i
105
90
275
470

yn

i i

i 1

63

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo: Durante 30 das se ha observado el nmero de pasajeros que viajan


de Lima a Iquitos, siendo estos resultados los siguientes:
36 30 34 38 39 40 30 35 36 37
30 39 38 31 37 32 39 38 30 38
38 39 40 40 38 33 31 35 35 32
Ejemplo: En el mercado de Tarma se realiz una inspeccin en pesos (Kg.) de 50 sacos
de papas, para saber si contenan el peso completo (100 Kg.), la muestra fue obtenida de
la produccin semanal del distrito de Huasahuasi, de acuerdo a estos datos el alumno
elaborar y clasificar una tabla de frecuencias con 5 clases de amplitud (m) y con los
resultados que son representativos de toda la poblacin de produccin de papas de
dicho distrito, el alumno informar lo siguiente:
a) Hallar la Media Aritmtica para estos datos agrupados.
94,3
92,9
94,2
94,7
94,1

93,7
92,7
95,7
93,6
93,0

94,7
95,0
94,2
95,7
95,5

94,3
93,0
93,8
93,7
95,3

92,4
94,0
92,7
94,8
92,9

94,5
93,9
94,4
93,7
93,9

92,8
93,6
96,2
92,7
92,7

95,4
93,3
91,6
93,2
94,6

93,6
92,3
93,6
93,7
94,6

95,5
93,7
91,9
96,4
94,4

Solucin:
Habiendo realizado los clculos respectivos, se tiene la siguiente tabla de frecuencias:
[yi-1 - yi>
91,5 ---- 92,5

yi
92

ni
4

y in i
368

92,5 ---- 93,5 93

11

1023

93,5 ---- 94,5 94 20

1880

94,5 ---- 95,5 95

855

95,5 ---- 96,5 96


6
576
Total
50 4702
Hallamos la Media Aritmtica, sumando los productos de yini, y dividiendo entre n = 50
obtenindose:
5

yn
i 1

4702

y n
i

i 1

4702
94,04kg.
50
64

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Este valor promedio, nos indica que cada vez que un saco de papas sea llenado, el peso
que se espera que tenga sea de aproximadamente 94 kg.
4.2.3. MEDIA DE LA POBLACIN
Definicin: La media aritmtica de una poblacin finita de N elementos x 1, x2,
x3,., xn, se denota por y se define por:
N

x1 x 2 .... x n i 1

N
N

Por ejemplo: si la poblacin x = (1, 3, 4, 6, 8, 11, 16), entonces la media aritmtica


poblacional es:

1 3 4 6 8 11 16 49

7
7
7

4.3. MTODOS ABREVIADOS DE CLCULO DE LA MEDIA ARITMTICA


Presentaremos dos mtodos abreviados de la media aritmtica con ayuda de las
propiedades para datos tabulados:
a) Mtodo del Origen de Trabajo (Ot)
Se trata de reducir la magnitud de la variable, transformando las marcas de
clases y1, y2, .., yn, en desviaciones di, respecto de un origen de trabajo
arbitrariamente elegido, esto es:
di = yi O t

donde: i = 1, 2, 3, ., m.

Luego se halla la media aritmtica de la nueva variable desviacin d


Criterios para elegir el Origen de Trabajo: Se determina de acuerdo a los
siguientes criterios:
* Si m es impar, Ot, debe ser el valor central de las yi.
* Si, m es par, Ot, puede ser uno de los valores centrales, el de mayor
frecuencia, entonces, el mtodo consiste:
1. Elegir un origen de trabajo: Ot.
2. Se determinan las desviaciones de las: yi, respecto a Ot; di = yi Ot
3. Se determina la media aritmtica de la variable desviacin d.
m

M (d )

n d
i

i 1

4. Luego determinamos la Media aritmtica

y M ( y ) M ( d ) Ot
Ejemplo: Hallar la media aritmtica por el mtodo abreviado para los datos agrupados
en la tabla siguiente:

65

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Solucin:

yi
92

ni
4

1.

93

11

Puesto que m = 5 se elige el

94

20

central de las yi

95

Se calculan las desviaciones:

Ot

94,

valor

2.

nidi

96
6
total 50

di = yi Ot.
3.
4.

di = yi - Ot

Se calculan los productos nidi.

Se determina la media aritmtica de la variable d


yi
92

ni
4

di = yi - Ot
-2

nidi
-8

93

11

-1

- 11

94

20

95

12
2

96
6
total 50

Ot

M (d )

n d
i

i 1

2
0,04
50

5. Luego hallamos la media aritmtica:

y M ( y ) M ( d ) Ot

M(y) = 0,04 + 94

M(y) = 94,04

b) Mtodo Codificado (ui): Si la amplitud de clases es constante, esto es para:

y 2' y1' y 3' y 2' ..... y m' y m' 1 c , en el caso discreto cuando las yi estn
espaciadas a una distancia constante.
Entonces:
1.

Se elige el origen de trabajo Ot, siguiendo los criterios


mencionados.

2.

Se calcula la variable ui y se toma la amplitud de clase


constante de los intervalos como unidad para medir las desviaciones,
respecto al origen Ot; es decir:

ui
3.

y i Ot
c

Se calcula la media aritmtica de la variable u. En efecto:


m

M (u )
4.

u n
i

i 1

Por ltimo se calcula la Media Aritmtica:


M(y) = cM(u) + Ot

66

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Ejemplo: Durante 40 das se ha observado, el nmero de prestamistas del Banco de


Crdito que sacan dinero mediante prstamos anuales, siendo estos resultados los
siguientes:
40 44 39 45 42 46 41
38 45 47 43 43 45 46
42 43 44 40 39 41 43
44 41 42 44 45 41 42
Determinar la media aritmtica, usando el mtodo

43 42 44
42 48 44
45 46 43
43 47 40
codificado.

Solucin:
1. Se construye la tabla de distribucin de frecuencias.
Siendo: R = 48 38 = 10
yi

Luego: m = 10 + 1 = 11
ni

ui

38
1
39
2
40
3
41
4
42
6
43
7
44
6
45
5
46
3
47
2
48
1
Total 40

y i Ot
c

niui

-5
-4
-3
-2
-1
0
1
2
3
4
5

-5
-8
-9
-8
-6
0
6
10
9
8
5
+ 2

Ot = 43

2. Como m = 11, elegimos el Ot = 43, el valor central de los yi.


3. Calculamos las ui, que tiene como constante c = 1:

ui

y i Ot
= yi 43;
c

los valores en la tabla

4. Luego determinamos la Media Aritmtica de las ui:


m

M (u )

u n
i

i 1

M(u) =

2
= 0,05
40

5. Por ltimo determinamos la Media Aritmtica:


M(y) = M(u) + Ot

M(y) = 0,05 + 43

M(y) = 43,05

Ejemplo: Los ingresos mensuales de 40 personas son los siguientes:


[yi-1 - yi>
200 -- 250

ni
2

Ni

67

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

250 -- 300
300 -- 350

12 22

350 --- 400

29

400 --- 450

34

450 --- 500

500 --- 550


Total
a)

Calcule el nmero de personas con ingresos entre 253 u.m. y 359 u.m.

b) Calcule el ingreso medio, usando el mtodo codificado.


SOLUCIN:
1. Los valores que faltan se deducen como siguen:
N1 = n 1 = 2
N3 = N2 + n3

entonces:

N2 = N3 n3 = 22 12 = 10

N2 = N1 + n2

entonces:

n2 = N2 N1 = 10 2 = 8

N4 = N3 + n4

entonces:

n4 = N4 N3 = 29 22 = 7

N5 = N4 + n5

entonces:

n5 = N5 N4 = 34 29 = 5

N6 = N5 + n6

entonces:

N6 = 34 + 4 = 38

N7 = 40 = N6 + n7 entonces

n7 = 40 N6 = 40 38 = 2

Con estos valores completamos la tabla de frecuencias


a) Como los datos estn uniformemente distribuidos en cada intervalo. Luego, el
intervalo entre 253 y 359 (<253, 359>) comprende:
253

359

250

300

350

400

* En el intervalo 250 300:


Si en 50
En

300 253

x = (47x8)/50

* En el intervalo: 300 350 = 12


* En el intervalo 350 400:
Si en
En

50

359 350

x = (9x7)/50

Entonces de los clculos anteriores tenemos el nmero de personas con ingresos


entre 253 y 359:
47
9
x8 12
x7 7,52 12 1,26 21 personas
50
50
La tabla de distribucin de frecuencias es:

68

ESTADSTICA I

FACAP UNCP - 2015

[yi-1

Ot

- yi>

yi

ni

ING. CLAUDIO LIMAYMANTA SULCA

Ni

ui

y i 325
50

uini

200 -- 250

225

-2

-4

250 -- 300

275

10

-1

-8

300 -- 350

325

12 22

350 --- 400

375

7 29

400 --- 450

425

5 34

10

450 --- 500

475

4 38

12

500 --- 550

525

2 40
40

8
25

b) Elegimos Ot = 325, por que corresponde al intervalo de mayor frecuencia,


luego:

ui

y i Ot
c

ui

y i 325
50

c) Hallamos la Media aritmtica de las ui:


m

M (u )

u n
i

i 1

M(u) =

25
= 0,625
40

d) Por ltimo determinamos la media aritmtica:


Por tanto:

M(y) = cM(u) + Ot = 50 (0,625) + 325 = 31,25 + 325 = 356,25 u.m.


M(y) = 356,25 u.m.
4.4. MEDIA ARITMTICA DE DISTRIBUCIONES SIMTRICAS
La media aritmtica de las distribuciones simtricas esta dada por:

y y m 1

Si m es impar

y y 'm Si m es par

donde: m = N intervalos de clase

Yi = marca de clase

y i' = lmite de clase

Ejemplo: Hallar la media aritmtica por el mtodo codificado, para los datos
agrupados en la tabla siguiente:
yi
ni
ui
niui

10
8
-3
- 24

20
20
-2
- 40

30
42
-1
- 42

40
60
0
0

50
42
1
42

60
20
2
40

70 Total
8
200
3
24
0

69

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

Donde: m = 7 intervalos de clase, es impar; entonces:


y y 4 40

4.5. MEDIA ARITMTICA A PARTIR DE SUBMUESTRAS


Este procedimiento de clculo se justifica porque en muchas situaciones hay la
necesidad de obtener muestras diferentes de una poblacin, ya sea por razones
tcnicas o por disponibilidad de informacin.
Un ejemplo del primer caso: Se desea estimar la utilidad media en soles de la
venta en una bodega en das diferentes.
Ejemplo del segundo caso: Se desea estimar el promedio del rendimiento
acadmico de la poblacin estudiantil del sistema universitario peruano,
tomaremos una muestra de la universidad A, otra de la B, etc. Y luego
obtendremos el promedio deseado y los tamaos de n 1 y n2 respectivamente y

sean: x y x las medias aritmticas de las muestras, entonces la media asociada


1
2
a las n1 + n2 observaciones esta dada por:
k

n x1 n2 x 2
x 1
n1 n2

Expresado en sumatorias:

ni x i
i 1
k

n
i 1

Donde: n1, n2, . nk = muestras de tamao n


Ejemplo 1. Un examen fue rendido por 80 alumnos de una seccin A y 90 alumnos
de una seccin B. En la seccin A se obtuvo un promedio de 11,8 y en la seccin B
se obtuvo un promedio de 12,5. Hallar la media aritmtica de las notas de todos
los estudiantes que rindieron el examen.
Solucin: Sea: nA = Nmero de alumnos de la seccin A = 80
nB = Nmero de alumnos de la seccin B = 90
xA = Media aritmtica de notas de la seccin A = 11,8
xB = Media aritmtica de notas de la seccin B = 12,5
Entonces:

70

ESTADSTICA I

FACAP UNCP - 2015

n x1 n2 x 2
x 1
n1 n2

ING. CLAUDIO LIMAYMANTA SULCA

(80)(11,8) (90)(12,5)
12,17
80 90

Es decir; el promedio de las dos secciones es: 12,17 y se espera que estos
estudiantes obtengan este valor.
Ejercicio para el alumno: La empresa A tiene 100 empleados, con un sueldo promedio
mensual por empleado de $. 250. La empresa B tiene 200 empleados con un sueldo
promedio mensual de $. 240.
a) Cul es el sueldo promedio mensual de las dos empresas en conjunto?
b) Si a las dos empresas se agrega una tercera con 50 empleados y un sueldo
promedio mensual por empleado de $. 300. Cul es el sueldo promedio para las
tres empresas en conjunto?
Ejercicio para el alumno: Las tablas muestran la informacin correspondiente a un
experimento de laboratorio, presentada por 3 estudiantes: A, B, C; las unidades estn
dadas en kg/cm2. Calcular la media aritmtica por el mtodo codificado de la muestra
resultante de combinar las tres muestras.
yi
10

A
n1
9

B
n2
9

C
n3
12

15

10 12

10

-1

-10 -1

-12 -1

-10

20 14 18

16

25 12 15

15

12

15

15

30 11

13

22

24

26

10

30

24

30

7
8
81 84

36
72

28
61

32
69

12

35 10 8
40 9

---

A
B
C
ui uini ui uini ui uini
-2 -18 -2 -18 -2 -24

Ejercicio para el estudiante:


El ingreso medio mensual de los 16500 obreros de una compaa es de S/. 116 y de los
12900 empleados de esta compaa es de S/. 148. Si los obreros reciben un aumento del
20 % sobre sus ingresos ms una bonificacin de S/. 50 por condiciones de trabajo y
los empleados reciben un aumento del 30 % ms S/. 60 por refrigerio. Cul es el
ingreso medio de todos los trabajadores de la compaa despus del aumento.
Ventajas e inconvenientes de la media aritmtica:
La media aritmtica viene expresada en las mismas unidades que la variable.

71

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

En su clculo intervienen todos los valores de la distribucin.


Es el centro de gravedad de toda la distribucin, representando a todos los valores
observados.
Su principal inconveniente es que se ve afectada por los valores extremadamente
grandes o pequeos de la distribucin.
4.6.

MEDIA GEOMTRICA
a) MEDIA GEOMTRICA PARA DATOS NO AGRUPADOS
La media geomtrica simple Mg, de n observaciones positivas, esta dada por la
raz ensima del producto de los n valores observados, es decir:

x g Mg n x1 .x 2 .....x n n

i 1

Ejemplo: Hallar la media geomtrica de los nmeros: 3, 5, 8, 3, 5, 2.


Solucin: en este caso n = 6, entonces la media geomtrica es:

x G 6 3 x5 x8 x3 x5 x 2 6 3 2 x5 2 x 4 2 3 3 x5 x 4 3,915
En la prctica, el clculo de la media geomtrica se hace ms rpido tomando
logaritmo y luego el antilogaritmo de ste, as:
1
log x G log n x1 .x 2 .....x n
log x G log x1 log x 2 ..... log x n
n

log x G

1 n
xi
n i 1

Es decir, el logaritmo de la media geomtrica resulta ser, la media aritmtica de


los logaritmos de la xi.
Ahora basta calcular el antilogaritmo de la expresin anterior para obtener:

log x

x G anti log

i 1

BIBLIOGRAFA
1. CALZADA, J. 1999. Mtodos Estadsticos para la Investigacin. 4ta Edicin. Editorial
Milagros. S.A. Lima.
2. CANTATORE, N. 2001. Manual de Estadstica Aplicada. Editorial Hemisferio Sur. S.A.
Buenos Aires
3. COCHRAN, W. 2001 Diseos Experimentales. 2da Edicin. Editorial Trillas S.A. Mxico
4. CHRISTENSEN H. 2001. Estadstica. da Edicin. Editorial Trillas. S. A. Mxico.
5. STEEL R. G. 2000. Bioestadstica Principios y Procedimientos. 2da Edicin. Editorial
Mc. Graw-Hill. Latinoamrica S.A. Mxico.
6. GARCA ALFREDO. 1999. Fundamentos de la Estadstica y sus Aplicaciones. Impreso
en la oficina de Informtica Tcnica de la UNALM.
PAGINAS ELECTRNICAS

72

ESTADSTICA I

FACAP UNCP - 2015

ING. CLAUDIO LIMAYMANTA SULCA

7. Monografias. com
8. Investigacinper.com
9. MINEDU.gob.pe

73

Das könnte Ihnen auch gefallen