Sie sind auf Seite 1von 118

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Programa de Capacitacin
en Investigacin Cientfica 2016
MDULO II.
ESTADSTICA PARA LA INVESTIGACIN I
Del 30.04.2016 al 21.05.2016

Docente: Manuel Hurtado Snchez, Lic. Estad. MsC.


Contenido:
1. La Estadstica y la Investigacin Cientfica
2. El Mtodo Estadstico
3. Conceptos bsicos: Poblacin, muestra y marco muestral, variable, medicin,
4. Tcnicas estadsticas descriptivas
5. Diseos estadsticos de muestreo

Chimbote, Mayo del 2016


Manuel Hurtado Snchez

Pgina 1

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

RESUMEN
El presente trabajo titulado Estadstica para la investigacin tiene como
propsito fundamental presentar a los investigadores en todas las ramas del
quehacer cientfico, la forma como la ciencia estadstica hace ms eficientes los
procesos de investigacin.
Partiendo de una reflexin sobre el concepto de Estadstica, examinamos el
papel que esta disciplina juega en la investigacin cientfica, desde el
planteamiento del problema, la formulacin de la hiptesis, el diseo del tamao
de la muestra, as como las tcnicas estadsticas que resultan tiles en la
investigacin con enfoque cuantitativo y, en particular, en la fase de anlisis
descriptivo de datos. Consideramos tambin que la estadstica puede ser
empleada en otros momentos del proceso de investigacin. Asimismo, se hace
mencin de los softwares estadsticos disponibles para su aplicacin.
Tambin se argumenta cmo el mtodo cientfico encuentra en los mtodos
estadsticos una herramienta fundamental para alcanzar sus objetivos. Y cmo
la estadstica aporta informacin valiosa a los datos obtenidos de un proceso
de investigacin cuantitativa con el fin de obtener conclusiones ms acertadas.
M. Hurtado S.

Manuel Hurtado Snchez

Pgina 2

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

I. LA ESTADSTICA Y LA INVESTIGACIN CIENTFICA


1. El Proceso de Investigacin

La investigacin es un proceso sistemtico y controlado de constante


exploracin y descubrimiento, fundamentado en el mtodo cientfico y,
comnmente, dirigido hacia la solucin de un problema o contestar una
incgnita. Este proceso de investigacin intenta descubrir nueva informacin
o ampliar, refinar y verificar el conocimiento actual. La investigacin
involucra la recoleccin y examinacin de informacin nueva con el fin de
proveer conocimiento nuevo, entender el conocimiento existente, desarrollar
teoras o descubrir principios generales que puedan ayudar a predecir
eventos futuros, todo esto en forma objetiva y eliminando cualquier influencia
o prejuicio personal.
2. Estrategias a Seguir al Iniciar la Investigacin
1. Indagar sobre literatura relacionada con el posible tema de estudio.
Esto ayudar a formular una pregunta o hiptesis.
2. Seleccionar un tema de estudio limitado. Una vez se posee un posible
tpico, es vital delimitarlo hasta donde se pueda con el fin de establecer
la interrogante investigativa.
3. Plantear el problema de investigacin. Se expone el propsito del
estudio, basado en una pregunta de investigacin, la cual debe ser
expresada en forma clara y estableciendo una relacin entre las
variables.
4. Se determina la hiptesis. Se expone y defiende una posible respuesta
anticipada al problema, ofreciendo argumentos lgicos, basados en el
cuerpo de conocimientos existentes y una buena dosis de talento e
ingenio del investigador.
5. Se definen las variables del estudio. El investigador identifica las
variables independientes y dependientes.
6. Observacin y registro de las variables durante el estudio. Se inicia
la recoleccin de datos utilizando instrumentos vlidos y confiables.
7. Ordenacin, clasificacin, organizacin y anlisis de la informacin
obtenida. Los datos crudos son tabulados y analizados. Se generan
inferencias, conclusiones y se establece si la hiptesis es rechazada o
no rechazada.

Manuel Hurtado Snchez

Pgina 3

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

3. Reflexin acerca del Concepto de ESTADSTICA en el contexto de la


Investigacin Aplicada
Pocas objeciones pueden hacerse a la idea de que la Estadstica es una
herramienta fundamental para la investigacin cientfica. De ah, que casi
todas las carreras universitarias, incluyan en sus planes de estudios
asignaturas de contenido estadstico. Sin embargo, la Estadstica trasciende
el contexto acadmico y est presente en distintos mbitos de la actividad
humana. Si examinamos el sentido que popularmente se da a la Estadstica,
encontramos que la opinin pblica est ms familiarizada con el trmino
estadsticas, en plural. Con frecuencia aparecen en los medios de
comunicacin informaciones acerca de acontecimientos de las esferas
poltica, econmica o social, que vienen expresadas en forma de
estadsticas. As, podemos referirnos a las estadsticas sobre los resultados
de comicios electorales, la evolucin del ndice de precios al consumidor
(IPC), las estadsticas de un partido de futbol, etc.. Los procedimientos para
llegar a esos resultados, consistentes en la recopilacin, ordenacin y presentacin
constituiran la estadstica (esta vez en singular). Sin embargo, el concepto de
estadstica ha evolucionado histricamente, tras fusionarse en el siglo XIX
con la corriente de estudios sobre el clculo de probabilidades.
Desde nuestro punto de vista, en una definicin de Estadstica debieran
considerarse los siguientes rasgos caractersticos:
La Estadstica es una ciencia que tiene por objeto el estudio de mtodos
y tcnicas para el tratamiento de conjuntos de datos numricos.
Las tcnicas estadsticas permiten la descripcin de conjuntos de datos
y la inferencia sobre conjuntos ms amplios.
Los mtodos desarrollados por la Estadstica pueden ser aplicados en
distintos campos del saber, constituyendo un importante instrumento
para la investigacin cientfica.
Centrando la atencin sobre la Estadstica aplicada al campo de la
investigacin, la Estadstica habr de ser vista como una ciencia encargada de
desarrollar mtodos, tcnicas y procedimientos para el manejo de datos, su
ordenacin, presentacin, descripcin, anlisis e interpretacin, que contribuyen: al
estudio cientfico de los problemas planteados, a la adquisicin de conocimientos
sobre las realidades en estudio, a la toma de decisiones y a la mejora de la prctica
desarrollada por cualquier tipo de profesional.

4. La Estadstica en el proceso de investigacin


Habitualmente se acepta que la Estadstica resulta ser una herramienta de
trabajo, til en la investigacin cientfica en la medida en que ofrece tcnicas
y procedimientos que pueden ser aplicados en la etapa de anlisis de datos;
sin embargo tambin es til en otros momentos del proceso de investigacin.
A continuacin mostramos los ms importantes:
a) Planteamiento del problema y formulacin de hiptesis
Manuel Hurtado Snchez

Pgina 4

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

La Estadstica est presente en la formulacin del problema de


investigacin. El proceso de investigacin constituye un todo
interrelacionado en el que las decisiones sobre cualquiera de los
elementos suponen condicionantes de cara a los restantes elementos del
proceso. Desde esta perspectiva, la formulacin del problema determinar
en buena medida el tipo de datos que es necesario recoger, las tcnicas
de recogida adecuadas para ello y los procedimientos estadsticos que se
utilizarn en el anlisis. Por otra parte, entre las caractersticas que debe
poseer cualquier problema de investigacin se encuentra su resolubilidad,
aspecto que a veces slo queda garantizado si contamos con tcnicas
estadsticas adecuadas, capaces de abordar los interrogantes de partida.
Por ejemplo, el planteamiento de problemas que supongan comparaciones
entre mltiples grupos no podra hacerse sin contar con tcnicas como el
anlisis de la varianza; un gran nmero de problemas de investigacin en
los que se incluyen mltiples dimensiones o variables simultneamente de
hecho no han llegado a ser estudiados hasta contar con tcnicas de
anlisis multivariante que permiten abordarlos.
El mismo argumento podra utilizarse para justificar la presencia de la
Estadstica en la formulacin de hiptesis. La formulacin de hiptesis no
puede hacerse de espaldas a consideraciones acerca de las tcnicas
estadsticas que permitirn su contrastacin. Como afirman Arnal, Del
Rincn y Latorre (1992), el investigador se ve en la necesidad de
salvaguardar la coherencia entre la teora, la hiptesis y el posterior
anlisis estadstico que le permitir aceptarla o rechazarla. En el marco de
los programas de investigacin positivistas la hiptesis cientfica, para ser
contrastada, suele ser expresada en trminos estadsticos, dando paso a
la aplicacin de tcnicas para el contraste de hiptesis.
En el planteamiento del problema y la posterior formulacin de hiptesis
han de tenerse en cuenta tanto el marco terico como los trabajos previos
realizados sobre el mismo tema, a cuya revisin podran contribuir tcnicas
de metaanlisis, aplicadas a la sntesis e interpretacin tanto de los
resultados obtenidos en la investigacin como de los mtodos utilizados
para ello. Los resultados a los que nos conduce el metaanlisis son
sntesis de los obtenidos en las diferentes investigaciones realizadas sobre
un tema, nos informan sobre el rigor de la misma, los mtodos empleados,
la representatividad de las muestras, la fiabilidad y validez de los estudios.
Una va para determinar las tendencias dominantes en el modo de abordar
el estudio de un tema, los aspectos del mismo que son objeto de mayor
atencin por parte de la comunidad cientfica, o los autores que por
encontrarse entre los ms citados gozan de mayor autoridad, la constituye
la utilizacin de revisiones bibliomtricas, en las que a travs de estudios
estadsticos se pueden poner de manifiesto las tendencias que se dibujan
en publicaciones o investigaciones sobre un tema. Las bases
documentales informatizadas permiten con facilidad realizar estadsticas
acerca del nmero de registros relativos a diferentes tpicos, lo cual nos
aporta cierta aproximacin a la importancia y relevancia de distintos
Manuel Hurtado Snchez

Pgina 5

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

objetos de investigacin o modos de abordarlos a lo largo de una


determinada poca.
Todo este tipo de resultados estadsticos en ningn modo sustituyen a la
revisin exhaustiva de la literatura y el estudio del marco tericoconceptual en el que se inscribe el trabajo de investigacin, pero
constituyen una informacin complementaria en manos del investigador a
la hora de concretar el objeto de inters y fundamentar su estudio.
Por otra parte, a veces la formulacin del problema no se apoya slo en
resultados de investigaciones anteriores, sino que el investigador recurre
a trabajos descriptivos previos o estudios pilotos, en los que el empleo de
la Estadstica puede contribuir a clarificar el problema en estudio. Los
resultados de una descripcin estadstica acerca de determinadas
variables implicadas en algn fenmeno, podran dar pie a que se formulen
hiptesis en las que se contemple la relacin entre variables; y estudios
basados en la obtencin de medidas estadsticas de correlacin entre
variables facilitaran el planteamiento de problemas y la formulacin de
hiptesis que suponen relaciones de causalidad. Tatsuoka y Tiedeman
(1963), en su trabajo sobre la Estadstica en el mtodo cientfico, insisten
en esta posibilidad, afirmando el papel de las tcnicas estadsticas en el
desarrollo de constructos tericos e hiptesis acerca de las relaciones
entre ellos. De este modo, la Estadstica est presente en la fase inductiva
del mtodo cientfico, contribuyendo a la creacin de modelos tericos a
partir de los cuales se deducirn hiptesis contrastables que relacionan
variables observables.
b) Diseo de investigacin y del plan de recoleccin de datos
La Estadstica forma parte de los diseos de investigacin experimentales.
Como es sabido, en el concepto de diseo es posible contemplar de un
lado la organizacin de los aspectos que constituyen el experimento y, de
otro, el procedimiento estadstico que har posible la interpretacin de los
resultados. Para Kerlinger (1981:214), el principio estadstico en el que
descansa el diseo es maximizar la varianza sistemtica, regular la
varianza sistemtica extraa y minimizar la varianza de error. Las tcnicas
estadsticas constituyen una parte contemplada en el diseo del
experimento en la medida en que facilitarn el anlisis de los datos y
posibilitarn el control de la varianza debida a variables extraas. Si dentro
del diseo del experimento se consideran grupos experimentales y grupos
control, que antes de la aplicacin de los tratamientos han de ser
equivalentes, el investigador necesitar recurrir a tcnicas estadsticas
para el contraste de hiptesis acerca de la existencia de diferencias entre
los grupos y comprobar de ese modo la equivalencia pretendida.
Adems, la Estadstica est presente cuando el diseo incluye la seleccin
de sujetos. La teora de muestras proporcionar tanto los procedimientos
de seleccin como la determinacin del tamao muestral necesario para
mantener el error y la confianza dentro de lmites aceptables.
Manuel Hurtado Snchez

Pgina 6

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

c) Recoleccin de datos
La recogida de datos es una tarea en la que aparentemente no parecen
jugar un papel las tcnicas estadsticas. Sin embargo, la Estadstica est
de manera implcita presente si consideramos el modo en que se elaboran
los instrumentos utilizados para la recogida de datos (tests, cuestionarios,
protocolos de observacin, etc.). A esta disciplina corresponde un papel
crucial en la construccin de tales instrumentos, dado que las tcnicas
estadsticas estn en la base de los procedimientos por los cuales se
analizan sus caractersticas tcnicas. Por citar algunos ejemplos, la
determinacin de la fiabilidad y validez de algunos instrumentos se apoya
directamente en coeficientes de correlacin; la aplicacin de tcnicas de
anlisis de componentes principales o anlisis factorial permite explorar o
confirmar la dimensionalidad de los instrumentos; los mtodos para el
anlisis de tems, en la teora clsica de los tests o en la teora de
respuesta al tem, se basan en correlaciones y en la estimacin de
parmetros recurriendo a diferentes procedimientos estadsticos, tales
como los mtodos de mxima verosimilitud o los mtodos de inferencia
bayesiana; tests como el de chi-cuadrado permiten valorar el grado de
ajuste de las respuestas a los tems a modelos logsticos de uno, dos o
tres parmetros.
Al margen de todo el aparato estadstico que se esconde tras la
elaboracin o el anlisis de los instrumentos de recogida de datos, la
Estadstica puede participar indirectamente en la operacin de recogida
proporcionando primeras elaboraciones de los datos en el momento
mismo de su registro. Por ejemplo, cuando tras aplicar un test se registran
los resultados en forma de percentiles, resultantes de la comparacin de
la puntuacin del sujeto con un grupo normativo.
d) Anlisis descriptivo de datos
En los tiempos actuales del desarrollo de la ciencia, es innegable la
importancia de las tcnicas estadsticas en la fase de anlisis de datos.
Existe un consenso generalizado en que la forma ms adecuada de
razonar sobre la base del gran nmero de observaciones exigidas para un
estudio con pretensin generalizante, es la Estadstica.
De acuerdo con el concepto de Estadstica que hemos presentado
anteriormente, a la Estadstica le corresponden las tareas de organizacin,
descripcin, anlisis y presentacin de datos acerca de las muestras
estudiadas, y tambin de generalizacin de los resultados a las
poblaciones de donde las muestras fueron extradas. El anlisis
estadstico de los datos supone una descripcin de stos, el
descubrimiento de regularidades y la inferencia de caractersticas relativas
a conjuntos ms amplios que los directamente estudiados.
e) Estimacin Probabilstica y Prueba de hiptesis
La estadstica nos proporciona herramientas que formalizan y uniforman
nuestros procedimientos para sacar conclusiones. De alguna forma, las
Manuel Hurtado Snchez

Pgina 7

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

conclusiones estn predeterminadas por el tipo de tcnicas estadsticas


que utilicemos. Un anlisis de regresin, por ejemplo, nos permitir
obtener conclusiones acerca de la posibilidad de que determinadas
variables independientes puedan predecir el valor observado en una
variable dependiente; un anlisis de conglomerados nos llevar a concluir
sobre formas de agrupamiento entre los individuos u objetos que
estudiamos; un anlisis simple de la varianza supondr llegar a
conclusiones acerca de las diferencias significativas entre las medias de
diferentes grupos; etc. En cualquier caso, la Estadstica estar presente a
la hora de elaborar las conclusiones, aportando las claves para la
interpretacin de los resultados del anlisis.
f) Obtencin de conclusiones y redaccin del informe
La presentacin de las conclusiones, as como de todo el proceso de
investigacin, debe contar con la inclusin de resultados estadsticos.
Aunque no se trata de una aplicacin de tcnicas estadsticas en el
momento de redactar el informe, s que la Estadstica est de algn modo
presente a la hora de mostrar los resultados. Las conclusiones de un
estudio se vern convenientemente ilustradas mediante la presentacin de
tablas, cuadros, etc. recogiendo medias, porcentajes, coordenadas,
correlaciones, o cualquier otro tipo de estadsticos. La inclusin de los
pesos factoriales de las variables consideradas en un anlisis factorial, por
ejemplo, es imprescindible si queremos ilustrar el modo en que cada factor
se ve saturado por las variables observadas.
Otro tanto podemos decir acerca de los resultados estadsticos
expresados grficamente. La utilizacin de determinadas tcnicas
estadsticas y la intencin posterior de comunicar los resultados obtenidos
requieren incluir representaciones estrechamente vinculadas a aqullas
en los informes de investigacin. Tcnicas como el anlisis de
conglomerados, el anlisis de correspondencias, son indisociables de
formas de representacin grfica como dendogramas, diagramas de flujos
o grficos factoriales, respectivamente.
En cuanto a la calidad de las investigaciones, la Estadstica aporta sus
procedimientos para garantizar la validez interna y la validez externa en
los experimentos. Procedimientos de muestreo aleatorio y tcnicas
estadsticas como el anlisis de la covarianza, para controlar el efecto de
variables intervinientes que pudieran enmascarar el efecto de las variables
independientes, resultan recursos tiles en este sentido.
5. La Estadstica y los programas de investigacin cuantitativa
Frecuentemente, entre los rasgos diferenciadores de los programas de
investigacin cuantitativa frente a otros programas (sobre todo
interpretativos) se encuentra el carcter cuantitativo de las estrategias,
tcnicas e instrumentos de recogida de datos y en los procedimientos para
Manuel Hurtado Snchez

Pgina 8

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

el anlisis de los mismos. Pero de acuerdo con la posiciones integradoras,


actualmente ms extendidas, deberamos considerar que los mtodos
cuantitativos pueden ser empleados tanto desde enfoques positivistas como
desde enfoques interpretativos o crticos.
El modelo de la metodologa cuantitativa se caracteriza, entre otros
aspectos, por su asociacin a las concepciones epistemolgicas positivistas
y por el uso de la Estadstica en el anlisis de datos, mientras que la
metodologa cualitativa queda caracterizada por concepciones interpretativas
o fenomenolgicas y por el anlisis de los datos siguiendo vas diferentes a
la Estadstica.
En el caso de los mtodos descriptivos, el propsito del investigador es llegar
a describir las caractersticas de un objeto, hecho o fenmeno a partir de
algn modo de observacin sistemtica del mismo, una vez que ste ya se
ha producido. La Estadstica cuenta con un amplio abanico de tcnicas que
contribuyen directa o indirectamente al objetivo de la descripcin de un
conjunto de datos.
En los mtodos correlacionales, la presencia de la Estadstica es
indispensable, en la medida en que el establecimiento de relaciones entre
variables se apoya directamente en ndices, tcnicas o procedimientos
estadsticos especficos. Adems del uso de la correlacin, los mtodos
correlacionales se caracterizan por el empleo de tcnicas estadsticas que
permiten estudiar las covariaciones que se dan entre los fenmenos en los
que concurren mltiples aspectos o dimensiones.
Adems de stas, en los estudios en que la finalidad no es nicamente
identificar y valorar la magnitud de las interrelaciones que se dan entre
variables implicadas en determinados fenmenos, sino tambin conseguir un
cierto grado de prediccin de determinadas variables o efectos, estn
presentes tcnicas estadsticas apropiadas.
El uso de la Estadstica aparece tambin estrechamente vinculado a los
mtodos experimentales, en los que el objetivo es determinar diferencias
entre grupos debidas a la intervencin de una variable experimental o
independiente. El anlisis de los efectos producidos por la manipulacin de
variables independientes se apoya en mtodos estadsticos para el contraste
de grupos. Una preocupacin fundamental en los mtodos experimentales
radica en el control sobre la situacin. Existen diferentes modos de reducir el
error experimental, debido a la existencia de fuentes de variacin extraas,
en los diseos de investigacin. Un modo de abordarlo sera prestar un
especial inters por reducir los errores de medida, para lo cual, entre otros
aspectos relevantes, cabra situar la preocupacin por la calidad de los
instrumentos de medicin y la calidad de las medidas. En relacin a la
construccin de tales instrumentos ya fue destacado anteriormente el papel
que juegan los procedimientos estadsticos. Otros procedimientos
especficos para reducir el error experimental pasaran por el ajuste
estadstico de los datos con el fin de controlar la influencia de otras variables;
Manuel Hurtado Snchez

Pgina 9

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

es decir, determinar la varianza explicada por las variables independientes


objeto de estudio, separndola de la varianza debida a otras variables cuya
influencia sobre la variable dependiente es evidente.
Si bien los procedimientos fsicos resultan ser el medio ms adecuado para
el control de variables en la experimentacin desarrollada en ciencias fsiconaturales, en el campo de las ciencias sociales, este tipo de control no es
posible. En este campo, es muy difcil lograr situaciones en las que el
experimentador posea un dominio casi absoluto, como si sucede en las
ciencias naturales. En este contexto, la solucin al control de las variables se
consigue a travs de tcnicas estadsticas. Por ejemplo, conseguir la
aleatorizacin en la constitucin de grupos cuando stos existen de forma
natural sera difcil. Por ese motivo, las variables extraas podran estar
presentes en los grupos constituidos con distintos niveles, haciendo que los
grupos sean diferentes antes de comenzar el experimento. Gracias a la
utilizacin de tcnicas estadsticas como el anlisis de covarianza, es posible
suplir el control riguroso de la situacin en este tipo de experimentos, pues
mediante tal tcnica se consigue un ajuste estadstico de los datos que
permita comparar los grupos despus de la aplicacin del tratamiento como
si se hubiera partido de una situacin inicial de equivalencia.
5.1.

La estadstica en los programas de investigacin cualitativa.

Para algunos, an siguen considerando irreconciliables el anlisis estadstico


de datos y la investigacin que se desarrolla desde planteamientos diferentes
del tradicional marco cientfico-experimental. Sin embargo, el empleo de los
mtodos estadsticos trasciende a estos lmites y puede estar presente de
alguna manera en estudios e investigaciones realizados desde perspectivas
interpretativas o crticas, a las que globalmente podemos referirnos como
perspectiva cualitativa. Indirectamente al menos, la Estadstica contribuira a
delimitar o introducir el problema de estudio, en la medida en que ste podra
apoyarse en los resultados de estudios previos basados en el anlisis
estadstico. Comienza a ser relativamente frecuente, en el acercamiento a
las realidades educativas, partir de un estudio descriptivo extensivo con base
metodolgica cuantitativo - estadstica que abra paso a estudios de tipo
interpretativo, basados en el estudio de casos y dirigidos a profundizar en la
explicacin de los fenmenos analizados. Es lo que se ha denominado una
estrategia de combinacin metodolgica (Bericat, 1998), como forma de
integracin de mtodos cuantitativos y cualitativos.
Cuando no existe un suficiente conocimiento previo de la realidad objeto de
estudio, la fase de muestreo podra verse auxiliada por anlisis previos
realizados sobre la poblacin, que contribuyan a un mejor conocimiento de
la misma. En la medida en que se lleven a cabo estudios sobre la poblacin,
habremos de trabajar con grandes colectivos y el recurso a las tcnicas
estadsticas ser necesario. Estas permitirn por ejemplo una descripcin y/o
clasificacin de los sujetos, fenmenos o casos estudiados, que ayudarn al
investigador en la fase de seleccin de casos.

Manuel Hurtado Snchez

Pgina 10

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Existen vas diferentes a la Estadstica para llevar a cabo el anlisis de datos


en la investigacin cualitativa. En este sentido, entre los procedimientos de
anlisis de datos, entendidos como tcnicas para extraer informacin de los
datos e interpretar su significado, cabra hacer una distincin entre anlisis
cualitativo, que expresa, ordena, describe, interpreta los datos mediante
conceptos, razonamientos y palabras, y anlisis cuantitativo, en el que se
recurre a conceptos y razonamientos que se apoyan en nmeros y
estructuras matemticas (Yela, 1994). Aunque lo ms caracterstico es el
empleo de tcnicas cualitativas, al analizar los datos son muchos los
investigadores interpretativos o crticos que recurren en algn momento de
su proceso analtico a las tcnicas estadsticas, usadas para complementar
o contrastar las conclusiones obtenidas por otras vas. Incluso este rasgo se
ha destacado como una caracterstica de los enfoques de investigacin
interpretativos o crticos, en los que se recurre, sobre todo a la hora del
anlisis de datos, a procedimientos cuantitativos propios del enfoque
positivista (De Miguel, 1988).
La naturaleza de los datos cualitativos palabras, y no nmeros
constituye una dificultad metodolgica en la investigacin cualitativa, pues si
bien las palabras encierran una mayor carga de significados, los nmeros
tienen la ventaja de ser menos ambiguos y son analizados con menor
esfuerzo. Esta razn lleva a una parte de los investigadores a preferir el
trabajo con nmeros y traducir los textos en valores numricos desde las
primeras fases del anlisis. Para Miles y Huberman (1984:215), cuando
identificamos un tema o modelo estamos aislando algo que ocurre un nmero
de veces y que ocurre consistentemente de un modo especfico, es decir
respecto a cualquier tema establecemos algn tipo de recuento. Los
nmeros, siguiendo a estos autores, permiten que nos hagamos una idea de
la importancia de los temas que tenemos ante nosotros cuando trabajamos
con un volumen importante de datos cualitativos, y constituyen un criterio a
la hora de verificar la existencia de una hiptesis o relacin entre temas.
Autoras tan representativas de la investigacin etnogrfica como Goetz y
Lecompte (1988:178-179) reconocen igualmente el papel de los datos
numricos, al afirmar que una vez identificados los elementos, es posible
reducirlos a forma cuantificable examinndolos, elaborando listas,
codificndolos y asignndoles puntuaciones.
Partiendo de las frecuencias con que se dan determinados fenmenos o
estn presentes determinados temas en los textos, identificaramos las
relaciones que se dan entre los elementos mediante la aplicacin de
determinadas tcnicas estadsticas, cuya importancia en el contexto de un
anlisis de datos cualitativos vara ampliamente, desde una presencia nula
hasta el uso de tcnicas estadsticas de variado grado de complejidad
(Wilcox, 1982).
Cuando los resultados de la cuantificacin de textos son analizados
estadsticamente, conviene emplear pruebas estadsticas inferenciales,
Manuel Hurtado Snchez

Pgina 11

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

preferentemente no paramtricas, dado que con este tipo de datos no es


posible mantener el supuesto de normalidad de la poblacin, en el que en
gran medida se apoya la Estadstica clsica. Adems, no podramos pasar
mucho ms all de un nivel de medida nominal y ordinal.
5.2. Lmites de la Estadstica en el estudio de una realidad social.
Hasta ahora hemos comentado la amplia gama de posibilidades que la
Estadstica ofrece en las diferentes etapas del proceso de investigacin. De
alguna forma, la Estadstica es una herramienta fundamental en la
metodologa de investigacin, hasta el punto de que ha llegado a ser
considerada como el lenguaje de la ciencia.
Si el progreso de la Estadstica puede ser entendido como un verdadero
motor para el desarrollo de la investigacin cientfica, tambin es verdad que
la aplicacin de la Estadstica en algunos campos de la investigacin, como
el campo de la educacin o la sociologa, etc. se ve limitada por fronteras que
surgen a veces de una mala concepcin de estas herramientas, traducida en
un uso inadecuado o para fines cuestionables, y otras, de las limitaciones con
las que las propias tcnicas cuentan, especialmente cuando se trata de
abordar un objeto de estudio tan complejo como los educativos o sociales.
5.3.

Usos incorrectos de la Estadstica

La Estadstica no puede ser empleada ms all de lo que la utilizacin


adecuada de las tcnicas permite, ni puede responder a finalidades distintas
a las que le son propias. De acuerdo con esta idea, recogemos a
continuacin los principales factores o circunstancias que conllevan un uso
inadecuado de las tcnicas estadsticas.
a) Fines cuestionables
El empleo de la Estadstica no puede obedecer a la finalidad de enmascarar
conscientemente la realidad, tratando de presentar slo determinadas
perspectivas acerca del objeto estudiado. Ya comentbamos al inicio de
este trabajo la percepcin que algunos poseen acerca de la Estadstica,
considerndola como un instrumento para ocultar informacin bajo la
apariencia de objetividad y veracidad. Kruskal (1978:1073) denunciaba el
mal uso de la Estadstica por quienes la utilizan para tratar de ofuscar,
mitificar o impresionar.
Otro de los usos incorrectos de la Estadstica consiste en emplearla con el
fin de justificar el rigor de un trabajo, con base en la falsa idea de que los
resultados de un estudio quedarn avalados por la sofisticacin de los
procedimientos estadsticos utilizados, y ms an si stos han sido llevados
a cabo con el auxilio de paquetes estadsticos informatizados. Tambin
Kruskal (1978:1073) adverta de este mal uso, cuando afirmaba que los
mtodos estadsticos sirven a algunos para suministrar el requisito de
autenticidad cientfica. Ello se basa en una asociacin falaz entre la
complejidad de la tcnica y la calidad de la investigacin, que conduce a
Manuel Hurtado Snchez

Pgina 12

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

una especie de fetichismo estadstico, cuando bien sabemos que la


complejidad del aparato estadstico no va a mejorar los resultados de la
investigacin. En realidad, la calidad de las conclusiones de un estudio
depende de otros muchos elementos del proceso de investigacin, tales
como una slida fundamentacin terica, la correcta delimitacin del
problema y formulacin de hiptesis, la adecuada seleccin de los
individuos estudiados o las tcnicas empleadas en la recogida de datos.
De alguna forma, las consideraciones expuestas hasta ahora apuntan hacia
la necesidad de observar ciertas reglas ticas en el uso de la Estadstica,
las cuales incluiran junto a su no utilizacin para ocultar la verdad o para
servir a finalidades que no le son propias, consideraciones acerca del
anonimato y la confidencialidad en el uso de los datos y resultados
obtenidos (Moore, 1979). Y, por supuesto, habra que aadir la necesidad
de que el analista no llegue a alterar los datos con los que trabaja, ni elimine
aquellos casos que hacen alejarse los resultados obtenidos de lo esperado,
con la justificacin de que posiblemente se trate de errores de medida o
codificacin.
b) Subordinacin del problema al mtodo
La eleccin de las tcnicas estadsticas estan subordinadas al objetivo de
investigacin, es decir, debe dar respuesta a los interrogantes o problemas
planteados. A veces, la seleccin de los procedimientos estadsticos podra
responder a ciertas modas que llevan al empleo constante de determinadas
tcnicas en detrimento de otras que tal vez resulten ms adecuadas. Ms
grave an resultara el uso incorrecto de la Estadstica que supone hacer
depender el problema de investigacin del mtodo estadstico que vamos a
emplear, invirtindose as el orden epistemolgico. Es decir, podra caerse
en la incorreccin de seleccionar un problema con el nico fin de utilizar
tcnicas cuyo uso es novedoso o est bien valorado dentro de la comunidad
cientfica.
En ningn caso es la Estadstica el fin de la investigacin, sino un medio
para su desarrollo. La investigacin no puede reducirse al empleo de
sofisticadas tcnicas de anlisis estadstico, sin que exista un trasfondo
terico del que surge el problema investigado, dando lugar a lo que algunos
han calificado de vaciamiento terico y trasvase desde el diseo de
investigacin al diseo estadstico (Bartolom, 1988).
Cabra aqu recoger las palabras de Cormack (1971) cuando afirma que la
Estadstica es una combinacin de tcnicas y sentido comn, sin que ste
pueda ser sustituido por aqullas. El autor citado refleja su pensamiento con
una muy ilustrativa metfora:
Las tcnicas son los caballos; el sentido comn sostiene las riendas
(1971:164). En nuestro campo de estudio, podemos sealar parafraseando
la afirmacin anterior que la aplicacin de la Estadstica supone una
combinacin de tcnicas y conocimiento sobre el tema investigado. Como
afirman Box, Hunter y Hunter (1989) al ocuparse de la utilizacin de la
Manuel Hurtado Snchez

Pgina 13

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Estadstica, las tcnicas son ms efectivas cuando se combinan con el


apropiado conocimiento del tema al que se aplican.
c) Violacin de supuestos
La Estadstica no puede ser aplicada sin ms en la investigacin. El
investigador que emplea modelos estadsticos ha de establecer una
correspondencia entre los sistemas formales y la realidad estudiada;
considerar unos supuestos (que no son sino axiomas de ciertos modelos
matemticos) de manera que las deducciones a las que llegue a partir del
modelo estadstico sean vlidas para interpretar la realidad slo en la
medida en que se cumplan dichos supuestos (Tejedor, 1986).
Por tanto, cada tcnica de anlisis estadstico requiere el cumplimiento de
unas condiciones para poder ser aplicada, y esta aplicacin ha de ir
precedida de un estudio sobre el cumplimiento o no de tales condiciones. A
veces, la violacin de los supuestos de partida conlleva pequeas
alteraciones sobre los resultados que en parte pueden ser previstas por el
investigador; pero como norma general, y ante el desconocimiento de la
robustez de las pruebas y los efectos que la violacin de los supuestos
pueda acarrear sobre los resultados, es preferible ajustarse a la ms pura
ortodoxia si no queremos que las conclusiones extradas puedan resultar
poco vlidas.
d) Conocimiento insuficiente de las tcnicas
La utilizacin de la Estadstica presupone un conocimiento de las propias
tcnicas y procedimientos empleados. A veces, el investigador posee
concepciones errneas que pueden limitar la utilizacin correcta de las
herramientas estadsticas. As, por ejemplo, algunos de los errores
habituales podran ser el pensar que cuando no se rechaza la hiptesis nula
sta queda confirmada, el considerar que una relacin alta entre las
variables implica causalidad, o creer que el anlisis de la varianza permite
un contraste de varianzas en lugar de un contraste de medias. Reflexiones
acerca de los errores conceptuales en Estadstica pueden encontrarse en
el artculo de Cohen (1990), e interesantes consideraciones en este mismo
sentido aparecen en el trabajo de Vallecillos y Batanero (1995).
La carencia de una suficiente formacin estadstica podra llevar a algunos
investigadores a limitar su uso a tcnicas relativamente simples e
insuficientes para abordar y resolver problemas relevantes. A veces, esta
situacin deriva en un traspaso de responsabilidades a expertos que se
encargan de realizar los anlisis estadsticos. Sin embargo, la colaboracin
entre investigadores y estadsticos profesionales no est exenta de
problemas, fundamentalmente derivados de la dificultad de comunicacin.
La aplicacin de las tcnicas estadsticas en la investigacin educativa
requiere adems el conocimiento profundo de las reglas de interpretacin
de los resultados obtenidos. El producto de los anlisis estadsticos ha de
ser interpretado y traducido a conclusiones relevantes de cara al problema
investigado. La aplicacin de la Estadstica implica una modelizacin del
Manuel Hurtado Snchez

Pgina 14

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

problema, operativizndolo en trminos matemticos susceptibles del


razonamiento lgico que las tcnicas conllevan, y finalmente una traduccin
de los resultados a los trminos en que se plante el problema de partida.
Las conclusiones no son las que el analista espera conseguir, sino que se
derivan directamente de los ndices, valores, grficos o tablas obtenidas,
cuya interpretacin requiere un conocimiento exhaustivo de la tcnica
empleada y, a veces, cierta experiencia, olfato o incluso imaginacin. Por
ejemplo, al hablar de la interpretacin de los resultados del escalamiento
multidimensional, Kruskal y Wish (1986) consideran que stos estn
subordinados a lo que denominan una interpretacin creativa.
5.4.

Limitaciones intrnsecas de la Estadstica

En cuanto a los lmites propios de las tcnicas estadsticas, podemos


comenzar hablando de la incertidumbre respecto a los resultados. El
conocimiento al que llegamos a travs de la Estadstica y en general de
cualquier investigacin cientfica - no es exacto sino probable. No debemos
olvidar que las conclusiones alcanzadas por medio de los procedimientos
inferenciales se apoyan en conceptos probabilsticos y contemplan la
posibilidad de un margen de error.
Por otra parte, los resultados del anlisis estadstico pueden resultar
incompletos en s mismos. Por ejemplo, al realizar un anlisis de la varianza
somos capaces de determinar los factores que explican la varianza
experimental, pero desconocemos qu se esconde detrs de la varianza de
error. En un anlisis de regresin llegamos a explicar slo un porcentaje de
la varianza de la variable dependiente, pero desconocemos qu elementos
se esconden tras la varianza no explicada. De alguna forma, el
conocimiento que nos permiten las tcnicas estadsticas es limitado.
Cuando la Estadstica es aplicada a la investigacin en ciencias sociales
surgen limitaciones adicionales derivadas de la complejidad del objeto de
estudio. Las realidades sociales, los comportamientos humanos resultan
extremadamente multifacticos y estrechamente vinculados a las
caractersticas del contexto en el que se dan, de tal forma que muchos
consideran difcil que los nmeros sean capaces de reflejarlos. El nmero
supone alejarse de la riqueza de significados asociada al objeto de estudio.
Por otra parte, las tcnicas estadsticas implican seleccionar un modelo que
traduce la realidad emprica en un sistema formal de elementos
relacionados; si tratamos de que este modelo sea simple nos alejamos del
fenmeno real, mientras que si incluimos en este modelo la complejidad de
la situacin convertiramos el problema en prcticamente inabordable desde
el punto de vista de la metodologa estadstica.
Algunos conceptos estadsticos resultan aparentemente opuestos a la
naturaleza de los fenmenos en que interviene el hombre. La idea de
causalidad que subyace a determinados modelos estadsticos supone para
algunos que la conducta humana podra llegar a estar determinada por
causas externas. No obstante, es necesario matizar que en los modelos
Manuel Hurtado Snchez

Pgina 15

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

causales no se llega a explicar mucho ms del 50% de la varianza; la


libertad humana podra permanecer formando parte de la varianza no
explicada o trmino de error.
Existen dificultades epistemolgicas que obstaculizan en las ciencias
humanas la utilizacin de la experimentacin tal y como es aplicada en las
ciencias fsico-naturales, y por tanto, la aplicacin de la Estadstica. Para
que los grupos sean comparables es preciso que las diferencias individuales
se repartan en ellos del mismo modo, objetivo que puede lograrse, entre
otras vas, con los procesos de aleatorizacin. Sin embargo, habitualmente
los grupos con los que trabajamos son grupos naturales, preexistentes en
el contexto estudiado (grupo de alumnos de una clase, profesores de un
centro, etc.), sin que podamos controlar la asignacin de los sujetos a los
grupos.
La aleatoriedad de las muestras no es el nico caso. Buena parte de los
supuestos exigidos para la aplicacin de las tcnicas estadsticas no
siempre se dan en la realidad social. Es el caso de la distribucin normal de
las variables o del supuesto de homoscedasticidad de varianzas. Por otra
parte, la aditividad resulta difcil de aceptar cuando medimos realidades no
observables directamente. Adems, gran parte de la Estadstica inferencial
se apoya en distribuciones de frecuencias para poblaciones infinitas,
cuando en el mundo real, y en particular en el mundo social, se suelen
estudiar poblaciones finitas.
Adems de estas objeciones epistemolgicas, la medida en ciencias
sociales presenta ciertas dificultades que limitan el alcance de los
resultados a los que nos conduce el anlisis estadstico de los datos. Entre
los problemas ms importantes de las ciencias sociales se encuentra la
obtencin de mtodos adecuados de medicin, en este campo no existen a
veces instrumentos adecuados o unidades de medida para valorar
dimensiones o caractersticas de los fenmenos.
Todo ello hace que, aun reconociendo el importante papel que desempean
las tcnicas estadsticas en la investigacin social, su empleo sea
contemplado con cierta cautela, puesto que un uso incorrecto de las
tcnicas de anlisis, bien por desvirtuar sus fines y su lugar natural en el
proceso de investigacin, o bien por desconocimiento, puede llevarnos a
cuestionar su pertinencia para el estudio de los problemas planteados.
Adems, es preciso ser conscientes de las propias limitaciones de los
mtodos estadsticos y de los supuestos estadsticos que imponen a las
situaciones estudiadas, que en el caso de las educativas podran resultar
difciles de cumplir. En la medida en que se tengan en cuenta
consideraciones de este tipo, conseguiremos combatir la imagen negativa
que no pocas veces se proyecta de la Estadstica.

Manuel Hurtado Snchez

Pgina 16

UNIVERSIDAD SAN PEDRO

II.

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

EL MTODO ESTADSTICO

El mtodo estadstico consiste en una secuencia de procedimientos para el


manejo de los datos cualitativos y cuantitativos de una investigacin.
Dicho manejo de datos tiene por propsito la comprobacin, en una parte de
la realidad, de una o varias consecuencias verificables deducidas de la
hiptesis general de la investigacin.
Las caractersticas que adoptan los procedimientos propios del mtodo
estadstico dependen del diseo de investigacin seleccionado para la
comprobacin de la consecuencia verificable en cuestin.
En la investigacin estadstica por su naturaleza, pueden distinguirse cinco
etapas:
1. Planeamiento:
a. Fundamentacin y comprensin del estudio del estudio e identificacin de las
variables.
b. Determinacin de objetivos
c. Organizacin de las variables, precisin de los datos e informacin requerida.
d. Identificacin y evaluacin de las fuentes de informacin.
e. Identificacin y anlisis de estudios similares.
f. Determinacin del mbito de investigacin.
g. Preparacin del plan para ejecutar la investigacin.
h. Formacin y capacitacin del equipo de trabajo.
i. Elaboracin del calendario de actividades
j. Formulacin del presupuesto y fuentes de financiamiento.

k. Diseo y ejecucin de una prueba piloto o experimental


2. Recopilacin de datos: La recoleccin de datos es el momento en el
cual el investigador se pone en contacto con los objetos o elementos
sometidos a estudio, con el propsito de obtener los datos o respuestas
a las variables analizadas. Los mtodos de recoleccin son diversos y
dependen de las posibilidades de acceso o contacto con los elementos
investigados, del tamao de la poblacin o muestra de la oportunidad de
obtener datos y del presupuesto y de las exigencias del tiempo.
3. Organizacin y presentacin de datos,
Despus de la recoleccin de datos, se procede a su organizacin,
clasificacin y tabulacin, de modo que se facilite la presentacin en
tablas, cuadros o grficos.
Como tarea previa a la organizacin es indispensable realizar una
evaluacin, crtica, correccin y ajuste de los datos, el propsito es
superar las omisiones, o inconsistencias y desechar las respuestas no
significativas o errneas. Debemos tener presente que la validez de sus

Manuel Hurtado Snchez

Pgina 17

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

resultados y conclusiones dependen en gran medida de la fidelidad de


los datos utilizados.
Realizadas las correcciones o ajustes, se inicia el procesamiento de
datos con un anlisis exploratorio, y la construccin de tablas o grficos
de distribuciones de frecuencias, clculo de medidas de resumen, etc.
4. Anlisis e interpretacin de resultados.
En esta etapa se aplican los argumentos matemticos y tericos de la
estadstica. A travs de mtodos estadsticos se calcula indicadores y
medidas de resumen, se establecen relaciones entre variables, se
estiman valores, se ejecutan pruebas estadsticas, etc., como elementos
de referencia para la descripcin, anlisis e interpretacin del
comportamiento de los datos, hacer inferencias vlidas y obtener
informacin de los elementos o unidades estudiadas.
5. Obtencin de conclusiones y preparacin del informe
En toda investigacin debe analizarse el cumplimiento de los objetivos,
en funcin de los resultados fundamentales. Esta contrastacin permite
elaborar un resumen de los aspectos sustantivos, que luego se
expresarn en forma de conclusiones y sugerencias orientadoras en la
toma de decisiones.
En la siguiente ilustracin se esquematiza la relacin que existe entre la
estadstica y las etapas de la investigacin cientfica:

Conocimiento

Problema

Hiptesis

Conocimiento

Deduccin de consecuencias
verificables
Diseo de
investigacin
Mtodo Estadstico
1. Planeamiento
2. Recopilacin de datos
3. Organizacin y presentacin de datos
4. Anlisis e interpretacin de resultados
5. Obtencin de conclusiones y preparacin del informe

Realidad

Manuel Hurtado Snchez

Pgina 18

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Ejemplo: En el siguiente problema, sobre mortalidad de los mdicos por


cncer pulmonar en relacin con el hbito de fumar
Con el mismo sistema de enumeracin empleado en el esquema anterior,
identifique las etapas del Mtodo Estadstico que se encuentran presentes en
el siguiente relato y anote las letras correspondientes en los recuadros de
los prrafos (algunos recuadros pueden quedar vacos):

Al revisar las estadsticas de enfermedades y defunciones por


enfermedades pulmonares se encontr que casi todos los casos de
enfisema pulmonar y varios de cncer pulmonar tenan en muchas
ocasiones el antecedente de tabaquismo crnico.

Sin saber el porqu de tal relacin, en un estudio de numerosos casos de


cncer pulmonar se observ que alrededor del 70% de los enfermos eran
antiguos fumadores.

Esto hizo pensar que el consumo de tabaco pudiera ser un factor


favorecedor o causal del cncer pulmonar.

Si lo anterior fuera cierto, podra inferirse lo siguiente a) Un grupo de


fumadores de determinada edad, sexo y nivel socioeconmico
presentara un nmero mayor de muertes por cncer pulmonar que un
grupo de no fumadores de edad, sexo y nivel socioeconmico similares y
b) La frecuencia de cncer pulmonar sera mayor al aumentar el nmero
de cigarrillos consumidos.

Luego de discutir si convena formar un grupo de mdicos fumadores y


seguirlo a lo largo de varios aos o formar un grupo de mdicos
fumadores y uno de no fumadores, se resolvi hacer la investigacin
enviando un cuestionario a un nico pero numeroso grupo de mdicos
del Reino Unido.

De ellos, se solicitaron datos individuales sobre, edad y hbitos de fumar


por medio del cuestionario de referencia. Dicho cuestionario fue puesto a
prueba para comprobar que meda con precisin las diversas variables
en estudio. Se establecieron adems conexiones con el Registro de
Defunciones para asegurar la informacin sobre la mortalidad por cncer
pulmonar que fuera ocurriendo en los mdicos a quienes se incluy en el
estudio.

Aunque el nmero de datos preguntados a cada mdico era pequeo, la


cantidad de mdicos a quienes se envi el cuestionario sumaba varios
miles. Por ello tuvo que hacerse uso de las que en esa poca se
consideraban modernas computadoras.

Los datos se mostraron solamente en forma de cuadros o tablas.

Manuel Hurtado Snchez

Pgina 19

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

El resumen de la informacin obtenida se expres en tasas de mortalidad


por cada mil mdicos.

Las tasas de mortalidad por cada mil mdicos fueron comparadas para
averiguar, si parecan existir diferencias significativas, desde el punto de
vista estadstico entre quienes murieron por cncer pulmonar segn el
antecedente de si fumaban o no.

Los resultados mostraron que el riesgo de morir fue 14 veces mayor en


fumadores que en no fumadores. Tambin se observ que en los
fumadores la frecuencia de estas muertes aument cuando la cantidad
de tabaco que se consuma era mayor.

III. Conceptos bsicos


1. Poblacin: Es el conjunto de todas las unidades de anlisis cuyas
caractersticas se van a estimar. Una poblacin debe definirse en
trminos de su contenido, extensin y tiempo. Una poblacin en
estudio debe estar definida sin ambigedad, de manera que no d lugar
a confusiones.
Ejemplo: Estudiantes de la UNSP de Chimbote matriculados en el ciclo
acadmico 2015-I.
Poblacin Objetivo.- La poblacin objetivo est constituida por todos
los elementos (unidades de observacin), sin lmite a travs del tiempo
y del espacio, que constituyen el objetivo final de la generalizacin o
inferencia.
Poblacin muestral.- La poblacin muestral est constituida por una
parte o un subconjunto de la poblacin objetivo. Est determinada y
delimitada en el tiempo y en el espacio y de cuyos elementos en la
prctica se obtiene la muestra para realizar el estudio.
2. Muestra: Una muestra es un subconjunto de la poblacin, una porcin
del total, que nos representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es ms que eso, una parte del
todo que llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan tiles para llevar a cabo
un trabajo de investigacin. Lo que se busca al emplear una muestra es
que, observando una porcin relativamente reducida de unidades
tamao adecuado-, se obtengan conclusiones semejantes a las que
lograramos si estudiramos la poblacin completa. Cuando una
Manuel Hurtado Snchez

Pgina 20

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

muestra cumple con esta condicin, es decir, cuando nos refleja en sus
unidades lo que ocurre en el universo, la llamamos muestra
representativa. Por lo tanto, una muestra representativa contiene las
caractersticas relevantes de la poblacin en las mismas proporciones
en que estn incluidas en tal poblacin. Sus conclusiones son
susceptibles de ser generalizadas al conjunto del universo, aunque para
ello debamos aadir un cierto margen de error en nuestras
proyecciones.
Las muestras pueden ser clasificadas, en una primera divisin en
probabilsticas y no probabilsticas.
En las muestras probabilsticas, la caracterstica fundamental es que
todo elemento del universo tiene una determinada probabilidad de
integrar la muestra, y esa probabilidad puede ser calculada
matemticamente con precisin. En las muestras no probabilsticas
ocurre lo contrario y el investigador no tiene idea del error que puede
estar introduciendo en sus apreciaciones.
3. Marco Muestral
Un marco muestral es una lista de unidades de muestreo de tal forma
que se pueda seleccionar de all, las unidades que constituirn la
muestra. El marco muestral es indispensable, al menos cuando se trata
de realizar un muestreo probabilstico.
Ejemplos:
La gua telefnica
Padrn de empresas pblicas y privadas
Un plano de la ciudad.
El listado de alumnos.
4. Variable: Es una caracterstica que puede tomar diferentes valores;
Tambin se dice que son caractersticas observables, susceptibles de
adoptar distintos valores o ser expresados en distintas categoras.
Clasificacin de variables
A. Por su Naturaleza
A.1. Cualitativas: Expresan una cualidad de la unidad elemental o
de anlisis. Ej. Lugar de procedencia, Lugar de nacimiento, etc.
A.2. Cuantitativas: Expresan una cantidad, la cual puede obtenerse
mediante procesos de conteo o de medicin haciendo uso de algn
instrumento de medida para dicha variable; por lo que a su vez se
pueden subdividir en:

Manuel Hurtado Snchez

Pgina 21

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

A.2.1. Discretas: Expresan cantidades aisladas mediante


nmeros enteros o racionales (a/b), su valor se suele obtener
mediante procesos de conteo. Ej. Nmero de hijos por mujer,
nmero de estudiantes matriculados por asignatura, nmero de
trabajadores por empresa, etc.
A.2.2. Continuas: Expresan cantidades usando los nmeros
reales, los cuales son obtenidos mediante procesos de
medicin utilizando algn instrumento de medida. Ej. Peso de
un recin nacido, Tiempo de vida de un foco, etc.
B. Por su escala de medida
B.1. Nominal: Permite clasificar y no admite ninguna operacin
matemtica. Ejemplo: Carrera de estudio, lugar de procedencia, etc.
B.2. Ordinal: Permite clasificar y ordenar, adems es posible
establecer relaciones < y >. Ejemplo: Rango militar, clase social, nivel
de instruccin, etc.
B.3. Intervalo: Permite clasificar, ordenar y medir distancias pero con
cero relativo. Admite todas las operaciones matemticas, excepto la
divisin. Ejemplo: Temperatura, puntaje de un test psicomtrico
validado, etc.
B.4. Razn: Permite clasificar, ordenar y medir distancias con cero
absoluto. Admite todas las operaciones matemticas. Ejemplo: Peso,
estatura, nmero de hijos por mujer, etc.
C. Por el tipo de relacin: es necesario la presencia de por lo menos
dos variables
C.1. Dependientes: Su valores dependen del valor de otra variable.
Ejemplo: rendimiento acadmico.
C.2. Independientes: Sus valores no dependen de otra variable,
sino de la voluntad del investigador. Ejemplo: Horas de estudio
C.3. Intervinientes: Son aquellas que condicionan el modo de
influencia de la variable independiente sobre la dependiente.
Ejemplo: Nivel de estrs.
D. Por el orden en el registro de datos.
D.1. Atemporales. Los valores NO estn asociados al tiempo en que
fueron registrados. Sexo, Lugar de procedencia, etc.
D.2. Temporales (Series de tiempo). Los valores estn asociados al
tiempo en que fueron registrados de la fuente primaria. Ejemplo:
Preferencia electoral actual, ventas mensuales, etc.

Manuel Hurtado Snchez

Pgina 22

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

E. Por la amplitud
E.1. Individuales: Se refieren a las caractersticas de las unidades
elementales, como por ejemplo personas
E.2. Privadas: Se refieren a las caractersticas de las unidades
elementales que voluntariamente permiten su observacin, por
ejemplo: Coeficiente de inteligencia, Nivel de estrs, etc.
E.3. Pblicas. Se refieren a caractersticas que pueden ser
observadas incluso sin el permiso del individuo, por ejemplo: Sexo,
raza, color de cabello, etc.
E.4. Colectivas: son caractersticas que se refieren a colectivos de
unidades elementales. Ejemplo: Tasa de morbilidad en una
poblacin, inflacin, etc.

F. Por el nmero de variables:


F.1. Unidimensionales: Se refieren a una sola caracterstica
observada en una unidad de anlisis
F.2. Bidimensionales: Se refieren a dos caractersticas observadas
en una misma unidad de anlisis
F.3. Pluridimensionales: Se refieren a ms de dos caractersticas
observadas en una misma unidad de anlisis
5. Medicin:
Es el proceso mediante el cual se obtiene el registro del valor de una
variable en una unidad de anlisis especfica, utilizando para ello la
comparacin de la caracterstica con un patrn.
Dependiendo de la variable de la cual se desea obtener datos o registro
de su valor en una unidad de anlisis, existir un instrumento de
medida. Cuando la variable corresponde a una caracterstica fsica o de
la naturaleza, generalmente existe un instrumento fsico que permite
realizar tales mediciones, como por ejemplo una balanza para registrar
el peso de un objeto, etc, en cambio cuando la variable es del tipo social,
stas generalmente son conceptos abstractos que no pueden ser
directamente medibles, por lo que es necesario un proceso mediante el
cual este concepto abstracto se vuelve medible a travs de un sistema
de indicadores. Este proceso es conocido como Operacionalizacin de
variables.
Operacionalizacin de variables
Es el proceso mediante el cual se hace medible una variable con un
nivel de abstraccin elevado o que no es directamente medible.

Manuel Hurtado Snchez

Pgina 23

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

CONCEPTO

Variable

Categoras de la Variable:

Terica

A:

C:

B:

D:

Definicin
conceptual

OPERACIONALIZACIN

DIMENSIONES

Definicin operacional
de cada dimensin

INDICADORES

.
Cuadro de
categorizaciones de la
variable principal a partir
de los indicadores

Variable
Emprica

Ejemplo del cuadro de operacionalizacin de la variable Nivel Socioeconmico (NSE)


CONCEPTO

DIMENSIN

(Variable terica)

Nivel
Socioeconmico
(NSE):
Es una caracterstica de un
hogar. El hogar obtiene su
NSE a partir de
caractersticas propias del
mismo y el entorno en que
se mueve. La primera
forma la parte econmica
del NSE y la segunda la
parte socio del NSE.
Adems, el NSE incorpora
tanto caractersticas fsicas
de la vivienda que habita el
hogar, como de las
personas que integran al
hogar.

Manuel Hurtado Snchez

INDICADOR
(Variable Emprica)

D1: Nivel Social:


Es el entorno en que el
hogar se mueve (los dems
hogares con los que
interacta; La ocupacin
que tienen, las escuelas a
que se asiste, el club
deportivo al que pertenece,
las actividades culturales).

D2: Nivel econmico:


Est determinado por la
capacidad econmica del
hogar (cmo est
constituido y cmo son las
personas que lo conforman;
qu artculos o posesiones
tiene)

I1: Nmero de aos de


estudio del jefe del hogar
I2: Grado acadmico del jefe
del hogar
I3: Ocupacin del Jefe del
hogar
I4: Zona de residencia

I5: Turismo
I6: Ingreso econmico familiar
mensual

I7: Gasto en alimentacin


I8: Vehculos

Valores o
cualidades
Nmero
Ninguno, Br., Mg.,
Dr.
Gerente, , obrero
eventual o ambulante
Urb. Santa Victoria,
, P.J. El Bosque
Turismo Internacional,
Turismo nacional,
Turismo local,
No hace turismo
En nuevos soles
En nuevos soles
Uso particular del ao
Uso Partic. No del ao
Para trabajo

Pgina 24

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

1. Nivel Alto A1: En esta categora se encuentran las personas que tienen un nivel de
estudios Superior / post-grado, con un promedio en aos de estudios de 17.5. Estas
personas ocupan cargos de Gerentes Generales cuyo ingreso es de $5000. Y tienen
un gasto promedio mensual de $750 en alimentos. En servicios de televisin a control
remoto es al 100% de igual manera en tenencia de telfono y servicios domsticos.
2. Nivel Medio Superior A2: En esta categora se encuentran las personas con un nivel
de estudios Superior Universitarios, con un promedio de aos de estudios de 16.8.
Estas personas ocupan cargos profesionales independientes / dependientes, con un
ingreso familiar mensual ms de $2000, y tienen un gasto promedio mensual de $450
en alimentos, tienen televisin a control remoto, tienen telfono y servicio domstico.
3. Nivel Medio Tpico B1: En esta categora se encuentran las personas con un nivel de
estudios Superior Universitario, con un promedio en aos de estudios de 16.7. Estas
personas ocupan cargos profesionales independientes / dependientes. Con un ingreso
familiar mensual ms de $1000, y tienen un gasto promedio mensual de $280 en
alimentos. En servicios de tenencia de televisin a control remoto es de 92% en
tenencia de telfono es de 96% y en servicios domsticos es de 67%.
4. Nivel Medio Inferior B2: En esta categora se encuentran las personas con un nivel de
estudios Universitario y no Universitario, con un promedio en aos de estudios de 15.1.
Estas personas ocupan cargos especializado/ profesional independiente. Con un
ingreso familiar mensual ms de $780, y tienen un gasto promedio mensual de $235 en
alimentos. En servicios de tenencia de televisin a control remoto es de 82% en
tenencia de telfono es de 92% y en servicios domsticos es de 32%.
5. Nivel Bajo Superior C1: En esta categora se encuentran las personas con un nivel de
estudios Superior no Universitario/ Secundaria, con un promedio en aos de estudios
de 13.1. Estas personas ocupan cargos pequeos Comerciantes/ Trabajo especializado
Con un ingreso familiar mensual ms de $400, y tienen un gasto promedio mensual de
$180 en alimentos. En servicios de tenencia de televisin a control remoto es de 77%
en tenencia de telfono es de 73% y en servicios domsticos es de 8%.
6. Nivel Bajo Inferior C2: En esta categora se encuentran las personas con un nivel de
estudios Secundaria, con un promedio en aos de estudios de 10.6. Estas personas
ocupan cargos pequeos Comerciantes/ Trabajo especializado Con un ingreso familiar
mensual ms de $320, y tienen un gasto promedio mensual de $150 en alimentos. En
servicios de tenencia de televisin a control remoto es de 61% en tenencia de telfono
es de 56% y en servicios domsticos es de 2%.
7. Nivel Muy Bajo D: En esta categora se encuentran las personas con un nivel de
estudios Secundaria/ Primaria, con un promedio en aos de estudios de 8.8. Estas
personas ocupan cargos como Empleado poco especializado/ Obrero con un ingreso
familiar mensual ms de $230, y tienen un gasto promedio mensual de $135 en
alimentos. En servicios de tenencia de televisin a control remoto es de 42% en
tenencia de telfono es de 25% y en servicios domsticos es de 1%.
1

Nivel Bajo Extremo E: En esta categora se encuentran las personas con un nivel de
estudios Primarios, con un promedio en aos de estudios de 6.2. Estas personas
ocupan cargos como Obrero eventual/ Ambulante con un ingreso familiar mensual ms
de $150, y tienen un gasto promedio mensual de $105 en alimentos. En servicios de
tenencia de televisin a control remoto es de 16% en tenencia de telfono es de 7% y
en servicios domsticos es de 0%.

Manuel Hurtado Snchez

Pgina 25

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

PERFIL DE LOS NIVELES SOCIO ECONOMICOS


Caractersticas
dominantes

A1

A2

B1

B2

C1

C2

Alto

Medio superior

Medio Tpico

Medio
inferior

Bajo superior

Bajo inferior

Muy Bajo

Bajo Extremo

3.5

6.5

8.8

10.9

21.5

36.1

11.9

% de hogares en Lima
0.8
Metropolitana
Educacin del jefe del Superior
universitaria /
hogar
Postgrado

Superior
universitaria

Aos de estudio del


17.5
16.8
jefe del hogar
Ocupacin del jefe del Empresario /
Profesional
hogar
Gerente General Independiente /
Dependiente
Ingreso familiar
mensual bruto
Promedio
(aproximado) gasto
mensual en alimentos
Promedio
(aproximado) tenencia
de TV LSD / PLASMA
Tenencia de
telfono/Internet
Tenencia de TV
Cable
Servicio domstico
Vehculo de uso
particular

Superior
universitaria

16.7
Profesional
Independiente /
Dependiente

Superior
universitaria /
no
universitaria
15.1
Trabajador
especializado
/ Profesional
Independiente

Superior no
universitaria /
secundaria
13.1
Pequeo
comerciante /
Trabajador
Especializado

Secundaria

Secundaria
/ Primaria

Primaria /
Secundaria

10.6

8.8

6.2

Pequeo
comerciante /
Trabajador
Especializado

Empleado
poco
especializa
do / Obrero

Obrero eventual
/ ambulante

+ us$ 5,000

+ us$ 2,800

Us$ 1,000

Us$ 780

Us$ 400

Us$ 320

Us$ 230

Us$ 150

Us$ 750

Us$ 450

Us$ 280

Us$ 235

Us$ 180

Us$ 150

Us$ 135

Us$ 105

100%

100%

92%

82%

77%

61%

42%

16%

100%

100%

96%

92%

73%

56%

25%

7%

100%
Del ao

100%
De 1 ao

67%
De 3 aos

32%
De 4 aos

8%

2%

1%

0%

Fuente: Apoyo Opinin y Mercado S.A. Actualizado por M. Hurtado S. Junio/2006

IV.
Tcnicas estadsticas descriptivas
Las tcnicas estadsticas descriptivas permiten conocer, representar y
cuantificar el comportamiento de un conjunto de datos de una o ms
variables.
Datos sin agrupar

Datos agrupados
Tablas de frecuencia y grficos

Medidas de resumen:
Medidas de tendencia central, de dispersin, y de correlacin

Las tcnicas descriptivas parten de una base de datos, tal como se presenta
en la siguiente tabla N 1. El anlisis descriptivo se inicia con la organizacin
de los datos en tablas de frecuencias y su correspondiente representacin

Manuel Hurtado Snchez

Pgina 26

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

mediante grficos, con lo cual se tiene una visin panormica del


comportamiento de una variable.
Base datos para ejemplos de tablas de frecuencias
Lugar de
Procedencia

Jefe de
hogar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

1.

Chiclayo
=1
Lambayeque= 2
Ferreafe = 3
Cajamarca = 4
Piura
=5
Otros
=6
1
1
6
1
2
1
1
1
1
2
1
1
3
1
1
2
4
1
1
2
1
4
2
1
1
1
3
1
1
2
1
1
2
1
1
5
1
3
1
6

N Personas
por hogar

Edad
(aos)

Peso
(Kgr.)

Cuenta

1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4
3
5
4
3
3
4
5
4
3
5
3
3
4
3
4
6
2
5
2
6

42
39
35
41
50
39
33
30
26
32
35
26
43
40
30
46
47
38
38
45
28
43
37
36
40
32
38
49
54
31
33
44
43
25
31
34
34
36
35
36

66.6
59
69.2
73
66.3
58.6
67.5
66.1
63.1
55.8
69.1
53.9
64.4
72.2
64.4
68.1
73.2
60.5
66.4
61.9
69.1
57.9
62.7
65.7
63.8
71.6
52.4
61.9
58.8
67
63.8
73.4
61.3
61.3
66
69.8
71.1
76.9
67.2
65.9

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Organizacin de datos en tablas de frecuencias

La finalidad de una tabla de frecuencia es presentar los datos en un ordenamiento


tal que permita visualizar el comportamiento de la variable en cuanto a la
frecuencia con que aparecen de sus categoras o valores. Si la variable es del tipo
Manuel Hurtado Snchez

Pgina 27

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

cualitativa, solo se podrn encontrar frecuencias simples, es decir, el nmero de


datos que contiene cada categora o cualidad, en cambio si la variable es
cuantitativa, adems de las frecuencias simples se podrn presentar frecuencias
acumuladas, tanto en forma absoluta como relativa.
Toda tabla de frecuencia consta de tres partes:
El nmero y ttulo de la tabla: El Nmero sirve para llevar un orden correlativo y
poder hacer una referencia rpida de la tabla y el ttulo debe contener bsicamente
el nombre de la variable, las unidades elementales de donde se han obtenido los
datos y el lugar y tiempo donde estuvieron tales unidades elementales
Ejemplo

El cuerpo de la tabla. Es la tabla propiamente dicha en la cual tambin podemos


identificar tres componentes:
Encabezamiento: En la parte superior de la primera columna del lado izquierdo se
escribe el nombre de la variable y las unidades de medida.
Clases o categoras: En la primera y debajo del nombre de la variable
(encabezamiento) se ubican las clases o categoras de la variable. El nmero de
clases se suele representar por m
Frecuencias: A partir de la segunda columna se escriben las frecuencias, las
mismas que pueden ser de dos clases, absolutas y relativas, y cada una de ellas
a su vez pueden ser simples o acumuladas.
La fuente: Expresa el lugar de donde fueron obtenidos los datos, de modo tal que
cualquier persona pueda acudir a la fuente y encontrarlos. Cuando el investigador
que presenta una tabla de frecuencias es el que obtuvo los datos directamente del
informante, no es necesario que escriba la fuente.

Tabla de frecuencia para variable cualitativa


En esta clase de tablas, las categoras vienen a ser cada una de las categoras de
la variable y las frecuencias se obtienen mediante un proceso de conteo, el cual
puede ser manual o con ayuda de una computadora.

Manuel Hurtado Snchez

Pgina 28

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tabla N 2 Lugar de procedencia de los jefes de hogar residentes en el


distrito de Chiclayo. Marzo 2011
Lugar de
procedencia
Chiclayo
Lambayeque
Ferreafe
Cajamarca
Piura
Otros
Total

N de jefes de
hogar
25
7
3
2
1
2
40

Proporcin de
jefes de hogar
0.625
0.175
0.075
0.05
0.025
0.050
1

% de jefes de
hogar
62.5
17.5
7.5
5.0
2.5
5.0
100

Fuente: Encuesta a hogares, marzo 2011

Tabla de frecuencia para variables cuantitativas con pocos valores diferentes


En esta clase de tablas, las categoras vienen a ser cada una de los valores de la
variable y las frecuencias se obtienen mediante un proceso de conteo, el cual
puede ser manual o con ayuda de una computadora.
Tabla N 2 Nmero de miembros por hogar en el distrito de Chiclayo.
Marzo 2011
N
Nmero de
Acumulado
miembros N de Proporcin % de
de
por hogar hogares de hogares hogares hogares
1
2
0.0500
5.00
2
2
7
0.1750
17.50
9
3
12
0.3000
30.00
21
4
10
0.2500
25.00
31
5
6
0.1500
15
37
6
3
0.0750
7.5
40

Total

40

%
Acumulado
de
hogares
5.00
22.50
52.50
77.50
92.50
100.00

N
Acumulado
de
hogares
40
38
31
19
9
3

%
Acumulado
de
hogares
100
95
77.5
47.5
22.5
7.5

100

Fuente: Encuesta a hogares, marzo 2011

Tabla de frecuencia para variables cuantitativas con pocos valores diferentes


En este caso las clases estn constituidas por intervalos, para lo cual se siguen los
siguientes pasos:
1 Paso: Determinar el Rango
R = Mximo Mnimo
2 Paso: Elegir o calcular el nmero de clases m
Este nmero depende del nmero de observaciones, en algunos casos se
desea construir una tabla de modo tal que sirva para hacer comparaciones con
otros estudios, en tal caso el nmero de clases queda determinado por la
amplitud de clase deseada para hacer dichas comparaciones. Si ste no fuera

Manuel Hurtado Snchez

Pgina 29

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

el caso, se adoptar algunas frmulas para obtener este nmero de clases, a


continuacin se presentan algunas:
m 1 3.322 Log (n) . (1) regla de Sturges
m Log (n) (2)
m n (3)

Donde

es en nmero de datos

La primera frmula conocida como la Regla de Stugers es la ms utilizada. En


general se sugiere que el nmero de clases podra estar comprendido entre 5 y
15 inclusive.
3 Paso: Calcular la amplitud de clase C.
Se recomienda que todos los intervalos sean de igual amplitud, siempre que los
datos distribuyan mas o menos en forma uniforme en cada uno de los
intervalos; pero si existen variaciones muy pronunciadas, podra convenir
analizar la conveniencia de utilizar intervalos de amplitudes diferentes.
Para el caso de utilizar intervalos de igual amplitud, sta se puede obtener
mediante la siguiente frmula
R
C
m

Donde:
[ ] : Significa que el cociente R es redondeado al menor mayor entero,
m

siempre que C sea redondeado a un nmero entero, pero si C es un nmero


con un decimal, el redondeo se realizar al decimal inmediato superior. Pero
nunca se debe truncar.

R 25
C 5
m 5
R 28
C 5.6 6
m 5

es una divisin exacta, no es necesario redondear

Redondeo a un nmero menor mayor entero

R 27
C 5.4 6
m 5
R 25
C 3.571 3.6
m 7

Manuel Hurtado Snchez

Redondeo al decimal inmediato superior a


nivel de decenas
Pgina 30

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

4 Paso: Construir los intervalos de clase.


Calcular la cobertura m C , a continuacin se debe obtener el exceso con
respecto al rango R y dividirlo en dos partes: m C con lo cual se procede a
2

construir los intervalos del siguiente modo:


- Cuando el cociente C R 20 5 es un nmero exacto
m 4

Mximo

Mnimo

)[

)[

C=5

C=5

)[

C=5

C=5

- Cuando el cociente C R 25 6.25 7 no es un nmero exacto y fue


m 4
necesario de redondear

R=25

Mnimo

)[

)[

C=7

Mximo

)[

C=7

C=7

C=7

m.C=28 > R

m.C R
Mn
2

Mn

m.C R
2

5 Paso: Conteo del nmero de datos contenidos en cada intervalo


de clase.
Clases
[
[
[
[
Total

Manuel Hurtado Snchez

)
)
)
)

Conteo (ejemplo de conteo)


IIII
= 4 = n1
IIIII IIIII II
= 12 = n2
IIIII II
= 7 = n3
III
= 3 = n4
16 = n

Pgina 31

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

6 Paso: Construir la tabla de frecuencia

Ejemplo Usando los datos de la base que aparece en la tabla N 1, construya una
tabla de frecuencia para la variable edad.
1 Paso: Determinacin del Rango
R = Mximo Mnimo = 54 25 = 29
2 Paso: Clculo del nmero de clases m
Usaremos la regla de Sturges: m 1 3.322 Log (n) 1 3.322 Log (40) 6.32 6
3 Paso: Clculo de la amplitud de clase C.

R 29
C 4.8 5
m 6

4 Paso: Construccin de los intervalos de clase.


Clculo de la cobertura m C 6 5 30 ,
Obtencin el exceso de la cobertura respecto al rango R
m C R 6 5 29 30 29 1

Como el exceso es 1, no es necesario dividirlo en dos partes, debido a


que construiremos intervalos cuyos lmites sern nmeros enteros, con lo
cual se procede a construir los intervalos del siguiente modo:
R=29

Mnimo=25

)[

C=5

ooooooo

C=5
m.C=30 > R=29

Mximo=54

C=5

Mn m.C 25 6 x5 55

5 Paso: Conteo del nmero de datos contenidos en cada intervalo


de clase.
Edad (aos)
Nmero de jefes de hogar
[ 25 - 30)
IIII
= n1 = 4
[30 - 35)
IIIII IIIII
= n2 = 10
[35 - 40)
IIIII IIIII II
= n3 = 12
[40 - 45)
IIIII III
= n4 = 8
[45 - 50)
IIII
= n5 = 4
[50 - 55)
II
= n6 = 2
Total
n = 40

Manuel Hurtado Snchez

Pgina 32

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

6 Paso: Construir la tabla de frecuencia


Tabla 3 Edad de 40 jefes de hogar en el distrito de Chiclayo. Marzo 2011
N
N de Proporcin % de Acumulado
Edad del jefe jefes de de jefes de jefes de de jefes
del hogar
hogar hogar
hogar de hogar

%
Acumulado
de jefes
de hogar

N
Acumulado
de jefes
de hogar

%
Acumulado
de jefes
de hogar

[ 25 - 30)

0.10

10

10

40

100

[30 - 35)

10

0.25

25

14

35

36

90

[35 - 40)

12

0.30

30

26

65

26

65

[40 - 45)

0.20

20

34

85

14

35

[45 - 50)

0.10

10

38

95

15

[50 - 55)

0.05

40

100

40

100

Total

Fuente: Encuesta a hogares, marzo 2011

2.

Grficos Estadsticos

Son representaciones grficas de las distribuciones de frecuencias, que tienen por


finalidad transmitir la mayor cantidad posible de informacin acerca de la variable
en estudio, para que sea interpretada en el menor tiempo, con el menor esfuerzo
y sin necesidad de conocer teora estadstica. En forma similar a las tablas de
frecuencia, los grficos tambin tienen tres partes: el nmero y ttulo del grfico, el
grfico propiamente dicho y la fuente. Existen una diversidad muy amplia de
grficos estadsticos, su elaboracin es ms un arte que una tcnica, sin embargo
presentaremos algunos grficos clsicos que se suelen usar en los informas de
investigacin cientfica.

Manuel Hurtado Snchez

Pgina 33

UNIVERSIDAD SAN PEDRO

Manuel Hurtado Snchez

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Pgina 34

UNIVERSIDAD SAN PEDRO

Manuel Hurtado Snchez

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Pgina 35

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

3. Medidas de Resumen
El clculo de las medidas de resumen de una variable constituye la
segunda etapa de un anlisis descriptivo. Su propsito es cuantificar
diversas caractersticas de una variable cuantitativa, tales como las
medidas de posicin, tendencia central, dispersin, deformacin y
correlacin.
Medidas de Posicin:
Moda [Mo]:
La Moda es el dato que ms se repite. Aqu se presentan distintas
situaciones:
Un conjunto de datos no necesariamente tiene que tener una moda,
podra suceder que todos los datos tengan el mismo nmero de
repeticiones, en tal caso no existir moda
Un conjunto de datos podra tener una o ms modas. Si tuviera una sola
moda entonces la distribucin sera unimodal, si tuviera dos modas
entonces sera bimodal y si tuviera ms de una moda, entonces sera
multimodal.
CASO: DATOS ORIGINALES O SIN AGRUPAR
Ejemplo:
Considere los siguientes datos que representan el nmero de personas
por hogar
Nmero de personas por hogar

1
3
6
1

4
2
2
3

3
4
3
2

5
2
2
4

5
3
4
4

3
5
4
3

3
4
5
4

3
5
3
3

4
3
4
6

2
5
2
6

Debemos arreglar los datos en una tabla de frecuencias con clases


simples, en donde cada valor es una clase

Tambin podemos observar en el siguiente grfico la posicin o ubicacin


que tiene la moda. Observe que se trata de una distribucin unimodal
Manuel Hurtado Snchez

Pgina 36

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

El siguiente grfico representa el caso de una distribucin bimodal

Manuel Hurtado Snchez

Pgina 37

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

CASO: DATOS AGRUPADOS EN INTERVALOS DE CLASE


Para obtener la moda a partir de una tabla de frecuencias con intervalos
se utiliza la siguiente frmula:
1
= +
1 + 2
Donde:
=
=
1 =
2 =
=
=
=

Ejemplo
Considere los puntajes obtenidos en la prueba de conocimientos por los
261 postulantes a la Academia de Diplomticos del Per en el proceso
de admisin 2015. Los datos se presentan en la siguiente tabla N 5.
Se aprecia aqu que:
Frecuencia modal es igual a 54 ( = 54 )
Intervalo de la clase modal: [11.375 12.500)
Lmite Real Inferior LRI = 11.375
Frecuencia anterior a la modal: = 50
Frecuencia posterior a la modal: = 43
Amplitud de clase C = 12.500 11.375 = 1.125
Con lo cual se obtiene: 1 = 54 50 = 4
2 = 54 43 = 11
Por lo tanto la moda ser obtenida as:
4 1.125
= 11.375 +
= 11.675
4 + 11

Manuel Hurtado Snchez

Pgina 38

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

En caso hubiera ms de una moda, para cada una de las modas se


procede en forma similar. En el siguiente ejemplo se presenta un caso
donde hay dos modas
Ejemplo 4. A continuacin se presentan las edades de un conjunto de
120 estudiantes universitarios
Tabla N 2 Edad de estudiantes universitarios de la escuela de
Estadstica UNPRG, a Octubre del 2012.
Edad (aos)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
Manuel Hurtado Snchez

N de estudiantes
18
30
20
30
12
Pgina 39

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

40 - 44
45 - 49
Total

fmo = 30

8
2
120

Clases modales: [20 - 24] y [30 - 34]

Para la clase modal: [20 24]

LRI

19 20
19.5
2

C = 24.5 19.5 = 5
1 = 30 18 = 12
2 = 30 20 = 10

M o (1) LRI

1 C
12 5
19.5
19.5 2.727 22.227 aos
1 2
12 10

Para la clase modal: [30 34]

LRI

29 30
29.5
2

C = 34.5 29.5 = 5
1 = 30 20 = 10
2 = 30 12 = 18

M o (2) LRI

1 C
10 5
29.5
19.5 1.786 31.286 aos
1 2
10 18

Note que en este caso las clases modales o con la ms alta frecuencia absoluta
simple, se encuentran separadas, conteniendo cada una de ellas una moda, por
Manuel Hurtado Snchez

Pgina 40

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

lo que a esta clase de distribuciones de les conoce como Distribuciones


Bimodales

Ejemplo 5. Consideremos ahora que las dos clase con las mximas
frecuencias estn juntas una a continuacin de la otra
Tabla N 3 Edad de estudiantes universitarios de la escuela de Estadstica
UNPRG, a Octubre del 2012.
Edad (aos)
15
20
25
30
35
40
45

19
24
29
34
39
44
49

Total

fmo = 30

N de estudiantes
18
30
30
20
12
8
2

120

Clases modales: [20 - 24] y [30 - 34]

Para la clase modal: [20 24]

LRI

19 20
19.5
2

C = 24.5 19.5 = 5
1 = 30 18 = 12
2 = 30 30 = 0

M o (1) LRI

1 C
12 5
19.5
19.5 5 24.5 aos
1 2
12 0

Para la clase modal: [25 29]

LRI

24 25
24.5
2

C = 34.5 29.5 = 5
1 = 30 30 = 0
2 = 30 20 = 10

M o (2) LRI

Manuel Hurtado Snchez

1 C
05
24.5
24.5 0 24.5 aos
1 2
0 10

Pgina 41

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Note que aun cuando en este caso existen dos clases con la ms alta
frecuencia, es decir dos clases modales, sin embargo, la distribucin
es Unimodal, debido a que ambas clases estn una a continuacin de
la otra, en este caso la moda se ubica en el lmite real entre las dos clases
modales.
Mediana[Me]:
Es el dato que ocupa el lugar central en una serie ordenada de datos.
X1 X2 X3 X4 . . . . . . . . . . . . . . . . . . . Xn
50 %

50 %

Me

Para datos sin agrupar:


Aqu la mediana se identifica segn el nmero de datos, as:
Cuando n es impar:

M e X n 1

Ejemplo 1: Obtenga la mediana del siguiente conjunto de datos:


Xi = {3, 5, 2, 7, 8, 9, 8, 9, 4}, aqu, n = 9 (impar)
1 Paso: Ordenar:

Manuel Hurtado Snchez

Pgina 42

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

2 Paso:
= (9+1) = 5 = 7
2

1
Cuando n es par: M e X n X n 2

2 2
2

Ejemplo 2: Obtenga la mediana del siguiente conjunto de datos:


Xi = {3, 5, 2, 7, 8, 9, 8, 9, 4, 10}, aqu, n = 10 (par)
1 Paso: Ordenar:

2 Paso:

Me

1
1
1
X 10 X 102 X 5 X 6 7 8 7.5

2 2
2
2
2

Para datos agrupados:


Se utiliza la siguiente frmula:

N i 1 C
2

M e LRI
ni
Donde:
n
= nmero total de datos
n
= Identificador de la clase de la mediana en la columna de las
2
frecuencias absolutas acumuladas menor o igual que
LRI = Lmite real inferior de la clase de la mediana
Manuel Hurtado Snchez

Pgina 43

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

C
ni

= Amplitud de clase
= Frecuencia absoluta simple de la clase de la mediana

Ni1

= Frecuencia absoluta acumulada menor igual que hasta la


clase anterior a la clase de la mediana

Demostracin
Para la siguiente Tabla de datos:
Frecuencia
i
Intervalo
absoluta simple:
ni
1
A: [
,
)
n1
2
B: [
,
)
n2
3
C: [
,
)
n3
4
D: [
,
)
n4
5
E: [
,
)
n5
Total
n

Frecuencia absoluta
acumulada menor que:
Ni
N1
N2
N3
N4
N5

Consideremos ahora el siguiente grfico de la ojiva menor que:


Con ayuda del grfico de la distribucin acumulativa menor que
deducimos que la mediana debe ubicarse en Me = LRI + X, entonces
debemos centrar nuestra atencin en encontrar el valor de X
Segn el teorema de Thales sobre tringulos semejantes, a partir de los
tringulos formados en la clase i donde se encuentra la mediana con
el segmento correspondiente del grfico de la distribucin acumulativa
menor que, debemos tener que:

= 2

De donde obtenemos que

Manuel Hurtado Snchez

Pgina 44

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

( 2 1 )

Por lo tanto la mediana debe ser:

= +

(2 1 )

Ejemplo: Obtenga la mediana de la siguiente tabla de datos


correspondiente a la resistencia a la tensin.

Manuel Hurtado Snchez

Pgina 45

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tabla N Resistencia a la tensin de 80 muestras de la aleacin


aluminio Litio (Kgrf/cm2)(*)

(*). Montgomery. Probabilidad y Estadstica. Aplicaciones a la


Ingeniera. Ed. Mc Graw Hill, 1996. Pg. 5

n 80
40 la clase de la mediana ser [16 18]

2 2
LRI

15 16
15.5
2

C 3
ni 27

Ni1 37

80

37 3
9
2

M e 15.5
15.5
15.83
27
27

M e 15.83 Kgrf / cm 2

Manuel Hurtado Snchez

Pgina 46

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Cuartiles[Qi]: Son valores que dividen a una serie ordenada de datos en


cuatro partes iguales.
X1 X2 X3 X4 . . . Xn
25%

25%
Q1

25%
Q2

50%

25%
Q3

Me

50%

Quintiles[qi]: Son valores que dividen a una serie ordenada de datos en


cinco partes iguales.
X1 X2 X3 X4 . . . . . . . . . . . . . . . . Xn
20%
20%
20%
20%
q1

Manuel Hurtado Snchez

q2

q3

20%
q4

Pgina 47

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Deciles[Di]: Son valores que dividen a una serie ordenada de datos en


diez partes iguales.
X1 X2 X3 X4 .. . Xn
10%

10%

D1

10%

D2

10%

D3

D4

10%

10%

D5

10%

D6

10%

D7

10%

D8

10%

D9

A continuacin presentaremos los percentiles, con lo cual se puede calcular


cualquier estadstica de orden, incluyendo la mediana, cuartiles, quintiles o
deciles
Percentiles[Pi]: Son valores que dividen a una serie ordenada de datos en
diez partes iguales.

Cuando los datos estn agrupados en tablas de frecuencia, los


percentiles son obtenidos utilizando la siguiente frmula:

Manuel Hurtado Snchez

Pgina 48

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

in

Fi 1 C

100

Pi LRI
fi
Donde:

= nmero total de datos

i n

= Identificador de la clase de la clase del percentil i en la columna de las


100
frecuencias absolutas acumuladas menor o igual que
LRI = Lmite real inferior de la clase del percentil i
C
= Amplitud de clase

fi

= Frecuencia absoluta simple de la clase del percentil i.

Fi1 = Frecuencia absoluta acumulada menor igual que hasta la clase anterior a la
clase del percentil i

Ejemplo: Obtenga los siguientes percentil de la distribucin de la edad


de los habitantes de Chiclayo.

Manuel Hurtado Snchez

Pgina 49

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Para el Percentil 15: P15


i = 15

15 n 15 260948
39142 .2 La clase de P15 es: [5 9]

100
100

LRI

45
4.5
2

C 5
ni 21540

Ni1 21842
15 260948

21842 5

100

P15 4.5
8.52
21540

P15 8.52 aos

85%

15%

P15

Para el Percentil 83: P83


i = 83
83 n 83 260948
216586 .8.2 La clase de P83 es: [50 54]

100
100

LRI

49 50
49.5
2

C 5
ni 13060

Ni1 210938
83 260948

210938 5

100

P83 49.5
51.66
13060

P83 51.66 aos

83%

17%
P83

Manuel Hurtado Snchez

Pgina 50

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Medidas de tendencia central:


Media aritmtica o promedio:
Es un nmero real que caracteriza o representa a un conjunto de datos,
cuyo polgono de frecuencias presenta simetra y poca dispersin;
tambin podemos entender a la media aritmtica como el punto de
equilibrio del conjunto de datos.
Para el caso en que todos los datos son igualmente importantes,
podemos definir la media aritmtica de la siguiente manera: Si x1,..., xn es
un grupo de datos, la media aritmtica o simplemente media de estos
datos es igual a la suma de todos estos datos dividido entre el nmero
total de datos.
n

x x2 ... xn
x 1

x
i 1

A continuacin se presentan otras frmulas para calcular la media


aritmtica para el caso de datos agrupados.

Manuel Hurtado Snchez

Pgina 51

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

x n

i i

i 1

n
m

x xi hi
i 1

donde:

hi

ni
n

Para el caso en que los datos no tengan el mismo grado de


importancia, se utilizar la media ponderada, para lo cual se utilizar la
siguiente frmula:
= =1

siempre que se cumpla con =1 = 1

Fsicamente, tambin puede entenderse a la media aritmtica como el


centro de masa de la distribucin de los datos

Para datos sin agrupar no ponderados


Ejemplo 1:

Sea X = Nmero de trabajadores por microempresa.

Xi : 4, 5, 3, 8, 6, 5, 6, 5, 4, 5 .
Notemos que el nmero de microempresas es n = 5
La media aritmtica ser:
=

+ + + + + + + + + +

=
= .

= .

Manuel Hurtado Snchez

Pgina 52

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Estos mismos datos tambin se podran arreglar en una tabla


Nmero de trabajadores por
microempresa: Xi
3
4
5
6
8
Total

Nmero de microempresas: ni
1
2
4
2
1
10

Y por lo tanto podramos aplicar la siguiente frmula:


n

x
i 1

3 1 4 2 5 4 6 2 8 1 51
5.1
10
10

Se suele utilizar la siguiente tabla de clculos:


Nmero de trabajadores Xi
3
4
5
6
8
Total

Nmero de empresas: ni

Xi * ni

1
2
4
2
1

3
8
20
12
8
51

Para datos agrupados en intervalos


Ejemplo 2. En la siguiente tabla de frecuencias aparecen los valores de
compra (en nuevos soles) de un conjunto de 17 clientes.

Una aproximacin de la media es:


Manuel Hurtado Snchez

Pgina 53

UNIVERSIDAD SAN PEDRO

__

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

2(7) 4(11) 7(15) 3(19) 1(23) 273

14.294. nuevos soles


17
17

Aqu debemos interpretar o entender que el valor de compra


representativo o caracterstico de los 17 clientes es de 14.294 nuevos
soles. aproximadamente.
Decimos aproximadamente por que el clculo se ha realizado utilizando
las marcas de clase y no precisamente los datos originales.
Media aritmtica para datos ponderados
Para el caso en que los datos no son igualmente importantes, se debe
utilizar la media aritmtica ponderada
= =1 , siempre que se cumpla con =1 = 1
Ejemplo: Sea X las calificaciones de que un estudiante universitario
recibe en una asignatura.
-

Promedio de evaluaciones escritas: 15, con una ponderacin del 40%,


Promedio intervenciones orales: 12, con una ponderacin de 5%
Promedio de presentacin de trabajos en clase: 16, con una ponderacin del 15%
Promedio de trabajo de aplicacin: 18 con una ponderacin del 30% y
Promedio de actitudes: 14, con una ponderacin de 10%

El promedio ponderado se obtiene de la siguiente manera:

= = 15 0.4 + 12 0.05 + 16 0.15 + 18 0.3 + 14 0.1 = 15.8


=1

En cuadro de clculos se muestra a continuacin

Manuel Hurtado Snchez

Pgina 54

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Algunos vicios
aritmtica:

y argumentos en la interpretacin de la media

Se dice por ejemplo que si una persona gana un milln y otra nada, la
"media aritmtica" establece que las dos han ganado medio milln, lo
cual no es verdad. Este argumento parece suficiente para desvirtuar una
disciplina, puesto que: si no sabe hacer algo tan sencillo cmo es
posible que sea capaz de resolver problemas ms complejos?. Veamos
otro ejemplo, Si un soldado que dispara sobre un blanco una vez medio
metro a la derecha y otra medio metro a la izquierda, la media establece
que dicho soldado en promedio ha tenido un acierto en los dos disparos
al blanco, lo cual tampoco es verdad.
Podemos darnos cuenta fcilmente que el clculo de la media es una
operacin estrictamente matemtica y que en un sentido estricto lo que
falla en los ejemplos es la interpretacin de un resultado aritmtico. Una
de las caractersticas de la Estadstica es precisamente analizar la
validez de los resultados. Para que este ejemplo pueda abandonar el
mbito de las matemticas y pasar al terreno de la Estadstica es
necesario que se establezca alguna medida de la representatividad, de
la validez, del resultado que se presenta. Es evidente que la media
aritmtica en estos ejemplos esta afectada por una escasa
representatividad.
Media armnica: Cuando los datos corresponden a velocidades, es decir cuando
expresan cantidad de desplazamiento por unidad de tiempo, la media que
corresponde es la media armnica, la cual viene expresada en las siguientes
frmulas, tanto para datos sin agrupar, como para datos agrupados:

xH

n
n

i 1 xi

Manuel Hurtado Snchez

Para datos sin agrupar,

xi 0

Pgina 55

UNIVERSIDAD SAN PEDRO

xH

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

n
Para datos agrupados en m-clases, xi 0
ni

i 1 xi
m

Note que en esta clase de promedio, todos los valores de la variable deben ser
diferentes de cero.
Ejemplo 1. Durante la primera semana de vigencia del control del lmite de
velocidad de vehculos de transporte pblico, se instala en dos puntos de una
carretera, separados por una distancia de 30 Km, una cmara que registra los
instantes de salida del primer punto y los de llegada al segundo punto de cada
unidad mvil, encontrando las siguientes tiempos en una muestra de 8 vehculos
en minutos. Cul ser la velocidad promedio de este grupo de vehculos?

Espacio = Velocidad x Tiempo


Espacio (Km)= 30

2 Ley de Newton:

Vehculo
1
2
3
4
5
6
7
8
Total

Velocidad = Espacio/Tiempo

Tiempo

Tiempo

Tiempo

(min. y Seg.)

(minutos)

(horas)

22'30"
18'45"
18'
30'
22'30"
18'
15'
12'

22.50
18.75
18.00
30.00
22.50
18.00
15.00
12.00

0.375
0.3125
0.300
0.500
0.375
0.300
0.250
0.200
2.6125

V (Km / H)
80
96
100
60
80
100
120
150
786

1/V
0.012500
0.010417
0.010000
0.016667
0.012500
0.010000
0.008333
0.006667
0.087083

Concepto Estadstico
Promedio Armnico =

91.866 Km/H

Concepto fsico
Veloc. Media = (Espacio total/Tiempo total)=
Espacio total =
Tiempo Total =

91.866

240 Km
2.6125 Horas

La velocidad promedio de los vehculos se obtiene con la media armnica:

Manuel Hurtado Snchez

Pgina 56

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

xH

n
n

x
i 1

8
91.866 Km / h
0.087083

Nota importante: Si se hubiera utilizado la media aritmtica se hubiera obtenido el


siguiente resultado:

V 786
V i
91.25 Km / h
n
8
Podemos apreciar que este resultado no coincide con el concepto fsico, por lo cual
concluimos que en este caso, para obtener la velocidad media, la media aritmtica
falla, y en su lugar se debe utilizar el promedio armnico
Ejemplo 2. Considere que un colectivo de transporte pblico, recorre una distancia
total de 20 Km, que es la distancia que existe entre sus paraderos de dos ciudades
conectadas por la carretera panamericana norte, su recorrido lo hace a diferentes
velocidades, de acuerdo a la zona de desplazamiento: en el primer tramo de 2 Km
se desplaza a una velocidad de 25 Km/H, en el segundo tramo de 4 Km, se
desplaza a una velocidad de 50 Km/H, en el tercer tramo de 10 Km, se desplaza a
una velocidad de 100 Km/H, en el cuarto tramo de 3 Km, se desplaza a una
velocidad de 40 Km/H y en el ltimo tramo de 1 Km, se desplaza a 20 Km/H.
Deseamos conocer cul ser la velocidad promedio.

Tramo
1
2
3
4
5
Total

Longitud (Km)
(ni)

Velocidad
(Vi )

2
4
10
3
1
20

25
50
100
40
20
235

(Km/H)

ni / Vi
(tiempo en Horas)

0.08
0.08
0.1
0.075
0.05
0.385

En este caso utilizamos la media armnica ponderada:


Manuel Hurtado Snchez

Pgina 57

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

VH

n
20

51.9481 Km / h
ni 0.385

i 1 Vi
n

De acuerdo al concepto fsico, la velocidad media es igual espacio total recorrido


entre el tiempo total utilizado

Espacio total recorrido


20 Km

51.9481 Km / h
tiempo total utilizado
0.385 Horas

Nota importante:
Si se hubiera utilizado la media aritmtica se hubiera obtenido el siguiente resultado:

V 236
V i
47 Km / h
n
5

Podemos apreciar que este resultado no coincide con el concepto fsico, por lo cual
concluimos que en este caso, para obtener la velocidad media, la media aritmtica
falla, y en su lugar se debe utilizar el promedio armnico

Media geomtrica: Cuando los datos representan tasas de crecimiento, entonces


la media que corresponde utilizar es la media geomtrica, la cual viene expresada
en las siguientes frmulas, tanto para datos sin agrupar, como para datos
agrupados:

xG n

x
i 1

xG n

Para datos sin agrupar,

x
i 1

ni
i

xi 0

Para datos agrupados,

xi 0

Note que en esta clase de promedio, todos los valores de la variable deben ser
diferentes de cero.

Ejemplo. Durante cuatro aos consecutivos una pequea empresa aument su


capital en 20%, 50%, 80% y 90%. Calcular la tasa promedio de aumento del
capital.

X G 4 (1.2)(1.5)(1.8)(1.9) 4 6.156 1.5752


Tasa promedio de crecimiento = 57.52%

Manuel Hurtado Snchez

Pgina 58

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Para verificar este resultado consideremos que la empresa tiene un capital inicial
de 20000 nuevos soles, entonces este capital con las tasas de crecimiento
indicadas, debe haberse convertido en:

Capitalfinal 20000 1.2 1.5 1.8 1.9 123120

nuevos soles

El capital final al 4 ao de la empresa, debera poder ser estimado con la tasa de


crecimiento promedio de 57.52%, del siguiente modo:

Capitalfinal 20000 (1.5752)4 20000 6.156 123120 nuevos soles


De este modo comprobamos que la tasa promedio de crecimiento obtenida con la
media geomtrica es la correcta
En cambio, si hubiramos utilizado la media aritmtica, el resultado hubiera sido:

X 20% 50% 80% 90% 240


X i

60 %
n
4
4
Para verificar si este resultado es el correcto, veamos nuevamente si el capital de
la empresa al final del 4 ao, es estimado con esta tasa promedio:

Capitalfinal 20000 (1.60)4 20000 6.5536 131072 nuevos soles


Podemos apreciar que este resultado no coincide con el capital final verdadero
123120 nuevos soles, por lo cual concluimos que en este caso, para obtener la tasa
promedio de crecimiento, la media aritmtica falla, y en su lugar se debe utilizar el
promedio geomtrico

Medidas de dispersin:
Miden el grado discrepancia o de diferencias entre los datos. Una medida de
dispersin siempre debe acompaar a un promedio para asignarle un grado de
importancia a esta medida en su funcin de representar al conjunto de datos.
Desviacin estndar.
Mide el grado de dispersin de los datos respecto al valor promedio en
unidades absolutas.

x X
N

Desviacin estndar poblacional

Manuel Hurtado Snchez

DE( x)

i 1

Pgina 59

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

x x
n

Desviacin estndar muestral

de( x)

i 1

n 1

s2 s

Coeficiente de variacin.
Mide el grado de dispersin relativo de los datos respecto a su valor
promedio. Sirve para comparar el grado de dispersin entre dos o ms
variables.
Coeficiente de variacin poblacional:

Coeficiente de variacin muestral:

CV ( x)
cv( x)

DE( x)
100
X

de( x)
100
x

Nota:
Cuando CV(x) < 33% : Distribucin homognea
Cuando CV(x) 33% : Distribucin heterognea

Coeficiente de Curtosis
Este coeficiente permite medir el grado de elevacin o apuntamiento de la
distribucin con respecto a una distribucin normal estndar.
Al igual que para el caso del coeficiente de asimetra, existen diversas
frmulas para calcular el coeficiente de curtosis:
1. En funcin de los percentiles: k

(0.5)( P75 P25 )


P90 P10

2. Coeficiente de Apuntamiento de Fisher:

4
3
4

Donde:
n

Momento central de cuarto orden:

Manuel Hurtado Snchez

( x x)
i 1

Pgina 60

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin
n

Momento Central de segundo orden: 2 2

(x
i 1

x) 4

( x x)
i 1

( xi x)

i 1

Nota:
Cuando K < 0 : Distribucin platicurtica
Cuando K = 0 : Distribucin mesocurtica
Cuando K > 0 : Distribucin leptocurtica

Ejemplo: Considere que los siguientes datos corresponden a las edades


50 trabajadores expresadas en aos. Se desea obtener la media
aritmtica, desviacin estndar, coeficiente de variacin, coeficiente de
asimetra y coeficiente de curtosis. Los clculos se muestran en el mismo
cuadro de datos
Cuadro de clculos
Edad

Xi

ni

15 19
20 24
25 29
30 34

17
22
27
32

3
12
16
10

Manuel Hurtado Snchez

Ni
3
15
31
41

Xi. Ni

(Xi-u)^2*ni

51
264
432
320

396.75
507.00
36.00
122.50

(Xi-u)^3*ni
-4562.625
-3295.5
-54.00
428.75

(Xi-u)^4*ni
52470.1875
21420.75
81.00
1500.625
Pgina 61

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

35 39
40 44

37
42

5
3

46
49

185
126

361.25
546.75

3070.625
7381.125

26100.3125
99645.1875

45 49

47

50

47

342.25

6331.625

117135.0625

9300

318353.125

Total

50

1425

2312.50

Media aritmtica:

x n

i i

i 1

1425
28.5 aos
50

Desviacin estndar DE(x):


7

V ( x)

(x
i 1

x) 2 ni
n

2312 .5
46.25 aos2
50

DE( x) V ( x) 46.25 aos2 6.80074

aos

Coeficiente de variacin: CV(x):

CV ( x)

DE( x) 6.80074 aos

0.2386 23.86%
x
28.5 aos

Esto significa que la dispersin de las edades no es muy importante y


al no exceder el 33%, las edades del grupo de trabajadores puede
considerarse como homognea
Coeficiente de asimetra de fisher: CA(x)

CA( x )

3
9300 / 50
186

0.59 0
3
3

6.80074 314.534664

Al ser el coeficiente de asimetra mayor que cero, nos indica que existe
una asimetra positiva, que la mayor cola del polgono de frecuencias
est en el lado derecho
Coeficiente de Curtosis: [k]

Manuel Hurtado Snchez

Pgina 62

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

4
318353 .125 / 50
3
3
2 2
( )
(46.25)2

6367 .0625
3 2.976 3 0.0234 0
2139 .0625

El coeficiente de curtosis menor que cero, significa que el grado de


elevacin o apuntamiento de las frecuencias el ligeramente aplanado,
es decir corresponde a una distribucin platicurtica.

Medidas Concentracin: ndice de Gini y curva de Lorenz.


Las medidas de concentracin tratan de poner de relieve el mayor o menor grado
de igualdad en el reparto del total de los valores de la variable, son por tanto
indicadores del grado de distribucin de la variable.
Para este fin, estn concebidos los estudios sobre concentracin. Denominamos
concentracin a la mayor o menor equidad en el reparto de la suma total de los
valores de la variable considerada (renta, salarios, etc.).
Estudiaremos dos medidas de concentracin de la riqueza:
Indice de Gini [ IG ] Es un nmero real comprendido entre 0 y 1 que se utiliza
como una medida del grado de concentracin de la riqueza en la poblacin.
0 1
Cuando = 0 indica que existe una equidad absoluta, es decir que todos los
miembros de una poblacin tienen exactamente la misma riqueza. Es un caso
extremo que en la prctica no se cumple.

Manuel Hurtado Snchez

Pgina 63

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Cuando = 1 indica que existe una inequidad absoluta, es decir que toda la
riqueza est concentrada en una sola clase y el resto de la poblacin no posee
riqueza. Este tambin es un caso extremo que en la prctica no se cumple.
Lo que si se cumple es que 0 < < 1 , las polticas sociales de los gobiernos
procuran que este ndice sea lo ms bajo posible, lo cual indicar que la riqueza
est mejor distribuida en la poblacin, en cambio cuando este valor se acerca a 1
indicar que la mayor cantidad de la riqueza est concentrada en un pequeo
grupo de la poblacin.

Matemticamente, el ndice de Gini est definido por la siguiente ecuacin:


k 1

IG

p i q i
i 1

k 1

pi
i 1

Este ndice tomara los valores de IG = 0 cuando pi = qi concentracin mnima

y de Ig = 1

cuando qi = 0
Curva de Lorenz, es un mtodo grfico de estudiar la concentracin de la riqueza.
Sea una distribucin de rentas (xi, ni) de la que formaremos una tabla con las
siguientes columnas:
1.- Los productos xi ni, que nos indicarn la renta total percibida por los ni rentistas
de renta individual xi .
2.-

Las frecuencias absolutas acumuladas Ni .

3.- Los totales acumulados ui que se calculan de la siguiente forma:


u1 = x 1 n1
u2 = x 1 n1 + x 2 n2
u3 = x 1 n1 + x 2 n2 + x 3 n3
u4 = x1 n1 + x2 n2 + x3 n3 + x4 n4
un = x1 n1 + x2 n2 + x3 n3 + x4 n4 + . + xn nn
n

Por tanto podemos decir que u n x i n i


i 1

4.- La columna total de frecuencias acumuladas relativas, que expresaremos en tanto por ciento y que
representaremos como pi y que vendr dada por la siguiente notacin
pi
Manuel Hurtado Snchez

Ni
100
n
Pgina 64

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

5.- La renta total de todos los rentistas que ser un y que dada en tanto por ciento, la cual
representaremos como qi y que responder a la siguiente notacin:
qi

ui
100
un

Por tanto, ya podemos confeccionar la tabla que ser la siguiente:

xi

ni

x1

n1

x i ni
x 1 n1

x2

n2

x 2 n2

...

...

Xn

nn

i
Ni Ui
N1 U1 p1

Ni
100
n

qi

ui
100
un

pi - qi

q1

p1 - q1

N2 U2 p2

q2

p2 - q2

...

...

...

...

...

...

x n nn

Nn un

Pn

qn

pn - qn

Como podemos ver la ltima columna es la diferencia entre las dos penltimas,
esta diferencia seria 0 para la concentracin mnima ya que pi = qi y por tanto su
diferencia seria cero.
Si esto lo representamos grficamente obtendremos la curva de concentracin
o curva de Lorenz .La manera de representarlo ser, en el eje de las X, los valores
pi en % y en el de las Y los valores de qi en %. Al ser un %, el grfico siempre ser
un cuadrado, y la grfica ser una curva que se unir al cuadrado, por los valores
(0,0), y (100,100), y quedar siempre por debajo de la diagonal.
La manera de interpretarla ser: cuanto ms cerca se site esta curva de la
diagonal, menor concentracin habr, o ms homogeneidad en la distribucin.
Cuanto ms se acerque a los ejes, por la parte inferior del cuadrado, mayor
concentracin.
Los extremos son

Manuel Hurtado Snchez

Pgina 65

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Distribucin de concentracin mnima

Distribucin de concentracin mxima

Esto lo veremos mejor con un ejemplo


Frecuencia

Li-1 - Li
0 50
50 - 100
100 - 150
150 - 200
200 - 250
250 - 300
300 - 350
350 - 400
400 - 450
450 - 500

marca
xi
ni

Ni

25
75
125
175
225
275
325
375
425
475

23
95
157
205
224
232
246
253
258
260

23
72
62
48
19
8
14
7
5
2
260

xini

un

qi = (ui/un) 100 pi = (Ni/n) 100 pi - qi

575
5400
7750
8400
4275
2200
4550
2625
2125
950
38850

575
5975
13725
22125
26400
28600
33150
35775
37900
38850

1,48
15,38
35,33
56,95
67,95
73,62
85,33
92,08
97,55
100,00

8,85
36,54
60,38
78,85
86,15
89,23
94,62
97,31
99,23
100,00
651,15

7,37
21,16
25,06
21,90
18,20
15,61
9,29
5,22
1,68
0,00
125,48

Obtenga el ndice de concentracin de Gini y Curva de Lorenz correspondiente

Manuel Hurtado Snchez

Pgina 66

UNIVERSIDAD SAN PEDRO

a)

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

ndice de concentracin de GINI


k 1

IG

p i q i
i 1

k 1

pi

125,48
0,193 ,
651,15

i 1

Observamos que hay poca concentracin por encontrarse cerca del 0.


b)

Curva de Lorenz
La curva la obtenemos cerca de la diagonal, que indica que hay poca concentracin:

V.
Anlisis Estadstico con dos variables
Cuando analizamos dos o ms variables de manera conjunta, generalmente
estamos interesados en estudiar la relacin que existe entre dichas
variables. En esta ocasin solo presentaremos el anlisis estadstico para
dos variables.
El primer nivel de anlisis estadstico con dos variables consiste en elaborar
tablas de frecuencia de doble entrada. Estas tablas se elaboran cuidado de
mantener el vnculo que existe que ambas variables son observadas en una
misma unidad de anlisis, y los datos originales en este caso son pares
ordenados

(X1, Y1)

(X2, Y2)

(X3, Y3)

..

(Xn, Yn)

Adems debemos conocer de antemano que existe una relacin de


dependencia entre dichas variables, es decir debemos conocer cul es la
variable dependiente y cul la variable independiente, y nuestro inters ser
Manuel Hurtado Snchez

Pgina 67

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

identificar el comportamiento de la variable dependiente en funcin de la


variable independiente, para lo cual construiremos los perfiles de la variable
dependiente para cada nivel de la variable independiente, los cuales son
comparados para examinar la influencia de la variable independiente.
Tablas de frecuencia de doble entrada
Sean X e Y dos variables observadas en una misma unidad de anlisis, tal
que, la variable Y es la variable dependiente o por lo menos considerada
como variable dependiente y sea X la variable independiente o por lo menos
considerada como variable independiente. Las observaciones de estas dos
variables en n unidades de anlisis ser:
(X1, Y1)

(X3, Y3)

(X2, Y2)

..

(Xn, Yn)

Las variables X e Y pueden ser ambas cuantitativas, ambas cualitativas o


una cuantitativa y la otra cualitativa. Si la variable es cuantitativa se deben
construir intervalos de clase de la misma manera a como se hizo cuando
elaboramos tablas de frecuencia de una sola dimensin y si la variable es
cualitativa, cada una de sus categoras constituir una clase para la tabla de
frecuencias.
A continuacin presentamos un ejemplo de tabla de frecuencias
bidimensional.
Tabla N 1 Promedio ponderado de los estudiantes de la Fac.
de Ingeniera de la USAT en el semestre 2013-II segn sexo
Promedio
Ponderado (i)

SEXO (j)

Total

09.0 - 11.4

Varn
29

Mujer
18

47

11.5 - 13.9

53

24

77

14.0 - 16.4

Total

85

44

129

En esta tabla la variable Promedio Ponderado est en la primera entrada o


filas y tiene tres categoras, en cambio la variable Sexo en la segunda
entrada o columnas y tiene dos categoras.
Los nmeros que aparecen en el centro representan a las frecuencias
bidimensionales, es decir que representan al nmero de estudiantes cuyo
promedio ponderado est comprendido en una categora determinada y
adems pertenecen a una categora especfica del sexo.
Los nmero que aparen en la ltima columna representan a las frecuencias
marginales del promedio ponderado y los nmero de la ltima fila
representan las frecuencias marginales de la variable sexo. A continuacin
presentamos la notacin usual.
Manuel Hurtado Snchez

Pgina 68

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

=
11 = 29 29 . . 09.0 11.4
12 = 18 18 . . 09.0 11.4
22 = 24 24 . . 11.5 13.9
As sucesivamente
. =

= ()

1. = 47 47 . . 09.0 11.4
2. = 77 77 . . 11.5 13.9
As sucesivamente.
. =

()

.1 = 85 85
.2 = 44 44

Como dijimos al inicio de este captulo, cuando estudiamos dos variables,


nos interesa la relacin entre dichas variables. Un primer nivel de esta
exploracin es la obtencin de las frecuencias relativas condicionales
denominados tambin perfiles, los cuales a ser comparados podremos
deducir si la variable considerada como dependiente cambia de
comportamiento cuando cambia de nivel la otra variable independiente.
Los perfiles son obtenidos dividiendo cada frecuencia bidimensional entre el
total de cada nivel de la variable considerada como independiente, de
manera que la suma de estas frecuencias en cada uno de estos niveles debe
dar la unidad o en forma equivalente el 100%.
Considerando el Promedio ponderado como la variable dependiente y el
sexo como la variable independiente, entonces los perfiles del promedio
ponderado en los varones y las mujeres se muestran en la siguiente tabla.
Tabla N Promedio ponderado de los estudiantes de la Facultad de Ingeniera de la
USAT en el semestre 2013-I segn SEXO
Promedio
Ponderado
(Puntos)
09.0 - 11.4
11.5 - 13.9
14.0 - 16.4
Total

SEXO
Varn

N de
% de
N de
% de
estudiantes estudiantes estudiantes estudiantes
29
34.1%
18
40.9%
53
62.4%
24
54.5%
3
3.5%
2
4.5%
85
100.0%
44
100.0%

Perfil del Prom. Pond. De los varones

Manuel Hurtado Snchez

Mujer

Total
N de
estudiantes
47
77
5
129

% de
estudiantes
36.4%
59.7%
3.9%
100.0%

Perfil del Prom. Pond. de las mujeres

Pgina 69

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Aqu lo que se compara son los perfiles, as podemos leer que hay mayor
proporcin de mujeres en promedios ponderados bajos (09.0 a 11.4), en
cambio en promedios ponderados intermedios (11.5 a 13.9), se observa
mayor proporcin de varones, finalmente en promedios ponderados
sobresalientes (14.0 a 16.4) las proporciones de varones y mujeres son
bastante parecidas. Por lo tanto podemos concluir que el promedio
ponderado si guarda relacin con el sexo, los varones parecen estar en
ventaja sobre las mujeres.

Medidas de correlacin:
Despus de un anlisis descriptivo de cada variable, el siguiente nivel de
anlisis comprende analizar la relacin entre dos variables. Aqu aparecen
diferentes herramientas estadsticas, desde las tablas de contingencia o
tablas cruzadas hasta el clculo de coeficientes de correlacin. Existen
diversos coeficientes de correlacin que han sido construidos para las
diferentes escalas en quede estar medida una variable; sin embargo en esta
ocasin presentaremos solamente el coeficiente de correlacin lineal de
Pearson.

Coeficiente de correlacin lineal de Pearson [r]


Es una medida que sirve para medir el grado de correlacin lineal entre dos
variables medidas en escala de intervalo o de razn.

Cov( x, y)
;
x y

Donde:
Covarianza entre X e Y:

para todo:

Cov( x, y)

1 r 1

x x y y
N

x x

Desviacin estndar de X: x

y y

Desviacin estndar de Y: y

Para clculos manuales se puede demostrar que:

Cov( x, y)

Manuel Hurtado Snchez

x y
xy N
N

: Co var ianza entre x e y

Pgina 70

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

x
x n

: Desviacin estndar de x

y
y N

: Desviacin estndar de y

x y
xy N

x x y x

N
N
2

: Coeficente de correlaci n de pearson

Sabiendo que el coeficiente de correlacin lineal de Pearson puede valores


comprendidos entre cero y 1, los significados aproximados que se suelen
dar se presentan en el siguiente grfico:

Ejemplo 1.

Manuel Hurtado Snchez

Pgina 71

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Se desea estudiar la relacin existente entre el tiempo (en das) utilizado


para realizar una obra de construccin de un canal (Y) y el nmero de
trabajadores participantes en ella (X)

N de das necesarios
para hacer la obra
x

N de trabajadores
participantes en la obra
y

XY

X^2

Y^2

1
2
3
4
5
6
7
8
9
10

2
3
3
5
6
6
8
8
10
12

8
7
6
6
5
4
3
2
1
0.5

16
21
18
30
30
24
24
16
10
6

4
9
9
25
36
36
64
64
100
144

64
49
36
36
25
16
9
4
1
0.25

63

42.5

195

491

240.25

63 42.5
10
r
0.971

632
42.52
491
240.25

10
10

195

Manuel Hurtado Snchez

Pgina 72

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Ejemplo 2.
Se desea estudiar la relacin existente entre la Longitud en metros de un cable
elctrico (X) y el peso en Kgr. del cable (Y)

i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Suma

Longitud del
cable (metros)
X
4
6
6
7
7
7
8
9
9
9
11
11
11
13
13
14
15
16
176

Peso del cable


(en Kgr.)
Y
5
5
7
6
7
8
8
8
9
10
10
11
12
12
13
14
15
15
175

XY

X^2

Y^2

20
30
42
42
49
56
64
72
81
90
110
121
132
156
169
196
225
240
1895

16
36
36
49
49
49
64
81
81
81
121
121
121
169
169
196
225
256
1920

25
25
49
36
49
64
64
64
81
100
100
121
144
144
169
196
225
225
1881

176 175
18
r
0.972
2

176
175 2
1920
1881

18
18

1895

Manuel Hurtado Snchez

Pgina 73

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Regresin Lineal simple


Cuando estamos frente a una situacin en la que tenemos dos variables, digamos
X e Y, entre las cuales existe una relacin de dependencia lineal evidenciada en
el grfico de dispersin de puntos, de manera similar a como examinamos dicha
relacin cuando estudiamos el coeficiente de correlacin lineal de Pearson.
Supongamos que Y depende de X, entonces podemos establecer una ecuacin
de regresin lineal simple de la siguiente manera:
= + +
Donde:
Y = Variable dependiente o respuesta
X = Variable independiente i regresora
= ( )
= ( )

Representa la razn de cambio esperado de Y por cada unidad de cambio en X


Representa el valor esperado de la variable respuesta Y, cuando X = 0, siempre que
sea posible que X pueda tomar el valor cero (0), caso contrario no tiene
interpretacin y solo es el trmino constante de la ecuacin de regresin.
Mtodo de Mnimos cuadrados para estimar los parmetros de la
ecuacin de regresin lineal simple
Para estimar los parmetros de la ecuacin de regresin necesitamos una muestra
aleatoria de n-observaciones bidimensionales: { (x1, y1), , (xn, yn)}.
1 Graficar los datos y verificar que el tipo de relacin es lineal
2 Estimar los parmetros con las frmulas:
Manuel Hurtado Snchez

Pgina 74

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

x y
xy

n

x
x

Con lo cual podemos escribir la ecuacin de regresin lineal estimada.

Y X
Coeficiente de determinacin de la ecuacin de regresin lineal simple [ R2]
El coeficiente de determinacin es una medida de adecuacin de la ecuacin de
regresin lineal simple, y expresa el porcentaje de variabilidad de la variable
dependiente (Y) que est siendo explicada por la variable regresora (X) en la
ecuacin de regresin lineal simple. Su clculo se puede obtener elevando al
cuadrado el coeficiente de correlacin lineal de Pearson:

R2 r 2
Podemos notar que

0 R2 1 o en forma equivalente 0 R2 100

Usos de la ecuacin de regresin lineal simple:


El mayor beneficio de una ecuacin de regresin lineal simple es poder estimar o
pronosticar el valor de la variable dependiente cuando se conoce anticipadamente
el valor de la variable independiente; Sin embargo debemos tener presente
algunas consideraciones antes de realizar estos pronsticos:
1. El valor de Xo para el cual se desea pronosticar el valor de Y debe ser muy
cercano al valor de la media aritmtica de los valores de X utilizados en la
estimacin de los parmetros (
rango de estos valores.

), por ningn motivo puede estar fuera del

2. Los errores residuales deben tener distribucin normal con media cero y
varianza constante.
3. El coeficiente de determinacin debe ser por lo menos 70%

Ejemplo: Un comerciante al menudeo lleva a cabo un estudio para


determinar de qu manera dependen las ventas de los gastos por semana
en publicidad, para lo cual registra los datos de ambas variables en las
ltimas 12 semanas, cuyos datos aparecen en la siguiente tabla:

Manuel Hurtado Snchez

Pgina 75

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tabla N Ventas en funcin de los gastos en


publicidad
Semana Gasto semanal en valor de ventas
(i)
publicidad (X)
($): (Y)
1
2
3
4
5
6
7
8
9
10
11
12

40
20
25
20
30
50
40
20
50
40
25
50

385
400
395
365
475
440
490
420
560
525
480
510

1. En primer lugar por teora del mrquetin, sabemos que las ventas
dependen de los gastos en publicidad, y al representar los datos de estas
variables en las ltimas 12 semanas en la siguiente grfica, verificamos
que la relacin es del tipo lineal, entonces es aplicable el uso de la
regresin lineal simple.

2. Estimaremos los parmetros de la ecuacin de regresin lineal simple,


para lo cual hacemos construimos el siguiente cuadro de clculos:

Manuel Hurtado Snchez

Pgina 76

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tabla N __ cuadro de clculos para la regresin lineal simple de Ventas en funcin de los
gastos en publicidad
Gasto semanal en
valor de ventas ($):
Semana (i)
publicidad (X)
(Y)
X.Y
X2
Y2
1
2
3
4
5
6
7
8
9
10
11
12

40
20
25
20
30
50
40
20
50
40
25
50

385
400
395
365
475
440
490
420
560
525
480
510

15400
8000
9875
7300
14250
22000
19600
8400
28000
21000
12000
25500

1600
400
625
400
900
2500
1600
400
2500
1600
625
2500

148225
160000
156025
133225
225625
193600
240100
176400
313600
275625
230400
260100

Suma

410

5445

191325

15650

2512925

x y
xy
n

y
x

n

Y X

Manuel Hurtado Snchez

Esto significa que por cada


nuevo sol adicional que se
gaste en publicidad, debemos
esperar un incremento en las
ventas de 3.22 nuevos soles

410 5 445
191 325
12

3.2208
410 2
15650
12

5445
410

3.2208
12
12

343.71

Esto significa que si no se gasta


en publicidad, debemos esperar
un nivel de ventas de 342.71
nuevos soles

Y 343.71 3.2208 X

Pgina 77

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

El coeficiente de correlacin lineal de Pearson es:

1913255

410 5445
10

410 2
5445 2
15650
2512925

12
12

0.6348

Por lo tanto el coeficiente de determinacin ser:

R2

r 2 0.6348 2

0.403 40.3%

El valor nos indica que el 40.3% de la variabilidad de las ventas lo explica los gastos
en publicidad, es decir que se trata de una ecuacin no muy til para realizar
pronsticos de las ventas en funcin de los gastos en publicidad.

V.

DISEOS ESTADSTICOS DE MUESTREO


El diseo muestral comprende el mtodo de seleccin de los elementos de una
muestra, el nmero de elementos a ser seleccionados, y los mtodos de
estimacin de parmetros, el cual debe ser especificado en todo estudio por
muestreo.

1. Muestreo: El Muestreo es parte de la Estadstica. En su formulacin ms general,


puede decirse que su funcin bsica es determinar qu parte de una realidad en
estudio a la que suele llamarse poblacin debe examinarse con la finalidad de hacer
inferencia sobre el todo de la poblacin de la que procede.
El muestreo es, una herramienta de la investigacin cientfica; segn Cochran W. Tiene
como objetivo desarrollar mtodos de seleccin de muestras y de estimacin, que
proporcionen, al menor costo posibles, estimaciones con la suficiente exactitud para
nuestros propsitos.
2.

Ventajas del muestreo.-

a.
Costo reducido.- Si los datos se obtienen nicamente de una pequea fraccin del
total, los gastos son menores que los que se realizaran si se llevara a cabo un censo
completo. En poblaciones muy grandes se pueden obtener resultados lo suficientemente
exactos cuando se analizan muestras que representan slo una pequea fraccin de la
poblacin.
b. Mayor rapidez.Los datos pueden ser recolectados y resumidos ms rpidamente con una muestra
que con una enumeracin completa. Esta es una consideracin vital cuando se
necesita la informacin con urgencia.

Manuel Hurtado Snchez

Pgina 78

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

c. Ms posibilidades.Para obtener la informacin en ciertos tipos de encuestas, se utilizan los servicios de


personal altamente calificado o equipo muy especializado de disponibilidad limitada.
Por lo tanto, en estos casos el censo completo es impracticable y como alternativa a
la obtencin de datos por muestreo, solo existe la de no obtenerlos. De ah que las
encuestas basadas en el muestreo tengan ms posibilidades y flexibilidad respecto a la
informacin que puede obtenerse.
d. Mayor exactitud.Debido a que al reducir el volumen de trabajo se puede emplear personal ms
capacitado y someterlo a un entrenamiento intensivo y debido tambin a que en estas
condiciones ser factible la supervisin cuidadosa del trabajo de campo y del
procesamiento de los datos, una muestra puede producir resultados ms exactos que
la enumeracin completa.
e. nico mtodo de estudio.Hay situaciones en las que la observacin de unidades implica la destruccin de las
mismas, el muestreo en el nico mtodo lgico de obtener datos para tener
informacin de la poblacin.
Terminologa tcnica:
f.

UNIDAD DE OBSERVACIN.Son los elementos de la poblacin sobre los cuales se medirn las variables de
inters. sta es la unidad bsica, a veces llamada elemento. En los estudios de
poblaciones humanas la unidad de observacin son los individuos.
Ejemplo: En una investigacin sobre el estado nutricional y el rendimiento escolar de
los nios del nivel primario; la unidad de observacin son los nios del nivel primario.

g. POBLACION.Es el conjunto de todas las unidades de anlisis cuyas caractersticas se van a estimar.
Una poblacin debe definirse en trminos de su contenido, extensin y tiempo

Ejemplo: Estudiantes del Colegio Nacional San Jos de Chiclayo,


matriculados en el ao 2013
Una poblacin en estudio debe estar definida sin ambigedad, de manera que
no d lugar a confusiones.
h. POBLACION OBJETIVO.La poblacin objetivo est constituida por todos los elementos (unidades de
observacin), sin lmite a travs del tiempo y del espacio, que constituyen el objetivo
final de la generalizacin o inferencia.

Manuel Hurtado Snchez

Pgina 79

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

POBLACION MUESTRAL.La poblacin muestral est constituida por una parte o un subconjunto de la poblacin
objetivo. Est determinada y delimitada en el tiempo y en el espacio y de cuyos
elementos en la prctica se obtiene la muestra para realizar el estudio.

i. MUESTRA.Una muestra es un conjunto de unidades, una porcin del total, que nos
representa la conducta del universo en su conjunto.
Una muestra, en un sentido amplio, no es ms que eso, una parte del todo que
llamamos universo y que sirve para representarlo.
Sin embargo, no todas las muestras resultan tiles para llevar a cabo un trabajo
de investigacin. Lo que se busca al emplear una muestra es que, observando
una porcin relativamente reducida de unidades, se obtengan conclusiones
semejantes a las que lograramos si estudiramos el universo total. Cuando una
muestra cumple con esta condicin, es decir, cuando nos refleja en sus unidades
lo que ocurre en el universo, la llamamos muestra representativa. Por lo tanto,
una muestra representativa contiene las caractersticas relevantes de la
poblacin en las mismas proporciones en que estn incluidas en tal poblacin.
Sus conclusiones son susceptibles de ser generalizadas al conjunto del universo,
aunque para ello debamos aadir un cierto margen de error en nuestras
proyecciones.
Las muestras pueden ser clasificadas, en una primera divisin en probabilsticas
y no probabilsticas.
En las muestras probabilsticas, la caracterstica fundamental es que todo
elemento del universo tiene una determinada probabilidad de integrar la muestra,
y esa probabilidad puede ser calculada matemticamente con precisin. En las
muestras no probabilsticas ocurre lo contrario y el investigador no tiene idea del
error que puede estar introduciendo en sus apreciaciones.
j. UNIDAD DE MUESTREO.La unidad de muestreo y la unidad de anlisis son las mismas, pero hay casos
en que no lo son. Una unidad de muestreo puede contener un conjunto de
unidades de observacin o, incluso, un conjunto de unidades de muestreo
correspondientes a una etapa posterior de seleccin.
Ejemplo:

Podramos querer estudiar a las personas, pero no tenemos una lista de todos
los individuos que pertenecen a la poblacin objetivo. En vez de esto, la vivienda
sirven como las unidades de muestreo y las unidades de observacin son los
individuos que viven en una vivienda.
k. MARCO MUESTRAL.-

Manuel Hurtado Snchez

Pgina 80

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Un marco muestral es una lista de unidades de muestreo de tal forma que se


pueda seleccionar de all, las unidades que constituirn la muestra. El marco
muestral es indispensable, al menos cuando se trata de realizar un muestreo
probabilstico. Debe ser actualizado (sin omisiones ni duplicaciones.)

Ejemplos de marcos muestrales:


1. La gua telefnica
2. Padrn de empresas pblicas y privadas
3. Un plano de la ciudad.
4. Mapa de un pas.
5. El listado de alumnos.
6. rea de un terreno de cultivo.
l. PLAN MUESTRAL.Conjunto se reglas o especificaciones para seleccionar una muestra.
m. DISEO MUESTRAL.- El diseo muestral comprende el mtodo de seleccin y
estimacin, el cual debe ser indicado en todo estudio muestral.
Ejemplo:
Los Estilos de vida de los residentes en distrito de Chiclayo
Variable en estudio: Estilos de Vida.
Escala de medida: Nominal
Unidad de Observacin: Cada uno de los residentes del distrito de Chiclayo
Poblacin Objetivo: Todos los residentes
Poblacin Muestral: Todos los residentes del distrito de Chiclayo
Ejemplo: Si se desea estudiar factores que influyen, para drogarse, en los Jvenes
de una determinada ciudad, no se podra tener informacin sobre cuntos son, dnde
viven, como se llaman, por lo que sera imposible extraer una muestra de estos
Jvenes. El investigador tendra que tomar una muestra de casas para poder llegar a
los Jvenes.

Manuel Hurtado Snchez

Pgina 81

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

3. TIPOS DE MUESTREO
Con Reemplazo
Simple

T
I

Estratificado

Proporcional
Desproporcional
Cruzado

nico

O
S

Sin Reemplazo

Conglomerado

Probabilstico

Una etapa
Dos etapas
Multi etapas

Sistemtico

D
E

Doble
Mltiple
Secuencial

M
U
Casos tpicos.

Conveniencia

No

Probabilstico

Voluntarios
Bola de nieve

E
O

Manuel Hurtado Snchez

Pgina 82

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

4. MUESTRAS NO ALEATORIAS
Si consideramos que no precisamos cifras exactas sobre la representatividad
estadstica de nuestros resultados, podramos plantearnos el usar una muestra no
aleatoria (o "no probabilstica"), lo que significa que elegiremos a voluntad nuestra.
Podemos considerar que esto puede ayudarnos a obtener los elementos que
necesitamos estudiar directamente y, adems, actuar sin los tediosos procesos de
seleccin aleatoria y verificacin estadstica.
Sin embargo, hay una desventaja: corremos un gran riesgo de obtener demasiado
sesgo en la muestra. No seremos capaces siquiera de advertir la presencia, y menos
an la cantidad, de sesgo si hacemos personalmente la seleccin de la muestra. Y la
presencia de sesgo puede hacer imposible generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o grupo la
seleccin de los elementos.
Estas muestras son bastante tiles en aquellas situaciones en las cuales no es posible
utilizar un muestreo probabilista, es decir cuando no es posible disponer de un marco
muestral para la seleccin de los elementos de la muestra. Su utilizacin est
reservada solo para aquellos investigadores que conocen la estructura de la poblacin
y tienen un criterio suficientemente bueno para conseguir representatividad; incluso si
se dispone de un buen criterio para conseguir representatividad es posible obtener
mayor precisin a ms bajos costos que con un muestreo probabilista.
Entre los tipos comunes de muestras no aleatorias se incluyen,
Muestra de "casos tpicos" o los "mejores" casos es algo bastante tradicional en
historia del arte: estudiar solamente los "grandes maestros". La idea es que stos
representan lo ms autntico de su poca. Tal seleccin deliberada por parte del
investigador tiene no obstante riesgos serios, que se tratan en el punto Delimitar el
objeto de estudio.
Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una reunin,
podra ser designado como muestra. Este es un mtodo fcil y barato, pero el sesgo
suele ser imposible de estimar. El mtodo es popular en las demostraciones de cursos
sobre mtodos, pero raramente usado en la investigacin profesional.
Muestra de voluntarios es creada cuando todos los miembros de la poblacin tienen
la oportunidad de participar en la muestra. Un ejemplo es la respuesta voluntaria de
los clientes que llega a una empresa; igualmente, las respuestas que un investigador
recibe a un anuncio en un peridico pidiendo a la gente sus opiniones.
Una muestra de voluntarios suele ser una alternativa bastante sensata; no obstante, el
investigador debe considerar cuidadosamente los riesgos de sesgo. Hay dos
cuestiones que plantearse:
Manuel Hurtado Snchez

Pgina 83

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Es cierto que todos los miembros de la poblacin bajo muestreo tenan las mismas
oportunidades de ser incluidos en la muestra? Por definicin, los voluntarios difieren
de la media de la poblacin en su mayor actividad. La cuestin crucial entonces es
difieren del resto de la poblacin tambin en otros aspectos?.
Muestra bola de nieve. Cuando se entrevista a miembros de un grupo, podemos pedir
a las personas que nos indiquen otros individuos en ese grupo que estn en la mejor
posicin para dar informacin sobre ese tema; podramos tambin pedirles que nos
indicasen personas que compartan sus puntos de vista y tambin otras que sean de
opinin opuesta. Entonces entrevistaremos a nuevos individuos y continuaremos del
mismo modo hasta que no obtengamos nuevos puntos de vista de nuevos entrevistados.
Este es un buen mtodo por ejemplo para recoger los distintos puntos de vista existentes
en un grupo, pero su inconveniente es que no obtenemos una idea exacta de la
distribucin de las opiniones.
En el momento de disear una muestra no aleatoria, debemos siempre tener en mente
la poblacin. Es representativa la muestra? Son vlidos los resultados en la
poblacin?
Recordemos tambin que no tenemos que incluir elementos que no sean miembros de
la poblacin en nuestra muestra.

Por ejemplo, podramos decidirnos (de forma bastante sensata) por investigar
las preferencias de los clientes de electrodomsticos entrevistando a
vendedores. O podramos estudiar las historias de vida de arrendatarios
mediante un cuestionario a administradores de casas o caseros. La idea es
factible, ya que esta gente habitualmente conoce mucho sobre el tema. Sin
embargo, los "especialistas" no pueden ser tomados como muestra de "no
especialistas". Son dos poblaciones diferentes. No debiramos generalizar los
resultados de "especialistas" a ninguna otra poblacin que no sea la
de "especialistas", cualquiera que sea el campo del que tratemos.
En los ejemplos de arriba, podramos tal vez continuar transformando los resultados a
partir de los especialistas en hiptesis que ms tarde verificaramos con una muestra
apropiada de la poblacin "real" o de no especialistas, que seran en los ejemplos
citados, respectivamente, los consumidores y los arrendatarios. En otras palabras,
podramos usar la entrevista de los especialistas slo como un estudio preliminar.
5. Tamao de Muestras no aleatorias
No hay frmula para determinar el tamao de una muestra no aleatoria. Con
frecuencia, especialmente en investigaciones cualitativas, podemos simplemente
ampliar gradualmente nuestra muestra y analizar los resultados siempre que continen
llegando nuevos casos con informacin relevante o nueva; en cambio, cuando en los
casos nuevos ya no se presenta informacin nueva, podemos concluir que nuestra
Manuel Hurtado Snchez

Pgina 84

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

muestra est saturada, y terminaremos el trabajo de muestreo. Este mtodo es, sin
embargo, muy vulnerable al muestreo sesgado, con lo que tenemos que ser muy
cuidadosos y asegurarnos que no omitimos a ningn grupo de nuestra poblacin.
Antes de decidir el tamao de una muestra no aleatoria, tal vez debamos leer cmo
debe ser evaluada la representatividad de los resultados a partir de una muestra no
aleatoria. De otro modo podramos sufrir una sorpresa bastante desagradable cuando
estemos intentando, demasiado tarde, definir la poblacin en que nuestros resultados
puedan ser declarados vlidos.

6. ERROR DE MUESTREO:
Recordemos que la muestra descansa en el principio de que las partes
representan al todo y, por tal, refleja las caractersticas que definen a la poblacin
de la cual fue extrada, lo cual nos indica que es representativa. Es decir, que
para hacer una generalizacin exacta de una poblacin, es necesario tomar una
muestra representativa. Por lo tanto, la validez de la generalizacin depende de
la validez y tamao de la muestra.
Cuando trabajamos con muestras, generalmente se presentan dos tipos de
errores:
Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan
por causas ajenas a la muestra:

Situaciones inadecuadas: se presentan, por ejemplo, cuando el encuestador


tiene dificultades para obtener la informacin y la sustituye por la que ms fcilmente
est a su alcance, que no siempre es la ms confiable.

Insuficiencia en la recoleccin de datos: hay distorsin por falta de respuestas,


o respuestas inadecuadas, ya sea por ignorancia o falta de datos relativos a los
elementos incluidos. Distorsiones del encuestador causadas por prejuicios, inters
personal o por fallas en la aplicacin de instrumentos.

Errores de cobertura a causa de que no se han incluido elementos importantes y


significativos para la investigacin que se realiza.

Error de muestreo o muestral. Cualquiera sea el procedimiento utilizado y la


perfeccin del mtodo empleado, la muestra diferir de la poblacin. A esta diferencia
se la denomina error de muestreo.

Cuando una muestra es aleatoria o probabilstica, es posible calcular sobre ella


el error muestral. Este error indica el porcentaje de incertidumbre, es decir, el
riesgo que se corre de que la muestra elegida no sea representativa. Si
trabajamos con un error calculado en 5%, ello significa que existe un 95% de
probabilidades de que el conjunto muestral represente adecuadamente al
universo del cual ha sido extrado.

Manuel Hurtado Snchez

Pgina 85

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

A medida que incrementamos el tamao de la muestra, el error muestral tiende


a reducirse, pues la muestra va acercndose ms al tamao del universo. Del
mismo modo, para una muestra determinada, su error ser menor cuanto ms
pequeo sea el universo a partir del cual se la ha seleccionado. As, para un
universo de 10.000 casos, una muestra de 200 unidades tendr un error mayor
que una de 300; una muestra de 200 casos, por otra parte, tendr un error mayor
si el universo tiene 10.000 unidades que si ste posee solamente 2.000.
Para fijar el tamao de la muestra adecuado a cada investigacin, es preciso
primero determinar el porcentaje de error que estamos dispuestos a admitir. Una
vez hecho esto, debern realizarse las operaciones estadsticas
correspondientes para poder calcular el tamao de la muestra que nos permite
situarnos dentro del margen de error aceptado.
A veces, sin embargo, el tamao de la muestra queda determinado previamente
por consideraciones prcticas; en tales casos, no hay otra alternativa que aceptar
el nivel de error que su magnitud acarree.
Si una muestra extrada de la poblacin, se denomina error de muestreo para
esa muestra, a la diferencias que existe entre una estimacin muestral y el
parmetro poblacional obtenido por un censo completo. El error de muestreo es
inherente al uso de mtodos de muestreo, y el error estndar cuantifica su
magnitud.

Si es el parmetro de inters y es un estimador de , debemos especificar

un lmite para el error de estimacin; esto es, debemos especificar que y


difieran en valor absoluto en una cantidad menor que

Simblicamente: Error de estimacin = / /


Debemos establecer tambin una probabilidad ( 1 ), que especifica la fraccin de las
veces en muestreo repetido en que requerimos que el error de estimacin sea menor
que . Esta condicin puede ser establecida como
P{Error de estimacin < }= 1

1. MUESTREO ALEATORIO SIMPLE


Es un procedimiento de seleccin de una muestra por el cual todos y cada uno de los
elementos de la poblacin tienen igual probabilidad de ser incluidos en la muestra,
Adems, si se toma la muestra de tamao n, cualquier muestra posible de n elementos
tiene la misma probabilidad de ser extrada que cualquier otra combinacin de

elementos, ya sea que la muestra se seleccione con o sin reposicin.


Manuel Hurtado Snchez

Pgina 86

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Una muestra aleatoria simple se extrae por seleccin aleatoria empleando los nmeros
aleatorios, este proceso ofrece la oportunidad de que todos los elementos que no han
sido sacados previamente tengan igual probabilidad de pertenecer a la muestra.
Este tipo de muestreo es eficiente en poblaciones pequeas y homogneas, para la
cual se dispone de listas adecuadas (marco muestral) y cuando la dispersin
geogrfica de los elementos muestrales no constituye un problema; as es
relativamente fcil y barato seleccionar las unidades muestrales. El inconveniente en
poblaciones grandes es conseguir una lista completa o exacta de la poblacin (marco
muestral). Otro problema conexo es el costo de determinar el nmero de elementos de
la muestra y recabar informacin a partir de cada elemento (poblaciones heterogneas)
Por ejemplo, la muestra puede contener elementos que se hallan muy dispersos por lo
tanto, para efectuar entrevistas personales se requieren fuertes desembolsos por
concepto de viaje.

1.1. Tamao de muestra para estimar un Media Poblacional:

Manuel Hurtado Snchez

Pgina 87

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Z2 2

d2

Z2 2
2

Donde:

n Tamao de muestra

Desvo Normal para una confianza (1 ) . (Sus valores se obtienen de la


2

distribucin normal estndar).

2
d

Varianza poblacional (Generalmente tiene un valor desconocido)


Nivel de precisin (Mximo error de muestreo al estimar la media poblacional tolerada por
el investigador)

N =

Tamao total de la poblacin

Valores de Z

para distintos niveles de confianza


2

Probabilidad de
confianza (1 )
0.90
0.95
0.99

Manuel Hurtado Snchez

Probabilidad de
significancia: ( )
0.10
0.05
0.01

0.050
0.025
0.005

1.645
1.960
2.576

Pgina 88

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tcnicas de estimacin de la varianza


1 Posibilidad: Utilizar la varianza

s2

de poblacin similar

2 Posibilidad: Utilizar la varianza s de la misma poblacin obtenida en un


estudio anterior resiente.

Manuel Hurtado Snchez

Pgina 89

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

3 Posibilidad: Si la variable en estudio tiene distribucin normal, la varianza puede


ser estimada determinando el mximo y el mnimo y utilizando la
propiedad de la distribucin Normal que aproximadamente 0.9973
del rea se encuentra en el intervalo

, por lo que la

varianza estimada podr ser estimada utilizando la siguiente


frmula:

Mximo Mnimo

4 Posibilidad: Si la distribucin de la variable es del tipo triangular o asimtrica, la


desviacin estndar
podr ser estimada utilizando la
siguiente aproximacin:

0.24Mximo Mnimo

Manuel Hurtado Snchez

Pgina 90

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

5 Posibilidad: Utilizando una muestra piloto, de donde podr obtenerse la varianza


muestral

s2

poblacional

y utilizarla como un estimador de la varianza

para efectos del clculo del tamao de

muestra. Es decir que:

2 s2

Ejemplo: Se desea estimar el peso promedio de una poblacin de 400 estudiantes


ingresantes a una Universidad. En base a una muestra preliminar de 10 de estos
estudiantes que acudieron a su control mdico en la Direccin de Bienestar
universitario, se estima una desviacin estndar de 6.6 Kgr. Si deseamos tener un
mximo error de muestreo de 1.5 Kgr. y una confianza de 0.95.Cul ser el tamao
de muestra mnimo requerido?
La frmula a utilizar ser:

Z2 2
2

d2
Poblacin N =

400

Confianza (1-)

0.95

Manuel Hurtado Snchez

Z2 2
2

Pgina 91

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Significancia ()

0.05

(1-/2)

0.975

1.960

Error

1.500

DE(x) = =

6.6

Tamao de muestra n = 63

1.96 2 6.6 2
n
63
1.96 6.6 2
2
1.5
400

1.2.

Tamao de muestra para estimar una Proporcin Poblacional:

Z2 pq
2

d2

Manuel Hurtado Snchez

Z2 pq
2

N
Pgina 92

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Donde:

n Tamao de muestra

Desvo Normal para una confianza (1 ) . (Sus valores se obtienen de la


2

distribucin normal estndar).

Proporcin muestral esperada o conjeturada por el investigador

q 1 p Complemento de la proporcin muestral

Nivel de precisin (Mximo error de muestreo al estimar la proporcin poblacional


tolerada por el investigador)

N =

Tamao total de la poblacin

Estimacin de la proporcin para calcular el tamao de muestra:


1 Posibilidad: El investigador asigna un valor para P considerando un valor que l
puede esperar encontrar cuando realice el muestreo, siempre que este valor se
encuentre entre 0.25 y 0.75.
2 Posibilidad: Cuando p < 0.25, se considerar que estamos investigando una
caracterstica rara, por lo que debe abandonarse dicho valor y se asume p = 0.5, se
procede de manera similar cuando p>0.75, tambin se abandona y se remplaza por
0.5, con lo cual estaremos asumiendo una mxima varianza, puesto que el producto
p.q tiende a cero cuando p tiende a cero o a 1; en cambio toma su mximo valor
cuando p = 0.5.

Manuel Hurtado Snchez

Pgina 93

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Ejemplo

Ejemplo: Se desea estimar la proporcin de clientes que aceptaran recibir


un baln de gas domstico nuevo antes de que el que tiene en uso se
termine, y guardarlo el baln vaco hasta la siguiente entrega. Se sabe que
establecimiento comercial tiene 1500 clientes, de quienes conoce sus
nombres y direcciones. El dueo del establecimiento comercial aplic una
muestra piloto a un grupo de 20 clientes a quienes les pregunt si estaran
de acuerdo con esta propuesta, encontrando que 15 estaban de acuerdo
con dicha propuesta. Se necesita tener una confianza de 0.95 y una
precisin de 0.06 en la estimacin de dicha proporcin. Cul ser el
tamao de muestra?.

Tamao de la poblacin N = 1500


Proporcin aproximada p = 15/20 = 0.75,
Complemento de p:

q = 1-p = 0.75

Confianza: (1) = 0.95


Desvo normal : 2 = 1.96
Precisin: d = 0.06
Tamao de muestra: =

2 .

2
2

2 + 2

(1.96)2 0.75 0.25


= 200
(1.96)2 0.75 0.25
2
0.06 +
1500

Respuesta: Se debe obtener una muestra de n = 200 clientes, los cuales deben
ser seleccionados en forma aleatoria.

Manuel Hurtado Snchez

Pgina 94

UNIVERSIDAD SAN PEDRO

1.3.

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tamao de muestra para probar hiptesis acerca de la Media Poblacional:

Ho : o

1 Caso:

Ha : o
2

Z Z 2

n 2

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

Manuel Hurtado Snchez

Probabilidad de error tipo II

Pgina 95

UNIVERSIDAD SAN PEDRO

2 Caso:

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Ho : o
Ha : o Ha : o

Z
n

Z 2
2

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

3 Caso:

Probabilidad de error tipo II

Ho : 1 2
Ha : 1 2
2

Z Z ( 2 2 )

1
2
2

Manuel Hurtado Snchez

Pgina 96

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

4 Caso:

Probabilidad de error tipo II

1 2

Ho : 1 2
Ha : 1 2 Ha : 1 2

Z
n

Z ( 12 22 )
2

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

1.4.

Probabilidad de error tipo II

1 2

Tamao de muestra para probar hiptesis acerca de la Proporcin


Poblacional:
1 Caso:

Ho : P Po

Ha : P Po
Z
Po Qo Z pq

n 2

Manuel Hurtado Snchez

Pgina 97

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

Probabilidad de error tipo II

p Po

1 Po

Qo

proporcin muestral

q 1 p

Ho : P Po

2 Caso:

Ha : P Po

Z
n

Po Qo Z

Ha : P Po
pq

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

Qo

Manuel Hurtado Snchez

Probabilidad de error tipo II

p Po

1 Po
Pgina 98

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

proporcin muestral

q 1 p

3 Caso:

Ho : P1 P2
Ha : P1 P2

p1 p2 p1 p2 / 2
2

p1q1 p2 q2

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

4 Caso:

Probabilidad de error tipo II

P1 P2

Ho : P1 P2
Ha : P1 P2 Ha : P1 P2

Z
n

p1 p2 q1 q2 / 2

Z p1q1 p2 q2

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

Manuel Hurtado Snchez

Probabilidad de error tipo II

P1 P2
Pgina 99

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Ejemplo:
Se desea determinar el tamao de muestra para probar una hiptesis de
comparacin de proporciones. Ho : P1 = P2 contra Ha: P1 < P2, donde:
P1 : Proporcin de complicaciones en intervenciones quirrgicas con protocolo.
P2 : Proporcin de complicaciones en intervenciones quirrgicas sin protocolo.
De acuerdo a la informacin histrica, del Hospital Regional Docente Las
Mercedes de Chiclayo, se conoce que, cuando se sigue el protocolo, la proporcin
de complicaciones quirrgicas es 0.01, y cuando no se sigue el protocolo esta
proporcin es de 0.18. Si deseamos tener una confianza de 0.95 y tambin una
potencia para la prueba de hiptesis de 0.95, Cul deber ser el tamao de
muestra mnimo requerido?
La frmula a utilizar en este caso es:

Z
n

p1 p2 q1 q2 / 2

Z p1q1 p2 q2

n = tamao de muestra para cada grupo


Confianza de la prueba: (1-) = 0.95 entonces Z = 1.645
Potencia de la prueba: (1-) = 0.95 entonces Z = 1.645
Proporcin de complicaciones quirrgicas con protocolo p1 = 0.01
Proporcin de complicaciones quirrgicas sin protocolo p2 = 0.18
Entonces: q1 = 1 - p1 = 0.99

q2 = 1- p2 = 0.82

Remplazando en la frmula tenemos:

1.645
n

0.01 0.180.99 0.82 / 2 1.645


0.01 0.182

0.01 0.99 0.18 0.82

62

Respuesta: Se debe obtener una muestra de 62 observaciones de cada uno de


los grupos.
Manuel Hurtado Snchez

Pgina 100

UNIVERSIDAD SAN PEDRO

1.5.

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tamao de muestra para probar hiptesis de estudios de Casos y


Controles:

Ho : P1 P2
H a : P1 P2
Z
2 pq Z p1q1 p2 q2

Donde:

Probabilidad de error tipo I, o nivel de significancia de la prueba

Probabilidad de error tipo II

p1 Casos
p2

Controles

p2 p2
2
q 1 p
p

: Proporcin mancomunada

P1 P2

Ejemplo: Se necesita calcular el tamao de muestra para una investigacin con diseo
de casos y controles, para probar una hiptesis de que la proporcin de partos exitosos
con mtodo de induccin es mayor a la proporcin de partos exitosos cuando no se
usa este tratamiento.
Sea: P1 = Proporcin de induccin exitosa de partos con un tratamiento
P2 = Proporcin de induccin exitosa de partos con un tratamiento

La Hiptesis en prueba es:


Ho: P1=P2 contra
Ha: P1>P2
La frmula que corresponde ser utilizada es:

Z
n

2 pq Z

p1q1 p2 q2

p1 p2 2

= Tamao de muestra mnimo para cada grupo: Casos y controles


Z = 1.645 : Desvo normal para una significancia del 0.05
Manuel Hurtado Snchez

Pgina 101

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Z = 1.645 : Desvo normal para una significancia de 0.05


1 = 0.8

:Proporcin de induccin exitosa del parto usando el tratamiento (Caso)

2 = 0.6

:Proporcin de partos exitosos sin usar tratamiento (control)

q1 = 1 p1 = 1 0.8 = 0.2
q1 = 1 p1 = 1 0.8 = 0.2

1 +2
2

0.8+0.6
2

= 0.7

= 1 = 1 0.7 = 0.3

Reemplazando en la frmula tenemos:


2

(1.645 2 0.7 0.3 + 1.645 0.8 0.2 + 0.4 0.4)


=
= 111
(0.8 0.6)2
Respuesta:
El tamao de muestra ser n1 = 111 casos y n2 = 111 controles

i.
Muestreo Aleatorio Estratificado (MAE):
En este tipo de muestreo, la poblacin es dividida en L subpoblaciones o
estratos, de tamaos Nh cada uno de ellos de los cuales se selecciona nh
elementos respectivamente, de modo tal, que en cada estrato, cada uno de
los elementos tengan la misma probabilidad de ser incluidos en la muestra.
Este proceso genera muestras representativas siempre que la variabilidad
en cada subpoblacin no exceda el 33%, aun cuando la poblacin general
dicha variabilidad sea mayor que el 33%.

Manuel Hurtado Snchez

Pgina 102

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

El clculo del tamao de muestra depende del propsito del muestreo, es


decir del parmetro que se pretende estimar y del modo de asignacin o
reparto de tamao general de muestra a cada uno de los estratos.
Tamao general de muestra para estimar la media poblacional con
asignacin de Neyman en el MAE.

WS
n
W S
V
2

2
h

N = Tamao general de la Poblacin


n = Tamao general de muestra
Wh = Nh/N = Ponderacin del estrato h en la poblacin
Sh = Desviacin estndar en el estrato h.
V = (d/2 )2 = Varianza deseada al estimar la media poblacional
Tamao de la muestra en los estratos:

nh

Wh Sh
n
2
Wh Sh

Ejemplo: Se desea investigar el nivel de competencias bsicas de comprensin


lectora y Matemticas en estudiantes del 5 de secundaria de tres instituciones
educativas representativas de Chiclayo: Colegio Nacional San Jos, Colegio
Nacional Elvira Garca y Garca y el Colegio Nacional Magdalena Sofa. Como
antecedente de esta investigacin se dispone de las notas promedio en ambos
cursos, las cuales utilizaremos para disear la muestra.
RENDIMIENTO ACADMICO EN LENGUAJE Y MATEMTICAS DE ESTUDIANTES DE 5 DE
SECUNDARIA DE TRES INSTITUCIONES EDUCATIVAS DE CHICLAYO EN DICIEMBRE DEL 2012
Institucin Educativa
Elvira Garca
Magdalena Sofa
San Jos

N de
Estudiantes
148
152
150

Promedio.
Lenguaje
14.20
13.82
14.75

Desv. Estnd.
Lenguaje
2.25
2.36
2.52

Promedio.
Matemtica
13.94
14.11
14.92

Desv. Estnd.
Matemtica
3.22
2.59
3.05

Como la investigacin comprende dos variables, que son la Comprensin Lectora


y Matemticas, entonces haremos el clculo del tamao de muestra estratificado
para cada una de las variables y al final nos quedaremos el tamao de muestra
ms grande. Elegimos un nivel de confianza de 0.95 y un error de muestreo de
aproximadamente igual a 3.5% del promedio general en los tres colegios, cuyo
valor resulta ser igual a 0.5 puntos, con lo cual la varianza deseada V ser obtenida
del siguiente modo:

Manuel Hurtado Snchez

Pgina 103

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Confianza (1-/2)
= 0.95
Desvo Normal
2 = 1.96
Precisin (3.5% de la media) d = 0.5
Varianza deseada: V=(d/Z)2 = 0.06507944
Calculo del tamao de muestra general para investigar competencias bsicas de
comprensin lectora:
=

( )2
(2.3786)2
=
= 73
2 0.06507944 + 5.6697
+
450

Tamao de muestra para los estratos (colegios):


1 =

1 1
0.7406
=
73 = 23

2.3786

2 =

2 2
0.7980
=
73 = 24

2.3786

3 =

3 3
0.8400
=
73 = 26

2.3786

Cuadro de clculos del tamao de muestra para investigar competencias bsicas de


Lenguaje en tres instituciones Educativas de Chiclayo
Institucin Educativa
(Estrato h)
Elvira Garca
Magdalena Sofa
San Jos
Total

N de
Estudiantes
Nh
148
152
150
450

Promedio en
Lenguaje
14.20
13.82
14.75

Desv. Estnd.
Lenguaje Sh
2.25
2.36
2.52

Ponderacin:
Wh
0.329
0.338
0.333
1.000

Wh. Sh
0.7406
0.7980
0.8400
2.3786

Wh.Sh^2
1.6675
1.8854
2.1168
5.6697

muestra del
estrato: nh
23
24
26
73

Calculo del tamao de muestra general para investigar competencias bsicas de


comprensin Matemticas:
=

( )2
(2.9521)2
=
= 103
8.7850
2
+ 0.06507944 + 450

Tamao de muestra para los estratos (colegios):


1 =

Manuel Hurtado Snchez

1 1
1.0591
=
103 = 37

2.9521

Pgina 104

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

2 =

2 2
0.8763
=
103 = 31

2.9521

3 =

3 3
1.0167
=
103 = 35

2.9521

Cuadro de clculos del tamao de muestra para investigar competencias bsicas de Matemticas
en tres instituciones Educativas de Chiclayo
Institucin
Educativa
(Estrato h)

N de
Desv. Estnd.
Estudiantes Promedio en Matemticas Ponderacin:
Nh
Matemticas
Sh
Wh
Elvira Garca
148
13.94
3.22
0.329
Magdalena Sofa
152
14.11
2.59
0.338
San Jos
150
14.92
3.05
0.333
Total
450
1.000

Wh. Sh
1.0591
0.8763
1.0167
2.9521

Wh.Sh^2
3.4107
2.2734
3.1008333
8.7850

muestra del
estrato: nh
37
31
35
103

Conclusin: Para la investigacin nos debemos quedar con este ltimo


tamao por ser el ms grande

Tamao general de muestra para estimar la proporcin poblacional con


asignacin de Neyman en el MAE.
Cuando el diseo de muestra es el Estratificado con asignacin de Neyman
(Este tipo de asignacin se utiliza cuando los costos de muestreo es igual
en cada uno de los estratos), el tamao general de muestra se calcula con
la siguiente frmula:
2

( )
=

+

Donde:
N = Tamao general de la Poblacin
n = Tamao general de muestra

Wh = Nh/N = Ponderacin del estrato h en la poblacin


V = (d/2 )2 = Varianza deseada al estimar la media poblacional
ph = Proporcin estimada en el estrato h.
qh = 1-ph

Manuel Hurtado Snchez

Pgina 105

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tamao de la muestra en los estratos:

Ejemplo de diseo y muestra para estimar una proporcin con M.A.E.


Se desea estimar la proporcin de estudiantes con buena calidad de sueo entre los estudiantes
matriculados en la universidad catlica Santo Toribio de Mogrovejo matriculados en el semestre
2015-I. Se tiene acceso al padrn de matriculados por carrera profesional, de donde se obtiene el
nmero total de matriculados (6120), adems se puede obtener el nmero de matriculados en cada
una de las 18 carreras existentes as como una estimacin a priori de la proporcin de estudiantes
con buena calidad de sueo en cada carrera, lo cual se presenta en la tabla siguiente. Si
establecemos una confianza de 0.95 y una precisin de 0.05 para estimar la proporcin antes
indicada, cul ser el tamao general de muestra y el correspondiente a cada uno de los estratos?.

Poblacin: La poblacin lo constituyen los 6120 estudiantes de la USAT matriculados en el semestre


acadmico 2011-I, clasificados segn carrera profesional.

Muestra: Se utilizar un muestreo estratificado para estimar la proporcin de estudiantes con calidad
de sueo Deficiente. Las unidades elementales o informantes son cada uno de los estudiantes. Se
elige un nivel de confianza de 0.95 y un nivel de precisin de 0.05

Clculo del tamao de muestra.

El tamao de muestra se calcula para estimar la proporcin de estudiantes con calidad de sueo
deficiente, mediante un muestreo estratificado con asignacin de Neyman, la cual asigna un tamao
de muestra a los estratos teniendo en cuenta el tamao del estrato y la dispersin interna del estrato.
Suponiendo que los costos de muestreo dentro de cada estrato es el mismo.

Manuel Hurtado Snchez

Pgina 106

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Estudiantes de la USAT matriculados en el semestre 2011-I

P = Proporcin de
estudiantes con
calidad de sueo
deficiente

N = 6120

Administracin
Admi
de empresas

N1 = 1141

Psicologa

Administracin
hotelera

N18 = 301

N2 = 291

d = 0.05
(1-)=0.95

n1 = 69

n18 = 30

n2 = 18

Tamao general de
muestra
n = 413

pst = Estimado
estratificado de P

Tamao general de muestra:

(Wh ph qh ) 2
n
,
Wh ph qh

V
N

Donde
2

d
V Varianza deseada del estimador de la proporcin
z
Asumimos
Una confianza (1-) de 0.95, para el cual, el desvo normal es Z = 1.96
Una precisin (mximo error de muestreo tolerado) d 0.05
Entonces la varianza deseada debe ser:
2

0.05
V
0.000651
1.96
Los clculos se muestran en la siguiente tabla, con lo cual, el tamao de muestra es:
n

Manuel Hurtado Snchez

(0.434192) 2
276
0.203828
0.000651
6120

Pgina 107

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

La asignacin de Neyman del tamao de muestra a los estratos se hace con la frmula:
W p q
nh h h h n
Wh ph qh
por razones de conseguir estabilidad para los estimadores por carrera profesional, se corrige el
tamao de muestra a un mnimo de 30, con lo cual se tiene una muestra corregida de 535
estudiantes, tal como se puede apreciar en el siguiente cuadro.
Cuadro N 2 Clculo del tamao de muestra estratificado con asignacin de Neyman para estudiantes de la
USAT matriculados en el semestre acadmico 2011-I.
Matriculados

ESTRATO (h)
(2011-I): Nh
Carrera profesional

N
Wh h
N

Proporcin de
estudiantes con
calidad de
sueo deficiente

qh 1 ph Wh p h q h

Wh ph qh

nh

nh (corr )

ph
ADM. DE EMPRESAS
ADM. HOTELERA Y
DE SERVICIOS
CONTABILIDAD
ECONOMA
EDUCACIN (inicial,
Prim. y Secundaria.)
COMUNICACIN
DERECHO
ARQUITECTURA
ING. CIVIL Y AMB.
ING. DE SIST. Y
COMP.
ING. ENERGTICA
ING. INDUSTRIAL
ING. MECNICA
ELCTRICA
ING. NAVAL
ENFERMERA
MEDICINA
ODONTOLOGA
PSICOLOGA
TOTAL

1131

0.1848

0.3

0.5

0.071574

0.027721

45

45

289

0.0472

0.25

0.5

0.016696

0.005903

11

30

479
177

0.0783
0.0289

0.3
0.3

0.5
0.5

0.030313
0.011201

0.011740
0.004338

19
7

30
30

254

0.0415

0.25

0.5

0.014674

0.005188

30

220
703
234
320

0.0359
0.1149
0.0382
0.0523

0.4
0.4
0.4
0.4

0.5
0.5
0.5
0.5

0.016076
0.051371
0.017099
0.023384

0.007190
0.022974
0.007647
0.010458

10
33
11
15

30
33
30
30

398

0.0650

0.6

0.5

0.035620

0.019510

23

30

9
415

0.0015
0.0678

0.4
0.6

0.5
0.5

0.000658
0.037141

0.000294
0.020343

0
24

9
30

71

0.0116

0.6

0.5

0.006354

0.003480

30

28
589
296
207
300
6120

0.0046
0.0962
0.0484
0.0338
0.0490
1.0000

0.4
0.4
0.7
0.6
0.4

0.5
0.5
0.5
0.5
0.5

0.002046
0.043041
0.028614
0.018526
0.009804
0.434192

0.000915 1
0.019248 27
0.016928 18
0.010147 12
0.009804 6
0.203828 276

28
30
30
30
30
535

El estimador de la proporcin y su desviacin estndar, se obtendrn con las formulas correspondientes


a este diseo muestral. A continuacin se muestran dichas frmulas:
18

pst phWh ,
h1

Manuel Hurtado Snchez

DE( pst )

18

W
h1

2
h

ph qh N h nh

nh N h 1

Pgina 108

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

ii. Muestreo por conglomerados (MC):


En este tipo de muestreo, la poblacin es dividida en M subpoblaciones o
conglomerados, de tamaos Nj cada uno de ellos. En la 1 etapa se
seleccionan m conglomerados, de los cuales se selecciona nj elementos
respectivamente, de modo tal, que en cada conglomerado, cada uno de los
elementos tengan la misma probabilidad de ser incluidos en la muestra. Este
proceso genera muestras representativas aun cuando la variabilidad en
cada conglomerado exceda el 33%.

Tamao de Muestra por conglomerados en dos etapas con


probabilidades proporcionales al tamao:
o Supongamos que se tiene una poblacin de N unidades de anlisis
divididas en M conglomerados de tamaos N1, N2, ... , NM conocidos.
o Por ejemplo tenemos un censo actualizado de un sector de salud
que tiene 2 189 individuos distribuidos en 8 manzanas del siguiente
modo:
Manzana: 1
Tamao : 114

2
222

3
525

4
308

5
205

6
191

7
414

8
210

o Se seleccionar una muestra de exactamente n elementos en dos


etapas:

Manuel Hurtado Snchez

Pgina 109

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

o Obtener m conglomerados o unidades de primera etapa (UPE) de


modo que a las mayores les correspondan mayores probabilidades
de seleccin y luego tomar exactamente c individuos en cada UPE
(n=mxc)
Por ejemplo; de una poblacin de 2189 viviendas agrupadas en 8
conglomerados, se desea seleccionar una muestra de por conglomerados
de n = 200 viviendas, agrupadas en m = 4 conglomerados cada uno de un
tamao C = 50 viviendas.
N = 2189,

n = 200,

m = 4 y c = 50.

Pasos:
1. Crear una lista de las UPE (conglomerados) y obtener los tamaos
acumulados Di = N1 + N2 + ... + Ni a lo largo de la misma:
Marco muestral de Unidad Primaria Elemental (UPE)
UPE i

Tamao Ni

Tamao acumulado Di

114

114

222

336

525

861

308

1169

205

1374

191

1565

414

1979

210

2189

2 Calcular el intervalo de seleccin I.

I
En el ejemplo =

2189
4

N
m

= 547.25 547

3. Seleccionar un nmero aleatorio R entre 1 e I. En nuestro caso de 1 en


547. Supongamos que al seleccionar un nmero aleatorio se obtiene R
= 369

Se calculan los nmeros

Manuel Hurtado Snchez

Pgina 110

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Z1 =R,

Z2 =R+I,

Z3 = R+2I . Zm = R+(m-1)I

En nuestro caso estos m = 4 nmeros son: 369, 916, 1 463, 2 010


Asociar cada uno de estos nmeros con una UPE del modo siguiente: se
selecciona en cada caso la primera UPE cuyo tamao acumulado supere
o iguale al nmero en cuestin.
De este modo, 369 identifica a la manzana 3 ( pues C3 = 861 es el
primer valor que supera 369); 916 identifica a la UPE nmero 4 por ser
1 169 el primer acumulado que lo supera; 1 463 a la manzana 6 y 2 010
a la ltima.
As en el ejemplo han quedado elegidos los conglomerados que ocupan
los lugares 3, 4, 6 y 8 del listado
UPE i
1
2
3
4
5
6
7
8

Tamao Ni
114
222
525
308
205
191
414
210

Tamao
acumulado Di
114
336
861
1169
1374
1565
1979
2189

Zi

369
916
1463
2016

Hacer una seleccin simple aleatoria de exactamente c = 50 individuos


de cada UPE elegida en el paso anterior.

b. Combinacin del
Conglomerados

muestreo

Aleatorio

Estratificado

por

Se calcula el tamao de muestra con el muestreo aleatorio estratificado y


en cada estrato se aplica el muestreo por conglomerados con
probabilidades proporcionales al tamao.

Manuel Hurtado Snchez

Pgina 111

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Ejemplo.
Deseamos estimar la proporcin de viviendas con alta vulnerabilidad
ssmica en la ciudad de Ferreafe, para lo cual se dispone de un plano, el
cual aparece segmentado en 7 zonas aproximadamente homogneas a su
interior, pero que tienen distintos niveles de vulnerabilidad de una zona a
otra. Se conoce el nmero de viviendas por manzana, por cada zona y por
lo tanto el total de viviendas, as mismo se tiene una estimacin a priori de
la proporcin de viviendas en cada zona que tienen alta vulnerabilidad
ssmica. Dichos valores se muestran en el siguiente cuadro.

Sector (h)
1
2
3
4
5
6
7
Total

N de
viviendas
: Nh
425
1482
1292
1621
2105
1286
1187
9398

Proporcin de viviendas
con alta vulnerabilidad
ssmica: ph
0.7
0.8
0.6
0.5
0.6
0.4
0.9

Deseamos tener para la estimacin de la proporcin antes indicada con una


confianza de 0.95 y una precisin de 0.07. Cul ser el tamao general de
muestra y el tamao de muestra para cada estrato?, Adems si deseamos
aplicar un muestreo por conglomerados con probabilidades proporcionales
al tamao, donde cada conglomerado viene a ser una manzana de
viviendas, cules sern las manzanas que debemos considerar en la
muestra, si asumimos una muestra fija igual a 8 para cada manzana
seleccionada?
Muestra estratificada
Tamao general de muestra:

(Wh ph qh ) 2
n
,
Wh ph qh

V
N

Donde
2

d
V Varianza deseada del estimador de la proporcin
z
Asumimos
Una confianza (1-) de 0.95, para el cual, el desvo normal es Z = 1.96
Una precisin (mximo error de muestreo tolerado) d 0.07
Manuel Hurtado Snchez

Pgina 112

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Entonces la varianza deseada debe ser:


2

0.07
V
0.00128
1.96
Los clculos se muestran en la siguiente tabla, con lo cual, el tamao de muestra es:
n

(0.45205) 2
160
0.03435
0.00128
9398

La asignacin de Neyman del tamao de muestra a los estratos se hace con la frmula:
W p q
nh h h h n
Wh ph qh
N de
Sector
viviendas
(h)
: Nh
1
425
2
1482
3
1292
4
1621
5
2105
6
1286
7
1187
Total
9398

Proporcin de viviendas
con alta vulnerabilidad
ssmica: ph
0.7
0.8
0.6
0.5
0.6
0.4
0.9

Wh
0.0452
0.1577
0.1375
0.1725
0.2240
0.1368
0.1263
1

Muestra de muestra de
Mz
qh Wh(phqh)^0.5 Wh^2(phqh) viviendas nh
0.3
0.02072
0.00043
7
1
0.2
0.06308
0.00398
22
3
0.4
0.06735
0.00454
24
3
0.5
0.08624
0.00744
30
4
0.4
0.10973
0.01204
39
5
0.6
0.06704
0.00449
24
3
0.1
0.03789
0.00144
13
2
0.45205
0.03435
160
20

Muestra por conglomerados


Manuel Hurtado Snchez

Pgina 113

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Zona 1
LOTE Ni
Zi
1
5
5
2
24
29
3
9
38
4
22
60
5
9
69
6
14
83
7
22 105
8
15 120
9
0 120
10
43 163
11
1 164
12
1 165
13
1 166
14
10 176
15
21 197 192
16
1 198
17
22 220
18
32 252
19
32 284
20
16 300
21
19 319
22
20 339
23
15 354
24
1 355
25
13 368
26
13 381
27
1 382
28
22 404
29
1 405
30
20 425
Total
425
Mz

m=
I=
r=

1
425
192

Zona 2
Mz
LOTE
1
49
2
32
3
37
4
39
5
37
6
24
7
42
8
41
9
33
10
1
11
8
12
44
13
55
14
24
15
24
16
38
17
15
18
19
19
41
20
40
21
7
22
0
23
1
24
3
25
11
26
17
27
28
28
17
29
16
30
18
31
13
32
10
33
16
34
30
35
17
36
36
37
1
38
11
39
33
40
55
41
59
42
48
43
57
44
49
45
43
46
2
47
56
48
21
49
30
50
49
51
42
52
43
Total 1482
m=
I=
r=
Zi

Manuel Hurtado Snchez

3
494
6
500
994

Ni
49
81
118
157
194
218
260
301
334
335
343
387
442
466
490
528
543
562
603
643
650
650
651
654
665
682
710
727
743
761
774
784
800
830
847
883
884
895
928
983
1042
1090
1147
1196
1239
1241
1297
1318
1348
1397
1439
1482

Zi
6

500

994

Zona 3
Mz
LOTE Ni
1
12
12
2
23
35
3
16
51
4
32
83
5
29
112
6
1
113
7
17
130
8
15
145
9
30
175
10
32
207
11
15
222
12
39
261
13
17
278
14
11
289
15
34
323
16
0
323
17
8
331
18
25
356
19
9
365
20
26
391
21
35
426 402
22
32
458
23
31
489
24
46
535
25
24
559
26
1
560
27
10
570
28
8
578
29
12
590
30 114
704
31
44
748
32
26
774
33
31
805
34
1
806
35
34
840 833
36
31
871
37
24
895
38
54
949
39
21
970
40
28
998
41
35 1033
42
1 1034
43
49 1083
44
7 1090
45
32 1122
46
0 1122
47
11 1133
48
22 1155
49
9 1164
50
17 1181
51
25 1206
52
15 1221
53
31 1252
54
18 1270 1263
55
22 1292
56
0 1292
Total 1292
m=
I=
r=
Zi =

3
431
402
833
1263

Pgina 114

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Zona 4
LOTE Ni
1
35
35
2
36
71
3
19
90
4
0
90
5
23 113
6
30 143
7
47 190
8
39 229
9
36 265
10
12 277
11
0 277
12
10 287
13
10 297
14
15 312
15
41 353
16
50 403
17
47 450
18
30 480
19
21 501
20
33 534
21
41 575
22
45 620
23
37 657
24
45 702
25
35 737
26
39 776
27
32 808
28
32 840
29
23 863
30
12 875
31
8 883
32
38 921
33
3 924
34
31 955
35
49 1004
36
18 1022
37
39 1061
38
43 1104
39
32 1136
40
32 1168
41
30 1198
42
32 1230
43
20 1250
44
32 1282
45
23 1305
46
27 1332
47
41 1373
48
1 1374
49
10 1384
50
16 1400
51
26 1426
52
35 1461
53
22 1483
54
15 1498
55
18 1516
56
17 1533
57
21 1554
58
9 1563
59
17 1580
60
24 1604
61
15 1619
62
2 1621
Total
1621

Zona 5

Mz

m=
I=
r=
Zi =

4
405.3
379
784.3
1190
1595

Manuel Hurtado Snchez

379

784

1190

1595

LOTE Ni
1
34
34
2
42
76
3
22
98
4
50 148
5
38 186
6
39 225
7
47 272
8
55 327
9
1 328
10
20 348
11
71 419
12
54 473
13
42 515
14
32 547
15
37 584
16
47 631
17
49 680
18
60 740
19
9 749
20
43 792
21
39 831
22
46 877
23
31 908
24
35 943
25
45 988
26
44 1032
27
12 1044
28
23 1067
29
24 1091
30
45 1136
31
36 1172
32
42 1214
33
42 1256
34
47 1303
35
84 1387
36
36 1423
37
41 1464
38
8 1472
39
28 1500
40
38 1538
41
43 1581
42
25 1606
43
1 1607
44
45 1652
45
58 1710
46
2 1712
47
35 1747
48
29 1776
49
7 1783
50
40 1823
51
9 1832
52
36 1868
53
37 1905
54
42 1947
55
43 1990
56
27 2017
57
4 2021
58
31 2052
59
25 2077
60
1 2078
61
24 2102
62
3 2105
Total
2105

Zona 6

Mz

m=
I=
r=
Zi =

5
421
99
520
941
1362
1783

Mz

99

520

941

1362

1783

LOTE Ni
1
34
34 18
2
42
76
3
32 108
4
29 137
5
6 143
6
22 165
7
42 207
8
34 241
9
42 283
10
50 333
11
38 371
12
50 421
13
35 456 447
14
40 496
15
13 509
16
11 520
17
26 546
18
25 571
19
18 589
20
19 608
21
37 645
22
18 663
23
1 664
24
7 671
25
11 682
26
34 716
27
36 752
28
40 792
29
17 809
30
14 823
31
7 830
32
30 860
33
25 885 875
34
30 915
35
0 915
36
42 957
37
48 1005
38
49 1054
39
28 1082
40
10 1092
41
3 1095
42
11 1106
43
17 1123
44
33 1156
45
13 1169
46
35 1204
47
34 1238
48
14 1252
49
33 1285
50
1 1286
Total
1286
m=
I=
r=
Zi

3
428.7
18
446.7
875.3

Zona 7
Mz LOTE Ni
1
30
2
30
3
21
4
17
5
1
6
10
7
9
8
41
9
8
10
49
11
26
12
38
13
18
14
4
15
26
16
21
17
13
18
1
19
26
20
0
21
17
22
14
23
19
24
20
25
18
26
22
27
8
28
19
29
19
30
1
31
18
32
24
33
11
34
17
35
8
36
11
37
12
38
12
39
12
40
12
41
0
42
0
43
16
44
12
45
17
46
26
47
33
48
1
49
1
50
26
51
23
52
28
53
34
54
37
55
19
56
24
57
1
58
24
59
20
60
22
61
28
62
22
63
28
64
31
65
9
66
22
Total
1187
m=
I=
r=
Zi =

30
60
81 76
98
99
109
118
159
167
216
242
280
298
302
328
349
362
363
389
389
406
420
439
459
477 472
499
507
526
545
546
564
588
599
616
624
635
647
659
671
683
683
683
699
711
728
754
787
788
789
815
838
866
900 867
937
956
980
981
1005
1025
1047
1075
1097
1125
1156
1165
1187

3
395.7
76
471.7
867.3 Pgina 115

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

c. Muestreos No Probabilsticos
Si consideramos que no precisamos cifras exactas sobre la
representatividad estadstica de nuestros resultados, podramos
plantearnos el usar una muestra no aleatoria (o "no probabilstica"), lo que
significa que elegiremos a voluntad nuestra. Podemos considerar que esto
puede ayudarnos a obtener los elementos que necesitamos estudiar
directamente y, adems, actuar sin los tediosos procesos de seleccin
aleatoria y verificacin estadstica.
Sin embargo, hay una desventaja: corremos un gran riesgo de obtener
demasiado sesgo en la muestra. No seremos capaces siquiera de advertir
la presencia, y menos an la cantidad, de sesgo si hacemos personalmente
la seleccin de la muestra. Y la presencia de sesgo puede hacer imposible
generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o
grupo la seleccin de los elementos.
Estas muestras son bastante tiles en aquellas situaciones en las cuales no
es posible utilizar un muestreo probabilstico, es decir cuando no es posible
disponer de un marco muestral para la seleccin de los elementos de la
muestra. Su utilizacin est reservada solo para aquellos investigadores
que conocen la estructura de la poblacin y tienen un criterio
suficientemente bueno para conseguir representatividad; incluso si se
dispone de un buen criterio para conseguir representatividad es posible
obtener mayor precisin a ms bajos costos que con un muestreo
probabilstico.
Entre los tipos comunes de muestras no aleatorias se incluyen,
Muestra de "casos tpicos" o los "mejores" casos es algo bastante
tradicional en la historia del arte: estudiar solamente los "grandes maestros".
La idea es que stos representan lo ms autntico de su poca. Tal
seleccin deliberada por parte del investigador tiene no obstante riesgos
serios, que se tratan en el punto De limitar el objeto de estudio.
Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una
reunin, podra ser designado como muestra. Este es un mtodo fcil y
barato, pero el sesgo suele ser imposible de estimar. El mtodo es popular
en las demostraciones de cursos sobre mtodos, pero raramente usado en
la investigacin profesional.
Muestra de voluntarios es creada cuando todos los miembros de la
poblacin tienen la oportunidad de participar en la muestra. Un ejemplo es
la respuesta voluntaria de los clientes que llega a una empresa; igualmente,
las respuestas que un investigador recibe a un anuncio en un peridico
pidiendo a la gente sus opiniones.

Manuel Hurtado Snchez

Pgina 116

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Una muestra de voluntarios suele ser una alternativa bastante sensata; no


obstante, el investigador debe considerar cuidadosamente los riesgos de
sesgo. Hay dos cuestiones que plantearse:
Es cierto que todos los miembros de la poblacin bajo muestreo tenan las
mismas oportunidades de ser incluidos en la muestra? Por definicin, los
voluntarios difieren de la media de la poblacin en su mayor actividad. La
cuestin crucial entonces se diferencian del resto de la poblacin tambin
en otros aspectos?.
Muestra bola de nieve. Cuando se entrevista a miembros de un grupo,
podemos pedir a las personas que nos indiquen otros individuos en ese
grupo que estn en la mejor posicin para dar informacin sobre ese tema;
podramos tambin pedirles que nos indicasen personas que compartan sus
puntos de vista y tambin otras que sean de opinin opuesta. Entonces
entrevistaremos a nuevos individuos y continuaremos del mismo modo
hasta que no obtengamos nuevos puntos de vista de nuevos entrevistados.
Este es un buen mtodo por ejemplo para recoger los distintos puntos de
vista existentes en un grupo, pero su inconveniente es que no obtenemos
una idea exacta de la distribucin de las opiniones.
En el momento de disear una muestra no aleatoria, debemos siempre
tener en mente la poblacin. Es representativa la muestra? Son vlidos
los resultados en la poblacin?
Recordemos tambin que no tenemos que incluir elementos que no sean
miembros de la poblacin en nuestra muestra.
Por ejemplo, podramos decidirnos (de forma bastante sensata) por
investigar las preferencias de los clientes de electrodomsticos
entrevistando a vendedores. O podramos estudiar las historias de vida de
arrendatarios mediante un cuestionario a administradores de casas o
caseros. La idea es factible, ya que esta gente habitualmente conoce mucho
sobre el tema. Sin embargo, los "especialistas" no pueden ser tomados
como muestra de "no especialistas". Son dos poblaciones diferentes. No
debemos generalizar los resultados de "especialistas" a ninguna otra
poblacin que no sea la de "especialistas", cualquiera que sea el campo del
que tratemos.
En los ejemplos de arriba, podramos tal vez continuar transformando los
resultados a partir de los especialistas en hiptesis que ms tarde
verificaramos con una muestra apropiada de la poblacin "real" o de no
especialistas, que seran en los ejemplos citados, respectivamente, los
consumidores y los arrendatarios. En otras palabras, podramos usar la
entrevista de los especialistas slo como un estudio preliminar.

Manuel Hurtado Snchez

Pgina 117

UNIVERSIDAD SAN PEDRO

VICERRECTORADO DE INVESTIGACIN
Direccin General de Investigacin

Tamao de Muestras no aleatorias


No hay frmula para determinar el tamao de una muestra no aleatoria. Con
frecuencia, especialmente en investigaciones cualitativas, podemos
simplemente ampliar gradualmente nuestra muestra y analizar los
resultados siempre que continen llegando nuevos casos con informacin
relevante o nueva; en cambio, cuando en los casos nuevos ya no se
presenta informacin nueva, podemos concluir que nuestra muestra est
saturada, y terminaremos el trabajo de muestreo. Este mtodo es, sin
embargo, muy vulnerable al muestreo sesgado, con lo que tenemos que ser
muy cuidadosos y asegurarnos que no omitimos a ningn grupo de nuestra
poblacin.
Antes de decidir el tamao de una muestra no aleatoria, tal vez debamos
leer cmo debe ser evaluada la representatividad de los resultados a partir
de una muestra no aleatoria. De otro modo podramos sufrir una sorpresa
bastante desagradable cuando estemos intentando, demasiado tarde,
definir la poblacin en que nuestros resultados puedan ser declarados
vlidos.
REFERENCIAS BIBLIOGRFICAS
1. Bautista, Nelly Patricia. (2011). Proceso de la Investigacin Cualitativa. Ed. El Manual Moderno.
Bogot.
2. Box, G., Hunter, W. G., y Hunter, J. S. (1989). Estadstica para investigadores. Barcelona: Revert.
3. Glass, G.V. y Stanley, J.C. (1980). Mtodos estadsticos aplicados a las ciencias sociales. Barcelona:
Editorial Prentice/Hall Internacional.
4. Gutierrez, Hugo A. (2009). Estrategias de Muestreo. Diseo de encuestas y estimacin de
parmetros. Ed. Universidad santo Toms. Bogot.
5. Hair, Anderson, Tatham y Black. (1999). Anlisis Multivariante. Ed. Pearson Prentice Hall.
Espaa.
6. Hurtado S. Manuel,(2011). Estadstica para Ingeniera y Ciencias. Edit. UNPRG Lambayeque, Per
7. Pea, D. (1987). Estadstica. Modelos y mtodos. 1. Fundamentos. Madrid: Alianza Editorial.
8. Prez, Csar (2000): Tcnicas de Muestreo Estadstico. Teora, prctica y aplicaciones informticas.
Ed. Alfaomega. Mxico.
9. Rodrguez Osuna, J. (1991). Mtodos de muestreo. Madrid: Centro de Investigaciones Sociolgicas.
10. Sharon L. Lohr. (2000). Muestreo: Diseo y Anlisis. Ed. Thomson. Mxico.
11. Tejedor, F. J. (1988). El soporte estadstico en la investigacin educativa. En Dendaluce,

Manuel Hurtado Snchez

Pgina 118