Sie sind auf Seite 1von 72

ESTADSTICA DESCRIPTIVA:

CONCEPTOS GENERALES

50 Votos

ESTADSTICA DESCRIPTIVA
CONCEPTOS GENERALES

Origen, Avance y Desarrollo


Histrico

Surgimiento de la Estadstica en
la Antigedad
La estadstica surgi en pocas muy remotas; como
todas las ciencias, no se cre de improviso, sino mediante
un proceso largo de desarrollo y evolucin, desde hechos
de simple recoleccin de datos hasta la diversidad y
rigurosa interpretacin de los datos que se dan hoy en
da.
Desde los comienzos de la civilizacin han existido
formas sencillas de estadstica, pues ya se utilizaban
representaciones grficas y otros smbolos en pieles,
rocas, palos de madera y paredes de cuevas para contar

el nmero de personas, animales o cosas. Es una ciencia


con tanta antigedad como la escritura, y es por s
misma auxiliar de todas las dems ciencias.

El nacimiento de la Estadstica se puede situar en el ao


3050 A.C., en el Antiguo Egipto.
Los mercados, la medicina, la ingeniera, los gobiernos,
etc. se nombran entre los ms destacados clientes de
esta ciencia.
Los comienzos de la estadstica pueden ser hallados en
el antiguo Egipto, cuyos faraones lograron recopilar,
hacia el ao 3050 a. C., prolijos datos relativos a la
poblacin y la riqueza del pas.
De acuerdo al historiador griego Herdoto, dicho registro
de riqueza y poblacin se hizo con el objetivo de preparar
la construccin de las pirmides. En el mismo
Egipto, Ramss IIhizo un censo de las tierras con el
objeto de verificar un nuevo reparto.
Hacia el ao 3000 a.C. los babilonios usaban pequeas
tablillas de arcilla para recopilar datos sobre la produccin
agrcola y sobre los gneros vendidos o cambiados

mediante trueque. En el antiguo Israel la Biblia da


referencia del uso estadstico, principalmente en los libros
de Nmeros y Crnicas que incluyen, en algunas partes,
trabajos de esta ndole. El primero contiene doscensos de
la poblacin de Israel y el segundo describe el bienestar
material de las diversas tribus judas.
En China se efectuaron censos de poblacin, pues varios
registros numricos con anterioridad al ao 2000
a.C. dan fe de ello. Los griegos efectuaron censos
peridicamente hacia 594 a. C., con fines tributarios,
sociales (divisin de tierras) y militares (clculo de
recursos y hombres disponibles). La investigacin
histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y
ponderar la potencia guerrera.

El Imperio Romano, fue el primer gobierno en emplear los


recursos estadsticos para calcular su poblacin, su
superficie territorial y renta de sus territorios.
El Imperio romano, maestro de la organizacin poltica,
fue elprimer gobierno que supo emplear los recursos

de la estadstica, mediante la recopilacin de una gran


cantidad de datos sobre la poblacin, superficie y renta de
todos los territorios bajo su control: cada cinco aos
realizaban un censo de la poblacin y sus funcionarios
pblicos tenan la obligacin de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos
peridicos del ganado y de las riquezas contenidas en las
tierras conquistadas. Para el nacimiento de Cristo suceda
uno de estos empadronamientos de la poblacin bajo la
autoridad del imperio.
Durante los mil aos siguientes a la cada del imperio
Romano realizaron operaciones sobre las relaciones de
tierras pertenecientes a la Iglesia; en la edad
media slo se realizaron algunos censos exhaustivos
en Europa. Los reyes caloringios Pipino el Breve y
Carlomagno ordenaron hacer estudios minuciosos de las
propiedades de la Iglesia en los aos 758 y
762respectivamente.

Desarrollo y avances en la
Estadstica

Durante el siglo IX se realizaron en Francia algunos


censos parciales de siervos. En Inglaterra, despus de la
conquista
normanda
en 1066,Guillermo
el
Conquistador encarg la realizacin de un censo. La
informacin obtenida fue recopilada en el Domesday Book
o libro del Gran Catastro para el ao 1086, un documento
de la propiedad, extensin y valor de las tierras de

Inglaterra. Esa obra fue el primer compendio estadstico


de Inglaterra.

Guillermo el Conquistador orden en 1066 un censo,


recopilado en el Libro del Gran Castro, considerado el
primer compendio estadstico de Inglaterra.
Aunque Carlomagno, en Francia; y Guillermo el
Conquistador, en Inglaterra, trataron de revivir la tcnica
romana, los mtodos estadsticos permanecieron casi
olvidados durante laEdad Media.
Durante los siglos XV, XVI, y XVII, hombres
como Leonardo de Vinci, Nicols Coprnico, Galileo,
Neper, William Harvey, Sir Francis Bacon y Ren
Descartes, hicieron grandes operaciones al mtodo
cientfico, de tal forma que cuando se crearon
los Estados Nacionales y surgi como fuerza el
comercio internacional exista ya un mtodo capaz de
aplicarse a los datos econmicos.

Por el ao 1540 el alemn Sebastin Muster realiz


una compilacin estadstica de los recursos nacionales,
comprensiva de datos sobre organizacin poltica,
instrucciones sociales, comercio y podero militar. Durante
el siglo XVII aport indicaciones ms concretas de
mtodos de observacin y anlisis cuantitativo y ampli
los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters
por la Estadstica Demogrfica como resultado de la
especulacin sobre si la poblacin aumentaba, decreca o
permaneca esttica. En los tiempos modernos tales
mtodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el
potencial humano de sus respectivos pases.
El primer empleo de los datos estadsticos para fines
ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo
de Gaspar Neumann, un profesor alemn que viva en
Breslau.
Este
investigador
se
propuso destruirla
antigua creencia popular de que en los aos terminados
en siete mora ms gente que en los restantes, y para
lograrlo hurg pacientemente en los archivos parroquiales
de la ciudad. Despus de revisar miles de partidas de
defuncin pudo demostrar que en tales aos no fallecan
ms personas que en los dems. Los procedimientos de
Neumann fueron conocidos por elastrnomo ingls
Halley, descubridor del cometa que lleva su nombre,
quien los aplic al estudio de la vida humana. Sus
clculos sirvieron de base para las tablas de

mortalidad que hoy utilizan todas las compaas de


seguros.
Durante
el siglo
XVII y
principios
del XVIII, matemticos comoBernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron
la teora
de probabilidades. No obstante durante cierto tiempo,
la teora de las probabilidades limit su aplicacin a
los juegos de azar y hasta el siglo XVIII no comenz a
aplicarse a los grandes problemas cientficos.

En 1760, Godofredo Achenwall, acu la palabra


Estadstica.
Godofredo Achenwall, profesor de la Universidad de
Gotinga, acu en 1760 la palabra estadstica, que
extrajo del trmino italiano statista (estadista). Crea, y
con sobrada razn, que los datos de la nueva ciencia
seran el aliado ms eficaz del gobernante consciente. La
raz remota de la palabra se halla, por otra parte, en el
trmino latino status, que significa estado o situacin;
Esta etimologa aumenta el valor intrnseco de la palabra,

por cuanto la estadstica revela el sentido cuantitativo de


las ms variadas situaciones.
Jacques Qutelect es quien aplica lasEstadsticas a
las ciencias sociales. Este interpret la teora de la
probabilidad para su uso en las ciencias sociales y
resolver la aplicacin del principio de promedios y de la
variabilidad a los fenmenos sociales. Qutelect fue el
primero en realizar la aplicacin prctica de todo el
mtodo Estadstico, entonces conocido, a las diversas
ramas de la ciencia.
Entretanto, en el perodo del 1800 al 1820 se
desarrollaron dos conceptos matemticos fundamentales
para la teora Estadstica; la teora de los errores de
observacin, aportada por Laplace y Gauss; y la
teora de los mnimos cuadrados desarrollada
por Laplace, Gauss y Legendre.
A finales del siglo XIX, Sir Francis Gaston ide el
mtodo conocido porCorrelacin, que tena por
objeto medir la influencia relativa de los factores sobre
las variables. De aqu parti el desarrollo del coeficiente
de correlacin creado por Karl Pearson y otros
cultivadores de la ciencia biomtrica como J. Pease
Norton, R. H. Hooker y G. Udny Yule, que efectuaron
amplios estudios sobre la medida de las relaciones.

Nacimiento de la Estadstica
Moderna

Ronald Arnold Fisher, figura ms influyente de la


Estadstica.
Una vez sentadas las bases de la teora de probabilidades,
podemos
situar
el nacimientode
la estadstica
moderna y su empleo en el anlisis de experimentos en
los trabajos deFrancis Galton y Kurt Pearson. Este
ltimo public en 1892 el libro The Grammar of
Science (La gramtica de la ciencia), un clsico en la
filosofa de la ciencia, y fue l quien ide el conocido test
de Chi -cuadrado. El hijo de Pearson, Egon, y el
matemtico nacido en Polonia Jerzy Neyman pueden
considerarse los fundadores de las pruebas modernas de
contraste de hiptesis.
Pero
es
sin
lugar
a
dudas Ronald
Arnold
Fisher la figura ms influyente de la estadstica,
pues la situ como una poderosa herramienta para
la planeacin
y
anlisis
de
experimentos.
Contemporneo de Pearson, desarroll el anlisis de

varianza y
fue
pionero
en
el
desarrollo
de
numerosas tcnicas de anlisis multivariante y en la
introduccin del mtodo de mxima verosimilitud para
la estimacin de parmetros. Su libro Statistical
Methods for Research Workers (Mtodos estadsticos para
los investigadores), publicado en 1925, ha sido
probablemente el libro de estadstica ms utilizado a lo
largo de muchos aos.
Mientras tanto, en Rusia, una activa y fructfera escuela
de matemticas y estadstica aport asimismo como no
poda ser de otro modo su considerable influencia.
Desde finales del siglo XVIII y comienzos del XIXcabe
destacar las figuras de Pafnuty Chebichev y Andrei
Harkov,
y
posteriormente
las
de Alexander
Khinchin y Andrey Kolmogorov.

Sucesos de inters en el
desarrollo de la estadstica

A continuacin
se presenta una relacin cronolgica de diferentes
sucesos que nos permiten tener una idea general de la
evolucin de la estadstica
En el siglo XIX, con la generalizacin del mtodo
cientfico para estudiar todos los fenmenos de las
ciencias naturales y sociales, los investigadores vieron la
necesidad de reducir la informacin a valores numricos
para evitar la ambigedad de las descripciones verbales.
Los progresos ms recientes en el campo de la Estadstica
se refieren al ulterior desarrollo delclculo de

probabilidades,
particularmente
en
la
rama
denominadaindeterminismo o relatividad, se ha
demostrado que el determinismo fue reconocido en la
Fsica como resultado de las investigaciones atmicas y
que este principio se juzga aplicable tanto a las ciencias
sociales como a las fsicas.[1], [2], [3], [4], [5], [6] y [7]

Influencia y Aplicaciones de la
Estadstica en la Sociedad Actual

En nuestros das, la estadstica se ha convertido en un


mtodo efectivo para describir con exactitud los valores
de datos
econmicos, polticos,sociales, psicolgicos, biolgic
os o fsicos, y sirve como herramienta para relacionar y
analizar dichos datos. El trabajo del experto estadstico no
consiste ya slo en reunir y tabular los datos, sino sobre
todo en el proceso de interpretacin de esa informacin.

La Estadstica es ampliamente utilizada para la exactitud


de datos econmicos, polticos...
La estadstica que conocemos hoy da debe gran parte de
sus logros a los trabajos matemticos de aquellos

hombres que desarrollaron la teora de las probabilidades,


con la cual se adhiri la estadstica a las ciencias
formales.
El desarrollo
de
la
teora
de
la
probabilidad ha
aumentado
el
alcance
de
lasaplicaciones de la estadstica.
De esta manera, la estadstica ocupa un lugar de gran
importancia en la investigacin y en la prctica
mdica. En los estudios de medicina de cualquier pas se
incluyen varias asignaturas dedicadas a la estadstica; es
difcil, por no decir imposible, que un trabajo de
investigacin sea aceptado por una revista mdica sin
que sus autores hayan utilizado tcnicas y conceptos
estadsticos en su planteamiento y en el anlisis de los
datos.
Muchos conjuntos de datos se pueden aproximar, con
gran exactitud, utilizando determinadas distribuciones
probabilsticas; los resultados de stas se pueden
utilizar para analizar datos estadsticos.

La Estadstica es de suma importancia en la Investigacin


y la prctica mdica.
Es una herramienta indispensable para la toma de
decisiones; se ha convertido en un mtodo efectivo

para describir conexactitud los valores de los datos


econmicos, polticos, sociales,psicolgicos, biolgi
cos y fsicos, y sirve como herramienta pararelacionar
y analizar dichosdatos. El trabajo del experto
estadstico no consiste ya slo en reunir y tabular los
datos, sino sobre todo en interpretar esa informacin.
Tambin
es
ampliamente
empleada
para mostrar los aspectos
cuantitativos de
una
situacin. La estadstica est relacionada con elestudio
de
proceso cuyo resultado es ms o menos
imprescindible y con la finalidad de obtener conclusiones
para tomar decisiones razonables de acuerdo con
tales observaciones.
El resultado de estudio de dichos procesos,
denominados procesos
aleatorios,
puede
ser
de naturaleza cualitativa o cuantitativa y, en este
ltimo
caso, discreto
o
contina.
Son
muchas
las predicciones de
tipo socilogo,
o econmico, que pueden hacerse a partir de la
aplicacin exclusiva de razonamientos probabilsticos a
conjuntos de datos objetivos como son, por ejemplo, los
de naturaleza demogrfica.
La
estadstica
es
un potente
auxiliar de
muchas ciencias
y
actividades
humanas: sociologa,psicologa, geografa humana,
economa,
etc.
Las predicciones
estadsticas,
difcilmente hacen referencia a sucesos concretos,
perodescriben con
considerable precisin en

el comportamiento global de grandes conjuntos de


sucesos particulares.
De manera ms especfica, sirve para saber quien, de
entre los miembros de una poblacin importante, va a
encontrar trabajo o a quedarse sin l; o en cuales
miembros va a verse aumentada o disminuida
una familia concreta en
los
prximos
meses.
Sin
embargo, puede proporcionar estimaciones fiables del
prximo
aumento
o
disminucin
de
la
tasa
de desempleo referido al conjunto de la poblacin; o de la
posible variacin de os ndices de natalidad o mortalidad.

La aplicacin de la Estadstica en
la Contabilidad
En el caso especfico de la contabilidad, la estadstica es
muy importante, pues se aplica para seleccionar
muestras, cuando se pretende hacer una auditoria;
tambin funciona para medir la variacin de costos de
produccin.

En la Contabilidad, es una herramienta rpida y eficiente


para la solucin de problemas de costos y auditoras
La estadstica matemtica y
en
particular
los mtodos de muestreo, juegan un papel de gran
importancia y utilidad en el desarrollo de una auditora,
esto gracias a su carcter derapidez y economa.
Cmo seleccionar
la
muestra,
cmo realizar
la
inferencia(extrapolacin de las conclusiones obtenidas
sobre la muestra, al resto de la poblacin), y qu grado
de
confianza se
tiene
en
ello,
son
los
principales problemas a los cules de unasolucin
efectiva.
El muestreo, es un procedimiento por el que se
infieren los valores verdaderos de una poblacin, a travs
de la experiencia obtenida con una muestra de esta.
El uso de muestraspara estimar valores de una
poblacinofrece
diversas
ventajas.
En
trminos
generales
se
puede
afirmar
que
el
muestreo permite una reduccin considerable
de

los costos materiales del


estudio,
una mayor
rapidez en la obtencin de la informacin y el logro de
resultados con mxima calidad.
Hoy
las tcnicas
de
muestreo asistidas por computadoras,
son herramientas bsicas, pues la rpida toma de
decisiones que hay que ejecutar en la dinmica de
los procesos econmicos, demanda el uso de nuevas
tecnologas
que
le
impriman
una rapidez,
confiabilidad, disponibilidad y capacidad, entre otras
facilidades, que se han ido buscando a travs de
los recursos informticos.
Con el avance de la Informtica y la vinculacin de esta a
la Estadstica, se maneja de manera rpida, fiable y
relativamente sencilla grandes volmenes de informacin,
y obtener conclusiones que despus el profesional
interpreta, mediante el uso de paquetes de programas,
tales como el estatistics, el SPSS, el statgraphics, que
facilitan el empleo de procedimientos estadsticos usados
por algunos auditores, contadores e investigadores en
general. [6], [7], [8], [9], [10] y [11]

Definiciones de la Estadstica
Qu es la Estadstica?

Sir John Sinclair, introdujo la recoleccin y clasificacin de


datos a la Estadstica.
Despus de haber conocido el origen y desarrollo de la
Estadstica como ciencia as como su influencia y
aplicaciones en la sociedad actual, toca turno de definir y
comprender qu es la Estadstica.
Si bien, existen diversas definiciones acerca de esta
ciencia, considero preciso el comenzar por aclarar
el origen etimolgico, a pesar de que como ya vimos,
fue Godofredo Achenwall quien en 1760, acu la
palabra Estadstica.
As
pues, Estadstica proviene
del
trmino
alemn Statistik que se traduce como La ciencia del
Estado, por lo que designaba originalmente el anlisis
de datos del Estado. En el siglo XIX cuando el militar
britnico Sir John Sinclair (1754-1835) introdujo al
trmino estadstica el significado de recolectar y

clasificar datos. Tambin se sabe proviene del


latn statisticum collegium (consejo de Estado) y
su derivado italiano statista (hombre de Estado o
poltico).
Ahora bien, despus de haber dado a conocer el
significado etimolgico, es preciso el saber cul es la
definicin conceptual del trmino en cuestin. Para ello,
he decidido tomar la definicin que el autor Ignacio M.
Lizrraga Gaudry hace respecto a esta ciencia, pues la
considero una respuesta completa y concreta para
definirla de manera generalizada. Entonces, el seor
Lizrraga considera la Estadstica como:
La rama de
las matemticas que recopila, organiza, analiza eint
erpreta los datos obtenidos
de
un problema
estadstico, para obtener conocimiento de los hechos
pasados,
para prever situaciones
futuras y tomar
decisiones en base a las experiencias.
Ahora, a pesar de ser la anterior una respuesta entendible
y completa, es necesario el exponer otras interesantes
definiciones acerca del tema, tales como las siguientes:
1. Es una rama de las matemticas que se ocupa de
reunir, organizar y analizar datos numricos y que
ayuda a resolver problemas como el diseo de
experimentos y la toma de decisiones. [6]

2. Es el recuento, ordenacin y clasificacin de los


datos obtenidos por las observaciones, para poder
hacer comparaciones y sacar conclusiones. [12]
3. Es un conjunto de mtodos cientficos ligados a la
toma, organizacin, recopilacin, presentacin y
anlisis de datos, tanto para la deduccin de
conclusiones como para tomar decisiones razonables
de acuerdo con tales anlisis. [13]
4. Es la ciencia cuyo objetivo es reunir una informacin
cuantitativa concerniente a individuos, grupos, series
de hechos, etc. y deducir de ello gracias al anlisis
de estos datos unos significados precisos o unas
previsiones para el futuro. [14]
5. En general, es la ciencia que trata de la recopilacin,
organizacin presentacin, anlisis e interpretacin
de datos numricos con el fin de realizar una toma
de decisin ms efectiva. [14]
6. Es la ciencia que tiene por objeto el estudio
cuantitativo de los colectivos. Enrique Chacn [14]
7. La ciencia que tiene por objeto aplicar las leyes de la
cantidad a los hechos sociales para medir su
intensidad, deducir las leyes que los rigen y hacer su
prediccin prxima.
scar Vzquez Mnguez [14]
Ahora bien, en cuanto a la Estadstica Descriptiva,
especficamente hablando, podemos definirla como la
ciencia
que analiza, estudia ydescribe a
la totalidad de
individuos
de
una poblacin.

Su finalidad esobtener
informacin, analizarla, elaborarla y simplificarla lo
necesario para que pueda ser interpretada cmoda y
rpidamente
y,
por
tanto,
pueda utilizarse
eficazmente para el fin que se desee. [6]

Divisin de la Estadstica y su
Objeto de Estudio

La Estadstica se puede clasificar en funcin de su etapa o


funcin, del tiempo considerado o del nmero de
variables estudiadas.
La Estadstica es
una disciplina que
utiliza recursos matemticos para organizar y resumir una
gran cantidad de datos obtenidos de la realidad, e inferir
conclusiones
respecto
de
ellos.
Tiene
comopropsito la descripcin del conjunto de datos
colectados, as como lageneralizacin y/o toma de
decisionesacerca de las caractersticas de todas las
observaciones potenciales bajo
consideracin.
En

consecuencia nos permite organizar y resumir datos


para poder realizar inferencias (conclusiones) relativas a
los mismos. Para su mejor estudio se han creado varias
formas de clasificar los estudios estadsticos. Algunas
de las ms comunes son las siguientes:

Clasificacin de la Estadstica
segn la etapa o funcin

Generalmente se considera que la estadstica tiene dos


funciones
(divisiones).
Hay
una estadstica
descriptiva y una estadstica inferencial. Laprimera
etapa se ocupa de describir la muestra, y la segunda
etapainfiere conclusiones a partir de los datos que
describen la muestra (por ejemplo con respecto a la
poblacin). A continuacin, se dar paso a describir
brevemente, cada etapa.

Estadstica Descriptiva o Deductiva

Se
refiere
a
la recoleccin, presentacin, descripcin, anlisis ei
nterpretacin de
una
coleccin
de datos,
esencialmente consiste enresumir stos con uno o dos
elementos de informacin (medidas descriptivas) que
caracterizan la totalidad de los mismos.

La Estadstica Descriptiva recolecta, describe, analiza,


interpreta y presenta los datos de una poblacin en forma
de tablas y grficas
Consiste sobre todo en lapresentacin de datos en
forma detablas y grficas; as que se emplea
simplemente para resumir de forma numrica o grfica un
conjunto de datos. Esta comprende cualquier actividad
relacionada con los datos y est diseada para resumir o
describir los mismos sin factores pertinentes adicionales;
esto es, sin intentar inferir nada que vaya ms all de los
datos, como tales.
La estadstica Descriptiva es el mtodo de obtener de
un conjunto de datosconclusiones sobre s mismos y no
sobrepasan el conocimiento proporcionado por
stos. Puede utilizarse para resumir o describir
cualquier
conjunto ya
sea
que
se
trate
de
una poblacin o de una muestra, cuando en la etapa
preliminar de la Inferencia Estadstica se conocen los
elementos de una muestra.

As pues, si aplicamos las herramientas ofrecidas por


la estadstica descriptiva a una muestra, solo nos
limitaremos a describir los datos encontrados en dicha
muestra, por lo que no se podr generalizar
la informacin hacia la poblacin.

Estadstica Inferencial o Inductiva

La Estadstica Inferencial trabaja a base de muestras para


inferir aspectos de la poblacin.
La estadstica descriptiva trabaja con todos los individuos
de la poblacin. La estadstica inferencial, sin
embargo,trabaja con muestras, subconjuntos formados
por algunos individuos de la poblacin. A partir del
estudio de la muestra se pretende inferir aspectos
relevantes de toda la poblacin. Cmo se selecciona la
muestra, cmo se realiza la inferencia, y qu grado de
confianza se puede tener en ella son aspectos
fundamentales de la estadstica inferencial, para cuyo
estudio se requiere un alto nivel de conocimientos de
estadstica, probabilidad y matemticas.

Para
que
stas
generalizaciones
sean
vlidas
la muestra deben serrepresentativa de la poblacin y
la calidad de
la informacin debe
ser
controlada,
adems puesto que las conclusiones as extradas estn
sujetas a errores, se tendr que especificar el riesgo o
probabilidad que con que se pueden cometer
esos errores.
La
Estadstica
Inferencial investiga
o
analiza una poblacin partiendode
una muestra tomada.
Es
as
que
permite
realizar conclusiones o inferencias, basndose en
los datos
simplificados y analizados de
unamuestra hacia la poblacin o universo.
Por ejemplo, a partir de una muestra representativa
tomada a los habitantes de una ciudad, se podr inferir la
votacin de todos los ciudadanos que cumplan los
requisitos con un error de aproximacin.
En sus particularidades la Inferencia distingue
la Estimacin (cuando se usan las caractersticas de la
muestra para hacer inferencias sobre las caractersticas
de
la
poblacin)
y
la Contrastacin
de
Hiptesis (cuando se usa la informacin de la muestra
para responder a interrogantes sobre la poblacin).

Clasificacin de la Estadstica
segn el tiempo considerado

Si se clasifica la Estadstica en base al tiempo


considerado, tenemos la Estadstica Esttica (datos de la
actualidad) y la Estadstica Evolutiva (datos del pasado).
Dentro de la estadstica descriptiva se distinguen los
datos en funcin al tiempo en que se encuentra analizada
la poblacin; de esta manera, tenemos 2 clasificaciones:

Estadstica Esttica o Estructural

La estadstica esttica o estructural, que describe


la poblacin en un momento dado empleando datos
de la actualidad (por ejemplo la tasa de nacimientos en
determinado censo)

Estadstica Dinmica o Evolutiva


La estadstica dinmica o
evolutiva,
que
describe como va cambiando la poblacin en el
tiempo empleando datos del pasado (por ejemplo el
aumento anual en la tasa de nacimientos).

Clasificacin de la Estadstica
segn la cantidad de variables
estudiada
Tambin, se puede clasificar a la Estadstica en funcin de
la cantidad de variables que estn siendo estudiadas en
determinado problema estadstico. Desde este punto de
vista hay una estadstica univariada (estudia una sola
variable, como por ejemplo la inteligencia, en una
muestra), una estadstica bivariada (estudia cmo
estn relacionadas dos variables, como por
ejemplo inteligencia y alimentacin), y una estadstica
multivariada (que estudia tres o ms variables, como
por ejemplo como estn relacionados elsexo, la edad y
la alimentacin con la inteligencia).

Estadstica Univariada

Un ejemplo perfecto del anlisis estadstico univariado, es


la utilizacin del promedio o media aritmtica, pues slo
se mide una variable.

Cuando
el
anlisis
presentacaracterstica
por
caracterstica,aisladamente, estaremos en presencia
de un anlisis estadstico univariado. Esto quiere
decir, que se est estudiando una sola variable.
El anlisis univariado es el anlisis bsico, primario. Las
caractersticas o propiedades de las personas o cosas han
de medirse una a una, de modo univariado y si se
presentan de esa manera decimos que es anlisis
univariado.
Los estadsticos bsicos que conocemos, como la media,
lamediana, la moda, la varianza, los porcentajes,
entre otros, miden una variable. Es decir, fueron hechos
univariados.
Ahora bien este tipo de anlisis ha sido muy criticado ya
que la realidad se presenta interconectada, relacionada.
Por ejemplo existe una relacin entre el peso y la talla de
las personas o entre la el inters y el rendimiento escolar,
etc.
Como la realidad se presenta relacionada necesitamos
mtodos ms rigurosos para evaluarla. Esto lo podemos
hacer de dos modos; El primero es medir las variables de
modo univariado (analizarlas) y relacionarlas luego en la
interpretacin.

Estadstica Bivariada

La Estadstica bivariada, busca la relacin entre 2


variables, mediante la elaboracin de ndices y resultados
estadsticos
La estadstica univariada se aplica, por lo general, en
explotaciones estadsticas bsicas de la fuente de datos
(frecuencias,
porcentajes,
promedios,
tasas).
La estadstica bivariada trata de ir ms all elaborando
ndices y resultados estadsticos en trminos de
relaciones entre dos variables de inters, as como de
establecer inferencias sobre una poblacin a partir de
datos que provienen de una muestra (como, por ejemplo,
en los estudios mediante encuesta).
El conjunto de tcnicas estadsticas bivariadas difiere
en funcin del tipo de datos de los que se dispone
(niveles de medida: nominal, ordinal, intervalo, razn),
adaptndose en todo momento al contexto de anlisis
aplicado en el que nos encontremos.

Estadstica Multivariada

La Estadstica multivariada tiene diversas aplicaciones en


una enorme cantidad de reas, como los son: la
agricultura, el deporte, la psicologa, la economa, etc.
Los mtodos estadsticos multivariantes y el anlisis
multivariante son herramientas estadsticas que estudian
el comportamiento de tres o ms variables al
mismo
tiempo.
Se
usan
principalmente
parabuscar las variables menos representativas para
podereliminarlas, simplificando as
modelos
estadsticos en los que el nmero de variables sea un
problema
y
para comprender la relacinentre
varios grupos de variables. Algunos de los mtodos
ms conocidos y utilizados son la Regresin lineal y el
Anlisis discriminante.
Se pueden sintetizar dos objetivos claros:
1. Proporcionar mtodos cuya finalidad es el estudio
conjunto de datos multivariantes que el anlisis
estadstico uni y bidimensional es incapaz de
conseguir.

2. Ayudar al analista o investigador a tomar decisiones


ptimas en el contexto en el que se encuentre
teniendo en cuenta la informacin disponible por el
conjunto de datos analizado.
Los datos multivariados surgen cuando a un mismo
individuo se le midems de una caracterstica de
inters. Un individuo puede ser un objeto o concepto que
se puede medir. Ms generalmente, los individuos son
llamados unidades experimentales. Ejemplos de objetos:
personas, animales, terrenos, compaas, pases, etc.
Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una
variable es una caracterstica o atributo que se le mide a
un individuo.
Las aplicaciones
de
la
estadstica
multivariada estn presentes en distintas reas o
ramas
de
la
ciencias,
como
por
ejemplo
en: Investigacin
de
mercados (para
identificar
caractersticas de los individuos con el propsito de
determinar qu tipo de personas compran determinado
producto); en el sistema de educacin de cualquier tipo
de especialidad (para conocer los estudiantes que
tendrn xito y concluirn satisfactoriamente sus
estudios); en la agricultura (al estudiar la resistencia de
determinado tipo de cosechas a daos por plagas y
sequas); en el deporte(para conocer a partir de medidas
antropomtricas las posibilidades de obtener buenos
resultados en un deporte especfico); en la psicologa (al
estudiar la relacin entre el comportamiento de

adolescentes
y
actitudes
de
los
padres);
en
la economa (para conocer el nivel de desarrollo de un
territorio en relacin con otros y realizar inferencias a
partir de variables econmicas fundamentales, entre
otros).
[6], [15], [16], [17], [18], [19], [20] y [21]

Elementos bsicos de la
Estadstica
Concepto de Poblacin

En estadstica, poblacin es el conjunto de datos de un


problema estadstico determinado.
Poblacin
estadstica,
tambin
llamada universo o colectivo,
es
el conjunto
de
elementos de referencia sobre el que se realizan las
observaciones.
El concepto de poblacin en estadstica va ms all de lo
que comnmente se conoce como tal. Una poblacin se
precisa como unconjunto finito o infinito de personas
u objetos que presentan caractersticas comunes.
Algunas de las definiciones ms aceptadas son:

Una poblacin es un conjunto de todos los elementos


que estamos estudiando, acerca de los cuales intentamos
sacar conclusiones.
Levin & Rubin (1996).
Una poblacin es un conjunto de elementos que
presentan una caracterstica comn.
Cadenas (1974).
Es entonces que cuando tenemos un conjunto muy
grande de datos numricos para analizar decimos que
tenemos
un Universo
o
Poblacin
de
observaciones; tiene
como
objetivo final descubrir lascaractersticas y propieda
des de aquello que gener los datos. En estadstica
es representado con N.
Existen distintos tipos de poblaciones que son:
Poblacin

base: es

el

grupo

de

personas

designadas por las siguientes caractersticas:


personales, geogrficas o
temporales,
que
son
elegibles para participar en el estudio.
Poblacin muestreada: es la poblacin base con
criterios de viabilidad o posibilidad de realizarse
el muestreo.
Muestra estudiada: es el grupo de sujetos en el
que
se
recogen
los datos
y
se
realizan
las observaciones, siendo realmente un subgrupo de

la poblacin muestreada y accesible. El nmero de


muestras que se puede obtener de una poblacin es
una o mayor de una.
Poblacin diana: es el grupo de personas a la que
va proyectado dicho estudio, la clasificacin
caracterstica de los mismos, lo cual lo hace modelo
de estudio para el proyecto establecido.

Concepto de Muestra

Una muestra de poblacin, en estadstica, es un conjunto


de datos representativos del total de una poblacin o
universo.
Muestra de poblacin, seleccin de unconjunto de
individuos
representativos de
la totalidad
del
universo objeto de estudio, reunidos como una
representacin vlida y de inters para la investigacin de
su comportamiento.
Los criterios que se utilizan para la seleccin de muestras
pretendengarantizar que
el
conjunto
seleccionado

represente con la mxima fidelidad a latotalidad de la


que se ha extrado, as como hacer posible la medicin
de su grado de probabilidad.
Otras definiciones altamente aceptadas, son:
Se llama muestra a una parte de la poblacin a
estudiar qu sirve para representarla.
Murria R. Spiegel (1991).
Una muestra es una coleccin de algunos elementos
de la poblacin, pero no de todos.
Levin & Rubin (1996).
Una muestra debe ser definida en base de la
poblacin determinada, y las conclusiones que se
obtengan de dicha muestra solo podrn referirse a la
poblacin en referencia
Cadenas (1974).
La muestra tiene que estar protegida contra el riesgo de
resultar sesgada, manipulada u orientada durante el
proceso de seleccin, con la finalidad de proporcionar una
base vlida a la que se pueda aplicar la teora de la
distribucin estadstica. A la muestra de una poblacin
se le representa en estadstica con la letra n.
Es as muestreo probabilstico, consiste en elegir una
muestra de una poblacin al azar. Podemos distinguir
varios tipos de muestreo.

Muestreo aleatorio simple:


El procedimiento empleado es el siguiente: 1) se asigna
un nmero a cada individuo de la poblacin y 2) a travs
de algn medio mecnico (bolas dentro de una bolsa,
tablas de nmeros aleatorios, nmeros aleatorios
generados con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar
el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca
o nula utilidad prctica cuando la poblacin que estamos
manejando es muy grande.

Muestreo aleatorio sistemtico:


Este procedimiento exige, como el anterior, numerar
todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se parte
de ese nmero aleatorio i, que es un nmero elegido al
azar, y los elementos que integran la muestra son los que
ocupa los lugares i, i+k, i+2k, i+3k,, i+(n-1) k, es decir
se toman los individuos de k en k, siendo k el resultado de
dividir el tamao de la poblacin entre el tamao de la
muestra: k= N/n. El nmero i que empleamos como punto
de partida ser un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en
que se dan periodicidades en la poblacin ya que al elegir
a los miembros de la muestra con una periodicidad

constante (k) podemos introducir una homogeneidad que


no se da en la poblacin.

Muestreo aleatorio estratificado:


Consiste en considerar categoras tpicas diferentes entre
s (estratos) que poseen gran homogeneidad respecto a
alguna caracterstica. Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de
inters estarn representados adecuadamente en la
muestra.
Cada estrato funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que
formarn parte de la muestra. La distribucin de la
muestra en funcin de los diferentes estratos se
denomina afijacin, y puede ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde
igual nmero de elementos mustrales.
Afijacin Proporcional: La distribucin se hace de
acuerdo con el peso (tamao) de la poblacin en
cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible
dispersin de los resultados, de modo que se
considera la proporcin y la desviacin tpica.

Muestreo aleatorio por conglomerados:

El muestreo por conglomerados consiste en seleccionar


aleatoriamente un cierto nmero de conglomerados (el
necesario para alcanzar el tamao muestral establecido)
y
en
investigar
despus
todos
los
elementos
pertenecientes a los conglomerados elegidos.
En el muestreo por conglomerados la unidad muestral es
un grupo de elementos de la poblacin que forman una
unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja
de determinado producto, etc., son conglomerados
naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas
electorales. Cuando los conglomerados son reas
geogrficas suele hablarse de muestreo por reas.
Las razones para estudiar muestras en lugar de
poblaciones son diversas y entre ellas podemos sealar:
1. Ahorrar tiempo. Estudiar a menos individuos es
evidente que lleva menos tiempo.
2. Como consecuencia del punto anterior ahorraremos
costes.
3. Estudiar la totalidad de los pacientes o personas con
una caracterstica determinada en muchas ocasiones
puede ser una tarea inaccesible o imposible de
realizar.
4. Aumentar la calidad del estudio. Al disponer de ms
tiempo y recursos, las observaciones y mediciones

realizadas a un reducido nmero de individuos


pueden ser ms exactas y plurales que si las
tuvisemos que realizar a una poblacin.
5. La seleccin de muestras especficas nos permitir
reducir la heterogeneidad de una poblacin al indicar
los criterios de inclusin y/o exclusin.

Tipos y clasificacin de Datos


Estadsticos

Los Datos Estadsticos, son aquellos que se estudian en


cada elemento de la muestra y son variables que tomaran
valores dependiendo del problema.
Los datos estadsticos son lo que estudiamos en cada
individuo de la muestra son las variables (edad, sexo,
peso, talla, tensin arterial sistlica, etctera). Los
datos son losvalores que toma la variable en cada
caso. Lo que vamos a realizar esmedir, es decir, asignar
valores a las variables incluidas en el estudio.

Deberemos adems concretar la escala de medida que


aplicaremos a cada variable.
La naturaleza de las observaciones ser de gran
importancia a la hora de elegir el mtodo estadstico ms
apropiado para abordar su anlisis. Con este fin,
clasificaremos a estosdatos estadsticos, a grandes
rasgos, en dos tipos: datos cuantitativos o datos
cualitativos.

Datos cuantitativos

Las Datos Cuantitativos son aquellos que se pueden


expresar mediante valores numricos, y se dividen en
continuos (enteros y decimales) y discretos (slo enteros):
Son
las
variables
que
pueden medirse,cuantificarse o expresarse
numricamente y
pueden
sermanipulados
estadsticamente.
Incluyentabulaciones
de
frecuencia, porcentajes,medias y promedios. Si entre cada
dos datos puede haber una infinidad de ellos, se
llamancontinuos, y si entre un dato y otro siempre hay
un hueco o salto, se llaman discretos.
Datos cuantitativos continuos: si admiten tomar
cualquier valor dentro de un rango numrico

determinado,
es
decir,
que
pueden
expresarse
con nmeros decimales o fraccionarios. (Densidad de
un lquido, la fuerza de un muelle, edad, peso, talla).
Datos cuantitativos discretos: si no admiten todos
los valores intermedios en un rango. Suelen tomar
solamente valores enteros (Nota de un examen, nmero
de hijos, nmero de partos, nmero de hermanos, etc.).

Datos cualitativos.

Son datos que no se pueden expresar numricamente,


debido a que suponen cualidades, opiniones, sentimientos
entre otros, y se dividen en nominales (categoras que no
mantiene relacin de orden) y los jerarquizados (escalas
utilizadas bajo un orden).
Datos
que
expresan cualidades,
como opiniones, sentimientos,observaciones y camb
ios en elcomportamiento que clasifica a cada caso en
una de varias categoras (Domroese & Sterling 1999). La
situacin ms sencilla es aquella en la que se clasifica
cada caso en uno de dos grupos (hombre/mujer,
enfermo/sano, fumador/no fumador).

Son datos dicotmicos o binarios. Como resulta obvio,


en muchas ocasiones este tipo de clasificacin no es
suficiente y se requiere de un mayor nmero de
categoras (color de los ojos, grupo sanguneo, profesin,
etctera).
En el proceso de medicin de estas variables, se pueden
utilizar dos escalas:
Escalas nominales: sta es una forma de observar
o medir en la que los datos se ajustan por categoras
que no mantienen una relacin de orden entre s
(color de los ojos, sexo, profesin, presencia o
ausencia de un factor de riesgo o enfermedad,
etctera).
Escalas ordinales o jerarquizados: en las escalas
utilizadas, existe un cierto orden o jerarqua entre las
categoras (grados de disnea, estadiaje de un tumor,
etctera).

Tipos y clasificacin de Variables


Estadsticas

Una variable
estadstica es
cada
una
de
las caractersticas o cualidades que poseen los
individuos de la poblacin que estamos interesados en
estudiar. Se pueden clasificar en funcin a la Medicin o a
la influencia.

VARIABLES EN FUNCIN DE SU
MEDICIN

Existen
dos
tipos:
las variables
cualitativas y
las variables cuantitativas.
Variable cualitativa
Las variables cualitativas se refieren a caractersticas
o
cualidades que no pueden
ser medidas con nmeros. Podemos distinguir dos tipos:
Variable
cualitativa
nominal: presenta modalidades
no
numricas que no admiten un criterio de orden.
Por ejemplo: El estado civil, con las siguientes
modalidades: soltero, casado, separado, divorciado y
viudo.
Variable
cualitativa
ordinal
o
variable
cuasicuantitativa:presenta modalidades
no
numricas, en las que existe un orden.
Por ejemplo: La nota en un examen: suspenso, aprobado,
notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1, 2, 3,
Medallas de una prueba deportiva: oro, plata, bronce.
La variable que tiene resultados o valores que
tienden a variar de observacin en observacin debido a
los factores relacionados con el azarrecibe el nombre
de variable aleatoria. Las variables aleatorias pueden
serdiscretas y continuas.
Variable cuantitativa
Una variable
cuantitativa es
la
que
se expresa mediante un nmero, por tanto se pueden

realizar operaciones aritmticas con ella. Podemos


distinguir dos tipos:
Variable discreta: Una variable discreta es aquella
que toma valores aislados, es decir no admite valores
intermedios entre dos valores especficos. Es decir, slo
puede ser expresado con nmeros enteros.
Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0,
1, 3.
Variable
continua: Una variable
continua es
aquella que puede tomar valores comprendidos entre
dos nmeros por lo cual tiene un nmero infinito de
valores posibles. Es decir, puede ser expresada
connmeros decimales o fraccionarios.
Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77,
1.69, 1.75.
En la prctica medimos la altura con dos decimales, pero
tambin se podra dar con tres decimales.

VARIABLES EN FUNCIN DE SU
INFLUENCIA

Variables independientes
Son las que el investigador escoge para establecer
agrupaciones
en
el
estudio,
clasificando
intrnsecamente a los casos del mismo. Un tipo especial
son las variables de control, que modifican al resto de
las variables independientes y que de no tenerse en
cuenta adecuadamente pueden alterar los resultados por
medio de un sesgo.

Es aquella caracterstica o propiedad que se supone


ser la causa del fenmeno estudiado. En investigacin
experimental se llama as a la variable que el investigador
manipula.
Variables dependientes
Son las variables de respuesta que se observan en el
estudio y que podran estar influenciadas por los valores
de las variables independientes. Hayman la define
como propiedad o caracterstica que se trata de
cambiar mediante
la manipulacin de
la
variable
independiente. La variable dependiente es el factor que
es observado y medido para determinar el efecto de la
variable independiente.
Fuentes del subtema 1.5 [22], [23], [24], [25], [25], [27], [28], [29] y [30],

Cuadros Estadsticos
Qu es un cuadro o tabla
estadstica?
Un cuadro estadstico es una representacin grafica de
las diversas situaciones que se nos presentan
diariamente;
sirve
para
presentar
de forma
ordenada las distribuciones de frecuencias. Es la
forma esquemtica de comprender las tendencias de
nuestra forma de ser y de vivir. En un cuadro estadstico
puedes identificar tantas variables como quieras; se
realiza como un resumen del conjunto de datos que se
poseen, distribuidos segn las variables que se estudian.
Su forma general es la siguiente:

Modalida Frec.
d
Abs.
C
ni
c1
n1

cj
nj

ck
nk

Frec.
Rel.
fi

Frec. Abs.
Acumu.
Ni
N1 = n1

Frec. Rel.
Acumu.
Fi

Nk = n

Fk = 1

n
Es un instrumento que permite sintetizar y/o presentar la
informacin de un hecho investigado, y consta de cinco
elementos principales:
Cabeza: parte inicial donde se registra el ttulo.
Columna principal: Aqu anotamos las categoras
ordenadas obtenidas.
Encabezado de columnas: Smbolos que explican el
objeto en estudio, o las caractersticas fundamentales que
dan lugar al ingreso de la informacin (vaciado de datos).
Cuerpo: Conjunto de datos estadsticos realmente
observados y distribuidos de acuerdo a las caractersticas
predeterminadas.
Fuente: Referencia donde se adquiere la informacin.

Cmo construir tablas o cuadros


estadsticos?

Si tenemos datos estadsticos que los podemos manejar


tambin los podemos ordenar. Si luego de la recopilacin,

obtenemos un conjunto de datos estadsticos demasiado


numeroso, poco o nada se puede hacer con ellos. Pero si
los organizamos y los clasificamos se nos va a facilitar la
informacin incluso la interpretacin.
La forma ms correcta es en una tabla de distribucin de
frecuencias, y su elaboracin no requiere ningn artificio
especial, basta con anotar los datos en fila o en columna.
Cuando elaboramos estas tablas se debe tener presente
lo siguiente:
Si se trabaja con variables discretas las clases
pueden ser sin agrupamiento, siempre y cuando su
recorrido sea menor a 20.
Cuando
estamos
encontrando estadsticas de
variables continuas y por lo general numerosa,
debemos agrupar, o por lo general cuando su rango
sea mayor a 20.

Por consiguiente podemos obtener 3 tipos de series:


1. Serie simple o tipo I, tambin llamada ordinaria
(cuando las estadsticas representan un rango menor a
10.
2. Serie de frecuencia, o tipo II (cuando las
estadsticas observadas se repiten y su rango est entre
mayor a 10 y menor que 20).

3. Serie de intervalos de clase o tipo III, o de datos


agrupados (cuando los datos observados son numerosos o
su rango es mayor que 20).

Tipos de Tablas o Cuadros


Estadsticos

Las tablas o cuadros estadsticos no tienen modelo nico,


estn sujetos a las exigencias de la informacin y del
investigador (revise, estudie y analice los cuadros de la
gua didctica y texto bsico.
Las tablas estadsticas segn el nmero de observaciones
y segn el recorrido de la variable estadstica, as
tenemos los siguientes tipos de tablas estadsticas:
1. Tablas Tipo I
2. Tablas Tipo II
3. Tablas Tipo III

Tablas tipo I: Cuadro Simple


Cuando el tamao de la muestra y el recorrido de la
variable son pequeos, por ejemplo si tenemos una
muestra de las edades de 5 personas, por lo que no hay
que hacer nada especial simplemente anotarlas de
manera ordenada en filas o columnas.
Edad de los 5 miembros de una familia:
1 2 4 6 8
5 1 2 0 5 0

Tablas tipo II: Cuadro de Frecuencias

Cuando el tamao de la muestra es grande y el recorrido


de la variable es pequeo, por lo que hay valores de la
variable que se repiten. Por ejemplo, si preguntamos el
nmero de personas activas que hay en 50 familias
obtenemos la siguiente tabla:
Personas Activas en 50 familias
2
1
2
2
1
2

Podemos observar que la variable toma valores


comprendidos entre 1 y 4, por lo que precisaremos una
tabla en la que resumamos estos datos quedando la
siguiente tabla:
Personas Activas

Nmero de Familias
16

1
20
2

3
5
4

Total

50

Tablas tipo III: Cuadro de Intervalos


Cuando el tamao de la muestra y el recorrido de la
variable son grandes, por lo que ser necesario agrupar
en intervalos los valores de la variable. Por ejemplo si a
un grupo de 30 alumnos les preguntamos el dinero que en
ese momento llevan encima, nos encontramos con los
siguientes datos:
450
1152
250
300
175
80
25
5
180
200
675
500
375
1500
605
785
1595
2300
5000
1200
100
185
125
315
425
560
1100
Evidentemente, la variable estadstica tiene un recorrido
muy grande, 4998 pesetas, por lo que s queremos hacer
una tabla con estos datos tendremos que tomar
intervalos. Para decidir la amplitud de los intervalos,
necesitaremos decidir cuntos intervalos queremos?
Normalmente se suele trabajar con no ms de 10 o 12
intervalos.
Amplitud =4998/10 = 499,8 Por lo que tomaremos
intervalos de amplitud 500
Debemos tener en cuenta las siguientes consideraciones:
Tomar pocos intervalos implica que la prdida de
informacin sea mayor.

2680
205
985

Los

intervalos

sern

siempre

Cerrados

por

la

izquierda y Abiertos por la Derecha [ Li-1 , Li )


Procuraremos que en la decisin de intervalos los
valores observados no coincidan con los valores de
los extremos del intervalo y si esto ocurre que no sea
en ms de un 5% del total de observaciones.
Con estas recomendaciones tendremos la siguiente tabla:
[ Li-1 , Li )
[ 0,500)
[ 500, 1000)
[ 1000,1500)
[ 1500, 2000)
[ 2000, 2500)
[ 2500, 3000)
[ 3000, 3500)
[ 3500, 4000)
[ 4000, 4500)
[ 4500, 5000)
[ 5000,5500)

Frecuencia
16
6
3
2
1
1
0
0
0
0
1

Fuentes del subtema 1.8 [31], [32], y [33]

Representacin Grfica de los


Datos de una Tabla de
Distribucin de Frecuencias
Qu son las Grficas
Estadsticas?

La Representacin Grfica de un conjunto de datos


recopilados, es una manera rpida y eficiente de
presentar estadsticamente la informacin.
Cuando se hace un estudio estadstico se obtiene una
gran cantidad de datos numricos. Para tener una
informacin clara y rpida de lo obtenido en el estudio se
han creado las grficas estadsticas.
Gran parte de la utilidad que tiene laEstadstica
Descriptiva es
la
deproporcionar
un
medio para informarbasado en los datos recopilados.
La eficacia con que se pueda realizar tal proceso de
informacin depender de la presentacin de los
datos, siendo la forma grfica uno de losms rpidos y
eficientes, aunque tambin uno de los que ms pueden
ser manipulados o ser malinterpretados si no se tienen
algunas precauciones bsicas al realizar las grficas.
Existen
tambin
varios tipos
de
grficas,
o representaciones grficas, utilizndose cada uno de

ellos de acuerdo al tipo de informacin que se est


usando y los objetivos que se persiguen al presentar la
informacin.
Entonces, algunas consideraciones que conviene
tomar en cuenta al momento de realizar cualquier grfica
a fin de que la informacin sea transmitida de la manera
ms eficaz posible y sin distorsiones son:
1. El eje que represente a las frecuencias de las
observaciones (comnmente el vertical o de las
ordenadas) debe comenzar en cero(0), de otra
manera podra dar impresiones errneas al comparar
la altura, longitud o posicin de las columnas, barras
o lneas que representan las frecuencias.
2. La longitud de los espacios que representan a
cada dato o intervalo(clase) en la grfica deben
ser iguales.
3. El tipo de grfico debe coincidir por sus
caractersticas con el tipo de informacin o el
objetivo que se persigue al representarla, de otra
manera la representacin grfica se convierte en un
instrumento ineficaz, que produce ms confusin que
otra
cosa,
innecesario
o
productor
de
malinterpretaciones.

Existen decenas de tipos de grficas, a continuacin te


presento los ms usuales e importantes.
Por ejemplo, si se desea representar la proporcin de
poblacin masculina en un pas conviene ms usar
una grfica de pastel o circular que una grfica de
barras al compararla contra la poblacin femenina; por un
lado se puede apreciar dicha proporcin, por el otro se
aprecia cul de las dos poblaciones es mayor.
Hay un punto que conviene remarcar: existe software que
permite la construccin rpida y eficiente de grficas a
partir de bases de datos o hojas de clculos, pero no
importa cun bonita, bien delineada, bien coloreada o
bien presentada est una grfica, si no se han tomado en
cuenta consideraciones de este tipo que tienen que ver
ms sobre el objetivo de estas herramientas y la
Estadstica: la
transmisin
eficiente
de
la
informacin.
Hay muchos tipos de grficas estadsticas. Cada una de
ellas es adecuada para un estudio determinado, ya que

no siempre se puede utilizar la misma para todos los


casos. Tienen una estructura distinta, lo cual les permite
ser utilizados para diferentes objetivos, y es que la
mayora de las veces utilizandatos o variables distintos.
A continuacin, se presentarn las grficas estadsticas
ms utilizadas:

Histograma

Histograma de Frecuencias
Un histograma es unarepresentacin grfica de una
variable en forma de barras.
Se utilizan para variables continuas o para variables
discretas, con un gran nmero de datos, y que se han
agrupado enclases.
En el eje abscisas se construyen unos rectngulos que
tienen por base la amplitud del intervalo, y
por altura, la frecuencia absoluta de cada intervalo.
La superficie de
cada barra es proporcional a
la frecuencia de los valores representados.
Un ejemplo es el que se presenta abajo y que representa
el nmero de visitas que ha tenido este hipertexto de

acuerdo a la hora de la visita. Es importante observar que


resulta difcil utilizar este tipo de representacin cuando
existen intervalos abiertos o cuando los intervalos no son
iguales entre s.
Otra observacin es la amplitud de los intervalos, que se
puede establecer utilizando la regla de Sturges, pues al
cambiarla la presentacin visual de un histograma puede
variar. Un applet que muestra cmo el nmero de clases y
su ancho pueden hacer variar fue desarrollado
por Webster West de la Universidad del Sur de Carolina.
Algunos de los usos ms comunes del uso de un
histograma son: aumentar la calidad de alguno de
nuestros procesos, pues todos sabemos que es necesario
reducir al mnimo la variacin que se presente en el
mismo. Es por eso, que el histograma nos permite
identificar cuantas veces se repite un mismo valor,
as como la frecuencia con la que se presenta. Siendo
base para la toma de decisiones.

Diagrama de Barras

Diagrama o grfica de barras

Un tipo de grfico muy parecido al histograma


es la grfica de columnas.
En este tipo de grfica, sobre losvalores de las
variables se levantan barras estrechas delongitudes
proporcionales a las frecuencias correspondientes. Se
utilizan
para
representarvariables
cualitativas ycuantitativas discretas.
Para
este
tipo
de
grfica,
elaboradas
con rectngulos tambin, se pide que sus bases sean
del mismo ancho y sus alturas equivalentes con las
frecuencias. A diferencia del histograma, no es necesario
tener una escala horizontal continua, por lo que los
rectngulos (o barras) no tienen que aparecer juntas
entre s. Otra observacin pertinente es que se
puedenrepresentar en la misma grfica, utilizando las
mismas
escalas
horizontales
y
verticales, varios
datos correspondientes
a
las mismas
variables producto de varias observaciones. Esto
produce una grfica convarias series, correspondiendo
cada una de ellas a cada observacin de la muestra (o
poblacin), y tenindose una grfica compuesta. Es
conveniente que cada serie de datos (u observaciones)
sean ilustrados o iluminados de igual manera entre s,
pero distinta de las dems.
En el eje horizontal, o eje de abscisas, se representan
los datos o modalidades; en el eje vertical o
de ordenadas, se representan lasfrecuencias de
cada dato o modalidad. Las frecuencias pueden

serabsolutas, acumuladas
relativas y relativas
acumuladas.
El ejemplo de la ilustracin de arriba pertenece al
comportamiento de las calificaciones parciales de tres
alumnos de preparatoria. Las series (cada una de las
calificaciones parciales) estn coloreadas con diferente
color para mostrar el comportamiento tanto individual,
como comparativo.
TIPOS DE GRFICOS DE BARRAS

Grfica de barras compuestas


Barra simple: se emplean para graficar hechos
nicos.
Barras mltiples: es muy recomendable para
comparar una serie estadstica con otra, para ello
emplea barras simples de distinto color o tramado
en un mismo plano cartesiano, una al lado de la otra.
Barras compuestas: en este mtodo de graficacin
las barras de
lasegunda
colocan encima de las barras de
serieen forma respectiva.

la

serie se
primera

El diagrama de barras proporciona informacin


comparativa principalmente y este es su uso
fundamental.

Grficas de Barras Horizontales


Tambin es posible realizar grficas de barras
horizontales, los cuales se parecen mucho a las grficas
de columnas, con la salvedad importante de que la
funcin de los ejes se intercambia y el eje horizontal
queda destinado a las frecuencias y el eje vertical a las
clases.
Es muy comn que este tipo de grficos se utilicen para
ilustrar
el tamaode
una poblacin
dividida en estratos como, por ejemplo, son sus edades.
El ejemplo que se presenta es la poblacin de un pas
ficticio llamado Timbuctulandia:
A este tipo de grficos en particular se le llama pirmide
de edades por su forma. Incluso, cuando se compara la
poblacin masculina y femenina por estratos de edades,
se estila utiliza el lado izquierdo para la poblacin de un
sexo y el lado derecho para el otro, el resultado es una
pirmide casi simtrica (depender de la poblacin en
particular).

Pirmides de poblacin.
La pirmide de poblacin es la representacin grfica de
la distribucin por edad y sexo de la poblacin.

Grficamente se trata de un doble histograma de


frecuencias.
La pirmide de edades es un histograma doble en el
que se representa en la derecha la poblacin masculina y
en la izquierda la poblacin femenina. En el eje de
abscisas se representa los efectivos de poblacin,
normalmente
en
porcentajes,
y
en
el eje
de
ordenadas las edades. Toma el nombre de la forma que
debe adoptar en las sociedades con una poblacin
equilibrada, con una amplia base debido al gran nmero
de nacimientos que se estrecha paulatinamente por
la mortalidad creciente a medida que aumenta el
intervalo de edades considerado.
La pirmide de poblacin, dependiendo de su forma,
puede dar una visin general de la juventud, madurez o
vejez de una poblacin, y por lo tanto obtener
consecuencias sociales de ello.
Segn su perfil podemos distinguir tres tipos bsicos de
pirmides:
De poblacin expansiva: con una base ancha y una
rpida reduccin a medida que ascendemos. Es propia de
los pases del Tercer Mundo en plena transicin
demogrfica con altas tasas de natalidad y mortalidad, y
con un crecimiento natural alto.
De poblacin regresiva: con una base ms estrecha
que el cuerpo central y un porcentaje de ancianos

relativamente grande. Se trata de una poblacin


envejecida con bajas tasas de natalidad y de mortalidad,
y con un crecimiento natural reducido.
De poblacin estacionaria: con una notable
igualdad entre las generaciones jvenes y adultas, y una
reduccin importante en las ancianas. El crecimiento
natural es bajo. Este tipo de pirmide es propia de las
poblaciones que no presentan cohortes de la transicin
demogrfica.

Grficas de Lneas

Cuando los datos se relacionan entre s, es decir, cuando


podemos decir que existe cierta continuidad entre las
observaciones se pueden utilizar las grficas de lneas,
que consisten en una serie de puntos trazados en las
intersecciones de las marcas de clase y las frecuencias de
cada una, unindose consecutivamente con lneas.
Este ejemplo muestra el comportamiento del peso
corporal (en kilogramos) de dos individuos a lo largo de
cinco observaciones anuales. Al igual que en el caso de
las grficas de columnas (y de otras ms) es posible
presentar varias series de observaciones (en este caso
cada serie de observaciones son los pesos de un
individuo).

Polgono de Frecuencias
Otra forma de representacin de un uso menos comn, y
muy parecida a las grficas de lneas, es el polgono de
frecuencias.

ste, es un grfico que se realiza a travs de la unin


de los puntos ms altos de las columnas en
un histograma de frecuencia (que utiliza columnas
verticales para mostrar las frecuencias). La diferencia
fundamental entre ambas es que en el polgono de
frecuencias se aaden dos clases con frecuencias
cero: una antes de la
primera
clase
con
datos y
otra despus de la ltima.
El resultado es que se sujeta la lnea por ambos
extremos al eje horizontal y lo que podra ser una lnea
separada del eje se convierte, junto con ste, en un
polgono. Los polgonos de frecuencia para datos
agrupados, por su parte, se construyen a partir de
la marca de clase que coincide con el punto medio de
cada columna del histograma.
Cuando se representan las frecuencias acumuladas de
una tabla de datos agrupados, se obtiene un histograma
de frecuencias acumuladas, que permite diagramar su
correspondiente polgono.
Se suelen utilizar cuando se desea mostrar ms de
una distribucin o la clasificacin cruzada de
una variable
cuantitativa
continua con
unacualitativa o cuantitativa discreta en un mismo
grfico.
El punto con mayor altura de un polgono de frecuencia
representa la mayor frecuencia, mientras que el rea bajo
la curva incluye la totalidad de los datos existentes.

El ejemplo de arriba corresponde al porcentaje del PIB


gastado en docencia e investigacin durante el ao de
1990 en cinco pases (fuente: Revista Ciencia y
Desarrollo, 1994, XIX (114):12))
Cabe recordar que la frecuencia es la repeticin menor o
mayor de un suceso, o la cantidad de veces que un
proceso peridico se repite por unidad de tiempo.

Pictograma

Son grficos con dibujos alusivos al carcter que se est


estudiando
y
cuyotamao es proporcional a
las frecuencias que representan.La mayor frecuencia se
identifica por la mayor acumulacin de smbolos. Los
pictogramas se emplean sobre todo, para hacer ms
amigables yentendibles los informes estadsticos. Se
utilizan en estadstica, en muchas ocasiones como parte
de una tabla.
Por ejemplo, si se quiere representar la produccin de
troncos de un aserradero, se utilizan el dibujo de un
tronco ancho para sealar mil troncos y un tronco
pequeo para representar 500 troncos.

Diagrama de Sectores
Tambin conocido como grfica de pastel o grfico
circular. Un diagrama de sectores se puede utilizar
para todo
tipo
de variables,
pero
se
usa
frecuentemente para las variables cualitativas.

Si el estudio estadstico tiene pocos valores distintos,


suele ocurrir con loscaracteres cualitativos, se puede usar
un diagrama en forma de crculo dividido en tantos
sectores como datos distintos haya, de modo que la
frecuencia de cada valor viene dada por un trozo de rea
del crculo. As, el crculo queda dividido en sectores cuya
amplitud es proporcional a las frecuencias de los valores.
Para obtener esta caracterstica fundamental del
diagrama
de
sectores,
en
que
el ngulo de
cada sector es proporcional a
la frecuencia
absolutacorrespondiente, tenemos que el ngulo se
calcula de la siguiente forma:
El diagrama circular se construye con la ayuda de un
transportador de ngulos.
Tambin puede usarse para datos cuantitativos agrupados
en clases, y en tales casos, cada sector corresponde a una
clase. Dada la ndole de esta representacin, slo se
utiliza
para distribuciones de
frecuencias
relativas usualmente expresadas en porcentajes.
Para qu sirve?
Expresa
de
manera
grfica
la distribucin
proporcional de los eventos o datos en estudio; sin
embargo, stos no deben ser ms de 7 porque el
anlisis se vuelve excesivamente complejo. Cuando lo
que
se
desea
esresaltar las proporciones que
representan algunos subconjuntos con respecto al total,
es decir, cuando se est usando una escala categrica,
conviene utilizarla.

Los datos presentados comienzan a las 12 horas en


el crculo y corren en el sentido de las manecillas del
reloj; colocando el porcentaje mayor (la rebanada ms
amplia del pastel) junto con la siguiente ms importante;
y as sucesivamente, hasta la ms pequea. Apguese a
esta convencin a menos que quiera ilustrar contrastes
dramticos en los porcentajes, colocando los porcentajes
mayores junto con los ms pequeos.
Los textos necesarios pueden situarse dentro del
pastel o fuera de ste (preferiblemente fuera cuando las
secciones representen valores pequeos) y el color debe
usarse
para
dar nfasis y esttica.
Su
principal
inconveniente consiste en que requieren de mucho
espacio en cada pgina.
Ejemplo
Alumnos(
Deporte
f i)
ngulo ()
12
144
Baloncesto
3
36
Natacin
9
108
Ftbol
6
72
Sin deporte
Total
30 (N)
360
En una clase de 30 alumnos, 12 juegan a baloncesto, 3
practican la natacin, 4 juegan al ftbol y el resto no
practica ningn deporte.

Diagrama de Dispersin
En
las distribuciones
bidimensionales a
cada individuo le corresponden los valores de dos
variables, las representamos por el par (xi, yi). Si
representamos
cada
par
de
valores
como
las coordenadas de un punto, el conjunto de todos ellos
se llama nube de puntos o diagrama de dispersin.
Sobre la nube de puntos puede trazarse una recta que se
ajuste a ellos lo mejor posible, llamada recta de
regresin.
Un grfico de dispersin tiene dos ejes de valores y
muestra un conjunto de datos numricos en el eje
horizontal (eje X) y otro en el eje vertical (eje Y).
Combina estos valores en puntos de datos nicos y los
muestra enintervalos irregulares o agrupaciones. Los
grficos de dispersin se utilizan por lo general
para mostrar y comparar valores numricos, por ejemplo
datos cientficos, estadsticos y de ingeniera. Se usa
cuando:
Desea convertir dicho eje en una escala logartmica.
Los espacios entre los valores del eje horizontal no
son uniformes.
Hay muchos puntos de datos en el eje horizontal.
Desea mostrar similitudes entre grandes conjuntos
de datos.
Desea comparar muchos puntos de datos sin tener
en cuenta el tiempo.
CLASIFICACIN SEGN TIPO DE CORRELACIN

1. Correlacin directa: La recta correspondiente a la


nube de puntos de la distribucin es una recta
creciente.
2. Correlacin inversa: La recta correspondiente a la
nube de puntos de la distribucin es una recta
decreciente.
3. Correlacin nula: En este caso se dice que las
variables son incorreladas y la nube de puntos tiene
una forma redondeada.
CLASIFICACIN SEGN GRADO DE CORRELACIN
El grado de correlacin indica la proximidad que hay
entre los puntos de la nube de puntos. Se pueden dar tres
tipos:
1. Correlacin fuerte: La correlacin ser fuerte
cuanto ms cerca estn los puntos de la recta.
2. Correlacin dbil: La correlacin ser dbil cuanto
ms separados estn los puntos de la recta.
3. Correlacin nula: No existe el ms mnimo grado
de correlacin entre los puntos.

Grficas de rea
Los grficos de rea destacan la magnitud del cambio
en el tiempo y se pueden utilizar para llamar la atencin
hacia el valor total en una tendencia. Por ejemplo, se
pueden trazar los datos que representan el beneficio en el
tiempo en un grfico de rea para destacar el beneficio
total. Al mostrar la suma de los valores trazados, un
grfico de rea tambin muestra la relacin de las partes
con un todo.

Los grficos de rea tienen los siguientes subtipos de


grfico:
reas en 2D y 3D

Tanto si se presentan en 2D

como en 3D, los grficos de reas muestran la


tendencia de los valores en el tiempo u otros datos
de categora. Como norma, considere la posibilidad
de utilizar un grfico de lneas en lugar de un grfico
de reas no apilado, ya que los datos de una serie
pueden quedar ocultos por los de otra.
reas apiladas y reas 100% apiladas: Los
grficos de reas apiladas muestran la tendencia de
la contribucin de cada valor a lo largo del tiempo u
otros datos de categora. Las grficas se pueden
proyectar en perspectiva 3D.

Otros grficos

Existen muchos otros grficos, que en este trabajo no


abordaremos de manera profunda debido a que son poco
comunes; principalmente, se trata de grficas estadsticas
utilizadas en ciencias o actividades muy especficas y
muchas veces se requiere de un conocimiento avanzado
para su realizacin. Como ejemplo, vale la pena
mencionar:
Grficos de superficie
Un grfico de superficie es til cuando busca
combinaciones ptimas entre dos conjuntos de datos.
Como en un mapa topogrfico, los colores y las tramas
indican reas que estn en el mismo rango de valores.

Puede utilizar un grfico de superficie cuando ambas


categoras y series de datos sean valores numricos.
Grficos de anillos
En un grfico de anillos se pueden representar datos
organizados nicamente en columnas o en filas de una
tabla de datos estadsticos. Un grfico de anillos muestra
la relacin de las partes con un todo pero puede contener
ms de una serie de datos; no son fciles de leer. Es
conveniente utilizar un grfico de columnas apiladas o un
grfico de barras apiladas en su lugar.
Grficas Radiales
Los datos organizados en columnas o filas en una hoja de
clculo se pueden representar en un grfico radial. Los
grficos radiales comparan los valores agregados de
varias series de datos y muestran cambios en valores
relativos a un punto central.
Fuentes del subtema 1.9 [34 - 50]

GLOSARIO
Al Azar o Aleatorio: Son todos aquellos eventos
fortuitos o productos de la suerte.
Aleatoriamente: Actividades o mtodos producidos o
llevados a cabo simulando un comportamiento al azar.
Clase: Subdivisin de escala de datos.
Correlacin: Cuando dos fenmenos sociales, fsicos o
biolgicos crecen o decrecen de forma simultnea y
proporcional debido a factores externos, se dice que los

fenmenos estn positivamente correlacionados. Si uno


crece en la misma proporcin que el otro decrece, los dos
fenmenos estn negativamente correlacionados. El
grado de correlacin se calcula aplicando
un coeficiente de correlacin a los datos de ambos
fenmenos.
Datos: Son los valores cualitativos o cuantitativos
mediante los cuales se miden las caractersticas de los
objetos, o fenmenos a estudiar.
Dispersin: La extensin o variabilidad de un conjunto
de datos.
Estadstica: Rama de las matemticas que se ocupa de
reunir, organizar y analizar datos numricos y que ayuda
a resolver problemas como el diseo de experimentos y la
toma de decisiones.
Evento: Uno o ms de los resultados posibles de
hacer algo, o uno de los resultados posibles de realizar un
experimento
Frecuencia: Nmero de veces en que se repite un dato.
Frecuencia Acumulada: Es el nmero de estudiantes
con calificaciones iguales o menores que el rango de
cada intervalo sucesivo.
Frecuencia absoluta: Es el nmero de veces que ocurre
un cierto suceso, en la proporcin de veces que ocurre
dicho suceso con relacin al nmero de veces que podra
haber ocurrido.
Frecuencia Relativa: Es la proporcin entre
la frecuencia de un intervalo y el nmero total de datos.

Intervalo de Clase: Pequea seccin de la escala segn


la cual se agrupan las puntuaciones de una distribucin
de frecuencia. Tamao o rango de la Clase.
Lmites del Intervalo: Son los valores extremos que
tiene el intervalo de clase, inferior y superior, entre los
cuales van a estar los valores de los datos agrupados en
ese intervalo de clase.
Muestra estadstica: es un subconjunto de casos o
individuos de una poblacin estadstica.
Muestreo aleatorio simple: Mtodos de seleccin de
muestras que permiten a cada muestra posible una
probabilidad igual de ser elegida y a cada elemento de la
poblacin una oportunidad igual de ser incluidos en la
muestra.
Muestreo aleatorio: Las tcnicas de muestreo aleatorio
aseguran que cada elemento en la poblacin de
inters tenga una probabilidad (no nula) de ser incluido
en la muestra.
Porcentaje: Es la proporcin de una cantidad
de datos especficos, con respecto al total de esos datos.
Poblacin estadstica: tambin
llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan las
observaciones.
Rango: Situacin de un dato respecto de una
distribucin.

Regresin: Proceso general que consiste en predecir una


variable a partir de otra mediante medios estadsticos,
utilizando datos anteriores.
Tablas de Frecuencias: Tabla que muestra el nmero de
veces que en un conjunto de datos aparece cada una de
las clases de inters especificadas en el recorrido de los
datos
Tamao de la Muestra: Es la cantidad de datos que
sern extrados de la poblacin para formar parte de
la muestra.
Variable: Propiedad o rasgo de un hecho u objeto (no
constante) por la que puede ser caracterizado o
clasificado. Representacin de una caracterstica, de un
tributo, que posee alguna realidad.
Variable dependiente: La variable que tratamos de
predecir en el anlisis de regresin.
Variables independientes: Variables (s) conocida(s)
en el anlisis de regresin.
Varianza: Desviacin cuadrada media de todos los
valores de la media.
Fuentes del Glosario [51] y [52]

Das könnte Ihnen auch gefallen