Sie sind auf Seite 1von 15

Historia de la Estadstica

La Estadstica es una disciplina que utiliza recursos matemticos para organizar y


resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones
respecto de ellos.
Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario
de un pas, a travs de ciertos parmetros como la tasa de morbilidad o mortalidad
de la poblacin.
En este caso la estadstica describe la muestra en trminos de datos organizados
y resumidos, y luego infiere conclusiones respecto de la poblacin.
Aplicada a la investigacin cientfica, tambin infiere cuando provee
los medios matemticos para establecer si una hiptesis debe o no ser rechazada.
La estadstica puede aplicarse a cualquier mbito de la realidad,ESTADISTICA"
se deriv de la palabra "ESTADO". La funcin de los gobiernos entre otras cosas
es llevar los registros de poblacin, nacimientos, cosechas, impuestos y toda la
informacin que engloba el estado, es as que, tradicionalmente se defini a la
estadstica como un instrumento de compilacin, organizacin, presentacin y
anlisis de datos numricos. Slo cuando nos adentramos en un mundo ms
especfico como es el campo de la investigacin de las Ciencias Sociales:
Medicina, Biologa, Psicologa, ... empezamos a percibir que la Estadstica no slo
es algo ms, sino que se convierte en la nica herramienta que, hoy por hoy,
permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de
estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan
ser abordadas desde la perspectiva de las leyes determinsticas. Podramos,
desde un punto de vista ms amplio, definir la estadstica como la ciencia que
estudia cmo debe emplearse la informacin y cmo dar una gua de accin en
situaciones prcticas que entraan incertidumbre. La estadstica es una ciencia
aplicada de las matemticas y es una valiosa herramienta para la toma de
decisiones. Permite el estudio de fenmenos mediante la descripcin del mismo a
travs de inferencias mediante distribuciones probabilsticas. La Estadstica se
ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa intrnseca de los mismos; as como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y
en su caso formular predicciones. Podramos por tanto clasificar la Estadstica en
descriptiva, cuando los resultados del anlisis no pretenden ir ms all del
conjunto de datos, e inferencias cuando el objetivo del estudio es derivar las
conclusiones obtenidas a un conjunto de datos ms amplio.
Estadstica descriptiva: Describe, analiza y representa un grupo de datos
utilizando mtodos numricos y grficos que resumen y presentan la informacin
contenida en ellos.
Estadstica inferencial: Apoyndose en el clculo de probabilidades y a partir de
datos de muestras, efecta estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos.

ORIGEN DE LA ESTADISTICA:
Los comienzos de la estadstica pueden ser
hallados en el antiguo Egipto, cuyos faraones
lograron recopilar, hacia el ao 3050 antes de
Cristo, prolijos datos relativos a la poblacin y
la riqueza del pas. De acuerdo al historiador
griego Herdoto, dicho registro de riqueza y
poblacin se hizo con el objetivo de preparar la
construccin de las pirmides. En el mismo
Egipto, Ramss II hizo un censo de las tierras
con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los
datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey
David por otra parte, orden a Joab, general del ejrcito hacer un censo de Israel
con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de
cuarenta siglos. Los griegos efectuaron censos
peridicamente con fines tributarios, sociales (divisin
de tierras) y militares (clculo de recursos y hombres
disponibles). La investigacin histrica revela que se
realizaron 69 censos para calcular los impuestos,
determinar los derechos de voto y ponderar la potencia
guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor
supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un
censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar
nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del
ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin
bajo la autoridad del imperio.
Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy
pocas operaciones Estadsticas, con la notable excepcin de las relaciones de
tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por
Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos
censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el
Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la
propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer
compendio estadstico de Inglaterra.

Aunque Carlomagno, en Francia; y


Conquistador, en Inglaterra, trataron
revivir la tcnica romana, los mtodos
estadsticos permanecieron casi
olvidados durante la Edad Media.

Guillermo

el
de

Durante los siglos XV, XVI, y XVII,


hombres como Leonardo de Vinci,
Nicols Coprnico, Galileo, Neper, William
Harvey,
Sir
Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo
cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi
como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a
los datos econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al
temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en
Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y
matrimonios. Durante un brote de peste que apareci a fines de la dcada de
1500, el gobierno ingls comenz a publicar estadsticas semanales de los
decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of Mortality
(Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. En
1662, el capitn John Graunt us documentos que abarcaban treinta aos y
efectu predicciones sobre el nmero de personas que moriran de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que
cabra esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Polticas y
Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo
innovador en el anlisis estadstico.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica
de los recursos nacionales, comprensiva de datos sobre organizacin poltica,
instrucciones sociales, comercio y podero militar. Durante el siglo XVII aport
indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y
ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica
Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba,
decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus
respectivos pases. El primer empleo de los datos estadsticos para fines ajenos a
la poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor
alemn que viva en Breslau. Este investigador se propuso destruir la antigua

creencia popular de que en los aos terminados en siete mora ms gente que en
los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de
la ciudad. Despus de revisar miles de partidas de defuncin pudo demostrar que
en tales aos no fallecan ms personas que en los dems. Los procedimientos de
Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del
cometa que lleva su nombre, quien los aplic al estudio de la vida humana. Sus
clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compaas de seguros.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teora de
probabilidades. No obstante durante cierto tiempo, la teora
de las probabilidades limit su aplicacin a los juegos de
azar y hasta el siglo XVIII no comenz a aplicarse a los
grandes problemas cientficos.
Godofredo Achenwall, profesor de la Universidad de
Gotinga, acu en 1760 la palabra estadstica, que extrajo
del trmino italiano statista (estadista). Crea, y con sobrada
razn, que los datos de la nueva ciencia seran el aliado
ms eficaz del gobernante consciente. La raz remota de la
palabra se halla, por otra parte, en el trmino latino status, que significa estado o
situacin; Esta etimologa aumenta el valor intrnseco de la palabra, por cuanto la
estadstica revela el sentido cuantitativo de las ms variadas situaciones.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este
interpret la teora de la probabilidad para su uso en las ciencias sociales y
resolver la aplicacin del principio de promedios y de la variabilidad a los
fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de
todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia.

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos


matemticos fundamentales para la teora
Estadstica; la teora de los errores de
observacin, aportada por Laplace y
Gauss; y la teora de los mnimos
cuadrados desarrollada por Laplace,
Gauss y Legendre. A finales del siglo XIX,
Sir Francis Gaston ide el mtodo
conocido por Correlacin, que tena por
objeto medir la influencia relativa de los
factores sobre las variables. De aqu
parti el desarrollo del coeficiente de
correlacin creado por Karl Pearson y otros cultivadores de la ciencia biomtrica
como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios
estudios sobre la medida de las relaciones.
Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior
desarrollo del clculo de probabilidades, particularmente en la rama denominada
indeterminismo o relatividad, se ha demostrado que el determinismo fue
reconocido en la Fsica como resultado de las investigaciones atmicas y que este
principio se juzga aplicable tanto a las ciencias sociales como a las fsicas.

Mtodo Estadstico:
El uso de los mtodos estadsticos se remonta al menos al siglo V a. C. El
historiador Tucdides en su Historia de la Guerra del Peloponeso describe como
los atenienses calculaban la altura de la muralla de Platea, contando el nmero de
ladrillos de una seccin expuesta de la muralla que estuviera lo suficientemente
cerca como para contarlos. El conteo era repetido varias veces por diferentes
soldados. El valor ms frecuente (la moda en trminos ms modernos) era tomado
como el valor del nmero de ladrillos ms probable. Multiplicando este valor por la
altura de los ladrillos usados en la muralla les permita a los atenienses determinar
la altura de las escaleras necesarias para trepar las murallas.
En el poema pico indio Majabhrata (libro 3: la historia del rey Nala), el
rey Ritupama estimaba el nmero de frutas y hojas (2095 frutas y 50,00,000 hojas
(5 crores)) en dos grandes hojas de un rbol Vibhitaka contndolos en un solo
vstago. Este nmero era luego multiplicado por el nmero de vstagos en las
ramas. Este estimado fue posteriormente verificado y se hall que estaba muy
cerca del nmero verdadero. Con el conocimiento de este mtodo Nala pudo
subsecuentemente reconquistar su reino.

El primer escrito de estadstica fue encontrado en un libro o del siglo IX


titulado Manuscrito sobre el descifrado de mensajes criptogrficos, escrito por AlKindi (801-873). En su libro, Al-Kindi da una descripcin detallada sobre el uso de
las estadsticas y anlisis de frecuencias en el descifrado de mensajes, este fue el
nacimiento tanto de la estadstica como del criptoanlisis.
La Prueba del Pyx es una prueba de pureza de la moneda del Royal Mint, que ha
sido llevada a cabo regularmente desde el siglo XII. La prueba en s misma est
basada en mtodos de muestreo estadstico. Despus de acuar una serie de
monedas originalmente de 10 libras de plata una moneda singular era
colocada en el Pyx (una caja en laAbada de Westminster). Despus de un tiempo
ahora una vez al ao las monedas son retiradas y pesadas. Luego, una
muestra de monedas retiradas de la caja es probada por pureza.
La Nuova Crnica, una historia de Florencia del siglo XIV escrita por el banquero
florentino y oficial Giovanni Villani, incluye mucha informacin estadstica.sobre la
poblacin, ordenanzas, comercio, educacin y edificaciones religiosas, y ha sido
descrito como la primera introduccin de la estadstica como elemento positivo en
la historia, aunque ni el trmino ni el concepto de la estadstica como campo
especfico exista an. Esto se demostr que era incorrecto despus del hallazgo
del libro de Al-Kindi sobre anlisis de frecuencias.
Aunque era un concepto conocido por los griegos, la media aritmtica no fue
generalizada a ms de dos valores hasta el siglo 16. La invencin del sistema
decimal por Simon Stevin en 1585 parece haber facilitado estos clculos. Este
mtodo fue adoptado por primera vez en astronoma por Tycho Brahe, el que
intentaba reducir errores en sus estimados de las localizaciones de varios cuerpos
celestiales.
La idea de la mediana se origin en el libro de navegacin de Edward
Wright (Certaine errors in navigation) en 1599 en una seccin concerniente a la
determinacin de una localizacin con un comps. Wright sinti que este valor era
el que ms probablemente estuviera correcto en una serie de observaciones.
John Graunt en su libro Natural and Political Observations Made upon the Bills of
Mortality, estim la poblacin de Londres en 1662 a travs de registros
parroquiales. El saba que haba cerca de 13,000 funerales al ao en Londres y
que de cada once familias tres personas moran por ao. El estimo de los registros
parroquiales que el tamao promedio de las familias era 8 y calcul que la
poblacin de Londres era de cerca de 384,000. Laplace en 1802 estim la
poblacin de Francia con un mtodo similar.

Los mtodos matemticos de la estadstica surgieron de la teora de


probabilidades, la cual tiene sus races en la correspondencia entre Pierre de
Fermat y Blaise Pascal(1654). Christiaan Huygens (1657) provey el primer
tratamiento cientfico sobre el tema que se conozca hasta la fecha. El libro Ars
Conjectandi de Jakob Bernoulli (pstumo 1713) y La doctrina de las
probabilidades (1718) de Abraham de Moivre trataron el tema como una rama de
las matemticas. En su libro, Bernoulli introdujo la idea de representar certeza
completa como el nmero 1 y la probabilidad como un nmero entre cero y uno.
Galileo luch contra el problema de errores en las observaciones y haba
formulado ambiguamente el principio de que los valores ms probables de
cantidades desconocidas seran aquellos que hicieran los errores en las
ecuaciones razonablemente pequeos. El estudio formal en teora de
errores puede ser originado en el libro de Roger Cotes (Opera Miscellanea,
pstumo 1750). Tobias Mayer, en su estudio de los movimientos de
la Luna (Kosmographische Nachrichten, Nremberg, 1750), invent el primer
mtodo formal para estimar cantidades desconocidas generalizando el promedio
de las observaciones bajo circunstancias idnticas al promedio de los grupos de
ecuaciones similares.
Un primer ejemplo de lo que posteriormente fue conocido como la curva normal
fue estudiado por Abraham de Moivre, quien traz esta curva en Noviembre 12,
1733. De Moivre estaba estudiando el nmero de caras que ocurran cuando una
moneda justa era lanzada.
En sus memorias Un intento por mostrar la emergente ventaja de tomar la
media de un nmero de observaciones en astronoma prctica preparada
por Thomas Simpsonen 1755 (impreso en 1756) aplicaba por primera vez la teora
a la discusin de errores en observaciones. La reimpresin (1757) de sus
memorias sostiene el axioma que errores positivos y negativos son igualmente
probables, y que hay ciertos valores lmites dentro de los cuales todos los errores
se encuentran; los errores continuos son discutidos y se provee una curva de
probabilidad. Simpson discuti varias posibles distribuciones de error. Primero
consider la distribucin uniforme y despus la distribucin triangular discreta
simtrica, seguida por la distribucin triangular contnua simtrica.
Ruder Bokovic en 1755 se bas en su trabajo sobre la forma de la Tierra
propuesto en el libro De litteraria expeditione per pontificiam ditionem ad
dimetiendos duos meridiani gradus a PP. Maire et Boscovicli para proponer que el
verdadero valor de una serie de observaciones sera aquel que minimizara la
suma de los errores absolutos. En terminologa moderna este valor es la media.

Johann Heinrich Lamber en su libro de 1765 Anlage zur Architectonic propuso


el semicrculo como una distribucin de errores:
con 1 = x = 1.
Pierre-Simon Laplace (1774) hizo su primer intento de deducir una regla para la
combinacin de observaciones desde los principios de la teora de las
probabilidades. El represent la ley de a probabilidad de errores mediante una
curva y dedujo una frmula para la media de tres observaciones.
Laplace en 1774 not que la frecuencia de un error poda ser expresada como una
funcin exponencial de su magnitud una vez descartado el signo. Esta distribucin
es ahora conocida como distribucin de Laplace.
Lagrange propuso una distribucin parablica de errores en 1776:
con -1 = x = 1.
Laplace en 1778 public su segunda ley de errores en la cual not que la
frecuencia de un error era proporcional a la funcin exponencial del cuadrado de
su magnitud. Esto fue descubierto subsecuentemente por Gauss (posiblemente en
1797) y es ahora mejor conocida como distribucin normal, la cual es de
importancia central en la estadstica. Esta distribucin fue referida como normal
por primera vez por Pierce en 1873, quien estaba estudiando las medidas de error
cuando un objeto era dejado caer sobre una superficie de madera. Escogi el
trmino normal debido a su ocurrencia frecuente en variables que ocurran en la
naturaleza.
Lagrange tambin sugiri en 1781 otras dos distribuciones para errores una
distribucin coseno:
con -1 = x = 1 y una distribucin logartmica
con -1 = x = 1 donde || es el --valor absoluto-- de x.
Laplace obtuvo una formula (1781) para la ley de facilidad de un error (un trmino
acuado por Joseph Louis Lagrange, 1774), pero esta conllevaba a ecuaciones
inmanejables.Daniel Bernoulli (1778) introdujo el principio del mximo producto de
las probabilidades de un sistema de errores concurrentes.

Laplace, en una investigacin del movimiento de Saturno y Jpiter en 1787,


generaliz el mtodo de Mayer usando diferentes combinaciones lineales de un
grupo de ecuaciones.
En 1802 Laplace estim la poblacin en Francia a 28,328,612. l calcul este
nmero usando la cantidad de nacimientos del ao anterior y el dato del censo de
tres comunidades. Los datos de los censos de estas comunidades mostraron que
tenan 2,037,615 personas y que el nmero de nacimientos era de 71,866.
Asumiendo que estas muestras eran representativas de Francia, Laplace produjo
un estimado para la poblacin entera.
El mtodo de los mnimos cuadrados, el cual era usado para minimizar errores en
la medicin de datos, fue publicado independientemente por Adrien-Marie
Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809).Gauss
haba usado el mtodo en s famosa prediccin en 1801 de la localizacin
del planeta enano Ceres. Las observaciones en las que Gauss bas sus clculos
fueron hechas por el monje italiano Piazzi. Posteriormente se dieron
demostraciones por Laplace (1810, 1812), Gauss (1823), Ivory (1825, 1826),
Hagen (1837), Bessel (1838), Donkin (1844, 1856), Herschel (1850), Crofton
(1870), y Thiele (1880, 1889).
El trmino error probable (der wahrscheinliche Fehler) la desviacin media
fue introducido en 1815 por el astrnomo alemn Frederik Wilhelm Bessel.
Antoine Augustin Cournot en 1843 fue el primero en usar el trmino
mediana (valeur mdiane) para el valor que divide la distribucin de
probabilidad en dos mitades iguales.
Otros contribuyentes a la teora de errores fueron Ellis (1844), De Morgan (1864),
Glaisher (1872), y Giovanni Schiaparelli (1875). La formula de Peters (1856)
para , el "error probable" de una sola observacin fue ampliamente usada e
inspir tempranamente la estadstica robusta (resistente a valores atpicos:
ver criterio de Peirce).
En el siglo 19 los autores de la teora estadstica incluan a included Laplace, S.
Lacroix (1816), Littrow (1833), Dedekind (1860), Helmert (1872), Laurant (1873),
Liagre, Didion,De Morgan, Boole, Edgeworth, and K. Pearson. y K. Pearson.
Gustav Theodor Fechner us la mediana (centralwerth) en fenmenos
sociolgicos y sociolgicos. Anteriormente haba sido usado solamente en
astronoma y campos relacionados.

Las primeras pruebas de la distribucin normal fueron inventadas por el


estadstico alemn Wilhelm Lexis en 1870. El nico conjunto de datos disponible
para l, en que le era posible mostrar que estaba normalmente distribuido, era la
frecuencia de nacimientos.
Francis Galton estudi una variedad de caractersticas humanas altura, edad,
peso, tamao de las pestaas, entre otras y encontr que michos de estos
factores podan ser ajustados a una distribucin normal. 16
Francis Galton en 1907 entreg un artculo a la revista Nature acerca de la utilidad
de la mediana.17 El examin la precisin de 787 intentos de adivinar el peso de un
buey en una feria de campo. El peso real era de 1208: la mediana de todas las
conjeturas fue 1198 libras. Las conjeturas fueron marcadamente no normales en
su distribucin.
El noruego Anders Nicolai Kir introdujo el concepto de muestreo estratificado en
1895.18 Arthur Lyon Bowley introdujo el muestreo aleatorio en 1906. [20] Jerzy
Neyman en 1934 hizo evidente que el muestreo aleatorio estratificado era en
general un mejor mtodo de estimacin que el muestreo intencional (por cuota). 19
El nivel de significacin del 5 % parece ser introducido por Fisher en 1925. 20 Fisher
expres que las desviaciones que excedan dos veces la desviacin estndar eran
consideradas significativas. Previamente a esto las desviaciones que excedan
tres veces el error probable eran consideradas significativas. Para una distribucin
simtrica el error probable la mitad del rango intercuantil. El cuantil superior de la
distribucin normal estndar est entre 0.66 y 0.67, su error probable es
aproximadamente 2/3 de la desviacin estndar. Parece que el criterio de Fisher
del 5% tena sus races en la prctica previa.
En 1929 Wilso y Hilferty re-examinaron los datos de Pierce de 1873 y
descubrieron que en realidad no estaba realmente normalmente distribuida. 21
CONCEPTOS BASICOS QUE SE DIERON EN EL SIGLO XX
POBLACION.- Agregado de unidades elementales, que poseen alguna
caracterstica o propiedades comunes. El estudio de toda la poblacin constituye
un CENSO. Una poblacin puede ser finita o infinita. En relacin al tamao de la
poblacin, sta puede ser:
Finita, como es el caso del nmero de personas que llegan al servicio de urgencia
de un hospital en un da; y se conoce el tamao N de la poblacin.
Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y cruces obtenida en el lanzamiento repetido de una moneda

al aire. Tambin se considera infinita, a pesar que las poblaciones son pequea,
no se puede saber con exactitud el tamao de la poblacin. Ejemplos
- Todos los agricultores que cultivan papa para comercializar en el PERU.
- Todas los arboles de pijuayo en Pucallpa.
UNIDAD ELEMENTAL.- Son los "entes" que constituyen la poblacin y de las que
se va a obtener informacin inicial. Tambin conocido como elementos o
individuos que contienen cierta informacin que se desea estudiar. Ejemplos
- Una agricultor que cultiva papa.
- Una arbol de pijuayo.
MUESTRA.- Es una parte de la poblacin. Se espera que la muestra sea
representativa de la poblacin, es decir reproduzca las caractersticas ms
importantes. El proceso de obtener la muestra de denomina MUESTREO.
MUESTRA ALEATORIA.- cuando la muestra a sido obtenida empleando algn
procedimiento del azar: sorteo, extraccin al azar, nmeros aleatorios, etc.
Ejemplo
- 20 agricultores de papa tomadas al azar de la poblacin de productores de
papa.
En una muestra aleatoria, cada unidad elemental tiene una determinada
posibilidad (probabilidad) de pertenecer a la muestra.
OBSERVACION.- Es el registro que se obtiene al evaluar una caracterstica en
una unidad elemental. Ejemplo
-10 ton por hectarea (si se evalu la produccin de un agricultor). Establecemos a
continuacin algunas definiciones de conceptos bsicos y fundamentales bsicas
como son: elemento, poblacin, muestra, carcteres, variables, etc., a las cuales
haremos referencia continuamente.

VARIABLES ESTADSTICAS
Cuando hablemos de variable haremos referencia a un smbolo (X,Y,A,B,...) que
puede tomar cualquier modalidad (valor) de un conjunto determinado, que
llamaremos dominio de la variable o rango. En funcin del tipo de dominio, las
variables las clasificamos del siguiente modo:
VARIABLES CUALITATIVAS.- Generan observaciones de carcter no numrico y
son del tipo:
CUALITATIVAS JERARQUICAS.- Cuando se puede establecer una relacin de
orden entre las posibles observaciones. Llamadas cuasicuantitativas

CUALITATIVAS NOMINALES.- No existe un orden entre las posibles


observaciones.
Ejemplos de variables cualitativas:
- Calidad de papa (V.C.J.)
- Color de la pulpa de la papa (V.C.N.)
cuando las modalidades posibles son de tipo nominal. Por ejemplo, una variable
de color
VARIABLES CUANTITATIVAS.- son las que tienen por modalidades cantidades
numricas con las que podemos hacer operaciones aritmticas. Dentro de este
tipo de variables podemos distinguir dos grupos:
CUANTITATIVAS DISCRETAS.- Cuando el conjunto de todas las posibles
observaciones que se generan constituyen a lo ms un conjunto infinito
numerable. cuando no admiten siempre una modalidad intermedia entre dos
cualesquiera de sus modalidades. Un ejemplo es el nmero de tuberculos por
planta. Es obvio que cada valor de la variable es un nmero natural
CUANTITATIVAS CONTINUAS.- Cuando el conjunto de todas las posibles
observaciones que se generan constituyen un conjunto infinito no numerable.
admiten una modalidad intermedia entre dos cualesquiera de sus modalidades,
v.g. el peso tuberculos de una planta cosechada. En este caso los valores de las
variables son nmeros reales, es decir ocurre a veces que una variable
cuantitativa continua por naturaleza, aparece como discreta. Este es el caso en
que hay limitaciones en lo que concierne a la precisin del aparato de medida de
esa variable, v.g. si medimos la altura en metros de los arboles con una regla que
ofrece dos decimales de precisin, podemos obtener 15.25, 18.24 .
En realidad lo que ocurre es que con cada mediciones se expresa que el
verdadero valor de la misma se encuentra en un intervalo. Por tanto cada una de
las observaciones representa ms bien un intervalo que un valor concreto.
Tal como se cito anteriormente, las modalidades son las diferentes situaciones
posibles que puede presentar la variable. A veces stas son muy numerosas (v.g.
cuando una variable es continua) y conviene reducir su nmero, agrupndolas en
una cantidad inferior de clases.
Ejemplos de variables numricas:
- Nmero de plantas enfermas en el campo de una hectarea (V.C.D.)
- peso de tubrculo a la cosecha. (V.C.C.)

PARAMETRO.- Es una constante que describe una caracterstica de una


poblacin. Para poder calcular el valor de un parmetro, se requiere conocer a
ciencia cierta el estado de naturaleza de la poblacin o realizar un censo.
Principales tipos de parmetros son:
Parmetros de tendencia central o de resumen, siendo los ms importantes :
- La media o promedio ()
- La mediana (Me)
- La moda (Mo)
Parametros de variabilidad, siendo los ms importantes:
- La variancia o varianza ()
- La desviacin estndar ()
- El coeficiente de variabilidad (C.V.)
En el caso de que la variable sea cuantitativa se usa el porcentaje o proporcin
. VALOR ESTADISTICO - Son valores anlogos a los parmetros, pero que son
calculados con la informacin obtenida de la muestra.
Los valores estadsticos son variables porque pueden tomar diferentes valores al
cambiar de muestra.
Un valor estadstico estima al parmetro correspondiente. La notacin difiere
respecto a los parametros:
- Promedio X
- Mediana me
- Moda mo
- variancia s
- Desviacin estndar s
s estima a
A los valores estadsticos tambin se le conoce con el nombre de estadgrafos. El
trmino de "medida", suele usarse para referirse a parmetros o valores
estadsticos.

LA ESTADSTICA EN LA ACTUALIDAD
Hoy el uso de la estadstica se ha extendido ms all de sus orgenes como un
servicio al Estado o al gobierno. Personas y organizaciones usan la estadstica

para entender datos y tomar decisiones en


ciencias naturales y sociales, medicina, negocios
y otras reas. La estadstica es entendida
generalmente no como un sub-rea de las
matemticas sino como una ciencia diferente
aliada. Muchas universidades tienen
departamentos acadmicos de matemticas y
estadstica separadamente. La estadstica se
ensea en departamentos tan diversos
Regresin lineal Grficos
como psicologa, educacin y salud pblica.
dedispersin en estadstica.
Al aplicar la estadstica a un problema
cientfico, industrial o social, se comienza con un proceso o poblacin a ser
estudiado. Esta puede ser la poblacin de un pas, de granos cristalizados en una
roca o de bienes manufacturados por una fbrica en particular durante un periodo
dado. Tambin podra ser un proceso observado en varios instantes y los datos
recogidos de esta manera constituyen una serie de tiempo.
Por razones prcticas, en lugar de compilar datos de una poblacin entera,
usualmente se estudia un subconjunto seleccionado de la poblacin,
llamado muestra. Datos acerca de la muestra son recogidos de manera
observacional o experimental. Los datos son entonces analizados
estadsticamente lo cual sigue dos propsitos: descripcin e inferencia.
El
valioso.
datos
dos

concepto de correlacin es particularmente


Anlisis estadsticos de un conjunto de
puede revelar que dos variables (esto es,
propiedades de la poblacin bajo
consideracin) tienden a variar
conjuntamente, como si hubiera una conexin
entre ellas. Por ejemplo, un estudio del ingreso
anual y la edad de muerte podra resultar en que personas pobres tienden a tener
vidas ms cortas que personas de mayor ingreso. Las dos variables se dice que
estn correlacionadas. Sin embargo, no se puede inferir inmediatamente la
existencia de una relacin de causalidad entre las dos variables. El fenmeno
correlacionado podra ser la causa de una tercera, previamente no considerada,
llamada variable confusora.
Si la muestra es representativa de la poblacin, inferencias y conclusiones hechas
en la muestra pueden ser extendidas a la poblacin completa. Un problema mayor
es el de determinar cun representativa es la muestra extrada. La estadstica

ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el


proceso de recoleccin de los datos, as como mtodos para disear experimentos
robustos como primera medida, ver diseo experimental.
El concepto matemtico fundamental empleado para entender
aleatoriedad es el de probabilidad. La estadstica
matemtica (tambin llamada teora estadstica) es la
las matemticas aplicadas que usa la teora de
probabilidades y el anlisis matemtico para
examinar las bases tericas de la
estadstica.

la
rama de

El uso de cualquier mtodo estadstico es vlido


solo cuando el sistema o poblacin bajo consideracin satisface los supuestos
matemticos del mtodo. El mal uso de la estadstica puede producir serios
errores en la descripcin e interpretacin, lo cual podra llegar a afectar polticas
sociales, la prctica mdica y la calidad de estructuras tales como puentes y
plantas de reaccin nuclear.