Sie sind auf Seite 1von 21

GENERALIDADES DE LA ESTADSTICA

La estadstica, de acuerdo con Monroy (2008), es la rama de la ciencia


matemtica que se encarga de organizar, resumir y analizar datos y,
partiendo de ese anlisis, realiza inferencias (deducciones) de una poblacin
a partir de la informacin contenida en una muestra.
Los mtodos estadsticos tradicionalmente se utilizan para propsitos
descriptivos, para organizar y resumir datos numricos. La estadstica
descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en
forma grfica o ilustrativa y el clculo de medidas descriptivas. (Ruz M.
2004).
Datos histricos revelan que en el antiguo Egipto, los faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, datos relativos a la poblacin y
la riqueza del pas. De acuerdo al historiador griego Herdoto, dicho registro
de riqueza y poblacin se hizo con el objetivo de preparar la construccin de
las pirmides.
En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de
los datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El
rey David por otra parte, orden a Joab, general del ejrcito hacer un censo
de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los
griegos efectuaron censos peridicamente con fines tributarios, sociales
(divisin de tierras) y militares (clculo de recursos y hombres disponibles).
La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia
guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor
supieron emplear los recursos de la estadstica. Cada cinco aos realizaban
un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de
anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos
peridicos del ganado y de las riquezas contenidas en las tierras
conquistadas. Para el nacimiento de Cristo suceda uno de estos
empadronamientos de la poblacin bajo la autoridad del imperio.
D. Bernoulli (1700 1782) proporciona la primera solucin al problema de
estimar una cantidad desconocida a partir de un conjunto de mediciones de
su valor que, por el error experimental, presentan variabilidad.
A partir de 1950 se puede decir que es el inicio de la poca moderna de la
estadstica.
La estadstica para su mejor estudio se divide en tres ramas las cuales son:
estadstica descriptiva, teora de la probabilidad y estadstica inferencial.

Estadstica descriptiva: se encarga solamente de describir y

analizar un conjunto determinado de datos, sin obtener conclusiones; para


lo cual se auxilia de tablas, grficos y cuadros para el manejo de datos
ordenados o individuales tanto cuantitativos como cualitativos. Su finalidad
es obtener informacin, analizarla, elaborarla y simplificarla lo necesario
para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda
utilizarse eficazmente para el fin que se desee.

Probabilidad: se utiliza en el anlisis de situaciones en las que


interviene el azar como los juegos de dados, cartas, tiro de monedas y casi
todos los deportes.

Estadstica inferencial: es aquella que nos permite realizar


inferencias o deducciones sobre el comportamiento o caractersticas de una
poblacin a partir de una muestra de los elementos que integran a dicha
poblacin.

CONCEPTOS BSICOS
Variable: Se define como variable a aquella caracterstica que puede ser
medida, y que al ser medida durante el transcurso de un evento
determinado, puede adoptar diferentes valores o uno solo.
Variable aleatoria: En un evento aleatorio, los valores de los sucesos que
en l ocurren y al que se le otorga un nmero real, se conoce como variable
aleatoria, y estas pueden clasificarse como variables aleatorias discretas y
variables aleatorias continuas, dependiendo de los valores que tome en
cada caso.
Variable aleatoria discreta: Son aquellos valores finitos o infinitos que
puede tomar una variable aleatoria y a cuyos valores se les conoce como
datos cuantitativos discretos y son respuestas numricas que resultan de un
proceso de conteo, ejemplo:
1.

El nmero de alumnos en el curso de estadstica.

2. El nmero de vehculos que se encuentran en el estacionamiento de la


universidad.
3.

El nmero de rboles en el jardn de la universidad.

Variable aleatoria continua: Es aquella que se encuentra dentro de un


intervalo comprendido entre dos valores cualesquiera; sta puede asumir
infinito nmero de valores y stos se pueden medir, ejemplo:
1.

La estatura de un alumno de un grupo escolar.

2.

El peso en gramos de una moneda.

3.

La edad de un hijo de familia.

Poblacin: Es el nmero total de elementos contenidos en el conjunto


universo, sobre el cual se realizan las observaciones para conocer sus
caractersticas.
Muestra: Es un subconjunto o porcin representativa de una poblacin, que
se estudia para realizar inferencias sobre ella, a partir de la muestra.
Estadstico: Es una medida cuantitativa, obtenida a partir de una muestra,
con la finalidad de conocer las caractersticas de una poblacin.
Medidas de tendencia central: En un conjunto de datos ordenados, el
valor que se encuentra en la parte central de esta distribucin, se le conoce
como medida de tendencia central o de posicin central. Entre las ms
conocidas estn la media, la mediana y la moda.
Medidas de dispersin: Las medidas de dispersin nos permiten conocer
que tanto se dispersan los datos o desvan los datos en torno al valor
central. Entre las ms utilizadas estn la varianza y la desviacin estndar.

biblografia
http://metodosestadisticos-utt.blogspot.com/2011/05/generalidadesde-la-estadistica.html

1. Ciencia que utiliza conjuntos de datos numricos para obtener


inferencias basadas en el clculo de probabilidades: la estadstica
ofrece conclusiones muy impersonales que en ocasiones no reflejan la
realidad.
2. Ciencia que tiene por objeto reunir y clasificar una serie de hechos
con una determinada caracterstica comn: este programa de
estadstica calcula automticamente el PIB de cada pas.
3. [Por extensin] Conjunto homogneo de datos sobre hechos o
manifestaciones de cualquier tipo (social, cientfico, deportivo, etc.):
hay una estadstica que dice que las mujeres espaolas fuman ms
que los hombres; me gustara tener las estadsticas del partido para
ver los porcentajes de tiro de tombergas.
Sinnimos
Diagrama, grfico, esquema, censo, padrn, catastro, lista, natalidad,
demografa, nupcialidad, mortalidad, criminalidad, porcentaje.
? (1)[Matemticas] Estadstica.
Rama de las Matemticas que se basa en la obtencin de los mtodos
adecuados para obtener conclusiones razonables cuando hay
incertidumbre. Esta ciencia tiene como principal objeto aplicar las
leyes de la cantidad a hechos sociales para medir su intensidad,
deducir las leyes que los rigen y hacer un prediccin prxima. Existen
dos ramas muy diferentes dentro de la estadstica: la estadstica
descriptiva y la estadstica matemtica.
La estadstica descriptiva se basa en la recoleccin de datos de una
muestra representativa de una poblacin de la que se quiere estudiar
alguna caracterstica, en su tratamiento y en la obtencin de una
serie de resultados y medidas matemticas (medias, desviaciones,
etc), que posteriormente se analizan y se extrae una conclusin de

las posibles causas que producen la caracterstica de la poblacin en


estudio y su relacin con otros fenmenos.
La estadstica matemtica utiliza el clculo de probabilidades para
establecer previsiones y conclusiones de los fenmenos colectivos.
? (2)[Tcnica] Estadstica.
Estudio del tratamiento de la informacin que contienen las series de
datos procedentes de observaciones de fenmenos colectivos
(demogrficos, econmicos, tecnolgicos, etc), en los que el gran
nmero de factores de variacin que intervienen hace necesarios
modelos probabilsticos para que a las conclusiones, leyes o
decisiones basadas en los mismos, se les pueda asignar una
confianza mensurable.
Evolucin histrica
Aunque es muy difcil establecer los comienzos de la estadstica tal y
como hoy la conocemos, se puede decir que el primer precedente que
se encuentra en la historia son los censos chinos que el emperador
Tao orden elaborar hacia el ao 2200 antes de Cristo. Ms tarde,
hacia el 555 a.C., se elaboraron los censos del Imperio Romano, y
desde entonces hasta el siglo XVII muchos estados realizaron estudios
sobre sus poblaciones.
En 1662 el comerciante londinense de lencera J. Graunt publica un
libro, titulado Natural and Political Observations made upon the Bills
of Mortality (Observaciones naturales y polticas extradas de los
certificados de defuncin), que es el primer intento de interpretar
fenmenos biolgicos y sociales de la poblacin partiendo de datos
numricos. En su libro pona de manifiesto la influencia que tenan las
cifras de nacimientos y muertes sobre el medio social en el Londres
de los aos 1604 a 1661. Graunt entabl amistad con un hombre
llamado Sir Willian Pety, que ms tarde public un libro sobre lo que l
llam "la nueva ciencia de la aritmtica poltica" que fue ampliamente
difundido. A finales del siglo XVII, el famoso astrnomo E. Halley
public un artculo titulado "Un clculo de los grados de mortalidad de
la humanidad, deducido de curiosas tablas de los nacimientos y
funerales de la ciudad de Breslau". Los estudios publicados por
Graunt, Pety y Halley estn considerados la base fundamental de los
trabajos posteriores sobre esperanza de vida que son tan utilizados
hoy por las aseguradoras.
Hacia el ao 1835 el astrnomo real de Blgica A. Q. Lambert elabor
el primer censo de su pas, en el que analiz la influencia sobre la

mortalidad de determinados factores como la edad, el sexo y la


situacin econmica. A este estudioso se debe el trmino "hombre
medio" que adoptaran despus otros cientficos de esta materia.
Pero es a otros dos hombres relevantes, llamados Galton y Pearson, a
los que se considera los "padres" de la estadstica actual, ya que
fueron ellos los que provocaron el paso de la estadstica deductiva,
estudiada en su poca, a la estadstica inductiva, que es la que hoy
tiene ms influencia en la ciencia.
Por ltimo, cabe destacar aqu, al profesor de fsica, G. T. Fechner. Este cientfico del siglo XIX aplic los
conocimientos de estadstica de su tiempo a las ciencias sociales, fundamentalmente a la psicologa.

Generalidades
La estadstica descriptiva incluye al conjunto de tratamientos de los datos de una muestra, de los que se
extraen unos valores que sintetizan o resumen sus caractersticas ms importantes, y las tcnicas de
representacin de estos valores de forma que se facilite su anlisis. Los valores que aportan
gran informacin sobre los datos tomados son las medidas de centralizacin, dispersin y forma.
Se conoce con el nombre de variable cuantitativa, o simplemente variable, a aquella magnitud que toma
valores mensurables. Las variables se conocen como discretas si toman valores enteros, como el nmero
de alumnos en un aula o el nmero de defectos por metro en un cable elctrico. Las variables continuas
pueden variar de forma continua, como por ejemplo el peso de una persona o la longitud de una varilla.
Las variables cualitativas o atributos son aquellas cualidades que no son mensurables, por ejemplo si una
determinada pieza es o no defectuosa.
La Regresin muestra la dependencia entre variables por medio de un modelo matemtico que contempla
tanto la parte sistemtica como la aleatoria de la relacin entre dichas variables. El modelo obtenido se
contrasta por medio de unas pruebas estadsticas con las que se comprueban las hiptesis formuladas, y
as generalizar los resultados a la poblacin.

Medidas de centralizacin
Estas medidas proporcionan informacin sobre la tendencia central de las observaciones.
- Media: La media o media aritmtica ( x ) es la suma de un conjunto de valores dividido entre el nmero
total de estos datos.

En el caso en el que los datos estn agrupados en intervalos, los valores de una misma clase pueden ser
sustituidos por la marca de la clase correspondiente.

Las propiedades de la media son las siguientes:


- La media de una constante es la propia constante.
- La media de la suma o diferencia de variables es igual a la suma o diferencia de las medias de dichas
variables.
- La media del producto de una constante por una variable, es igual a la constante por la media de la
variable.
- La media de una combinacin lineal de dos o ms variables es igual a la combinacin lineal de las
medias de dichas variables.
- La media es el centro de gravedad de la distribucin, ya que las desviaciones respecto a la media
suman 0.

- Mediana: La mediana es el valor del elemento que ocupa el lugar central, si los datos estn ordenados,
bien de forma creciente o de forma decreciente.
- Moda: La moda es el valor ms frecuente, es decir es el valor de la variable que se repite un mayor
nmero de veces.
En el caso de una distribucin totalmente simtrica, la media y la mediana coinciden. Si la media y la
mediana difieren mucho significa que hay heterogeneidad entre los datos y que la distribucin, por tanto
ser asimtrica.

Medidas de dispersin
Son las medidas que muestran la variacin de los datos tomados.
- Recorrido: El Recorrido (R) es la diferencia entre el valor mayor y el valor menor de los que toma la
variable.

Las propiedades de la varianza son:


- La varianza es siempre positiva o cero.
- La varianza de una constante es cero.
- La varianza de la suma o diferencia de una variable y una constante es igual a la varianza de la variable.

- La varianza de un producto de una constante por una variable es igual al cuadrado de la constante por la
varianza de la variable.
- Desviacin Tpica: La desviacin tpica o estndar (S) se define por:

Las propiedades de la desviacin tpica son:


- La desviacin tpica es siempre positiva o cero.
- La desviacin tpica de una constante es cero.
- La desviacin tpica de una constante por una variable es igual a la constante por la desviacin tpica de
la variable.
- La desviacin tpica de la suma o diferencia de una variable y una constante es igual a la desviacin
tpica de la variable.
- Meda: La meda es al medida de dispersin asociada a la mediana, y es la mediana de las desviaciones
absolutas.

Representacin grfica de los datos


Las representaciones grficas de una distribucin de frecuencias permite obtener, de un golpe de vista,
informacin de las caractersticas de dicha distribucin.
A) Histograma
El Histograma representa la frecuencia con la que se presentan los diferentes grupos de datos de la
variable objeto de estudio. Es un conjunto de rectngulos, los cuales representan a cada una de las
clases. En el eje de abscisas se representan las clases definidas y en el eje de ordenadas la frecuencia
de cada una de ellas.
La amplitud del intervalo de las clases se halla dividiendo el Recorrido entre el nmero de clases.
El Histograma proporciona mucha informacin respecto a la estructura de los datos. Por tanto, es
importante analizar la situacin del centro del Histograma y el ancho del mismo que definen la tendencia
central y la variabilidad del conjunto de datos respectivamente, as como la forma del Histograma que
identifica algunas de las caractersticas del proceso en estudio.
- Distribucin Simtrica Unimodal: Se caracteriza porque cada una de las observaciones equidistantes
al mximo central, tienen aproximadamente la misma frecuencia. Es tpico de la mayora de
los procesos industriales.

- Distribucin Asimtrica: Es tpica de datos econmicos, y de forma general en distribuciones de


renta, consumo de electricidad, poblacin, tamao de empresas,...
- Distribucin Triangular: Es totalmente asimtrica y se presenta al estudiar tiempos entre averas, entre
llegadas, entre accidentes, o en fabricacin donde existe la imposibilidad de superar un valor o bien se ha
realizado una seleccin de 100% de alguna caracterstica.
- Distribucin Bimodal: Se presenta como dos distribuciones muy separadas. Suele aparecer cuando se
han recopilado datos a partir de dos procesos distintos, tales como las caractersticas de una pieza
suministrada por dos proveedores diferentes.
- Distribucin Rectangular: Presenta gran variabilidad. Aparece al mezclar datos de Distribuciones
Simtricas Unimodales.
- Distribucin Truncada: Aparece al presentar datos de procesos que no cumplen las especificaciones,
despus de pasar un control de calidad. Puede ser, tambin un sntoma de una eleccin de un nmero de
clases menor al adecuado.
- Distribucin sin Datos en la Zona Central: Suele aparecer cuando los datos corresponden a un
material de mala calidad, y el "material bueno" ha sido seleccionado previamente.
- Distribucin con Picos en las Colas: Es una representacin tpica cuando se han sometido a un
reproceso, los elementos que en un primer control cayeron fuera de tolerancias.
B) Diagrama de puntos
Este grfico muestra un conjunto de puntos, que son la interseccin de las frecuencias (representadas en
el eje de ordenadas) y de los valores de la distribucin (representados en el eje de abscisas).
C) Diagrama de barras
Presenta los valores posibles de los datos sin agrupar y sus frecuencias absolutas o relativas. En el eje
horizontal aparecen los datos tratados y en el eje vertical las frecuencias. Sobre el eje horizontal se traza
un segmento de longitud proporcional al valor de las frecuencias.
D) Polgono de frecuencias
Es un grfico que une los puntos que representan la interseccin de las marcas de clase con su
frecuencia correspondiente.
Cabe mencionar tambin los grficos de sectores, de rectngulos, pictogramas, etc.

Covarianza y correlacin. Anlisis grfico


- Covarianza: Es una medida de asociacin que mide la relacin lineal entre las variables "x" e "y", y se
define como:

En el caso de que los datos estn agrupados en clases, la frmula de la covarianza es la siguiente:

- Correlacin: Es el resultado de dividir la covarianza por un trmino de sus mismas dimensiones,


obteniendo el coeficiente de correlacin (r). Sx y Sy, son las desviaciones tpicas de "x" e "y"
respectivamente.

Las propiedades del coeficiente de correlacin son las siguientes:


- Si multiplicamos "x" e "y". por constantes (aunque stas sean distintas), el coeficiente de correlacin no
vara.
- Cuando no existe una relacin lineal exacta entre "x" e "y", el coeficiente de correlacin vara entre -1 y 1
(-1 <> r <> 1).
- Cuando no existe relacin lineal r = 0 (en este caso puede ocurrir que exista otro tipo de relacin no
lineal).
- Si existe una relacin lineal, entonces r = 1 (correlacin lineal perfecta y directa) r = -1 (correlacin
lineal perfecta e inversa).
Del simple anlisis grfico se obtiene una gran informacin:
- Caso A: la relacin es lineal, y adems es positiva o directa ya que la variable "y" aumenta
proporcionalmente con "x". Existe dispersin de los puntos, por lo que "r" no se acercar a la unidad.
- Caso B: Se observa que no existe ninguna relacin entre las variables. No hay variaciones sistemticas
de una variable cuando vara la otra.
- Caso C: Existe una relacin lineal, inversa o negativa. Los puntos estn concentrados, luego "r" estar
prxima a "-1".
- Caso D: Existe una relacin no lineal.

Regresin simple
Cuando existe una dependencia causal entre dos variables, y se toman diversas observaciones, stas
aparecen reflejadas en una nube de puntos debido al componente aleatorio, a pesar de que pueda existir
una fuerte dependencia entre ellas. El objetivo de la regresin es obtener una recta (lnea de regresin,
denominada as por Galton) hacia la que tienden los puntos de un diagrama de dispersin, y va a definir la
dependencia exacta entre las variables "x" e "y".
El modelo de la recta de regresin se ajusta a la expresin:

Para proceder a la estimacin de los parmetros ?

se parte de las siguientes hiptesis:


- Linealidad.
- Homocedasticidad de las perturbaciones, es decir su variabilidad se mantiene constante.
- Independencia de las perturbaciones. Sus covarianzas deben ser nulas, para que haya ausencia de
autocorrelacin.
- Normalidad. Las perturbaciones deben seguir el modelo de una distribucin normal

Si de una poblacin se extrae una muestra, se tiene la siguiente relacin:

Regresin y correlacin mltiples


En la realidad es habitual que exista una dependencia causal entre ms de dos variables, con una
variable dependiente "y" (efecto) y varias variables independientes "x1", "x2",... (causas).
Estimacin del modelo:

En una poblacin, se considera:

La estimacin de los coeficientes de regresin

se realiza por el mtodo de los mnimos cuadrados, minimizando la suma de los residuos al cuadrado.
Tambin se deben cumplir las hiptesis de linealidad, homocedasticidad, independencia y normalidad de
la parte aleatoria.

Ecuaciones temporales
Las series temporales expresan la relacin entre dos variables, siendo una de ellas el "tiempo". Estas
series permiten describir la evolucin en el pasado de una magnitud y formular predicciones para el
futuro.
Este anlisis puede realizarse desde dos puntos de vista, el llamado enfoque clsico y el enfoque causal.
El enfoque causal estudia las series temporales en funcin de las variables que han producido dichas
variaciones, ya que el tiempo es slo el marco donde se producen los hechos, no la causa de los mismos.
El enfoque clsico analiza la serie considerando cada variable por separado y en funcin del tiempo; se
ha convertido en un mtodo estndar de estudio de estas series, y es aceptado de forma unnime por los
estadsticos; por tanto es el que se describir en el presente tema.
Las series temporales, tambin denominadas series cronolgicas, crnicas o histricas son un conjunto
de observaciones de una variable, la cual est relacionada con un conjunto de intervalos o instantes de
tiempos. Cuando cada observacin se refiere a un perodo, la variable se denomina "flujo" (por ejemplo, la
serie mensual del consumo de electricidad a nivel nacional) y cuando cada observacin se refiere a un
instante, la variable se denomina "nivel" o "stock" (por ejemplo, serie diaria de las temperaturas recogidas
en un punto determinado cada hora).

Las observaciones de una serie temporal tienen ciertas peculiaridades, pues con el paso del tiempo
pueden perder homogeneidad a causa de factores como son la mejora de los mtodos de observacin
estadstica, las variaciones en las definiciones estadsticas, etc. Por otra parte, las observaciones
temporales no son del todo independientes y es frecuente que una observacin dependa de la
precedente, y se suele presentar una correlacin entre una serie temporal y la misma pero retardada en el
tiempo, fenmeno que se denomina autocorrelacin. Por todo ello, es necesario estudiar las series
temporales de forma independiente a las series de las observaciones transversales.
Al analizar una serie temporal, se puede apreciar que se producen variaciones, y stas pueden ser:
- Evolutivas: el "nivel medio" de la variable est sometido a cambios muy bruscos.
En los siguientes grficos se aprecian estas variaciones; en la "figura 1" se observa cmo la serie va
pasando de unos niveles altos al principio a unos muy bajos despus, para volver al final a tener unos
niveles semejantes a los del principio. En la "figura 2", se aprecia cmo las observaciones van teniendo
niveles cada vez ms altos.
- Estacionarias: el "nivel medio" de la variable permanece prcticamente constante, lo que no quiere
decir que no aparezcan fluctuaciones.
En el siguiente grfico aparece una serie estacionaria, que aunque muestra fluctuaciones, el "nivel medio"
permanece constante en el tiempo.
Por tanto, como es normal encontrar variables que fluctan en el tiempo, es importante conocer las
causas que producen tales variaciones, para analizar la evolucin en el tiempo de un fenmeno
determinado, de forma que se pueda, tanto describir el comportamiento en el pasado de la variable como
formular predicciones para el futuro.
Desde el punto de vista clsico, se estudia una serie temporal considerando cada variable por separado y
en funcin del tiempo, es decir:
y = f (t)
Siendo:
y : variable dependiente
t : variable independiente o explicativa
En general, las serie temporales son mensuales, trimestrales o anuales.
Partiendo de la hiptesis de que las observaciones de la variable corresponden a un intervalo de tiempo,
se supone que las variaciones que se producen son el resultado del efecto de cuatro fuerzas o
componentes: la tendencia, la estacionalidad, los ciclos y los accidentes.
- Tendencia (T): Conocida tambin como "tendencia secular". Determina los movimientos de la variable a
largo plazo, ignorando de forma consciente las variaciones a corto y medio plazo. Se consideran, en
general, ms de diez aos, para apreciar si la serie obedece a una ley determinada. La tendencia
proporciona informacin sobre si la serie es estacionaria o evolutiva.
- Estacionalidad (E): Representa las variaciones a corto plazo, que se repiten de forma peridica en un
tiempo inferior al ao, y que adems se van reproduciendo un ao tras otro. Es independiente de la
tendencia y de las fluctuaciones cclicas.

La estacionalidad debe ser rigurosamente peridica. Suponiendo "t" el nmero de aos y "m" el perodo
correspondiente:

- Fluctuaciones cclicas (C): Corresponden a las variaciones a medio plazo, es decir a tiempos
superiores al ao. Estos movimientos cclicos no son tan regulares como los estacionales, se
corresponden con movimientos de periodicidad y amplitud variables.
- Variaciones accidentales (A): Son los movimientos espordicos que se producen de forma ocasional.
Son provocados por dos tipos de factores: aleatorios (provocados por pequeos accidentes) o errticos
(como consecuencia de inundaciones, terremotos, huelgas, etc). Se corresponden con movimientos
irregulares e imprevisibles de poca amplitud y no permanentes. En general, su media es nula, en un
numero pequeo de meses.
La tendencia y las fluctuaciones cclicas pueden tomarse de forma conjunta, como
un movimiento coyuntural o extraestacional, que marca la evolucin fundamental de la serie.

Inferencia estadstica
La inferencia estadstica es una parte de la Estadstica que permite generar modelos probabilsticos a
partir de un conjunto de observaciones.
Del conjunto se observaciones que van a ser analizadas, se eligen aleatoriamente slo unas cuantas, que
es lo que se denomina muestra, y a partir de dicha muestra se estiman los parmetros del modelo, y se
contrastan las hiptesis establecidas, con el objeto de determinar si el modelo probabilstico es el
adecuado al problema real que se ha planteado.
La utilidad de la inferencia estadstica, consiste en que si el modelo se considera adecuado, puede usarse
para la toma de decisiones o para la realizacin de las previsiones convenientes.
En el desarrollo del tema se utilizarn variables aleatorias, que son variables determinadas por el azar.
La inferencia estadstica parte de un conjunto de observaciones de una variable, y a partir de estos datos
"infiere" o genera un modelo probabilstico; por tanto es la consecuencia de la investigacin emprica. La
inferencia estadstica es, en consecuencia, un planteamiento inductivo.
Partiendo de los datos recopilados, la inferencia estadstica sigue los siguientes pasos:
- estimar los parmetros (por ejemplo la media y la desviacin tpica)
- hallar los intervalos de confianza, es decir el rango de valores donde es probable que se encuentren los
parmetros.
- contrastar las hiptesis (por ejemplo si la media & es igual a un valor &0 no es igual a &0).
Se entiende por poblacin al conjunto de elementos de los que se analiza una cierta caracterstica. La
prctica dice que lo habitual, es no poder estudiar la totalidad de estos elementos, debido a diversas
razones, tales como:
- Econmicamente, no es rentable el anlisis de toda la poblacin, por ser excesivamente grande.
- Los elementos, no existen como tales. Como son los casos de los elementos defectuosos.

- El anlisis requiere la destruccin de los elementos. Como, por ejemplo, en los ensayos destructivos.
Por todo lo mencionado anteriormente, se selecciona slo un conjunto de los elementos, que es lo que se
denomina muestra.
Se entiende por marco el patrn de la poblacin por el cual deben regularse o contrastarse las medidas.

Muestreo aleatorio
Dentro de las tcnicas de muestreo aleatorio merecen mencin, el muestreo aleatorio simple, el muestreo
aleatorio estratificado, el muestreo sistemtico y el muestreo polietpico. Todas ellas tienen como objetivo
fundamental seleccionar muestras que sean representativas de la poblacin.
A) Muestreo Aleatorio Simple
El muestreo aleatorio simple consiste en seleccionar elementos de una poblacin, bajo las siguientes
condiciones:
-todos los elementos tienen la misma probabilidad de ser elegidos
-la poblacin es idntica en todas las extracciones, es decir una vez seleccionada una poblacin, sta se
reemplaza.
La seleccin de las observaciones de una muestra aleatoria simple, se suele realizar mediante "nmeros
aleatorios", que son precisamente, un conjunto de nmeros, los cuales tienen todos ellos la misma
probabilidad de aparicin.
Si x1, x2,...,xn es una muestra aleatoria simple de una variable discreta, la probabilidad de obtener dicha
muestra se denomina "probabilidad conjunta" y es igual al producto de las probabilidades de cada
observacin:
P (x1, x2,...,xn) = P (x1) P (x2) ... P (xn)
Esta relacin se obtiene como consecuencia de la independencia de las observaciones.
Si la variable aleatoria es continua, se establece una relacin equivalente a la anterior, pero con
las funciones de densidad.
f (x1, x2,...,xn) = f (x1) f (x2) ... f (xn)
Con esta tcnica, cada uno de los elementos de la muestra Xi ser una variable aleatoria con la misma
distribucin que la poblacin de la que se ha obtenido.
Entre s, los elementos muestrales tambin son variables aleatorias independientes.
Mtodo de montecarlo
El Mtodo de Montecarlo es una forma artificial de realizar el muestreo aleatorio simple, pues se utiliza
cuando los elementos de la poblacin no estn disponibles.
Consiste en seleccionar muestras de cualquier poblacin, siempre y cuando se conozca su distribucin de
probabilidad.
B) Muestreo Aleatorio Estratificado

El muestreo aleatorio estratificado se produce cuando los elementos de una poblacin se estructuran en
clases (o estratos).
Para dividir la poblacin en clases se siguen los siguientes criterios:
- Se respetan, de forma proporcional, los tamaos relativos en la poblacin. Es decir, si en una poblacin
existieran un 60% de mujeres y un 40% de hombres, esta proporcin se respetara en el estrato.
- Se respeta tambin, de forma proporcional, la variabilidad de la poblacin en el estrato. Es decir, se
toman menos elementos de estratos donde la caracterstica tenga menor dispersin.
La muestra se elige de la siguiente manera:
-se asigna un nmero determinado de elementos a cada clase
-se elige, por muestreo aleatorio simple, dentro de cada clase
C) Muestreo Sistemtico
Se utiliza cuando los datos de la poblacin se presentan ordenados en listas. Dada una poblacin de
tamao "N", si se pretende obtener una muestra de tamao "n". Suponiendo que "k" es el nmero entero
ms cercano a N/n, la muestra sistemtica se va obteniendo al azar un elemento entre los primeros "k"
(mediante nmeros aleatorios).
Si el orden del elemento elegido es n?, a continuacin se toman los elementos n1+k, n?+2k, y as de
forma sucesiva a intervalos fijos de "k" hasta completar la muestra.
Si en el orden en el que se presentan los elementos de la poblacin, se encuentran ms prximos los
individuos que son ms semejantes y se encuentran ms alejados los individuos que ms difieren entre
s, este mtodo es ms preciso que el muestreo aleatorio simple, porque cubre de forma ms homognea
la poblacin.
Si el orden de los elementos que figuran en las listas ha sido tomado al azar, este mtodo es igual al
muestreo aleatorio simple.
D) Muestreo Polietpico
Se utiliza cuando la poblacin es muy heterognea. Para seleccionar una muestra de una poblacin se va
dividiendo dicha poblacin de forma sucesiva conforme algn criterio determinado con anterioridad. De
las partes que resultaron de la primera divisin se eligen algunas por muestreo aleatorio simple. A su vez
estas partes se subdividen en otras y de ellas se vuelve a seleccionar algunas, tambin por muestreo
aleatorio simple.
Un ejemplo clsico de un muestreo polietpico resulta cuando se quiere seleccionar una muestra de una
ciudad grande; la ciudad se divide en barrios y de ellos se eligen algunos por muestreo aleatorio simple;
los barrios se dividen en calles, y dentro de ellas se seleccionan algunas tambin por muestreo aleatorio
simple, y as sucesivamente.
Estadstico
Un Estadstico o Estimador de un parmetro poblacional ? desconocido es cualquier funcin que relaciona
los elementos de la muestra y que utilizaremos para estimar o contrastar el verdadero valor de

Debido a que el estimador es una funcin de la variable aleatoria que representa la muestra genrica,
ser a su vez una variable aleatoria con su correspondiente distribucin en el muestreo.

Distribuciones de variables discretas


Una variable aleatoria es discreta cuando el conjunto de sus valores posibles es finito, o bien en el caso
de ser infinito es numerable. La distribucin de probabilidad de variables aleatorias discretas se
representa indicando los valores de la variable aleatoria y sus respectivas probabilidades.

Distribucin binomial
Una distribucin sigue la ley binomial siempre y cuando se cumplan las siguientes hiptesis:
- Las observaciones se clasifican en dos categoras, que son adems excluyentes. Por ejemplo, los
elementos se pueden clasificar en aceptables o defectuosos
- Las observaciones son independientes. Esto significa que la probabilidad de que aparezca un elemento
aceptable es siempre la misma y a su vez la probabilidad de aparicin de un elemento defectuoso
tambin se mantiene.
- La proporcin de elementos de las dos categoras en las que se ha clasificado la poblacin es siempre
constante.
El modelo de la distribucin binomial se aplica a:
- poblaciones finitas, de las que se toman elementos al azar, con reemplazamientos.
- poblaciones consideradas infinitas desde el punto de vista conceptual, como son las piezas que produce
una mquina (defectuosas o aceptables), siempre que el resultado de cada momento sea independiente
de lo ocurrido con anterioridad.
La variable binomial es una variable discreta, de parmetros "n" y "p" que toma los valores enteros:
x = 0,1,2,...,n
Sean los parmetros, "p" y "q" comprendidos entre 0 y 1, y siendo q=1-p, se cumple tambin que:

Es una distribucin, en general, asimtrica. Slo es simtrica cuando se verifica que p = 1/2
La media, varianza y desviacin tpica tienen las siguientes expresiones:
Su media es igual al producto de los parmetros "n" y "p":

Un ejemplo de distribucin binomial son los sondeos a una poblacin cuyos individuos se dividen en dos
categoras.
Distribucin binomial negativa
La distribucin binomial negativa permite hallar un nmero de "z" elementos de una categora antes de
que aparezca el primer elemento de la otra categora.
Por ejemplo: "z" piezas aceptables antes de la k-sima defectuosa.

Distribuciones de variables continuas


Una variable aleatoria es continua cuando puede tomar cualquier valor dentro de un intervalo.

Para representar un distribucin de probabilidad de variables continuas es necesario tener en cuenta los
siguientes aspectos:
Si las medidas de una magnitud se representa en un Histograma y se van tomando cada vez ms
observaciones y se van disminuyendo el tamao de las clases, dicho Histograma tiende a una curva que
describe el comportamiento de la variable a largo plazo. Esta funcin lmite recibe el nombre de Funcin
de Densidad f (x).
El rea del Histograma es la unidad, debido a que la suma de las frecuencias relativas es la unidad. En
consecuencia:

Distribucin Normal
La Distribucin Normal o de Gauss-Laplace es la distribucin de probabilidad ms importante, pues
muchos procesos de medicin sin errores sistemticos se aproximan a ella.
La funcin de densidad de una distribucin normal es la siguiente:

Para transformar una variable aleatoria normal "x" en una variable normal estndar "z", se realiza
mediante la expresin:

La distribucin normal tiene como coeficiente de apuntamiento el valor 3, el cual se toma de referencia
para juzgar otras distribuciones.

Distribucin "t" de Student


La Distribucin "t" de Student es una distribucin continua que se define por la siguiente expresin:

La distribucin "t" de Student puede tomar valores negativos, pero, en general, slo interesa su magnitud
y no su signo.
Es una distribucin simtrica y con mayor dispersin que la distribucin normal. No obstante, cuando "n"
es igual o mayor que 100, la distribucin "t" es igual a la normal.
Su media y su varianza son respectivamente:

Distribucin x2

Su media y su varianza son respectivamente:

Leer ms: http://www.monografias.com/trabajos82/principios-basicos-estadistica/principios-basicosestadistica2.shtml#ixzz3aWveD0Gx

Das könnte Ihnen auch gefallen