Sie sind auf Seite 1von 19

ESTADISTICA

La estadstica es la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en situaciones
prcticas que entraan incertidumbre. (Gutirrez, p.23)

La estadstica es la ciencia de los datos, la cual implica su recoleccin, clasificacin, sntesis, organizacin, anlisis e
interpretacin, para la toma de decisiones frente a la incertidumbre (ngel, p. 28)

La estadstica es la rama del conocimiento humano que tiene como objeto el estudio de ciertos mtodos inductivos aplicables
a fenmenos susceptibles de expresin cuantitativa. (Lpez, p.1)

OBJETIVO DE LA ESTADISTICA

El objetivo de la estadstica es mejorar la comprensin de hechos a partir de datos. (Moore, p.267)

El principal objetivo de la estadstica es hacer inferencias acerca de una poblacin, con base en la informacin contenida en una
muestra. (Prez, p.172)

EXISTEN DOS TIPOS DE ESTADISTICA

Estadstica descriptiva

Se puede definir como un mtodo para describir numricamente conjuntos numerosos. Por tratarse de un mtodo de
descripcin numrica, utiliza el nmero como medio para describir un conjunto, que debe ser numeroso, ya que las
permanencias estadsticas no se dan en los casos raros. No es posible sacar conclusiones concretas y precisas de los datos
estadsticos. (Vargas, p.33)

OBJETIVO DE LA ESTADISTICA DESCRIPTIVA

La finalidad ltima de la estadstica descriptiva es resumir la informacin de conjuntos ms o menos numerosos de datos. Para
ello se asienta en un concepto inmediato a la tarea de recuento: la frecuencia, medida emprica de la ocurrencia de los distintos
estados que puede presentar una variable. (SGT, p.16)

ESTADSTICA INFERENCIAL, ANALTICA O DEDUCTIVA

Estudia la probabilidad de xito de las diferentes soluciones posibles a un problema en las diferentes ciencias en las que se aplica y para
ello utiliza los datos observados en una o varias muestras de la poblacin. Mediante la creacin de un modelo matemtico infiere el
comportamiento de la poblacin total partiendo de los resultados obtenidos en las observaciones de las muestras.(Fernndez et.al, p.17)

OBJETIVO DE LA ESTADSTICA INFERENCIAL

La inferencia estadstica intenta tomar decisiones basadas en la aceptacin o el rechazo de ciertas relaciones que se toman como hiptesis.
Esta toma de decisiones va acompaada de un margen de error, cuya probabilidad est determinada. (Vargas, p.33)
La estadstica inferencial tiene dos objetivos bsicos; a) obtener conclusiones vlidas acerca de una poblacin sobre la base de una
muestra, es decir, que las conclusiones que obtengamos de una muestra se puedan extrapolar a la poblacin que dio origen a esa muestra
y b) poder medir el grado de incertidumbre presente en dichas inferencias en trminos de probabilidad. (Daz, p.287)

OTRAS DEFINICIONES

A continuacin, se definen algunos de los trminos ms usados en estadstica:

Poblacin. Es el conjunto de todos los posibles elementos que intervienen en un experimento o en un estudio. La hay de dos tipos

Poblacin finita. Es aquella que indica que es posible alcanzarse o sobrepasarse al contar. Es aquella que posee o incluye un nmero
limitado de medidas y observaciones.
Poblacin infinita. Es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el conteo. Son
poblaciones infinitas porque hipotticamente no existe lmite en cuanto al nmero de observaciones que cada uno de ellos puede generar.

Muestra. Un conjunto de medidas u observaciones tomadas a partir de una poblacin dada. Es un subconjunto de la poblacin.

Muestra representativa. Un subconjunto representativo seleccionado de una poblacin de la cual se obtuvo.

Muestreo. Al estudio de la muestra representativa.

Censo. Al estudio completo de la poblacin.

Parmetro. Lo constituyen las caractersticas medibles en una poblacin completa. Se le asigna un smbolo representado por una letra
griega.

Estadstico o estadgrafo. Es la medida de una caracterstica relativa a una muestra. La mayora de los estadsticos muestrales se encuentran
por medio de una frmula y suelen asignrseles nombres simblicos que son letras latinas.

Datos estadsticos (Variables). Los datos son agrupaciones de cualquier nmero de observaciones relacionadas. Para que se considere un
dato estadstico debe tener 2 caractersticas: a) Que sean comparables entre s. b) Que tengan alguna relacin.

Variable. Una caracterstica que asume valores.

Clases de datos

Variable cuantitativa o escalar. Ser una variable cuando pueda asumir sus resultados en medidas numricas.
Variable cuantitativa discreta. Es aquella que puede asumir slo ciertos valores, nmeros enteros. Ejemplo: El nmero de estudiantes
(1,2,3,4)
Variable cuantitativa continua. Es aquella que tericamente puede tomar cualquier valor en una escala de medidas, ya sea entero o
fraccionario. Ejemplo, Estatura: 1.90 m
Variables cualitativas nominales. Cuando no es posible hacer medidas numricas, son susceptibles de clasificacin. Ejemplo: Color de autos:
rojo, verde, azul.

Experimento. Es una actividad planificada, cuyos resultados producen un conjunto de datos. Es el proceso mediante el cual una
observacin o medicin es registrada. Ejemplo: Cul ser la preferencia del consumidor ante dos marcas de refresco con similares
caractersticas en un ambiente armnico y sin publicidad?
INFERENCIA

Si queremos conocer a fondo el origen etimolgico del trmino inferencia, tenemos que proceder a trasladarnos hasta el latn.
All encontraremos como aquel es el resultado de la suma de tres partes claramente identificables: el prefijo in-, que puede
traducirse como hacia; el verbo ferre, que puede establecerse como sinnimo de llevar, y finalmente el sufijo ia, que es
equivalente a accin o cualidad.

Inferencia

Inferencia es la accin y efecto de inferir (deducir algo, sacar una consecuencia de otra cosa, conducir a un resultado). La
inferencia surge a partir de una evaluacin mental entre distintas expresiones que, al ser relacionadas como abstracciones,
permiten trazar una implicacin lgica. Al partir de hiptesis o argumentos, es posible inferir una conclusin (que puede resultar
verdadera o falsa). Por ejemplo: Todava no recib la confirmacin oficial por parte de la empresa, lo que te digo es slo una
inferencia ma, Cada vez que juega la seleccin, Mariana falta al trabajo: mi inferencia es que maana vamos a estar solos en la
oficina, No podemos guiarnos por inferencias, sino que tenemos que aguardar a que los sucesos se confirmen antes de tomar
una decisin.

Es importante, adems de todo lo expuesto, establecer que existen diversos tipos de inferencias muy significativas:

Inferencia estadstica. Es aquella que se convierte en protagonista dentro del mbito de la administracin y la gestin. En su
caso, se sustenta en dos pilares fundamentales para poder desarrollarse: lo que sera el contrastar diversas hiptesis y tambin la
estimacin.

Inferencia del comportamiento. Como su propio nombre indica es la que se encarga de analizar a fondo las formas de
comportarse del ser humano en general. Para conseguirlo se tienen en cuenta factores tales como el grado de inteligencia o lo
que sera la empata. Adems de estas dos modalidades, hay que subrayar que a nivel general, la inferencia se clasifica en cinco
grandes grupos:

La trivaluada, que es la que ofrece tres valores como resultados.

La lgica, que es la que nicamente permite establecer un resultado verdadero o falso.

La probabilstica, que viene a determinar que una verdad tiene mayores probabilidades de serlo que otras.

La multivaluada, que se identifica por el hecho de que ofrece como resultado una serie amplia de valores.

La difusa. Esta ltima clase de inferencia podemos determinar que es la que se encarga de analizar todos los resultados con
una gran precisin.

El silogismo es una forma esencial de inferencia. Se trata de una forma de razonamiento deductivo que se forma por dos
proposiciones (premisas) y una conclusin. Esta conclusin es la inferencia que necesariamente se deduce de las dos premisas.

La veracidad de la conclusin depender de las leyes que regulan la relacin entre las premisas comparadas. La garanta de
verdad del nuevo juicio es la lgica, que deber establecer distintas clasificaciones de las premisas.

No todas las inferencias ofrecen conclusiones verdaderas. Es posible afirmar que todos los perros son animales peludos de
cuatro patas, pero no se puede inferir que todos los animales peludos con cuatro patas son perros.

Las inferencias suelen generarse a partir de un anlisis de caractersticas y probabilidades. Si alguien hace referencia a un animal
de cuatro patas, peludo y que mueve la cola, puedo inferir que lo ms probable es que est haciendo referencia a un perro.
ESTADISTICA INFERENCIAL

La Estadstica inferencial o Inferencia estadstica estudia cmo sacar conclusiones generales para toda la

poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados

obtenidos.

Muestreo probabilstico

Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo:

Muestreo aleatorio simple

Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los n elementos
que contiene la muestra.

Muestreo aleatorio sistemtico

Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la
muestra.

Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25
e l e m e n t o s , e n p r i m e r l u g a r d e b e m o s e s t a b l e c e r e l i n t e r v a l o d e s e l e c c i n q u e s e r i g u a l a 1 0 0 /2 5 = 4 . A
continuacin elegimos el elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a partir
de l obtenemos los restantes elementos de la muestra

2, 6, 10, 14,..., 98

Muestreo aleatorio estratificado

Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada


estrato proporcional al nmero de componentes de cada estrato.

En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200
trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.
Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita.

En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin.

Si consideremos todas las posibles muestras de tamao n en una poblacin, para cada muestra podemos

calcular un estadstico (media, desviacin tpica, proporcin, ...) que variar de una a otra.

As obtenemos una distribucin del estadstico qu e se llama distribucin muestral .

Teorema central del lmite

Si una poblacin tiene media y desviacin tpica , y tomamos muestras de tamao n (n>30, cualquier

tamao si la poblacin es "normal"), las medias de estas muestras siguen aproximadamente la distribucin:

Estimacin de parmetros

Es el procedimiento utilizado para conocer las caractersticas de un parmetro poblacional, a partir del

conocimiento de la muestra.

Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de un parmetro de

la poblacin; pero tambin necesitamos precisar un:


Intervalo de confianza
Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico.

Nivel de confianza
Probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza.
E l n i v e l d e c o n f i a n z a ( p ) se d e s i g n a m e d i a n t e 1 .

Error de estimacin admisible


Que estar relacionado con el radio del intervalo de confianza.

Estimacin de la media de una poblacin

El intervalo de confianza , para la media de una poblacin, con un nivel de confianza de 1 , siendo x la
media de una muestra de tamao n y la desviaci n tpica de la poblacin, es:

El error mximo de estimacin es:

Cuanto mayor sea el tamao de la muestra, n, menor es el error .

Cuanto mayor sea el nivel de confianza , 1-, mayor es el error .

Tamao de la muestra

Si aumentamos el nivel de confianza , aumenta el tamao de la muestra .

Si disminuimos el error , tenemos que aumentar el tamao de la muestra .


El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con

media desconocida y desviacin tpica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un

tiempo medio de 5,2 minutos.

1.Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los

clientes.

2.Indica el tamao muestral necesario para estimar dicho tiempo medio con un el error de 0,5 minutos y

un nivel de confianza del 95%.

n 4

Estimacin de una proporcin

Si en una poblacin, una determinada caracterstica se presenta en una proporcin p, la proporcin p' , de
individuos con dicha caracterstica en las muestras de tamao n, se distribuirn segn:
Intervalo de confianza para una proporcin

El error mximo de estimacin es:

En una fbrica de componentes electrnicos, la proporcin de componentes finales defectuosos era del 20%.

Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analiz una muestra

aleatoria de 500 componentes, encontrndose que 90 de ellos eran defectuosos. Qu nivel de confianza debe

adoptarse para aceptar que el rendimi ento no ha sufrido variaciones?

p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02


P (1 - z/2 <1.12) = 0.86861 - 0.8686 = 0.1314

0.8686 - 0.1314 = 0.737

Nivel de confianza: 73.72%

Contraste de hiptesis

Hiptesis estadsticas

Un test estadstico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer

conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el valor de un parmetro

desconocido de una poblacin.

La hiptesis em itida se designa por H0 y se llama hiptesis nula.

La hiptesis contraria se designa por H1 y se llama hiptesis alternativa.

Contrastes de hiptesis

1. Enunciar la hiptesis nula H 0 y la alternativa H1.


Bilateral H0=k H1 k

H0 k H1 < k

Unilateral

H0 k H1> k

2. A partir de un nivel de confianza 1 o el de significacin . Determinar:

El valor z/2 (bilaterales), o bien z (unilaterales)

La zona de aceptacin del parmetro muestral (x o p').

3. Calcular: x o p', a partir de la muestra.

4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis con un

nivel de significacin . Si no, se rechaza .

Contraste bilateral

Se presenta cuando la hiptesis nula es del tipo H0: = k (o bien H0: p = k) y la hiptesis alternativa, por tanto,

es del tipo H1: k (o bien H1: p k).


El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media.

L a r e g i n d e a c e p t a c i n en e s t e c a s o n o e s m s q u e e l c o r r e s p o n d i e n t e i n t e r v a l o d e p r o b a b i l i d a d p a r a x o

p', es decir:

o bien:

Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para una muestra de

36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota

media del examen fue de 6, con un nivel de confianza del 95%?

1. Enunciamos las hiptesis nula y alternativa:


H0 : = 6 La nota media no ha variado.

H1 : 6 La nota media ha variado.

2. Zona de aceptacin

Para = 0.05, le corresponde un valor crtico: z/2 = 1.96 .

Determinamos el intervalo de confianza para la media:

(6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78)

3. Verificacin.

Valor obtenido de la media de la muestra: 5,6 .

4. Decisin

Aceptamos la hiptesis nula H 0, con un nivel de significacin del 5%.

Contraste unilateral

Caso 1

La hiptesis nula es del tipo H0: k (o bien H0: p k).

L a h i p t e s i s a l t e r n a t i v a , po r t a n t o , e s d e l t i p o H 1 : < k ( o b i e n H 1 : p < k ) .
Valores crticos

1 z

0.90 0.10 1.28

0.95 0.05 1.645

0.99 0.01 2.33

El nivel de significacin se concentra en una parte o cola.

La regin de aceptacin en este caso ser:


o bien:

Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las prximas

elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a

voto, 75 de los cuales estaran dispuestos a votar. Determinar con un nivel de significacin del 1%, si se puede

admitir el pronstico.

1. Enunciamos las hiptesis nula y alternativa:

H0 : 0.40 La abstencin ser como mnimo del 40%.

H1 : < 0.40 La abstencin ser como mximo del 40%;

2. Zona de aceptacin

Para = 0.01, le corresponde un valor crtico: z = 2.33 .

Determinamos el intervalo de confianza para la media:

3.Verificacin.
4.Decisin

Aceptamos la hiptesis nula H0. Podemos afirmar, con un nivel de significacin del 1%, que la La abstencin

ser como mnimo del 40%.

Caso 2

La hiptesis nula es del tipo H0: k (o bien H0: p k).

La hiptesis alternativa, por tanto, es del tipo H1: > k (o bien H1: p > k).

El nivel de significacin se concentra en la otra parte o cola.

La regin de aceptacin en este caso ser:


o bien:

U n i n f o r m e i n d i c a q u e e l p r e c i o m e d i o d e l b i l l e t e d e a v i n e n t r e C a n a r i a s y Ma d r i d e s , c o m o m x i m o , d e 1 2 0

con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y se obtiene que la media de los

precios de sus billetes es de 128 .

Se puede aceptar, con un nive l de significacin igual a 0,1, la afirmacin de partida?

1. Enunciamos las hiptesis nula y alternativa:

H0 : 120

H1 : > 120

2.Zona de aceptacin

Para = 0.1, le corresponde un valor crtico: z = 1.28 .

Determinamos el intervalo de confianza:


3. Verificacin.

Valor obtenido de la media de la muestra: 128 .

4. Decisin

No aceptamos la hiptesis nula H0. Con un nivel de significacin del 10%.

Errores de tipo I y tipo II

Error de tipo I . Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se

rechaza.

Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste se acepta.

H0 Verdadera Falsa

Decisn correcta Decisin incorrecta:


Aceptar
Probabilidad = 1 ERROR DE TIPO II
ERROR DE TIPO I
Rechazar
Decisin correcta
Probabilidad =

La probabilidad de cometer Error de tipo I es el nivel de significacin .

La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace tanto

menor cuanto mayor sea n .

Definicin de Estadstica Inferencial

De acuerdo con el diccionario de la Real Academia Espaola, inferir significa "sacar una consecuencia o deducir algo de
otra cosa".

El principal objetivo de la Estadstica consiste en poder decir algo con respecto a un gran conjunto de personas, mediciones u
otros entes (poblacin) con base en las observaciones hechas sobre slo una parte (muestra) de dicho gran conjunto. La
capacidad para "decir algo" sobre poblaciones con base en muestras est basada en supuestos con respecto a algn modelo
de probabilidad que permite explicar las caractersticas del fenmeno bajo observacin.

Al conjunto de procedimientos estadsticos en los que interviene la aplicacin de modelos de probabilidad y mediante los
cuales se realiza alguna afirmacin sobre poblaciones con base en la informacin producida por muestras se le llama
Inferencia Estadstica o Estadstica Inferencial.

Estudio de la estadstica inferencial

Toma de muestras o muestreo, que se refiere a la forma adecuada de considerar una muestra que permita obtener
conclusiones estadsticamente vlidas y significativas.

Estimacin de parmetros o variables estadsticas, que permite estimar valores poblacionales a partir de muestras de
mucho menor tamao.
Contraste de hiptesis, que permite decidir si dos muestras son estadsticamente diferentes, si un determinado
procedimiento tiene un efecto estadstico significativo, etc.
Diseo experimental
Inferencia bayesiana.
Mtodos no paramtricos.

Mtodo
Planteamiento del problema: un problema de inferencia estadstica suele iniciarse con una fijacin de objetivos o algunas
preguntas del tipo:
Cul ser la media de esta poblacin respecto a tal caracterstica?
Se parecen estas dos poblaciones?
Hay alguna relacin entre...?
En el planteamiento se definen con precisin la poblacin, la caracterstica a estudiar, las variables, etc.

Elaboracin de un modelo: en caso de establecer un modelo terico, se replantea el procedimiento y se llega a una
conclusin lgica. Los posibles modelos son distribuciones de probabilidad.

Extraccin de la muestra: se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una
pequea parte de la poblacin.

Tratamiento de los datos: en esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan
los valores que sern necesarios en pasos posteriores, como la media muestral, la varianza muestral.
Los mtodos de esta etapa estn definidos por la estadstica descriptiva.

Estimacin de los parmetros: con determinadas tcnicas se realiza una prediccin sobre cules podran ser los parmetros
de la poblacin.

Contraste de hiptesis: los contrastes de hiptesis son tcnicas que permiten simplificar el modelo matemtico bajo anlisis.
Frecuentemente el contraste de hiptesis recurre al uso de estadsticos muestrales.
Artculo principal: Contraste de hiptesis

Conclusiones: se critica el modelo y se hace un balance. Las conclusiones obtenidas en este punto pueden servir para
tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cclico que permite conocer cada vez mejor
la poblacin y caractersticas de estudio.