Sie sind auf Seite 1von 71

Estadstica Inferencial

Comprobacin de Hiptesis

Seleccin de una prueba


3. 1. Existen Estamos Cuntas variables tratando una estamos 5. circunstancias

muestra observando representativa en considerar? la prueba? de peculiares para una poblacin o ms?
2. 4.

Cuales los niveles Cul es son el tamao de lade medicin decuntos las variables? muestra y/o grados de libertad esta dsiponibles?

Variables
Fenmeno

medible que vara (cambia) a travs del tiempo, o que difiere de un lugar a otro o de un individuo a otro

Variable dependiente
Aquella

cuya variacin queremos explicar y saber qu provoca un incremento o disminucin en la cantidad de la misma

Variable independiente
Estn

relacionadas y predicen la variacin en la variable dependiente

Relaciones entre variables

Vi CORRELACIN: CAUSA
cambio en una variable PREDICTOR

Vd Cambio EFECTO
asociado en otra variable RESULTADO

INTERVENCION (accin tomada)

RESULTADO

HIPTESIS
Es

una prediccin sobre la relacin entre dos variables; en ella se afirma que los cambios en medida de una variable independiente corresponder a cambios en la medida de una variable dependiente

La investigacin
El

proceso de investigacin implica organizar ideas en una teora, realizar predicciones empricas que apoyen la teora, y, entonces, reunir datos probatorios de tales predicciones

ERROR ESTADSTICO
Grados

conocidos de imprecisin en los procedimientos utilizados para reunir y procesar informacin; pueden ser:

ERROR DE MUESTREO
Representa

la inexactitud en las predicciones sobre un poblacin, que resulta del hecho de que no observamos a todos los sujetos en la poblacin.

ERROR DE MEDICIN
Es

la inexactitud en la investigacin que se deriva de los instrumentos de medicin imprecisos, de las dificultades en la clasificacin de las observaciones y de la necesidad de redondear nmeros

MUESTRA REPRESENTATIVA
Es

aquella en la que todos los segmentos de la poblacin estn incluidos en la proporciones que guardan en ella

NIVELES DE MEDICION
Identifica

la propiedades de medicin de la variable, y determina el tipo de operaciones matemticas que pueden usarse apropiadamente con dicho nivel, as como las frmulas estadsticas para probar la hiptesis.

Variables nominales
Son

aquellas donde los cdigos slo indican una diferencia en categora, clase, calidad o tipo

GENERO ESTADO CIVIL

VARIABLES ORDINALES

Designan categoras, pero tiene la propiedad adicional de permitir clasificarlas de mayor a menor, de la mejor a la peor
En total desacuerdo En desacuerdo De acuerdo

Esta de acuerdo con la pena de muerte

Totalmente de acuerdo

VARIABLES DE INTERVALO

Designan categoras y adems una unidad numrica de medicin definida

Cuantos aos tienes?

VRIABLES DE RAZN

Son aquellas que se asigna un valor numrico pero se pueden expresar mediante una razn

EL PESO
Te supero 4/1 en masa corporal

OPERACIN CON VARIABLES

Presentacin de datos

La presentaciones grficas deben de cumplir con alguna reglas:

1. 2. 3.

Elija el diseo con base Tiene que ser clara y en: a) el nivel de medicin; Explicarse por si mismo, si entendible; simplificar no b) los objetivos del estudio hacer referencia a ningn complicar. y c) a quien se dirige texto.

Grficos de pastel
Es

un estilo simple para presentacin de datos nominales. Cada rebana representa la frecuencia proporcional de determinada categora.

GRFICOS DE BARRAS
Son

eficaces para ilustrar competencias entre categoras de variables nominales y ordinales

HISTOGRAMA
Presenta

las puntuaciones de una variable de intervalo o razn a lo largo del eje horizontal y la frecuencia de cada puntuacin en forma vertical

POLGONO DE FRECUENCIA
Para

variables de intervalo o razn especialmente tiles para compara dos muestras

OJIVAS
Es

un polgono de frecuencias porcentuales acumuladas; indican que porcentajes de la muestran estn por debajo o encima de un valor X

DISTORSIN GRFICA
Es

una manera de hacer ms grandes pequeas diferencias entre variables

La distribucin normal
Al

iniciar el anlisis estadstico de una serie de datos, y despus de la etapa de deteccin y correccin de errores, un primer paso consiste en describir la distribucin de las variables estudiadas y, en particular, de los datos numricos.

Para

describir un conjunto de datos, adems de la tabulacin y la representacin grfica , se utilizan valores numricos de funciones de la variable llamadas medidas de resumen. Las medidas de resumen aportan la informacin acerca de valores centrales, la dispersin y la forma de la distribucin

Aquellas medidas de resumen utilizadas para describir valores centrales se llaman Medidas de tendencia central Media Mediana Moda

MEDIA ARITMTICA

Es la ms utilizada, por su facilidad de clculo, en muestras grandes es estable, fcil de entender y es de fcil uso en clculos posteriores

* Datos numricos *distribuciones simtricas

MEDIANA (Me)

Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

MODA (Mo)
Es

el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.

LA DISPERSIN

Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Se distingue entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.

MEDIDAS DE DISPERSIN ABSOLUTAS

VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones.

DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza

RECORRIDO

O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = Xmax - Xmin

MEDIDAS DE DISPERSIN RELATIVAS

OEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica

Distribucin normal

Tambin llamada distribucin gaussiana; Su importancia se debe fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y cotidianos siguen, aproximadamente, esta distribucin.

La distribucin normal posee ciertas propiedades importantes que conviene destacar: 1.Tiene una nica moda, que coincide con su media y su mediana. 2.Es simtrica con respecto a su media

El tamao de la Muestra

Entre ms grande la muestra la curva tiende a ser normal: la moda, mediana y media tienen el mismo valor

ASIMETRA

Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coinciden. Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden ms lentamente por la derecha que por la izquierda. Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin es asimtrica a la izquierda.

MEDIDA DE APUNTAMIENTO O CURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones segn su grado de curtosis:

mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

DESVIACIN TPICA
6 12

En ambos casos la media es 8.5 aos


48 36 24 12 00 55 66 77 88 99 10 10 11 11 12 12 13 13 14 14 EDAD EN AOS EDAD EN AOS

FRECUENCIA

5 10

En ambos casos el rango es el mismo


20 20 25 25 30 30 40 40 45 45 50 50 55 55 EDADEN ENAOS AOS EDAD

10 7 9 6 8 5 7 6 4 5 3 4 3 2 2 1 1 0 0

FRECUENCIA FRECUENCIA

DESVIACION ESTANDAR

La

desviacin tpica es grande, el intervalo de incertidumbre de la medida es grande, la precisin es dbil

La

desviacin tpica es pequea, el intervalo de incertidumbre de la medida es pequea, la precisin es grande

INFERENCIA ESTADSTICA
Es

el proceso a travs del cual se extraen conclusiones relativas a una poblacin a partir de una muestra .

Segn la finalidad de la Inferencia Estadstica se puede dividir en :

TEORA DE LA VERIFICACIN DE HIPTESIS TEORA DE LA ESTIMACIN

COMPROBACION DE HIPTESIS

Las hiptesis estadsticas son suposiciones que se hacen acerca de los parmetros de las poblaciones. Se conocen dos tipos de hiptesis, las nulas o planteadas y las alternativas. La suposicin que se hace del parmetro antes de realizar el experimento se conoce como Hiptesis planteada o nula y generalmente se representa como Hp o H0.

Las

pruebas de hiptesis se hacen para la hiptesis nula (es decir, es sta la que se acepta o se rechaza con la prueba de hiptesis) y pueden ser de una o de dos colas.

Es

interesante tener en cuenta que la veracidad de una hiptesis no puede ser probada nunca Lo que se puede hacer es afirmar que tiene tal o cual probabilidad de ser falsa

La

verificacin de hiptesis es el proceso que lleva a juzgar la credibilidad de afirmaciones (hiptesis) relativas a las poblaciones (habitualmente a sus parmetros) de las que fueron extradas las muestras

Prueba de dos colas


Se

debe realizar cuando al estudiar el promedio de una caracterstica o tratamiento se desea saber si dicho promedio es menor o mayor que una cantidad dada

Prueba de una cola


se

debe emplear cuando al estudiar el promedio de una caracterstica o tratamiento, se sabe de antemano que una de las hiptesis alternativas se puede descartar

Decisin sobre la direccin de una prueba


1.

De una cola en direccin positiva: El contenido de la pregunta de investigacin incluye trminos como mayor que, ms, incremento, ms rpido, ms pesado y ganancia

2.

De una cola en direccin negativa: El contenido de la pregunta de investigacin incluye trminos como menor que, menos, disminucin, ms lento, prdida.

3.

De dos colas no direccional: El contenido de la pregunta de investigacin no incluye ninguna de las declaraciones anteriores o simplemente afirma desigualdad

TIPOS DE ERRORES

Se pueden cometer dos tipos de errores en la verificacin de hiptesis:


1.

2.

ERROR TIPO I : RECHAZAR LA Ho SIENDO CIERTA ERROR TIPO II : ACEPTAR LA Ho SIENDO FALSA

NIVEL DE CONFIANZA
Grado

de confianza calculado de que un procedimiento estadstico realizado con los datos de la muestra producir un resultado correcto en la poblacin muestreada

Al

calcula el nivel de confianza usamos la letra alfa a y decimos: Nivel de confianza = 100 a Para aceptar un hipotesis se debe de tener un nivel de confianza de 95%

Dos muestras dependientes.

Cuando se trata de comparar dos grupos de observaciones, es importante distinguir el caso en el que son independientes de aquel en el que los datos estn apareados. Las series dependientes surgen normalmente cuando se evala un mismo dato ms de una vez en cada sujeto de la muestra.

Comparacin de dos poblaciones normales


a) Poblaciones normales con igual varianza y medias distintas

b) Poblaciones normales con igual y diferentes varianzas.

Regiones de aceptacin y rechazo en el contraste de hiptesis

t-Student
Se

muestra lo diferentes valores de la reas con 15 grados de libertad

Das könnte Ihnen auch gefallen