You are on page 1of 61

REPBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA DEFENSA UNIVERSIDAD NACIONAL EXPERIMENTAL POLITCNICA DE LA FUERZA ARMADA

NCLEO YARACUY EXTENSIN NIRGUA

En una poblacin cuya distribucin es conocida pero desconocemos algn

parmetro, podemos estimar dicho parmetro a partir de una muestra


representativa. Un estimador es un valor que puede calcularse a partir de los datos mustrales y que proporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la poblacin.

Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los estimadores ms probables en este caso son los estadsticos obtenidos en la muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribucin muestral indica la distribucin de los valores que tomar el estimador al seleccionar distintas muestras de la poblacin.

Estimaciones de intervalo: El propsito de tomar muestras es para conocer ms acerca de una poblacin. Podemos calcular esa informacin a partir de las muestras como estimaciones puntuales, o como estimaciones de intervalo. Una estimacin de intervalo describe un intervalo de valores dentro del cual es posible que est un parmetro de poblacin. Si seleccionamos y representamos grficamente un gran nmero de medias de muestras de una poblacin, la distribucin de tales medias se aproximar a la curva normal. Adems, la media de las medias de muestra ser la misma media de la poblacin.

Estimador Insesgado: Sea un estimador puntual de un parmetro . Entonces es insesgado de si de lo contrario se dice que es sesgado. En palabras, un estimador insesgado es aquel cuya media o valor esperado de la distribucin de las estimaciones es igual al parmetro estimado.

Estimador Eficiente: Si se consideran todos los estimadores insesgados posibles de algn parmetro aquel con la varianza ms pequea recibe el nombre de estimador mas eficiente de Bsicamente, al comparar la eficiencia relativa entre dos estimadores y se presenta la siguiente razn:

La idea fundamental de este mtodo es tomar como estimacin del parmetro estudiado el valor que haga mxima la probabilidad de obtener la muestra observada. Ejemplo: para todos los posibles valores de p, es decir, para todo valor real entre 0 y 1. Es lo que se muestra en la siguiente tabla, en la que se han simplificado los posibles valores de p tomando incrementos de 0,1:

Para ilustrar este mtodo, imaginemos la siguiente situacin: queremos estimar la probabilidad p de que salga cara en el lanzamiento de una moneda no necesariamente regular. Para ello procedemos de la siguiente manera: lanzamos la moneda cinco veces y obtenemos la siguiente secuencia: C+CC+ Una manera aparentemente razonable de estimar p sera evaluar la probabilidad de obtener esta muestra para diferentes valores de p y quedarnos con el valor que haga mxima dicha probabilidad. En nuestro caso, debemos calcular:

Mnimos cuadrados es una tcnica de anlisis numrico enmarcada dentro de la optimizacin matemtica, en la que, dados un conjunto de pares ordenados: variable independiente, variable dependiente, y una familia de funciones, se intenta encontrar la funcin continua, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo error cuadrtico.

Desde un punto de vista estadstico, un requisito implcito para que funcione el mtodo de mnimos cuadrados es que los errores de cada medida estn distribuidos de forma aleatoria. El teorema de Gauss-Mrkov prueba que los estimadores mnimos cuadrticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribucin normal. Tambin es importante que los datos a procesar estn bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar ms peso a un dato en particular, La tcnica de mnimos cuadrados se usa comnmente en el ajuste de curvas. Muchos otros problemas de optimizacin pueden expresarse tambin en forma de mnimos cuadrados, minimizando la energa o maximizando la entropa.

En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias en las ordenadas (llamadas residuos) entre los puntos generados por la funcin elegida y los correspondientes valores en los datos. Especficamente, se llama mnimos cuadrados promedio (LMS) cuando el nmero de datos medidos es 1 y se usa el mtodo de descenso por gradiente para minimizar el residuo cuadrado. Se puede demostrar que LMS minimiza el residuo cuadrado esperado, con el mnimo de operaciones (por iteracin), pero requiere un gran nmero de iteraciones para converger.

Se llama correlacin a la teora que trata de estudiar la dependencia que existe entre 2 variables que intervienen en una distribucin BIDIMENSIONAL. LA CORRELACIN PUEDE SER LINEAL, O CURVILNEA, SEGN que el diagrama de puntos se concentre en torno a una recta, o entorno a una curva

LA CORRELACIN ES FUNCIONAL, si existe una cierta funcin que satisface todos los valores de la distribucin.

La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

Tambin conocido como diagrama de correlacin-dispersin o correlacin lineal, la ley de correlacin no es ms que una herramienta que permite tener una idea de la relacin que puede existir entre dos datos diferentes. Para poder ver qu relacin existe entre dos datos diferentes se utiliza una grfica cartesiana donde se permita introducir la intercepcin de los datos, de esta manera ver la relacin entre ellos, debido a la variedad que existen en los datos, existen variedades de correlaciones, entre ellas se pueden mencionar:

Las MAN normalmente estn basadas en estndares SONET/SDH o WDM, que son estndares de transporte por fibra ptica.
conecta diversas LAN cercanas geogrficamente (en un rea de alrededor de cincuenta kilmetros) entre s a alta velocidad una MAN permite que dos nodos remotos se comuniquen como si fueran parte de la misma red de rea local

Son redes que se extienden sobre un rea geogrfica extensa. Contiene una coleccin de mquinas dedicadas a ejecutar los programas de usuarios (hosts). Estos estn conectados por la red que lleva los mensajes de un host a otro. Por lo general, la red WAN funciona punto a punto, por lo que puede definirse como una red de paquete conmutado. Estas redes, por otra parte, pueden utilizar sistemas de comunicacin de radio o satelitales.

La Direccin de una mina est preocupada por el alto porcentaje de indisponibilidad de sus mquinas cargadoras. Encarga al Jefe de Mantenimiento que analice si est influyendo la antigedad de dichas maquinas en su porcentaje de indisponibilidad. Para ello, recoge la informacin de la fecha de compra y del porcentaje de indisponibilidad de cada mquina y la traslada a la siguiente tabla:

Maquina C-0037 C-0038 C-0039 C-0040 C-0041 C-0042 C-0043 C-0044 C-0045 C-0046 C-0047 C-0048 C-0049 C-0050 C-0051 C-0052

Fecha de Compra 1994 1994 1995 1995 1995 1996 1996 1996 1997 1997 1998 1998 1999 1999 2000 2000

% de Indisponibilidad 29 39 24 32 43 20 41 30 20 25 12 19 10 30 9 14

En estadstica, se llama a un par o varios pares de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1- y se denomina nivel de confianza. En estas circunstancias, es el llamado error aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de error.

Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar, 2 . Es habitual que el parmetro presente una distribucin normal. Tambin pueden construirse intervalos de confianza con la desigualdad de Chebyshev. En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro poblacional que sigue una determinada distribucin de probabilidad, es una expresin del tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin de probabilidad de .

Las lneas verticales representan 50 construcciones diferentes de intervalos de confianza para la estimacin del valor .

En probabilidad y estadstica, la distribucin-t o distribucin t de Student es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.

A la teora de pequeas muestras tambin se le l ama teora exacta del muestreo, ya que tambin la podemos utilizar con muestras aleatorias de tamao grande.

Una variable aleatoria se distribuye segn el modelo de probabilidad t o T de Student con k grados de libertad, donde k es un entero positivo, si su funcin de densidad es la siguiente:

La grfica de esta funcin de densidad es simtrica, respecto del eje de ordenadas, con independencia del valor de k, y de forma algo semejante a la de una distribucin normal:

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribucin t tiene colas ms amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar.

1. 2.

Cada curva t tiene forma de campana con centro en 0.

Cada curva t, est ms dispersa que la curva normal estndar.

3. A medida que k aumenta, la dispersin de la curva t correspondiente disminuye. 4. A medida que k la curva normal estndar , la secuencia de curvas t se aproxima a

En estadstica, la distribucin (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribucin de probabilidad continua con un parmetro k que representa los grados de libertad de la variable aleatoria donde Zi son variables aleatorias normales independientes de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as:

Es conveniente tener en cuenta que la letra griega se transcribe al latn como chi y se pronuncia en castellano como ji.

Las distribucin Chi cuadrado, se derivan de la 2 relacionadas con la distribucin Normal y estn teora del muestreo pequeo n< 30. Son muy importantes pues son la base de metodologas inferenciales, tales como Intervalos de Confianza y Pruebas de Hiptesis.

En otros estudios se les define como la suma de diferencias cuadrticas relativas entre valores experimentales (observados) y valores tericos (esperados).

Definicin: Sea k variables aleatorias normales e independientes, cada una con media 0 y desviacin tpica 1. entonces, la variable aleatoria

Se llama la variable aleatoria chi cuadrado con k grados de libertad.

DEFINICIN DE LOS TRMINOS


Frmula de Chi Cuadrado = Nivel de Significancia:
2

2 ( f f ) o e

fe

En estadstica, un resultado se denomina estadsticamente significativo cuando no es probable que haya sido debido al azar. Son comunes los niveles de significancia del 0,05, 0,01 y 0,1. En algunas situaciones es conveniente expresar la significancia estadstica como percentil 1 . Este valor hace referencia al nivel de confianza que deseamos que tengan los clculos de la prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de la confianza.

Hiptesis:
Si un contraste de hiptesis proporciona un valor P inferior a , la hiptesis nula es rechazada, siendo tal resultado denominado estadsticamente significativo. Cuanto menor sea el nivel de significancia, ms fuerte ser la evidencia de que un hecho no se debe a una mera coincidencia (al azar).

Grados de Libertad: GL=k-1


En estadstica, grados de libertad es un estimador del nmero de categoras independientes en una prueba particular o experimento estadstico. Se encuentran mediante la frmula n r, donde n=nmero de sujetos en la muestra, tambin pueden ser representados por k r,
k=nmero de grupos, cuando se realizan operaciones con grupos y no con sujetos individuales r=nmero de sujetos o grupos estadsticamente dependientes

CHI CUADRADO CRTICO

PARA QUE UTILIZAMOS UNA PRUEBA DE CHI CUADRADO?


Para determinar si la muestra se ajusta o no se ajusta a una distribucin terica. Para saber si la(s) poblacione(s) son homognea(s) o no.
Para determinar la dependencia e independencia la(s) variable(s) a analizar.

APLICACIONES DE CHI CUADRADO


Prueba de Chi Cuadrado

Dos Variables

Una Variable

Prueba de Homogeneidad

Prueba de Independencia

Prueba de Bondad de Ajuste

Se utiliza para la comparacin de la distribucin de una muestra con alguna distribucin terica que se supone describe a la poblacin de la cual se extrajo. Ho : La variable tiene comportamiento normal se distribuye de manera uniforme

H1 : La variable no tiene comportamiento normal, no se distribuye de manera uniforme.

( f

fe )

fe

EJEMPLO 1:
Un gerente de ventas que tiene su mercado dividido en cuatro zonas le indica a sus vendedores que las zonas tienen el mismo potencial de ventas. Ante la duda de los vendedores sobre el potencial de sus zonas el gerente hace el siguiente procedimiento :Se extrae una muestra de los archivos de la empresa de 40 ventas realizadas el ao pasado y encuentra que el numero de ventas por zona son: zona 1 = 6, Zona 2 = 12, Zona 3 = 14 y zona 4 = 8 . En vista de esos resultados se realiza una prueba de bondad de ajuste.

SOLUCIN:
Planteamiento de Hiptesis H0 : las ventas estn igualmente distribuidas. H1: las ventas no estn igualmente distribuidas Nivel de Significancia = 5% = 0.05 Clculos GL= k-1 = 4-1 = 3
2

El critico = 7.81 (Segn Tabla)

CHI CUADRADO CRTICO

SOLUCIN:
2 Elaborar la tabla de f o y f e y calcular el

ZONAS
A
Frecuencia observada (fo) Frecuencia esperada (fe) Ch

B
12 10 0.4
2

C
14 10 1.6
2 Los individuales

D
8 10 0.4 40 40 4

6 10 1.6

( fo fe )
fe

se calculan con la formula; y luego se suman:

2 Este valor es el observado = 4

LA DECISIN:

2 2 Como: observado < Critico 2 2 observado (4) < critico (7.81)

Si se Cumple

entonces, no rechazamos Ho. Es decir que la Ho de que las ventas se encuentran igualmente distribuidas en las cuatro zonas no se puede rechazar para un nivel de significancia de 5%.

Se usa para analizar la frecuencia de dos variables con categoras mltiples para determinar si las dos variables son independientes o no.

Hiptesis nula (H0) : Las variables X e Y son independientes, ( X e Y no estn relacionadas)


Hiptesis alternativa (H1): Las variables X e Y no son independientes, (X e Y estn relacionadas)

2 ( F 1)(C 1)
i 1 j 1

(Oij Eij ) 2 Eij

TABLAS DE CONTINGENCIAS
fe suma ( fila ) suma (columna) (total)

Grados de libertad GL= (m-1)(n-1) Calculo de frecuencia esperado. Una Tabla de contingencia con r filas y c columnas tiene la siguiente forma:

Los datos de variables cualitativa o categricas representan atributos o categoras y se organizan en tablas llamadas tablas de contingencia o tablas de clasificacin cruzada.

Donde:
Oi j : es el nmero de sujetos que tienen las caractersticas Ai y Bj a la vez. Ri : (i = 1,,r) es la suma de la i-sima fila de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Ai.

Cj :(j = 1,,c) es la suma de la j-sima columna de la tabla. Es decir, es el total de sujetos que poseen la caracterstica Bj.
n : representa el total de observaciones tomadas.

2 ( F 1)(C 1)
i 1 j 1

(Oij Eij ) 2 Eij