Sie sind auf Seite 1von 46

Resumen del libro de estadsticas de Berenson y Levine

Indice 1. Resumen Captulo 1 del Libro 2. Resumen Captulo 2 del Libro 3. Resumen Captulo 3 del Libro 4. Resumen Captulo 4 del Libro 5. Resumen Captulo 5 del Libro 6. Capitulo 6 del libro 7. Captulo 7 del libro 8. Captulo 8 del libro 9. Capitulo 9 del libro 10. Capitulo 10 del libro 11. Hiptesis nula y alternativa 12. Capitulo 12 del libro 13. Captulo 13 del libro 14. Capitulo 14 del libro 15. Captulo 15 del libro 16. Aplicaciones estadsticas en administracin de la calidad y productividad

1. Resumen Captulo 1 del Libro

Estadstica Descriptiva: Puede definirse como aquellos mtodos que incluyen la recoleccin, presentacin y caraterizacin de un conjunto de datos con el fin de describir apropiadamente las diversas caractersticas de ese conjunto. Estadstica Inferencial: Puede definirse como aquellos mtodos que hacen posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente a una poblacin basndose slo en los resultados de una muestra.

Para aclara este concepto se necesitan de las siguientes definiciones:


Poblacin: es la totalidad de elementos o cosas bajo consideracin. Muestra: Es la porcin de la poblacin que se selecciona para su anlisis. Parmetro: Es una medida de resumen que se calcula para describir una caracterstica de toda una poblacin. Estadstica: Es una medida que se calcula para describir una caracterstica de una sola muestra de la poblacin.

Podemos encontrar dos tipos de estudios estadsticos que se emprenden: los estudios enumerativos y los estudios analticos. Los estudios enumerativos involucran la toma de decisiones respecto a una poblacin y/o sus caractersticas. Los estudios analticos involucran realizar alguna actividad sobre un proceso para mejorar el desempeo en el futuro. La atencin de un estudio analtico est puesta sobre la prediccin del comportamiento futuro de un proceso y sobre la comprensin y perfeccionamiento de ese proceso. En un estudio analtico no existe un universo identificable, como sucede en un estudio enumerativo y en consecuencia tampoco hay un marco. 2. Resumen Captulo 2 del Libro Recoleccin de Datos La necesidad de datos: los datos se necesitan para: 1. Proporcionar la introduccin imprescindible para un estudio de investigacin. 2. Medir el desempeo en un servicio o proceso de produccin en curso. 3. Ayudar en la formulacin de cursos alternativos de accin en un proceso de toma de decisiones. 4. Satisfacer nuestra curiosidad. Que es un dato? Los datos pueden concebirse como informacin numrica necesaria para ayudarnos a tomar una decisin con ms bases en una situacin particular. Cmo obtenemos los datos? Existen muchos mtodos mediante los cuales podemos obtener los datos necesarios. Primero, podemos buscar datos ya publicados por fuentes gubernamentales, industriales o individuales. Segundo, podemos disear un experimento. En tercer lugar, podemos conducir un estudio. Cuarto, podemos hacer observaciones del comportamiento, actitudes u opiniones de los individuos en los que estamos interesados. Utilizacin de fuentes de datos publicadas Sin importar la fuente utilizada, se hace una distincin entre el recolector original de los datos y la organizacin o individuos que compilan stos en tablas y diagramas. El recolector de datos es la fuente primaria; el compilador de los datos es la fuente secundaria. Diseo de un experimento En un experimento se ejerce control sobre el tratamiento de los dado a los participantes.

Conduccin de una encuesta Aqu no se ejerce ningn control sobre el comportamiento de la gente encuestada. Simplemente se formulan preguntas respecto a sus opiniones, actitudes, comportamiento y otras caractersticas. Realizacin de un estudio observacional El investigador observa el comportamiento de inters directamente, por lo comn en su entorno natural. La importancia de obtener buenos datos: GIGO GIGO: Entra Basura, sale basura. No importa el mtodo utilizado para obtener los datos, si un estudio ha de ser til, si el desempeo debe controlarse apropiadamente o si el proceso de la toma de decisiones debe ampliarse, los datos recabados deben ser vlidos: es decir, las respuestas correctas deben valorarse de manera que se obtengan mediciones significativas. Obtencin de datos mediante investigacin de encuesta Tipos de datos Existen bsicamente dos tipos de variables aleatorias que producen dos tipos de datos: categricas y numricas. Las variables aleatorias categricas producen respuestas categricas, mientras que las variables numricas producen respuestas numricas. Las variables numricas pueden considerarse como discretas o continuas. Los datos discretos son respuestas numricas que surgen de un proceso de conteo, mientras que los datos continuos son respuestas numricas que surgen de un proceso de medicin. La necesidad de definiciones operacionales. Una definicin operacional proporciona un significado a un concepto o variable que puede comunicarse a otros individuos. Es algo que tiene el mismo significado ayer, hoy y maana para todos los individuos. Diseo del cuestionario El objetivo de un cuestionario es permitirnos recabar informacin significativa que nos ayude en el proceso de toma de decisiones.

Seleccin de temas amplios - Longitud del cuestionario

Los amplios temas de los cuestionarios deben enumerarse. Mientras ms largo sea el cuestionario, menor ser el cociente de respuesta. Por tanto, se deben evaluar cuidadosamente las preguntas. Las preguntas deben ser lo ms cortos posibles.

Modo de Respuesta

Existen tres modos mediante los cuales se realiza el trabajo de encuesta: la entrevista persona, telefnica y por medio del correo. La personal es la que tiene una tasa de respuesta mayor, pero es ms costosa.

Formulacin de preguntas

Cada pregunta debe presentarse claramente en el menor nmero de palabras y cada pregunta debe considerarse esencial para la encuesta. Adems, deben ser libres de ambigedades.

Prueba del cuestionario

Una vez analizadas los pros y contras de cada pregunta se debe realizar una prueba piloto de manera que puedan examinarse en cuanto a claridad y longitud. Eleccin del tamao de muestra para la encuesta Existen tres razones para extraer una muestra. Antes que todo, por lo general lleva demasiado tiempo realizar un censo completo. En segundo lugar, es demasiado costoso hacer un censo completo. Tercero, es demasiado molesto e ineficiente obtener un conteo completo de la poblacin objeto Seleccin de los sujetos respondientes: tipos de muestras Existen bsicamente dos tipos de muestras: las muestra no probabilstica y la muestra de probabilidad. Una muestra de probabilidad es aquella en la que los sujetos de la muestra se eligen sobre la base de probabilidades conocidas. En una muestra aleatoria simple cada individuo o elemento tiene la misma oportunidad de seleccin que cualquier otro, y la seleccin de un individuo o elemento particular no afecta la probabilidad de que se elija cualquier otro. Extraccin de la muestra aleatoria simple La clave de la seleccin de muestras apropiada es obtener y mantener una lista actualizada de todos los individuos o elementos de los cuales se extraer la muestra. Tal lista se conoce como el marco de la poblacin. Este listado de poblacin servir como la poblacin objetivo, de tal manera que si se extrajeran muchas muestrasde probabilidades diferentes de tal lista, en el mejor de los casos cada muestra sera una representacin de la poblacin. - Muestreo con o sin reemplazo de poblaciones finitas Para seleccionar la muestra pueden usarse dos mtodos bsicos: con reemplazo o sin reemplazo. Digamos que N representa la poblacin y n la muestra. Al extraer con reemplazo la probabilidad de cualquier miembro de la poblacin de ser seleccionado en la primera extraccin es 1/N. La probabilidad de ser seleccionado en otra extraccin sigue siendo 1/N debido a que una vez registrado el dato, el individuo seguir formando parte de la poblacin. Sin embargo, al muestrear poblaciones humanas generalmente se considera ms apropiado tener una muestra de persona diferentes que permitir mediciones repetidas de la misma persona. La probabilidad en este caso es 1/N en la primera extraccin. La probabilidad de que cualquier individuo no seleccionado previamente sea seleccionado en la segunda extraccin es 1/N-1. La encuesta de la muestra El primer pasa para evaluar una encuesta es determinar si se bas en una muestra de probabilidad o en una no probabilstico.

Aun cuando las encuestas emplean mtodos de muestreo de probabilidad aleatorios, estn sujetas a errores potenciales. Existen cuatro tipo de errores de encuesta: 1 - Error de cobertura o sesgo de seleccin. Este error resulta de la exclusin de ciertos sujetos del listado de poblacin, de tal manera que no tienen oportunidad de ser seleccionados en la muestra. El error de cobertura provoca el sesgo de seleccin. 2- Error de no-respuesta o sesgo de no-respuesta. El error de no-respuesta resulta del fracaso de recolectar datos sobre todos los sujetos de la muestra. Y el error de no-respuesta da como resultado el sesgo de no-respuesta. 3- Error de Muestreo. Este error refleja la heterogeneidad o las diferencias de oportunidad de muestra a muestra basndose en la probabilidad de los sujetos que estn siendo seleccionados en las muestras particulares. El error de muestreo puede reducirse tomando tamaos de muestra mayores, aunque esto incrementar el costo de aplicacin de la encuesta. 4- Error de Medicin. Este error se refiere a inexactitudes en las respuestas registradas que ocurren debido a una mala formulacin de las preguntas, el efecto de un entrevistados sobre el encuestado o el esfuerzo hecho por el encuestado. Organizacin y Resumen de Datos Organizacion, Resumen Y Presentacion De Datos Estadisticos Conceptos que deben reforzarse POBLACION: es el conjunto formado por todas las unidades elementales que proporcionarn las mediciones de inters. Pueden ser personas, cosas, objetos abstractos. CENSO: Cuando se estudia la totalidad de las unidades elementales que componen la poblacin. Desventaja: errores de observacin. Ej.: omisiones, duplicaciones, no-ubicacin (no medibles) del encuestado, volumen de informacin MUESTRA: se estudia una parte representativa de la poblacin Desventaja: errores de observacin (no medibles) errores de estimacin (medible, cuantificable) LOS DATOS ESTADISTICOS SON VARIABLES, SU RESULTADO VARIA DE UNA MEDICION A OTRA. Debido a ello a los datos estadsticos los denominamos VARIABLES. Segn se vio, las Variables se clasifican en: Categricas Ordinales o Nominales Y Numricas Discretas o Contnuas. Caso Sr. Jurez

Problema: " Aumento en el ndice de rotacin de cobranzas". Poblacin: Todos los clientes que compran a crdito al seor Jurez en el local A o B. Supuestos: - Dos Locales A y B. Datos del ltimo mes. Muestra Local A: 60 clientes; Local B: 78 clientes. Hiptesis de Trabajo:

Deudores del local A necesitan menos tiempo para pagar. Situacin econmica de los clientes peor nosotros > plazo de financiacin. Locales poseen precios > competencia. Mal sistema de cobros en cuenta corriente.

Para Cada hiptesis se debe tomar una variable a analizar.

Variable a Utilizar en nuestro Caso: " Cantidad de das transcurridos entre la confeccin de la factura y el efectivo cobro de la misma. Definiciones operacionales:

N= Tamao de la poblacin. n= Tamao de la muestra. Yi = Variable a analizar El tamao de muestra es independiente del tamao de la poblacin.

Distribucin de frecuencia:

fi: frecuencia absoluta. Fi: frecuencia absoluta acumulada. hi: frecuencia relativa ( cociente entre frecuencia absoluta y la muestra/poblacin ). Hi: frecuencia relativa acumulada. El 21,7 % de los clientes del local A pagan el da 20. En el local minorista hay pocos que pagan los primeros das y pocos los que pagan el ltimo da. Para comparar se trabaja con frecuencias relativas (cuando los tamaos de muestra son distintos). 23/03/01 Prctico Ejercicio 2.35 - Pgina 49 n = 1425 Objetivo: " Medir el grado de satisfaccin de los clientes que compraron una videograbadora en los ltimos 12 meses. a. Poblacin: Todos los clientes que compraron una videograbadora en los ltimos 12 meses. b. Preguntas cualitativas: 1. Qu le pareci el producto? 2. - Excelente. - Muy Bueno.

- Bueno. - Malo. - Si. - No. 3. Recomendara el Producto. 4. Comprara nuestra marca o producto.

Si. No.

Preguntas Cuantitativas. 1. Cuantas veces us el servicio tcnico?


Ninguna. Una. Dos. Ms de dos.

1. Diseo y funcionamiento. Califique de uno a diez 2. Cuntas marcas analiz antes de decidir por Xenith? 3. Cuntos productos Xenith posee Ud.? Ejercicio 3.8 - Pagina 61 b) Diagrama de Tallo y Hoja SPSS lo hace en forma automtica. Yi= Segundos que tarda un automvil de llegar de 0 a 60 Mph. Autos Alemanes Tallo Hoja 4 5 9 5 4 1

6 7 8 9 10

4 9 4 7 0 9 9 1 5 6 7 3 5 5 8 9

0 9

27/03/01 Construccin de Grficos


Nombrar los ejes. Ttulo del grfico. Fuente de datos.

Ejercicio 3.70 - Pagina 95 Yi fi hi Fi Hi

1,00 1 1,50 2 2,00 3 2,50 2 3,00 6 3,50 5 4,00 2 4,50 2 5,00 3

0,03 1 0,07 3 0,10 6 0,07 8 0,20 14 0,17 19 0,07 21 0,07 23 0,10 26

0,03 0,10 0,20 0,27 0,47 0,63 0,70 0,77 0,87

5,50 1 6,00 1 6,50 1 7,00 1 30

0,03 27 0,03 28 0,03 29 0,03 30 1,00

0,90 0,93 0,97 1,00

Yi = $ de cada manmetro. fi = cantidad de veces que se repite la variable. En este caso se supone que la variable es discreta. Construccin de Intervalos Intervalos sirve en especial para variables continuas Ry = Y max - Y min = Recorrido = Amplitud = Rango Ry = 7.5 - 1 = 6.5 Cantidad de intervalos 4 C= Amplitud del intervalo = Ry / Cantidad de intervalos = 6.5/4 = 1.625 C = Valor entero = 2 Ry* = c x cantidad de intervalos = 2 x 4 = 8 Yi-1 - Yi Yi 1-3 3-5 5-7 7 -9 2 4 6 8 fi 8 15 6 1 30 hi 0.27 0.50 0.20 0.03 1

Construccin del intervalo del Caso Jurez. R = 38 - 14 = 24 Cantidad de Intervalos = 7 Amplitud = Ry / c = 3.43 = 4 3. Resumen Captulo 3 del Libro

Presentacin de datos numricos en tablas y diagramas Una distribucin de frecuencia es una tabla de resumen en la que los datos se disponen en agrupamientos o categoras convenientemente establecidas de clases ordenadas numricamente. En esta forma las caractersticas ms importantes de los datos se aproximan muy fcilmente, compensando as el hecho de que cuando los datos se agrupan de ese modo, la informacin inicial referente a las observaciones individuales de que antes se dispona se pierde a travs del proceso de agrupamiento o condensacin. Al construir la tabla de frecuencia-distribucin, debe ponerse atencin a: 1. Seleccionar el nmero apropiado de agrupamientos de clase para la tabla. 2. Obtener un intervalo o ancho de clase de cada agrupamiento de clase. 3. Establecer los lmites de cada agrupamiento de clase para evitar los traslapes. Seleccin del Nmero de Clases La distribucin de frecuencia debe tener al menos cinco agrupamiento de clase, pero no ms de 15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se obtendr poca informacin. Obtencin de los intervalos de clase Ancho del intervalo Rango nmero de agrupamientos de clase deseado La principal ventaja de usar una de estas tablas de resumen es que las principales caractersticas de los datos se hacen evidentes inmediatamente para el lector. La principal desventaja de tal tabla de resumen es que no podemos saber como se distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso a los datos originales. El punto medio de la clase, sin embargo, es el valor usado para representar todos los datos resumidos en un intervalo particular. El punto medio de una clase (o marca de clase) es el punto a la mitad de los lmites de cada clase y es representativo de los datos de esa clase. Tabulacin de datos numricos: la distribucin de frecuencia relativa y distribucin de porcentaje La distribucin relativa de frecuencia se forma dividiendo las frecuencias de cada clase de distribucin de frecuencia entre el nmero total de observaciones. Entonces puede formarse una distribucin de porcentaje multiplicando cada frecuencia relativa o proporcin entre 100. La distribucin de frecuencia relativa o la distribucin de porcentaje se vuelve esencial siempre que una serie de datos se compara con otra seria de datos, especialmente si difiere el nmero de observaciones en cada serie de datos. Graficacin de datos numricos: el histograma y el polgono Histogramas

Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los lmites de cada clase. La variable aleatoria o fenmeno de inters se despliega a lo largo del eje horizontal; el eje vertical representa el nmero, proporcin o porcentaje de observaciones por intervalo de clase, dependiendo de si el histograma particular, es un histograma de frecuencia, un histograma de frecuencia relativa o histograma de porcentaje Al comparar dos o ms series de datos, ni los diagramas de tallo y hoja ni los histogramas pueden construirse en la misma grfica. Con respecto a estos ltimos, la sobreposicin de barras verticales de uno en el otro ocasionara dificultades de interpretacin; en estos casos se usan los polgonos. Polgonos El polgono de porcentaje se forma permitiendo que el punto medio de cada clase represente los datos de esa clase y luego conectando la sucesin de puntos medios con sus respectivos porcentajes de clase. Distribuciones acumulativas y polgonos acumulativos Una tabla de distribucin de porcentaje acumulativo se construye registrando primero los lmites inferiores de cada clase a partir de la distribucin de porcentaje y luego insertando un lmite extra al final. Polgono de porcentaje acumulativo Para construir un polgono de porcentaje acumulativo (tambin llamado ojiva), el fenmeno se grafica en el eje horizontal, mientras que los porcentajes acumulativos se grafican en el eje vertical. 4. Resumen Captulo 4 del Libro Resumen y descripcin de los datos numricos Propiedades de los datos numricos. Las tres mejores propiedades que describe una serie numrica de datos son: 1. Tendencia central 2. Variacin 3. Forma Si estas mediciones se calculan a partir de una muestra, se denominan estadsticas, si se calculan a partir de los datos de una poblacin se denominan parmetros. Mediciones de tendencia Central

La media aritmtica, es el promedio. Se calcula sumando todas las observaciones y luego dividiendo el total entre el nmero de elementos involucrados.

La media acta como punto de equilibrio de tal forma que las observaciones menores compensan a las observaciones que son mayores. La media aritmtica se ve afectada en gran medida por valores extremos.

La mediana. Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las observaciones sern menores y la otra mitad sern mayores. La mediana no se ve afectada por valores extremos. Para calcular la mediana, primero se deben poner los datos en orden. Despus usamos la frmula del punto de posicionamiento.

El clculo del valor de la media se ve afectado por el nmero de observaciones, no por la magnitud de cualquier extremo.

La moda. Es el valor de una serie de datos que aparece con ms frecuencia. La moda no se ve afectada por la ocurrencia de cualquier valor extremo. Cuartiles. Los cuartiles sonmediciones descriptivas que dividen los datos ordenados en cuatro cuartos.

Mediciones de la Variacin La variacin es la cantidad de dispersin o propagacin en los datos.

El rango: es la diferencia entre la mayor y la menor observacin en una serie de datos. El rango mide la propagacin total en la serie de datos. La debilidad del rango es que no logra tomar en cuenta la forma en que los datos se distribuyen realmente entre el mayor y el menor valor. Sera impropio usar el rango como una medicin cuando uno de o ambos componentes son observaciones extremas. El rango intercuartil: es la diferencia entre el tercer y primer cuartil. No se ve influida por valores extremos. La varianza y la desviacin estndar: a diferencia de las mediciones anteriores la varianza y la desviacin estndar toman en cuenta como se distribuyen las observaciones. La Varianza de muestra es el promedio de las diferencias cuadradas entre cada una de las observaciones de una serie de datos y la media. La desviacin estndar es simplemente la raz cuadrada de la varianza. La varianza y la desviacin miden la dispersin promedio alrededor de la media, es decir, como las observaciones mayores fluctan por encima de sta y como las observaciones menores se distribuyen por debajo de sta. El Coeficiente de Variacin: es una medida relativa de variacin. Se expresa como porcentaje antes que en trminos de las unidades de los datos particulares. Mide la dispersin en los datos relativa a la media.

El coeficiente de variacin es til al comparar la variabilidad de dos o ms series de datos que se expresan en distintas unidades de medicin.

Forma Para describir la forma slo necesitamos comparar la media y la mediana. Si estas dos mediciones son iguales, por lo general podemos considerar que los datos son simtricos. Si la media excede a la mediana, los datos pueden describirse de sesgo positivo o sesgadas a la derecha. Si la media es excedida por la mediana, estos datos pueden llamarse de sesgo negativo o sesgadas a la izquierda. El sesgo positivo surge cuando la media se incrementa en algunos valores inusualmente altos, el sesgo negativo ocurre cuando la media se reduce en algunos valores extremadamente bajos. Clculo de mediciones descriptivas de resumen de una poblacin Las mediciones de tendencia central para una poblacin se calculan igual que en la muestra simplemente reemplazamos n por N. El rango y el rango intercuartil para una poblacin de tamao N se obtienen como si fuera una muestra reemplazando n por N. La varianza se calcula reemplazando el ( n - 1 ) del denominador por N. Uso de la Desviacin Estndar: La regla Emprica En series de datos simtricos, donde la mediana y la media son iguales, las observaciones tienden a distribuirse igualmente alrededor de estas mediciones de tendencia central. Cuando el sesgado extremo no se presenta y tal agrupamiento se observa en una serie de datos, podemos usar la denominada regla emprica para examinar la propiedad de variabilidad de datos y obtener una mejor idea de lo que la desviacin estndar est midiendo. La regla emprica establece que en la mayora de las series de datos encontraremos que aproximadamente dos de cada tres observaciones (es decir, el 67%), estn contenidas en una distancia de una desviacin estndar alrededor de la media y aproximadamente 90% a 95% de las observaciones estn contenidas a una distancia de 2 desviaciones estndar alrededor de la media. Uso de la desviacin estndar: La regla de Bienaym Chebyshev No importa como se distribuyen los datos. el porcentaje de las distribuciones estn contenidas dentro de las dsitancias de k desviaciones estndar alrededor de la media debe ser al menos 1 - 1 / k2 Al menos 75% de las observaciones deben estar contenidas dentro de distancias de +/-2 desviaciones estndar alrededor de la media. Al menos 88,89% de las observaciones deben estar contenidas dentro de una distancia de +/-3 desviaciones estndar alrededor de la media. Al menos 93.75% de las observaciones deben estar contenidas dentro de distancias de +/-4 desviaciones estndar alrededor de la media. 5. Resumen Captulo 5 del Libro Presentacin de datos categricos en tablas y diagramas Graficacin de datos categricos: de barras, de pastel y de punto

Grfica de barras

En la grfica de barras, cada categora se describe mediante una barra, cuya longitud representa la frecuencia o porcentaje de observaciones que caen en una categora. Para construir una grfica de barras se hacen las siguientes sugerencias: 1. Las barras deben construirse horizontalmente. 2. Todas las barras deben tener el mismo ancho. 3. Los espacios entre las barras deben variar entre la mitad 4. del ancho de una barra hasta el ancho de una barra. 5. Las escalas y guas son auxiliares tiles en la lectura 6. de una grfica y deben incluirse. El punto cero u origen debe indicarse. 7. Los ejes deben etiquetarse.

Grfica de Pastel Grfica de Puntos

Graficacin de datos categricos: el Diagrama de Pareto. El diagrama de Pareto es un tipo especial de grfica de barras verticales en la que las respuestas categrizadas se grafican en el orden de rango descendiente de sus frecuencias y se combinan con un polgono acumulativo en la misma escala. El principio bsico detrs de este dispositivo grfico es su capacidad de distinguir los "pocos vitales" de los "muchos triviales". Tabulacin de datos categricos: Tabla de contingencias y supertablas. Las tablas de contingencia se usan para examinar las respuestas a dos variables categricas simultneamente. Supertablas. Una supertabla es esencialmente una coleccin de tablas de contingencia, cada una con las mismas variables y categoras de columna. Sin embargo, se incluyen tantas variables de fila como se deseen para comparaciones frente a la variable de columna. Tipos de Grficos Medidas Estadsticas. Medidas Estadsticas descriptivas.

Variables Numricas: Medidas de posicin. Media. Mediana.

Moda. Cuartiles. Medidas de Variacin. Rango. Rango Medio. Varianza. Desvo Estndar. Coeficiente de variacin.

6. Capitulo 6 del libro Probabilidad Bsica La probabilidad es la posibilidad u oportunidad de que suceda un evento particular. La probabilidad involucrada es una porcin o fraccin cuyo valor vara entre cero y uno exclusivamente. Observamos un evento que no tiene posibilidad de ocurrir (es decir, el evento nulo), tiene una probabilidad de cero, mientras que un evento que seguramente ocurrir (es decir, el evento cierto), tiene una probabilidad de uno. Ejemplo: 1. La posibilidad de sacar una carta con figura negra de una baraja. 2. La posibilidad de que un individuo seleccionado aleatoriamente de una encuesta este de acuerdo con X tema. 3. La posibilidad que tenga xito un nuevo producto en el mercado. Cada uno de los ejemplos anteriores se refiere a uno de los tres planteamientos del tema de la probabilidad. El primero a menudo se denominacom el planteamiento de la probabilidad clsica a priori. Aqu la probabilidad de xito se basa en el conocimiento nterior del proceso involucrado. En el caso ms simple, cuando cada resultado es igualmente posible. Esta posibilidad puede definirse de la siguiente manera: En el segundo ejemplo; llamado probabilidad clsica emprica, aunque la probabilidad se sigue definiendo como la proporcin entre el nmero de resultados favorables y el nmero total de resultados, estos resultados se basan en datos observados, no en el conocimiento anterior a un proceso. El tercer planteamiento de probabilidad se denomina el enfoque de probabilidad subjetiva. Mientras que en los dos anteriores enfoques la probabilidad de un evento favorable se calculaba objetivamente, ya fuera de un conocimiento previo o de datos reales, la probabilidad subjetiva se refiere a la posibilidad de ocurrencia asignada a un evento por un individuo particular. La

probabilidad subjetiva es especialmetne til para la toma de decisiones en aquellas situaciones en que la probabilidad de diversos eventos no puede determinarse empricamente. Conceptos de probabilidad bsica Espacios de muestra y eventos Los elementos bsicos de la teora de probabilidades son los resultados del proceso o fenmeno bajo estudio. Cada tipo posible de ocurrencia se denomina un evento. Un evento simple puede puede describirse mediante una caracterstica sencilla. la compilacin de todos los eventos posibles se llama el espacio muestral. La manera en que se subdivide el espacioi muestral depende de los tipos de probabilidades que se han de determinar. Tomando esto en cuenta, resulta de inters definir tanto el complemento de un evento como un evento conjunto de la siguiente manera: La complemento del evento A incluye todos los elementos que no son parte del evento A. Esta dado por el smbolo A. Un evento conjunto es un evento que tiene dos o ms caractersticas. Tablas de Contingencias y diagramas de Venn Existen varias formas en las que puede verse un espacio muestral particular. El primer mtodo implica asignar los eventos apropiados a una tabla de clasificaciones cruzadas. Tal tabla tambin se denomina tabla de contingencia. Roja As 2 Negro Totales 2 24 26 4 48 52

No As 24 Totales 26

La segunda forma de presentar el espacio muestral es usando un diagrama de Venn. Este diagrama se representa grficamente los diversos eventos como "uniones" e "intersecciones" de crculos. El rea contenida dentro del crculo A y de crculo B (rea central) es la interseccin de de Ay B (y se escribe A B) , puesto que esta rea es parte de A y tambien parte de B. El rea total de los dos crculos es la unin de A y B (y se escribe A B ) y contiene todos los resultados que son parte del evento A, parte del evento B o parte de ambos A y B. El rea fuera del diagrama fuera de A B contiene aquelloos resultados que no sonparte de A ni son parte de B. Probabilidad ( marginal ) simple

La regla mas evidente para las probabilidades es que deben variar en valor de 0 a 1. Un evento imposible tiene una probabilidad cero de ocurrir, y un evento cierto tiene una probabilidad uno de ocurrir. La probabilidad simple se refiere a la probabilidad de ocurrencia de un evento simple. Ejemplo:

la probabilidad de seleccionar una carta negra; la probabilidad de seleccionar un As

La probabilidad simple se denomina probabilidad marginal puesto que el nmero total de xitos puede obtenerse del mrgen apropiado de la table de contingencias. Probabilidad Conjunta La probabilidad conjunta se refiere a fenmenos que contienen dos o mas eventos, como la probabilidad de un as negro, una reina roja o un empleado que este satisfecho con el trabajo y haya progresado dentro de la organizacin. P (A)= P ( A y B1 ) + P ( A y B2 ) + .....+ P ( A y Bk ) donde B1, B2, ... Bk son eventos mutuamente excluyentes y colectivamente exhaustivos. Dos eventos son mutuamente excluyentes si ambos eventos no pueden ocurrir al mismo tiempo. Dos eventos son colectivamente exhaustivos si uno de los eventos debe ocurrir. Por ejemplo, ser hombre y ser mujer son eventos mutuamente excluyentes y colectivamente exhaustivos. Nadie es ambos ( son mutuamente excluyentes ) y todos son uno u otro ( son colectivamente exhaustivos ). Regla de la adicin La regla de la adicin se usa para encontrar la probabilidad del evento A o B. Esta regla para obtener la probabilidad de la unin de A y B considera la ocurrencia del evento A o del evento B o de ambos, A y B. El clculo de P ( A B ), la probabilidad del evento A o B, puede expresarse en la siguiente regla de la adicin general: P(AB)=P(AoB)=P(A)+P(B)P(AyB) Eventos mutuamente excluyentes En ciertas circunstancias, sin embargo, la probabilidad conjunta no necesita restarse porque es igual a cero. Tales circunstancias cuando no existen resultados para un evento particular. Por ejemplo, suponga que deseamos saber la probabilidad de escoger un corazon o una espada si

estuviramos seleccionando slo una carta de una baraja estndar de 52 cartas de juego. Usando la regla de la adicin, tenemos lo siguiente: P ( corazn o espada ) = P ( corazn ) + P ( espada ) P ( corazn y espada ) P = 13/52 + 13/52 0/52 = 26/52 La interseccin en este caso no existe ( llamado el conjunto nulo ) porque no contiene resultados, puesto que una carta no puede ser corazn y espada simultneamente. Siempre que la probabilidad conjunta no contenga ningn resultado, los eventos involucrados se consideran mutuamente excluyentes. Asi la regla general para eventos mutuamente excluyentes se reduce a: P(AoB)=P(A)+P(B) Eventos colectivamente exhaustivos Consideremos la probabilidad de seleccionar una carta negra o rojo. Puesto que son mutuamente excluyentes al usar la ecuacin: 26/52 + 26/52 = 1 La probabilidad de rojo o negro suma uno. Dado que uno de los eventos debe ocurrir se consideran mutuamente excluyentes. Probabilidad Condicional. Cuando estamos calculando la probabilidad de un evento particular A, dada informacin sobre la ocurrencia de otro evento B, esta probabilidad se denomina probabilidad condicional, P ( A \ B ). La probabilidad condicional P ( A \ B ) puede definirse de la siguiente manera: P(A\B)=P(AyB) P(B)

Independencia estadstica Se dice que dos eventos independientes si el conocimiento previo de la probabilidad de ocurrencia de uno de ellos no afecta la probabilidad del otro. Puede definirse de la siguiente manera:

P(A\B)=P(A) Regla de multiplicacin La frmula para la probabilidad condicional puede manipularse algebraicamente de forma tal que la probabilidad conjunta P ( A y B ) puede determinarse a partir de la probabilidad condicional de un evento. La regla de multiplicacin para eventos independientes puede expresarse de la siguiente manera sustituyendo P ( A ) por P ( A \ B ):

P(AyB)=P(A)*P(B) Si esta regla se cumple para dos eventos, A y B entonces A y B son estadsticamente independientes. Por tanto, hay dos formas de determinar la independencia estadstica:. 1. Los eventos A y B son estadsiticamente independientes si y slo si P ( A \ B )=P (A) 2. Los eventos A y B son estadsticamente independientes si y slo si P ( A y B ) = P ( A ) * P ( B ). Teorema de Bayes La probabilidad condicional toma en cuenta informacin respecto a la ocurrencia de un evento para encontrar la probabilidad de otro evento. Este concepto puede ampliarse para revisar probabilidaddes basadas en nueva informacin y, as determinar la probabilidad que un efecto particular se deba a una causa especfica. El procedimiento para revisar estas probabilidades se conoce como teorema de Bayes. El teorema de Bayes puede definirse a partir de las definiciones de probabilidad condicional y probabilidad marginal, asi el teorema de Bayes es: P ( Bi \ A ) = P ( A \ Bi ) P ( Bi ) P ( A \ B1 ) P ( B1 ) + P ( A \ B2 ) P ( B2 ) 7. Captulo 7 del libro Algunas distribuciones importantes de probabilidad discreta Una distribucin de probabilidad para una variable aleatoria discreta es un listado mutuamente excluyente de todos los resultadosposibles para esa variable aleatoria, tal que una probabilidad particular de ocurrencia est asociada con cada resultado. Esperanza Matemtica La media de una distribucin de probabilidad es el valor esperado de su variable aleatoria. El valor esperado de una variable aleatoria discreta puede considerarse como su promedio pesadoo sobre todos los resultados posibles, siendo los pesos la probabilidad asociada con cada uno de los resultados. Esta medicin de resumen puede puede obtenerse multiplicando cada resultado posible Xi, por su probabilidad correspondiente P (Xi) y luego sumando los productos resultantes. Por tanto, el valor esperado de la variable aleatoria discreta X, simbolizado como E (X), puede expresarse de la siguiente manera: E(X)= Xi * P ( Xi) Varianza y desviacin estndar de una variable aleatoria discreta La varianza de una variable aleatoria discreta puede definirse como el promedio pesado de las

diferencias cuadradas entre cada resultado posible y su media, siendo los pesos las probabilidades de cada uno de los resultados respectivos. Esta medicin de resumen puede obtenerse multiplicando cada diferencia cuadrada posible ( Xi )2 por su probabilidad correspondiente P (Xi) y luego sumando los productos restantes. Por lo tanto la varianza de la variable aleatoria discreta X puede expresarse de la siguiente manera: ( Xi )2 * P (Xi) Funciones de distribucin de probabilidad discreta La distribucin de probabilidad para una variable aleatoria discreta puede ser: 1. Un listado terico de resultados y probabilidades que pueden obtenerse de un modelo matemtico que represente algn fenmeno de inters. 2. Un listado emprico de resultados y sus frecuencias relativas observadas. 3. Un listado subjetivo de resultados asociados con sus probabilidades subjetivas que representan el grado de conviccin del tomador de decisiones respecto a la probabilidad de los resultados posibles. Un modelo se considera una representacin en miniatura de algn fenmeno subyacente. En particular, un modelo matemtico es una expresin matemtica que representa cierto fenmeno subyacente. Para variables aleatorias discretas, esta expresin matemtica se conoce como funcin de distribucin de probabilidad. La caracterstica escencial de la distribucin uniforme es que es igualmente posible que ocurran todos los resultados de la variable aleatoria. Distribucin Binomial La distribucin binomial es una distribucin de probabilidad discreta que es extremadamente til para describir muchos fenmenos. La distribucin binomial posee cuatro propiedades esenciales: 1. Las observaciones posibles pueden obtenerse mediante dos mtodos de muestreo distintos. Cada observacin puede considerarse como seleccionada de una poblacin infinita sin reemplazo o de una poblacin finita con reemplazo. 2. Cada observacin puede clasificarse en dos categoras mutuamente excluyentes y colectivamente exhaustivas, usualmente denominadas xito y fracaso. 3. La probabilidad de que una observacin se clasifique como xito, p, es constante de observacin a observacin.

4. El resultado de cualquier observacin es independiente del resultado de cualquier observacin. Modelo matemtico P( X= x \ n, p ) = n ! px ( 1 p ) n-x X!(nx)! La primera parte de la frmula nos dice cuntas secuencias de arreglos de los x xitos de n observaciones son posibles. La segunda parte nos dice la probabilidad de obtener exactamente x xitos de n observaciones en una secuencia particular. Caractersticas de la distribucin binomial

Forma. Siempre que p= 0.5 la distribucin binomial ser simtrica sin importar que tan grande o pequeo sea el valor de n. Sin embargo, cuando p 0.5 la distribucin ser sesgada. Mientras ms cercana este p de 0.5 y mayor sea el nmero de observaciones, n, menos sesgada ser la distribucin. Con una p pequea la distribucin estara sesgada a la derecha. Para p muy grandes, la distribucin sera sesgada a la izquierda. La media. La media de la distribucin binomial puede obtenerse fcilmente como el producto de sus parmetros, n y p.

La desviacin estndar. La desviacin estndar se calcula usando la siguiente frmula:

Distribucin de Poisson. La distribucin de Poisson es otra funcin de distribucin de probabilidad que tiene muchas aplicaciones prcticas importantres. Un proceso Poisson no slo representa numerosos fenmenos discretos, sino que el modelo Poisson tambin se usa para proporcionar aproximaciones a la distribucin binomial. Se dice que un proceso de Poisson existe si podemos observar eventos discretos en un rea de oportunidad, un intervalo continuo, de tal manera que si acotamos el rea de oportunidad o intervalo de manera suficiente: 1. La probabilidad de observar exactamente un xito en el intervalo es estable.

2. La probabilidad de observar exactamente ms de un xito en el intervalo es cero. 3. La ocurrencia de un xito en cualquier intervalo es estadsticamente independiente de aquella en cualquier otro intervalo. Caractersticas

Forma. Cada vez que se especifica el parmetro , puede generarse una distribucinde probabilidad de Poisson espacfica. Una distribucin de Poisson estar sesgada a la derecha cuando es pequea, y se aproximar a la simetra al crecer. La media y la desviacin estndar. Una propiedad de esta distribucin es que la media y la varianza son iguales al parmetro .

Uso de la distribucin de Poisson para aproximar la distribucin binomial Para aquellas situaciones en las que n es grande ( mayor o igual a 20 ) y p es muy pequea ( menor a 0.05 , la distribucin de Poisson puede usarse para aproximar la distribucin binomial. La variable aleatoria de Poisson puede variar tericamente de 0 a . Sin emabrgo, cuando se usa como una aproximacin a la distribucin binomial, la variable aleatoria de Poisson, el nmero de xitos de n observaciones, claramente no puede exceder el tamao de la muestra n. Caractersticas = = n * p 8. Captulo 8 del libro La distribucin Normal

Modelos matemticos de variables aleatorias continuas:. La funcin de densidad de probabilidad.

La probabilidad exacta de un valor particular de una distribucin continua es cero. A fin de eliminar la necesidad de realizar laboriosos clculos matemticos se ha desarrolladola distribucin gaussiana o normal.

La Distribucin Normal. Importancia de la distribucin Normal.

La distribucin normal es de vital importancia en estadstica por tres razones principales: 1. Numerosos fenmenos continuos parecen seguirla o pueden aproximarse mediante sta. 2. Podemos usarla para aproximar diversas distribuciones de probabilidad discreta y evitar as pesados clculos.

3. Proporciona la base de la inferencia estadstica clsica debido a su relacin con el teorema del lmite central.

Propiedades de la distribucin normal

1. Tiene forma de campana y es simtrica en apariencia. 2. Sus mediciones de tendencia central (media, mediana, moda alcance medio y eje medio) son todas idnticas.l 3. Su "dispersin media" es igual a 1.33 desviaciones estndar. Es decir, el alcance intercuartil est contenido dentro de un intervalo de dos tercios de una desviacin estndar por debajo de la media a dos tercios de una desviacin estndar por encima de la media. 4. Su variable aleatoria asociada tiene un alcance infinito

El modelo matemtico

Para la distribucinnormal, el modelo usado para obtener las probabilidades deseadas es:

Examinemos los componentes de la funcin: puesto que e y son constantes matemticas, las probabilidades de la variable aleatoria X dependen slo de dos parmetros de la distribucin normal, la media de la poblacin y de la desviacin estndar de la poblacin. Cada vez que especificamos una combinacin particular se generar una distribucin de probabilidad diferente.

Estandarizacin de la distribucin normal

Afortunadamente, al estandarizar los datos, solo necesitamos una frmula:

Al usar la frmula de transformacin cualquier variable aleatoria normal X se convierte en una variable aleatoria normal estandarizada Z. Mientras los datos originales para la variable aleatoria X tenan una media y una desviacin estandar, la variable aleatoria estandarizada Z siempre tendr una media = 0 y una desviacin = 1.

Uso de las tablas de distribucin de probabilidad normal

La tabla de normal representa las probabilidades o reas bajo la curva normal calculadas desde la media hasta los valores particulares de inters X. Slo se enumeran en la tabla entradas positivas

de Z, puesto que para una distribucin simtrica de este tipo con una media de cero, el rea que va desde la media hasta +Z debe ser idntica al rea que va desde la media hasta Z. Al usar la tabla de normal se puede observar que todos los valores de Z deben registrarse primero con hasta dos lugares decimales.

Encontrar los valores correspondientes a probabilidades conocidas.

Para encontrar un valor particular asociado con una probabilidad conocida,debemos adoptar los siguientes pasos: 1. Trazar la curva normal y luego colocar los valores para las medias en las escalas X y Z respectivas. 2. Dividir la mitad apropiada de la curva normal en dos partes: la porcin de la X deseada a la media y la porcin de la X deseada al extremo. 3. Sombrear el rea de inters. 4. Usando la tabla de normal determinar el valor Z apropiado correspondiente al rea que est bajo la curva normal desde la X deseada hasta la media. 5. Usando la ecuacin que se presenta a continuacin encontrar X.

Aproximacin de la distribucin binomial Mientras ms cerca est p de 0,50 y mientras ms grande sea el nmero de observaciones de la muestra n, ms simtrica se vuelve la distribucin. Siempre que el tamo de muestra sea grande, puede usarse la distribucin normal para aproximar las probabilidades exactas de xito que de otra manera se tendran que haber obtenido mediante laboriosos clculos. Como regla general, esta aproximacin normal puede usars siempre que n * p y n * ( 1- p ) sean al menos 5. Entonces la nueva Z sera la que se presenta a continuacin:

Aproximacin de la distribucin de Poisson La distribucin normal tambin puede usarse para aproximar el modelo de poisson siempre que el parmetro Lambda sea igual o mayor que cinco. Entonces la formula de Z ser la siguiente:

9. Capitulo 9 del libro Distribuciones de muestreo Con el fin de poder usar la estadstica de muestra para estimar el parmetro de poblacin, deberamos examinar cada muestra posible que pudiera ocurrir. Si esta seleccin de todas las muestras posibles realmente se tuviera que hacer, la distribucin de todos los resultados se denominara distribucin de muestreo. El proceso de generalizar estos resultados de muestra para la poblacin se refiere como una inferencia estadstica. Distribucin de muestreo de la media

Propiedades de la media aritmtica

Entre varias propiedades matemticas importantes de la media aritmtica para una distribucin normal estn: 1. Imparcialidad 2. Eficiencia 3. Consistencia. La imparcialidad, implica el hecho de que el promedio de todas las medias de muestras posibles ser igual a la media de la poblacin. Tomemos como ejemplo una poblacin de N=4 con tamaos de muestra de 2. Si seleccionamos dos muestras con reemplazo, podramos obtener 16 muestras posibles. El promedio de cada una de las muestras es igual a la media de la poblacin. Por lo tanto hemos demostrado que la media aritmtica de muestra es un estimador imparcial de la media de la poblacin. Esto nos dice que an cuando no sepamos qu tan cerca est el promedio de cualquier muestra particular seleccionada a la media de la poblacin, al menos estamos seguros que el promedio de todas las medias de muestra que se podran haber seleccionado ser igual a la media de la poblacin. La eficiencia, se refiere a la precisin de la muestra estadstica como un estimador del parmetro de poblacin. La media de muestra se acercar ms estable que otras mediciones de tendencia central. La media de muestra se acercar ms a la media de la poblacin que cualquier otro estimador. La consistencia, se refiere al efecto del tamao de muestra, sobre la utilidad de un estimador. Al incrementarse el tamao de muestra, la variacin de la media de muestra de la media de la

poblacin se hace ms pequea, de manera que la media aritmtica de muestra se vuelve una mejor estimacin de la media de la poblacin. Error estndar de la media El hecho de que las medias de muestra son menos variables que los datos de poblacin se desprende directamente de la ley de los grandes nmeros. Una media de muestra particular promedia conjuntamente todos los valores de la muestra. Una poblacin puede consistir en resultados individuales que pueden tener un amplio radio de valores, de extremadamente pequeos a extremadamente grandes. Sin embargo, si un valor extremo cae en la muestra, aunque tendr un efecto en la media, el efecto se reducir pues se promediar con todos los dems valores de la muestra. Adems, al incrementarse el tamao de la muestra, el efecto de un valor extremo se hace cada vez menor, puesto que se est promediando con ms observaciones. Al muestrearse con reemplazo, el error estndar de la media es igual a la desviacin estndar de la poblacin dividida entre la raz cuadrada del tamao de muestra.

Muestreo de poblaciones normales Puede demostrarse que si muestreamos con reemplazo de una poblacin con distribucin normal, la distribucin de muestreo de la media tambin tendr una distribucin normal para cualquier tamao de muestra y tendr una desviacin estndar como la que se mostr ms arriba. Al incrementarse el tamao de muestra el error estndar de la media disminuye, de forma tal que una mayor proporcin de medias de muestra estn ms cercanas a la media de la poblacin.

Muestro de poblaciones no normales En muchos casos no sabremos si la poblacin se distribuye normalmente. Por lo tanto, necesitamos examinar la distribucin de muestreo de la media para poblaciones que no estn normalmente distribuidas. Teorema del lmite central. Al hacerse lo bastante grande el tamao de muestra, la distribucin de muestreo de la media puede aproximarse mediante la distribucin normal. Esto es cierto no importando la forma de la distribucin de los valores individuales de la poblacin. Qu tamao de muestra? Una gran parte de las investigaciones demuestran que una muestra adecuada de por la menos 30, hace que la distribucin de muestreo se aproxime a la normal.

Para la mayora de las distribuciones de poblacin, sin importar la forma, la distribucin de muestreo de la media tendr una distribucin aproximadamente normal, si se seleccionan muestras de al menos 30 observaciones. Si la distribucin de la poblacin es lo bastante simtrica, la distribucin de muestreo de la media ser aproximadamente normal si se seleccionan muestras de al menos 15 observaciones. Si la poblacin se distribuye normalmente, la distribucin de muestreo de la media se distribuir normalmente sin importar el tamao de la muestra.

Distribucin de muestreo de la proporcin Cuando trabajamos con variables categricas cada caracterstica puede clasificarse con 1 o 0 para representar la presencia o ausencia de la caracterstica. Al tratar con datos categricos puede definirse como:

La proporcin tiene la propiedad especial de estar entre 0 y 1. El error estndar de la proporcin es: La distribucin de muestreo de la proporcin sigue una distribucin binomial. Sin embargo, cuando n*p y n*(1-p) son cada uno al menos 5 puede usarse la distribucin normal. Muestreo de poblaciones finitas

En casi todas las investigaciones el muestreo es conducido sin reemplazo, por esto debe usarse un factor de correccin de poblacin finita (fpc) en la definicin tanto del error estndar de la media como del error estndar de la proporcin. El factor de correccin puede expresarse como: 10. Capitulo 10 del libro Estimacin Introduccin La inferencia estadstica es el proceso que consiste en utilizar los resultados de una muestra para llegar a conclusiones acerca de las caractersticas de una poblacin.

Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de intervalo. Una estimacin puntual consiste en una sola estadstica de muestra que se utiliza para estimar el valor verdadero de un parmetro de poblacin. Puesto que la estadstica de prueba vara de una muestra a otra necesitamos considerar este hecho con el fin de proporcionar una estimacin ms significativa y caracterstica de la poblacin. Para lograr esto, debemos desarrollar una estimacin de intervalo de la media de poblacin verdadera, tomando en consideracin la distribucin de muestreo de la media. El intervalo que construimos tendr una confianza o probabilidad especfica de estimar correctamente el valor verdadero del parmetro de poblacin. Estimacin de intervalo de confianza de la media (desvo de la poblacin conocido): En la inferencia estadstica debemos tomar los resultados de una sola muestra y llegar a conclusiones acerca de la poblacin. En la prctica, la media de la poblacin es la cantidad desconocida que se va a determinar. Para algunas muestras la estimacin de intervalo de la media de la poblacin ser correcta y para otras no. Tenemos que recordar que para el clculo del intervalo trabajamos con una estimacin de intervalo de confianza de 95, por ejemplo, esto puede interpretarse como si se tomaran todas las muestras posibles del mismo tamao, n, 95% de ellas incluiran la media de poblacin verdadera en alguna parte del intervalo alrededor de sus medias de muestra, y solamente 5% de ellas no estaran incluidas. En general el nivel de confianza se simboliza como (1- ) x 100%, en donde es la porcin que se encuentra en los extremos de la distribucin que est fuera del intervalo de confianza. Por consiguiente para obtener la estimacin del intervalo tenemos:

Z es el valor correspondiente a un rea de (1- )/2 desde el centro de una distribucin normal estandarizada. El valor Z elegido para construir tal intervalo de confianza se conoce como el valor crtico. Cualquier aumento en el nivel de confianza se logra ampliando simultneamente el intervalo de confianza obtenido (hacindolo menos preciso y menos til). Estimacin de intervalo de confianza de la media (desvo desconocido) Del mismo modo en que la media de la poblacin se desconoce, es probable que la desviacin estndar real de la poblacin tampoco sea conocida. Por lo tanto, necesitamos obtener una estimacin de intervalo de confianza utilizando las estadsticas de muestra "X" y "S". Para ello, utilizamos la distribucin t-student. De este modo, el intervalo de confianza se establecer a partir de la siguiente frmula: Estimado del intervalo de confianza de la porcin

Podemos establecer la siguiente estimacin de intervalo de confianza (1-) para la porcin de la poblacin:

Determinacin del tamao de muestra para la media: El error de muestreo "e" se puede definir como:

Por consiguiente para determinar el tamao de la muestra, deben conocerse tres factores: 1. El nivel de confianza deseado. 2. EL error de muestreo permitido. 3. La desviacin estndar. Determinacin del tamao de muestra para una porcin:

Al determinar el tamao de muestra para estimar una porcin se deben definir tres incgnitas: 1. El nivel de confianza. 2. El error de muestreo permitido. 3. La porcin verdadera de xitos. Estimacin y determinacin del tamao de muestra para poblaciones finitas. Estimacin de la media

Estimacin de la porcin

Determinacin del tamao de muestra

11. Hiptesis nula y alternativa La prueba de hiptesis empieza con algo de teora, afirmacin o negacin con respecto a un parmetro particular de una poblacin. La hiptesis de que el parmetro de la poblacin es igual a la especificacin de la compaa se conoce como hiptesis nula. Una hiptesis nula es siempre una de status quo o de no diferencia. Se simboliza con el smbolo Ho. Siempre que especificamos una hiptesis nula, tambin debemos especificar una hiptesis alternativa, o una que debe ser verdadera si se encuentra que la hiptesis nula es falsa. La hiptesis alternativa se simboliza H1. La hiptesis alternativa representa la conclusin a la que se llegara si hubiera suficiente evidencia de la informacin de la muestra para decidir que es improbable que la hiptesis nula sea verdadera, y por tanto rechazarla. El hecho de no rechazar la hiptesis nula no es una prueba de que sta sea verdadera. Nunca podemos probar que tal hiptesis sea correcta porque estamos basando nuestra decisin nicamente en la informacin de la muestra, no en la poblacin entera. Resumen:

La hiptesis nula se refiere siempre a un valor especificado del parmetro de poblacin, no a una estadstica de muestra. El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parmetro. El planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parmetro.

Regiones de rechazo y de no rechazo La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una regin de rechazo (conocida como regin crtica) y una regin de no rechazo. Si la estadstica de prueba cae dentro de la regin de no rechazo, no se puede rechazar la hiptesis nula. La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de prueba que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hiptesis nula es falsa. El valor crtico separa la

regin de no rechazo de la de rechazo. Riesgos en la toma de decisiones al utilizar la metodologa de prueba de hiptesis. Se pueden presentar dos tipos diferentes de errores:

Un error tipo I se presenta si la hiptesis nula es rechazada cuando de hecho es verdadera y deba ser aceptada. Un error tipo II se presenta si la hiptesis nula es aceptada cuando de hecho es falsa y deba ser rechazada.

Nivel de Significacin. La probabilidad de cometer un error tipo I denotada con la letra griega alfa, se conoce como nivel de significacin de la prueba estadstica. Est bajo el control directo del individuo que lleva a cabo la prueba. Ya que se ha especificado el valor de alfa, se conoce el tamao de la regin de rechazo, puesto que alfa es la probabilidad de un rechazo de la hiptesis nula. Coeficiente de confianza. EL complemento ( 1-a ) de la probabilidad de cometer un error de tipo I se conoce como coeficiente de confianza. El coeficiente de confianza es la probabilidad de que la hiptesis nula no sea rechazada cuando de hecho es verdadera y debera ser aceptada. Riesgo b . La probabilidad de cometer un error de tipo II se conoce como nivel de riesgo del consumidor. A diferencia del error tipo I, en el cual las pruebas estadsticas nos permiten controlar nuestra eleccin de a , la probabilidad de cometer un error del tipo II depende de la diferencia entre los valores supuesto y real del parmetro de poblacin. Como es ms fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el correspondiente parmetro de poblacin es grande, b la probabilidad de cometer un error del tipo II, probablemente sea pequea. Potencia de una prueba. El complemento (1-b ) de la probabilidad de cometer un error del tipo II se conoce como potencia de una prueba estadstica. La potencia de una prueba es a probabilidad de rechazar la hiptesis nula cuando de hecho esta es falsa y debera ser rechazada. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamao de la muestra. Tamaos ms grandes de muestra, nos permitirn detectar diferencias incluso muy pequeas entre las estadsticas de muestra y los parmetros de la poblacin. Cuando se disminuye a , b aumentar de modo que una reduccin en el riesgo de cometer un error de tipo I tendr como resultado un aumento en el riesgo de cometer un error tipo II. Prueba de hiptesis Z para la media (desvo de la poblacin conocido) El estadstico de prueba a utilizar es:

La Potencia de una prueba representa la probabilidad de que la hiptesis nula no sea rechazada cuando de hecho es falsa y debera rechazrsele. La potencia de prueba 1- representa la sensibilidad de la prueba estadstica para detectar cambios que se presentan al medir la probabilidad de rechazar la hiptesis nula cuando de hecho es falsa y debera ser rechazada. La potencia de prueba estadstica depende de qu tan diferente en realidad es la media verdadera de la poblacin del valor supuesto. Una prueba de un extremo es ms poderosa que una de dos extremos, y se debera utilizar siempre que sea adecuado especificar la direccin de la hiptesis alternativa. Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error tipo II tienen una relacin inversa y esta ltima es el complemento de la potencia de prueba (1-), entonces y la potencia de la prueba varan en proporcin directa. Un aumento en el valor del nivel de significacin escogido, tendra como resultado un aumento en la potencia y una disminucin en tendra como resultado una disminucin en la potencia. Un aumento en el tamao de la muestra escogida tendra como resultado un aumento en la potencia de la prueba, una disminucin en el tamao de la muestra seleccionada tendra como resultado una disminucin en la potencia. 12. Capitulo 12 del libro Pruebas de una muestra con datos numricos Eleccin del procedimiento de prueba apropiada Procedimientos paramtricos Todos los procedimientos paramtricos tienen tres caractersticas distintivas: Los procedimientos de prueba paramtricos pueden definirse como aquellos 1)que requieren que el nivel de medicin obtenido con los datos recolectados est en forma de una escala de intervalo o de una escala de cociente; 2)implican la prueba de hiptesis de valores de parmetros especificados 3) y por ltimo requieren un conjunto limitante de suposiciones. Procedimientos sin distribucin y no paramtricos Los procedimientos de prueba sin distribucin pueden definirse ampliamente como 1) aquellos cuya estadstica de prueba no depende de la forma de la distribucin de la poblacin subyacente de la cual se tom la muestra de datos o como 2) aquellos para los cuales los datos no tienen fuerza suficiente para garantizar operaciones aritmticas significativas. Los procedimientos no paramtricos pueden definirse como aquellos que no tienen que ver con los parmetros de una poblacin.

Prueba t de hiptesis para la media (2 desconocida)

En ocasiones se desconoce la desviacin estndar de la poblacin. Sin embargo, se la puede estimar con el clculo de S, la desviacin estndar de la muestra. Recordemos de muestreo de la media seguir una distribucin t con n-1 grado de libertad. Aproximacin del valor p Suposiciones de la prueba t de una muestra La prueba t est considerada como un procedimiento paramtrico clsico. Supuestos: los datos numricos obtenidos son tomados de manera independiente y representan una muestra aleatoria de la poblacin que est distribuida normalmente. Prueba de hiptesis 2 para la varianza (o desviacin estndar) Al intentar llegar a conclusiones con respecto a la variabilidad de la poblacin, primero debemos determinar que estadstica de prueba puede utilizarse para representar la distribucin de la variabilidad de los datos de la muestra. Si la variable se supone que est distribuida normalmente, entonces la estadstica de prueba para probar si la varianza de la poblacin es igual o no a un valor especificado es:

Una distribucin chi-cuadrado es una distribucin sesgada cuya forma depende exclusivamente del nmero de grados de libertad. Conforma este aumenta, la distribucin se vuelve ms simtrica.

13. Captulo 13 del libro Pruebas de dos muestras con datos numricos Prueba t de varianza conjunta para diferencias entre dos medias

Supongamos que consideramos dos poblaciones independientes, cada una con una media y una desviacin estndar. La estadstica de prueba utilizada para determinar la diferencia entre las medias de las poblaciones est basada en la diferencia entre las medias de las muestras (X1 X2). Debido al teorema del lmite central esta estadstica seguir la distribucin normal. La estadstica de prueba Z es:

En donde X es la media de la muestra correspondiente a cada una de las dos muestras, n es el tamao de la muestra y por ltimo tenemos la varianza de la muestra. Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera aleatoria e independiente se puede utilizar una prueba t de varianza conjunta para determinar si existe alguna diferencia significativa entre las medias de las poblaciones. Si puede calcular la siguiente estadstica de prueba t de varianza conjunta:

Donde:

La estadstica de prueba t de varianza conjunta sigue una distribucin t con n-2 grados de libertad. Prueba t`de varianza separada para diferencias entre dos medias

Si suponemos que las varianzas no son iguales como en el caso anterior debemos replantear el estadstico a utilizar.

La estadstica de prueba t`puede ser aproximada con la frmula de v, mostrada anteriormente. Prueba t para la diferencia de medias Con el propsito de determinar cualquier diferencia que exista entre dos grupos relacionados, deben obtenerse las diferencias en los valores individuales de cada grupo. Cuando la desviacin estndar de la poblacion de la diferencia es conocida y el tamao de muestra es lo suficientemente grande. La estadstica de prueba Z es:

Sin embargo, en la mayora de los casos no conocemos la desviacin estndar real de la poblacin. La nica informacin que se puede obtener son las estadsticas sumarias como la media y la desviacin estndar de muestra. Si se supone que la muestra de resultados es tomada de manera aleatoria e independiente se puede realizar una prueba t para determinar si existe una diferencia media de poblacin significativa. La estadstica seguir una distribucin t con n-1 grados de libertad. Ho= d = 0 donde d= 1-2 H1= d 0 Se puede calcular el siguiente estadstico de prueba:

14. Capitulo 14 del libro Prueba de hiptesis con datos categricos Prueba Z de una muestra para la proporcin Para evaluar la magnitud de la diferencia entre la porcin de la muestra y la porcin de la poblacin supuesta la estadstica de prueba est dada por la ecuacin siguiente:

La estadstica de prueba Z est distribuida de manera aproximadamente normal. Prueba Z para diferencias entre dos porciones (muestras independientes) Cuando se evalan diferencias entre dos porciones basndose en muestras independientes se puede emplear una prueba Z. La estadstica de prueba es:

Se supone que las dos porciones de poblacin son iguales. Ho= p1=p2 H1= p1 p2 Prueba X2 de independencia Sirve para evaluar diferencias potenciales entre la porcin de xitos en cualquier nmero de poblaciones. Para una tabla de contingencias que tiene r renglones y c columnas, la prueba mencionada puede generalizarse como una prueba de independencia. Como prueba de hiptesis las hiptesis nula y alternativa son: H0= Las dos variables categricas son independientes. H1= Las dos variables categricas estn relacionadas. La estadsitica de prueba es la siguiente:

La regla de decisin consiste en rechazar a hiptesis nula a un nivel de significacin si el valor calculado de la estadstica de prueba es mayor que el valor crtico de extremo superior de una distribucin chi-cuadrada que posee (r-1)*(c-1) grados de libertad. 15. Captulo 15 del libro Regresin lineal simple y correlacin El anlisis de regresin se utiliza principalmente con el propsito de hacer predicciones. El anlisis de correlacin se utiliza para medir la intensidad de la asociacin entre las variables numricas. Diagrama de dispersin: cada valor es graficado en sus coordenadas particulares X, Y. Tipos de modelos de regresin. El modelo de lnea recta puede representarse como:

El primer termino (B0), es la interseccin Y para la poblacin; B1 es la pendiente de la poblacin y E es el error aleatorio en Y para la observacin i. En este modelo, la pendiente de la recta B1 representa el cambio esperado en Y por unidad de cambio en X; esto es, representa la cantidad que cambia la variable Y con respecto a una unidad de cambio particular en X. B0 representa el valor promedio de Y cuando X es igual a cero. El modelo matemtico est influenciado por la distribucin de los valores X y Y en el diagrama de dispersin.

Determinacin de la ecuacin de regresin lineal simple. El mtodo de mnimos cuadrados. A b0 y b1 se los puede considerar como estimaciones de B0 y B1. Por consiguiente, la ecuacin de regresin de muestra sera:

Yi es el valor predicho de Y para la observacin i, y Xi es el valor de X para la observacin i. El anlisis de regresin lineal simple tiene que ver con la bsqueda de la lnea recta que mejor se ajusta a los datos. El mejor ajuste significa que deseamos encontrar la lnea recta para la cual las diferencias entre los valores reales (Yi) y los valores que seran predichos a partir de la lnea ajustada de regresin (Yi estimada) sean lo ms pequeas posibles. Debido a que tales diferencias sern positivas y negativas para las diferentes observaciones, minimizamos matemticamente la expresin:

Una tcnica matemtica utilizada para determinar los valores de bo y b1 que mejor se ajusten a los datos observados se conoce como mtodo de mnimos cuadrados. Al utilizar este mtodo surgen dos ecuaciones normales:

I. II.

El error estndar de estimacin.

El error estndar de la estimacin, representado como Syx se define como: Mediciones de variacin en regresin y correlacin. Con el fin de examinar que tan bien una variable independiente predice a la variable dependiente, necesitamos desarrollar algunas medidas de variacin. La primera: la suma total de cuadrados, esta puede dividirse en dos partes: la variacin explicada o suma de cuadrados debida a la regresin (SSR) y la variacin no explicada o suma de cuadrados de error (SSE). La suma de cuadrados debida a la regresin. La SSR representa la diferencia entre el valor promedio de Y y el valor promedio de Y que sera predicho a partir de la

relacin de regresin).La SSE representa aquella parte de la variacin de Y que noo es explicada por la regresin. SST = SSR + SSE

En la que SST =

Podemos ahora definir el coeficiente de determinacin r2: mide la porcin de variacin que es explicada por la variable independiente del modelo de regresin:

Algunos investigadores sugieren que se calcule un coeficiente r2 ajustado para reflejar tanto el nmero de variables explicatorias del modelo como el tamao de la muestra. El coeficiente r2 ajustado se calcula de la siguiente manera: Correlacin: medicin de la intensidad de la asociacin En el anlisis de correlacin estamos interesados en medir el grado de asociacin entre dos variables. La intensidad de la relacin se mide mediante el coeficiente de correlacin r , cuyos valores van de 1 a +1. El coeficiente de correlacin en casos de regresin lineal simple toma el signo de b1.

Suposiciones de regresin y correlacin. Las cuatro principales suposiciones acerca de la regresin son: 1.Normalidad. 2. Homoscedasticidad. 3. Independencia de error. 4. Linealidad. La primera suposicin, normalidad, requiere que los valores de Y estn distribuidos normalmente en cada valor de X. Siempre y cuando la distribucin de los valores de Yi alrededor de cada nivel de X no sea extremadamente diferente de una distribucin normal, las inferencias acerca de la lnea de regresin y de los coeficientes de regresin no se vern seriamente afectadas. La segunda suposicin, homoscedasticidad, requiere que la variacin alrededor de la lnea de regresin sea constante para todos los valores de X. La tercera suposicin, independencia de error, requiere que el error sea independiente de cada valor de X. Por ltimo, la linealidad establece que la relacin entre las variables es lineal.

Estimacin del intervalo de confianza para predecir m yx.

Intervalo de prediccin para una respuesta individual Yi

Inferencias respecto a los parmetros de poblacin en regresin y correlacin Ho= 1=0 (No hay relacin) H1= 1 0 (Hay relacin) Y la estadstida de prueba para probar la hiptesis est dada por:

La estadstica de prueba sigue una distribucin t con n-2 grados de libertad. Un segundo mtodo equivalente para probar la existencia de una relacin lineal entre las variables consiste en establecer una estimacin de intervalo de confianza de 1 y determinar si el valor supuesto est incluido en el intervalo. La estimacin del intervalo de confianza se obtendra de la siguiente manera:

Un tercer mtodo para examinar la existencia de una relacin lineal entre dos variables implica al coeficiente de correlacin de la muestra, r. Para ello se realiza lo siguiente: Ho: = 0 ( No hay relacin) H1: 0 (Hay relacin) La estadstica de prueba para determinar la existencia de una correlacin esta dada por:

La estadstica de prueba sigue una distribucin t con n-2 grados de libertad. Dificultades de la regresin y cuestiones ticas Las dificultades que surgen con frecuencia son: 1. Falta de conciencia sobre las suposiciones de la regresin de mnimos cuadrados. 2. Conocimiento de cmo evaluar las suposiciones de la regresin de mnimos cuadrados. 3. Conocimientos de cules son las alternativas de la regresin de mnimos cuadrados si no se cumple alguna suposicin individual. 4. La creencia de que la correlacin implica causalidad. 5. El uso del modelo de regresin sin conocer de qu se trata. 16. Aplicaciones estadsticas en administracin de la calidad y productividad Calidad y productividad: Una perspectiva histrica. Al tema de calidad y productividad lo podemos dividir en cuatro fases histricas: 1. Podemos pensar en una administracin de primera generacin como administracin mediante la accin, el tipo administracin practicada por las sociedades cazadoras-recolectoras primitivas en que los individuos producan algo para s mismos o para su unidad tribal, siempre que el producto fuera necesario. 2. Luego encontramos la administracin por direccin. Es la poca del surgimiento de los gremios en Europa (Edad Media). Los gremios administraban el entrenamiento de aprendices y trabajadores y determinaban las normas de calidad y fabricacin de los productos hechos por el gremio. 3. La administracin por control, surge aproximadamente con Henry Ford, en el cual los trabajadores estaban divididos entre aquellos que en realidad hacan el trabajo y aquellos que planeaban y supervisaban el trabajo. Esto le quit responsabilidad al trabajador individual con respecto al tema calidad y dej el tema en manos de inspectores. El estilo de administracin por control contena una estructura jerrquica que pona nfasis en la responsabilidad individual por la obtencin de un conjunto de objetivos predeterminados. 4. Por ltimo encontramos la administracin por proceso. Llamada a menudo TQM o Administracin de Calidad Total. Una de las caractersticas principales de este

planteamiento consiste en centrar la atencin en una continua mejora de los procesos. Se le da importancia al trabajo en equipo, atencin al cliente y rpida reaccin a los cambios. Tiene fuerte fundamentacin estadstica. La teora de los diagramas de control. El diagrama de control es un medio para revisar la variacin de la caracterstica de un producto o servicio mediante 1. la consideracin de la dimensin temporal en la cual el sistema fabrica productos y 2. el estudio de la naturaleza de la variabilidad del sistema. El diagrama de control puede utilizarse para estudiar desempeos pasados o evaluar las condiciones presentes o ambas cosas. Los diagramas de control pueden utilizarse para diferentes tipos de variables: para las variables categricas y para las variables discretas. La atencin principal del diagrama de control se enfoca en el intento de separar las causas especiales o asignables de la variacin de las causas comunes o debidas al azar.

Las causas especiales o asignables representan grandes fluctuaciones en los datos que no son inherentes a un proceso. Tales fluctuaciones son ocasionadas por cambios en un sistema. Las causas comunes o debidas al azar representan la variabilidad inherente que se presenta en un sistema.

Las causas especiales se consideran aquellas que no forman parte de un proceso y son susceptibles de corregir; mientras que las causas comunes pueden reducirse solo cambiando el sistema. Existen dos tipos de errores que los diagramas de control ayudan a prevenir. El primer tipo de error implica la creencia de que un valor observado representa una causa especial de la variacin cuando de hecho se debe a una causa comn de variacin del sistema. El segundo error implica tratar a una causa especial como si fuera una causa comn y no tomar medidas correctivas cuando son necesarias. La forma ms tpica de un diagrama de control establece lmites de control que se encuentran dentro de +/-3 desviaciones estndar de la medida de estadstica de inters. En general puede establecerse como:

Algunas herramientas para estudiar un proceso: diagrama de esqueleto de pescado (Ishikawa) y de flujo de procesos. Un proceso es una secuencia de pasos que describen una actividad desde el inicio hasta su terminacin.

El diagrama de esqueleto de pescado (o Ishikawa): El nombre viene de la manera en que las diferentes causas estn ordenadas en el diagrama. El problema se muestra en la parte derecha y las principales causas se colocan en la parte izquierda. Estas causas a menudo se subdividen. Diagrama de flujo de proceso. Este diagrama nos permite ver un flujo de pasos de un proceso, desde su inicio hasta su terminacin.

Los catorce puntos de Deming: una teora de la administracin por proceso. Deming desarrollo su enfoque basndose en los siguientes catorce puntos: 1. Crear una constancia en el propsito de mejorar el producto y el servicio. 2. Adoptar la nueva filosofa. 3. Dejar de ser dependientes de la inspeccin para lograr la calidad. 4. Terminar con la prctica de otorgar contratos sobre la nica base del precio. En vez de ello minimizar el costo total trabajando con un solo proveedor. 5. Mejorar constantemente y para siempre cada proceso de planeacin, produccin y servicio. 6. Instituir el entrenamiento en el trabajo. 7. Adoptar e instituir el liderazgo. 8. Eliminar el miedo. 9. Derribar las barreras entre reas de personal. 10. Eliminar lemas, exhortaciones y metas destinados a la fuerza laboral. 11. Eliminar cuotas numricas para la fuerza laboral y objetivos numricos para la administracin. 12. Retirar barreras que le restan orgullo a la gente respecto a su trabajo. Eliminar el sistema de evaluacin anual o de mrito. 13. Instituir un vigoroso programa de educacin y autodesarrollo para todos. 14. Poner a todo el que trabaje en la compaa a trabajar en el logro de la transformacin. Diagramas de control para la proporcin y el nmero de elementos que no se ajustan:. Los diagramas p y np.

Diagrama p: basado en la porcin de elementos que no cumplen con los requisitos. Para establecer los lmites de control:

Cualquier valor negativo del lmite de control inferior significar que el lmite de control inferior no existe.

Diagrama np: basado en el nmero de elementos que no cumplen con los requisitos. Los lmites de control los establecemos de la siguiente manera:

El diagrama R: Un diagrama de control para la dispersin. Los lmites de este diagrama de control los obtenemos de la siguiente manera:

Diagrama X. El diagrama de control para X utiliza subgrupos de tamao n que se obtienen sobre k secuencias consecutivas o periodos. Los lmites de control se obtienen de la siguiente manera:

Resumen Pronstico de series de tiempo. Tipos de mtodos de prediccin: Existen dos planteamientos para la prediccin: cualitativa y cuantitativa. Los mtodos de prediccin cualitativa son especialmente importantes cuando no se dispone de datos histricos. Se consideran altamente subjetivos. Los mtodos de prediccin cuantitativa hacen uso de los datos histricos. Introduccin al anlisis de series de tiempo. Una serie de tiempo es un conjunto de datos numricos que se obtienen en perodos regulares a travs del tiempo. El principal objetivo de una serie de tiempo consiste en identificar y aislar tales

factores de influencia con propsitos de hacer predicciones, as como para efectuar una planeacin y un control administrativo. Factores componentes del modelo multiplicativo de series temporales. Tendencia: impresin a largo plazo. Componente cclico: representa la oscilacin o los movimientos a la baja y a la alta que se dan a lo largo de la serie. Los movimientos cclicos varan en longitud, por lo general de dos a 10 aos. Componente irregular aleatorio: cualquier componente que no sigue la curva de tendencia modificada por el componente cclico. Cuando los datos se registran mensual o trimestralmente adems de la tendencia cclica y los componentes irregulares debemos tomar en cuenta el factor estacional. El modelo multiplicativo clsico de las series temporales. Cuando los datos se obtienen anualmente una observacin Yi puede expresarse como: Yi=Ti*Ci*Ii; en la que Ti es el valor del componente tendencia, Ci= valor del componente cclico; Ii es el valor del componente irregular. Por otra parte cuando los datos se obtienen de manera trimestral o mensual una observacin Yi puede estar dada por: Yi=Ti*Si*Ci*Ii, en la que Si es el valor del componente estacional. El primer paso de una serie de tiempo consiste en graficar los datos y observar su tendencia a travs del tiempo. Primero debemos determinar si parece haber un movimiento a largo plazo hacia arriba o hacia abajo en la serie. ( es decir una tendencia), o si la serie parece oscilar alrededor de una lnea horizontal a travs del tiempo. Si este ltimo parece ser el caso entonces debe emplearse el mtodo de promedios mviles o el suavizado exponencial, para suavizar la serie y proporcionarnos una impresin global a largo plazo. Suavizado de las series temporales anuales:. promedios mviles y suavizado exponencial. Promedios mviles. Este mtodo es altamente subjetivo y dependiente de la longitud del perodo elegido para la construccin de los promedios. Para eliminar las fluctuaciones cclicas, el perodo escogido debe ser un valor entero que corresponda a la duracin promedio estimada de un ciclo. Los promedios mviles para un perodo elegido de longitud L consisten en una serie de medias aritmticas calculadas en el tiempo de tal modo que cada media se calcula para una secuencia de valores observados que tienen esa longitud particular, L.

El promedio mvil puede calcularse de la siguiente manera: Cuanto ms largo sea el perodo, menor ser el nmero de valores promedio mvil que se pueden calcular y graficar. Por consiguiente, la seleccin de promedios mviles con perodos de longitud mayores a siete aos es, por lo general, no deseable puesto que habr demasiados puntos de datos que faltan al inicio y al final de la serie, haciendo que sea ms difcil de obtener una impresin global de la serie completa.

Suavizado Exponencial. El suavizado exponencial puede utilizarse para obtener predicciones a corto plazo. Su nombre deriva del hecho de que nos proporciona un promedio mvil pesado o ponderado exponencialmente a travs de la serie de tiempo, esto es, a lo largo de la serie cada clculo de suavizado o prediccin depende de todos los valores observados anteriormente. Esta es una ventaja con respecto al otro mtodo. Con este mtodo los pesos asignados a los valores observados disminuyen con el tiempo, de modo que cuando se hace el clculo, el valor observado ms reciente recibe el mayor peso. Para suavizar una serie de tiempo en cualquier periodo i tenemos la siguiente expresin:.

Ei= valor de la serie suavizada exponencialmente que se calcula en el perodo i. Ei-1= valor de la serie suavizada exponencialmente calculado en el perodo i-1 Yi= valor observado de la serie en el perodo i W= peso o coeficiente de suavizado que se asigna de manera subjetiva. W==2/(L+1) Si deseamos suavizar una serie mediante la eliminacin de las variaciones cclicas e irregular no deseadas, debemos seleccionar un pequeo valor de W. Si, nuestro objetivo es hacer predicciones debisemos seleccionar el valor ms grande de W (cercano a uno). Anlisis de series de datos anuales: ajuste de tendencia de mnimos cuadrados y pronstico.

El modelo lineal:

El modelo cuadrtico:

El modelo exponencial: Eleccin de un modelo de prediccin apropiado

Autor:

Hernan Torino htorino[arroba]sinectis.com.ar

Das könnte Ihnen auch gefallen