Sie sind auf Seite 1von 86

Curso de Estadstica Bsica

Ingeniera Industrial
11/07/2011 Instituto Tecnolgico Superior de Tierra Blanca I.I VIRIDIANA SNCHEZ VZQUEZ

Curso de Estadstica Bsica ESTRUCTURA DEL CURSO

Conceptos basicos Distribucin de frecuencias

Pruebas de hiptesis Regresin Lineal

Da 1

Da 2

ANOVA Diseo de Experimentos

D a 3
Instituto Tecnolgico Superior de Tierra Blanca Pgina 2

Tema 1: Introduccin a la Estadstica Una meta comn e importante de la materia de estadstica es la siguiente: aprender acerca de un grupo grande examinando los datos de algunos de sus miembros. En dicho contexto los trminos muestra y poblacin adquieren importancia. Las definiciones formales de estos y otros trminos bsicos se muestran a continuacin Datos: son las observaciones recolectadas (como mediciones, gneros, respuestas de encuestas). Estadstica: es un conjunto de todo el plan de estudios experimentos, obtener datos y luego organizado, resumi, presentar, analizar, interpretar y llegar a conclusiones basadas en datos. Poblacin: es el conjunto completo de todos los elementos (puntuaciones, personas, medidas, etc.) Que se va a estudiar. El conjunto es completo porque incluye a todos los objetos que se estuvieran. Censo: es el conjunto de datos de cada uno de los miembros de la poblacin. Muestra: es un conjunto de miembros seleccionados de una poblacin. Los datos muestran les deben reunirse de una forma adecuada, como a travs de un proceso de seleccin aleatoria. Si los datos muestran les no se renan de la forma apropiada, resultaron tan intiles que ninguna cantidad de estadstica podr salvarnos.

Estadstica Descriptiva. Es la parte de la Estadstica dedicada a colectar, organizar, resumir, presentar y analizar datos. Estadstica Inferencial. Es la parte de la Estadstica dedicada a generar conclusiones vlidas acerca de las caractersticas de la fuente de donde fueron obtenidos los datos. Muestra Aleatoria. Es una muestra obtenida de la poblacin de tal manera que todas las posibles Muestras de igual nmero de observaciones tienen la misma probabilidad de ser seleccionada. En otras palabras, en una muestra aleatoria solo el azar es quien decide que elementos estn en la muestra, se debe evitar cualquier procedimiento que involucre la participacin del investigador ya que inconscientemente se podra sesgar el muestreo y se no representativo de la poblacin. Se dice que una muestra aleatoria es representativa de la poblacin cuando tiene las mismas caractersticas de la poblacin, y el muestreo aleatorio es la manera con mayores posibilidades de obtener una muestra representativa.

TIPOS DE DATOS Concepto clave en la materia de estadstica se trata totalmente de utilizar datos muestrales para ser inferencias se (o generalizaciones) sobre una poblacin completa. Debemos saber y entender las definiciones de poblacin, muestra, parmetro y estadstico, ya que son bsicas y fundamentales. Tambin necesitamos reconocer la diferencia entre datos cuantitativos y datos cualitativos. Tenemos que entender que algunos nmeros, como los cdigos postales, no son cantidades en el sentido de que realmente mide no cuenten algo. Los cdigos postales son. En realidad, ubicaciones geogrficas, por lo que no tiene sentido hacer clculos con ellos, como calcular su promedio. En esta seccin se describen distintos aspectos de la naturaleza de los datos muestran les, los cuales pueden afectar de manera importante los mtodos estadsticos que se utilicen con ellos. Definiciones Parmetro es una medicin numrica que escribe algunas caractersticas de una poblacin. Estadstico es una medicin numrica que describe algunas caractersticas de una muestra. Los datos cuantitativos consisten en nmeros que representan conteos con mediciones. Los datos cualitativos (o categricos poder atributo) se dividen en diferentes categoras que se distinguen por algunas caractersticas no numricas. Los datos discretos resultan cuando el nmero de valores posibles en un nmero finito un nmero que puede contarse (es decir, el nmero de valores posibles es 0,1, 2, etctera). Uno los datos continuos (numricos) resultan de un infinito de posibles valores que corresponden a alguna escala continua que cubre un rango de valores sin huecos, interrupciones o asaltos. Niveles de medicin El nivel de medicin nominal se caracteriza por datos que consiste en exclusiva mente en nombres, etiquetas o categoras. Los datos no se pueden acomodar en un esquema de orden (como dems bajo al ms alto). Ejemplos veamos algunos ejemplos de datos muestrales a nivel de medicin nominal. 1. S/no/indeciso: respuesta es decir, no e indeciso en una encuesta. 2. Colores: los colores de los automviles conducidos por estudiantes universitarios (rojo, negro, azul, blanco, magenta, prpura, etctera)

Puesto que los datos nominales carecen de orden y no tienen un significado numrico, no se deben utilizar para hacer clculos. En ocasiones se asigna nmeros a las distintas categoras (especialmente cuando los datos e codifican para utilizarse en computadoras), pero estos nmeros no tienen un significado computacional real y cualquier promedio que se calcule carece de sentido. Los datos estn en el nivel de medicin ordinal cuando pueden acomodarse en algn orden, aunque no es posible determinar diferencias entre los valores de los datos con tales diferencias carecen de significado. Ejemplos veamos algunos ejemplos de datos mustrales a nivel de medicin ordinal. 1. Las calificaciones de un curso: un Profesor universitario asigna calificaciones de A, B, C, D, D o F. Tales calificaciones se pueden ordenar, aunque no es posible determinar diferencias entre tales calificaciones. Por ejemplo, sabemos que A es mayor que B (por lo que hay un orden); no podemos restar B de A (por lo que no se puede calcular las diferencias) 2. Rangos: con base en varios criterios, una revista ordena las ciudades de acuerdo a su habitabilidad. Dicho rangos (primero, segundo, tercero, etctera) determinan un orden. Sin embargo, las diferencias entre los rangos no tiene ningn significado. Por ejemplo, la diferencia del segundo menos el primero sugerira 2-1 = 1, pero esta diferencia de 1 no tiene significado porque no es una cantidad exacta que sea comparable con otras diferencias de este tipo. La diferencia entre la primera y la segunda ciudades no es la misma que la diferencia entre la segunda y la tercera ciudades. Utilizando los rangos de la revista, la diferencia entre la ciudad de nueva York y Boston no se puede comparar de forma cuantitativa con la diferencia entre San Luis y Filadelfia. Los datos ordinales proporcionen informacin sobre comparaciones relativas pero no las magnitudes de las diferencias. Por lo General, los datos son ordinales no deben utilizarse para hacer clculos como promedios, aunque en ocasiones esta norma se infringe (como sucede cuando utilizamos calificaciones con letras para calcular una calificacin promedio). El nivel de medicin de intervalo se parece al nivel ordinal, pero con la propiedad adicional de que la diferencia entre los valores de datos cualesquiera tiene un significado. Sin embargo, los datos en este nivel no tienen punto de partida cero natural inherente (donde nada de la cantidad est presente). Ejemplos los siguientes ejemplos ilustran el nivel de medicin de intervalo. 1. Temperaturas: las temperaturas corporales de 98.2 F y 98.6 F son ejemplos de datos a nivel de medicin intervalo. Dichos valores estn ordenados, y podemos determinar su diferencia de 0.4F. Sin embargo, no existe un punto de inicio natural. Pareciera que el Valor de 0 F no es un punto de partida cero natural, sera incorrecto decir que 50F es dos veces ms caliente que 25F.

2. Daos: los aos 1000, 2008,1776 y 1492. (El tiempo no inician en el ao cero, por lo que el ao cero es arbitrario y no constituye un punto de partida cero natural que represente la ausencia de tiempo). En nivel de medicin de razn es similar a nivel de intervalo, pero con la propiedad adicional de que s tiene un punto de partida cero natural (donde el cero indica que nada de la cantidad est presente). Para valores a este nivel, tanto las diferencias como las proporciones tienen significado. Ejemplos los siguientes ejemplos de datos al nivel de medicin de razn. Observ la presencia de un Valor ser natural, as como el uso de proporciones que significan dos veces y tres veces. 1. Esos: los presos (en quilates) de anillos de compromiso de diamante (el cero realmente representa la ausencia de 4 quilates que es dos veces el peso de 2 quilates). 2. Precios: los precios de libros de texto universitarios ($0 realmente representa ningn costo y un libro de $90 es tres veces ms caro que un libro de $30). Este nivel de medicin se denomina de razn porque el punto de partida cero hace que las razones poco sientes tengan significado. Entre los cuatro niveles de medicin, la principal dificultad surge del distinguir entre los niveles de intervalo y de razn. Sugerencia: para simplificar esta diferencia, utilice una sencilla prueba razn: considere dos cantidades en las cuales un nmero es dos veces en otro y pregunt seis y dos veces sirve para describir correctamente las cantidades. Puesto que un preso de 200 libras estos meses ms pesado que un peso de sien libras pero 50F no es dos veces ms caliente que 25F, los presos estn en el nivel de razn, mientras que las temperaturas faringe y estn en el nivel de intervalo. Para una comparacin y un repaso concisos, estudie la siguiente tabla que seala las diferencias entre los cuatro niveles de medicin. Nivel Nominal Resumen Ejemplo de

Solo categoras, los datos no pueden acomodarse Origen en un esquema de orden. participantes: 1 Crdoba 1 Orizaba 1 Puebla Las categoras estn ordenadas pero no hay diferencias o carecen de significado.

Ordinal

De intervalo

Automviles de los participantes: 3 medianos 2 compactos Las diferencias tienen un significado pero no hay Temperaturas de Tierra punto de partida cero natural y los cocientes no Blanca: tienen significado 20 C 40 C 50 C

De razn

Hay un punto de partida cero natural y los cocientes tienen significado.

Distancia de traslado de los participantes. 5 Km 10 Km 220 Km

EJERCICIOS: Consulte el conjunto de datos de la OECD que da informacin sobre censos, datos econmicos y comerciales de 29 pases, de acuerdo a las variables presentadas en la tabla, determine cuales son variables cualitativas y cuales son cuantitativas. Variable Tipo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 Escriba la respuesta que considere correcta Si un experimento produce datos que son de naturaleza continua, los datos tambin pueden ser cuantitativos o pueden ser cualitativos? .

Determine si el valor dado es un estadstico o un parmetro 1.- Se selecciona una muestra de hogares y la media de personas por familia es de 2.58 (segn los datos de la oficina censal mexicana) R= . 2.- En la actualidad el 42% de los gobernadores de las 50 entidades de Estados Unidos son demcratas. R= . 3.- En un estudio de los 2223 pasajeros del Titanic, se encontr que 706 sobrevivieron cuando se hundi. R= .

Determine si los valores dados provienen de un conjunto de datos discretos o continuos 1.- Velocidad de un coche (km/h) R= .

2.- Nmero de billetes de $20 en circulacin en Mxico, en cada momento. R= . 3. Nmero de estudiantes matriculados en el ITSTB. R= Determine cul de los cuatro niveles de medicin es el ms apropiado. 1.- Los nmeros en las camisetas de los corredores de maratones R= 2.- Las calificaciones que da la revista del consumidor recomendado, no recomendado. R= 3.- Los nmeros de seguridad social R= . .

de la mejor compra, . . . . .

4.- La distancia que recorren los estudiantes para llegar a la escuela R= 5. Calificaciones de los participantes al curso de estadstica. R= 6. Cantidad de horas de estudio por semana de los estudiantes. R=

Pensamiento Crtico Esta seccin est diseada para ilustrar la forma en que se utiliza el sentido comn cuando pensamos crticamente acerca de datos y estadsticos. En esta seccin, en vez de memorizar mtodos o procedimientos especficos, hay que enfocarse en el pensamiento y el uso del sentido comn al analizar datos. Es importante saber que cuando los datos mustrales se renen de manera inapropiada, como cuando se utiliza una muestra de respuestas voluntarias (que se define ms adelante en esta seccin), ningn mtodo estadstico es capaz de producir resultados vlidos. La siguiente definicin se refiere a uno de los usos incorrectos de la estadstica ms comunes y graves. Una muestra de respuesta voluntaria (o muestra auto seleccionada) es aquella en que los propios sujetos deciden ser incluidos. Por ejemplo, la revista Newsweek hizo una encuesta sobre el controvertido sitio web Napster, que estuvo permitiendo el libre acceso a la copia de CD musicales, a los lectores se les plante la siguiente pregunta: continuar utilizando Napster si tuviera que pagar una cuota? los lectores podan registrar sus respuestas en el sitio web Newsweek. MSNDC. COM. De las 1873 respuestas recibidas, el 19% dijo que s, porque contina siendo ms barato que comprar los CD. Otro 5% dijo que s, que se sentiran ms cmodos utilizndolo por una cuota. Cuando Newsweek o alguien ms hace una encuesta por internet, los propios individuos deciden participar, por lo que

constituye una muestra de respuesta voluntaria. Sin embargo, las personas con opiniones extremas son ms proclives a participar, por lo que su respuesta no son representativas de toda la poblacin. A continuacin se presentan algunos ejemplos de muestras de respuesta voluntaria que, por su naturaleza, tienen graves errores y no deberamos obtener conclusiones sobre una poblacin, se muestra se dcadas como stas: Encuestas por internet, donde los sujetos deciden si responden o no. Encuestas por correo, donde los sujetos deca si responden o no. Encuestas telefnicas, donde anuncios televisivos, de radio o de peridicos le piden que llame voluntariamente a un nmero especial para registrar su opinin.

Con este tipo de muestras de respuesta voluntaria slo se logran conclusiones vlidas sobre el grupo de gente especfico que decidi participar; aunque una prctica comn consiste en afirmar o sacar conclusiones incorrectas sobre una poblacin ms grande. Desde un punto de vista estadstico, una muestra de este tipo es defectuosa y no debe usarse para hacer afirmaciones generales sobre una poblacin ms grande. Muestras pequeas Las conclusiones no se deben basar en muestras demasiado pequeas. Como ejemplo, el Childrens Defence Fund pblico Children Out of School in America, donde se reporto que, de los estudiantes de secundaria suspendidos en una region, el 67% fueron suspendidos al menos 3 veces. Pero esta cifra est basada en una muestra de tan slo tres estudiantes! Los informes en los medios de comunicacin no mencionaron que el tamao de la muestra era muy pequeo. Grficas Las grficas, un como las de barras y las de pastel (circulares), se pueden utilizar para exagerar O subestimar a la verdadera naturaleza de los datos. (En el captulo dos analizaremos diferentes tipos de grficas). Las dos grficas de la figura que se muestra abajo, describe los mismos datos obtenidos de u. S. BUREAU OF ECONOMIC ANALYSIS, aunque en el inciso B) est diseado para exagerar la diferencia entre el ingreso personal per cpita en California y nevada, su estado vecino. Como el eje vertical no inicia en cero, la grfica del inciso B) tiende a producir una impresin subjetiva engaosa, provocando que los lectores crean de manera incorrecta que la diferencia es mucho mayor de lo que realmente es. La figura ensea una leccin importante: para interpretar de manera correcta una grfica, tenemos que analizar la informacin numrica que va presentar, para no engaarnos por su forma General.

Pictogramas los dibujos de objetos, llamados pictogramas, tambin suelen ser confusos. Algunos objetos que se utilizan comnmente para describir datos son los objetos tridimensionales, como las bolsas de dinero, sac de monedas y tanques del ejrcito (para gastos militares), barriles (para la produccin de petrleo) y casas (para la construccin de viviendas). Al dibujar este tipo de objetos artistas podran crear falsas impresiones que distorsionan las diferencias. Si usted duplica cada lado de un cuadrado, el rea no tan slo se duplica, sino comenta en un factor de cuatro. Si usted duplica cada lado de un cubo, el volumen no solamente se duplica, sino que aumenta en un factor de ocho. Vea la figura donde el inciso a) est dibujado para describir correctamente la relacin entre el consumo diario de petrleo en estados unidos y Japn. En la figura a) parece que estados unidos consume aproximadamente cuatro veces un ms petrleo que Japn. Sin embargo, el inciso b) de la figura se dibuj con barriles, en los que cada dimensin est dibujado en proporcin a las cantidades reales vea como la figura B) exagera mucho la diferencia al crear la falsa impresin de que el consumo de petrleo en estados unidos es aproximadamente 50 veces mayor que en el de Japn.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 10

Porcentajes En ocasiones utilizan porcentajes confusos o poco claros. Si usted toma el 100% de alguna cantidad, la est tomando toda. (No se requiere del 110 % de esfuerzo para entender esta afirmacin). Al referirse la prdida de equipaje, continental Airlines public anuncios que afirmaban que se trataba de una hara que mejoraron un 100% durante los ltimos seis meses. En un editorial el que criticaba de estadstica, el new York times interpretado correctamente que la cifra de mejora de un 100% significa que ya no se pierde el equipaje: un logro que todava no disfruta continental Airlines. Preguntas predispuestas hay muchos aspectos que afectan las preguntas de encuestas. Estas pueden estar cargadas o redactadas intencionalmente para obtenerlas respuesta deseada. Observe las tasas reales de la respuesta sea para las diferentes formas de redaccin de una pregunta: 97% s: debera el Presidente utilizar su poder de veto para eliminar los desperdicios? 57 % s: debera el Presidente utilizar su poder de veto uno? Orden de las preguntas En ocasiones las preguntas de una encuesta se sesgan de manera no intencional debido a factores como el orden de los reactivos que se someten a consideracin. Observ estas preguntas de una encuesta aplicada en Alemania: Cree usted que el trnsito vehicular contribuye a la contaminacin del aire ms o menos que la industria? Cree usted que leyendo se contribuye la contaminacin del aire ms o menos que el trnsito vehicular?

Cuando se present primero el trnsito, el 45% culpo a este factor, y el 27% a la industria; cuando la industria se present primero, el 24 % culpo al trnsito y el 57% culp a la industria. Falta de respuesta Existe una falta de respuesta cuando alguien se rehsa a responder una pregunta de encuesta o cuando la persona no est disponible. Cuando se plantean preguntas de crecido en los ltimos aos, en parte debido a que muchos televendedores persistentes tratan de vender bienes o servicios, iniciando con un argumento de venta similar a un encuesta de opinin. Datos faltantes En ocasiones los resultados se ven muy afectados por datos faltantes. A veces faltan datos mustrales por el azar, lo cual implica que la posibilidad de que falte un dato no tiene ninguna relacin con sus valores u otros valores. Sin embargo, algunos datos faltan debido a factores especiales, como los individuos con bajos ingresos que son menos proclives a reportar cunto dinero gana.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 11

Correlacin y casualidad correlacin no implica causalidad. Esto significa que cuando encontramos una asociacin estadstica entre dos variables, no podemos de concluir que una de las variables ser causa de (o lo que afecta directamente a) la otra variable. Si encontramos una correlacin entre la riqueza y el CI, no podemos concluir que el coeficiente intelectual de una persona afecta directamente su riqueza, ni que la riqueza de una persona afecta directamente su puntuacin de CI. En los medios de comunicacin masiva son muy comunes los reportes de una correlacin recin encontrada con una redaccin que indicado implica directamente que una de las variables de causa de la otra. Estudios para el propio beneficio En ocasiones los estudios reciben el patrocinio de grupos con intereses especficos que buscan promover. Por ejemplo, kiwi brands, un fabricante de los lustrador para calzado, encarg un estudio que dio como resultado la siguiente aseveracin impresa en algunos peridicos: de acuerdo con la encuesta nacional de 250 empleadores profesionales, la razn ms comn por la que un solicitante de empleo no logr dar una buena impresin fue por llevar los zapatos desaseados. Debemos ser muy cautos con encuestas como stas, donde el patrocinador puede obtener ganancias monetarias con base en los resultados. En los ltimos aos ha aumentado la preocupacin por la prctica de las empresas farmacuticas financiera mdicos que realizan experimentos clnicos y reportan sus resultados en revistas de prestigio, como no Journal of the American Medical Association. Nmeros precisos en la actualidad hay 103,215, 027 hogares en estados unidos. Puesto que estas cifras muy precisa, mucha gente considera errneamente que tambin es exacta. En este caso, el nmero de subestimado y sera mejor decir que el nmero de hogares es aproximadamente de 103 millones. Imgenes parciales (el 90 % de todos nuestros automviles, vendidos en este pas en los ltimos diez aos, contina circulando. Millones de consumidores escucharon ese mensaje comercial y no se dieron cuenta de que el 90 % de los automviles que el anunciante vendi en este pas se vendieron durante los ltimos tres aos por lo que la mayora de esos automviles que circulaban estaban casi nuevos. La afirmacin era tcnicamente correcta, aunque muy engaosa pues no presentaba los resultados completos. Distorsiones deliberadas en el libro Tainted Truth, un Cynthia Crossen cita un ejemplo de la revista corporate travel que public resultados que mostraban que, entre las compaas de renta de automviles, Harris fue la ganadora en una encuesta realizada a las personas que utilizan dicho servicio. Cuando Hertz solicit informacin detallada sobre la encuesta, la respuesta originales desaparecieron y el coordinador de encuesta de la revista anuncio.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 12

EJERCICIOS En los siguientes ejercicios utilice el pensamiento crtico para elaborar una alternativa Considere un informe de los medios de comunicacin masiva de que los automviles BMW causan que las personas estn saludables, ya que se ha descubierto que los individuos que conducen automviles BMW estn ms saludables que quienes no lo hacen.

. Con base en un estudio que revela que las personas que se gradan de la universidad viven ms tiempo que quienes no lo hacen, un investigador concluye que el estudio provoca que la gente viva ms tiempo.

. Un estudio revel que en la ciudad de Tierra Blanca se expiden mas multas por exceso de velocidad a los individuos de nivel econmico ms bajo que a las personas que cuentan con alguna empresa o microempresa. Por lo tanto se cree que los individuos de recursos bajos exceden la velocidad lmite ms que las personas con un nivel econmico de alto.

. Utilice el pensamiento crtico para indicar lo que se pide El New York Times publico un articulo que inclua la siguiente afirmacin: porfin, el chocolate ocupa el lugar que merece en la pirmide alimenticia, junto a sus vecinos de clase alta: el vino tinto, las frutas, los vegetales y el t verde. Varios estudios, reportados en el Journal Nutrition revelaron que, despus de comer chocolates, los sujetos a prueba incrementaron los niveles de antioxidantes en su sangre. El chocolate contiene flavonoides, antioxidantes asociados con la disminucin del riesgo de enfermedades cardiacas y embolias. Mars, Inc., la empresa de dulces, y la chocolate manufactures Association financiaron gran parte de la investigacin. Qu es incorrecto en este estudio?

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 13

. Cuando la autora Shere Hite escribi la Mujer y el amor: Una revolucin cultural en progreso, bas sus conclusiones en las 4500 respuestas que recibi despus de enviar por correo 100 000 cuestionarios a diversos grupos de mujeres. Es probable que sus conclusiones sean validas, en el sentido de que puedan aplicarse a la poblacin general de todas las mujeres? Por qu?

. El senado de la republica entr en audiencia para considerar una ley que obligaba a los motociclistas a usar cascos. Algunos motociclistas testificaron que haban participado en choques donde los cascos resultaron intiles. Qu grupo importante no fue capaz de testificar?

. ESTADSTICA DESCRIPTIVA Cuando se describen, exploran y comparan conjunto de datos, cuando se describen, exploran y comparan conjuntos de datos, las siguientes caractersticas suelen ser sumamente importantes. Caracterstica importante de los datos 1. 2. 3. 4. 5. Centro: Valor promedio o representativos que indica la localizacin de la mitad el conjunto de los datos. Variacin: medida de la cantidad en que los valores de los datos varan entre s. Distribucin: la naturaleza o forma de la distribucin de los datos (como en forma de campana, uniforme o sesgada). Valores extremos: valores mustrales que estn muy alejados de la vasta mayora de los dems valores de la muestra. Tiempo: caractersticas cambiantes de los datos a travs del tiempo. Cuidado con los Virus que Destruyen el Valioso Trabajo

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 14

Distribucin de frecuencias Cuando ya se tienen los datos de la muestra, ahora de deben organizar de una manera conveniente para que el investigador pueda percibir rpidamente el comportamiento de la distribucin de los datos. Para esto se debe hacer una tabla de frecuencias, que bsicamente es un agrupamiento de datos en grupos pequeos llamados intervalos de clase o clases. La tabla de frecuencias se hace con datos que son nmeros reales correspondientes a una variable continua. Tablas de Frecuencias. Los datos se agrupan en clases o intervalos de clase, luego se cuenta el nmero de observaciones que caen en cada clase. Nmero de clases. Sea n el tamao o nmero de observaciones en la muestra. Luego el nmero de clases se puede determinar como , se recomiendan de 5 a 20 clases. Hay otros criterios pero usaremos este que es muy sencillo. Tambin se recomiendan un mnimo de 5 clases y un mximo de 20 clases y evitar si son posibles las clases vacas. Longitud de los intervalos de clase. Sea MAX la mayor observacin de la muestra y sea MIN la menor observacin de la muestra. Luego, la longitud de clases es: Lo anterior es considerando que todas las clases tienen la misma longitud. Frecuencia absoluta de una clase. Es el nmero de observaciones contenidas en dicha clase. Frecuencia relativa absoluta de una clase. Es su frecuencia absoluta dividida entre n. Frecuencia acumulada absoluta de una clase. El nmero de observaciones menores al lmite superior de la clase. Frecuencia acumulada relativa de una clase. Es su frecuencia acumulada absoluta dividida entre n. Ejercicio 1.2 Lo siguiente son horas por semana dedicadas a ver TV de una muestra de 50 estudiantes. 16, 24, 22, 21, 23, 25, 15, 18, 20, 20, 22, 18, 15, 23, 21, 21, 21, 15, 21, 22, 21, 18, 21, 18, 22, 21, 23, 19, 19, 20, 19, 22, 22, 20, 22, 21, 19, 20, 20, 15, 22, 21, 17, 23, 20, 20, 18, 19, 20, 18. Se har una tabla de frecuencias, primero debemos definir el nmero de clases. Tenemos que 50= 7.071 que redondeando a entero nos da 7, luego usaremos 7 clases. Ahora para obtener la longitud de clase, tenemos que MAX = 25 y MIN = 15 de donde
Instituto Tecnolgico Superior de Tierra Blanca Pgina 15

longitud de clase = (25 15)/7 = 1.43, es recomendable redondear la longitud de clase hacia arriba para asegurar que el valor mximo de la muestra se incluya en la ltima clase. Entonces, la primera clase es el intervalo que inicia en el valor mnimo de la muestra que es 15 hasta el valor 15 + 1.43 = 16.43, es decir el lmite inferior de la primera clase es 15 y el lmite superior es 16.43. Luego, el lmite superior de la primera clase es el lmite inferior de la segunda, tal que los lmites de la segunda clase son: 16.43 y 16.43 + 1.43 = 17.86, y as sucesivamente. Otro valor importante es el valor central de cada clase que se llama marca de clase, ste se obtiene promediando los lmites del intervalo de clase. Para la primera clase se tiene que la marca de clase es (15 + 16.43)/2 = 15.715, para la segunda clase se tiene que la marca de clase es (16.43 + 17.86)/2= 17.145, etc. La tabla 1.2 muestra los intervalos de clase y sus marcas de clase en las primeras tres columnas.

Ahora obtenemos la frecuencia absoluta de cada clase, es decir la cantidad de valores de la muestra ubicados en cada clase. Para la primera clase se tienen los valores: 15, 15, 15, 15,16, luego la primera clase tiene una frecuencia absoluta de 5. Para la segunda clase solo se tiene al 17 lo cual da una frecuencia absoluta de 1, etc. El resto de las frecuencias absolutas se muestran en la tabla 1.3. Es recomendable que en la tabla de frecuencias se agregue la columna conteo en donde se coloca la frecuencia absoluta de clase con la correspondiente cantidad de lneas verticales como se muestra en la tabla 1.3, la razn de esto es que no da una visin anticipada del aspecto del histograma. Observe que la suma de las frecuencias absolutas debe ser igual a n.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 16

Ejercicio 1.3 Determinar las frecuencias faltantes en la tabla. Ejercicio 1.4 La tabla siguiente muestra la cantidad de anuncios en 30 segundos que se transmitieron por radio y fueron adquiridos por cada uno de los 45 miembros de una asociacin de agentes de ventas de automviles. Organice los datos en una representacin de tallo y hoja. Alrededor de que valores tienden a agruparse el nmero de anuncios de publicidad? Cul es el menor nmero de anuncios adquiridos por un agente de ventas? Cul es el mayor nmero de anuncios? (realizarlo mediante el software Minitab) 96 142 132 143 93 94 111 120 88 107 125 103 117 125 104 113 127 155 106 124 95 155 139 138 113 103 134 96 112 119 108 127 97 94 117 89 148 120 118 156 112 136 139 135 125

Representacin grfica de una distribucin de frecuencias Histograma. Es una grfica de la tabla de frecuencias, colocando una barra rectangular sobre cada intervalo de clase. La longitud de la base es la longitud del intervalo de clase y la altura es la frecuencia de clase.

EJERCICIOS 1.5 A continuacin se presenta la cantidad de minutos que toma viajar desde el hogar al trabajo, para un grupo de maestros con automvil. 28 31 25 26 48 21 37 32 41 25 19 31 32 43 26 35 16 42 23 38 23 33 29 28 36

a) Cuntas clases serian recomendables? b) Qu intervalo de clase sugiere?

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 17

c) Qu valor sugiere como lmite inferior de la primera clase? d) Organice los datos en una distribucin de frecuencias LI MC LS CONTEO F FR FAA

FAR

e) Realice el histograma y de una conclusin acerca de la distribucin de los datos. Conceptos bsicos de las medidas de tendencia central Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de un conjunto de datos. La media aritmtica. Es la suma de los datos dividida entre n. ~ La mediana X . Es el valor cuya frecuencia acumulada relativa es el 50% (el 2. cuartil). Para calcular la mediana, primero se ordenan los datos en forma creciente (de menor a mayor). Luego, si n es un nmero impar la mediana es el valor ubicado en el centro de los datos. Si n es par, la mediana se obtiene promediando los dos valores centrales. La Moda. La moda es el valor con mayor frecuencia Conceptos bsicos de las medidas de dispersin Medidas de dispersin. Tratan de medir el alejamiento o distanciamiento de los datos. Mientras este valor sea ms grande significa que los datos estn muy alejados, y mientras esta medida sea menor, significa que los datos estn muy juntos o compactos. El Rango. Es la diferencia; dato mayor dato menor. La otra medida importante de dispersin es la varianza, pero hay dos tipos de varianza, la varianza poblacional y la varianza muestral. La primera se aplica cuando lo que se tiene es la poblacin (cosa en es poco usual). La varianza muestral se aplica cuando se tiene una muestra aleatoria de la poblacin y con ella se desea estimar la varianza poblacional

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 18

Probabilidad
La probabilidad conforma los cimientos sobre los cuales se construyen los mtodos importantes de la estadstica inferencial. Como un sencillo ejemplo, supongan que usted ha creado un procedimiento de seleccin del genero y afirma que este incrementa en gran medida la probabilidad de que un bebe sea nia. Suponga que los resultados de pruebas independientes con 100 parejas demuestran que su procedimiento dio por resultado 98 nias y solos 2 nios. Aun que existe la probabilidad de que nazcan 98 nias en 100 nacimientos sin ningn tratamiento especial, tal probabilidad es tan bajo que se rechazara como una explicacin razonable. En cambio, se reconocera de manera general que los resultados indican fuertes evidencias para afirmar que la tcnica de seleccin del gnero es efectiva. Esta es precisamente la forma de pensar de los especialistas en estadstica: rechazan las explicaciones basadas en probabilidades muy bajas y utilizan la regla del suceso infrecuente para la estadstica inferencial. Regla el suceso infrecuente para estadstica inferencial Si, bajo un supuesto dado, la probabilidad de un suceso particular observado es extremadamente pequea, concluimos que el supuesto probablemente es incorrecto. Fundamentos Concepto clave: en esta seccin se presenta el concepto bsico de la probabilidad de un suceso. Se presentarn tres mtodos diferentes para calcular valores de probabilidad. Veremos que los valores de probabilidad se expresan en nmeros entre 0 y 1, inclusive. Sin embargo, el objetivo ms importante de esta seccin consiste en aprender a interpretar valores de probabilidad. Por ejemplo, debemos comprender que una pequea probabilidad, como 0.001, corresponde a un suceso que es infrecuente, en el sentido de que ocurra en pocas ocasiones. En captulos posteriores hablaremos de valores especficos llamados valores P y veremos que estos tienen un papel suma mente importante en diversos mtodos de estadstica inferencial. Sin embargo, tales valores P solo son valores de probabilidad, como se describe en esta seccin. Concntrese en desarrollar una intuicin para interpretar valores de probabilidad, en especial los que son relativamente pequeos. Al considerar la probabilidad, tratamos con procedimiento (como tirar un dado, contestar una pregunta de opcin mltiple en un examen, o ser someti a una prueba de consumo de drogas) que producen resultados. Un suceso es cualquier conjunto de resultados o consecuencias de un procedimiento. Un suceso simple es un resultado o un suceso que ya no puede desglosarse en componentes ms simples. El espacio muestral de un procedimiento se compone de todos los sucesos simples posibles. Es decir, el espacio muestral est formado por todos los resultados que ya no pueden desglosarse ms.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 19

Ejemplo: anotacin de un tiro libre. Calcule la probabilidad que tiene el jugador de basquetbol de la NBA, Reggie Miller, de anotar un tiro libre despus de recibir una falta. En cierto momento de su carrera, anoto 5915 tiros libres entre 6679 tiros (de acuerdo con datos de la NBA). Solucin. El espacio muestral consiste en dos sucesos simples: Miller anota el tiro libre o no lo hace. Pues que el espacio muestral consiste en suceso que no tienen la misma probabilidad, no podemos utilizar el mtodo clsico (regla 2), si no el mtodo de las frecuencias relativas (regla 1) con sus resultados anteriores, y obtenemos lo siguiente. P(Miller anota un tiro libre) = 5915 = 0.886 6679 Ejemplo: Genotipo como parte de un estudio sobre los genotipos AA, Aa, aA y aa, anote cada genotipo individual en una ficha, luego mezcle las cuatro fichas y elija uno al azar. Qu probabilidad tiene de elegir el genotipo Aa? Solucin puesto que el espacio muestral (AA,Aa,Aa,aa) en este caso incluye resultados igualmente posibles, empleamos el mtodo clsico (regla 2) para obtener. P (Aa)=1/4 Ejemplo: choques de meteoritos Cul es la probabilidad de que su automvil sea impactado por un meteorito este ao? Solucin: en ausencia de datos histricos de meteoritos que chocan con automviles, no podemos usar el mtodo de frecuencias relativas de la regla 1. Hay dos posibles resultados (chocar o no chocar), pero no son igualmente probables, por lo que no podemos usar el mtodo clsico de la regla 2. Esto nos deja con la regla 3, por medio de la cual hacemos un estimado subjetivo. En este caso todos sabemos que la probabilidad en cuestin es muy, muy pequea. Estimemos que sea, digamos, 0.000000000001 (equivalente a una en un billn). Este estimado subjetivo, basado en nuestro conocimiento general, puede encontrarse en el campo general de la probabilidad real. Actividad: Estimar la probabilidad de que cuando se dejen caer, una tachuela quede con la punta hacia arriba. Cuntos intentos son necesarios para obtener un resultado que parezca ser razonablemente preciso? Regla formal de la suma P(A o B)= P(A) + P(B) -P(A y B) Donde P(A y B) denota la probabilidad de que A y B ocurran al mismo tiempo, como resultado en su ensayo de un procedimiento. La regla formal de la suma se presenta como una formula, pero no se recomienda el uso irreflexivo de las formulas. En general, es mejor comprender el espritu de la regla y utilizar esa compresin de la siguiente forma.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 20

Regla intuitiva de la suma Para obtener P(A o B), calcule la suma del numero de formas en que puede ocurrir el suceso A y el numero de formas en que puede ocurrir el suceso B, sumando de tal manera que cada resultado se cuente solo una vez. P(A o B) es igual a esa suma, dividida entre nmero total de resultados en el espacio muestral. Puesto que el traslape de sucesos es un aspecto esencial en la regla de las sumas, existe un trmino especial para describirlo: Definicin Los sucesos A y B son disjuntos (o mutuamente excluyentes) cuando ambos no pueden ocurrir al mismo tiempo. (Es decir, los sucesos disjuntos no se traslapan).

Sucesos complementarios Dijimos que A consiste en todos los resultados en lo que el suceso A no ocurre. Los sucesos A y A debe ser disjuntos, porque es imposible que un suceso y un complemento ocurren al mismo tiempo Regla de los sucesos complementarios P(A) + P(A) = 1 P(A) = 1 P(A) P(A) = 1 P(A) Ejemplo: En realidad, cuando nace un bebe, P(nio) = 0.512. Calcule P(nia). Solucin: usando la regla de los sucesos complementarios, tenemos P (nia) = 1 P (nio) = 1 0.512 = 0.488 Es decir, la probabilidad de no tener un nio, que es la misma que la de tener una nia, es de 0.488. La principal ventaja de la regla de los sucesos complementarios simplificar mucho ciertos problemas. es que puede

EJERCICIOS En los ejercicios del 1 al 4, utilice los datos de la siguiente tabla que resume los resultados de 985 muertes de peatones causadas por accidentes. El conductor estaba intoxicado? Si No El peatn estaba intoxicado? Si No 59 79 266 581

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 21

1.- si se elige al azar una de las muertes de peatones, calcule la probabilidad de que el peatn estuviera intoxicado o que el conductor estuviera intoxicado. 2.- si se elige al azar una de las muertes de peatones, calcule la probabilidad de que el el peatn no estuviera intoxicado o que el conductor no estuviera intoxicado. 3.- si se elige al azar una de las muertes de peatones, calcule la probabilidad de que el peatn estuviera intoxicado o que el conductor no estuviera intoxicado. 4.- si se elige al azar una de las muertes de peatones, calcule la probabilidad de que el conductor estuviera intoxicado o que el peatn no estuviera intoxicado. Simulacin La simulacin es un proceso que se comporta de la misma forma que el procedimiento sometido a consideracin, de manera que produce resultados semejantes. Consideremos el siguiente ejemplo para comprender mejor el uso de la simulacin. Ejemplo seleccin del genero cuando los investigadores mdicos prueban tcnicas de seleccin del genero, necesitan conocer valores de probabilidad de diferentes resultados, por ejemplo, la probabilidad al menos 60 nias entre 100 nios. Suponiendo que el nacimiento de un varn o de una nia es igualmente probable, describa una simulacin que de cmo resultado los gneros de 100 bebes recin nacidos. Solucin una opcin es simplemente lanzar una moneda al aire 100 veces; la cara representa al as nias y la cruz a los varones. Otra opcin es usar una calculadora o computadora para generar aleatoriamente 0 y 1(el 0 representa 1 nio y el 1 representa 1 nia). Los nmeros deben generarse de forma que sean igualmente probables. Minitab: seleccione calc en la barra del men principal, despus seleccione Random Data y despus seleccione integer. En el cuadro de dialogo. Introduzca 25 para el numero de renglones guarde los resultados en la columna C1 e ingrese un mnimo de 1 y un mximo de 365.

Ejercicio: Suponga que un lote consiste en 500 telfonos celulares y que la tasa general de aparatos defectuosos es del 2%. Realice una simulacin generando 500 nmeros, cada uno de ellos entre 1 y 100. Cualquier resultado de 1 y 2 representa un telfono celular defectuoso en tanto que los resultados de 3,4,5,.100, representan telfonos celulares sin defectos. El nmero medio de defectos en los lotes debe ser 10. Sin embargo algunos lotes tendrn menos o ms de 10 defectos. a) Utilice Minitab o Excel para simular la fabricacin de telfonos celulares y registre el nmero de defectos en este lote simulado. b) Repita el inciso a para tener un total de 20 lotes simulados c) Utilice los resultados del inciso b) para estimar la probabilidad de que el numero de defectos en un lote sea exactamente 10. cree usted que esta estimacin es hasta cierto punto exacta?, Por qu?
Instituto Tecnolgico Superior de Tierra Blanca Pgina 22

EJERCICIOS: Qu significan cuando decimos que la probabilidad de ganar el premio mayor de la lotera nacional es 1/20, 358,520? Un triunfo como este es infrecuente?

. Al hablar acerca de la probabilidad de que llueva en Tierra Blanca el 28 de julio del prximo ao, el reportero de la crnica afirma que la probabilidad es de , ya que llover o no llover. Este razonamiento es correcto? Por qu?

. Exprese el grado indicado de probabilidad como un valor de probabilidad entre 0 y 1 1.- como estudio a conciencia y comprendi los conceptos, seguramente aprobara el examen de estadstica 2.- El pronstico de maana indica un 10% de probabilidad de lluvia 3.- Usted tiene la probabilidad de una bola de nieve en el infierno de casarse con mi hija Cul de los siguientes valores no puede ser una probabilidad? 0, 1, -1, 2, 0.0123, 3/5, 5/3, 2 Calcule la probabilidad de cada suceso cuando una pareja tiene tres hijos 1.- De entre tres hijos hay exactamente una nia 2.- De entre tres hijos hay exactamente hay exactamente dos nias 3.- De entre tres hijos todos son nias. a.- De los 100 dulces M&M listados estime la probabilidad de obtener un dulce azul al elegir al azar un dulce M&M sencillo. b.- The Mars Company afirma que el 24 % de sus dulces M&M sencillos son azules. La estimacin del inciso a) coincide aproximadamente con esta afirmacin o al parecer existe una gran diferencia?

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 23

LISTA DE LOS PESOS DE 100 M&M OLDM&M: Data Set 14 in this book includes recent weights from a sample of M&M plain candies, but this data set includes weights from a sample collected in 1993.

RED ORANGE YELLOW BROWN 0.87 0.903 0.906 0.932 0.933 0.92 0.978 0.86 0.952 0.861 0.926 0.919 0.908 1.009 0.868 0.914 0.911 0.971 0.876 0.914 0.908 0.898 0.968 0.904 0.913 0.942 0.921 0.93 0.983 0.897 0.893 0.871 0.92 0.939 1.033 0.936 0.886 0.955 0.891 0.924 0.876 0.924 0.91 0.856 0.874 0.877 0.866 0.908 0.879 0.858 0.924 0.941 0.988 0.897 0.879 0.936 0.912 0.94 0.93 0.888 0.96 0.923 0.872 0.989 0.867 0.898 0.9 0.965 0.882 0.917 0.902 0.911 0.928 0.892 0.9 0.886 0.889 0.949 0.875 0.934 0.909 0.976 0.921 0.898 0.897 0.902 0.92 0.909

BLUE GREEN 0.838 0.911 0.875 1.002 0.87 0.902 0.956 0.93 0.968 0.949 0.89 0.902

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 24

Distribuciones de Probabilidad Discretas Una variable aleatoria es aquella (casi siempre representada por x) que tiene un solo valor numrico determinado por el azar, para cada resultado de un procedimiento. Una distribucin de probabilidad es una distribucin que indica la probabilidad de cada valor de la variable aleatoria. A menudo se expresa como grafica, tabla o formula. Las distribuciones de probabilidad binomial nos permite enfrentar circunstancias en las que los resultados pertenecen a dos categoras relevantes, tales como aceptable/defectuoso o sobrevivi/muri. En la siguiente definicin se plantean otros requisitos. Definicin Una distribucin de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes requisitos: 1. El procedimiento tiene un nmero fijo de ensayos. 2. Los ensayos deben ser independientes. (el resultado de cualquier ensayo individual no afecta las probabilidades de los dems ensayos). 3. Todos los resultados de cada ensayo deben ser clasificados en dos categoras (generalmente llamadas xito y fracasos). 4. La probabilidad de un xito permanece igual en todos los ensayos. Ejemplo seleccin de jueces. En el caso de Castaeda contra partida se sealo que, aunque el 80% de poblacin de un condado en Texas es Mxico estadounidenses, solo el 39% de quienes fueron llamados para integrar el jurado pertenecan a este grupo, supongamos que necesitamos seleccionar a 12 jueces de una poblacin integrada en un 80% de por Mxico- estadounidenses, y que deseamos calcular la probabilidad de que, de 12 jueces elegidos al azar, exactamente 7 sean Mxico estadounidenses. a. este proceso dar por resultado una distribucin binomial? b. Si este proceso da como resultado una distribucin nominal, identifique los valores de n, x, p y q. Solucin. a. Este procedimiento satisface los requisitos de una distribucin binomial, como se indica a continuacin. 1. El nmero de ensayos (12) es fijo. 2. Los 12 ensayos son independientes. (tcnicamente los, 12 ensayos implican una seleccin sin reemplazo y no son independientes, pero podemos suponer independencia porque estamos seleccionando al azar solo a 12 miembros de una poblacin muy grande. 3. Cada uno de los 12 ensayos tienen dos categoras de resultado posible: el miembro de jurado elegido es Mxico estadounidenses o no lo es.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 25

4. Para cada miembro del jurado elegido, la probabilidad de que sea Mxicoestadounidenses es de 0.8 (porque el 80% de la poblacin es Mxicoestadounidense). Esa probabilidad es de 0.8 es la misma para cada uno de los miembros del jurado. b. Una vez concluimos que el procedimiento dado as da por resultado una distribucin binomial, ahora procedemos a identificar los valores de n, x. p y q. 1. Con 12 jueces elegidos, tenemos que n=12 2. Buscamos la probabilidad de exactamente 7 Mxico- estadounidenses, entonces x=7. 3. La probabilidad de xito (elegir a un Mxico- estadounidense) es una seleccin es 0.8 por lo tanto, p= 0.8. 4. La probabilidad de fracaso (no elegir a un Mxico estadounidense) se 0.2 por lo tanto, q=0.2. Una vez ms, es muy importante asegurarse de que tanto x como p se refieran al mismo concepto de xito. En este ejemplo usamos x para contar el nmero de Mxico- estadounidense, de manera que p debe ser la probabilidad de un Mxico estadounidense. Por siguiente por siguiente, x y p si usan aqu el mismo concepto de xito (Mxico estadounidense) Distribucin de probabilidad de poisson Es una distribucin de probabilidad discreta importante, ya que a menudo se utiliza para describir comportamientos que ocurren en raras ocasiones (con probabilidad pequeas). Debemos conocer los requisitos para el uso de la distribucin de poisson y tambin debemos saber cmo calcular las probabilidades. Definicin La distribucin de poisson es una distribucin de probabilidad discreta que se aplica a las ocurrencias de algn suceso durante un intervalo especfico. La variable aleatoria x es el nmero de veces que ocurre un suceso en un intervalo el intervalo puede ser tiempo, distancia, rea, volumen o alguna unidad similar. Requisitos de la distribucin de Poisson La variable aleatoria x es el nmero de veces que ocurre un suceso durante un intervalo. Las ocurrencias deben ser aleatorias Las ocurrencias deben ser independientes entre si Las ocurrencias deben estar unifrmenle distribuidas dentro del intervalo empleado.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 26

Distribucin normal estndar

1.- presenta forma de campana 2.- posee una media igual a 0 3.- tiene una deviacin estndar a 1 As como existen muchas distribuciones uniformes diferentes (con distintos rangos de valores), tambin existen muchas distribuciones normales diferentes, las cuales dependen de dos parmetros: la medida poblacional y la desviacin estndar poblacional . Clculo de probabilidades con puntuaciones z dadas. Si utilizar la tabla A-2, es esencial que comprenda los siguientes puntos: 1.- la tabla A-2 est diseada nicamente para la distribucin normal estndar, que tiene una medida de 0 y una desviacin estndar de 1. 2.- la tabla A-2 abarca dos pginas, una para las puntuaciones Z negativas y la otra para las puntuaciones z positivas. 3.- cada valor en la tabla es una rea acumulativa desde la izquierda hasta un lmite vertical por arriba de la puntuacin z especifica. 4.- cuando construya una grafica, evite la confusin entre puntuaciones z y las reas. Puntuacin z: distancia a lo largo de la escala horizontal de la distribucin normal estndar, remtase a la columna de la extrema izquierda y el rengln superior de la tabla A-2. reas: regin bajo la curva, remtase a los valores de la tabla A-2.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 27

Ejemplo termmetros cientficos. La precisin Scientific Instrument Company fabrica termmetros que se suponen deben de dar lecturas 0C al punto de congelacin del agua. Las pruebas de una muestra grande de estos instrumentos revelaron que el punto de congelacin del agua, algunos termmetros daban lecturas por debajo de 0 (denotadas con nmeros negativos ), y otras daban lecturas por encima de 0 ( denotados con nmeros positivos). Supngase que la lectura media es 0C y que la desviacin estndar de las lecturas es 1.00C. Tambin supngase que las lecturas se distribuyen de manera normal. Si se elige al azar un termmetro, calcule la probabilidad de que, al punto de congelacin del agua, la lectura sea menor que 1.58. Solucin: La distribucin de probabilidad de las lecturas es una distribucin normal estndar, ya que las lecturas se distribuyen de forma normal, con =0 y = 1. Necesitamos encontrar el rea que est debajo de z= 1.58, continua:

Ejemplo termmetros cientficos: utilice los termmetros del ejemplo anterior y calcule la probabilidad de seleccionar al azar un termmetro con una lectura ( en el punto de congelacin del agua) por arriba de -123. Solucin: nuevamente, calculemos la probabilidad deseada encontrando el rea correspondiente. Buscamos el rea de la regin sombreada en la figura pero la tabla A-2 est diseada para aplicarse nicamente en reas acumulativas desde la izquierda. Si nos remitimos a la tabla A-2, en la pagina con puntuaciones negativas, encontramos que rea acumulativa de la izquierda ha de ser z = -123es 0.1093, tal como se observa. Sabiendo que el rea total bajo la curva es 1, podemos calcular el rea sombreada si restamos 0.1093 de 1. El resultado es 0.8907. Aun cuando la tabla A-2 est diseada nicamente para reas acumulativas a partir de la izquierda, podemos utilizarla para calcular reas acumulativas desde la derecha, tal como se muestra en la figura.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 28

Ejemplo termmetros cientficos: Una vez ms, haga una seleccin aleatoria de al mismas muestra de termmetros y calcule la probabilidad de el termmetro elegido tenga lecturas ( en el punto de congelacin del agua entre -2.00 y 1.50). El rea de forma directa, pero podemos emplearla para encontrar que z= -2.00 corresponde al rea de 0.0228, y que z= 1.50 corresponde al rea de 0.9332, como se observa en la figura.

El ejemplo anterior puede generalizarse como una regla que establece que el rea correspondiente a la regin localizada entre dos puntuaciones z especificas puede obtenerse al calcular la diferencia entre las dos reas localizadas en la tabla A-2.

Aplicaciones de las distribuciones normales Para trabajar con una distribucin normal que no es estndar, simplemente estandarice los valores para poder continuar utilizando los mismos procedimientos de la seccin anterior Si convertimos valores en puntuaciones estndares, empleando la frmula 1.1, entonces los procedimientos para trabajar con todas las distribuciones normales son los mismos que los de la distribucin normal estndar. Formula 1.1 z= x -/ (redondear las puntuaciones z hasta dos decimales). Cuando calcule procedimiento: reas en una distribucin normal no estndar, utilice este

1.- dibuje una curva normal, indique la media y los valores especficos de x, despus sombree la regin que representa la probabilidad deseada.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 29

2.- para cada valor relevante de x que sea un lmite de la regin sombreada, utilice la formula 1.1 para convertir el valor a la puntuacin z equivalente. 3.- Remtase a la tabla A-2 para encontrar el constituye la probabilidad deseada. rea de la regin sombreada que

Ejemplo pesos de pasajeros de taxis acuticos. La carga segura para un taxi acutico se calcul en 3500 libras. El peso medio de un pasajero es de 140 libras. Supongamos el peor de los casos, en el que todos los pasajeros son hombres adultos. (Esto podra ocurrir fcilmente en una ciudad donde se realizan convecciones en las personas del mismo gnero suelen viajar en grupos). En concordancia con los datos de la National Health and Nutrition Examination Survey, suponga que los pesos de hombres se distribuyen normalmente, con una media de 172 libras y una desviacin estndar de 29 libras. Si seleccionamos al azar a un hombre, calcule la probabilidad de que pese menos de 174 lb ( el valor sugerido por National Transportation and Safety Board). Solucin: Paso 1: Observe la figura , que incluye la siguiente informacin: los hombres tienen pesos que se distribuyen normalmente, con una media de 172 lb y una desviacin estndar de 29 lb, y la regin sombreada representa a los hombres con pesos menores de 174 libras.

Paso 2: para usar al tabla A-2 primero debemos de aplicar al formula 1.1 para transformar la distribucin normal no estndar a una distribucin normal estndar. El peso de 174 libras se convierte a una puntuacin z de la siguiente manera: Z= x-/ = 174-172/29 = 0.07 Pas 3: si nos remitimos a la tabla A-2 y utilicemos z = 0.07, encontramos que el rea acumulativa a la izquierda de z= 0.07 es un rea de 0.5279.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 30

Para encontrar el rea acumulativa que est a la izquierda de una puntuacin Z (como en la tabla A-2), seleccione calc, distribuciones de probabilidad, normal, probabilidad acumulada, registre la media y la desviacin estndar, despus haga clic en el botn de constante de entrada e ingrese el valor

Para encontrar un valor correspondiente a un rea conocida, seleccione calc, distribuciones de probabilidad, normal, despus seleccione probabilidad acumulada inversa e indique la media y la desviacin estndar. Despus haga clic en el botn de constante de entrada y registre el rea total que se encuentra a la izquierda del valor dado.

EJERCICIOS: En los siguientes ejercicios suponga que las lecturas de los termmetros se distribuyen normalmente, con una media de 0 y una desviacin estndar de 1C. Se selecciona aleatoriamente un termmetro y se prueba. En cada caso, dibuje un bosquejo y calcule la probabilidad de cada lectura. a) Menor que -1 b) Menor que 1 c) Mayor que 1.25 d) Mayor que -1.75 e) Entre 1 y 2 f) Entre -2.45 y -2.00 g) Mayor que 3.52 h) Mayor que 0 En los ejercicios 1 y 2 use la informacin que se le proporciona. La estatura de los hombres se distribuyen normalmente, con una media de 69 pulgadas y una desviacin estndar de 2.8 pulgadas. La estatura de las mujeres se distribuye normalmente con una media de 63.6 pulgadas y una desviacin estndar de 2.5 pulgadas. 1.- En una organizacin para personas altas, se requiere que las mujeres midan al menos 70 pulgadas qu porcentaje de la mujeres cumple con este requisito? R=

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 31

2.- la altura estndar de la entrada de una puerta es de 80n pulgadas. Si un especialista en estadstica disea una casa de tal manera que la entrada de la puerta tenga una altura suficiente para todos los hombres, con excepcin del 5% de los ms altos, Cul sera la altura de la entrada?

3.- En estados unidos los pesos al nacer se distribuyen normalmente, con una media de 3420g y una desviacin estndar de 495 g. si un hospital desea establecer condiciones especiales de observacin para el 2% de los bebes menos pesados, Qu peso se utilizara para establecer un punto de corte que separe al 2% de los bebes menos pesados de los dems? El teorema del lmite central La variable aleatoria x tiene una distribucin (que puede o no ser normal) con media y desviacin estndar . Todas las muestras aleatorias del mismo tamao n se seleccionan de la poblacin (todas deben de tener la misma probabilidad de ser seleccionadas). Determinacin de la normalidad 1.- Histograma: construya un histograma. Rechace la normalidad si el histograma difiere mucho de la forma de campana. 2.- valores extremos: rechace la normalidad si existe ms de un valor extremo. 3.- Grafica cuantilar normal: si el histograma es bsicamente simtrico y existe a lo sumo un valor extremo, construya una Grafica cuantilar normal. Para la construccin de una grafica cuantilar normal en MINITAB utilice los siguientes pasos: 1. Anote los valores en una columna 2. Seleccione stat 3. Seleccione basic statistics 4. Seleccione normality test. 5. Introduzca la columna en la que introdujo los datos 6. Haga click en ok

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 32

Estimaciones y tamaos de muestra Las dos aplicaciones principales de la estadstica inferencial implican el uso de datos de muestra para 1. Estimar el valor de un parmetro de poblacin 2. Probar alguna aseveracin (o hiptesis) acerca de una poblacin. Estimacin de la proporcin de una poblacin. Requisitos: 1. La muestra es aleatoria simple. 2. Las condiciones para la distribucin binomial se satisfacen. Esto es, hay un nmero fijo de ensayo los ensayos son independientes, hay dos categoras de resultados y las probabilidades permaneces constantes para cada ensayo. 3. Existen al menos 5 xitos y al menos 5 fracasos (cuando y se desconocen estimamos sus valores utilizando la proporcin muestral, de manera que este 5 y 5 se cumplan para que la requisito es una forma de verificar distribucin normal sea una aproximacin adecuada para la distribucin binomial. Adems existen procedimientos para tratar situaciones para que la distribucin normal no es una aproximacin adecuada). NOTACIN PARA PROPORCIONES. = proporcin muestral de x xitos en una muestra de tamao . = = proporcin muestral de = 1= proporcin muestrl de en una muestra e tamao en una muestra de tamao

Definicin Un estimado puntual es un valor individual (o punto) que se usa para aproximar un parmetro de poblacin. La proporcin muestral es mejor estimado puntual es el mejor estimado puntual en la proporcin poblaciones . Usamos como el estimado puntual ya que no est sesgado y es el ms consistente de los estimadores que podran usarse. No est sesgado en el sentido de que la distribucin de las proporciones mustrales tiende a concentrarte al valor ; esto es, las proporciones mustrales no tienden sistemticamente a subestimar ni a sobreestimar p. La proporcin muestral es el timador ms consistente en el sentido de que la desviacin estndar de las proporciones mustrales tienden a ser menor a la desviacin estndar de cualquier otro estimador estndar sin sesgo.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 33

Por qu necesitamos intervalos de confianza? En el ejemplo anterior vimos que 0.4 es el mejor estimado puntual de la proporcin poblacional , pero no tenemos indicacin precisa de que tan bueno es nuestro mejor estimado. Como el estimado puntual tiene el gran defecto de no revelar nada de qu tan bueno es, los especialistas en estadstica han diseado ingeniosamente otro tipo de estimado: el intervalo de confianza o estimado del intervalo, que consiste en un rango (o un intervalo) de valores en vez de un solo valor. Definicin Un intervalo de confianza(o estimado del intervalos) es un rango (o un intervalo) de valores que se usan para estimar el valor real de un parmetro de poblacin. El intervalo de confianza suele abreviarse como IC. Un intervalo de confianza se asocia con un nivel de confianza, como 0.9 (95%).el nivel de confianza nos da la tasa de xitos del procedimiento que se utiliza para construir el intervalo de confianza. El nivel de confianza suele expresarse como la probabilidad o rea 1 (alfa griega minscula). de es el complemento del confianza nivel de confianza . Para un nivel de confianza El de valor 0.95 (95%) =0.5. Para un nivel de de 0.99 (99%). =0.01. Definicin El nivel de confianza es la probabilidad 1 (a menudo expresado por el valor equivalente), que es la proporcin de veces que el intervalo de confianza realmente contiene el parmetro de poblacin, suponiendo que el proceso de estimacin se repite un grado numrico de veces. El nivel de confianza tambin se llama grado de confianza o coeficiente de confianza. Las opciones ms comunes para el nivel de confianza son 90% (con = 0.10) , y 95%,(con = 0.50), y 99%(con = 0.01). La opcin del 95% es la ms comn puesto que provee un equilibrio entre presin (reflejada en el ancho del intervalo de confianza) y confiabilidad (expresada por el nivel de confianza). A continuacin se presenta un ejemplo de un intervalo de confianza basando en los datos muestrales de 280 ensayos de terapeutas de contacto, donde en el 44% de los ensayos se identifica correctamente la mano elegida: El intervalo de confianza estimado de 0.95(o 95%) de la proporcin poblacional p es 0.381< p<0.497. Interpretacin de un intervalo de confianza. Debemos ser cuidadosos para interpretar los intervalos de confianza correctamente.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 34

Existe una interpretacin correcta y muchas diferentes y creativas interpretaciones errneas del intervalo de confianza 0.381<p<0.497.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 35

Correcta: Tenemos una confianza del 95% de que el intervalo de 0.381 a 0.497 realmente contiene el valor verdadero de p. Esto significa que si seleccionamos muchas muestras diferentes de tamao 280 y construimos los intervalos de confianza correspondientes, el 95% de ellos incluiran realmente el valor de la proporcin poblacional p. (note que en esta interpretacin correcta, el nivel del 95% se refiere a la tasa de xitos del proceso, utilizada para estimar la proporcin, y no a la proporcin de la poblacin en s). Errnea: Existe un 95% de probabilidad de que el valor real de p este entre 0.381 y 0.497. Para cualquier punto especifico en el tiempo, una poblacin tiene un valor fijo y constante de p, un intervalo de confianza construido a partir de una muestra que incluye o no a p. De manera similar, si un bebe acaba de nacer y el mdico esta por anunciar su gnero, es incorrecto decir que existe una probabilidad de 0.5 de que sea nia; el bebe es o no una nia, y no hay una probabilidad implicada. Una proporcin poblacional p es como el bebe que acaba de nacer: el valor de p es fijo, de manera que los limites del intervalo de confianza contienen o no a p. por eso es incorrecto decir que existe un 95% de probabilidad de que p se localice entre el los valores tales como 0.381 y 0.497. Un nivel de confianza el 95% nos dice que el proceso que estamos usando, a la larga, dar por resultado lmites del intervalo de confianza que contienen la proporcin real de la poblacin el 95% del tiempo. Suponga que la proporcin real de todas las identificaciones correctas de la mano por partes de los terapeutas de contacto es p=0.5. Entonces, el intervalo de confianza obtenido de los datos mustrales no incluira la proporcin poblacional, ya que la proporcin poblacional real de 0.5 no se encuentran entre 0.381 y 0.497. Con un 95% de confianza, esperamos que 19 de las 20 muestras den por resultado intervalos de confianza que contienen el valor real de p. Valores crticos. Notacin para el valor critico. El valor critico z2 es el valor z positivo que est en la frontera vertical que separa una rea de 2 en la cola derecha de la distribucin normal estndar. (El valor de z2 est en la frontera vertical para el rea de 2 en la cola izquierda). El subndice 2 es simplemente un recordatorio de que la puntuacin z separa un rea de cola derecha de la distribucin normal estndar. Definicin Un valor crtico es el nmero en lnea limtrofe que separa estadsticos muestrales que tienen mayor probabilidad de ocurrir de aquellos que no tienen probabilidad de ocurrir. El nmero 2 es la uncola valor crtico, una puntuacin z con laestndar. propiedad de que una 7-2) rea de derecha de la distribucin normal (Vase lasepara figura 2 en 2 2 en la

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 36

Margen de error. Cuando reunimos un conjunto de datos mustrales, como los datos sobre la terapia de contacto de Emily Rosa en el problema del captulo (donde el 44% de los 280 ensayos correspondieron a identificaciones correctas), podemos calcular la proporcin muestral y esta proporcin muestral suele ser diferente de la poblacin poblacional p. La diferencia entre la proporcin muestral y la proporcin de la poblacin se considera un error. Ahora definiremos el margen de error E como sigue. Definicin Cuando se utilizan los datos de muestra aleatoria simple para estimar una proporcin p, el margen de error, denotado por E, es la diferencia mxima probable (con probabilidad 1- ) entre la proporcin muestral de observada y el valor real de la proporcin poblacional p. El margen de error E tambin se conoce llama error mximo del estimado y se calcula multiplicando el valor critico por la desviacin estndar de las proporciones muestrales, como se indica en la frmula 1.2 Formula 1.2 E = z 2 margen de error para proporciones

Dada la formula en que se define el margen de error E, existe una probabilidad de que una proporcin muestral sea errnea por ms de E. Intervalo de confianza (o estimado de intervalo) para la proporcin poblacional p. < < + Donde E = z 2

El intervalo de confianza suele expresar en los siguientes formatos equivalentes , +

Regla de redondeo para estimados de intervalos de confianza de p. Redondee los lmites del intervalo de confianza para p a tres dgitos significativos. Con base en los resultados anteriores, podemos resumir el procedimiento para construir un estimado del intervalo de confianza de una proporcin poblacional como sigue.

Procedimiento para construir un intervalo de confianza para p. 1. Verifique que los supuestos requeridos se cumplan (la muestra es aleatoria simple, las condiciones para la distribucin binomial se satisfacen y existen al menos 5 xitos y al menos 5 fracasos). 2. Remtase a la tabla A-2 y encuentre el valor crtico z 2 que corresponde al nivel de confianza deseado. (Por ejemplo, si el nivel de confianza es del 95%, el valor critico es z 2 =1.96). 3. Evalu el margen de error E = z 2 4. Utilizando el valor del margen de error E calculado y el valor de la proporcin muestral , calcule los valores , + Sustituya esos valores en el formato general para el intervalo de confianza: < < + , +

5. Redondee significativos.

los lmites del intervalo de confianza resultantes a tres dgitos

Uso del Minitab para determinar intervalos de confianza Seleccione estadsticas, estadstica bsica, luego 1 proporcin. En el cuadro de dialogo haga clic en el botn datos resumidos. Tambin haga clic en el botn de opciones, ingrese el nivel de confianza deseado. En vez de utilizar una aproximacin normal, el procedimiento determinado de Minitab consiste en determinar los lmites de intervalo de confianza por medio de un mtodo exacto. Para usar el mtodo de aproximacin normal analizado, haga clic en opciones y luego en el cuadro de la frase use la prueba y el intervalo basado en una distribucin normal. Ejercicios: Un estudiante encuesta a 100 compaeros de clase y les pregunta si tienen deudas pendientes. Despus de calcular la proporcin muestral de esta muestra de n=100 sujetos, su puede utilizar el mtodo analizado anteriormente para estimar la proporcin de todos los adultos que tienen deudas pendientes? Por qu? . Construya el intervalo de confianza 1. n=500, x=200, 95% de confianza 2. n=1200, x=800, 99% de confianza 3. n=1068, x=267, 98% de confianza

Estimacin de una media de poblacin: conocida. Requisitos: 1. La muestra es aleatoria simple. (todas las muestras del mismo tamao tienen la misma probabilidad de ser seleccionadas). 2. El valor de la desviacin estndar poblacional es conocido. 3. Cualquier o ambas de estas condiciones se satisfacen: la poblacin esta normalmente distribuida o n>30. Requisitos de normalidad. Los requisitos incluyen la propiedad de que la poblacin se 30, la poblacin no necesita tener una distribuya normalmente o que n>30. Si distribucin exactamente normal, sino aproximadamente normal. Podemos considerar que el requisito de normalidad se satisface si no hay valor extremo y si un histograma de los datos muestrales no se aleja mucho de la forma de campana. (Se dice que los mtodos de esta seccin son robustos, es decir, se ven muy afectados si los datos se alejan de la normalidad, siempre y cuando no se alejen demasiado). En la seccin anterior vimos que la proporcin muestral es el mejor estimado puntual de la proporcin poblacional p. Por razones similares, la media muestral es el mejor estimado puntual de la media poblacional . La medida muestral es el mejor estimado puntual de la media de la poblacin. brinda el mejor estimado, por las siguientes dos

Por lo general la media de la muestra razones:

1. Para todas las poblaciones, la media muestral es un estimador sin sesgo de la media poblacional , lo que significa que la distribucin de medias muestrales tiende a concentrarse alrededor del valor de la media poblacional . [es decir, las medidas muestrales no tienden sistemticamente a sobreestimar el valor de , ni tienden sistemticamente a subestimar el valor de ,] sino que tienden a coincidir con este valor. Para muchas poblaciones, la distribucin de las medias muestrales tiende hacer ms consistente (con menos variacin) que la distribucin de otros estadsticos muestrales. EJEMPLO. Pulso cardiaco de mujeres. El pulso cardiaco de las personas es sumamente importante. Sin l, Dnde estaramos? El conjunto de datos del archivo FHEALTH incluye pulsos cardiacos (en latidos por minutos) de mujeres seleccionadas al azar; los estadsticos son los siguientes: n=40, =76.3 y s= 12.5. Utilice esta muestra para calcular el mejor estimado puntual de la media poblacional de los pulsos cardiacos de todas las mujeres. SOLUCIN. Para los datos muestrales, =76.3. Como la media muestral es el mejor estimado puntual de la media poblacional , concluimos que el mejor estimado puntual de los pulsos cardiacos de todas las mujeres es 76.3.

Intervalo de confianza. Aunque l un estimado puntual es el mejor valor individual para estimar un parmetro poblacional, no nos da ninguna indicacin precisa de que tan bueno es este mejor estimado. Sin embargo, un intervalo de confianza nos ofrece informacin que nos permite comprender mejor la exactitud del estimado. El intervalo de confianza se asocia con un nivel de confianza, como 0.95 (o 95%).el nivel de confianza nos da la tasa de xito de procedimiento que se utiliza para construir el intervalo de confianza. Como se describi en la seccin anterior, es el = complemento del nivel nivel de confianza. Para un nivel deconfianza de 0.95 (o 95%), 0.05. Para un confianza de 0.99 (o99%), =0.01. Margen de error. Cuando reunimos un conjunto de datos muestrales, como los datos de los 40 pulsos de mujeres que se incluyen en el conjunto de datos 1 del apndice B, podemos calcular la medida muestral y esa medida muestral por lo regular es diferente de la medida poblacional . La diferencia entre la medida muestral y la medida es un error. En la seccin anterior vimos que la desviacin esE estndarpoblacional de la las medidas muestrales. Utilizando y la notacin que se presento en seccin anterior ahora podemos usar/el de / error que margen 2 expresa como sigue: Formula 1.3 E = 2 margen de error para la medida (con base en ).

La frmula 1.3 refleja el hecho de que la distribucin del muestreo de la medida muestral es exactamente una distribucin normal con medida y desviacin estndar / , siempre y cuando la poblacin tenga una distribucin normal con medida y desviacin estndar . Si la poblacin no est distribuida normalmente las muestras grandes producen medidas muestrales con una distribucin que se aproxima a la normal. Utilizando el margen de error E ahora podemos identificar el intervalo de confianza para la medida poblacional (si se satisfacen los requisitos de esta seccin). Los tres formatos que suelen usarse para expresar el intervalo de confianza se presentan en el siguiente cuadro. Estimacin del intervalo de la medida poblacional -E< O < +E donde E o E = 2

(con

conocida).

( - E, +E)

Definicin Los dos valores -E y +E se llaman limites del intervalo de confianza.

Procedimiento para construir un intervalo de confianza para conocida)

(con

1. Verifique que los supuestos requeridos se satisfagan. (Tenemos una muestra aleatoria simple, es conocida, y la poblacin parece estar distribuida normalmente o n>30). 2. Remtase en la tabla A-2 y calcule el valor crtico z2 correspondiente al nivel de confianza deseado. (por ejemplo, si el nivel de confianza es de 95%, el valor critico es de z2 =1.96). 3. Evalu el margen de error E= z2 / . 4. Utilizando el valor calculado del margen de error E y el valor de la medida muestral , calcule los valores - E and +E. sustituya esos valores en el formato general para el intervalo de confianza: -E< +E O E O ( - E, +E) 5. Redondee los valores resultantes usando la siguiente regla de redondeo. <

Regla de redondeo para intervalos de confianza utilizados para estimar . 1. Cuando utilice el conjunto de datos original para construir un intervalo de confianza a un decimal ms del que se usa para el conjunto de datos original. 2. Cuando el conjunto de datos original se desconoce y solo se utiliza el resumen de estadsticos (n, , ) redondee los limites del intervalo de confianza al mismo nmero de espacios decimales utilizados para la media muestral Interpretacin de un intervalo de confianza. Correcta: tenemos una confianza del 95% de que el intervalo de 72.4 a 85.2 realmente tiene el valor verdadero de . Esto significa que si seleccionamos muchas muestras diferentes del mismo tamao y construimos los intervalos de confianza correspondiente a la larga, el 95% de estos contendran realmente el valor de . (Esta interpretacin correcta se refiere a la tasa de xito del proceso que se usa para estimar la media poblacional).

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 40

Ejercicios: Con base en datos muestrales se obtiene el siguiente intervalo de confianza del 95%: 2.5<<6.0. Escriba un enunciado que interprete el intervalo de confianza de manera correcta. . Calcule el intervalo de confianza 1.- salarios de ex docentes del ITSTB que tomaron un curso de estadstica: confianza del 95%; n=41, = $67,200, y se sabe que es $18,277.

2.- calificaciones de crdito de solicitantes de tarjetas de crdito: confianza del 99%; n=70, = $688, y se sabe que es $68.

Estimacin de desconocida. Requisitos:

la

media

poblacional:

1. La muestra es aleatoria simple. 2. La muestra proviene de una poblacin distribuida normalmente o n<30. La media muestral . es el mejor estimado puntual de la medida poblacional

He aqu aspecto clave de esta seccin: si no se conoce, pero los requisitos anteriores se satisfacen, utilizamos la distribucin t de student (en vez de la distribucin normal), que desarrollo William Gosset (1876-1937). Gosset fue un empresario de la cervecera Guinness Brewery que necesitaba una distribucin que pudiera utilizarse con muestreas pequeas. La cervecera irlandesa donde trabajaba no permita la publicacin de resultados de investigaciones, entonces Gosset publico bajo el seudnimo de student. (Puesto que no conocemos el valor de , estimamos con el valor de la desviacin estndar muestral s, pero esto introduce otra fuente de confiabilidad en especial o las muestras pequeas para mantener un intervalo de confianza a un nivel deseado el 95% compensamos esta falta de confiabilidad adicional haciendo ms ancho el intervalo de una confianza: utilizamos valores crticos distribucin t de Student), los cuales son ms grandes que los valores crticos de2(de 2 de la distribucin normal.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 41

La distribucin de t Student. Si una poblacin tiene una distribucin normal, entonces la distribucin de: = Es una distribucin t de Student para todas las muestras de tamao n. la distribucin t student, conocida a menudo como distribucin t, se utiliza para calcular valores crticos denotados por t 2. Pronto analizaremos algunas de las propiedades importantes de la distribucin t, pero antes presentamos los componentes necesarios para la construccin de intervalos de confianza. Comencemos con el valor critico denotado por 2. Un valor de 2 se puede encontrar en la tabla A-3 localizando el numero apropiado de grados de libertad en la columna izquierda y avanzando por el rengln correspondiente hasta encontrar el numero que aparece directamente a bajo del rea adecuada en el parte superior. Definicin. El numero de grados de libertad para un conjunto de datos muestrales recolectados es el numero de valores muestrales que pueden variar despus de haber impuesto cierta restricciones a todos los valor de los datos. Por ejemplo, si 10 estudiantes tienen puntuaciones de examen con una media de 80, podemos asignar con libertad valores a las primeras 9 puntuaciones, pero la decima puntuacin se calcula la suma de las 10 puntuaciones debe ser 800 entonces la decima puntuacin debe ser a 800 menos la suma de la primeras 9 puntuaciones. Puesto que esas 9 primeras puntuaciones pueden seleccionarse con libertad para adoptar cualquier valor, decimos que existen 9 grados de libertad disponibles. Para las aplicaciones de esta seccin el nmero de grados libertad es simplemente el tamao muestral menos 1. Grados de libertad = n 1. Una muestra de tamao n=23 es una muestra aleatoria simple seleccionada de una poblacin distribuida normalmente. Calcule el valor crtico 2 correspondiente a un nivel de confianza del 95%. Puesto que n=23, el numero de grados de libertad est dado por n-1 =22. Utilizando la tabla A-3, localizamos el rengln 22 con respecto a la columna de la extrema izquierda. Al igual que en la seccin anterior, un nivel de confianza de 95% corresponde a = 0.05, de manera que encontramos los valores listados en la columna para un rea de 0.05 en dos colas. El valor correspondiente el rengln para 22 grados de libertad y la columna para unencontrar rea de 0.05 en dos colas es 2.074; entonces ahora el que sabemosde margen cmo error E de ese intervalo valores de crticos confianza. denotados por 2 podemos describir 2 = 2.074

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 42

El margen de error E para la estimacin de Formula 1.4 = / Donde /

(con

desconocidas). / .

tiene n -1 grados de libertad. La tabla A-3 lista valores de (con desconocidas).

Intervalos de confianza para la estimacin de -E< +E Donde = / <

Procedimiento para construir un intervalo de confianza para desconocidas).

(con

1. Verifique que los requisitos se satisfacen.(tenemos una muestra aleatoria simple y la poblacin parece estar distribuida normalmente o n>30). 2. Utiliza n -1 grados de libertad, remtase a la tabla A-3 y encuentre el valor crtico / que corresponde al nivel de confianza deseado. (para el nivel de confianza, remtase al rea en dos colas). 3. Evalu el margen de error = /2 / 4. Utilizando el valor del margen de error E calculando y el valor de la media muestral , calcula los valores de -E y +E. sustituya estos valores en el formato general para el intervalo de confianza: - E < < +E O E ( - E, +E) 5. Redondee los lmites del intervalo de confianza resultantes. Si utiliza el conjunto original de datos, redondee a un decimal mas que se usa para el conjunto original de datos. Si utiliza un resumen de estadsticos ( , , ), redondee los lmites del intervalo de confianza al mismo nmero de lugares decimales utilizados para la medida muestral. Ahora listamos las propiedades importantes de la distribucin t que utilizamos en esta seccin. Propiedades importantes de la distribucin t de Student. 1. La distribucin t de Student es diferente para distintos tamaos de muestra.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 43

2. La distribucin t de student tiene la misma forma de campana simtrica que la distribucin normal estndar, pero refleja una mayor variabilidad (con distribuciones ms amplias) de lo que se espera con muestras pequeas. 3. La distribucin t student tiene una media de t=0 (as como la distribucin normal estndar tiene una medida de z=0). 4. La desviacin estndar de la distribucin t de student varia con el tamao muestral, pero es mayor que 1(a diferencia de la distribucin normal estndar tiene =1) 5. Conforme el tamao muestral n se hace ms grande, la distribucin t de Student se acerca ms a la distribucin normal estndar.

Dis6tr. ibucin normal est7.ndar.

Distribucin t de Student con n =12

0 Ejercicios: Suponiendo que usted planea construir un intervalo de confianza para la media poblacional , utilice los datos para determinar si el margen de error debe calcularse utilizando un valor critico de la distribucin normal (z) o un valor critico de (t) o de ninguno de estos. a) n=150, =100, s=15, y la poblacin tiene una distribucin sesgada b) n=8, =100, s=15, y la poblacin tiene una distribucin normal c) n=8, =100, s=15, y la poblacin tiene una distribucin muy sesgada Ejemplo: en un estudio de los efectos sobre los bebes del consumo de cocana durante el embarazo, se obtuvieron los siguientes datos de pesos al nacer: n= 190, =2700g, s=645g. el diseo del estudio justifica el supuesto de que la muestra puede tratarse como una muestra aleatoria simple. Utilice los datos muestrales para construir un estimado del intervalo de confianza del 95% de , el peso medio al nacer de todos los bebes hijos de
Instituto Tecnolgico Superior de Tierra Blanca Pgina 44

madres que consumieron cocana durante el embarazo.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 45

El valor crtico es /2= 1.972. En la tabla A-3 encontramos que el valor crtico corresponde a n-1= 189 grados de libertad y un rea en dos colas de 0.05. Como la tabla A-3 no incluye gl=189, utilizamos el valor critico ms cercano de 1.972. Calcule el margen de error E: el margen de error E= 2.97355 se calcula utilizando la = 1.972* 645/ = 92.276226 formula 1.4: = /

Ahora calcularemos el intervalo de confianza: indica a continuacin: -E< < +E

= 2700g y E= 92.276226, como se

2700- 92.276226 << 2700 + 92.276226 2607.7238 < < 2792.2762 Con base en los datos muestrales, tenemos una confianza del 95% de que los limites de de 2608 g y 2792 g realmente contienen el valor del peso medio al nacer.

EJERCICIOS: El peso perdido por una dieta de slim fast: 95% de confianza; n=40, s=4.9 kg. (Suponga que la poblacin tiene una distribucin normal) a) calcule el margen de error b) calcule el intervalo de confianza para la media poblacional Estimacin de la varianza poblacional. Requisitos: 1. La muestra es aleatoria simple. 2. La poblacin debe tener valores distribuidos normalmente (aun si la muestra es grande) El supuesto de una poblacin distribuida normalmente se menciono en secciones anteriores, pero este requisito es mucho ms importante aqu. Para los mtodos de esta seccin, los alejamientos de una distribucin normal pueden generar errores muy graves. En consecuencia, el requisito de tener una distribucin normal es mucho ms estricto, y debemos revisar la distribucin de los datos construyendo histogramas y graficas cuantilares normales. Cuando consideramos estimados de proporciones y medias, utilizamos las distribuciones normales y t de Student. Cuando desarrollamos estimados de varianza o desviaciones estndar utilizamos otra distribucin, conocida como la distribucin chi cuadrada. Examinaremos caractersticas importantes de esta distribucin antes de proceder con el desarrollo de intervalos de confianza. =3.0 kg,

Distribucin chi cuadrada. En una poblacin distribuida normalmente, con varianza , suponga que seleccionamos al azar muestras independientes de tamao n y, para cada muestra calculamos la varianza muestral (que es el cuadrado de la desviacin estandar muestral s). El estadstico muestral =(n-1) / tiene una distribucin llamada distribucin chi cuadrada. Distribucin chi cuadrada. Formulacin 1.5 Donde n= tamao muestral = Varianza muestral = varianza poblacional Denotamos chi cuadrada por , que se pronuncia ji cuadrada. Para calcular valores crticos de la distribucin chi cuadrada, remitida a la tabla A-4. La distribucin chi cuadrada se determina por el nmero de grados de libertad y en este captulo usamos n1 grados de libertad. Grados de libertad = n-1. En captulos posteriores encontramos situaciones en las que grados de libertad no son n-1, por lo que no debemos hacer la generalizacin incorrecta de que el nmero de grados de libertad es siempre n- 1. Propiedades de la distribucin del estadstico chi cuadrada 1. La distribucin chi cuadrada no es simtrica, a diferencia de las distribuciones normales y t de student. 2. Los valores de chi cuadrada pueden ser cero o positivos, pero no puede ser negativos. Puesto que la distribucin chi cuadrada es sesgada y no simtrica, el intervalo de confianza no se ajusta al formato de y debemos hacer clculos se parados para los limites de confianza superior e inferior. Si se utiliza la tabla A-4 para calcular valores crticos, observe su siguiente caracterstica: En la tabla A-4 cada valor critico de corresponde a una rea que se encuentra en el rengln superior de la tabla, y esa rea representa la re un intervalo de regin acumulativa localizada a la derecha del valor critico. La tabla A-2 para la distribucin normal estndar proporciona rea acumulativa de la =
( )

izquierda pero la tabla A-4 para la distribucin chi cuadrada provee reas acumulativas de la derecha.

Procedimientos para construir un intervalo de confianza para 1. Verifique que los requisitos se satisfagan. (la muestra es aleatoria simple y un histograma o grafico cuantiar normal sugiere que la poblacin tiene una distribucin que es muy cercana a la distribucin normal). 2. Utilizando n-1 grados de libertad, remtase a la tabla A-4 y encuentre los valores crticos correspondiente al nivel de confianza deseado. 3. Evala los lmites del intervalo de confianza e inferior utilizando el siguiente formato para el intervalo de confianza.
( )

<

<(

4. Si se desea un estimado del intervalo de confianza de , calcule la raz cuadrada de los lmites del intervalo de confianza superior e inferior y cambie por . 5. Redondee los lmites del intervalo de confianza resultantes. Si se utiliza el conjunto original de datos, redondee a un decimal ms del que se usa para el conjunto original del dato. Si se utiliza la desviacin estndar o varianza muestrales redondee los lmites del intervalo de confianza al mismo nmero de espacios decimales. Ejemplo: En la actualidad las monedas de 1 centavo de dlar se acuan con una desviacin estndar de .0165g. se prueba un nuevo equipo con la intencin de mejorar la calidad al reducir la variacin. Se tiene una muestra aleatoria simple de 10 monedas de 1 centavo acuadas con el equipo nuevo. Una grafica cuantilar normal y un histograma indican que los pesos provienen de una poblacin distribuida normalmente, y la muestra tiene una desviacin entandar de 0.0125 g. utilice los resultados muestrales para construir un estimado de un intervalo de confianza del 95% de , la desviacin estndar de los pesos de monedas de 1 centavo fabricadas con el equipo nuevo. Con base en los resultados, parce que el equipo nuevo sirve para reducir la variacin de los pesos? Solucin: el tamao muestral es n=10 de manera que hay 9 grados de libertad , buscamos en la tabla A-4 el valor de los nueve grados de libertad y revisamos las columnas con reas de .975 y .025 los valores crticos de son = 2.700 y =19.023 Usando los valores crticos de 2.700 y 19.023, la desviacin estndar muestral de s=.0125 y el tamao muestral de 10, construimos el intervalo de confianza al evaluar lo siguiente:
( ). .

<

<

) . .

= .0086<

<.0228

Con base en este resultado, tenemos una confianza del 95% de que los limites de .0086g y .0228 g contienen el valor real de .

Pruebas de Hiptesis para una muestra 1.- introduccin Dentro del estudio de la inferencia estadstica, se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parmetro poblacional en la cual se puede emplear el mtodo de muestreo y el teorema del valor central lo que permite explicar cmo a partir de una muestra se puede inferir algo acerca de una poblacin, lo cual nos lleva a definir y elaborar una distribucin de muestreo de medias muestrales que nos permite explicar el teorema del lmite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una poblacin. Pero es necesario tener conocimiento de ciertos datos de la poblacin como la media, la desviacin estndar o la forma de la poblacin, pero a veces no se dispone de esta informacin. En este caso es necesario hacer una estimacin puntual que es un valor que se usa para estimar un valor poblacional. Pero una estimacin puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el parmetro poblacional buscado. Tambin se utiliza una estimacin mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el parmetro poblacional En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveracin acerca de un parmetro poblacional este mtodo es denominado Prueba de hiptesis para una muestra. 2.- Hiptesis Y Prueba De Hiptesis Tenemos que empezar por definir que es una hiptesis y que es prueba de hiptesis. Hiptesis es una aseveracin de una poblacin elaborado con el propsito de poner a prueba, para verificar si la afirmacin es razonable se usan datos. En el anlisis estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se hacen las pruebas para verificar la aseveracin o para determinar que no es verdadera. Por tanto, la prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora de probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable. Prueba de una hiptesis: se realiza mediante un procedimiento sistemtico de cinco pasos:

Siguiendo este procedimiento sistemtico, al llegar al paso cinco se puede o no rechazar la hiptesis, pero debemos de tener cuidado con esta determinacin ya que en la consideracin de estadstica no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba ms all de una duda razonable. Analizaremos cada paso en detalle Objetivo de la prueba de hiptesis. El propsito de la prueba de hiptesis no es cuestionar el valor calculado del estadstico (muestral), sino hacer un juicio con respecto a la diferencia entre estadstico de muestra y un valor planteado del parmetro. 3.- Procedimiento sistemtico para una prueba de hiptesis de una muestra Paso 1: Plantear la hiptesis nula Ho y la hiptesis alternativa H1. Cualquier investigacin estadstica implica la existencia de hiptesis o afirmaciones acerca de las poblaciones que se estudian. La hiptesis nula (Ho) se refiere siempre a un valor especificado del parmetro de poblacin, no a una estadstica de muestra. La letra H significa hiptesis y el subndice cero no hay diferencia. Por lo general hay un "no" en la hiptesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hiptesis nula es una afirmacin que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parmetro. La hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. Es una afirmacin que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hiptesis nula es falsa. Se le conoce tambin como la hiptesis de investigacin. El planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parmetro. Paso 2: Seleccionar el nivel de significancia. Nivel de significancia: Probabilidad de rechazar la hiptesis nula cuando es verdadera. Se le denota mediante la letra griega , tambin es denominada como nivel de riesgo,

este trmino es ms adecuado ya que se corre el riesgo de rechazar la hiptesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba. Si suponemos que la hiptesis planteada es verdadera, entonces, el nivel de significacin indicar la probabilidad de no aceptarla, es decir, estn fuera de rea de aceptacin. El nivel de confianza (1-), indica la probabilidad de aceptar la hiptesis planteada, cuando es verdadera en la poblacin.

La distribucin de muestreo de la estadstica de prueba se divide en dos regiones, una regin de rechazo (conocida como regin crtica) y una regin de no rechazo (aceptacin). Si la estadstica de prueba cae dentro de la regin de aceptacin, no se puede rechazar la hiptesis nula. La regin de rechazo puede considerarse como el conjunto de valores de la estadstica de prueba que no tienen posibilidad de presentarse si la hiptesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hiptesis nula es falsa. El valor crtico separa la regin de no rechazo de la de rechazo. Tipos de errores Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de aceptacin de la Ho o de la Ha, puede incurrirse en error: Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y deba ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada cuando de hecho es falsa y deba ser rechazada. En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las consecuencias posibles.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 50

Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser posible. La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende de la diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms fcil encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el correspondiente parmetro de poblacin es grande, la probabilidad de cometer un error de tipo II, probablemente sea pequea. El estudio y las conclusiones que obtengamos para una poblacin cualquiera, se habrn apoyado exclusivamente en el anlisis de una parte de sta. De la probabilidad con la que estemos dispuestos a asumir estos errores, depender, por ejemplo, el tamao de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida siguen una distribucin normal Existe una relacin inversa entre la magnitud de los errores y : conforme a aumenta, disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadsticas. Lo ideal sera establecer y . En la prctica se establece el nivel y para disminuir el Error se incrementa el nmero de observaciones en la muestra, pues as se acortan los limites de confianza respecto a la hiptesis planteada .La meta de las pruebas estadsticas es rechazar la hiptesis planteada. En otras palabras, es deseable aumentar cuando sta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- ) La aceptacin de la hiptesis planteada debe interpretarse como que la informacin aleatoria de la muestra disponible no permite detectar la falsedad de esta hiptesis.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 51

Paso 3: Clculo del valor estadstico de prueba Valor determinado a partir de la informacin muestral, que se utiliza para determinar si se rechaza la hiptesis nula., existen muchos estadsticos de prueba para nuestro caso utilizaremos los estadsticos z y t. La eleccin de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o mas se utiliza el estadstico z, en caso contrario se utiliza el estadstico t. Tipos de prueba a) Prueba bilateral o de dos extremos: la hiptesis planteada se formula con la igualdad Ejemplo H0 : = 200 H1 : 200

b) Pruebas unilateral o de un extremo: la hiptesis planteada se formula con o H0 : 200 H1 : < 200 H0 : 200 H1 : > 200

En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar () poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor estadstico de prueba es z y se determina a partir de:

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 52

El valor estadstico z, para muestra grande y desviacin estndar poblacional desconocida se determina por la ecuacin:

En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional desconocida se utiliza el valor estadstico t.

Paso :4 Formular la regla de decisin SE establece las condiciones especficas en la que se rechaza la hiptesis nula y las condiciones en que no se rechaza la hiptesis nula. La regin de rechazo define la ubicacin de todos los valores que son tan grandes o tan pequeos, que la probabilidad de que se presenten bajo la suposicin de que la hiptesis nula es verdadera, es muy remota

Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 53

Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la regin en la que no se rechaza la hiptesis nula. Paso 5: Tomar una decisin. En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se compara con el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en una prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hiptesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula cuando no debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la hiptesis nula se acepte cuando debera haberse rechazado (error de tipo II). 4.- Ejemplo en la cual se indica el procedimiento para la prueba de hiptesis Ejemplo El jefe de la Biblioteca Especializada de la Facultad de Ingeniera Elctrica y Electrnica de la UNAC manifiesta que el nmero promedio de lectores por da es de 350. Para confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 das. Se considera el nivel de significancia de 0.05 Datos: Da 1 2 3 4 5 6 7 8 9 10 Usuarios 356 427 387 510 288 290 320 350 403 329 Da 11 12 13 14 15 16 17 18 19 20 Usuarios Da 305 21 413 22 391 23 380 24 382 25 389 26 405 27 293 28 276 29 417 30 Usuario 429 376 328 411 397 365 405 369 429 364

Solucin: Se trata de un problema con una media poblacional: muestra grande y desviacin estndar poblacional desconocida.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 54

Paso 01: Seleccionamos la hiptesis nula y la hiptesis alternativa Ho: 350 Ha: 350 Paso 02: Nivel de confianza o significancia 95% 0.05 Paso 03: Calculamos o determinamos el valor estadstico de prueba De los datos determinamos: que el estadstico de prueba es t, debido a que el numero de muestras es igual a 30, conocemos la media de la poblacin, pero la desviacin estndar de la poblacin es desconocida, en este caso determinamos la desviacin estndar de la muestra y la utilizamos en la formula reemplazando a la desviacin estndar de la poblacin.

Calculamos la desviacin estndar muestral y la media de la muestra empleando Excel, lo cual se muestra en el cuadro que sigue. Columna1 Media Error tpico Mediana Moda Desviacin estndar 372.8 9.56951578 381 405 52.4143965

Varianza de la muestra 2747.26897 Curtosis Coeficiente de asimetra Rango Mnimo Mximo 0.36687081 0.04706877 234 276 510

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 55

Suma Cuenta Nivel de confianza (95.0%)

11184 30 19.571868

Paso 04: Formulacin de la regla de decisin. La regla de decisin la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad de 0.05, es decir 0.025, est en cada cola. el rea en la que no se rechaza Ho est entre las dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96. Por consiguiente la regla de decisin: es rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor Z calculado no queda en la regin comprendida entre -1.96 y +1.96. En caso contrario no se rechaza la hiptesis nula si Z queda entre -1.96 y +1.96. Paso 05: Toma de decisin. En este ltimo paso comparamos el estadstico de prueba calculado mediante el Software Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el estadstico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la Biblioteca. One-Sample Z Test of mu = 350 vs not = 350 The assumed standard deviation = 52.414 N Mean SE Mean 95% CI Z P

30 372.800

9.569 (354.044, 391.556) 2.38 0.017

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 56

Conclusiones: Se rechaza la hiptesis nula (Ho), se acepta la hiptesis alterna (H1) a un nivel de significancia de = 0.05. La prueba result ser significativa. La evidencia estadstica no permite aceptar la aceptar la hiptesis nula.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 57

Prueba de una aseveracin respecto de una proporcin. Las aseveraciones sobre una proporcin poblacional suelen probarse utilizando una distribucin normal como aproximacin de la distribucin binomial. Requisitos: 1. Las observaciones muestrales son una muestra aleatoria simple 2. Se satisfacen las condiciones para una distribucin binomial 3. Se satisfacen las condiciones np5 y nq 5. El estadstico de prueba para probar una aseveracin sobre una proporcin es: =

Ejemplo: De los resultados de una encuesta a 703 empleados elegidos al azar, el 61% obtuvo trabajo por medio de redes de contacto. Utilice los datos muestrales, con un nivel de significancia de 0.05, para probar la aseveracin de que la mayora de los empleados (ms del 50%) consiguen su trabajo por medio de redes de contacto. Paso 0 : Analizar si se cumplen los requisitos: Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6

Paso 7 Paso 8

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 58

Cuando Gregor Mendel realiz sus famosos experimentos de hibridacin con chicharos, uno de ellos dio por resultados descendencia que consista en 428 plantas de chicharos con vainas verdes y 152 plantas de chicharos con vainas amarillas. Segn la teora de Mendel de los vstagos de chicharos de chicharos deban tener vainas amarillas. Utilice un nivel de significancia de 0.05 con el mtodo del valor P, para probar la aseveracin de que la proporcin de vstagos de chicharos con vainas amarillas es igual a . Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6

Paso 7 Paso 8

Minitab : Seleccione stat, Basic statics, 1 proportion, luego haga clic en el botn de summarized data. Introduzca el tamao de muestra y el numero de xitos y despus haga clic en Options y proceda a introducir los datos en el cuadro sde dialogo. Para el nivel de confianza introduzca el complemento del nivel de significancia. Para el valor de test proportion, ingrese la proporcin empleada en la hiptesis nula. Para alternative seleccione el formarto usado para la hiptesis alternativa. En vez de usar una aproximacin normal, el procedimiento determinado por Minitab consiste en determinar el valor P empleando un mtodo exacto. Para utilizar el mtodo de aproximacin normal presentado en este tema, haga clic en el botn de options y luego en el recuadro que dice use tests and interval based on normal distribution.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 59

EJERCICIOS: En los siguientes ejercicios examine la afirmacin dada, despus exprese la hiptesis nula y la hiptesis alternativa de manera simblica. (Asegrese de emplear el smbolo correcto. 1.- Ms del 25% de los usuarios de internet pagan sus facturas en lnea.

2.- El peso medio de mujeres que han ganado el ttulo de nuestra belleza Mxico es igual 54.8846 kg.

3.- Las puntuaciones del CI de los profesores universitarios tienen una desviacin estndar menor que 15, que es la desviacin estndar de la poblacin general.

Calcule los valores crticos siguientes: 1.- prueba de dos colas; =0.05 2.- prueba de cola derecha; =0.01 3.- =0.10; 4.- =0.02; es p 0.17 es p < 0.19

Calcule el valor del estadstico de prueba z La aseveracin es que la proporcin de adultos que fumaron un cigarrillo la semana pasada es menor que 0.25, y los estadsticos de muestra incluyen n=1018 sujetos, de los cuales 224 dicen que fumaron un cigarrillo la semana pasada.

La aseveracin es que ms de 75% de los empleados estn satisfechos con su trabajo, y los estadsticos de muestra incluyen a 580 adultos empleados, de los cuales 516 afirman sentirse satisfechos con su trabajo.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 60

En uno de los famosos experimentos de Mendel sobre la hibridacin, se obtuvieron 8023 vstagos de chicharos y el 24.94% de ellos presentaba flores verdes. El resto tenia flores blancas. Considere una prueba de hiptesis que utiliza un nivel de significancia de 0.05 para probar la aseveracin de que la plantas de chicharos con flores verdes se presenta en una proporcin del 25% a) b) c) d) e) Cul es el estadstico de prueba? Cul es el valor crtico? Cul es el valor P? Cul es la conclusin? Se podra utilizar una hiptesis para probar que el porcentaje de plantas de chicharos con flores verdes es del 25% como se asever?

En 1997 una encuesta de 880 hogares estadunidenses revelo que 149 de ellos emplean el correo electrnico. Utilice los resultados de esta muestra para probar la aseveracin de que ms del 15% de los hogares estadunidenses emplean el correo electrnico. Use el nivel de significancia de 0.05. Sera vlida la conclusin aun hoy? Por qu?

Prueba de hiptesis respecto a una media con desviacin estndar poblacional conocida Los requisitos, el estadstico de prueba, los valores crticos y el valor P se resumen de la siguiente manera: 1. La muestra es aleatoria simple 2. Se conoce el valor de la desviacin estndar poblacional 3. Se satisface una o ambas de las siguientes condiciones: la poblacin se distribuye normalmente y n>30 El estadstico de prueba que se utiliza es el siguiente: = Ejemplo: un fabricante de equipo deportivo desarrolla un nuevo sedal sintetico que afirma tiene una resistencia media a la tensin de ocho kilogramos con una desviacin estndar de 0.5 kilogramos. Pruebe la hiptesis = 8 kilogramos contra la alternativa 8 kilogramos si se prueba una muestra aleatoria de 50 sedales y se encuentra que tienen una resistencia media a la tensin de 7.8 kg. Utilice un nivel de significancia de 0.01.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 61

Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6

Paso 7 Paso 8

Prueba de hiptesis respecto a una media con desviacin estndar poblacional desconocida Requisitos. 1.- La muestra es aleatoria simple 2.- Se desconoce el valor de la desviacin estndar poblacional El estadstico de prueba usado para este caso es: = Propiedades importantes de la distribucin t de Student 1.- Difiere para tamaos de muestra distintos 2.- Tiene la misma forma de campana que la distribucin normal estndar; su forma ms ancha refleja una mayor variabilidad, lo que se espera cuando se utiliza s para estimar . 3.- Tiene una media de t=0

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 62

4.- La desviacin estndar de la distribucin vara de acuerdo con el tamao muestral y es mayor que 1. 5.- Conforme aumenta el tamao muestral n, esta distribucin (t) se acerca ms a la distribucin normal estndar. Ejemplo: Control de calidad de los dulces m&m. el conjunto de datos sobre los dulces m&m que se mostro en secciones anteriores incluye los pesos de 13 dulces m&m rojos, elegidos al azar de una bolsa que contiene 465 m&m. A continuacin se presentan los pesos en gramos, los cuales tienen una media de = 0.8635 y una desviacin estndar de s= 0.0576 g. en el empaque se afirma que el peso neto del contenido es de 396.9 g, de manera que los m&m deben tener un peso medio de al menos 396.9/465 = 0.8535g para dar la cantidad anunciada. Utilice los datos muestrales con un nivel de significancia de 0.05, para probar la aseveracin que hizo un gerente de produccin de que los m&m tienen en realidad una media mayor que 0.8535 g, de manera que los consumidores estn recibiendo mas que la cantidad indicada en la etiqueta. Utilice el mtodo tradicional siguiendo el procedimiento descrito en el diagrama de flujo. Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6

Paso 7 Paso 8

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 63

Potencia de una prueba: La potencia de una prueba de hiptesis es la probabilidad (1- ) de rechazar una hiptesis nula falsa; se calcula utilizando un nivel de significancia particular y un valor especfico del parmetro de la poblacin que representa una alternativa al valor considerado como verdadero en la hiptesis nula. Es decir, la potencia de una prueba de hiptesis es la probabilidad de sustentar una hiptesis alternativa que es verdadera.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 64

Pruebatde1muestraparal amediadeRed Informededia gnstico


Ordendelosdatosenlahojadetrabajo Investigar valoresatpicos(marcadosenrojo).
1,0

0,9

0,8

0,7

Pote ncia Culeslaprobabilidaddedete ctarunadiferencia? <40% 60 % 90 % 100 %

Qudiferenciapuededetectarco nun tamaodemuest rade13? Diferencia Potencia

0,0496 55 Paraniveldesignif.=0,05ytama odelamuestra=13: Silamediaverdaderafueramayor queelobjetivopor 0,032162,ustedtendraunaprobabilid adde60%dedetectar ladiferencia.Sifuera0,049655 mayor,tendrauna probabilidadde90,

0,032162

0,032162 0,036769 0,042165 0,049655

60,0 70,0 80,0 90,0

Lapotenciaesunafuncindeltamaodelamuestraydeladesviacinestndar.Parad etectarunadiferenciamenorque0,042165,considere aumentareltamaodelamuestra.

Ejercicios. 1.- Suponga que se seleccion una muestra aleatoria simple de una poblacin distribuida en forma normal, obtenga la hiptesis nula, la alternativa, el estadstico de prueba, el valor P, el valor o valores crticos y establezca la conclusin final. Aseveracin: La puntuacin media del coeficiente intelectual de profesores de industrial es mayor que 120. Datos muestrales: n=21, =132, s=12. El nivel de significancia es = 0.05.

2.- el conjunto de datos 2 del apndice B incluye 106 temperaturas corporales con una media de 98.20 F y una desviacin estndar de 0.62F. Utilice un nivel de significancia

de 0.05 para probar la aseveracin de que la temperatura media corporal es menor que 98.6F. con base en esos resultados, Parece que la media de 98.6 F que suele utilizarse es errnea?

Curso de Estadstica Bsica Prueba de hiptesis respecto a una desviacin estndar Requisitos: 1.- La muestra es aleatoria simple 2.- La poblacin tiene una distribucin normal El estadstico que se utiliza para este tipo de pruebas es: =(

1) Valores P y valores crticos: Utilice la tabla A-4, con gl= n-1 para el numero de grados de libertad. Propiedades de la distribucin 1. La distribucin chi cuadrada no es simtrica, a diferencia de las distribuciones normales y t de student. 2. Los valores de chi cuadrada pueden ser cero o positivos, pero no puede ser negativos. Ejemplo: El mundo de la industria comparte esta meta en comn: mejorar la calidad reduciendo la variacin. Los ingenieros de control de calidad desean asegurarse que un producto tenga una media aceptable, pero tambin quieren producir artculos con una calidad consistente, eliminando los defectos. Crown ha fabricado latas de bebidas de cola con cantidades que tienen una desviacin estndar de 0.051 onzas. Se prueba una nueva mquina embotelladora, y una muestra aleatoria simple de 24 latas produce las cantidades en onzas que se listan a continuacin. (Las 24 cantidades tienen una desviacin estndar de s=0.039 oz). Utilice un nivel de significancia de 0.05 para probar la aseveracin de que las latas de bebidas de cola de la nueva mquina tienen cantidades con una desviacin estndar menor que 0.051 oz. 11.98 12.02 11.95 Paso 0 Paso 1 11.98 12.02 11.96 11.99 12.02 11.96 11.98 11.98 12.02 11.90 12.01 11.99 12.02 12.00 12.07 11.99 11.99 11.93 11.93 11.95 12.05

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 66

Curso de Estadstica Bsica Paso 2

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 67

Curso de Estadstica Bsica Paso 3 Paso 4 Paso 5 Paso 6

Paso 7 Paso 8

En los siguientes ejercicios pruebe la aseveracin dada. Suponga que se selecciona una muestra aleatoria simple de una poblacin distribuida normalmente. Utilice el mtodo tradicional de prueba de hiptesis. 1.- Se realiz un estudio de hijos de madres que consumieron cocana durante el embarazo y se obtuvieron los siguientes datos muestrales de pesos al nacer: n= 190, = 2700 g, y s=645. Utilice un nivel de significancia de 0.05 para probar la aseveracin de que la desviacin estndar de los pesos al nacer de hijos de consumidoras de cocana difiere de la desviacin estndar de 696 g de los pesos al nacer de los hijos de las mujeres que no consumieron cocana durante el embarazo. (como la tabla A-4 tiene un mximo de 100 grados de libertad, mientras que aqu se requieren 189 grados, utilice los siguientes valores crticos obtenidos por medio de software XL = 152.8222 y XR= 228.9638) Con base en el resultado, parece que la cocana consumida por las madres afecta la variacin de los pesos de sus bebs?

2.- utilice un nivel de significancia de 0.01 para probar la aseveracin de que los dulces M&M de cacahuate tienen pesos que varan mas que los pesos de los dulces M&M sencillos. La desviacin estndar de los pesos de los dulces M&M sencillos es de 0.056 g. una muestra de 41 dulces M&M de cacahuate tienen pesos con una desviacin estndar de 0.31g. Por qu los dulces de cacahuate tendrn pesos que varan mas que los pesos de los dulces sencillos?

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 68

Curso de Estadstica Bsica Inferencias a partir de dos muestras Inferencias acerca de dos proporciones Cuando se prueba una hiptesis acerca de dos proporciones poblacionales o cuando se construye un intervalo de confianza de la diferencia entre dos proporciones poblacionales, los requisitos y la notacin son los siguientes. Observe que cuando se prueba la hiptesis nula de p1=p2, no hay necesidad de estimar los parmetros individuales p1 y p2, si no que estimamos su valor comn con la proporcin muestral agrupada que se describe a continuacin. Requisitos: 1.- tenemos proporciones de dos muestras aleatorias simples que son independientes. 2.- Para ambas muestras, el nmero de xitos es de al menos 5 y el nmero de fracasos es de al menos 5. Proporcin muestral agrupada. = + +

Estadstico de prueba para dos proporciones (con Ho: p1=p2)

)( +

Donde p1-p2=0 (supuesto en la hiptesis nula) = = y + + =

=1 Utilice la tabla A-2. Ejemplo: La siguiente tabla incluye los resultados de una prueba clnica en la que se dio tratamiento a pacientes con sndrome del tnel carpiano. Utilice los datos muestrales de la tabla, con un nivel de significancia de 0.05 para probar la aseveracin de que la tasa de xito de la ciruga es mejor que la tasa de xito del entablillado.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 69

Curso de Estadstica Bsica Tabla de datos: tratamiento del sndrome del tnel carpiano Ciruga 67 73 92%
Tratamien to

xito un ao despus del tratamiento Nmero total de sujetos tratados Porcentaje de xito Paso 0

Entablillado 60 83 72%

Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6

Paso 7 Paso 8

Minitab: seleccione stat de la barra del men principal, luego seleccione basic statics, luego 2 proportions. Haga clic en el botn summarize Data e ingrese los valores muestrales. Haga clic en options e introduzca el nivel de confianza deseado. Si realiza una prueba de hiptesis, ingrese el valor aseverado de p1-p2, seleccione el formato para la hiptesis alternativa y haga clic en el cuadro para utilizar el estimado agrupado de p para la prueba. Haga clic en OK dos veces.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 70

Curso de Estadstica Bsica EJERCICIOS: Calcule el nmero de xitos x sugeridos por la afirmacin dada: 1.- De 976 sujetos encuestados, el 7% consumi una bebida alcohlica cada da.

Suponga que usted planea utilizar un nivel de significancia de =0.05 para probar la aseveracin de que p1=p2. Utilice los tamaos muestrales y los nmeros de xitos dados para calcular a) el estimado agrupado , b) El estadstico de prueba z. c)los valores crticos de z y d) el valor P 1.Grupo de tratamiento n1= 500 =100 Grupo Placebo n2=400 =50

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 70

Curso de Estadstica Bsica Correlacin Concepto clave: en esta seccin se explica el coeficiente de correlacin lineal r que es una medida numrica de la fuerza de la relacin entre dos variables que representan datos cuantitativos. Utilizando datos mustrales apareados (que en ocasiones se llaman datos bivariados), calculamos el valor de r (generalmente con recursos tecnolgicos) y luego utilizamos este valor para concluir que existe (o no) una relacin entre las dos variables. En esta seccin solo consideramos las relaciones lineales, lo que quiere decir que cuando se grafican, los puntos se aproximan al patrn de una lnea recta. Puesto que los programas de cmputo o las calculadoras suelen emplearse para calcular el valor de r, es importante enfocase en los conceptos de esta seccin, sin entretenerse demasiado con clculos aritmticos tediosos. Conceptos bsicos de correlacin Iniciamos con la definicin bsica de correlacin, un trmino que se utiliza comnmente en el contexto de una relacin entre dos variables. Defini ci n Una correlacin existe entre dos variables cuando una de ellas est relacionada con la otra de alguna manera. C oefi cien te de co rrel acin lin eal Puesto que el examen visual de los diagramas de dispersin es muy subjetivo, necesitamos medidas ms precisas y objetivas. Empleamos el coeficiente de correlacin lineal r, que sirve para detectar patrones lineales. Requisitos Dado cualquier conjunto de datos muestrales apareados siempre se puede calcular el coeficiente de correlacin lineal r, pero se deben satisfacer los siguientes requisitos cuando se prueban hiptesis o cuando se hacen inferencias acerca de r. 1. la muestra de datos apareados es una muestra aleatoria de datos cuantitativos. (es importante que los datos muestrales no se hayan reunido por medio de algn mtodo inapropiado, como una muestra de respuesta voluntaria). 2. El examen visual del diagrama de dispersin debe con firmar que los puntos se acercan al patrn de una lnea recta. 3. Es necesario eliminar cualquier valor extremo, si se sabe que se trata de un error. Los efectos de cualquier valor extremo, si se sabe que se trata de un error. Los efectos de cualquier otro valor extremo deben tomarse en cuenta calculando r con y sin el valor extremo incluido.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 71

Curso de Estadstica Bsica

Notacin para el coeficiente de correlacin lineal n x x (x) xy representa el numero de pares de datos presentes. denota la suma de los elementos indicados. denota la suma de todos los valores de x. indica que cada valor de x debe elevarse al cuadrado y despus deben sumarse esos cuadrados. indica que los valores de x deben sumarse y el total elevarse al cuadrado. Es sumamente importante evitar confundirse entre x y (x) indica que cada valor de x debe multiplicarse primero por su valor y correspondiente. Despus de obtener, todos estos productos, se calcula su suma. representa el coeficiente de correlacin lineal de una muestra. la letra griega rho se usa para representar el coeficiente de correlacin lineal de una poblacin.

Formula 1.6

=
(

( ) (

) )

)( ( )

) ( )

Interpretacin de r por medio de la tabla A-6: si el valor absoluto del valor calculado de r excede el valor de la tabla de A-6, concluya que existe una correlacin lineal significativa. De lo contrario, no existe evidencia suficiente para sustentar la conclusin de una correlacin lineal. Interpretacin de r por medio de un programa de cmputo: si el valor P calculado es menor o igual que el nivel de significancia, concluya que existe una correlacin lineal. De lo contrario, no existe evidencia para sustentar la conclusin de una correlacin lineal. Interpretacin del coeficiente de correlacin lineal Necesitamos interpretar un valor calculado de r, tal como el valor de -0.956 obtenido en el ejemplo anterior. Dada la manera en que la formula 1.6 est construida, el valor de r siempre debe estar entre -1 y +1, inclusive. Si r se acerca a 0, concluimos que no existe una correlacin lineal entre x y y, pero si r se acerca -1 o +1, concluimos que hay una correlacin lineal entre x y y. Interpretaciones tales como cercano a 0, a 1 o a -1 son vagas, por lo que utilizamos el siguiente criterio especifico de decisin:

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 72

Curso de Estadstica Bsica Uso de la tabla A-6: Si el valor absoluto del valor calculado de r excede el valor de la tabla A-6, se concluye que existe una correlacin lineal. De lo contrario, no existe evidencia suficiente para sustentar la con conclusin de una correlacin lineal. Uso de un programa de cmputo: si el valor P calculado es menor o igual que el nivel de significancia, se concluye que existe una correlacin lineal. De lo contrario, no existe evidencia suficiente para sustentar la conclusion de una correlacin lineal. Cuando en realidad no existe una correlacin lineal entre x y y, la tabla A-6 lista valores que son crticos en este sentido: separan valores comunes de r de aquellos que son poco comunes.

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 73

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 74

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 75

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 76

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 77

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 78

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 79

Curso de Estadstica Bsica

Instituto Tecnolgico Superior de Tierra Blanca

Pgina 80

Das könnte Ihnen auch gefallen