Beruflich Dokumente
Kultur Dokumente
II.- SUMILLA.
El curso est organizado en tres unidades: La primera unidad trata de Estadstica Descriptiva;
la segunda unidad est dedicada al estudio del Probabilidad; la tercera unidad se ocupa del
Estadstica Inferencial.
Al finalizar la asignatura el estudiante estar capacitado para describir y utilizar los mtodos
estadsticos descriptivos e inferenciales en el campo de la Agronoma.
1
Estadstica General ciclo 2013-I
4.1.2. Temtica:
ESTRATEGIA DE APRENDIZAJE
SEMANA CONTENIDO
Breve historia de la Estadstica.
1RA Definicin de estadstica
DISCUSION SOLUCION Y
y Tipos Estadstica.
GENERALIZACIN
2 DA Definicin de trminos estadsticos.
Recoleccin de datos. Tcnicas
Elaboracin de datos
Presentacin de datos en tablas de distribucin de
DISCUSION SOLUCION Y
3 RA frecuencias para variable discreta
GENERALIZACIN
Presentacin de datos en tablas de distribucin de
frecuencias para variable contina.
Interpretacin de tablas de distribucin de
frecuencias para los diferentes tipos de variables
Presentacin de datos en grficos. Grfico de barras
Grfico de sectores
Grfico de barras agrupadas
Grfico de barras compuestas.
Grfico de ramas y hojas
Pictograma
Grfico de Cajas
Grfico de Bastones
Histograma de Frecuencias
4 TA Polgono de Frecuencias.
DISCUSION
a Ojiva ascendente
SOLUCION Y GENERALIZACIN
8 VA Ojiva descendente
Medidas de Centralizacin. Promedio
Mediana
Moda
Cuartiles
Deciles
Percentiles
Medidas dispersin. Desviacin estndar
Coeficiente de variacin
Medidas de asimetra.
Medidas de Kurtosis.
Primer Examen
2
Estadstica General ciclo 2013-I
4.2.2. Temtica:
SEMANA ESTRATEGIA DE
APRENDIZAJE
CONTENIDO
Introduccin LECTURA
9NA Experimento aleatorio
Punto muestral, espacio muestral, evento o suceso DISCUSION SOLUCION
Tipos eventos. Y GENERALIZACIN
Probabilidad de un evento
Propiedades, Regla aditiva general de Probabilidad.
10 MA
Regla aditiva especial de Probabilidad. DISCUSION
Probabilidad Condicional.
SOLUCION Y
Regla general de la multiplicacin.
Regla especial de la multiplicacin o Probabilidad de GENERALIZACIN
Sucesos independientes.
Teorema de Bayes
PROBLEMAS
Distribuciones muestrales La distribucin Binomial.
11 RA
La distribucin de Poisson. DISCUSION
Distribucin Hipergeomtrica
Distribucin Normal. SOLUCION Y
Segundo Examen. GENERALIZACIN
3
Estadstica General ciclo 2013-I
ESTRATEGIA DE
APRENDIZAJE
SEMANA CONTENIDO
Introduccin
12DA
Importancia LECTURA
Estimacin intervlica
Intervalo de confianza para estimar el promedio DISCUSION SOLUCION
poblacional Y GENERALIZACIN
Intervalo de confianza para estimar la diferencia de
promedios poblacionales (dos casos)
Intervalo de confianza para estimar la proporcin
poblacional.
13RA
Intervalo de confianza para estimar la diferencia DISCUSION
entre proporciones poblacionales.
Y SOLUCION Y
Intervalo de confianza para estimar la varianza
poblacional Intervalo de confianza para estimar la GENERALIZACIN
14 TA varianza poblacional.
Intervalo de confianza para estimar la razn de
varianzas poblacionales
Hiptesis estadstica y prueba de hiptesis.
Prueba de hiptesis: hiptesis unilaterales y bilaterales
Prueba de hiptesis para promedios.
15 TA
Prueba de hiptesis para la diferencia de promedios
poblacionales (dos casos)
A Prueba de hiptesis para la proporcin poblacional.
Prueba de hiptesis para la diferencia entre EJERCICIOS
17 MA proporciones
Prueba de hiptesis para la varianza DISCUSION
Prueba de hiptesis para razn. SOLUCION Y
Tercer Examen GENERALIZACIN
Examen sustitutorio
V.- METODOLOGA
Las estrategias metodolgicas a utilizar para el mejor aprendizaje son:
2 P . E . U .+ P .T . A .
P.F =
3
Donde:
4
Estadstica General ciclo 2013-I
P.E.U: Promedio de Exmenes de unidad, el mismo que debe ser mayor o igual a
10.5.
El alumno para ser aprobado en el curso deber obtener como promedio final una nota
de 10.5 a ms.
Tendrn derecho a rendir examen sustitutorio todos aquellos estudiantes que
cumplieron con rendir todas las evaluaciones y con entregar todos los trabajos,
adems tengan como promedio de exmenes no menor de 08, el cual reemplazar el
menor calificativo del examen de unidad.
8. MOYA CALDERON, Rufino: Probabilidad e inferencia estadstica. Ed. San Marcos. Lima -
Per. 2006. 807 pginas
5
Estadstica General ciclo 2013-I
ESTADISTICA GENERAL
HISTORIA DE LA ESTADSTICA
El trmino Estadstica que se utiliz hasta el siglo XVII como una abreviatura de la ciencia descriptiva de los
Estados, se identific cada vez ms, en el siglo XIX, con las cifras cuantitativas. Hacia 1830, en Francia e
Inglaterra, el trmino ya fue usado de forma general como sinnimo de la ciencia numrica de la sociedad.
Este cambio de significado se debi a que, desde 1800, los gobiernos de Europa Occidental y de Estados
Unidos comenzaron a recopilar y publicar sistemticamente una gran cantidad de registros de censos y de
otros tipos de tablas.
Aunque a lo largo del siglo XIX la teora de la probabilidad haba sido desarrollada por matemticos tales
como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su aplicacin al estudio de hechos
estadsticos fue casi inexistente, ya que la mayor parte de los estadsticos sociales de la poca se contentaban
con dejar que los datos hablaran por s mismos. En particular, en esa poca los estadsticos no estaban
interesados en sacar inferencias a partir de individuos, ms bien se centraban en la sociedad en su totalidad.
Por consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener censos de la poblacin
al completo. Como resultado, la inferencia probabilstica sobre la poblacin a partir de muestras era
prcticamente desconocida en las estadsticas sociales del siglo XIX
No fue hasta finales de este siglo cuando los estadsticos empezaron a preocuparse por inferir conclusiones a
partir de los datos numricos. El movimiento comenz con los trabajos de Francis Galton sobre el anlisis de
la influencia de la herencia a travs de la utilizacin de tcnicas que actualmente se conocen como anlisis de
regresin y correlacin, que alcanzaron su mayor auge con los trabajos de Karl Pearson. ste, que desarroll
los contrastes de bondad de ajuste, fue el primer director del laboratorio Galton, fundado por Galton en 1904.
All, Pearson lider un programa de investigacin con el objetivo de desarrollar nuevos mtodos en los que la
Estadstica se utiliza con fines inferenciales. Su laboratorio potenci que investigadores provenientes de
distintas reas de la ciencia y la industria aprendieran los mtodos estadsticos que podan tener aplicacin en
sus campos. Uno de los primeros estudiantes que acudi a su laboratorio fue W. S. Gosset qumico de
formacin, que demostr su devocin por Pearson y public sus propios trabajos bajo el seudnimo de
Student. Existe una famosa leyenda que mantiene que Gosset tema publicar sus trabajos, bajo su propio
nombre por miedo a que, en la fbrica de cerveza Guinnes, donde laboraba, sus jefes descubrieran que uno de
sus qumicos realizaba investigaciones estadsticas. Gosset es famoso por el desarrollo de los contrastes de t.
Dos de las reas ms importantes de aplicacin de la Estadstica a principios del siglo XX fueron la biologa y
la agricultura; todo ello gracias al inters de Pearson y de otros investigadores de su laboratorio, y tambin a
los logros del cientfico ingls Ronald A. Fisher. La teora de la inferencia desarrollada por estos
investigadores pioneros y otros entre los que se encuentran Egon Pearson, hijo de Karl Pearson, y el
6
Estadstica General ciclo 2013-I
estadstico matemtico polaco JersyNeyman- fue lo suficiente general como para tratar una amplia gama de
problemas cuantitativos prcticos. Como resultado, tras los primeros aos del siglo XX, aument muy
rpidamente el nmero de personas, procedente de la ciencia, los negocios y la administracin, que
empezaron a considerar la Estadstica como una herramienta capaz de suministrar soluciones cuantitativas a
una gran variedad de problemas cientficos y prcticos.
En la actualidad, podemos encontrar las ideas estadsticas en muchos mbitos. La Estadstica Descriptiva
puede verse en peridicos y revistas. La Inferencia Estadstica se ha hecho indispensable en las
investigaciones mdicas y de salud pblica, en la investigacin de mercados y en el control de calidad, en la
educacin, la contabilidad, la economa, en la prediccin meteorolgica o de las votaciones, y en muestreos,
deportes, seguros, en juego de apuestas y en cualquier tipo de investigacin que pretenda ser cientfica. Hoy
en da, la Estadstica se ha convertido realmente en una pieza integrante de nuestra herencia.
La Estadstica tiene el objeto de realizar una representacin fiable de un Estado en una poca determinada
(Quetelet, 1849)
La Estadstica es la nica herramienta mediante la cual se puede conseguir una apertura en la formidable
espesura de dificultades que entorpece el camino de aquellos que estudian la Ciencia del hombre (Galton,
1889)
La Estadstica puede considerarse (i) como el estudio de las poblaciones, (ii) como el estudio de las
variaciones y (iii) como el estudio de los mtodos de reduccin de datos (Fisher, 1925).
La Estadstica es el nombre de la ciencia que trata de llevar a cabo inferencias bajo situaciones de
incertidumbre; para ello, usa los nmeros para averiguar cuestiones relativas a la naturaleza y la experiencia.
(Weaver, 1952).
La Estadstica se caracteriza en el siglo XX como una herramienta matemtica para analizar datos
experimentales u observados. (Ross, 2005).
Estadstica es la ciencia que nos ayuda a recolectar, organizar, presentar, analizar e interpretar datos para una
toma de decisin ms efectiva.(Alvaro Pintado-Agurto Mejia,2009).
CLASIFICACIN DE LA ESTADSTICA
7
Estadstica General ciclo 2013-I
Es de esperar que el sacar estas conclusiones siempre exista una pequea probabilidad de error, pues la
inferencia es inductiva.
8
Estadstica General ciclo 2013-I
El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo de
investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qu unidad se
tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de
efectuar la toma de la informacin.
5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA
Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen una o
varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes; una poblacin
puede estar constituida por los habitantes de un pas o por los peces de un estanque, as como por los
establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino infinito no
est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro de un estanque son un
conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado como infinito.
Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar las
propiedades del conjunto del cual es obtenida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es aconsejable, ya
sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es
necesario destruir lo que se est midiendo, por ser demasiado grande el nmero de sus componentes o no se
pueden controlar; por eso se recurre al anlisis de los elementos de una muestra con el fin de hacer inferencias
respecto al total de la poblacin. Existen diversos mtodos para calcular el tamao de la muestra y tambin
para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos
solamente que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para
asegurar la objetividad de la investigacin.
6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual ha de partir,
a menos que se tenga experiencia con muestras anlogas, de una o varias muestras piloto en las cuales se
pondrn a prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de la poblacin, con el
fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de los parmetros con la
precisin establecida.
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es determinar si
la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes directos que recojan la
informacin; establecer su nmero ptimo y preparar su entrenamiento adecuado.
9
Estadstica General ciclo 2013-I
preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin de las diferentes variables que
intervienen en la investigacin.
El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas, manualmente
dispendiosas, puedan ser realizadas en corto tiempo.
8. LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al lector sobre lo
que se pretende describir; para su fcil interpretacin una tabla debe tener por lo menos: Un ttulo adecuado el
cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subttulos internos y la
cuantificacin de los diferentes tems de las variables, y las notas de pie de cuadro que hagan claridad sobre
situaciones especiales de la tabla, u otorguen los crditos a la fuente de la informacin.
9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los cuadros,
tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se van a presentar y la
forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes que, antes que
claridad, crean confusin. Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe
hacerse no slo en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe.
10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones de
primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la
toma de una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los parmetros y
estadsticos mustrales para las estimaciones e inferencias respecto a la poblacin, el ajuste de modelos y las
pruebas de las hiptesis planteadas, con el fin de establecer y redactar las conclusiones definitivas.
11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del mismo problema
a quienes se les puede aportar informacin, conocimientos y otros puntos de vista acerca de l.
TIPOS DE DATOS
Los especialistas en Estadstica analizan un amplia variedad de fenmenos o caractersticas, llamadas
variables aleatorias. Los datos son los hechos y nmeros, resultantes de la observacin de estas variables
aleatorias. Indudablemente una variable aleatoria puede tomar diferentes valores o atributos de una
observacin a otra.
Si una caracterstica de nuestro inters puede tomar distintos valores o tienen diferentes resultados, se
denomina variable
VARIABLE
Es una caracterstica o propiedad que puede tomar diferentes valores o atributos. Ejemplo: rendimiento
acadmico, religin, talla, etc.
10
Estadstica General ciclo 2013-I
Nmero de hijos 2, 3, 4
CLASIFICACIN DE VARIABLES
Antes de considerar aspectos relacionados con la recopilacin, descripcin reduccin y anlisis de datos
estadsticos, es necesario distinguir y conocer los diversos tipos de variables que se pueden encontrar en
los diversos estudios e investigaciones. Entre los muchos criterios de clasificacin, podemos mencionar
tres tipos:
11
Estadstica General ciclo 2013-I
Ejemplos:
El volumen de ventas (VD) se explica por la inversin en publicidad (VI)
El gasto familiar (VD) depende del ingreso familiar (VI)
Ventas de casas (VD) depende de la tasa de inters (VI)
Ejemplos:
El escaso fomento de la educacin alimentaria en la poblacin, genera mayor desnutricin
infantil en las familias con bajo nivel de instruccin.
Educacin alimentaria (VI)
Desnutricin infantil (VD)
Nivel de instruccin (V. Interviniente)
El bajo nivel de instruccin, es uno los factores que posibilita el poco inters de los padres, en el
control de crecimiento y desarrollo de los nios de familias de estrato socio econmico bajo.
Nivel de instruccin (VI)
Crecimiento y desarrollo (VD)
Estrato socio econmico (V. Interviniente)
12
Estadstica General ciclo 2013-I
Ejemplo:
Lugar de nacimiento (Lambayeque, Lima, Ica, Cuzco, etc.)
Deporte que practica ( Futbol, Bsquet, Vley, Natacin)
Colegio de Procedencia (Estatal, Particular)
Las variables que slo tienen dos categoras se llaman variables dicotmicas.
2.- Escala Ordinal
Es el segundo nivel de medicin donde las variables establecen categoras jerarquizadas, pero no grados de
distancia iguales entre ellas; las categoras expresan una posicin de orden.
Ejemplo:
Orden de mrito acadmico en un colegio (primero, segundo, tercero, etc.)
Nivel de calificacin a alguna autoridad pblica ( Muy bueno, bueno, regular, malo y muy malo)
Grado de instruccin (Sin instruccin, inicial, primaria, secundaria, superior no universitaria,
superior universitaria, post grado)
13
Estadstica General ciclo 2013-I
1.-NMERO DEL CUADRO.- Es el cdigo de identificacin del cuadro. Este nmero se escribe a
continuacin de la palabra cuadro, por ejemplo cuadro No 2.5, indica el quinto cuadro del captulo
dos.
2.- TTULO.- Es la identificacin que preside la tabla y es colocada en la parte superior de la misma. El ttulo
debe reunir las condiciones siguientes: a.- ser completo; b.- ser conciso.
a.- SER COMPLETO: Un ttulo completo debe indicar claramente cul es el contenido del cuadro
estadstico. Debe responder a las preguntas: Qu, Cmo, Dnde y Cundo
QUE: A qu se refiere la tabla que se estudia. Cul es el universo que se investiga. Ejemplo Alumnos
matriculados
COMO: Cmo se estudia, de acuerdo a cules caractersticas se clasifican los individuos u objetos
estudiados. Las variables ubicadas en las filas se identifican con la proposicin segn y las de las
columnas con la proposicin por Ejemplo Por sexo y segn especialidad
CUANDO: Momento o periodo de tiempo a que se refiere el estudio. Ejemplo Ciclo 2011 - II
DONDE: Lugar a que se refiere la informacin. Ejemplo Universidad Particular de Chiclayo
b.- SER CONCISO.- El ttulo debe ser breve, lo ms conciso posible, aunque no debe sacrificarse la
claridad a la concisin.
3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la informacin y consta de un
conjunto de casillas o celdas, dispuestas en columnas y filas. Sus elementos esenciales son:
encabezamiento de las columnas, columna principal o matriz y cuerpo.
ENCABEZAMIENTO.- Es la primera fila del cuadro, en l se explica las categoras, y el objeto de cada
una de las columnas, es decir indica la naturaleza de los datos inscritos en cada una de las celdas que se
hallan debajo. Deben ser breves y explcitos.
COLUMNA PRINCIPAL O MATRIZ.- Es aquella en que se anotan las categoras o las diferentes clases
de la escala de clasificacin utilizada.
CUERPO.- Es el conjunto de celdas o casillas, que son las intersecciones de filas y columnas, donde
estn anotados los datos numricos.
4.- NOTAS EXPLICATIVAS O CALCE O NOTA DE PIE O LLAMADAS: Se usa para aclarar algunos
trminos o siglas tambin para indicar que elementos estn o no incluidos en algunos de los conceptos del
cuadro.
5.- FUENTE.- Sirve para nombrar la publicacin, entidad, estudio o fuente de donde se obtuvieron los datos
utilizados para construir el cuadro.
Hay dos tipos de fuentes:
a.- Primaria.- Cuando se obtiene directamente de la unidad de anlisis o cuando se recurre a los
propios formularios de una encuesta.
b.- Secundaria.- Cuando se recurre a documentos, boletines o cuadros estadsticos publicados.
14
Estadstica General ciclo 2013-I
Las tablas de frecuencia o distribucin, son tablas de trabajo estadstico, que presentan la distribucin de un
conjunto de elementos agrupados o clasificados en las diversas categoras de las variables. Las tablas
presentan diversos tipos de frecuencia (absoluta, relativa o acumulada).
Para construir una tabla de frecuencias se siguen los siguientes pasos:
a.- La clasificacin.- que consiste en determinar las categoras, los distintos valores que toman las variables
o los intervalos de clase.
b.- Tabulacin.- que consiste en contabilizar cuantas veces se repite cada uno de los distintos valores o
categoras de las variables.
Con esta informacin construir una tabla de distribucin de frecuencia para la variable estado civil (X) y
representarla grficamente.
1.- Clasificacin.- Se identifican las clases o categoras que corresponden a la variable cualitativa, las cuales
deben ser mutuamente excluyentes.
Clase Conteo f i ni
Soltero ///// / 6
Casado ///// // 7
Divorciado //// 4
Viudo /// 3
Tabla No 1
Distribucin de 20 obreros de la empresa Techito de Chiclayo, segn su estado civil. Abril 2012.
15
Estadstica General ciclo 2013-I
Soltero 6 30
Casado 7 35
Divorciado 4 20
Viudo 3 15
Total 20 100
Interpretacin: El 30% de obreros son solteros (6), el 35% son casados (7), el 20% son divorciados (4) y el 15
% son viudos (15).
Grfico No 1
Distribucin de 20 obreros de la empresa Techito de Chiclayo segn su estado civil. Abril 2013
Ejemplo.- Se realiza un estudio para determinar el nmero de trabajadores que emplea las pequeas empresas
del Departamento de Lambayeque, para lo cual se tom una muestra de 20 pequeas empresas
determinndose los siguientes datos
X1 X6 X 11 4 X 16 3
6 3
X2 X7 X 12 5 X 17 4
5 4
X3 X8 X 13 6 X 18 6
4 4
16
Estadstica General ciclo 2013-I
X4 X9 X 14 2 X 19 5
4 5
X5 X 10 X 15 4 X 20 3
5 5
Clasificacin.- En este caso se identifican los distintos valores que tiene Xi y ubicamos el mayor y menor
valor: X min =2 y X m x =6
Los diferentes valores que toma la variable Xi los vamos a denotar por Yi ni
Tabla No 2
Distribucin del nmero de trabajadores en 20 pequeas empresas del Departamento de Lambayeque. Agosto
2013.
2 / 1
3 /// 3
4 ///// // 7
5 ///// / 6
6 /// 3
Total 20
Clases.- (m, K) se llaman clases a cada uno de los grupos en los que se divide el conjunto de datos.
K = 2,5 4 n
K = 1 + 3,3 log n
17
Estadstica General ciclo 2013-I
5 K 20
Rango. - (R) Diferencia entre la observacin que tiene el valor mximo y la observacin que tiene el valor
minino, tambin se conoce como recorrido amplitud total.
R= X M X m
Intervalo de clase (I).- es el cociente que resulta de dividir la amplitud total rango entre el nmero de
clases.
Y 'i 1 y 'i ni hi Ni Hi
'
yi
Y '0 Y1 n1 h1 N1 H1
'
y1
Y1
'
Y2 n2 h2 N2 H2
'
y 2
Y 'm 1 Ym nm hm Nm Hm
'
ym
Frecuencia absoluta-Llamada tambin frecuencia absoluta simple, es el nmero de veces que se repite los
valores dentro de las diferentes clases (intervalo) en la que est dividida la informacin
Frecuencia relativa.- se denomina frecuencia relativa del valor y i al cociente de la frecuencia absoluta
de y i y el nmero total de observaciones. Se denota por hi
Frecuencia absoutade yi n
hi= = i
N mero tota de observaciones n
18
Estadstica General ciclo 2013-I
2
N 2= n j=n1+ n2
j=1
3
N 3= n j=n1+ n2 +n3
j=1
4
N 4 = n j=n1 +n2 +n 3+ n4
j=1
5
N 5= n j=n1+ n2 +n3 +n 4+ n5
j=1
Y as sucesivamente
Frecuencia relativa acumulada.- se llama frecuencia relativa acumulada del valor yi a a frecuencia
relativa total de las observaciones menores o iguales a yi
Se denota como Hi
Entonces tenemos:
1
H 1= h j=h 1
j=1
2
H 2= h j=h1+ h2
j=1
3
H 3= h j=h1+ h2+ h3
j=1
4
H 4 = h j=h1 +h2 +h3 + h4
j =1
19
Estadstica General ciclo 2013-I
5
H 5= h j=h1+ h2+ h3 +h4 + h5
j=1
As sucesivamente
ni 0 y N i 0 para i 1, 2, 3,., m
2.- La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de observaciones.
ni= n1+ n2+ +nm =n
m
i=1
3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre nmero fraccionados no
negativos, no mayores de uno.
0 hi 1 0 Hi para i= 1, 2, ., m
3.- La frecuencia absoluta acumulada correspondiente al valor y m coincide con el nmero total conjunto
de observaciones.
m
N m= ni=n
i=1
n1=N 1 N 2 . N m Para i = 1, 2, , m
h1=H 1 H 2 . H m Para i = 1, 2, ,m
Ejemplo
Suponga que se han registrado 50 observaciones referentes a la altura (cm.) de planta de arroz (Oryza sativa
L.) al momento de la cosecha
63 36 49 56 64 59 35 78 43 36 43 53 70 57 62
43 68 62 27 88 64 72 52 51 62 60 71 61 55 27
59 60 67 57 67 62 51 81 60 53 64 76 44 73 56
62 63 60 68 67
20
Estadstica General ciclo 2013-I
27 27 35 36 36 43 43 43 44 49 51 51 52 53 53
55 56 56 57 57 59 59 60 60 60 60 61 62 62 62
62 62 63 63 64 64 64 67 67 67 68 68 70 71 72
73 76 78 81 88
El rango ser
R = 88 27= 61
4
K =m = 2,5 50=6,647 7
El intervalo ser
61
I= =9,17
6,647
A continuacin calculamos:
Marca de clase (Y i ) . - es la semisuma de los lmites de clase. Es decir lmite inferior ms lmite superior
entre dos.
Frecuencia relativa.- se denomina frecuencia relativa del valor y i al cociente de la frecuencia absoluta
de y i y el nmero total de observaciones. Se denota por hi
Frecuencia absoutade yi n
hi= = i
N mero tota de observaciones n
n1 5 n 4 n 6
h1 = = =0,10 h2= 2 = =0,08 h3= 3 = =0,12
n 50 n 50 n 50
n4 19 n 11
h4 = = =0,38 h5= 5 = =0,22
n 50 n 50
Y as sucesivamente
Interpretacin
h1 : 0,10 se interpreta como la proporcin de plantas cuya altura est comprendida entre 27 y 36 cm.
Inclusive
21
Estadstica General ciclo 2013-I
h2 : 0,080 se interpreta como la proporcin plantas cuya altura vara desde 36 hasta 45 cm. inclusive
Y as sucesivamente
1
N 1= n j =n1
J =1
2
N 2= n j=n1+ n2=5+ 4=9
j=1
3
N 3= n j=n1+ n2 +n3=5+ 4+ 6=15
j=1
4
N 4 = n j=n1 +n2 +n 3+ n4 =5+4 +6+19=34
j=1
5
N 5= n j=n1+ n2 +n3 +n 4+ n5=5+ 4+ 6+19+11=45
j=1
Y as sucesivamente.
Interpretacin.-
N 2=9 Significa que hay 9 plantas cuya altura de planta est comprendida entre 27 y 45 cm. Inclusive..
Frecuencia relativa acumulada.- se llama frecuencia relativa acumulada del valor yi a a frecuencia
relativa total de las observaciones menores o iguales a yi
Se denota como Hi
I
H i = h j
j=1
22
Estadstica General ciclo 2013-I
1
H 1= h j=h 1=0,10
j=1
2
H 2= h j=h1+ h2=0,10+0,08=0,18
j=1
3
H 3= h j=h1+ h2+ h3=0,10+ 0,08+0,12=0,30
j=1
4
H 4 = h j=h1 +h2 +h3 + h4=0,10+0,08+0,12+0,38=0,68
j =1
5
H 5= h j=h1+ h2+ h3 +h4 + h5=0,10+ 0,08+0,12+0,38+0,22=0.90
j=1
As sucesivamente
Interpretacin:
H 2 = 0,18, es la proporcin de las plantas cuya altura de planta varia de 27 45 cm. inclusive.
H 3 = 0,30 la proporcin de plantas cuya altura de plantas est comprendida entre 27 y 54 cm. inclusive.
As sucesivamente
Y 'i 1 Y 'i fi hi Fi Hi
'
yi
23
Estadstica General ciclo 2013-I
Interpretacin:
i=
5 plantas de arroz tienen una altura comprendida entre 27 y 36 cm respectivamente.
f i =n
h4 =0.38 38% de las 50 plantas de arroz tienen una altura comprendida entre 54ny 63 cm inclusive
REPRESENTACIN GRFICA
La aplicacin de grficos para la representacin del fenmeno estadstico, se le atribuye a William Playfair, a
fines del siglo XVIII. Un grfico es la representacin de un fenmeno estadstico por medio de figuras
geomtricas, (punto, lneas, rectngulo, etc.) cuyas dimensiones son proporcionales a la magnitud de los datos
representados. Su objeto principal es la representacin de los datos de forma grfica, que permita de un solo
golpe de vista darse cuenta del conjunto de elementos presentados y evidenciar sus variaciones y
caractersticas. El grfico es un auxiliar del cuadro estadstico, no lo sustituye sino que lo complementa.
. El grfico tiene la ventaja sobre el cuadro, de permitir apreciar ms rpidamente los datos y abarcar todo su
conjunto.
La construccin del grfico se basa en el cuadro estadstico, pero tiene sus limitaciones, como la siguiente:
. El grfico no puede presentar tantos grupos de datos como una tabla. Un cuadro puede tener 4 o ms
columnas de datos, sin embargo representado esto en un grfico, dificulta su comprensin.
. En los cuadros pueden darse valores exactos, en los grficos muchas veces solo valores aproximados.
PARTES DE UN GRFICO.
Al igual que en los cuadros estadsticos, en los grficos se considera las siguientes partes:
IMPORTANCIA
a.- Son esenciales en el estudio y presentacin de trabajos estadsticos. Los datos trasformados en dibujo
permiten un examen visual que constituye, la primera etapa de un anlisis e interpretacin de datos
b.- Permite observar en forma instantnea el comportamiento de la variable o variables materia de estudio.
c.-Permite formar una idea bastante aproximada sobre las tendencias de las variables en estudio.
Para graficar se utiliza el sistema cartesiano. El eje X o ejes de las abscisas se utiliza para poner la variable en
estudio y el eje Y o eje de ordenadas se utiliza para las frecuencias absolutas o relativas.
24
Estadstica General ciclo 2013-I
TIPOS DE GRFICOS
.- El espacio entre barra y barra debe ser la misma, y constituye la mitad del ancho de la barra.
.- El ancho de la barra debe ser el doble del espacio que se deja entre barra y barra.
.- El eje de las ordenas (Y), la longitud entre la escala y escala debe ser la misma que la longitud entre escala
y escala del eje de las abscisas (X).
.- Preferentemente construir las barras en orden decreciente de magnitud, en orden alfabtico, cronolgico,
etc.
Cuadro No 2
Pacientes atendidos en el Hospital Regional Docente Las Mercedes Chiclayo, segn grado de instruccin.
Mayo. 2012.
Grado de Instruccin ni f i hi
Analfabetos 36 45
Primaria 24 30
Secundaria 16 20
Superior 04 05
Total 80 100
Tabla No 3
25
Estadstica General ciclo 2013-I
Pacientes atendidos de intoxicacin alcohlica por sexo segn grado de instruccin en el Hospital Nacional
Almanzor Aguinaga Asenjo de Chiclayo. Agosto 2013.
Grado de Sexo
GRAFICO CIRCULAR:
Se usa para representar la dimensin de las partes de un fenmeno total. Par su elaboracin se utiliza la
circunferencia, siendo necesario que los valores absolutos y/o porcentajes sean traducidos a grados
Ejemplo
Solucin
o
Sabemos que la circunferencia tiene un total de 360 , utilizando la regla de tres simple, se encuentran
los grados par cada una de las clases
Analfabetos Secundaria
45 360 20 360
100 % 360% x= = 100% 360% x= =
100 100
o o
162 72
Primaria Superior
30 360 5 360 o
100% 360% x= = 100% 360% x= = 18
100 100
o
108
26
Estadstica General ciclo 2013-I
27
Estadstica General ciclo 2013-I
Muestra Poblacin
Nmero de elementos n N
Media x
Varianza 2 2
s
MEDIA
En las frmulas estadsticas se acostumbra denotar el valor de la primera observacin de la variable x con x 1,
el valor de la segunda observacin de la variable x con x 2 y as sucesivamente. En general, el valor de la i-
sima observacin de la variable x se denota xi .La frmula para la media muestral cuando se tiene una
muestra de n observaciones es la siguiente.
Poblacin Muestra
N n
xi xi
i=1
= x= i=1
N n
xi = X1 + X2 + . . . + Xn
28
Estadstica General ciclo 2013-I
16 24 12 16 22
Se emplea la notacin x1, x2, x3, x4, x5 para representar el nmero de crditos matriculados por alumno.
16+ 24+12+16+ 22
= = 18
5
En la ecuacin de la media muestral, se muestra cmo se calcula la media en una muestra de n observaciones.
Para calcular la media de una poblacin use la misma frmula, pero con una notacin diferente para indicar
que trabaja con toda la poblacin. El nmero de observaciones en una poblacin se denota N y el smbolo
para la media poblacional es
La media para datos agrupados (datos tabulados) Si los datos han sido clasificados en m clases en una tabla
de frecuencia con marca de clase yi y frecuencia absoluta f i = 1,2,..,m, la media aritmtica de estos
datos est definida por:
x=
f i yi
n
PROPIEDADES DE LA MEDIA
1.- Si todos los valores observadosx 1, x2, .xn son iguales a b (donde b es una constante) entonces la
media de una constante es la misma constante
M(x) = M (b) = b
2.- Si a cada valor de las observaciones x1, x2, xn se le suma ( o se resta) una constante, la media del
nuevo conjunto transformado yi= xi b ; es la media aritmtica del conjunto original ms (o menos) la
constante. Es decir
29
Estadstica General ciclo 2013-I
3.- Si cada valor de un conjunto x1, x2, .,xn se multiplica por una constante diferente de cero, la
media aritmtica del conjunto transformado yi = axi, donde i= 1,2,,n es la media aritmtica del
conjunto original multiplicado por la constante. O sea:
4.- La suma algebraica de las desviaciones de cada valor observado x 1, x2,x3,..xn con respecto a su media es
cero. Esta propiedad significa que,
m = nmero de clases
5.- Si x1,x2,,xn, y , y1,y2,yn son dos conjuntos de observaciones de n valores cada uno, de dos
variables X y Y, expresados en las mismas unidades, entonces
6.- En casos especiales, esto es cuando es apropiado hacerlo, la media aritmtica se puede utilizar para estimar
la cantidad total de una poblacin. Esta propiedad indica que
Total = N
Media aritmtica a partir de sub muestras.- Supongamos que de una poblacin (o de dos poblaciones
diferentes) se obtienen dos muestras de tamaos n1 y n2 respectivamente, Sean y las medias
aritmticas de las muestras, entonces la media asociada de las n1 + n2 observaciones est dada por
X i = Valor de la observacin i
W i = Peso de la observacin i
30
Estadstica General ciclo 2013-I
VENTAJAS DE LA MEDIA
2.- Es una medida que puede ser calculada y es nica. Ya que cada conjunto de datos tiene una y slo una
media.
3.- En el clculo de la media, es tomada en cuenta cada observacin del conjunto de datos.
4.- La media es una medida digna de confianza, porque se determina con mayor certeza que otras
caractersticas de un conjunto de datos
DESVENTAJAS DE LA MEDIA
1.- La media aritmtica puede verse afectado por valores extremos que no son representativos del resto de las
observaciones.
MEDIA GEOMTRICA
2.- Para determinar el incremento porcentual promedio en ventas, produccin u otras actividades o series
econmicas de un periodo a otro.
La media geomtrica (Mg) de un conjunto de n nmeros positivos se define como la raz n- sima del
producto de los n nmeros.
MG n X 1 X 2 X 3 . X n
Nota: si uno de los nmeros es cero o negativo no se puede calcular la media geomtrica
Ejemplo
Supngase que las utilidades obtenidas por una compaa constructora en cuatro proyectos fueron de 2,3,4 y 6
% respectivamente. Cul es la media geomtrica de las ganancias?
4
MG 2 x 3x 4 x 4
MG = 3.46.41
Este promedio se define diciendo que es igual a la media aritmtica del reciproco de los valores de una
variable.
31
Estadstica General ciclo 2013-I
Se aplica cuando se desea promediar datos de una variable dada en forma de tasas, esto es, tanta unidades de
un tipo por cada unidad de otra especie; pero tambin se utiliza para promediar datos inversamente
proporcionales.
n
Mh 1
x
n
n
Mh = n1 n2 n3 n
+ + + .+ m
y1 y2 y3 ym
MEDIANA
La mediana es otra medida de localizacin central. Es el punto medio de los valores despus de ordenarlos de
menor a mayor o de mayor a menor. Este valor indica que a lo sumo el 50% de las observaciones se
encuentran por arriba de la mediana y el otro 50% a lo sumo, por debajo de ella. Cuando tiene un nmero
impar de observaciones, la mediana es el valor central. Cuando la cantidad de observaciones es par, no hay un
nmero central. En este caso, la mediana es definida como el promedio de las dos observaciones centrales.
Apliquemos esta definicin para calcular la mediana del nmero de alumnos matriculados en un grupo horario
a partir de la muestra de cinco grupos horarios de la universidad. Los datos en orden ascendente son
32 42 46 46 54
Como n = 5 es impar, la mediana es el valor central. De manera que la mediana del tamao de los alumnos
matriculados en un grupo horario, es 46. Aun cuando en este conjunto de datos hay dos observaciones cuyo
valor es 46, al poner las observaciones en orden ascendente se toman en consideracin todas las
observaciones.
Suponga que tambin desea calcular la mediana del nmero de crditos matriculados de 12 alumnos de la
escuela profesional de Agronoma
12 23 17 26 23 18 17 22 20 21 22 24
12 17 17 18 20 21 22 22 23 23 24 26
32
Estadstica General ciclo 2013-I
Como n = 12 es par, se localizan los dos valores centrales: 21 y 22. La mediana es el promedio de estos dos
valores.
21+22
Mediana = = 21.5
2
Por ejemplo, la media de los datos del ejemplo anterior es 20.41. Ahora suponga que el primer estudiante no
se matricul en 12 crditos sino en 4, la media seria 19.75.Podremos ver que la mediana no vara en ningn
caso.
Al generalizar lo anterior, es posible decir que cuando los datos contengan valores extremos, es preferible usar
a la mediana como medida de localizacin central.
[ ]
n
'
N i1
Me y + 2
i1 cj
N iN i1
VENTAJAS DE LA MEDIANA
1.- La mediana es fcil de entender y puede ser calculada a partir de cualquier clase de datos
2.- La mediana est afectada por el nmero de observaciones y no por la magnitud de cualquier extremo
DESVENTAJAS DE LA MEDIANA
1.- Se debe organizar los datos antes de realizar cualquier tipo de clculo para determinar la mediana.
MODA
La tercera medida de localizacin es la moda. La moda se define como el valor que se presenta con mayor
frecuencia. Es decir, la moda es el valor ms comn o predominante.
33
Estadstica General ciclo 2013-I
Para ilustrar cmo identificar a la moda, considere la muestra del tamao de los cinco grupos de la
universidad. El nico valor que se presenta ms de una vez es el 46. La frecuencia con que se presenta este
valor es 2, por lo que es el valor con mayor frecuencia, entonces es la moda.
Cuando esto ocurre hay ms de una moda. Si los datos contienen ms de una moda se dice que los datos son
bimodales. Si contienen ms de dos modas, son multimodales. En los casos multimodales casi nunca se da la
moda, porque dar tres o ms modas no resulta de mucha ayuda para describir la localizacin de los datos.
j+1
n j n
Mo Y i1
' n
( j j1 ) +
n
n jn j1
+ c j
VENTAJAS DE LA MODA
1.- La moda se puede utilizar como una medida de localizacin tanto para datos cualitativos como
cuantitativos
DESVENTAJAS DE LA MODA
1.- Muy a menudo, no hay un valor modal porque el conjunto de datos no contiene valores que se repitan ms
de una vez. Otras veces, cada valor es la moda, porque cada uno aparece el mismo nmero de veces.
Claramente, la moda no es una medida til en estos casos
2.- Cuando el conjunto de observaciones contiene dos, tres o ms modas, stas son difciles de interpretar y
comparar.
1.- En una distribucin de frecuencias simtrica cuya representacin grfica es acampanada y adems
unimodal; coinciden exactamente en el mismo valor, media, mediana y moda.
34
Estadstica General ciclo 2013-I
2.- Si la distribucin tiene la forma acampanada, es unimodal, pero no tiene simetra, las tres medidas toman
valores diferentes, y la mediana queda comprendida generalmente entre la moda y la media aritmtica
Los cuantiles ms usados son los cuartiles, Q j , los deciles, D j y los percentiles, Pj .
PERCENTILES
El p simo percentil es un valor tal que, a lo sumo, p por ciento de las observaciones son menores o iguales
que este valor y, a lo sumo, (100 p) por ciento de las observaciones son mayores o iguales que este valor.
K=
[ ] i
100
n
3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la posicin del i
simo percentil.
Si k es entero, el i simo percentil es el promedio de los valores de los datos ubicados en los lugares k
y k 1.
Ejemplo
53 55 70 58 64 57 72 53 69 57 68 53
Solucin
53 53 53 55 57 57 58 64 68 69 70 72
Para percentil 30
35
Estadstica General ciclo 2013-I
K [ ] i
100
n [ ] 30
100
12=3.6
3.- Como k no es entero, redondeamos. El lugar del percentil 30 es el siguiente entero mayor de 3.6, es decir,
el lugar 4. En este caso el percentil 30 es el valor del dato que ocupa la posicin cuarta, o sea 55. Esto
significa que el 30% de los datos es menor que 55 y el 70% mayor o igual a 55.
Para percentil 75
k [ ]
i
100
n [ ] 75
100
12=9
Como k es entero se establece que el percentil 75 es el promedio de los valores de los datos noveno y
1.- Se calcula
100 , donde i 1, 2,3,..,99
[ ]
F
k1
Pi ' 100
Y i1 +cj
f
'
Donde: Y i1 = Lmite inferior de la clase que contiene a Pi
j=
Tamao del intervalo de clase
c
30 40 1 1
40 50 3 4
50 60 11 15
60 70 21 36 36
70 80 43 79
80 90 32 111
90 - 100 9 120
Estadstica General ciclo 2013-I
Solucin
La edad minina del 25% de las personas de ms edad es el percentil 75, en ese sentido tenemos que encontrar
las frecuencias acumuladas
75 x 120
1.- Se calcula =90
100 100
[ ]
F
k1
Pi ' 100
Y i1+ c j
f
CUARTILES
Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, Q1 deja el 25% de los datos
ordenados a su izquierda, y el otro 75% a su derecha. El segundo cuartil, Q 2 , deja el 50% de los datos a
su izquierda y el otro 50% a su derecha, este valor coincide con la mediana, mientras que el tercer cuartil,
Determine el Q1 y Q3
Solucin
37
Estadstica General ciclo 2013-I
Cuartil uno, Q1
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
2.- Calcular el Q1 es igual que calcular el P25 , en ese sentido se calcula el ndice K
k [ ]
i
100
n [ ]25
100
12=3
Como K es entero se establece que el percentil 25 es el promedio de los valores de los datos tercero y cuarto;
es por lo tanto
[ 2850+2880
2 ] 2865. Esto significa que el 25% de los Ingenieros Agrnomos
tienen un salario mensual superior a 2865.
Cuartil tres, Q3 :
k
[ ]
i
100
n
[ ]75
100
12=9
Como K es entero se establece que el percentil 75 es el promedio de los valores de los datos noveno y dcimo;
es por lo tanto,
[ 2950+3050
2 ] 3000. Esto significa que el 75% de los Ingenieros Agrnomos
tienen un salario menor a 3000 y el otro 25% un salario mensual superior a 30000
Q1 Q2 Q3
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
[ ] [ ]
n n
F k1 F k1
4 2
Q1=Y ' +c j Q2=Y ' +c j
i1
f i1
f
[ ]
3n
F k1
4
Q3=Y ' +c j
i1
f
Donde
38
Estadstica General ciclo 2013-I
'
Y i1= Limitre inferior de la clase que contiene al cuartil i
n=Nmero de datos
Ejemplo
Una empresa decide evaluar a sus empleados. La clasificacin se lleva a cabo mediante la aplicacin de un
test que arroja los siguientes puntajes
'
Y i1Y i
'
f i ni
0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8
Determine:
2.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores.
Solucin
[ ]
n
F k1
4
Q1=Y ' +c j
i1
f
Y 'i1Y 'i f i ni Fi
0 - 20 94 94
20 - 40 140 234
40 - 60 160 394
60 - 80 98 492
80 - 100 8 500
Luego
39
Estadstica General ciclo 2013-I
n 500
El lugar del cuartil 1 es la posicin = = 125. Es decir, que el cuartil est ubicado en la clase 20
4 4
40. Por lo tanto:
[ ]
n
Q1=Y '
i1
+c j
4
F k1
f
= 20+20
[ 12594
140 ] = 24.43
Esto quiere decir que el 75% de los trabajadores tienen una calificacin mayor a 24.43
b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores, corresponde al valor del tercer
curatil.
3n 3 x 500
El lugar del tercer cuartil es la posicin = = 375. Es decir, que el cuartil est ubicado
4 4
en la clase 40 - 60. Por lo tanto
[ ]
3n
Q3=Y '
i1
+c j
4
F k1
f
= 40 +20 [ 375234
160 ] = 57.625
Esto quiere decir que el 25% de los trabajadores tiene una puntuacin mayor a 57.625
MEDIDAS DE DISPERSIN
Las medidas de dispersin tratan de describir cuan agrupados o alejados estn los datos observados de su
promedio. Entre ms dispersos estn las observaciones individuales, mayor es la medida de dispersin, y
menos adecuado ser el promedio como medida descriptiva. Por eso, es importante que despus de elegir y
calcular un promedio se determina el grado de variacin de las observaciones o datos individuales.
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
Ser:
40
Estadstica General ciclo 2013-I
Aunque el rango es la medida de variabilidad ms fcil de calcular, rara vez se usa como nica medida. La
razn es que el rango se basa slo en dos observaciones y, por tanto, los valores extremos tienen una gran
influencia sobre l.
Una medida que no es afectada por los valores extremos es el rango intercuartlico (RIC). Esta medida de
variabilidad es la diferencia entre el tercer cuartil Q3 y el primer cuartil Q1. En otras palabras, el rango
intercuartlico es el rango en que se encuentra el 50% central de los datos.
RIC=
VARIANZA
La varianza es una medida de variabilidad que utiliza todos los datos. La varianza est basada en la
diferencia entre el valor de cada observacin (x 1) y la media. A la diferencia entre cada valor x 1 y la media (
cuando se trata de una muestra, cuando se trata de una poblacin) se le llama desviacin respecto
si se trata de una poblacin se escribe (xi .). Para calcular la varianza, estas desviaciones respecto de
Si los datos son de una poblacin, el promedio de estas desviaciones elevadas al cuadrado es la varianza
poblacional. La varianza poblacional se denota con la letra griega . En una poblacin en la que hay
2
=
( x i )
N
En la mayor parte de las aplicaciones de la estadstica, los datos a analizar provienen de una muestra. Cuando
muestral que se obtiene constituye un estimador no sesgado de la varianza poblacional. Por esta razn, la
varianza muestral, que se denota por s2, se define como sigue.
VARIANZA MUESTRAL
2
2
s=
( x ix )
n1
41
Estadstica General ciclo 2013-I
PROPIEDADES DE LA VARIANZA
V(x) 0
2.- La varianza de una constante es cero. Esto significa que si x1 = x2 =..= xn= b entonces:
V(b) = 0
3.- Si a cada observacin x1, x2, ,xn se le adiciona o se le resta una constante b 0, la varianza del
nuevo conjunto de valores y 1,y2,,yn, donde yi=xi b, i = 1,2,.,n, coincide con la varianza del
conjunto original. Es decir
V(y) = V (x b) = V(x)
4.- Si a cada valor de un conjunto x1,x2,xn, se multiplica por una constante a, la varianza del nuevo
conjunto de valores y1,y2,yn, donde yi = axi, i= 1,2,,n es igual a la varianza del conjunto
original multiplicada por el cuadrado de la constante. Es decir:
V(y) = a2 V(x)
DESVIACIN ESTNDAR
42
Estadstica General ciclo 2013-I
La desviacin estndar se define como la raz cuadrada positiva de la varianza. Continuando con la notacin
adoptada para la varianza muestral y para la varianza poblacional, se emplea s para denotar la desviacin
Lla desviacin estndar se mide en las mismas unidades que los datos originales. Por esta razn es ms fcil
comparar la desviacin estndar con la media y con otros estadsticos que se miden en las mismas unidades
que los datos originales.
1. Es confiable.
2. Tiene la misma unidad de medida que los datos originales.
3. No cambia de valor cuando se suma una constante a cada observacin de un conjunto de datos.
En algunas ocasiones se requiere un estadstico descriptivo que indique cun grande es la desviacin estndar
en relacin con la media. Es decir nos indica la cantidad de veces que la desviacin estndar contiene a la
media aritmtica.
CV =
Poblacin Muestra
CV =
[
x 100 ] CV =
[ s
x
x 100 ]
CARACTERSTICAS DEL COEFICIENTE DE VARIABILIDAD
3.- Se afecta su valor cuando se suma una constante K a cada observacin de un conjunto de datos.
4.- No cambia de valor cuando se multiplica por una constante K a cada una de las observaciones.
43
Estadstica General ciclo 2013-I
Si los conjuntos de datos tienen iguales unidades de medida y medias aritmticas iguales o similares,
entonces basta con comparar las varianzas o las desviaciones estndares
Si los conjuntos de datos tienen diferente unidades de medida y/o medias aritmticas diferentes, entonces se
deben comparar los coeficientes de variabilidad.
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRIA.
Las medidas de asimetra tienen como facilidad elaborar un indicador que permita establecer el grado de
simetra o asimetra, que presenta una distribucin, sin necesidad de llevar a cabo su representacin grafica.
xMo
sk=
s
Tambin existen otras formulas alternativas para el clculo del coeficiente de asimetra.
3(MediaMediana)
sk=
S
Asimismo, el coeficiente de asimetra nos describe la forma de un conjunto de datos, es decir, la manera como
se distribuyen, comparando la media y la mediana. Si ambas medidas son iguales, por lo general, se considera
que los datos son simtricos (o con sesgo cero, es decir, el coeficiente de asimetra es cero). Por lo contrario,
los datos o su distribucin es asimtrica o sesgada, es decir, si la media excede a la mediana, los datos se
describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetra es positivo). Si la
mediana excede a la media, los datos suelen llamarse sesgados a la izquierda, o con sesgo negativo (el
coeficiente de asimetra es negativo)
El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco usuales: el sesgo
negativo ocurre cuando la media se reduce debido a algunos valores muy pequeos. Los datos son simtricos
cuando en realidad no hay valores extremos en ninguna direccin, de tal manera que los valores grandes y
pequeos se equilibran.
Simetra Relacin
Simtrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda
44
Estadstica General ciclo 2013-I
Analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin, es
decir, estudia la distribucin de frecuencias en la zona central. La mayor o menor concentracin de
frecuencias alrededor de la media y en la zona central de la distribucin, dar lugar a una distribucin ms o
menos apuntada.
Si el valor de la curtosis es positivo, se dice que los datos tienen una distribucin leptocrtica (es ms
apuntada o puntiaguda que la distribucin normal); en caso contrario, si la curtosis es negativa, se dice que los
datos tienen una distribucin platicrtica (es menos apuntada o puntiaguda que la distribucin normal). Si la
curtosis es cero, entonces los datos se distribuyen siguiendo una distribucin normal, y se dice que en este
caso la distribucin mesocrtica.
k=
(x ix )
nsx
4
3 k= [
1 Q 3 Q1
2 P 90 . P10 ]
Donde
1=
Cuartil uno P10= Percentil diez
Q
CARACTERISTICAS DEL COEFICIENTE DE CURTOSIS
3.- No le afecta las operaciones de suma y multiplicacin por una constante c aplicada a cada observacin.
xi ( x ix )
2 4
( x ix )
2 4 16
4 0 0
8 16 256
2 4 16
16 24 288
Media x =4
2
Varianza s x = 8
45
Estadstica General ciclo 2013-I
k=
(x ix ) 3 =
288
- 3 = -1.875
ns
4
x
( 4 ) (64)
Ejemplo
Una muestra de digitadoras de texto revel que su rapidez media de tecleo es de 87 palabras por minuto, con
una media de 73. La desviacin estndar es de 16.9 palabras por minuto. Cul es el coeficiente de asimetra?
Interprete su respuesta.
Solucin
3( MediaMediana) 3(8773)
Reemplazando sk= = =2.49
s 16.9
Existe considerable asimetra con sesgo positivo en la distribucin de la rapidez de tecleo. Algunas operadoras
muy rpidas hacen que la media sea mayor que la mediana o la moda.
TEORA DE PROBABILIDADES
Introduccin
La teora de probabilidades no solo permite analizar la incertidumbre, sino tambin hacer inferencias
estadsticas de futuros eventos y acerca de las caractersticas de una poblacin basndose en informacin
muestral.
46
Estadstica General ciclo 2013-I
Debido a que existe una incertidumbre considerable al tomar decisiones, resulta importante que todos los
riesgos implcitos conocidos, se evalen en forma cientfica. Ayuda en esta evaluacin la teora de la
probabilidad, a la que frecuentemente se denomina "ciencia de la incertidumbre". El empleo de tal teora
probabilstica permite a quien toma decisiones, analizar con informacin limitada los riesgos y minimizar el
azar inherente. Por ejemplo, al lanzar un nuevo producto o aceptar un embarque recin llegado que contenga
partes defectuosas.
Modelos matemticos
Modelo determinstico
Cuando las condiciones bajo las cuales se verifica el experimento determinan el resultado de este. Por
ejemplo, si s: deja caer un cuerpo en el vaco, desde una altura h, la velocidad que alcanza es:
v= 2 gh
Este modelo determina la velocidad con la que el cuerpo cae al fondo.
Cuando las condiciones bajo las cuales se verifica el experimento no determinan el resultado de este. Segn el
fenmeno que se estudie, se determinar el tipo de modelo a usarse. Por ejemplo, si se quiere saber cuntos
autos llegan a una gasolinera entre las 7 y 8 a.m., con base a los datos histricos se puede disear un modelo
que brinde un resultado aproximado con cierto grado de confiabilidad.
Anlisis combinatorio
Es la rama de la matemtica que estudia los diversos arreglos o selecciones que se pueden formar con los
elementos de un conjunto dado, los cuales permiten resolver muchos problemas prcticos. Por ejemplo, se
puede averiguar cuntos nmeros diferentes de telfonos, placas o loteras se pueden formar utilizando un
conjunto dado de letras y dgitos.
Adems el estudio y comprensin del anlisis combinatorio es una herramienta de mucha utilidad para poder
resolver y comprender problemas sobre probabilidades.
En la mayora de problemas de anlisis combinatorio se observa que una operacin o actividad aparece en
forma repetitiva y es necesario conocer las formas o maneras en que se pueda realizar dicha operacin. Para
dichos casos es til conocer determinadas tcnicas o estrategias de conteo que faciliten el clculo sealado.
El anlisis combinatorio tambin se define como una manera prctica y abreviada de contar. Las operaciones
o actividades que se presentan son designadas como eventos o sucesos. A continuacin se presentan algunos
ejemplos donde es necesario utilizar el anlisis combinatorio:
~ Sealar las maneras diferentes de vestir de una persona, utilizando un nmero determinado de prendas de
vestir.
47
Estadstica General ciclo 2013-I
Principio de multiplicacin
Si un evento o suceso puede ocurrir, en forma independiente, de "m" maneras diferentes y otro suceso de "n"
maneras diferentes, entonces el nmero de maneras distintas en que pueden ocurrir ambos sucesos es: m x n.
Ejemplo
En la etapa final del ftbol profesional de primera divisin, cuatro equipos: CRISTAL (A), BOYS (B),
CIENCIANO (C), UNIVERSITARIO (D) disputan el primer y segundo lugar (campen y subcampen). De
cuntas maneras diferentes estos equipos pueden ubicarse en dichos lugares?
Solucin
B AB
A C AC
D AD
A BA
B C BC
D BD
A CA
C B CB
D CD
A DA
D B DB
C DC
Total 12
Existen 12 maneras diferentes en que estos equipos se pueden ubicar en el primer y segundo lugar
0 o
1 2
48
Estadstica General ciclo 2013-I
4 x 3 no de maneras = 12
Explicacin
a) El primer lugar puede ser ocupado por cualquiera de los cuatro equipos.
b) El segundo lugar puede ser ocupado por cualquiera de los otros tres equipos que restan.
c) Por el principio de multiplicacin, se observa que el evento del primer lugar se presenta de 4 maneras y el
del segundo lugar de 3 maneras distintas, entonces el nmero de maneras totales ser:
4 x 3 = 12
Principio de adicin
Si un evento A se puede realizar de "m" maneras y otro evento B se puede realizar de "n" maneras diferentes,
adems, no es posible que ambos eventos se realicen juntos (A B = ), entonces el evento A o el
evento B se realizarn de (m + n) maneras.
Ejemplo
Solucin
Victoria o Brea
Ejemplo
Se desea cruzar un ro, para ello se dispone de 3 botes, 2 lanchas y 1 deslizador. De cuntas formas se puede
cruzar el ro utilizando los medios de transporte sealados?
Solucin
3 2 1
No.de maneras = 3 + 2 + 1 = 6
49
Estadstica General ciclo 2013-I
Recuerda
Mtodos de conteo
En diferentes casos se tomar de algn conjunto parte de sus elementos o todos ellos, para formar diferentes
agrupaciones, que se van a distinguir por el orden de sus elementos o por la naturaleza de alguno de ellos. Si
los elementos que forman una agrupacin son diferentes entre s, sern llamados agrupaciones sin repeticin y
si alguno de ellos es igual se dir que son agrupaciones con repeticin.
Permutacin
Ejemplo
Determinar los diferentes arreglos o permutaciones que se pueden hacer con las letras a, b y c tomadas de dos
en dos.
Solucin
Mtodo 1:
Nmero de arreglos = 6
3 x 2 = 6
no de arreglos = 6
Explicacin:
a) El primer casillero puede ser ocupado por cualesquiera de las tres letras, existiendo 3 posibilidades.
b) El segundo casillero puede ser ocupado por cualesquiera de las otras dos letras restantes, existiendo 2
posibilidades.
50
Estadstica General ciclo 2013-I
"El nmero de permutaciones de "n" objetos diferentes, tomados en grupos de k elementos (siendo k n)
n
y denotado por P k estar dado por:
n!
Pnk =
(nk )!
Donde: n, k NyO k n
Estas permutaciones son llamadas lineales, porque los objetos son ordenados en una lnea recta de referencia.
Ejemplo
En una carrera de 400 metros participan 10 atletas. De cuntas formas distintas podrn ser premiados los
tres primeros lugares?
Solucin
Se buscan las diferentes ternas (k = 3) que se pueden formar con los 10 atletas (n = 10).
10 10 !
P3 = = 720
7!
Mtodo 2:
1o 2. 3.
10 x 9 x 8 = 720
Explicacin
a) El primer casillero (MEDALLA DE ORO) puede ser ocupado por cualquiera de los diez atletas, existiendo
10 posibilidades.
b) El segundo casillero (MEDALLA DE PLATA) puede ser ocupado por cualquiera de los nueve atletas
restantes, existiendo 9 posibilidades.
c) El tercer casillero (MEDALLA DE BRONCE) puede ser ocupado por cualquiera de los ocho atletas
restantes, existiendo 8 posibilidades.
Recordar
a) n!=lx2x3x...x (n-1)xn
b) 0!=1
51
Estadstica General ciclo 2013-I
c) 1!=1
d) n!=(n-1)!x n
Permutacin circular
Son agrupaciones donde no hay primer ni ltimo elemento, por hallarse todos en una lnea cerrada. Para hallar
el nmero de permutaciones circulares que se pueden formar con "n" objetos distintos de un conjunto, hay
que considerar fija la posicin de un elemento, los (n -1) restantes podrn cambiar de lugar de (n -1)! formas
diferentes, tomando todas las posiciones sobre la circunferencia relativa al primer punto.
n
Pc = (n-l)!
Ejemplo
De cuntas formas diferentes pueden sentarse alrededor de una mesa circular un padre y sus 5 hijos?
6
P1 = (6-1)!=5!=120
Combinacin
Es cada uno de los diferentes arreglos que se pueden hacer con parte o todos los elementos de un conjunto
dado sin considerar el orden en su ubicacin.
El nmero de combinaciones de "n" elementos diferentes tomados de "k" en "k", con k n, est dado
por:
n!
c nk =
( nk ) ! k !
Ejemplo
Se dispone de 5 puntos no colneales, cul es el mximo nmero de tringulos que se podrn formar?
Solucin
Para dibujar un tringulo solo es necesario 3 puntos en el plano, razn por la cual se tomarn 3 puntos (k = 3)
de un total de 5 puntos (n = 5).
Adems no importa el orden, ya que el triangulo ABC es igual al CBA; por lo tanto, se trata de una
combinacin
5 5!
c 3= = 10
2! 3 !
Observacin
52
Estadstica General ciclo 2013-I
n
c) El nmero de muestras posibles se calcula mediante: N
Ejemplo
Una seora tiene 3 frutas: manzana, fresa y pia. Cuntos sabores diferentes de jugo podr preparar con
estas frutas?
Solucin
Se puede escoger una o dos frutas de las tres o las tres frutas de las tres, adems en este caso no importa el
orden; por lo tanto, usamos el principio de adicin aplicado a la combinacin:
o 3 3 3
n de maneras diferentes = c 1 +c 2+ c 3
n de maneras diferentes = 3 + 3 + 1 = 7
Ejemplo
Solucin
8
1 Se selecciona 4 fsicos de 8, en c 4 formas:
8
c 4 =70
6
2. Se selecciona 3 matemticos de 6, en c3
6
c 3=20
8 6
c4 x c3 = 70x20 = 1400
Probabilidades:
Qu es una probabilidad?
El pronstico meteorolgico anuncia que hay un 70% de que el fenmeno de El Nio sea mnimo, en
intensidad, en el ao 2007.
53
Estadstica General ciclo 2013-I
Definicin de probabilidad
Valor entre cero y uno, inclusive, que describe la posibilidad relativa de que ocurra un evento.
Experimento
Resultado
Espacio muestral ()
Si es un conjunto numerable; es decir, si es posible asociar un nmero natural con cada elemento
de
Si es un conjunto no numerable; es decir, si no es posible asociar un nmero natural con cada elemento de
.
Evento
Es cualquier subconjunto de un espacio muestral . Los eventos se identifican mediante letras maysculas.
Ejemplo
54
Estadstica General ciclo 2013-I
Tipos de eventos
Dos eventos A y B son mutuamente exc1uyentes si no tienen elementos comunes; es decir, si no pueden
ocurrir simultneamente.
Eventos complementarios
Dos eventos A y B son complementarios SI son mutuamente excluyentes y su unin es el espacio muestra:
l. A B = A B' (Diferencia)
2. A' = - A (Complemento)
3. A (B C) = (A B) (A C) (Distributiva)
4. A (B C) = (A B) (A C) (Distributiva)
8. Si A A B , entonces A B = B y A B = A
9. A = A; A= ; A A' = ; A A' =
10.A A = A; A A = A
Probabilidad de un evento
Se llama probabilidad a cualquier funcin, p, que asigna a cada evento A un valor numrico p(A), verificando
los siguientes axiomas o postulados:
55
Estadstica General ciclo 2013-I
~ p () = 1
A2
p( ) p ( A 3 ) . Si
A 1 A 2 A3 . = p ( A1 ) p
A 1 A 2 A 3 ..
Enfoques de la probabilidad
Probabilidad objetiva
Probabilidad clsica
Se basa en la consideracin de que los resultados de un experimento son igualmente probables. As:
Consideramos el experimento de tirar un dado. Cul es la probabilidad del evento (suceso) "obtener un
nmero par"?
Solucin Sea:
3 1
P(A) = =
6 2
Ejemplo
Calcular la probabilidad de que en una carrera de 12 caballos, acertar a los tres que llegan primero en el
orden de su llegada a la meta.
Solucin
Se debe determinar el nmero de arreglos posibles de tres caballos de los 12 que hay. Como s interesa el
orden, entonces se utiliza la frmula de permutacin:
12 12 !
P3 = = 1320
( 123 ) !
Entonces hay 1320 grupos de tres caballos, como interesa uno, entonces:
56
Estadstica General ciclo 2013-I
A = Acertar a los tres caballos que llegan primero en el orden de su llegada a la meta.
1
p(A)= - = 0.00076
1320
Ejemplo
Una caja contiene dos calcetines blancos y dos azules. Si se eligen dos aleatoriamente, cul es la
probabilidad de que sean del mismo color?
Solucin
4!
C24= = 6, posibilidades de elegir dos calcetines
( 42 ) ! 2 !
Sea el evento:
2 1
p(A) = =
6 3
Probabilidad emprica
La probabilidad de que un evento ocurra a largo plazo se determinar. Observando en qu fraccin de tiempo
sucedieron eventos semejantes en el pasado.
Solucin Sea:
450
p (A) = = 0.58 == 58%
780
Por lo tanto, la probabilidad de que un egresado est empleado en un rea distinta a la de sus estudios es del
58%.
Probabilidad subjetiva
Posibilidad de que suceda un evento especfico asignado por una persona con base en cualquier informacin
que se disponga.
57
Estadstica General ciclo 2013-I
Reglas de adicin
Si dos eventos A y B son mutuamente excluyentes, la regla indica que la probabilidad de que ocurra uno u
otro de los eventos es igual a la suma de probabilidades.
P (A o B) = p (A B) = p (A)+p (B)
Observacin 1
Dos eventos son mutuamente excluyentes cuando no pueden ocurrir al mismo tiempo.
Ejemplo
En el experimento de tirar un dado, el evento "un nmero par" y el evento "un nmero impar" son
mutuamente excluyentes. Si se observ un nmero par, no podra caer un nmero impar al mismo tiempo.
Observacin 2
Los eventos colectivamente exhaustivos constan de todos los posibles resultados de un experimento y
constituyen su espacio muestral. As los eventos colectivamente exhaustivos de lanzar un dado son: 1, 2, 3, 4,
5, y 6. Adems, debido a que existe la certeza de que uno de estos eventos ocurrir, la suma de sus
probabilidades es igual a 1. Esto es: p (1 2 3 4 5 6) = 1
Ejemplo
Se ha de entrevistar a un grupo selecto de empleados de la empresa ORION S.A., con respecto a un plan de
pensiones. Se efectuarn entrevistas detalladas a cada uno de los empleados seleccionados en la muestra.
Estos se clasificarn como sigue:
Clasificacin no de empleados
Supervisores 120
Mantenimiento 50
Produccin 1460
Gerencia 302
Secretaria 68
Total 2000
b) No sea de gerencia?
58
Estadstica General ciclo 2013-I
Solucin
50 68
P (B o E) =p(B E) = + =0.059
200 2000
302
b) p(D') = 1- p (D) = 1- = 0.849
2000
Cuando los eventos no son mutuamente excluyentes, es decir, existe la posibilidad de que ocurran
simultneamente, aparece la siguiente regla:
Es la probabilidad que mide la posibilidad de que dos o ms eventos ocurran en forma simultnea:
1. p ( )=O
Ejemplo
Cul es la probabilidad de que una carta elegida al azar de una baraja americana sea un as o un corazn?
Solucin
Sea:
59
Estadstica General ciclo 2013-I
Los eventos A y B no son mutuamente excluyentes, porque existe la posibilidad de que salga un as y que sea
de corazones, por lo tanto:
p (A o B) = p (A) + p (B)- p (A y B)
p (A B ) = p (A) + p (B) p (A E)
4 1 13 1 1
p(A) = = p( B) = = p (A y B)
52 13 52 4 52
1 1 1
p (A B = +
13 4 52
4+ 131
p (A B =
52
16
p (A B = = 0.3077 = 30.77%
52
Ejemplo
Como parte de un programa de servicios de salud para los empleados de la empresa Don Carlos S.A., se
efectan anualmente exmenes clnicos de rutina. Se descubri que el 8% de los empleados tiene el colesterol
alto, el 15% sufre de gastritis y el 3% tiene el colesterol alto y sufre de gastritis.
a) Cul es la probabilidad de que un empleado seleccionado al azar tenga el colesterol alto o sufra de
gastritis?
b) Muestre esta situacin en forma de un diagrama de Venn.
Reglas de multiplicacin
P (A y B) = p(A). p (B)
P (A\E) = p(A) o
P (B \ A) = p (B)
60
Estadstica General ciclo 2013-I
Eventos independientes
Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de ocurrencia del otro.
Ejemplo
Una moneda es lanzada dos veces al aire, cul es la probabilidad de que las dos veces se obtenga cara?
Solucin sea:
1 1
p (A) = p (B) =
2 2
El que resulte cara en el segundo lanzamiento no depende si sali cara o no en el primero, es por eso que A y
B son eventos independientes. Por la tanto:
1 1 1
P (A y B) = p(A) p (B)= =
2 2 4
Ejemplo
Una mquina automtica introduce legumbres en una bolsa de plstico. La experiencia indica que algunos
paquetes tuvieron menos peso, y algunos otros pesos de ms, pero la mayora fueron satisfactorias. Veamos el
siguiente cuadro:
Insuficiente 0.025
Satisfactorio 0.900
Excedido 0.075
Solucin
p (F) = 0.025
p (F y F y F) = 0.000015625
b) Descubrir que a los tres paquetes les falte peso es poco probable.
61
Estadstica General ciclo 2013-I
Observacin
Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo ilustraremos esta idea:
Supongamos que hay 10 rollos de pelcula fotogrfica en una caja y se sabe que tres estn defectuosos. Se
selecciona uno:
3
p (D) = Probabilidad de que sea defectuoso.
10
7
p (D') = Probabilidad de que no sea defectuoso.
10
Despus se elige un segundo rollo de la caja, sin devolver el primero, la probabilidad de que este sea
defectuoso depender si el primero lo fue, de ser as es:
2
p( D2 ) = Probabilidad de que el segundo rollo extrado sea defectuoso dado que el primero lo
9
fue.
3
p( D'2 ) = Probabilidad de que el segundo rollo extrado no sea defectuoso dado que el primero
9
fue bueno.
Probabilidad condicional
Es la probabilidad de que ocurra un evento en particular dado que otro evento ha ocurrido.
p( A y B)
p (B \ A) =
p(A )
p( A B)
p (B \ A) =
p( A)
Del ejemplo anterior: cul es la probabilidad de escoger un defectuoso seguido de otro defectuoso?
3 2
p(A y B) = = O.067
10 9
Donde:
62
Estadstica General ciclo 2013-I
1. p (A B) = p(A) p (B\A), si p (A 0)
si p (A O; p (A B) O
3. p ( \A)= 0, si p(A O)
4. p (A'\B) = l- p (A\B)
P (A B) = p (A y B)
Ejemplo
De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. Cul es la probabilidad de obtener
dos espadas, dos corazones y un diamante?
Solucin
E2 /
p ( E1 y E2 y C 1 y C 2 yD = E1 p ( C 1 / E1 y E 2 ) p ( C 2 /
p ( E1 ) p
E1 y E2 y C 1 p ( D / E 1 y E2 y C 1 y C 2 )
13 12 13 12 13
p( E1 y E2 y C 1 y C 2 yD = = 0.001014
52 51 50 49 48
Pero esta es solo una parte, el total de posibilidades ser una permutacin de ellas, pero es una permutacin
con repeticin ya que las espadas se repiten dos veces y los corazones tambin dos veces, entonces:
13 12 13 12 13
5!
p( 52 51 50 49 48 ) = 0.0304
2 !2!
E1 y E2 y C 1 y C 2 yD =
Tablas de contingencia
Una tabla de contingencia es una distribucin, una matriz, en cuyas filas y columnas los individuos de una
poblacin se clasifican en funcin de dos variables. Tambin se le conoce con el nombre de tabla de doble
entrada.
Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han clasificado segn el sexo
y por su adiccin al tabaco.
63
Estadstica General ciclo 2013-I
Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de probabilidad
puede crearse dividiendo cada valor de las casillas por el total, que en el ejemplo anterior sera 300.
Los valores en los mrgenes de la tabla se llaman probabilidades marginales. Por ejemplo, elegida una
persona al azar la probabilidad de que esta sea hombre es p (H) = 0.6 y la probabilidad de seleccionar una
mujer es p (M) = O.4
A las probabilidades en las celdas de la estructura principal de la tabla se les denomina probabilidades
conjuntas y muestran la probabilidad de la interseccin de dos eventos. Por ejemplo, la probabilidad de
seleccionar una mujer y que esta sea fumadora es p (M y F) = 0.167.
p ( M y F ) 0.1667
p (M \ F) = = = 0.2942
p (F ) 0.5667
Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la persona elegida.
Es una representacin grfica til para organizar clculos que abarcan varios datos. Cada segmento en el rbol
es una etapa del problema.
64
Estadstica General ciclo 2013-I
Para la elaboracin de un arborigrama se empieza trazando un punto en la izquierda, que representa el punto
central de un tronco.
Ejemplo
Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.
Estado civil
Edad Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140
Solucin
S = Cliente soltero.
C = Cliente casado.
Probabilidad Probabilidad
condicionada
conjunta
P(S/A)
28 S p (B y S) = p(B)p(S/B) = = 0.20
B
49 49 49 28
140 140 49
65
Estadstica General ciclo 2013-I
21 C p (B y C) = p(B)p(C/B) = = 0.15
49 40 21
140 49
77
a.- p (A y S) = = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero
140
77
b.- p (S \ A)= = 0.85 Probabilidad de que un cliente sea soltero dado que es menor de 30 aos.
91
Tambin se puede asociar a cada diagrama de rbol una tabla de contingencia Y viceversa. Para el ejemplo se
ene
Estado civil
Edad Soltero Casado Totales
A p (A y S) p (A y C) p (A)
B p (B y S) p (B y C) p (B)
Totales p(S) p(C) 1
Los datos obtenidos en el diagrama de rbol los reemplazamos en la tabla, esto es:
Estado civil
Edad Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1
Teorema de Bayes
p (A \ B) y p (B \ A), pueden parecer similares, en concepto existe diferencia apreciable entre las
probabilidades que representan. Por ejemplo: si A es el evento de que las ventas en poca navidea sean altas
en un rea especfica y B es el evento de que el clima sea bueno, entonces p (A \ B) es la probabilidad de que
las ventas sean altas dado que el clima es bueno, mientras que p (B \ A) es la probabilidad de que el clima sea
bueno dado que las ventas son altas.
Probabilidad a priori
Probabilidad a posteriori
Es una probabilidad con base en informacin adicional. El teorema de Bayes proporciona un mtodo para
calcular este tipo de probabilidades.
Teorema de Bayes
66
Estadstica General ciclo 2013-I
A1
B
p(A\B) =
p( A1) p
Observacin
Ejemplo
La Dra. Blanquita ha estado enseando Estadstica Bsica durante muchos aos. Se sabe que el 80% de los
estudiantes terminarn los problemas asignados. Determin, que de los estudiantes que cumplen con su
trabajo el 90% aprobar el curso. De aquellos estudiantes que no lo hacen as, el 60% ser aprobado. Eduardo
Lpez tom Estadstica durante el ltimo semestre con la profesora Blanquitaa y recibi una calificacin
aprobatoria. Cul es la probabilidad de que s haya hecho sus tareas?
Solucin
Sea:
P(B) = 0.9 B
p(A y B) = p(A)p(
A
p(A y B) = (0.8)(0.9)= 0.72
'
P( B = 0.
1 '
P(A) =0.8 B
p(A y A )
p(A y B '' = ( 0.8 ) ( 0.1 )=0.08
B =p ( A ) p
67
Estadstica General ciclo 2013-I
P(B) =0.6 B
p( A '
yB A' )
P( A ' = 0. p( A '
y B = ( 0.2 )(' 0.6 )=0.12 )
2
= p ( A ) p
P( B ' = 0.
4
B'
'
p( A ' y B' '
p( A y B ' A
)
'
=
= p ( 0.2 ) p ( 0.4 p( A ) p
) =0.08
A p( A y B)
p( )=
B P(B)
p(
A
B
)=
p ( A) p ( BA )
p (B)
Tener en cuenta que p (B) no es discernible de inmediato. Aqu es donde participa el teorema de Bayes.
Existen dos razones por las que Eduardo Lpez haya aprobado el curso. Puede haber hecho los trabajos
asignados y aprobar el curso o puede no haber hecho los trabajos asignados y tambin aprobar el curso, es
decir:
p (B) = p (A y B) + p (A y B)
B
p( A) p( )
A A
P( =
B
p ( A) p ( BA )+ p ( A ) p( AB )
'
'
A 0.72 0.72
P( = = = 0.86 = 86%
B 0.72+0.12 0.84
Por lo tanto, hay un 86% de probabilidad de que Eduardo Lpez haya hecho sus tareas dado que recibi una
calificacin aprobatoria.
Ejemplo
El departamento de crdito de la tienda departamental Saga Falabel1a en Piura, inform que 30% de sus
ventas son en efectivo, 30% son pagadas con cheques en el momento de la adquisicin y 40% son a crdito.
Se tiene que 20% de las compras en efectivo, 90% de las pagadas con cheques y 60% de las adquisiciones al
crdito, son por ms de US$50. La Sra. Milagritos acaba de comprar un vestido que cuesta US$ 120. Cul es
la probabilidad de que haya pagado por l en efectivo?
68
Estadstica General ciclo 2013-I
Distribucin de probabilidades
Variable aleatoria
Una variable aleatoria de un espacio muestral es la regla que asigna un valor numrico a cada resultado de
, es decir, es una funcin de en el conjunto de los nmeros reales. Las variables aleatorias son:
Variable que solo puede tomar ciertos valores claramente separados, que resultan de contar algn elemento de
inters. Generalmente toma valores enteros. Ejemplo
Es aquella que resulta principalmente de la medicin y puede tomar cualquier valor, al menos dentro de un
rango dado.
X = Peso de un cliente
X = {60, 5, 60,35,}
Enumeracin de todos los resultados de un experimento junto con la probabilidad asociada a cada resultado.
Ejemplo
Suponga que est interesado en el nmero de caras que se obtienen al lanzar 3 veces una moneda. Cul es la
distribucin de probabilidades para el nmero de caras?
Solucin:
69
Estadstica General ciclo 2013-I
Como se aprecia, la variable X solo toma los valores: 0, 1, 2, 3, La distribucin probabilstica para los eventos
0,1,2 y 3 resultantes ser:
Si X es una variable aleatoria discreta que puede asumir valores x 1 , x 2 , x 3 , .. , x n , con probabilidad
de p1 , p2 , p3 , .. , pn , respectivamente, se define su valor esperado o media, como sigue:
n
= E (x) = [ xi p ( xi )]
i=1
2
= [ ( xi )2 p ( x i ) ]
i=1
La desviacin estndar
= 2
Ejemplo
El seor Prez ofrece tres tamaos de refrescos (pequeo, mediano, grande) como complemento de las tortas
que vende Las bebidas se venden a 50,75 y 90 cntimos, respectivamente. De los pedidos, 30% son para el
tamao pequeo, 50% para el mediano y 20% para el grande.
X pX) Xp(X) X ( x )2 p ( X )
50 30% = 0.30 15 20.5 126.075
75 50% = 0.50 37.5 4.5 10.125
90 20% = 0.2 18 19.5 76.050
70.5 212.250
70
Estadstica General ciclo 2013-I
2
c.- = 21.250
= 14.57 cm.
La distribucin probabilstica binomial es un ejemplo de una distribucin probabilstica discreta la cual tiene
muchas aplicaciones en la vida diaria.
1.- El resultado de cada ensayo o realizacin de un experimento se clasifica en una de dos categoras
mutuamente excluyentes: xito o fracaso. Esta clasificacin no implica que un resultado sea bueno y el
otro malo
2.- La variable aleatoria es el resultado de contar el nmero de xitos en una cantidad fija de ensayos.
4.- Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta el resultado de
algn otro
n! x ( nx )
p(x) = p q
x ! ( nx ) !
n= Nmero de ensayos
x= Numero de xitos
Ejemplo
La probabilidad de que un operario haga menos de 10 piezas en una jornada de trabajo es de 0.20. Determine
la probabilidad de que la prxima semana (6 das) en tres das haga menos de 10 piezas por semana.
Solucin
X = Numero de das que el operario hace menos de 10 piezas por jornada de trabajo
71
Estadstica General ciclo 2013-I
n!
p(x) = px q( nx )
x ! ( nx ) !
6!
p(x=3) = 0.23 0.8(63 )
3 ! ( 63 ) !
p(x=3) = 0.0819
Ejemplo
Cuando un cliente hace compras en una tienda por departamentos, un sistema computarizado de informacin
contable verifica de manera automtica si l o ella ha excedido su lmite de crdito. Registros pasados indican
que la probabilidad de que los clientes excedan su lmite de crdito es de 0.05. Suponga que en un da
cualquiera, 20 clientes hacen pedidos y que el nmero de clientes que ha excedido su lmite de crdito
detectado por el mismo sistema computarizado de informacin de contabilidad se distribuye como una
variable aleatoria binomial.
Es aplicable a casos en los cuales se desea obtener la probabilidad de un evento sobre un intervalo de tiempo
o espacio en el cual se cumplen los siguientes supuestos
c.- La ocurrencia del evento en uno de los intervalos es independiente de la ocurrencia del evento en
cualquiera de los otros.
La distribucin de Poisson tiene muchas aplicaciones como por ejemplo, el nmero de clientes que llegan a
un establecimiento por unidad de tiempo, nmero de usuarios que llegan a un punto de servicio y van
formando una cola, etc.
p (X) =
x e
x!
72
Estadstica General ciclo 2013-I
Observacin:
Ejemplo
Un cultivador de semillas hibridas tiene problemas de gusanos barrenadores de maz. Una exploracin
aleatoria de 5000 mazorcas revela estos datos: muchos de ellos no tenan gusanos, algunos tenan uno, unos
cuantos dos y as sucesivamente. El agricultor cont 3500 gusanos en las 5000 mazorcas.
a.- Cul es la probabilidad de que una mazorca seleccionada al azar no contenga barrenadores?
b.- Cul ser la probabilidad de que una mazorca seleccionada al azar contenga uno, dos tres, cuatro, cinco,
seis barrenadores?
Solucin:
3500
= = 0.7
5000
x
e
p (X) =
x!
0.70 e0.7
p (X =0) = = 0.4966
0!
p (x = 1) = 0.3476
p (x = 2) = 0.1217
p (x = 3) = 0.0284
p (x = 4) = 0.005
p (x = 5) = 0.0097
p (x = 6) = 0.0001
1.- La curva normal tiene la forma de una campana y presenta un solo valor mximo en el centro. La media,
mediana y moda son iguales.
73
Estadstica General ciclo 2013-I
Luego la mitad del rea bajo la curva se encuentra a un lado (o por encima del valor central) y la otra
mitad al otro lado (o por debajo)
3.- La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Es asinttica, lo
cual significa que la curva se acerca cada vez ms al eje X, pero nunca llega a tocarlo. Esto es, los puntos
extremos de la curva se extienden indefinidamente en ambas direcciones
La distribucin normal estndar tiene media igual a 0 y desviacin estndar igual a 1.
Valor z (o desvi normal z) es la diferencia (desviacin) entre un valor seleccionado, denotado por X
y la media poblacional , dividida entre la desviacin estndar de la poblacin.
X
Z=
1.- Aproximadamente el 68% del rea bajo la curva normal est dentro ms una y menos una desviacin
estndar respecto de la media. Esto se expresa as 1
2.-Aproximadamente el 95% del rea bajo la curva normal est dentro ms dos y menos dos desviaciones
estndar respecto de la media. Esto se expresa as 2
3.- Aproximadamente el 99% del rea bajo la curva normal est dentro ms tres y menos tres desviaciones
estndar respecto de la media. Esto se expresa as 3
Ejemplo
Una mquina expendedora de gaseosa se ajusta para servir 7.00 onzas de liquido por vaso. La desviacin
estndar es de 0.10 onzas Cul es la probabilidad de que la mquina sirva
Distribucin de probabilidad de todas las posibles medias de las muestran de un determinado tamao
demuestra de la poblacin
Ejemplo
Paty Industrias, cuenta con siete empleados de produccin a quienes se le considera la poblacin). En la
siguiente tabla se incluyen los ingresos por hora de cada empleado
74
Estadstica General ciclo 2013-I
Juan $7 Esther $7
Diana 7 Gabriela 8
Julio 8 Steffany 9
Eduardo 8
Toda inferencia que se haga sobre una poblacin tendr necesariamente, que basarse en estadsticos
muestrales, esto es, en funciones de la informacin muestral. La eleccin apropiada de estos estadsticos
depender de cul sea el parmetro de inters de la poblacin. El verdadero parmetro ser desconocido, y un
objetivo ser estimar su valor.
Para estudiar la estimacin de un parmetro desconocido, debe considerarse dos posibilidades: Estimacin
puntual y estimacin por intervalo.
Parmetros y estadsticos
La media y la desviacin estndar de una variable aleatoria poblacional X son conocidos como
parmetros y la media x y la desviacin estndar s de una muestra son conocidos como estadsticos.
En general a cualquier caracterstica numrica de una poblacin se le conoce como parmetro y a cualquier
cantidad calculada de una muestra aleatoria se le conoce como estadstico. Los estadsticos se usan para
estimar parmetros.
Estimacin puntual
Es el valor calculado, a partir de la informacin de muestreo, que se emplea para estimar el parmetro de
poblacin.
El estadstico muestral usado para estimar un parmetro de la poblacin se llama estimador, y un valor
observado especfico se denomina estimacin.
Cuando la estimacin de un parmetro de la poblacin est dada solamente por un nmero, se denomina
estimacin puntual. Por ejemplo la media muestral x es un estimador de la media poblacional y un
valor simple de x es un estimacin puntual.
Se dice que:
75
Estadstica General ciclo 2013-I
Luego a los valores numricos obtenidos para x , s , p en una determinada muestra se les llama estimados
puntuales del parmetro.
Ejemplo:
A continuacin se muestra el salario anual de 10 trabajadores de una fbrica y los datos si concluyeron con
un programa de adiestramiento general:
Salario Programa de
anual ($) adiestramiento
Gerencial?
x1 9 094.3 Si
x2 3 263.9 Si
x3 9 643.5 Si
x4 9 984.9 Si
x5 7 621.6 No
x6 5924 Si
x7 9 092.3 No
x8 1 404.4 Si
x9 3 957.7 No
x 10 5 109.7 No
= = 6
509.63
= 9.09
S 3.01
0.4
Luego para una muestra de 10 trabajadores de una fbrica, el estimado puntual de es de $ 6 509.63 nuevos
soles, el de es de 3.01 y el de p es 0,4
Insesgo:
Si el valor esperado del estadstico de muestra es igual al parmetro poblacional que se estima, se dice que
este estadstico es un estimador insesgado del parmetro poblacional.
76
Estadstica General ciclo 2013-I
Eficiencia.
Suponga que se puede usar una muestra aleatoria simple de n elementos para obtener dos estimadores
puntuales del mismo parmetro poblacional. En este caso, preferiramos usar el estimador puntual con la
menor desviacin estndar, porque tiende a proporcionar estimados ms cercanos al parmetro poblacional.
Se dice que el estimador puntual con la menor desviacin estndar tiene una mayor eficiencia relativa que el
otro.
Consistencia.
En trminos generales un estimador puntual es consistente si sus valores tienden a acercarse al parmetro de
la poblacin conforme se incrementa el tamao de la muestra. En otras palabras, un tamao grande de muestra
tiende a proporcionar un mejor estimador puntual que un tamao pequeo
Un intervalo de confianza, es una gama de valores obtenidos a partir de datos de muestreo, de modo que el
parmetro ocurre dentro de esta variedad de valores con una probabilidad pre establecida llamada nivel de
confianza.
Intervalo de confianza para la media de una poblacin normal: varianza poblacional conocida.
Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una poblacin con
distribucin normal con una media y una varianza . Si es conocida y el valor observado de la
media muestral es , entonces el intervalo de confianza del 100 (1- para la media poblacional,
viene dada por:
{ - Z +Z } = 1-
Error muestral
Es el valor absoluto de la diferencia entre un estimador puntual insesgado y el parmetro poblacional que
estima se llama error muestral.
Para el caso en el que la media de una muestra estima a una media poblacional, el error muestral es:
77
Estadstica General ciclo 2013-I
Ejemplo.-
Un proceso produce bolsas de azcar refinada. El peso del contenido de estas bolsas tiene una distribucin
normal con desviacin estndar de 15 gramos. Los contenidos de una muestra aleatoria de 25 bolsas tienen un
peso medio de 100 gramos. Calcule un intervalo de confianza del 95% para el verdadero peso medio de todas
las bolsas de azcar producidas por el proceso.
{x z
n
x+ z
n } = 1
{94.12
Intervalo de confianza para la media de una poblacin con varianza desconocida y tamao de muestra
grande
Supongamos que tenemos una muestra de n observaciones procedentes de una distribucin con media .
78
Estadstica General ciclo 2013-I
{ z z } = 1
Ejemplo.-
Se extrajo una muestra aleatoria de 172 estudiantes de Agronoma y se les pidi que evaluasen unas
determinadas condiciones de trabajo en una escala de 1 (no importante) a 5 (extremadamente importante). La
seguridad de trabajo recibi una calificacin media de 4.38 con una desviacin estndar muestral de 0.70.
Calcule un intervalo de confianza del 99% para la media poblacional
{ z +z } = 1
{4.2427 } = 0,99
Una estimacin puntual para una proporcin poblacional se obtiene dividiendo el nmero de xitos de una
muestra entre el nmero total muestreado.
Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo siguiente:
{ z }=1
Como p no se conoce
79
Estadstica General ciclo 2013-I
es la proporcin muestral
n es el tamao de la muestra
Ejemplo.-
En una muestra aleatoria de 900 votantes, el 55 % prefiere al candidato demcrata de presidente. Halle un
intervalo de confianza aproximado para la proporcin de todos los votantes que prefieren al candidato
demcrata con un nivel de confianza del 90%
{ z }=1
0.0165
{ 1.645(0.0165)
}=1
{0.5229 }=1
Ejemplo.-
Se realiz una investigacin de mercado para estimar la proporcin de amas de casa que puedan reconocer la
marca de un limpiador con base en la forma y el color del recipiente. De 1400 personas 420 pudieron
reconocer (identificar) la marca del producto. Si se utiliza el grado de confianza del 99% Cul sern los
intervalos de confianza?
{ z }=1
80
Estadstica General ciclo 2013-I
0,30
0.0122
{ 2.576(0.0122) }=1
{0.2686 }=1
Cuando la poblacin bajo estudio tiene una distribucin normal, o aproximadamente normal, pero no se
conoce la desviacin estndar de la poblacin, y el tamao de la muestra es menor de 30, no podemos usar la
distribucin normal para determinar intervalos de confianza para la media de la poblacin. En este caso
usaremos la distribucin t se Student.
Recordemos que la distribucin de t de Student se utiliza cuando se cumple con las siguientes condiciones.
2.- desconocida
3.- La poblacin es normal.
Al igual que la distribucin normal estandarizada, la distribucin t tiene forma de campaa y es simtrica
alrededor de la media cero, pero es ms achatada que la distribucin normal estandarizada debido a su mayor
dispersin.
81
Estadstica General ciclo 2013-I
4.- La distribucin t es ms extendida y menos aguda en el centro, que la distribucin Z. Sin embargo a
medida que n aumenta la curva de la distribucin t se aproxima a la distribucin normal estandarizada.
El intervalo de confianza para la media poblacional usando la distribucin t, est dado por:
.{ S + S }=1
{ + }=1
Ejemplo.-
Una tienda est interesada en conocer los gastos en prendas de vestir de los estudiantes universitarios en el
primer mes del ciclo acadmico. La media y la desviacin estndar de una muestra aleatoria de nueve
alumnos fueron de $ 15 782 y $ 3889, respectivamente. Suponiendo que la poblacin sigue una distribucin
normal, calcule el intervalo de confianza del 95% para el gasto medio poblacional.
{ S + S }=1
{ + }=1
{12792.65554 }=1
82
Estadstica General ciclo 2013-I
Cuando una variable aleatoria sigue una distribucin de Chi cuadrado con (n-1). Este resultado es clave para
construir un intervalo de confianza para la varianza poblacional cuando se toman muestras de una poblacin
normal.
Supongamos que se dispone de una muestra aleatoria de n observaciones procedentes de una poblacin con
Ejemplo
Un fabricante quiere estimar la variabilidad de los niveles de impurezas de los envos de materia prima de un
determinado proveedor. Extrae para ello una muestra de quince envos y comprueba que la desviacin
estndar muestral en la concentracin de los niveles de impurezas es de 2.36%. Supngase que la poblacin es
normal.
b.- Sin hacer los clculos, determine si un intervalo de confianza del 99% tendra una longitud mayor, menor
o igual a la del intervalo calculado anteriormente
Solucin
a.- n 15 g.l. 14
0.05
83
Estadstica General ciclo 2013-I
2.99 13.85
Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de impurezas discurre entre
2.99% y 13.85%
b.- El intervalo de confianza del 99% para la varianza poblacional ser ms ancho
Las producciones promedio en una planta qumica que usa materias primas suministradas por dos proveedores
diferentes.
Cuando muestras aleatorias independientes de tamao n1 y n2 observaciones han sido seleccionadas de entre
2 2
poblaciones con medias 1 y 2 y variancias 1 y 2 respectivamente, la prueba estadstica ser
( x1 x2 ) ( 1 2)
21 22
Z=
+
n1 n2
2 2
Pero si n1 y n2 son grandes (mayores de 30) y 1 , 2 no se conocen, el estimador del estadstico ser
( x1 x2 ) ( 1 2)
s21 s22
Z=
+
n1 n2
{ ( x 1x 2 ) z
21 22
+ ( x1 x2 ) + z
n1 n 2 1 2 21 22
+
n1 n 2
} =1-
2 2
En caso de que las muestras sean grandes (mayores de 30) y 1 , 2 no se conocen, el intervalo se podr
calcular de la siguiente forma:
2 2 2 2
s 1 s2 s 1 s2
{ ( x 1x 2 ) z + ( x 1x 2 ) + z + } =1-
n1 n2 1 2 n 1 n2
84
Estadstica General ciclo 2013-I
Ejemplo:
Las resistencia al desgaste de dos tipos de llantas para automvil se compararon en muestras de pruebas de
camino de n1 = n2 = 100 llantas para cada tipo. El nmero de millas hasta el completo desgaste se
defini como una cantidad especfica de desgaste de las llantas. Los resultados de la prueba se muestran a
continuacin
LLANTA 1 LLANTA 2
X 1=26400 Millas X 2=25100millas
2 2
S 1=144000 S 2=1960000
Estime (1 - 2), la diferencia en la media de millas hasta el completo desgaste, usando un intervalo de
confianza del 99%. Hay diferencia en el promedio de calidad de desgaste para los dos tipos de llantas?
Solucin: La estimacin puntual de ( 1 2)
es ( x 1x 2 ) = 26 400 25100 = 1300 millas
El error estndar =
21 22
+
n1 n 2
2 2
s1 s1
Que se puede estimar como = +
n1 n 2
=
1440 000 1960 000
100
+
100
= 184,4 millas
{ ( x 1x 2 ) z
s 21 s22
+ ( x 1x 2 ) + z
n1 n2 1 2 s 21 s22
+
n1 n2
} =1- {
1300-2,58
1440 000 1960 000
100
+
100
1 2 1300+2,58
1440 000 1960 000 }= 0,99
100
+
100
85
Estadstica General ciclo 2013-I
x1 x2
( ^p 1 ^p 2) (
n1 n2 )
La media muestral de ( ^p 1 - ^p 2) es p1 p2
La estimacin puntual:
{
( ^p 1 ^p 2 ) Z
^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2
< p 1 p 2< ( ^p 1 ^p 2 )+ Z
n1
+
^p 1 q^ 1 ^p 2 q^ 2
n2 } =1
Ejemplo: La propuesta de un bono para la construccin de una escuela ser enviada a los votantes en la
siguiente eleccin municipal. Una parte importante del dinero derivado de esta emisin de bonos se emplear
en construir escuelas en una zona de rpido desarrollo de la ciudad y lo dems se usar para renovar y
actualizar los edificios escolares del resto de sta. Para evaluar la viabilidad de la propuesta de un bono, a una
muestra aleatoria de n1=50 residentes de la zona de rpido desarrollo y n2= 100 de las otras
partes de la ciudad, se les pregunt si piensan votar por la propuesta. Los resultados se dan a continuacin:
Estime la diferencia en las proporciones verdaderas a favor de la propuesta del bono con un 99% de intervalo
de confianza.
( ^p 1 ^p 2) = 0,76 0,65 = 0,11
^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2 50
(0.76)(0,24) ( 0,65 ) (0,35)
= +
100
= 0,0770
{ ( ^p 1 ^p 2 ) Z
^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2
< p 1 p 2< ( ^p 1 ^p 2 )+ Z
n1
+
n2
^p 1 q^ 1 ^p 2 q^ 2
= 1
}
86
Estadstica General ciclo 2013-I
87