Sie sind auf Seite 1von 87

Estadstica General ciclo 2013-I

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO


FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS

ESCUELA PROFESIONAL DE AGRONOMIA

SILABO DE ESTADISTICA GENERAL

I.- DATOS GENERALES.


Facultad : AGRONOMIA.
Escuela Profesional : AGRONOMIA
Ciclo Acadmico : 2013- I
Ciclo de estudios : Segundo
Cdigo del Curso : EE 305
Pre-requisito : Matemticas I.
Duracin del Curso : 17 Semanas
Extensin Horaria : 04 Horas (2T, 2P)
Crditos : 03 crditos :
Ambiente de asesora : Cubculo N 3 FACFyM
Docente : M. Sc. JOS ELAS PONCE
AYALA.

II.- SUMILLA.

El curso de Estadstica General es de naturaleza terica y prctica. Pertenece al rea de


formacin profesional de la Carrera Profesional de Agronoma. Tiene como propsito
desarrollar en los estudiantes la adquisicin de conceptos, principios y procesos
correspondientes a la aplicacin al campo de la Agronoma as como al uso de los mtodos
estadsticos para la solucin de problemas prcticos de la especialidad, esto es, lograr los
objetivos en cuanto a las funciones e investigacin cientfica y del perfil profesional
correspondiente.

El curso est organizado en tres unidades: La primera unidad trata de Estadstica Descriptiva;
la segunda unidad est dedicada al estudio del Probabilidad; la tercera unidad se ocupa del
Estadstica Inferencial.

III.- OBJETIVOS GENERALES.

Al finalizar la asignatura el estudiante estar capacitado para describir y utilizar los mtodos
estadsticos descriptivos e inferenciales en el campo de la Agronoma.

IV. PROGRAMACION ACADEMICA:

4.1. PRIMERA UNIDAD: ESTADSTICA DESCRIPTIVA

4.1.1. Objetivos Especficos:

4.1.1.1 Conocer la historia de la Estadstica

4.1.1.2 Emplear correctamente los trminos estadsticos.

1
Estadstica General ciclo 2013-I

4.1.1.3 Presentar los datos en forma tabular y grfica.

4.1.1.4 Describir los datos por medio de sus medidas de resumen.

4.1.2. Temtica:

ESTRATEGIA DE APRENDIZAJE
SEMANA CONTENIDO
Breve historia de la Estadstica.
1RA Definicin de estadstica
DISCUSION SOLUCION Y
y Tipos Estadstica.
GENERALIZACIN
2 DA Definicin de trminos estadsticos.
Recoleccin de datos. Tcnicas
Elaboracin de datos
Presentacin de datos en tablas de distribucin de
DISCUSION SOLUCION Y
3 RA frecuencias para variable discreta
GENERALIZACIN
Presentacin de datos en tablas de distribucin de
frecuencias para variable contina.
Interpretacin de tablas de distribucin de
frecuencias para los diferentes tipos de variables
Presentacin de datos en grficos. Grfico de barras
Grfico de sectores
Grfico de barras agrupadas
Grfico de barras compuestas.
Grfico de ramas y hojas
Pictograma
Grfico de Cajas
Grfico de Bastones
Histograma de Frecuencias
4 TA Polgono de Frecuencias.
DISCUSION
a Ojiva ascendente
SOLUCION Y GENERALIZACIN
8 VA Ojiva descendente
Medidas de Centralizacin. Promedio
Mediana
Moda
Cuartiles
Deciles
Percentiles
Medidas dispersin. Desviacin estndar
Coeficiente de variacin
Medidas de asimetra.
Medidas de Kurtosis.
Primer Examen

4.2. SEGUNDA UNIDAD: PROBABILIDAD

4.2.1. Objetivos Especficos:

4.2.1.1 Identificar e interpretar correctamente los conceptos fundamentales de


probabilidad.

4.2.1.2 Identificar un experimento aleatorio, definir un espacio muestral para un


experimento dado.

2
Estadstica General ciclo 2013-I

4.2.1.3 Aplicar, los axiomas de Probabilidad y las reglas de probabilidad en la


resolucin de un problema dado

4.2.1.4 Describir las caractersticas y propiedades de las distribuciones


especiales de variables aleatorias discretas.

4.2.1.5 Calcular la probabilidad de eventos empleando las tablas de


distribuciones especiales.

4.2.1.6 Aplicar las distribuciones de probabilidades para resolver problemas


reales.

4.2.2. Temtica:

SEMANA ESTRATEGIA DE
APRENDIZAJE
CONTENIDO

Introduccin LECTURA
9NA Experimento aleatorio
Punto muestral, espacio muestral, evento o suceso DISCUSION SOLUCION
Tipos eventos. Y GENERALIZACIN
Probabilidad de un evento
Propiedades, Regla aditiva general de Probabilidad.
10 MA
Regla aditiva especial de Probabilidad. DISCUSION
Probabilidad Condicional.
SOLUCION Y
Regla general de la multiplicacin.
Regla especial de la multiplicacin o Probabilidad de GENERALIZACIN
Sucesos independientes.
Teorema de Bayes
PROBLEMAS
Distribuciones muestrales La distribucin Binomial.
11 RA
La distribucin de Poisson. DISCUSION
Distribucin Hipergeomtrica
Distribucin Normal. SOLUCION Y
Segundo Examen. GENERALIZACIN

4.3. TERCERA UNIDAD: ESTADSTICA INFERENCIAL

4.3.1. Objetivos Especficos:

4.3.1.1 Realizar estimaciones para la media, proporciones y varianzas


poblacionales mediante el intervalo de confianza.
4.3.1.2 Estimar la proporcin poblacional a travs de un intervalo de
confianza.

4.3.1.3 Obtener y diferenciar la hiptesis nula y alternativa.


4.3.1.4Realizar pruebas de hiptesis para promedio, proporciones y varianzas
de poblaciones.
4.3.2 Temtica:

3
Estadstica General ciclo 2013-I

ESTRATEGIA DE
APRENDIZAJE
SEMANA CONTENIDO

Introduccin
12DA
Importancia LECTURA
Estimacin intervlica
Intervalo de confianza para estimar el promedio DISCUSION SOLUCION
poblacional Y GENERALIZACIN
Intervalo de confianza para estimar la diferencia de
promedios poblacionales (dos casos)
Intervalo de confianza para estimar la proporcin
poblacional.
13RA
Intervalo de confianza para estimar la diferencia DISCUSION
entre proporciones poblacionales.
Y SOLUCION Y
Intervalo de confianza para estimar la varianza
poblacional Intervalo de confianza para estimar la GENERALIZACIN
14 TA varianza poblacional.
Intervalo de confianza para estimar la razn de
varianzas poblacionales
Hiptesis estadstica y prueba de hiptesis.
Prueba de hiptesis: hiptesis unilaterales y bilaterales
Prueba de hiptesis para promedios.
15 TA
Prueba de hiptesis para la diferencia de promedios
poblacionales (dos casos)
A Prueba de hiptesis para la proporcin poblacional.
Prueba de hiptesis para la diferencia entre EJERCICIOS
17 MA proporciones
Prueba de hiptesis para la varianza DISCUSION
Prueba de hiptesis para razn. SOLUCION Y
Tercer Examen GENERALIZACIN
Examen sustitutorio

V.- METODOLOGA
Las estrategias metodolgicas a utilizar para el mejor aprendizaje son:

Concurrir a clases a la hora exacta y con la seguridad de disponer de los prerrequisitos

Durante el ciclo acadmico se tomarn tres exmenes y las tareas acadmicas se


evaluarn permanentemente teniendo en cuenta que la presentacin sean de manera
completa y oportuna. El alumno que falte a un examen o no presente trabajos o tareas en
la fecha sealada tendr nota mnima.
Se tendr en cuenta para las exposiciones la Investigacin bibliogrfica
El alumno con el 30% de inasistencia no tendr derecho a ser evaluado.
Para la calificacin de los exmenes se emplear la escala vigesimal.
Intervenir ya sea en forma voluntaria o cuando se le indique.
El promedio final (P.F.) se obtiene de la siguiente forma

2 P . E . U .+ P .T . A .
P.F =
3
Donde:

4
Estadstica General ciclo 2013-I

P.E.U: Promedio de Exmenes de unidad, el mismo que debe ser mayor o igual a
10.5.

P.T.A.: Promedio de Tareas Acadmicas (Presentacin de trabajos, exposicin,


practicas calificadas, intervenciones)

El alumno para ser aprobado en el curso deber obtener como promedio final una nota
de 10.5 a ms.
Tendrn derecho a rendir examen sustitutorio todos aquellos estudiantes que
cumplieron con rendir todas las evaluaciones y con entregar todos los trabajos,
adems tengan como promedio de exmenes no menor de 08, el cual reemplazar el
menor calificativo del examen de unidad.

VI.- MEDIOS Y MATERIALES


Utilizaremos los siguientes medios y materiales

Ambiente Fsico: Aula de la Ciudad Universitaria


Ejercicios y problemas de esta unidad desarrollados en el aula.
Bibliografa Especializada
Separatas, fotocopias de textos referentes al tema
Textos guas
Calculadora cientfica, etc.

VII. REFERENCIAS BIBLIOGRAFCAS:

1. C. CANAVOS, George: Probabilidades y Estadstica Aplicaciones y Mtodos Ed. Mc.


GRAW HILL, 2007.651 pginas.

2. CORDOVA ZAMORA, Manuel: Estadstica Descriptiva e Inferencial. Ed. MOSHERA


S.R.L. Quinta edicin. Lima Per, 2008. 505 Pginas.

3. DAZA PORTOCARRERO, Jorge: Estadstica Aplicada. Ed. Megabayte s. a. c Lima Mayo


del 2006. 647 Pginas.

4. FREUND, Jhon/ WALPOLE, R: Estadstica Matemtica con Aplicaciones. Ed. Prentice


Hall, cuarta edicin Mxico - 2007. 622 Pginas

5. DAVID R. ANDERSON. Estadstica para Administracin y Economa. Stima Ediciones.


Internacional Thomsom Editores 2006. 908 Pg.

6. MITACC MEZA, Mximo: Tpicos de Estadstica Descriptiva y Probabilidades Ed. San


Marcos - Lima. 2007.532 Pginas

7. MORA C. ARTURO / CID S. LUIS / VALENZUELA H. MARIA: Probabilidades y Estadstica


Universidad de Concepcin. Facultad de Ciencias Fsicas y Matemticas Departamento de
Estadstica. 2006. 427 pginas

8. MOYA CALDERON, Rufino: Probabilidad e inferencia estadstica. Ed. San Marcos. Lima -
Per. 2006. 807 pginas

Lambayeque, Agosto del 2013.

5
Estadstica General ciclo 2013-I

M. Sc. Jos Elias Ponce Ayala

Docente del curso

ESTADISTICA GENERAL

HISTORIA DE LA ESTADSTICA

La recopilacin sistemtica de datos econmicos y de poblacin se inici en Venecia y Florencia, las


ciudades-Estado italianas, durante el Renacimiento. El trmino ESTADISTICA, derivado de la palabra
Estado, se utiliz entonces para referirse a la obtencin de datos de inters estatal. Esta idea de recopilacin
de datos se extendi desde Italia a otros pases de Europa occidental. De hecho, durante la primera mitad del
siglo XVI, era habitual que los gobiernos europeos obligaran a las parroquias a que registraran los
nacimientos, los matrimonios y las defunciones. Debido a las muy escasas condiciones de salud pblica, las
estadsticas referidas a estos hechos tenan un especial inters.

El trmino Estadstica que se utiliz hasta el siglo XVII como una abreviatura de la ciencia descriptiva de los
Estados, se identific cada vez ms, en el siglo XIX, con las cifras cuantitativas. Hacia 1830, en Francia e
Inglaterra, el trmino ya fue usado de forma general como sinnimo de la ciencia numrica de la sociedad.
Este cambio de significado se debi a que, desde 1800, los gobiernos de Europa Occidental y de Estados
Unidos comenzaron a recopilar y publicar sistemticamente una gran cantidad de registros de censos y de
otros tipos de tablas.

Aunque a lo largo del siglo XIX la teora de la probabilidad haba sido desarrollada por matemticos tales
como Jacob Bernoulli, Karl Friedich Gauss y Pierre Simon Laplace, su aplicacin al estudio de hechos
estadsticos fue casi inexistente, ya que la mayor parte de los estadsticos sociales de la poca se contentaban
con dejar que los datos hablaran por s mismos. En particular, en esa poca los estadsticos no estaban
interesados en sacar inferencias a partir de individuos, ms bien se centraban en la sociedad en su totalidad.
Por consiguiente, no estaban preocupados por el muestreo sino que intentaban obtener censos de la poblacin
al completo. Como resultado, la inferencia probabilstica sobre la poblacin a partir de muestras era
prcticamente desconocida en las estadsticas sociales del siglo XIX

No fue hasta finales de este siglo cuando los estadsticos empezaron a preocuparse por inferir conclusiones a
partir de los datos numricos. El movimiento comenz con los trabajos de Francis Galton sobre el anlisis de
la influencia de la herencia a travs de la utilizacin de tcnicas que actualmente se conocen como anlisis de
regresin y correlacin, que alcanzaron su mayor auge con los trabajos de Karl Pearson. ste, que desarroll
los contrastes de bondad de ajuste, fue el primer director del laboratorio Galton, fundado por Galton en 1904.
All, Pearson lider un programa de investigacin con el objetivo de desarrollar nuevos mtodos en los que la
Estadstica se utiliza con fines inferenciales. Su laboratorio potenci que investigadores provenientes de
distintas reas de la ciencia y la industria aprendieran los mtodos estadsticos que podan tener aplicacin en
sus campos. Uno de los primeros estudiantes que acudi a su laboratorio fue W. S. Gosset qumico de
formacin, que demostr su devocin por Pearson y public sus propios trabajos bajo el seudnimo de
Student. Existe una famosa leyenda que mantiene que Gosset tema publicar sus trabajos, bajo su propio
nombre por miedo a que, en la fbrica de cerveza Guinnes, donde laboraba, sus jefes descubrieran que uno de
sus qumicos realizaba investigaciones estadsticas. Gosset es famoso por el desarrollo de los contrastes de t.

Dos de las reas ms importantes de aplicacin de la Estadstica a principios del siglo XX fueron la biologa y
la agricultura; todo ello gracias al inters de Pearson y de otros investigadores de su laboratorio, y tambin a
los logros del cientfico ingls Ronald A. Fisher. La teora de la inferencia desarrollada por estos
investigadores pioneros y otros entre los que se encuentran Egon Pearson, hijo de Karl Pearson, y el

6
Estadstica General ciclo 2013-I

estadstico matemtico polaco JersyNeyman- fue lo suficiente general como para tratar una amplia gama de
problemas cuantitativos prcticos. Como resultado, tras los primeros aos del siglo XX, aument muy
rpidamente el nmero de personas, procedente de la ciencia, los negocios y la administracin, que
empezaron a considerar la Estadstica como una herramienta capaz de suministrar soluciones cuantitativas a
una gran variedad de problemas cientficos y prcticos.

En la actualidad, podemos encontrar las ideas estadsticas en muchos mbitos. La Estadstica Descriptiva
puede verse en peridicos y revistas. La Inferencia Estadstica se ha hecho indispensable en las
investigaciones mdicas y de salud pblica, en la investigacin de mercados y en el control de calidad, en la
educacin, la contabilidad, la economa, en la prediccin meteorolgica o de las votaciones, y en muestreos,
deportes, seguros, en juego de apuestas y en cualquier tipo de investigacin que pretenda ser cientfica. Hoy
en da, la Estadstica se ha convertido realmente en una pieza integrante de nuestra herencia.

LA CAMBIANTE DEFINICION DE LA ESTADSTICA

La Estadstica tiene el objeto de realizar una representacin fiable de un Estado en una poca determinada
(Quetelet, 1849)

La Estadstica es la nica herramienta mediante la cual se puede conseguir una apertura en la formidable
espesura de dificultades que entorpece el camino de aquellos que estudian la Ciencia del hombre (Galton,
1889)

La Estadstica puede considerarse (i) como el estudio de las poblaciones, (ii) como el estudio de las
variaciones y (iii) como el estudio de los mtodos de reduccin de datos (Fisher, 1925).

La Estadstica es la disciplina cientfica relativa a la recopilacin, el anlisis y la interpretacin de datos


obtenidos mediante la observacin o la experimentacin. Tiene una estructura coherente basada en la Teora
de la Probabilidad e incluye muchos procedimientos diferentes que contribuyen a la investigacin y el
desarrollo en todas las ramas de la Ciencia y la Tecnologa. (E. Pearson, 1936)

La Estadstica es el nombre de la ciencia que trata de llevar a cabo inferencias bajo situaciones de
incertidumbre; para ello, usa los nmeros para averiguar cuestiones relativas a la naturaleza y la experiencia.
(Weaver, 1952).

La Estadstica se caracteriza en el siglo XX como una herramienta matemtica para analizar datos
experimentales u observados. (Ross, 2005).

Estadstica es la ciencia que nos ayuda a recolectar, organizar, presentar, analizar e interpretar datos para una
toma de decisin ms efectiva.(Alvaro Pintado-Agurto Mejia,2009).

CLASIFICACIN DE LA ESTADSTICA

La Estadstica puede dividirse en dos partes: descriptiva e inferencial

ESTADSTICA DESCRIPTIVA.- Se encarga de recopilar, clasificar, presentar y describir un conjunto de


datos.
ESTADISTICA INFERENCIAL.- Se encarga de interpretar los datos estudiados por las tcnicas
descriptivas. Ella emplea mtodos que hacen posible la estimacin de una caracterstica de una poblacin, o la
toma de decisiones con respecto a una poblacin basada en los resultados de muestras, es decir, de los datos
obtenidos de las muestras se sacan conclusiones que se dan como vlidas para todo el universo o poblacin.

7
Estadstica General ciclo 2013-I

Es de esperar que el sacar estas conclusiones siempre exista una pequea probabilidad de error, pues la
inferencia es inductiva.

ETAPAS DEL MTODO ESTADSTICO


El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede siempre mantener las
mismas condiciones predeterminadas o a voluntad del investigador, deja que acten libremente, pero se
registran las diferentes observaciones y se analizan sus variaciones.
Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas:

1.- Planteamiento del problema.


2.- Fijacin de los objetivos.
3.- Formulacin de la hiptesis.
4.- Definicin de la unidad de observacin y de la unidad de medida.
5.- Determinacin de la poblacin y de la muestra.
6.- La recoleccin.
7.- Crtica, clasificacin y ordenacin.
8.- Tabulacin.
9.- Presentacin.
10.-Anlisis.
11.-Publicacin.

1. PLANTEAMIENTO DEL PROBLEMA


Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se pretende estudiar
algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible sobre el o los fenmenos que se
pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisin bibliogrfica del tema,
para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras
proposiciones bsicas a un anlisis lgico; es decir, se debe hacer una ubicacin histrica y terica del
problema.

2. FIJACIN DE LOS OBJETIVOS


Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos llegar; en
otras palabras, debemos fijar cules son nuestras metas y objetivos. Estos deben plantearse de tal forma que
no haya lugar a confusiones o ambigedades y debe, adems, establecerse diferenciacin entre lo de corto,
mediano y largo plazo, as como entre los objetivos generales y los especficos.

3. FORMULACIN DE LAS HIPTESIS


Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su formulacin
depende del conocimiento que el investigador posea sobre la poblacin investigada. Una hiptesis estadstica
debe ser susceptible de docimar, esto es, debe poderse probar para su aceptacin o rechazo.

4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA


La Unidad de Observacin, entendida como cada uno de los elementos constituyentes de la poblacin
estudiada, debe definirse previamente, resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a
las que se les har la medicin.
La unidad de observacin puede estar constituida por uno o varios individuos u objetos y denominarse
respectivamente simple o compleja.

8
Estadstica General ciclo 2013-I

El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo de
investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qu unidad se
tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de
efectuar la toma de la informacin.
5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA
Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen una o
varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes; una poblacin
puede estar constituida por los habitantes de un pas o por los peces de un estanque, as como por los
establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino infinito no
est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro de un estanque son un
conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado como infinito.

Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar las
propiedades del conjunto del cual es obtenida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es aconsejable, ya
sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es
necesario destruir lo que se est midiendo, por ser demasiado grande el nmero de sus componentes o no se
pueden controlar; por eso se recurre al anlisis de los elementos de una muestra con el fin de hacer inferencias
respecto al total de la poblacin. Existen diversos mtodos para calcular el tamao de la muestra y tambin
para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos
solamente que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para
asegurar la objetividad de la investigacin.

6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual ha de partir,
a menos que se tenga experiencia con muestras anlogas, de una o varias muestras piloto en las cuales se
pondrn a prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de la poblacin, con el
fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de los parmetros con la
precisin establecida.

El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de las


preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar teniendo en
cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las limitaciones que se tengan en
la zona geogrfica, el grado de desarrollo, la ausencia de tcnica, etc.

Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es determinar si
la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes directos que recojan la
informacin; establecer su nmero ptimo y preparar su entrenamiento adecuado.

7. CRITICA, CLASIFICACIN Y ORDENACIN


Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos recogidos.
Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin por parte de quien
depura para poder detectar falsedades en las respuestas, incomprensin a las preguntas, respuestas al margen,
amn de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario.
Separado el material de "desecho" con la informacin depurada se procede a establecer las clasificaciones
respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces necesarios entre las

9
Estadstica General ciclo 2013-I

preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin de las diferentes variables que
intervienen en la investigacin.
El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas, manualmente
dispendiosas, puedan ser realizadas en corto tiempo.

8. LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al lector sobre lo
que se pretende describir; para su fcil interpretacin una tabla debe tener por lo menos: Un ttulo adecuado el
cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subttulos internos y la
cuantificacin de los diferentes tems de las variables, y las notas de pie de cuadro que hagan claridad sobre
situaciones especiales de la tabla, u otorguen los crditos a la fuente de la informacin.

9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los cuadros,
tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se van a presentar y la
forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes que, antes que
claridad, crean confusin. Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe
hacerse no slo en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe.

10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones de
primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la
toma de una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los parmetros y
estadsticos mustrales para las estimaciones e inferencias respecto a la poblacin, el ajuste de modelos y las
pruebas de las hiptesis planteadas, con el fin de establecer y redactar las conclusiones definitivas.

11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del mismo problema
a quienes se les puede aportar informacin, conocimientos y otros puntos de vista acerca de l.

TIPOS DE DATOS
Los especialistas en Estadstica analizan un amplia variedad de fenmenos o caractersticas, llamadas
variables aleatorias. Los datos son los hechos y nmeros, resultantes de la observacin de estas variables
aleatorias. Indudablemente una variable aleatoria puede tomar diferentes valores o atributos de una
observacin a otra.
Si una caracterstica de nuestro inters puede tomar distintos valores o tienen diferentes resultados, se
denomina variable

VARIABLE
Es una caracterstica o propiedad que puede tomar diferentes valores o atributos. Ejemplo: rendimiento
acadmico, religin, talla, etc.

Variable Valor o atributo

Rendimiento acadmico 11,12,13

10
Estadstica General ciclo 2013-I

Gnero Masculino, femenino

Color de ojos Negros, verdes

Estado civil Soltero, casado

Atencin en restaurante Buena, mala, regular

Nmero de hijos 2, 3, 4

Nmero de TV vendidos 16,14

Peso de cargamento 14.5, 18.23

Talla 1.65, 1.70, 1.92

CLASIFICACIN DE VARIABLES
Antes de considerar aspectos relacionados con la recopilacin, descripcin reduccin y anlisis de datos
estadsticos, es necesario distinguir y conocer los diversos tipos de variables que se pueden encontrar en
los diversos estudios e investigaciones. Entre los muchos criterios de clasificacin, podemos mencionar
tres tipos:

SEGN LA NATURALEZA DE LA VARIABLE


1.- Variables Cualitativas
Son aquellas que expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo, sus datos se
expresan mediante una palabra, es no numrico.
Las variables cualitativas pueden ser: nominal u ordinal.
a) Variable Cualitativa Nominal: Son aquellas que establecen la distincin de los elementos en las
categoras sin implicar orden entre ellas.
Ejemplo:
Lugar de nacimiento (Trujillo, Chiclayo, Salas)
Estado Civil o conyugal (soltero, casado, viudo, divorciado, separado, conviviente)
Idioma de los habitantes de la tierra (castellano, ingls, francs, italiano, chino mandarn, etc.)
Religin que profesa (catlico, evanglico, musulmn, etc.)
b) Variable Cualitativa Ordinal: Son aquellas que agrupan a los objetos, individuos, en categoras
ordenadas, para establecer relaciones comparativas.
Ejemplo:
Nivel de pobreza ( no pobre, pobre, muy pobre, extremadamente pobre)
Categora de un docente universitario ( principal, asociado, auxiliar)
2.- Variables Cuantitativas
Son aquellas que expresan el valor de la variable por una cantidad, es de carcter numrico. El dato o valor
puede resultar de la operacin de contar o medir.
Las variables cuantitativas pueden ser: discreta y continua.
a) Variable cualitativa discreta: Cuando el valor de la variable resulta de la operacin de contar, su valor
est representado slo por nmeros naturales (enteros positivos)
Ejemplo:
Nmero de accidentes de buses en la panamericana norte
Nmero de hogares por vivienda en el distrito de San Juan de Lurigancho
b) Variable cualitativa contina: Cuando el valor de la variable puede tomar cualquier valor dentro de un

11
Estadstica General ciclo 2013-I

rango dado, por tanto se expresa por cualquier nmero real.


Ejemplo:
Produccin de azcar de la fbrica Casagrande en el ao 2011
Hectreas de cultivo de arroz en la Regin San Martin en el ao 2012

SEGN LA RELACIN ENTRE VARIABLES


1.- Variables Independientes: (VI)
Son las variables explicativas o predictivas, cuya asociacin, relacin o influencia en la variable
dependiente se pretende descubrir en la investigacin. Las variables independientes son los que traducen o
explican las causas o razones de las variaciones en la variable dependiente.
2.- Variables Dependientes: (VD)
Son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que
buscar un motivo, causas o razn de ser. Es la variable que traduce la consecuencia del efecto de una o
varias razones o causas, de otras variables.
Simplificando, en la relacin de variables, las causas o antecedentes seran las variables independientes
y el efecto o consecuente es la variable dependiente.

Ejemplos:
El volumen de ventas (VD) se explica por la inversin en publicidad (VI)
El gasto familiar (VD) depende del ingreso familiar (VI)
Ventas de casas (VD) depende de la tasa de inters (VI)

3.- Variables Intervinientes o Interferentes


Son aquellas que coparticipan con la variable independiente condicionando el comportamiento de la
variable dependiente.

Ejemplos:
El escaso fomento de la educacin alimentaria en la poblacin, genera mayor desnutricin
infantil en las familias con bajo nivel de instruccin.
Educacin alimentaria (VI)
Desnutricin infantil (VD)
Nivel de instruccin (V. Interviniente)

El bajo nivel de instruccin, es uno los factores que posibilita el poco inters de los padres, en el
control de crecimiento y desarrollo de los nios de familias de estrato socio econmico bajo.
Nivel de instruccin (VI)
Crecimiento y desarrollo (VD)
Estrato socio econmico (V. Interviniente)

ESCALA DE MEDICIN DE LAS VARIABLES


Las variables no slo de clasifican, sino tambin es necesario medirlas. La medicin se hace con el fin de
diferenciar por comparacin, un elemento de otro, en las caractersticas de la variable. Este se hace a travs
de niveles o escalas, entre las cuales tenemos:
1.- Escala Nominal
Es el nivel ms simple de medicin donde las variables en escala nominal son de naturaleza cualitativa
solamente permiten establecer categoras sin orden. En este nivel las categoras slo se nombran o se
enumeran, pero no se comparan.

12
Estadstica General ciclo 2013-I

Ejemplo:
Lugar de nacimiento (Lambayeque, Lima, Ica, Cuzco, etc.)
Deporte que practica ( Futbol, Bsquet, Vley, Natacin)
Colegio de Procedencia (Estatal, Particular)
Las variables que slo tienen dos categoras se llaman variables dicotmicas.
2.- Escala Ordinal
Es el segundo nivel de medicin donde las variables establecen categoras jerarquizadas, pero no grados de
distancia iguales entre ellas; las categoras expresan una posicin de orden.
Ejemplo:
Orden de mrito acadmico en un colegio (primero, segundo, tercero, etc.)
Nivel de calificacin a alguna autoridad pblica ( Muy bueno, bueno, regular, malo y muy malo)
Grado de instruccin (Sin instruccin, inicial, primaria, secundaria, superior no universitaria,
superior universitaria, post grado)

3.- Escala de Intervalo


Es el tercer nivel de medicin, entre cuyos diversos valores que toma la variable existen a la vez,
clasificacin, orden, y grados de distancia iguales entre las diferentes categoras, es decir, los intervalos son
considerados como equivalentes y con un origen convencional, la unidad de medida no necesariamente
empieza de cero; slo sirve como punto o valor de comparacin.
Ejemplo:
La temperatura
Las puntuaciones obtenidas en un test psicolgico
Coeficiente de inteligencia
4.- Escala de Razn o Proporcin
Es el nivel ms alto de medicin y donde la variable supone o comprende a la vez todos los casos
anteriores: clasificacin, orden, distancia y origen nico natural. Tiene un cero absoluto, el cero representa
la ausencia de la caracterstica estudiada.
Ejemplo:
La edad en aos
Las distancias
Producto bruto interno

Ejemplo: entre la escala de razn y de intervalo


Escala de Razn
Antonio tiene una estatura de 1.85 m y Felipe de 1.62 m, entonces Antonio es 114% tan alto como
Felipe (1.85/1.62 = 1.14), o simplemente Antonio es 14% ms alto que Felipe.
Escala de Intervalo
Sin embargo el Coeficiente de Inteligencia) no tiene la cualidad de proporcin.
Enzo tiene un CI de 130 y Diego de 100, no se puede decir que Enzo es 30% ms inteligente que
Diego.

ORGANIZACIN Y PRESENTACIN DE INFORMACIN ESTADSTICA


Frente a un conjunto de datos, el primer paso a dar, debe ser expresado y clasificarlo de acuerdo a criterios
convenientes, que permitan ver rpidamente todas las caractersticas tiles, ya sea directamente o por
medio de clculos posteriores.

PRESENTACIN DE INFORMACIN ESTADSTICA


La informacin estadstica puede presentarse de dos formas:

13
Estadstica General ciclo 2013-I

1.- Mediante cuadros o tablas


2.- Mediante grficos.
Presentacin de datos en cuadros estadsticos
El cuadro estadstico es el arreglo ordenado en filas y columnas, de los datos estadsticos o caractersticas
de un fenmeno. Tambin se llama cuadro de anlisis, cuyo objetivo es ofrecer informacin estadstica
de fcil lectura comparacin e interpretacin.

PARTES DE UN CUADRO ESTADSTICO.


Las partes de un cuadro estadstico son: 1 Nmero del cuadro; 2 Ttulo; 3 Cuadro propiamente dicho; 4 Las
notas explicativas o calce; 5 Fuente.

1.-NMERO DEL CUADRO.- Es el cdigo de identificacin del cuadro. Este nmero se escribe a
continuacin de la palabra cuadro, por ejemplo cuadro No 2.5, indica el quinto cuadro del captulo
dos.
2.- TTULO.- Es la identificacin que preside la tabla y es colocada en la parte superior de la misma. El ttulo
debe reunir las condiciones siguientes: a.- ser completo; b.- ser conciso.
a.- SER COMPLETO: Un ttulo completo debe indicar claramente cul es el contenido del cuadro
estadstico. Debe responder a las preguntas: Qu, Cmo, Dnde y Cundo
QUE: A qu se refiere la tabla que se estudia. Cul es el universo que se investiga. Ejemplo Alumnos
matriculados
COMO: Cmo se estudia, de acuerdo a cules caractersticas se clasifican los individuos u objetos
estudiados. Las variables ubicadas en las filas se identifican con la proposicin segn y las de las
columnas con la proposicin por Ejemplo Por sexo y segn especialidad
CUANDO: Momento o periodo de tiempo a que se refiere el estudio. Ejemplo Ciclo 2011 - II
DONDE: Lugar a que se refiere la informacin. Ejemplo Universidad Particular de Chiclayo
b.- SER CONCISO.- El ttulo debe ser breve, lo ms conciso posible, aunque no debe sacrificarse la
claridad a la concisin.
3.- CUADRO PROPIAMENTE DICHO.- Es la parte del cuadro que contiene la informacin y consta de un
conjunto de casillas o celdas, dispuestas en columnas y filas. Sus elementos esenciales son:
encabezamiento de las columnas, columna principal o matriz y cuerpo.
ENCABEZAMIENTO.- Es la primera fila del cuadro, en l se explica las categoras, y el objeto de cada
una de las columnas, es decir indica la naturaleza de los datos inscritos en cada una de las celdas que se
hallan debajo. Deben ser breves y explcitos.
COLUMNA PRINCIPAL O MATRIZ.- Es aquella en que se anotan las categoras o las diferentes clases
de la escala de clasificacin utilizada.
CUERPO.- Es el conjunto de celdas o casillas, que son las intersecciones de filas y columnas, donde
estn anotados los datos numricos.
4.- NOTAS EXPLICATIVAS O CALCE O NOTA DE PIE O LLAMADAS: Se usa para aclarar algunos
trminos o siglas tambin para indicar que elementos estn o no incluidos en algunos de los conceptos del
cuadro.
5.- FUENTE.- Sirve para nombrar la publicacin, entidad, estudio o fuente de donde se obtuvieron los datos
utilizados para construir el cuadro.
Hay dos tipos de fuentes:
a.- Primaria.- Cuando se obtiene directamente de la unidad de anlisis o cuando se recurre a los
propios formularios de una encuesta.
b.- Secundaria.- Cuando se recurre a documentos, boletines o cuadros estadsticos publicados.

CONSTRUCCIN DE TABLAS DE FRECUENCIA

14
Estadstica General ciclo 2013-I

Las tablas de frecuencia o distribucin, son tablas de trabajo estadstico, que presentan la distribucin de un
conjunto de elementos agrupados o clasificados en las diversas categoras de las variables. Las tablas
presentan diversos tipos de frecuencia (absoluta, relativa o acumulada).
Para construir una tabla de frecuencias se siguen los siguientes pasos:
a.- La clasificacin.- que consiste en determinar las categoras, los distintos valores que toman las variables
o los intervalos de clase.
b.- Tabulacin.- que consiste en contabilizar cuantas veces se repite cada uno de los distintos valores o
categoras de las variables.

TABLA DE VARIABLE CUALITATIVA


Ejemplo.- La empresa constructora Techito de Chiclayo contrat a 20 obreros para construir un edificio en
el cercado de la ciudad, en sus fichas de inscripcin de cada obrero
se registr su estado civil, los datos son los siguientes:

X 1 Soltero X 6 Viudo X 11 Casado X 16 Casado

X 2 Casado X 7 Soltero X 12 Soltero X 17 Casado

X 3 Viudo X 8 Divorciado X 13 Divorciado X 18 Soltero

X 4 Soltero X 9 Casado X 14 Viudo X 19 Divorciado

X 5 Divorciado X 10 Casado X 15 Soltero X 20 Casado

Con esta informacin construir una tabla de distribucin de frecuencia para la variable estado civil (X) y
representarla grficamente.

1.- Clasificacin.- Se identifican las clases o categoras que corresponden a la variable cualitativa, las cuales
deben ser mutuamente excluyentes.

Clases o categoras: Soltero


Casado
Divorciado
Viudo

2.-Tabulacin: Se realiza el tarjeo de datos (cuantos datos corresponden a cada clase)

Clase Conteo f i ni
Soltero ///// / 6
Casado ///// // 7
Divorciado //// 4
Viudo /// 3

Tabla No 1
Distribucin de 20 obreros de la empresa Techito de Chiclayo, segn su estado civil. Abril 2012.

Estado civil No de obreros f i ni hi %

15
Estadstica General ciclo 2013-I

Soltero 6 30

Casado 7 35

Divorciado 4 20

Viudo 3 15

Total 20 100

Fuente: Fichas de inscripcin, oficina de personal

Interpretacin: El 30% de obreros son solteros (6), el 35% son casados (7), el 20% son divorciados (4) y el 15
% son viudos (15).

Grfico No 1

Distribucin de 20 obreros de la empresa Techito de Chiclayo segn su estado civil. Abril 2013

TABLA DE VARIABLES CUANTITATIVAS

TABLAS DE VARIABLES CUANTITATIVAS DISCRETAS

Ejemplo.- Se realiza un estudio para determinar el nmero de trabajadores que emplea las pequeas empresas
del Departamento de Lambayeque, para lo cual se tom una muestra de 20 pequeas empresas
determinndose los siguientes datos

X1 X6 X 11 4 X 16 3
6 3

X2 X7 X 12 5 X 17 4
5 4

X3 X8 X 13 6 X 18 6
4 4

16
Estadstica General ciclo 2013-I

X4 X9 X 14 2 X 19 5
4 5

X5 X 10 X 15 4 X 20 3
5 5

Clasificacin.- En este caso se identifican los distintos valores que tiene Xi y ubicamos el mayor y menor

valor: X min =2 y X m x =6

Los diferentes valores que toma la variable Xi los vamos a denotar por Yi ni

Y 1=2 Y 2=3 Y 3=4 Y 4 =5 Y 5=6

Tabla No 2

Distribucin del nmero de trabajadores en 20 pequeas empresas del Departamento de Lambayeque. Agosto
2013.

No de trabajadores ( Y i Tarjas Frecuencia ( fi )

2 / 1

3 /// 3

4 ///// // 7

5 ///// / 6

6 /// 3

Total 20

TABLA PARA DATOS CONTINUOS

Designemos tambin el conjunto original de datos u observaciones por x 1 , x 2, . , x n siendo n el tamao


del conjunto y donde estos datos son del tipo continuo, para construir una tabla de frecuencia debemos
calcular lo siguiente:

Clases.- (m, K) se llaman clases a cada uno de los grupos en los que se divide el conjunto de datos.

No hay una regla fija para determinar el nmero de clases,

K = 2,5 4 n
K = 1 + 3,3 log n

17
Estadstica General ciclo 2013-I

5 K 20

Rango. - (R) Diferencia entre la observacin que tiene el valor mximo y la observacin que tiene el valor
minino, tambin se conoce como recorrido amplitud total.

R= X M X m

Intervalo de clase (I).- es el cociente que resulta de dividir la amplitud total rango entre el nmero de
clases.

Una tabla tiene la siguiente forma

Y 'i 1 y 'i ni hi Ni Hi
'
yi

Y '0 Y1 n1 h1 N1 H1
'
y1

Y1
'
Y2 n2 h2 N2 H2
'
y 2

Y 'm 1 Ym nm hm Nm Hm
'
ym

Marca de clase.-Es el punto medio de un intervalo o clase

Frecuencia absoluta-Llamada tambin frecuencia absoluta simple, es el nmero de veces que se repite los
valores dentro de las diferentes clases (intervalo) en la que est dividida la informacin

Frecuencia relativa.- se denomina frecuencia relativa del valor y i al cociente de la frecuencia absoluta
de y i y el nmero total de observaciones. Se denota por hi

Frecuencia absoutade yi n
hi= = i
N mero tota de observaciones n

Frecuencia absoluta acumulada.- Se llama frecuencia absoluta acumulada correspondiente al valor yi


al nmero de observaciones menores o iguales a y i se denota por N i

18
Estadstica General ciclo 2013-I

N i=n1 +n 2+ n3+ +ni :


1
N 1= n j =n1
J =1

2
N 2= n j=n1+ n2
j=1

3
N 3= n j=n1+ n2 +n3
j=1

4
N 4 = n j=n1 +n2 +n 3+ n4
j=1

5
N 5= n j=n1+ n2 +n3 +n 4+ n5
j=1

Y as sucesivamente

Frecuencia relativa acumulada.- se llama frecuencia relativa acumulada del valor yi a a frecuencia
relativa total de las observaciones menores o iguales a yi

Se denota como Hi

n1+ n2+ n3 + .+ni


H i=h1 +h 2+ .+ hi =
n
I
H i = h j
j=1

Entonces tenemos:

1
H 1= h j=h 1
j=1

2
H 2= h j=h1+ h2
j=1

3
H 3= h j=h1+ h2+ h3
j=1

4
H 4 = h j=h1 +h2 +h3 + h4
j =1

19
Estadstica General ciclo 2013-I

5
H 5= h j=h1+ h2+ h3 +h4 + h5
j=1

As sucesivamente

PROPIEDADES DE LAS FRECUENCIAS


1.- Las frecuencias absolutas y las frecuencias acumuladas absolutas son siempre enteros no negativos

ni 0 y N i 0 para i 1, 2, 3,., m

2.- La suma de todas las frecuencias absolutas es igual al nmero total del conjunto de observaciones.
ni= n1+ n2+ +nm =n
m


i=1

3.- Las frecuencias relativas y las frecuencias relativas acumuladas son siempre nmero fraccionados no
negativos, no mayores de uno.

0 hi 1 0 Hi para i= 1, 2, ., m

3.- La frecuencia absoluta acumulada correspondiente al valor y m coincide con el nmero total conjunto
de observaciones.

m
N m= ni=n
i=1

4.- La frecuencia relativa acumulativa correspondiente al valor y m coincide con la unidad


m
H m= hi=1
i =1

5.- Las frecuencias absolutas acumuladas cumplen las desigualdades siguientes

n1=N 1 N 2 . N m Para i = 1, 2, , m

6.- Las frecuencias relativas acumuladas cumplen las siguientes desigualdades

h1=H 1 H 2 . H m Para i = 1, 2, ,m

Ejemplo

Suponga que se han registrado 50 observaciones referentes a la altura (cm.) de planta de arroz (Oryza sativa
L.) al momento de la cosecha

63 36 49 56 64 59 35 78 43 36 43 53 70 57 62
43 68 62 27 88 64 72 52 51 62 60 71 61 55 27
59 60 67 57 67 62 51 81 60 53 64 76 44 73 56
62 63 60 68 67

20
Estadstica General ciclo 2013-I

A continuacin ordenamos los datos de menor a mayor

27 27 35 36 36 43 43 43 44 49 51 51 52 53 53
55 56 56 57 57 59 59 60 60 60 60 61 62 62 62
62 62 63 63 64 64 64 67 67 67 68 68 70 71 72
73 76 78 81 88

El rango ser
R = 88 27= 61

El nmero de clases o intervalos ser

4
K =m = 2,5 50=6,647 7
El intervalo ser
61
I= =9,17
6,647

A continuacin calculamos:

Marca de clase (Y i ) . - es la semisuma de los lmites de clase. Es decir lmite inferior ms lmite superior
entre dos.

Frecuencia absoluta ( ni . Es el nmero de observaciones o de datos comprendidos entre los lmites


de clase

Frecuencia relativa.- se denomina frecuencia relativa del valor y i al cociente de la frecuencia absoluta
de y i y el nmero total de observaciones. Se denota por hi

Frecuencia absoutade yi n
hi= = i
N mero tota de observaciones n

n1 5 n 4 n 6
h1 = = =0,10 h2= 2 = =0,08 h3= 3 = =0,12
n 50 n 50 n 50

n4 19 n 11
h4 = = =0,38 h5= 5 = =0,22
n 50 n 50
Y as sucesivamente

Interpretacin

h1 : 0,10 se interpreta como la proporcin de plantas cuya altura est comprendida entre 27 y 36 cm.
Inclusive

21
Estadstica General ciclo 2013-I

h2 : 0,080 se interpreta como la proporcin plantas cuya altura vara desde 36 hasta 45 cm. inclusive

Y as sucesivamente

Frecuencia absoluta acumulada.- Se llama frecuencia absoluta acumulada correspondiente al valor yi


al nmero de observaciones menores o iguales a y i se denota por N i

N i=n1 +n 2+ n3+ +ni

Para nuestro ejemplo ser:

1
N 1= n j =n1
J =1

2
N 2= n j=n1+ n2=5+ 4=9
j=1

3
N 3= n j=n1+ n2 +n3=5+ 4+ 6=15
j=1

4
N 4 = n j=n1 +n2 +n 3+ n4 =5+4 +6+19=34
j=1

5
N 5= n j=n1+ n2 +n3 +n 4+ n5=5+ 4+ 6+19+11=45
j=1

Y as sucesivamente.

Interpretacin.-

N 2=9 Significa que hay 9 plantas cuya altura de planta est comprendida entre 27 y 45 cm. Inclusive..

Frecuencia relativa acumulada.- se llama frecuencia relativa acumulada del valor yi a a frecuencia
relativa total de las observaciones menores o iguales a yi

Se denota como Hi

n1+ n2+ n3 + .+ni


H i=h1 +h 2+ .+ hi =
n

I
H i = h j
j=1

Para nuestro ejemplo

22
Estadstica General ciclo 2013-I

1
H 1= h j=h 1=0,10
j=1

2
H 2= h j=h1+ h2=0,10+0,08=0,18
j=1

3
H 3= h j=h1+ h2+ h3=0,10+ 0,08+0,12=0,30
j=1

4
H 4 = h j=h1 +h2 +h3 + h4=0,10+0,08+0,12+0,38=0,68
j =1

5
H 5= h j=h1+ h2+ h3 +h4 + h5=0,10+ 0,08+0,12+0,38+0,22=0.90
j=1

As sucesivamente

Interpretacin:

H 2 = 0,18, es la proporcin de las plantas cuya altura de planta varia de 27 45 cm. inclusive.

H 3 = 0,30 la proporcin de plantas cuya altura de plantas est comprendida entre 27 y 54 cm. inclusive.

As sucesivamente

La tabla de distribucin de frecuencias ser

Y 'i 1 Y 'i fi hi Fi Hi
'
yi

27 36 31.5 5 0,10 5 0,10

36 45 40.5 4 0,08 9 0,18

45 54 49.5 6 0,12 15 0,30

54 63 58.5 19 0,38 34 0,68

63 72 67.5 11 0,22 45 0,90

72 81 76.5 4 0,08 49 0,98

81 90 85.5 1 0,02 50 1,00

23
Estadstica General ciclo 2013-I

Interpretacin:

i=
5 plantas de arroz tienen una altura comprendida entre 27 y 36 cm respectivamente.
f i =n

F2 = 9 plantas de arroz tienen una altura comprendida entre 27 y 45 cm inclusive

h4 =0.38 38% de las 50 plantas de arroz tienen una altura comprendida entre 54ny 63 cm inclusive

REPRESENTACIN GRFICA
La aplicacin de grficos para la representacin del fenmeno estadstico, se le atribuye a William Playfair, a
fines del siglo XVIII. Un grfico es la representacin de un fenmeno estadstico por medio de figuras
geomtricas, (punto, lneas, rectngulo, etc.) cuyas dimensiones son proporcionales a la magnitud de los datos
representados. Su objeto principal es la representacin de los datos de forma grfica, que permita de un solo
golpe de vista darse cuenta del conjunto de elementos presentados y evidenciar sus variaciones y
caractersticas. El grfico es un auxiliar del cuadro estadstico, no lo sustituye sino que lo complementa.

VENTAJAS Y DESVENTAJAS DEL GRFICO

. El grfico tiene la ventaja sobre el cuadro, de permitir apreciar ms rpidamente los datos y abarcar todo su
conjunto.
La construccin del grfico se basa en el cuadro estadstico, pero tiene sus limitaciones, como la siguiente:
. El grfico no puede presentar tantos grupos de datos como una tabla. Un cuadro puede tener 4 o ms
columnas de datos, sin embargo representado esto en un grfico, dificulta su comprensin.
. En los cuadros pueden darse valores exactos, en los grficos muchas veces solo valores aproximados.

PARTES DE UN GRFICO.

Al igual que en los cuadros estadsticos, en los grficos se considera las siguientes partes:

1. El ttulo, 2. El grfico propiamente dicho, 3. Las notas explicativas


Sobre el ttulo y las notas explicativas no es necesario redundar, pues vale todo lo expresado con relacin a los
cuadros estadsticos.

IMPORTANCIA

Los grficos son importantes por lo siguiente:

a.- Son esenciales en el estudio y presentacin de trabajos estadsticos. Los datos trasformados en dibujo
permiten un examen visual que constituye, la primera etapa de un anlisis e interpretacin de datos

b.- Permite observar en forma instantnea el comportamiento de la variable o variables materia de estudio.

c.-Permite formar una idea bastante aproximada sobre las tendencias de las variables en estudio.

Para graficar se utiliza el sistema cartesiano. El eje X o ejes de las abscisas se utiliza para poner la variable en
estudio y el eje Y o eje de ordenadas se utiliza para las frecuencias absolutas o relativas.

24
Estadstica General ciclo 2013-I

TIPOS DE GRFICOS

GRFICOS PARA VARIABLE CUALITATIVA

GRFICO DE BARRAS SIMPLES

Para su elaboracin se debe contar con u tabla o cuadro de entrada simple.

En su construccin se debe observar lo siguiente:

.- Todas las barras tienen el mismo ancho.

.- El espacio entre barra y barra debe ser la misma, y constituye la mitad del ancho de la barra.

.- El ancho de la barra debe ser el doble del espacio que se deja entre barra y barra.

.- El eje de las ordenas (Y), la longitud entre la escala y escala debe ser la misma que la longitud entre escala
y escala del eje de las abscisas (X).

.- Preferentemente construir las barras en orden decreciente de magnitud, en orden alfabtico, cronolgico,
etc.

Cuadro No 2

Pacientes atendidos en el Hospital Regional Docente Las Mercedes Chiclayo, segn grado de instruccin.
Mayo. 2012.
Grado de Instruccin ni f i hi
Analfabetos 36 45
Primaria 24 30
Secundaria 16 20
Superior 04 05
Total 80 100

GRAFICA DE BARRAS COMPUESTAS

Para su elaboracin se debe contar con un cuadro de doble entrada.

Ejemplo Graficar la siguiente informacin.

Tabla No 3

25
Estadstica General ciclo 2013-I

Pacientes atendidos de intoxicacin alcohlica por sexo segn grado de instruccin en el Hospital Nacional
Almanzor Aguinaga Asenjo de Chiclayo. Agosto 2013.

Grado de Sexo

Instruccin Masculino Femenino Total


Analfabeto 14 22 36
Primaria 8 16 24
Secundaria 4 12 16
Superior 1 3 4
Total 27 53 80

GRAFICO CIRCULAR:

Se usa para representar la dimensin de las partes de un fenmeno total. Par su elaboracin se utiliza la
circunferencia, siendo necesario que los valores absolutos y/o porcentajes sean traducidos a grados

Ejemplo

Teniendo en cuenta la informacin del cuadro 5 construir un grfico circular.

Solucin

o
Sabemos que la circunferencia tiene un total de 360 , utilizando la regla de tres simple, se encuentran
los grados par cada una de las clases

Analfabetos Secundaria

45 360 20 360
100 % 360% x= = 100% 360% x= =
100 100
o o
162 72
Primaria Superior

30 360 5 360 o
100% 360% x= = 100% 360% x= = 18
100 100
o
108

26
Estadstica General ciclo 2013-I

HISTOGRAMA O HISTOGRAMA DE DISTRIBUCIN DE FRECUENCIAS


Puede usarse para representar tanto variable cualitativas como cuantitativas. Es un diagrama en el que se
representan las marcas de clase en el eje horizontal y las frecuencias de clase en el eje vertical. Las
frecuencias de clase pueden ser representadas por las alturas de barras y estas se colocan adyacentes.

POLIGONO DE FRECUENCIA O POLIGONO DE DISTRIBUCION DE FRECUENCIAS


Es similar al histograma, consiste en segmentos de recta que unen los puntos medios determinados por la
interseccin de los puntos medios de clase, marca de clase y las frecuencias de clase. As mismo es importante
resaltar que:
. Es exclusivo para datos cuantitativos.
. Se puede elaborar con las frecuencias absolutas, con la frecuencia relativa o el porcentaje.
. Es una grfica de punto y lnea sobre el eje cartesiano
. Sirve para observar la forma de distribucin.
. Lo importante en el polgono es mantener el rea bajo la curva igual al rea acumulada en el histograma,
para lo cual:
Se aade una marca de clase anterior a la primera (restndole una amplitud)
Se aade una marca de clase posterior a la ltima (sumndole la amplitud)
Se le adjudica frecuencia igual a cero a estas marcas de clase adicionales.
Se grafica utilizando las marca de clase adicionales.

27
Estadstica General ciclo 2013-I

MEDIDAS DE TENDENCIA CENTRAL O PROMEDIOS


El agrupamiento de la informacin en clases tiene la ventaja de presentar una serie de observaciones en una
forma ms compacta. Sin embargo, para muchas aplicaciones, la distribucin de frecuencias resulta todava
no muy clara, y nos gustara contar con un solo valor que represente el orden general de magnitud de los datos
observados. Este valor resume u conjunto de datos, el cual seala el centro de los valores
Los datos a analizar se obtendrn de una muestra aleatoria de una poblacin grande o directamente de la
misma poblacin. Distinguiremos estas dos cosas usando nomenclatura diferente. As:

Muestra Poblacin
Nmero de elementos n N
Media x
Varianza 2 2
s

MEDIA

La medida de localizacin ms importante es la media, o valor promedio de una variable. La media


proporciona una medida de localizacin central de los datos. Si los datos son de una muestra, la media se
denota x ; si los datos son de una poblacin, la media se denota con la letra griega .

En las frmulas estadsticas se acostumbra denotar el valor de la primera observacin de la variable x con x 1,
el valor de la segunda observacin de la variable x con x 2 y as sucesivamente. En general, el valor de la i-
sima observacin de la variable x se denota xi .La frmula para la media muestral cuando se tiene una
muestra de n observaciones es la siguiente.

Poblacin Muestra

N n

xi xi
i=1
= x= i=1
N n

La media muestral x un estadstico muestral.

En la frmula anterior el numerador es la suma de los valores de la n observaciones. Es decir:

xi = X1 + X2 + . . . + Xn

28
Estadstica General ciclo 2013-I

La letra griega : es el smbolo de sumatoria (suma).

Para ilustrar el clculo de la media muestral, considere el siguiente ejemplo:

El nmero de crditos matriculados por 5 estudiantes es:

16 24 12 16 22

Se emplea la notacin x1, x2, x3, x4, x5 para representar el nmero de crditos matriculados por alumno.

x1 = 16 x2 = 24 x3= 12 x4= 16x5 = 22

Por lo tanto, el clculo de la media muestral, ser:

16+ 24+12+16+ 22
= = 18
5

La media muestral del nmero de crditos matriculados es 18.

En la ecuacin de la media muestral, se muestra cmo se calcula la media en una muestra de n observaciones.
Para calcular la media de una poblacin use la misma frmula, pero con una notacin diferente para indicar
que trabaja con toda la poblacin. El nmero de observaciones en una poblacin se denota N y el smbolo
para la media poblacional es

La media muestral es un estimador puntual de la media poblacional .

La media para datos agrupados (datos tabulados) Si los datos han sido clasificados en m clases en una tabla
de frecuencia con marca de clase yi y frecuencia absoluta f i = 1,2,..,m, la media aritmtica de estos
datos est definida por:

x=
f i yi
n

PROPIEDADES DE LA MEDIA

1.- Si todos los valores observadosx 1, x2, .xn son iguales a b (donde b es una constante) entonces la
media de una constante es la misma constante

M(x) = M (b) = b

2.- Si a cada valor de las observaciones x1, x2, xn se le suma ( o se resta) una constante, la media del
nuevo conjunto transformado yi= xi b ; es la media aritmtica del conjunto original ms (o menos) la
constante. Es decir

Donde yi = xi b, b= constante, i = 1,2,.,n

29
Estadstica General ciclo 2013-I

3.- Si cada valor de un conjunto x1, x2, .,xn se multiplica por una constante diferente de cero, la
media aritmtica del conjunto transformado yi = axi, donde i= 1,2,,n es la media aritmtica del
conjunto original multiplicado por la constante. O sea:

4.- La suma algebraica de las desviaciones de cada valor observado x 1, x2,x3,..xn con respecto a su media es
cero. Esta propiedad significa que,

Para datos agrupados esta propiedad se transforma en

m = nmero de clases

f i = frecuencia absoluta de la clase i

yi = punto medio del intervalo i (marca de clase)

5.- Si x1,x2,,xn, y , y1,y2,yn son dos conjuntos de observaciones de n valores cada uno, de dos
variables X y Y, expresados en las mismas unidades, entonces

M(x y) = M(x) M(y)

6.- En casos especiales, esto es cuando es apropiado hacerlo, la media aritmtica se puede utilizar para estimar
la cantidad total de una poblacin. Esta propiedad indica que

Total = N

Media aritmtica a partir de sub muestras.- Supongamos que de una poblacin (o de dos poblaciones
diferentes) se obtienen dos muestras de tamaos n1 y n2 respectivamente, Sean y las medias
aritmticas de las muestras, entonces la media asociada de las n1 + n2 observaciones est dada por

Esto se generaliza para ms de dos muestras

MEDIA PONDERADA Se utiliza cuando la importancia de las observaciones vara.

X i = Valor de la observacin i

W i = Peso de la observacin i

30
Estadstica General ciclo 2013-I

VENTAJAS DE LA MEDIA

1.- Es un concepto familiar a la mayora de las personas e intuitivamente claro

2.- Es una medida que puede ser calculada y es nica. Ya que cada conjunto de datos tiene una y slo una
media.

3.- En el clculo de la media, es tomada en cuenta cada observacin del conjunto de datos.

4.- La media es una medida digna de confianza, porque se determina con mayor certeza que otras
caractersticas de un conjunto de datos

DESVENTAJAS DE LA MEDIA

1.- La media aritmtica puede verse afectado por valores extremos que no son representativos del resto de las
observaciones.

MEDIA GEOMTRICA

Tiene dos usos principales:

1.- Para promediar porcentajes, ndices y cifras relativas.

2.- Para determinar el incremento porcentual promedio en ventas, produccin u otras actividades o series
econmicas de un periodo a otro.

La media geomtrica (Mg) de un conjunto de n nmeros positivos se define como la raz n- sima del
producto de los n nmeros.

MG n X 1 X 2 X 3 . X n

Nota: si uno de los nmeros es cero o negativo no se puede calcular la media geomtrica

Ejemplo

Supngase que las utilidades obtenidas por una compaa constructora en cuatro proyectos fueron de 2,3,4 y 6
% respectivamente. Cul es la media geomtrica de las ganancias?

4
MG 2 x 3x 4 x 4
MG = 3.46.41

La media geomtrica de las utilidades es 3.46%

MEDIA ARMNICA (MH)

Este promedio se define diciendo que es igual a la media aritmtica del reciproco de los valores de una
variable.

31
Estadstica General ciclo 2013-I

Se aplica cuando se desea promediar datos de una variable dada en forma de tasas, esto es, tanta unidades de
un tipo por cada unidad de otra especie; pero tambin se utiliza para promediar datos inversamente
proporcionales.

Su mayor uso se realiza en el clculo de la velocidad promedio

Para datos sin agrupar:

n

Mh 1
x
n

Para datos agrupados:

n
Mh = n1 n2 n3 n
+ + + .+ m
y1 y2 y3 ym

MEDIANA

La mediana es otra medida de localizacin central. Es el punto medio de los valores despus de ordenarlos de
menor a mayor o de mayor a menor. Este valor indica que a lo sumo el 50% de las observaciones se
encuentran por arriba de la mediana y el otro 50% a lo sumo, por debajo de ella. Cuando tiene un nmero
impar de observaciones, la mediana es el valor central. Cuando la cantidad de observaciones es par, no hay un
nmero central. En este caso, la mediana es definida como el promedio de las dos observaciones centrales.

CALCULO DE LA MEDIANA (datos sin agrupar)

Ordenar los datos de menor a mayor (en forma ascendente).

a. Si el nmero de observaciones es impar, la mediana es el valor central.


b. Si el nmero de observaciones es par, la mediana es el promedio de las dos observaciones centrales

Apliquemos esta definicin para calcular la mediana del nmero de alumnos matriculados en un grupo horario
a partir de la muestra de cinco grupos horarios de la universidad. Los datos en orden ascendente son

32 42 46 46 54

Como n = 5 es impar, la mediana es el valor central. De manera que la mediana del tamao de los alumnos
matriculados en un grupo horario, es 46. Aun cuando en este conjunto de datos hay dos observaciones cuyo
valor es 46, al poner las observaciones en orden ascendente se toman en consideracin todas las
observaciones.

Suponga que tambin desea calcular la mediana del nmero de crditos matriculados de 12 alumnos de la
escuela profesional de Agronoma

12 23 17 26 23 18 17 22 20 21 22 24

Primero ordena los datos de menor a mayor

12 17 17 18 20 21 22 22 23 23 24 26

32
Estadstica General ciclo 2013-I

Los dos valores


centrales

Como n = 12 es par, se localizan los dos valores centrales: 21 y 22. La mediana es el promedio de estos dos
valores.

21+22
Mediana = = 21.5
2

Aunque la media es la medida de localizacin central ms empleada, en algunas situaciones se prefiere la


mediana. A la media la influyen datos muy pequeos o considerablemente grandes

Por ejemplo, la media de los datos del ejemplo anterior es 20.41. Ahora suponga que el primer estudiante no
se matricul en 12 crditos sino en 4, la media seria 19.75.Podremos ver que la mediana no vara en ningn
caso.

Al generalizar lo anterior, es posible decir que cuando los datos contengan valores extremos, es preferible usar
a la mediana como medida de localizacin central.

LA MEDIANA PARA DATOS AGRUPADOS

[ ]
n
'
N i1
Me y + 2
i1 cj
N iN i1

cj = amplitud de la clase mediana


Nj = Frecuencia absoluta acumulada de la clase medina
n = nmero de observaciones
y 'i1 = Lmite inferior de la clase mediana

VENTAJAS DE LA MEDIANA
1.- La mediana es fcil de entender y puede ser calculada a partir de cualquier clase de datos

2.- La mediana est afectada por el nmero de observaciones y no por la magnitud de cualquier extremo

3.- Se puede encontrar la mediana inclusive para datos cualitativos ordinal.

DESVENTAJAS DE LA MEDIANA

1.- Se debe organizar los datos antes de realizar cualquier tipo de clculo para determinar la mediana.

2.- La mediana no es adecuada a manipulaciones algebraicas posteriores

MODA

La tercera medida de localizacin es la moda. La moda se define como el valor que se presenta con mayor
frecuencia. Es decir, la moda es el valor ms comn o predominante.

33
Estadstica General ciclo 2013-I

Para ilustrar cmo identificar a la moda, considere la muestra del tamao de los cinco grupos de la
universidad. El nico valor que se presenta ms de una vez es el 46. La frecuencia con que se presenta este
valor es 2, por lo que es el valor con mayor frecuencia, entonces es la moda.

Hay situaciones en que la mayor frecuencia se presenta en dos o ms valores distintos.

Cuando esto ocurre hay ms de una moda. Si los datos contienen ms de una moda se dice que los datos son
bimodales. Si contienen ms de dos modas, son multimodales. En los casos multimodales casi nunca se da la
moda, porque dar tres o ms modas no resulta de mucha ayuda para describir la localizacin de los datos.

La moda para datos agrupados

j+1
n j n

Mo Y i1
' n
( j j1 ) +
n
n jn j1

+ c j

= lmite inferior de la clase modal


nj-1 = frecuencia absoluta de la clase premodal
nj = frecuencia absoluta de la clase modal
nj+1 = frecuencia absoluta de la clase posmodal
cj = amplitud de la clase modal

VENTAJAS DE LA MODA

1.- La moda se puede utilizar como una medida de localizacin tanto para datos cualitativos como
cuantitativos

2.- La moda no est indebidamente afectada por valores extremos

DESVENTAJAS DE LA MODA

1.- Muy a menudo, no hay un valor modal porque el conjunto de datos no contiene valores que se repitan ms
de una vez. Otras veces, cada valor es la moda, porque cada uno aparece el mismo nmero de veces.
Claramente, la moda no es una medida til en estos casos

2.- Cuando el conjunto de observaciones contiene dos, tres o ms modas, stas son difciles de interpretar y
comparar.

RELACIN ENTRE MEDIA. MEDIANA Y MODA EN DISTRIBUCIONES SIMTRICAS Y


ASIMTRICAS

1.- En una distribucin de frecuencias simtrica cuya representacin grfica es acampanada y adems
unimodal; coinciden exactamente en el mismo valor, media, mediana y moda.

34
Estadstica General ciclo 2013-I

2.- Si la distribucin tiene la forma acampanada, es unimodal, pero no tiene simetra, las tres medidas toman
valores diferentes, y la mediana queda comprendida generalmente entre la moda y la media aritmtica

MEDIDAS DE POSICIN NO CENTRALES O CUANTILES

Son medidas de posicin que no necesariamente reflejan la tendencia central de la distribucin de


frecuencias: A este tipo de medidas se les llama cuantiles, que son los valores de la variable que dividen a la
distribucin en intervalos que contienen el mismo nmero de observaciones.

Los cuantiles ms usados son los cuartiles, Q j , los deciles, D j y los percentiles, Pj .

PERCENTILES

El p simo percentil es un valor tal que, a lo sumo, p por ciento de las observaciones son menores o iguales
que este valor y, a lo sumo, (100 p) por ciento de las observaciones son mayores o iguales que este valor.

Calculo del i simo percentil para datos no agrupados

Se siguen los siguientes pasos:

1.- Ordenar los datos de forma ascendente.

2.- Calcule un ndice k:

K=
[ ] i
100
n

Donde i es el percentil de inters y n es la cantidad de observaciones

3.- Si k no es entero, se redondea. El valor del entero inmediato superior que k indica la posicin del i
simo percentil.

Si k es entero, el i simo percentil es el promedio de los valores de los datos ubicados en los lugares k
y k 1.

Ejemplo

Dada una muestra cuyos valores son:

53 55 70 58 64 57 72 53 69 57 68 53

Calcule los percentiles 30 y 75

Solucin

1.- Se ordenan los datos de menor a mayor, esto es:

53 53 53 55 57 57 58 64 68 69 70 72

2.- Clculo del ndice k

Para percentil 30

35
Estadstica General ciclo 2013-I

K [ ] i
100
n [ ] 30
100
12=3.6

3.- Como k no es entero, redondeamos. El lugar del percentil 30 es el siguiente entero mayor de 3.6, es decir,
el lugar 4. En este caso el percentil 30 es el valor del dato que ocupa la posicin cuarta, o sea 55. Esto
significa que el 30% de los datos es menor que 55 y el 70% mayor o igual a 55.

Para percentil 75

k [ ]
i
100
n [ ] 75
100
12=9

Como k es entero se establece que el percentil 75 es el promedio de los valores de los datos noveno y

decimo; es por lo tanto.


[ 68+69
2 ] 68.5 Esto significa que el 75% de los datos, a lo sumo es menor
que 68.5 y a lo sumo el 25% mayor o igual que 68.5.

Clculo del i semo percentil para datos agrupados

Se siguen los siguientes pasos:


1.- Se calcula
100 , donde i 1, 2,3,..,99

2.- Se identifica la clase que contiene el Pi por la frecuencia acumulada

3.- Se emplea la frmula

[ ]
F
k1
Pi ' 100
Y i1 +cj
f
'
Donde: Y i1 = Lmite inferior de la clase que contiene a Pi

n= Tamao de la muestra o poblacin.

j=
Tamao del intervalo de clase
c

F k1 Frecuencia acumulada de la clase anterior a la clase que contiene a Pi

f = frecuencia simple de la clase que contiene a pi


Ejemplo

La tabla siguiente muestra la distribucin de las edades de 120 personas


'
Y i1Y i
'
f i ni Fi N i

30 40 1 1
40 50 3 4
50 60 11 15
60 70 21 36 36
70 80 43 79
80 90 32 111
90 - 100 9 120
Estadstica General ciclo 2013-I

Determine la edad mnima del 25% de las personas de ms edad

Solucin

La edad minina del 25% de las personas de ms edad es el percentil 75, en ese sentido tenemos que encontrar
las frecuencias acumuladas

75 x 120
1.- Se calcula =90
100 100

2.- La clase que contiene al P75 es 70 80

3.- Utilizando la frmula

[ ]
F
k1
Pi ' 100
Y i1+ c j
f

P75 80+10 [ 9079


32 ] 83.44

CUARTILES

Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, Q1 deja el 25% de los datos

ordenados a su izquierda, y el otro 75% a su derecha. El segundo cuartil, Q 2 , deja el 50% de los datos a
su izquierda y el otro 50% a su derecha, este valor coincide con la mediana, mientras que el tercer cuartil,

Q3 deja el 75% de los datos ordenados a su izquierda y el otro 25% a su derecha.


Calculo de los cuartiles para datos ordenados.
Los cuartiles son solo percentiles especficos; por lo tanto, los pasos para calcular los percentiles se pueden
aplicar en forma directa para calcular los cuartiles. Esto es:
Q 1= Primer cuartil o percentil 25
Q2= Segundo cuartil o percentil 50
Q 3= Tercer cuartil o percentil 75
Ejemplo
Los siguientes datos representan los sueldos mensuales para una muestra de 12 Ingenieros Agrnomos.
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920 2880

Determine el Q1 y Q3

Solucin

37
Estadstica General ciclo 2013-I

Cuartil uno, Q1

1.- Se ordenan los datos en forma ascendente

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2.- Calcular el Q1 es igual que calcular el P25 , en ese sentido se calcula el ndice K

k [ ]
i
100
n [ ]25
100
12=3

Como K es entero se establece que el percentil 25 es el promedio de los valores de los datos tercero y cuarto;

es por lo tanto
[ 2850+2880
2 ] 2865. Esto significa que el 25% de los Ingenieros Agrnomos
tienen un salario mensual superior a 2865.

Cuartil tres, Q3 :

Implica calcular el percentil 75, entonces:

1.- Calcula el ndice K

k
[ ]
i
100
n
[ ]75
100
12=9

Como K es entero se establece que el percentil 75 es el promedio de los valores de los datos noveno y dcimo;

es por lo tanto,
[ 2950+3050
2 ] 3000. Esto significa que el 75% de los Ingenieros Agrnomos

tienen un salario menor a 3000 y el otro 25% un salario mensual superior a 30000

Q1 Q2 Q3

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2865 2905 3000

Clculo de cuartiles para datos no agrupados

[ ] [ ]
n n
F k1 F k1
4 2
Q1=Y ' +c j Q2=Y ' +c j
i1
f i1
f

[ ]
3n
F k1
4
Q3=Y ' +c j
i1
f

Donde

38
Estadstica General ciclo 2013-I

'
Y i1= Limitre inferior de la clase que contiene al cuartil i

n=Nmero de datos

F k1 = Frecuencia acumulada de la clase anterior de la clase que contiene al cuartil i

f = frecuencia de clase simple de la clase que contiene al cuartil

c j = tamao del intervalo de clase

Ejemplo

Una empresa decide evaluar a sus empleados. La clasificacin se lleva a cabo mediante la aplicacin de un
test que arroja los siguientes puntajes

'
Y i1Y i
'
f i ni

0 - 20 94
20 - 40 140
40 - 60 160
60 - 80 98
80 - 100 8
Determine:

a.- La puntuacin que es excedida por el 75% de los trabajadores

2.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores.

Solucin

a.- En este caso Se debe calcular el primer cuartil ( Q1 )

[ ]
n
F k1
4
Q1=Y ' +c j
i1
f

Debemos encontrar las frecuencias acumuladas

Y 'i1Y 'i f i ni Fi

0 - 20 94 94
20 - 40 140 234
40 - 60 160 394
60 - 80 98 492
80 - 100 8 500
Luego

39
Estadstica General ciclo 2013-I

n 500
El lugar del cuartil 1 es la posicin = = 125. Es decir, que el cuartil est ubicado en la clase 20
4 4
40. Por lo tanto:

[ ]
n
Q1=Y '
i1
+c j
4
F k1
f
= 20+20
[ 12594
140 ] = 24.43

Esto quiere decir que el 75% de los trabajadores tienen una calificacin mayor a 24.43

b.- La puntuacin que supera a las puntuaciones del 75% de los trabajadores, corresponde al valor del tercer
curatil.

3n 3 x 500
El lugar del tercer cuartil es la posicin = = 375. Es decir, que el cuartil est ubicado
4 4
en la clase 40 - 60. Por lo tanto

[ ]
3n
Q3=Y '
i1
+c j
4
F k1
f
= 40 +20 [ 375234
160 ] = 57.625

Esto quiere decir que el 25% de los trabajadores tiene una puntuacin mayor a 57.625

MEDIDAS DE DISPERSIN

Las medidas de dispersin tratan de describir cuan agrupados o alejados estn los datos observados de su
promedio. Entre ms dispersos estn las observaciones individuales, mayor es la medida de dispersin, y
menos adecuado ser el promedio como medida descriptiva. Por eso, es importante que despus de elegir y
calcular un promedio se determina el grado de variacin de las observaciones o datos individuales.

Las medidas de dispersin o de variabilidad ms usadas son:

RANGO O AMPLITUD DE VARIACIN

La medida de la dispersin de un conjunto de datos es el rango. Se calcula mediante la diferencia entre el


valor ms grande y el ms pequeo

Rango = Valor mayor - Valor menor

El rango de los siguientes datos

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

Ser:

Rango = Valor mayor - Valor menor

Rango = 3325 - 2710 = 615

40
Estadstica General ciclo 2013-I

Aunque el rango es la medida de variabilidad ms fcil de calcular, rara vez se usa como nica medida. La
razn es que el rango se basa slo en dos observaciones y, por tanto, los valores extremos tienen una gran
influencia sobre l.

RANGO INTERCUARTILICO (RIC)

Una medida que no es afectada por los valores extremos es el rango intercuartlico (RIC). Esta medida de
variabilidad es la diferencia entre el tercer cuartil Q3 y el primer cuartil Q1. En otras palabras, el rango
intercuartlico es el rango en que se encuentra el 50% central de los datos.

RIC=

Esta medida excluye al 25% ms alto y al 25% ms bajo de los datos.

VARIANZA

La varianza es una medida de variabilidad que utiliza todos los datos. La varianza est basada en la
diferencia entre el valor de cada observacin (x 1) y la media. A la diferencia entre cada valor x 1 y la media (

cuando se trata de una muestra, cuando se trata de una poblacin) se le llama desviacin respecto

de la media. Si se trata de una muestra, una desviacin respecto de la media se escribe (x i ), y

si se trata de una poblacin se escribe (xi .). Para calcular la varianza, estas desviaciones respecto de

la media se elevan al cuadrado.

Si los datos son de una poblacin, el promedio de estas desviaciones elevadas al cuadrado es la varianza

poblacional. La varianza poblacional se denota con la letra griega . En una poblacin en la que hay

N observaciones y la media poblacional es , la varianza poblacional se define como sigue

2
=
( x i )
N

En la mayor parte de las aplicaciones de la estadstica, los datos a analizar provienen de una muestra. Cuando

se calcula la varianza muestral, lo que interesa es estimar la varianza poblacional , la varianza

muestral que se obtiene constituye un estimador no sesgado de la varianza poblacional. Por esta razn, la
varianza muestral, que se denota por s2, se define como sigue.

VARIANZA MUESTRAL

2
2
s=
( x ix )
n1

41
Estadstica General ciclo 2013-I

La varianza para datos agrupados ser calculada empleando la siguiente frmula:

Tal como se ha definido, la varianza muestral es un buen estimador de la varianza poblacional.

PROPIEDADES DE LA VARIANZA

1.- La varianza de un conjunto de observaciones x1,x2,..xn siempre es un nmero no negativo

V(x) 0

2.- La varianza de una constante es cero. Esto significa que si x1 = x2 =..= xn= b entonces:

V(b) = 0

3.- Si a cada observacin x1, x2, ,xn se le adiciona o se le resta una constante b 0, la varianza del
nuevo conjunto de valores y 1,y2,,yn, donde yi=xi b, i = 1,2,.,n, coincide con la varianza del
conjunto original. Es decir

V(y) = V (x b) = V(x)

4.- Si a cada valor de un conjunto x1,x2,xn, se multiplica por una constante a, la varianza del nuevo
conjunto de valores y1,y2,yn, donde yi = axi, i= 1,2,,n es igual a la varianza del conjunto
original multiplicada por el cuadrado de la constante. Es decir:

V(y) = a2 V(x)

Varianza calculada a partir de sub muestras

Si y son las medias aritmticas de dos submuestras de tamao n1 y n2 respectivamente y

sus varianzas correspondientes. Entonces la varianza de la muestra de tamao n = n1

+ n2 est dada por

DESVIACIN ESTNDAR

42
Estadstica General ciclo 2013-I

La desviacin estndar se define como la raz cuadrada positiva de la varianza. Continuando con la notacin
adoptada para la varianza muestral y para la varianza poblacional, se emplea s para denotar la desviacin

estndar muestral y para denotar la desviacin estndar poblacional.

La desviacin estndar se obtiene de la raz cuadrada de la varianza como sigue.

Desviacin estndar muestral S=

Desviacin estndar poblacional

Lla desviacin estndar se mide en las mismas unidades que los datos originales. Por esta razn es ms fcil
comparar la desviacin estndar con la media y con otros estadsticos que se miden en las mismas unidades
que los datos originales.

CARACTERISTICAS DE LA DESVIACIN ESTANDAR.

1. Es confiable.
2. Tiene la misma unidad de medida que los datos originales.
3. No cambia de valor cuando se suma una constante a cada observacin de un conjunto de datos.

COEFICIENTE DE VARIACIN (CV)

En algunas ocasiones se requiere un estadstico descriptivo que indique cun grande es la desviacin estndar
en relacin con la media. Es decir nos indica la cantidad de veces que la desviacin estndar contiene a la
media aritmtica.

Esta medida es el coeficiente de variacin (coeficiente de variabilidad) y se representa como porcentaje.

CV =

Poblacin Muestra

CV =
[

x 100 ] CV =
[ s
x
x 100 ]
CARACTERSTICAS DEL COEFICIENTE DE VARIABILIDAD

1.- No tiene unidad de medida

2.- No aplicable cuando la distribucin tiene media cero

3.- Se afecta su valor cuando se suma una constante K a cada observacin de un conjunto de datos.

4.- No cambia de valor cuando se multiplica por una constante K a cada una de las observaciones.

Calificacin de una distribucin de datos, segn el grado de dispersin:

43
Estadstica General ciclo 2013-I

Coeficiente de variabilidad (%) Calificacin


0 Completamente homognea
0 CV <10 Muy homognea
10 CV <15 Regularmente homognea
15 CV < 20 Regularmente variable
20 CV < 25 Variable
CV 25 Muy variable

COMPARACION DE LA DISPERSION DE DOS O MS CONJUNTO DE DATOS

Si los conjuntos de datos tienen iguales unidades de medida y medias aritmticas iguales o similares,
entonces basta con comparar las varianzas o las desviaciones estndares

Si los conjuntos de datos tienen diferente unidades de medida y/o medias aritmticas diferentes, entonces se
deben comparar los coeficientes de variabilidad.

MEDIDAS DE FORMA

COEFICIENTE DE ASIMETRIA.

Las medidas de asimetra tienen como facilidad elaborar un indicador que permita establecer el grado de
simetra o asimetra, que presenta una distribucin, sin necesidad de llevar a cabo su representacin grafica.

El coeficiente de asimetra puede calcularse mediante el coeficiente de asimetra de Pearson.

xMo
sk=
s

Tambin existen otras formulas alternativas para el clculo del coeficiente de asimetra.

3(MediaMediana)
sk=
S
Asimismo, el coeficiente de asimetra nos describe la forma de un conjunto de datos, es decir, la manera como
se distribuyen, comparando la media y la mediana. Si ambas medidas son iguales, por lo general, se considera
que los datos son simtricos (o con sesgo cero, es decir, el coeficiente de asimetra es cero). Por lo contrario,
los datos o su distribucin es asimtrica o sesgada, es decir, si la media excede a la mediana, los datos se
describen como sesgados a la derecha, o con sesgo positivo (el coeficiente de asimetra es positivo). Si la
mediana excede a la media, los datos suelen llamarse sesgados a la izquierda, o con sesgo negativo (el
coeficiente de asimetra es negativo)

El sesgo positivo surge cuando la media aumenta debido a algunos valores grandes y poco usuales: el sesgo
negativo ocurre cuando la media se reduce debido a algunos valores muy pequeos. Los datos son simtricos
cuando en realidad no hay valores extremos en ninguna direccin, de tal manera que los valores grandes y
pequeos se equilibran.

Simetra Relacin
Simtrica o insesgada Media = Mediana = Moda
Sesgo positivo o a la derecha Media > Mediana > Moda

44
Estadstica General ciclo 2013-I

Sesgo negativo o a la izquierda Media < Mediana < Moda

COEFICIENTE DE APUNTAMIENTO O CURTOSIS

Analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin, es
decir, estudia la distribucin de frecuencias en la zona central. La mayor o menor concentracin de
frecuencias alrededor de la media y en la zona central de la distribucin, dar lugar a una distribucin ms o
menos apuntada.

As es por lo que a la curtosis tambin se le llama apuntamiento.

Si el valor de la curtosis es positivo, se dice que los datos tienen una distribucin leptocrtica (es ms
apuntada o puntiaguda que la distribucin normal); en caso contrario, si la curtosis es negativa, se dice que los
datos tienen una distribucin platicrtica (es menos apuntada o puntiaguda que la distribucin normal). Si la
curtosis es cero, entonces los datos se distribuyen siguiendo una distribucin normal, y se dice que en este
caso la distribucin mesocrtica.

Para medir la curtosis se puede emplear las siguientes frmulas:

k=
(x ix )
nsx
4
3 k= [
1 Q 3 Q1
2 P 90 . P10 ]
Donde

90= Percentil noventa


Q3= Cuartil tres
P

1=
Cuartil uno P10= Percentil diez
Q
CARACTERISTICAS DEL COEFICIENTE DE CURTOSIS

1.- No tiene unidades de medida

2.- Se aplica a distribuciones unimodales que sean simtricas o ligeramente asimtricas.

3.- No le afecta las operaciones de suma y multiplicacin por una constante c aplicada a cada observacin.

xi ( x ix )
2 4
( x ix )
2 4 16
4 0 0
8 16 256
2 4 16
16 24 288
Media x =4
2
Varianza s x = 8

Reemplazamos y calculamos el coeficiente de curtosis

45
Estadstica General ciclo 2013-I

k=
(x ix ) 3 =
288
- 3 = -1.875
ns
4
x
( 4 ) (64)

Al tener el coeficiente de curtosis un valor negativo, la distribucin ser platicurtica.

CARACTERISTICAS DEL COEFICIENTE DE ASIMETRIA DE PEARSON

1.- No tiene unidad de medida

2.- Se aplica a distribuciones unimodales

3.- Su valor debe encontrarse en el intervalo de -3 a 3

Ejemplo

Una muestra de digitadoras de texto revel que su rapidez media de tecleo es de 87 palabras por minuto, con
una media de 73. La desviacin estndar es de 16.9 palabras por minuto. Cul es el coeficiente de asimetra?
Interprete su respuesta.

Solucin

3( MediaMediana) 3(8773)
Reemplazando sk= = =2.49
s 16.9
Existe considerable asimetra con sesgo positivo en la distribucin de la rapidez de tecleo. Algunas operadoras
muy rpidas hacen que la media sea mayor que la mediana o la moda.

TEORA DE PROBABILIDADES

Introduccin

El anlisis de la incertidumbre tiene un papel cada vez ms importante en la sociedad moderna. La


incertidumbre es una caracterstica fundamental de cualquier entorno en el que se toman decisiones. En
Economa, Finanzas, Administracin, Ingeniera, Medicina y otras disciplinas encontramos problemas que
requieren un razonamiento cuantitativo de fenmenos aleatorios. La base de este razonamiento es la teora de
probabilidades.

La teora de probabilidades no solo permite analizar la incertidumbre, sino tambin hacer inferencias
estadsticas de futuros eventos y acerca de las caractersticas de una poblacin basndose en informacin
muestral.

46
Estadstica General ciclo 2013-I

Teora de probabilidades (ciencia de la incertidumbre)

Debido a que existe una incertidumbre considerable al tomar decisiones, resulta importante que todos los
riesgos implcitos conocidos, se evalen en forma cientfica. Ayuda en esta evaluacin la teora de la
probabilidad, a la que frecuentemente se denomina "ciencia de la incertidumbre". El empleo de tal teora
probabilstica permite a quien toma decisiones, analizar con informacin limitada los riesgos y minimizar el
azar inherente. Por ejemplo, al lanzar un nuevo producto o aceptar un embarque recin llegado que contenga
partes defectuosas.

Modelos matemticos

Modelo determinstico

Cuando las condiciones bajo las cuales se verifica el experimento determinan el resultado de este. Por
ejemplo, si s: deja caer un cuerpo en el vaco, desde una altura h, la velocidad que alcanza es:

v= 2 gh
Este modelo determina la velocidad con la que el cuerpo cae al fondo.

Modelo no deterministico o probabilidad.

Cuando las condiciones bajo las cuales se verifica el experimento no determinan el resultado de este. Segn el
fenmeno que se estudie, se determinar el tipo de modelo a usarse. Por ejemplo, si se quiere saber cuntos
autos llegan a una gasolinera entre las 7 y 8 a.m., con base a los datos histricos se puede disear un modelo
que brinde un resultado aproximado con cierto grado de confiabilidad.

Anlisis combinatorio

Es la rama de la matemtica que estudia los diversos arreglos o selecciones que se pueden formar con los
elementos de un conjunto dado, los cuales permiten resolver muchos problemas prcticos. Por ejemplo, se
puede averiguar cuntos nmeros diferentes de telfonos, placas o loteras se pueden formar utilizando un
conjunto dado de letras y dgitos.

Adems el estudio y comprensin del anlisis combinatorio es una herramienta de mucha utilidad para poder
resolver y comprender problemas sobre probabilidades.

Principios fundamentales del anlisis combinatorio

En la mayora de problemas de anlisis combinatorio se observa que una operacin o actividad aparece en
forma repetitiva y es necesario conocer las formas o maneras en que se pueda realizar dicha operacin. Para
dichos casos es til conocer determinadas tcnicas o estrategias de conteo que faciliten el clculo sealado.

El anlisis combinatorio tambin se define como una manera prctica y abreviada de contar. Las operaciones
o actividades que se presentan son designadas como eventos o sucesos. A continuacin se presentan algunos
ejemplos donde es necesario utilizar el anlisis combinatorio:

~ Sealar las maneras diferentes de vestir de una persona, utilizando un nmero determinado de prendas de
vestir.

~ Ordenar 5 artculos en 7 casilleros.

~ Contestar 7 preguntas de un examen de 10.

47
Estadstica General ciclo 2013-I

~ Designar 5 personas de un total de 50 para integrar una comisin.

~ Sentarse 4 personas en una fila de 5 asientos.

-~ Escribir una palabra de 7 letras utilizando 4 consonantes y 3 vocales.

Principio de multiplicacin

Si un evento o suceso puede ocurrir, en forma independiente, de "m" maneras diferentes y otro suceso de "n"
maneras diferentes, entonces el nmero de maneras distintas en que pueden ocurrir ambos sucesos es: m x n.

Ejemplo

En la etapa final del ftbol profesional de primera divisin, cuatro equipos: CRISTAL (A), BOYS (B),
CIENCIANO (C), UNIVERSITARIO (D) disputan el primer y segundo lugar (campen y subcampen). De
cuntas maneras diferentes estos equipos pueden ubicarse en dichos lugares?

Solucin

Mtodo 1: utilizando el diagrama de rbol.

Primer lugar Segundo Lugar

B AB

A C AC

D AD

A BA

B C BC

D BD

A CA

C B CB

D CD

A DA

D B DB

C DC

Total 12

Existen 12 maneras diferentes en que estos equipos se pueden ubicar en el primer y segundo lugar

Mtodo 2 Utilizando el principio de multiplicacin

0 o
1 2

48
Estadstica General ciclo 2013-I

4 x 3 no de maneras = 12
Explicacin

a) El primer lugar puede ser ocupado por cualquiera de los cuatro equipos.

b) El segundo lugar puede ser ocupado por cualquiera de los otros tres equipos que restan.

c) Por el principio de multiplicacin, se observa que el evento del primer lugar se presenta de 4 maneras y el
del segundo lugar de 3 maneras distintas, entonces el nmero de maneras totales ser:

4 x 3 = 12

Principio de adicin

Si un evento A se puede realizar de "m" maneras y otro evento B se puede realizar de "n" maneras diferentes,
adems, no es posible que ambos eventos se realicen juntos (A B = ), entonces el evento A o el
evento B se realizarn de (m + n) maneras.

Ejemplo

Un repuesto de automvil se vende en 6 tiendas de la Victoria o en 8 tiendas de Brea. De cuntas formas se


puede adquirir el repuesto?

Solucin

Por el principio de adicin:

Victoria o Brea

6 formas + 8 formas = 14 formas

Ejemplo

Se desea cruzar un ro, para ello se dispone de 3 botes, 2 lanchas y 1 deslizador. De cuntas formas se puede
cruzar el ro utilizando los medios de transporte sealados?

Solucin

Aplicando el principio de adicin se tiene:

Bote Lancha Deslizador

3 2 1

No.de maneras = 3 + 2 + 1 = 6

49
Estadstica General ciclo 2013-I

Recuerda

a) Si se desea que se realicen los eventos A y B, entonces se utiliza el principio de multiplicacin.

b) Si se desea que se realicen los eventos A o B, entonces se utiliza el principio de adicin.

Mtodos de conteo

En diferentes casos se tomar de algn conjunto parte de sus elementos o todos ellos, para formar diferentes
agrupaciones, que se van a distinguir por el orden de sus elementos o por la naturaleza de alguno de ellos. Si
los elementos que forman una agrupacin son diferentes entre s, sern llamados agrupaciones sin repeticin y
si alguno de ellos es igual se dir que son agrupaciones con repeticin.

Entre los mtodos de conteo ms conocidos se tiene: permutacin, variacin y combinacin.

Permutacin

Es un arreglo de todos o parte de un conjunto de objetos considerando el orden en su ubicacin; cuando en el


arreglo solo entran parte de los elementos del conjunto se llama variacin. Es importante resaltar que el orden
es una caracterstica importante en la permutacin, cuando variamos el orden de los elementos se dice que
permutamos dichos elementos.

Ejemplo

Determinar los diferentes arreglos o permutaciones que se pueden hacer con las letras a, b y c tomadas de dos
en dos.

Solucin

Mtodo 1:

Sea el conjunto {a, b, c}, entonces los arreglos pueden ser:

ab, ba, ac, ca, bc, cb

Nmero de arreglos = 6

Mtodo 2: (principio de multiplicacin)

3 x 2 = 6

no de arreglos = 6
Explicacin:

a) El primer casillero puede ser ocupado por cualesquiera de las tres letras, existiendo 3 posibilidades.

b) El segundo casillero puede ser ocupado por cualesquiera de las otras dos letras restantes, existiendo 2
posibilidades.

50
Estadstica General ciclo 2013-I

Teorema (permutacin lineal con elementos diferentes)

"El nmero de permutaciones de "n" objetos diferentes, tomados en grupos de k elementos (siendo k n)
n
y denotado por P k estar dado por:

n!
Pnk =
(nk )!

Donde: n, k NyO k n
Estas permutaciones son llamadas lineales, porque los objetos son ordenados en una lnea recta de referencia.

Ejemplo

En una carrera de 400 metros participan 10 atletas. De cuntas formas distintas podrn ser premiados los
tres primeros lugares?

Solucin

Mtodo 1: (usando la frmula de permutacin lineal)

Se buscan las diferentes ternas (k = 3) que se pueden formar con los 10 atletas (n = 10).

10 10 !
P3 = = 720
7!
Mtodo 2:

Empleando el principio de multiplicacin.

1o 2. 3.

10 x 9 x 8 = 720

Explicacin

a) El primer casillero (MEDALLA DE ORO) puede ser ocupado por cualquiera de los diez atletas, existiendo
10 posibilidades.

b) El segundo casillero (MEDALLA DE PLATA) puede ser ocupado por cualquiera de los nueve atletas
restantes, existiendo 9 posibilidades.

c) El tercer casillero (MEDALLA DE BRONCE) puede ser ocupado por cualquiera de los ocho atletas
restantes, existiendo 8 posibilidades.

Recordar

a) n!=lx2x3x...x (n-1)xn

b) 0!=1

51
Estadstica General ciclo 2013-I

c) 1!=1

d) n!=(n-1)!x n

Permutacin circular

Son agrupaciones donde no hay primer ni ltimo elemento, por hallarse todos en una lnea cerrada. Para hallar
el nmero de permutaciones circulares que se pueden formar con "n" objetos distintos de un conjunto, hay
que considerar fija la posicin de un elemento, los (n -1) restantes podrn cambiar de lugar de (n -1)! formas
diferentes, tomando todas las posiciones sobre la circunferencia relativa al primer punto.

El nmero de permutaciones circulares ser:

n
Pc = (n-l)!

Ejemplo

De cuntas formas diferentes pueden sentarse alrededor de una mesa circular un padre y sus 5 hijos?

Solucin Se trata de una permutacin circular:

6
P1 = (6-1)!=5!=120

Combinacin

Es cada uno de los diferentes arreglos que se pueden hacer con parte o todos los elementos de un conjunto
dado sin considerar el orden en su ubicacin.

El nmero de combinaciones de "n" elementos diferentes tomados de "k" en "k", con k n, est dado
por:

n!
c nk =
( nk ) ! k !

Ejemplo

Se dispone de 5 puntos no colneales, cul es el mximo nmero de tringulos que se podrn formar?

Solucin

Para dibujar un tringulo solo es necesario 3 puntos en el plano, razn por la cual se tomarn 3 puntos (k = 3)
de un total de 5 puntos (n = 5).

Adems no importa el orden, ya que el triangulo ABC es igual al CBA; por lo tanto, se trata de una
combinacin

5 5!
c 3= = 10
2! 3 !
Observacin

Si de una poblacin N se extrae una muestra sin reemplazo de n elementos, entonces:

52
Estadstica General ciclo 2013-I

a) Si el orden es importante, entonces se trata de permutaciones, porque se buscan ordenaciones.

b) Si el orden no es importante, entonces se trata combinaciones porque se buscan agrupaciones.

Si de una poblacin N se extrae una muestra con reemplazo de n elementos, entonces:

n
c) El nmero de muestras posibles se calcula mediante: N
Ejemplo

Una seora tiene 3 frutas: manzana, fresa y pia. Cuntos sabores diferentes de jugo podr preparar con
estas frutas?

Solucin

Se puede escoger una o dos frutas de las tres o las tres frutas de las tres, adems en este caso no importa el
orden; por lo tanto, usamos el principio de adicin aplicado a la combinacin:

o 3 3 3
n de maneras diferentes = c 1 +c 2+ c 3

n de maneras diferentes = 3 + 3 + 1 = 7

Total de sabores diferentes = 3 + 3 + 1 = 7

Ejemplo

Se desea formar un comit de 7 seleccionados: 4 fsicos y 3 matemticos, de un grupo de 8 fsicos y 6


matemticos. De cuntas maneras podr seleccionarse?

Solucin

8
1 Se selecciona 4 fsicos de 8, en c 4 formas:
8
c 4 =70
6
2. Se selecciona 3 matemticos de 6, en c3
6
c 3=20

3. Se aplica el principio de multiplicacin:

8 6
c4 x c3 = 70x20 = 1400

Probabilidades:

Qu es una probabilidad?

En general, es cuantificar la posibilidad de que algo suceder. As por ejemplo:

El pronstico meteorolgico anuncia que hay un 70% de que el fenmeno de El Nio sea mnimo, en
intensidad, en el ao 2007.

53
Estadstica General ciclo 2013-I

Definicin de probabilidad

Valor entre cero y uno, inclusive, que describe la posibilidad relativa de que ocurra un evento.

Se utilizan dos palabras claves en el estudio de la probabilidad: experimento y evento.

Experimento

Se denomina experimento a la reproduccin controlada de un fenmeno cualquiera que ocurre en la


naturaleza y cuyo resultado en cada prueba depende del azar. Es tambin un proceso que conduce a la
ocurrencia de una, y solamente una, de varias observaciones posibles.

Experimento Resultados (eventos)

Lanzar una moneda al aire Cara, sello

Lanzar un dado 1,2, ...,6

Control de calidad Defectuoso, no defectuoso

Resultado

Lo que resulta especficamente de un experimento.

Espacio muestral ()

Es el conjunto de todos los resultados posibles de un experimento aleatorio. Dependiendo de las


caractersticas del conjunto que se genera, se puede tener:

1. Espacios muestrales discretos

1.1 Espacios muestrales finitos

Son aquellos conformados por un nmero finito de elementos.

1.2 Espacios muestrales infinitos numerables

Si es un conjunto numerable; es decir, si es posible asociar un nmero natural con cada elemento
de

2. Espacios muestrales continuos o no numerables

Si es un conjunto no numerable; es decir, si no es posible asociar un nmero natural con cada elemento de
.

Evento

Es cualquier subconjunto de un espacio muestral . Los eventos se identifican mediante letras maysculas.

Ejemplo

Experimento aleatorio = E = {Eleccin de un alumno de la Facultad de Ciencias Econmicas y


Empresariales}

54
Estadstica General ciclo 2013-I

Sobre se pueden definir eventos tales como:

A = El alumno es de sexo femenino.

B = El alumno es de sexo masculino.

C = El alumno es recin ingresante.

Tipos de eventos

Eventos mutuamente excluyentes

Dos eventos A y B son mutuamente exc1uyentes si no tienen elementos comunes; es decir, si no pueden
ocurrir simultneamente.

A = El alumno tiene ms de 20 aos.

B = El alumno tiene menos de 18 aos.

Eventos complementarios

Dos eventos A y B son complementarios SI son mutuamente excluyentes y su unin es el espacio muestra:

A = El alumno tiene 18 aos o ms.

B = El alumno tiene menos de 18 aos.

Propiedades de operaciones con eventos

l. A B = A B' (Diferencia)
2. A' = - A (Complemento)

3. A (B C) = (A B) (A C) (Distributiva)

4. A (B C) = (A B) (A C) (Distributiva)

5. (A B)' = A' B' (Ley de De Morgan)

6. (A B)' = A' B' (Ley de De Morgan)

7. ' = ; '= ; (A')' = A

8. Si A A B , entonces A B = B y A B = A

9. A = A; A= ; A A' = ; A A' =

10.A A = A; A A = A

Probabilidad de un evento

Se llama probabilidad a cualquier funcin, p, que asigna a cada evento A un valor numrico p(A), verificando
los siguientes axiomas o postulados:

55
Estadstica General ciclo 2013-I

~O p ( A ) 1, para cada evento A en

~ p () = 1

~ Para cualquier nmero finito o infinito de eventos mutuamente exc1uyentes en , se cumple:

A2
p( ) p ( A 3 ) . Si
A 1 A 2 A3 . = p ( A1 ) p

A 1 A 2 A 3 ..

Enfoques de la probabilidad

Se analizarn dos enfoques de la probabilidad, el punto de vista objetivo y subjetivo.

Probabilidad objetiva

Se subdivide en probabilidad clsica y probabilidad emprica.

Probabilidad clsica

Se basa en la consideracin de que los resultados de un experimento son igualmente probables. As:

no de resultados favorables o xitos


Probabilidad de un evento:=
no total de resultados posibles
Ejemplo

Consideramos el experimento de tirar un dado. Cul es la probabilidad del evento (suceso) "obtener un
nmero par"?

Solucin Sea:

A = El nmero que sale al tirar el dado es par.

3 1
P(A) = =
6 2
Ejemplo

Calcular la probabilidad de que en una carrera de 12 caballos, acertar a los tres que llegan primero en el
orden de su llegada a la meta.

Solucin

Se debe determinar el nmero de arreglos posibles de tres caballos de los 12 que hay. Como s interesa el
orden, entonces se utiliza la frmula de permutacin:

12 12 !
P3 = = 1320
( 123 ) !
Entonces hay 1320 grupos de tres caballos, como interesa uno, entonces:

56
Estadstica General ciclo 2013-I

A = Acertar a los tres caballos que llegan primero en el orden de su llegada a la meta.

1
p(A)= - = 0.00076
1320

Ejemplo

Una caja contiene dos calcetines blancos y dos azules. Si se eligen dos aleatoriamente, cul es la
probabilidad de que sean del mismo color?

Solucin

4!
C24= = 6, posibilidades de elegir dos calcetines
( 42 ) ! 2 !
Sea el evento:

A = Los dos calcetines extrados son del mismo color.

2 1
p(A) = =
6 3
Probabilidad emprica

La probabilidad de que un evento ocurra a largo plazo se determinar. Observando en qu fraccin de tiempo
sucedieron eventos semejantes en el pasado.

no de veces que ocurri en el pasado


Probabilidad de un evento:=
no total de observaciones
Ejemplo

Se efectu un estudio de 780 graduados en Administracin de Empresas en la Universidad de Jan. Este


experimento revel que 450 de los 780 no estaban empleados segn su principal rea de estudios en la
universidad. Cul es la probabilidad de que un graduado especfico en Administracin est empleado en un
rea distinta a la principal de sus estudios en la universidad?

Solucin Sea:

A = Graduado empleado en otra rea.

450
p (A) = = 0.58 == 58%
780
Por lo tanto, la probabilidad de que un egresado est empleado en un rea distinta a la de sus estudios es del
58%.

Probabilidad subjetiva

Posibilidad de que suceda un evento especfico asignado por una persona con base en cualquier informacin
que se disponga.

57
Estadstica General ciclo 2013-I

Algunas reglas de probabilidad

Reglas de adicin

Regla especial de adicin

Si dos eventos A y B son mutuamente excluyentes, la regla indica que la probabilidad de que ocurra uno u
otro de los eventos es igual a la suma de probabilidades.

P (A o B) = p (A B) = p (A)+p (B)
Observacin 1

Dos eventos son mutuamente excluyentes cuando no pueden ocurrir al mismo tiempo.

Ejemplo

En el experimento de tirar un dado, el evento "un nmero par" y el evento "un nmero impar" son
mutuamente excluyentes. Si se observ un nmero par, no podra caer un nmero impar al mismo tiempo.

Observacin 2

Los eventos colectivamente exhaustivos constan de todos los posibles resultados de un experimento y
constituyen su espacio muestral. As los eventos colectivamente exhaustivos de lanzar un dado son: 1, 2, 3, 4,
5, y 6. Adems, debido a que existe la certeza de que uno de estos eventos ocurrir, la suma de sus
probabilidades es igual a 1. Esto es: p (1 2 3 4 5 6) = 1

Regla del complemento

Sea A un evento cualquiera, entonces se tiene que:

p (A) + p (A') = 1, de donde p (A') = 1- p (A)

Ejemplo

Se ha de entrevistar a un grupo selecto de empleados de la empresa ORION S.A., con respecto a un plan de
pensiones. Se efectuarn entrevistas detalladas a cada uno de los empleados seleccionados en la muestra.
Estos se clasificarn como sigue:

Clasificacin no de empleados
Supervisores 120
Mantenimiento 50
Produccin 1460
Gerencia 302
Secretaria 68
Total 2000

Cul es la probabilidad de que la primera persona seleccionada:

a) Sea empleada de mantenimiento o secretaria?

b) No sea de gerencia?

58
Estadstica General ciclo 2013-I

Solucin

Sean los siguientes eventos:

B = El empleado seleccionado al azar es de mantenimiento.

E = El empleado seleccionado al azar es secretaria.

D = El empleado seleccionado al azar es de gerencia.

a) p (B o E) = p (B)+ p(E), por ser mutuamente excluyentes.

50 68
P (B o E) =p(B E) = + =0.059
200 2000

302
b) p(D') = 1- p (D) = 1- = 0.849
2000
Cuando los eventos no son mutuamente excluyentes, es decir, existe la posibilidad de que ocurran
simultneamente, aparece la siguiente regla:

Regla general de adicin

Es la probabilidad que mide la posibilidad de que dos o ms eventos ocurran en forma simultnea:

p (a o b) = p(a) + p(b) - p(a y b) o equivalentemente

p (A U B) = p(A)+ p (B)- p(A B)


Propiedades

1. p ( )=O

2. Si A B , entonces p (A) p (B)

3. Si A, B Y C son tres eventos cualesquiera en , entonces:

P (A B C) = p (A) + p (B) + p (C)- p (A B)- p (A C) - p (B C) + p(A


B C)

4. p (A B C) p(A)+ p (B)+ p(C)

Ejemplo

Cul es la probabilidad de que una carta elegida al azar de una baraja americana sea un as o un corazn?

Solucin

Sea:

A = La carta elegida es as.

B = La carta elegida es de corazones.

59
Estadstica General ciclo 2013-I

Los eventos A y B no son mutuamente excluyentes, porque existe la posibilidad de que salga un as y que sea
de corazones, por lo tanto:

p (A o B) = p (A) + p (B)- p (A y B)

p (A B ) = p (A) + p (B) p (A E)

4 1 13 1 1
p(A) = = p( B) = = p (A y B)
52 13 52 4 52

1 1 1
p (A B = +
13 4 52

4+ 131
p (A B =
52

16
p (A B = = 0.3077 = 30.77%
52
Ejemplo

Como parte de un programa de servicios de salud para los empleados de la empresa Don Carlos S.A., se
efectan anualmente exmenes clnicos de rutina. Se descubri que el 8% de los empleados tiene el colesterol
alto, el 15% sufre de gastritis y el 3% tiene el colesterol alto y sufre de gastritis.

a) Cul es la probabilidad de que un empleado seleccionado al azar tenga el colesterol alto o sufra de
gastritis?
b) Muestre esta situacin en forma de un diagrama de Venn.

Reglas de multiplicacin

Regla especial de multiplicacin

Sean A y B dos eventos independientes, entonces:

P (A y B) = p(A). p (B)

Tambin se cumple que si A y B son independientes, entonces:

P (A\E) = p(A) o

P (B \ A) = p (B)

60
Estadstica General ciclo 2013-I

Eventos independientes

Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de ocurrencia del otro.

Ejemplo

Una moneda es lanzada dos veces al aire, cul es la probabilidad de que las dos veces se obtenga cara?

Solucin sea:

A = Obtener cara en el primer lanzamiento.

B = Obtener cara en el segundo lanzamiento.

1 1
p (A) = p (B) =
2 2
El que resulte cara en el segundo lanzamiento no depende si sali cara o no en el primero, es por eso que A y
B son eventos independientes. Por la tanto:

1 1 1
P (A y B) = p(A) p (B)= =
2 2 4
Ejemplo

Una mquina automtica introduce legumbres en una bolsa de plstico. La experiencia indica que algunos
paquetes tuvieron menos peso, y algunos otros pesos de ms, pero la mayora fueron satisfactorias. Veamos el
siguiente cuadro:

Peso del paquete Probabilidad

Insuficiente 0.025

Satisfactorio 0.900

Excedido 0.075

a) Cul es la probabilidad de seleccionar tres paquetes de la lnea de procesamiento de alimentos y encontrar


que a los tres les falta peso?

b) Qu significa esta probabilidad?

Solucin

a) Sea F = Paquete seleccionado que le falta peso.

p (F) = 0.025

p (F y F y F)= (F) p (F) p (F) = (0.025)(0.025)(0.025)

p (F y F y F) = 0.000015625

b) Descubrir que a los tres paquetes les falte peso es poco probable.

61
Estadstica General ciclo 2013-I

Observacin

Si dos eventos no son independientes, se dice que son dependientes. Con un ejemplo ilustraremos esta idea:

Supongamos que hay 10 rollos de pelcula fotogrfica en una caja y se sabe que tres estn defectuosos. Se
selecciona uno:

3
p (D) = Probabilidad de que sea defectuoso.
10

7
p (D') = Probabilidad de que no sea defectuoso.
10
Despus se elige un segundo rollo de la caja, sin devolver el primero, la probabilidad de que este sea
defectuoso depender si el primero lo fue, de ser as es:

2
p( D2 ) = Probabilidad de que el segundo rollo extrado sea defectuoso dado que el primero lo
9
fue.

3
p( D'2 ) = Probabilidad de que el segundo rollo extrado no sea defectuoso dado que el primero
9
fue bueno.

Este tipo de anlisis nos ayuda a definir la probabilidad condicional.

Probabilidad condicional

Es la probabilidad de que ocurra un evento en particular dado que otro evento ha ocurrido.

p(A y B) = p(A). p (B\A)

p( A y B)
p (B \ A) =
p(A )

p( A B)
p (B \ A) =
p( A)

P (B \ A) = Probabilidad de que ocurra B dado que ya ocurri A.

Del ejemplo anterior: cul es la probabilidad de escoger un defectuoso seguido de otro defectuoso?

p(A y B) = p (A) p (B\A)

3 2
p(A y B) = = O.067
10 9
Donde:

A = Primer rollo defectuoso.

62
Estadstica General ciclo 2013-I

B = Segundo rollo defectuoso.

Propiedades de la probabilidad condicional

1. p (A B) = p(A) p (B\A), si p (A 0)

2. p (A B C) = p(A) p(B\A) p(C\A B),

si p (A O; p (A B) O

3. p ( \A)= 0, si p(A O)
4. p (A'\B) = l- p (A\B)

5. p (A C\B) = p (A \B) + p (C \B)- p (A C\B)


6. p (A\B) + p (A'\B) =1, si p(B) O.
Recuerde que:

P (A B) = p (A y B)

Ejemplo

De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. Cul es la probabilidad de obtener
dos espadas, dos corazones y un diamante?

Solucin

E2 /
p ( E1 y E2 y C 1 y C 2 yD = E1 p ( C 1 / E1 y E 2 ) p ( C 2 /
p ( E1 ) p
E1 y E2 y C 1 p ( D / E 1 y E2 y C 1 y C 2 )

13 12 13 12 13
p( E1 y E2 y C 1 y C 2 yD = = 0.001014
52 51 50 49 48
Pero esta es solo una parte, el total de posibilidades ser una permutacin de ellas, pero es una permutacin
con repeticin ya que las espadas se repiten dos veces y los corazones tambin dos veces, entonces:

13 12 13 12 13
5!
p( 52 51 50 49 48 ) = 0.0304
2 !2!
E1 y E2 y C 1 y C 2 yD =

Tablas de contingencia

Una tabla de contingencia es una distribucin, una matriz, en cuyas filas y columnas los individuos de una
poblacin se clasifican en funcin de dos variables. Tambin se le conoce con el nombre de tabla de doble
entrada.

Por ejemplo, la siguiente es una tabla de contingencia en la que 300 personas se han clasificado segn el sexo
y por su adiccin al tabaco.

63
Estadstica General ciclo 2013-I

Fumadores No fumadores Total


Hombres 120 60 180
Mujeres 50 70 120
Total 170 130 300

En los mrgenes de la tabla se indican las sumas de filas y columnas.

Las tablas de contingencia nos ayudan a calcular los valores de probabilidad. Una tabla de probabilidad
puede crearse dividiendo cada valor de las casillas por el total, que en el ejemplo anterior sera 300.

Los resultados se muestran en la siguiente tabla:

Fumadores No fumadores Total


Hombres 120/300 60/300 180/300
Mujeres 50/300 70/300 120/300
Total 170/300 130/300 300/300

Por lo tanto, la tabla de probabilidades quedara de la siguiente manera:

Fumadores No fumadores Total


Hombres 0.4 0.2 0.6
Mujeres 0.1667 0.2333 0.4
Total 0.5667 0.4333 1

Los valores en los mrgenes de la tabla se llaman probabilidades marginales. Por ejemplo, elegida una
persona al azar la probabilidad de que esta sea hombre es p (H) = 0.6 y la probabilidad de seleccionar una
mujer es p (M) = O.4

A las probabilidades en las celdas de la estructura principal de la tabla se les denomina probabilidades
conjuntas y muestran la probabilidad de la interseccin de dos eventos. Por ejemplo, la probabilidad de
seleccionar una mujer y que esta sea fumadora es p (M y F) = 0.167.

Tambin se puede calcular probabilidades condicionales por ejemplo, si se ha elegido un fumador qu


probabilidad hay de que sea mujer?

Nos piden que calculemos p (M \ F), esto es:

p ( M y F ) 0.1667
p (M \ F) = = = 0.2942
p (F ) 0.5667

Por lo tanto, hay una probabilidad del 29.42% de que sea mujer dado que es fumador la persona elegida.

Diagramas de rbol o arborigrama

Es una representacin grfica til para organizar clculos que abarcan varios datos. Cada segmento en el rbol
es una etapa del problema.

64
Estadstica General ciclo 2013-I

Para la elaboracin de un arborigrama se empieza trazando un punto en la izquierda, que representa el punto
central de un tronco.

Ilustremos lo anterior mediante un ejemplo:

Ejemplo

Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140 clientes.

Estado civil
Edad Soltero Casado Total
Menor de 30 77 14 91
Mayor o igual a 30 28 21 49
Total 105 35 140

a) Cul es la probabilidad de encontrar un cliente menor de 30 y soltero?

b) Si un cliente tiene menos de 30 aos, cul es la probabilidad de que sea soltero?

Solucin

Sean los siguientes eventos:

A = Cliente menor de 30 aos.

B = Cliente mayor o igual a 30 aos.

S = Cliente soltero.

C = Cliente casado.

Trabajamos un diagrama de rbol para ubicar los datos.

Probabilidad Probabilidad
condicionada
conjunta
P(S/A)

77 S p(A y S) = p(A)p(S/A) = = 0.55


91 91 77

91 A C p(A y C) = p(A)p(C/A) = 140 91 = 0.10
140 14 14 91 14

91 91 140 91

28 S p (B y S) = p(B)p(S/B) = = 0.20
B
49 49 49 28

140 140 49

65
Estadstica General ciclo 2013-I

21 C p (B y C) = p(B)p(C/B) = = 0.15
49 40 21

140 49

77
a.- p (A y S) = = 0.55 Probabilidad de que un cliente sea menor de 30 y soltero
140

77
b.- p (S \ A)= = 0.85 Probabilidad de que un cliente sea soltero dado que es menor de 30 aos.
91
Tambin se puede asociar a cada diagrama de rbol una tabla de contingencia Y viceversa. Para el ejemplo se
ene

Estado civil
Edad Soltero Casado Totales
A p (A y S) p (A y C) p (A)
B p (B y S) p (B y C) p (B)
Totales p(S) p(C) 1

Los datos obtenidos en el diagrama de rbol los reemplazamos en la tabla, esto es:

Estado civil
Edad Soltero Casado Totales
A 0.55 0.1 0.65
B 0.2 0.15 0.35
Totales 0.75 0.25 1

Teorema de Bayes

p (A \ B) y p (B \ A), pueden parecer similares, en concepto existe diferencia apreciable entre las
probabilidades que representan. Por ejemplo: si A es el evento de que las ventas en poca navidea sean altas
en un rea especfica y B es el evento de que el clima sea bueno, entonces p (A \ B) es la probabilidad de que
las ventas sean altas dado que el clima es bueno, mientras que p (B \ A) es la probabilidad de que el clima sea
bueno dado que las ventas son altas.

Existen muchas probabilidades en Estadstica en que intervienen estas parejas de probabilidades


condicionadas, el teorema de Bayes que se ver a continuacin, permite expresar la relacin matemtica entre
las probabilidades de la forma p (A \ B) y p (B \ A), pero para ello se necesitan algunos conceptos previos.

Probabilidad a priori

Probabilidad inicial con base en el nivel actual de informacin.

Probabilidad a posteriori

Es una probabilidad con base en informacin adicional. El teorema de Bayes proporciona un mtodo para
calcular este tipo de probabilidades.

Teorema de Bayes

66
Estadstica General ciclo 2013-I

Si se conoce la probabilidad de B en cada uno de los componentes de un sistema excluyente de eventos,


entonces si ocurre B, se puede calcular la probabilidad (a posteriori) de ocurrencia de cada A

A1
B
p(A\B) =

p( A1) p

Observacin

Si los sucesos A 1 , A 2 , A3 , , A k se consideran casos posibles del suceso B, entonces Bayes


permite determinar la probabilidad de que uno de los A i ocurra siempre que B haya ocurrido.

Ejemplo

La Dra. Blanquita ha estado enseando Estadstica Bsica durante muchos aos. Se sabe que el 80% de los
estudiantes terminarn los problemas asignados. Determin, que de los estudiantes que cumplen con su
trabajo el 90% aprobar el curso. De aquellos estudiantes que no lo hacen as, el 60% ser aprobado. Eduardo
Lpez tom Estadstica durante el ltimo semestre con la profesora Blanquitaa y recibi una calificacin
aprobatoria. Cul es la probabilidad de que s haya hecho sus tareas?

Solucin

Sea:

A = Estudiante que cumple con su trabajo.

A' = Estudiante que no cumple con su trabajo.

B = Estudiante que aprueba.

B' = Estudiante que no aprueba.

p (A) = 0.8 => p (A') = 0.2

p (B\A) = 0.9 ;p (B\A') = 0.6

p (B'\A) = 0.1; p (B'\ A') = 0.4

P(B) = 0.9 B
p(A y B) = p(A)p(
A
p(A y B) = (0.8)(0.9)= 0.72
'
P( B = 0.
1 '
P(A) =0.8 B
p(A y A )
p(A y B '' = ( 0.8 ) ( 0.1 )=0.08
B =p ( A ) p

67
Estadstica General ciclo 2013-I

P(B) =0.6 B
p( A '
yB A' )
P( A ' = 0. p( A '
y B = ( 0.2 )(' 0.6 )=0.12 )
2
= p ( A ) p
P( B ' = 0.
4
B'
'
p( A ' y B' '
p( A y B ' A
)
'
=
= p ( 0.2 ) p ( 0.4 p( A ) p
) =0.08

Por definicin de probabilidad condicional tenemos:

A p( A y B)
p( )=
B P(B)

p(
A
B
)=
p ( A) p ( BA )
p (B)

Tener en cuenta que p (B) no es discernible de inmediato. Aqu es donde participa el teorema de Bayes.
Existen dos razones por las que Eduardo Lpez haya aprobado el curso. Puede haber hecho los trabajos
asignados y aprobar el curso o puede no haber hecho los trabajos asignados y tambin aprobar el curso, es
decir:

p (B) = p (A y B) + p (A y B)

p (B) = 0.12p (A). p (B \ A) + p (A'). p (B \ A')

Cuando se hace la sustitucin en el denominador de la frmula 1 se tiene:

B
p( A) p( )
A A
P( =
B
p ( A) p ( BA )+ p ( A ) p( AB )
'
'

A 0.72 0.72
P( = = = 0.86 = 86%
B 0.72+0.12 0.84

Por lo tanto, hay un 86% de probabilidad de que Eduardo Lpez haya hecho sus tareas dado que recibi una
calificacin aprobatoria.

Ejemplo

El departamento de crdito de la tienda departamental Saga Falabel1a en Piura, inform que 30% de sus
ventas son en efectivo, 30% son pagadas con cheques en el momento de la adquisicin y 40% son a crdito.
Se tiene que 20% de las compras en efectivo, 90% de las pagadas con cheques y 60% de las adquisiciones al
crdito, son por ms de US$50. La Sra. Milagritos acaba de comprar un vestido que cuesta US$ 120. Cul es
la probabilidad de que haya pagado por l en efectivo?

68
Estadstica General ciclo 2013-I

Distribucin de probabilidades

Variable aleatoria

Una variable aleatoria de un espacio muestral es la regla que asigna un valor numrico a cada resultado de
, es decir, es una funcin de en el conjunto de los nmeros reales. Las variables aleatorias son:

Variable aleatoria discreta

Variable que solo puede tomar ciertos valores claramente separados, que resultan de contar algn elemento de
inters. Generalmente toma valores enteros. Ejemplo

Sea el experimento: Inspeccionar un embarque de 50 radios, y sea la variable aleatoria

X = Cantidad de radios defectuosos

Entonces los valores que puede tomar la variable X serian:

X = {0, 1,2, . ,50}

Variable aleatoria contina

Es aquella que resulta principalmente de la medicin y puede tomar cualquier valor, al menos dentro de un
rango dado.

X = Peso de un cliente

Entonces los valores que pueden tomar la variable serian:

X = {60, 5, 60,35,}

Distribucin de probabilidades de una variable discreta.

Enumeracin de todos los resultados de un experimento junto con la probabilidad asociada a cada resultado.

Ejemplo

Suponga que est interesado en el nmero de caras que se obtienen al lanzar 3 veces una moneda. Cul es la
distribucin de probabilidades para el nmero de caras?

Solucin:

Resultado posible X = Nmero de caras


CCC 3
CCS 2
CSC 2
SCC 2
SSC 1
SCS 1
CSS 1
SSS 0

69
Estadstica General ciclo 2013-I

Como se aprecia, la variable X solo toma los valores: 0, 1, 2, 3, La distribucin probabilstica para los eventos
0,1,2 y 3 resultantes ser:

Nmero de caras P(X)


(X) 0 1/8 = 0.125
1 3/8 = 0.375
2 3/8 = 0.375
3 1/8 = 0.125

Media, variancia y desviacin estndar de una distribucin de probabilidades

Media o valor esperado de una variable aleatoria

Si X es una variable aleatoria discreta que puede asumir valores x 1 , x 2 , x 3 , .. , x n , con probabilidad
de p1 , p2 , p3 , .. , pn , respectivamente, se define su valor esperado o media, como sigue:
n
= E (x) = [ xi p ( xi )]
i=1

Variancia y desviacin estndar

La media no describe el grado de dispersin o variacin de una distribucin. La variancia si lo hace. Si


comparamos las dos, la variancia nos permite confrontar la variacin en dos distribuciones que tengan la
misma media


2
= [ ( xi )2 p ( x i ) ]
i=1

La desviacin estndar

= 2
Ejemplo

El seor Prez ofrece tres tamaos de refrescos (pequeo, mediano, grande) como complemento de las tortas
que vende Las bebidas se venden a 50,75 y 90 cntimos, respectivamente. De los pedidos, 30% son para el
tamao pequeo, 50% para el mediano y 20% para el grande.

a.- Es esta una distribucin de tipo discreta? Por qu?

b.- Calcule la cantidad media cobrada por un refresco.

c.- Cul es la variancia de los cobros por bebida y su desviacin estndar?

X pX) Xp(X) X ( x )2 p ( X )
50 30% = 0.30 15 20.5 126.075
75 50% = 0.50 37.5 4.5 10.125
90 20% = 0.2 18 19.5 76.050
70.5 212.250

70
Estadstica General ciclo 2013-I

a.- Es del tipo discreta

b.- = 70.5 cm.

2
c.- = 21.250

= 14.57 cm.

Distribucin de probabilidades binomial.

La distribucin probabilstica binomial es un ejemplo de una distribucin probabilstica discreta la cual tiene
muchas aplicaciones en la vida diaria.

Las caractersticas de la distribucin binomial son:

1.- El resultado de cada ensayo o realizacin de un experimento se clasifica en una de dos categoras
mutuamente excluyentes: xito o fracaso. Esta clasificacin no implica que un resultado sea bueno y el
otro malo

2.- La variable aleatoria es el resultado de contar el nmero de xitos en una cantidad fija de ensayos.

3.- La probabilidad de xito permanece igual en cada ensayo

4.- Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta el resultado de
algn otro

n! x ( nx )
p(x) = p q
x ! ( nx ) !

n= Nmero de ensayos

x= Numero de xitos

p = Probabilidad de xito en cada ensayo

q = Probabilidad de fracaso en cada ensayo

Ejemplo

La probabilidad de que un operario haga menos de 10 piezas en una jornada de trabajo es de 0.20. Determine
la probabilidad de que la prxima semana (6 das) en tres das haga menos de 10 piezas por semana.

Solucin

Sea la variable aleatoria

X = Numero de das que el operario hace menos de 10 piezas por jornada de trabajo

n=6 p = 0.2 q = 0.8

71
Estadstica General ciclo 2013-I

n!
p(x) = px q( nx )
x ! ( nx ) !

6!
p(x=3) = 0.23 0.8(63 )
3 ! ( 63 ) !

p(x=3) = 0.0819

Ejemplo

Cuando un cliente hace compras en una tienda por departamentos, un sistema computarizado de informacin
contable verifica de manera automtica si l o ella ha excedido su lmite de crdito. Registros pasados indican
que la probabilidad de que los clientes excedan su lmite de crdito es de 0.05. Suponga que en un da
cualquiera, 20 clientes hacen pedidos y que el nmero de clientes que ha excedido su lmite de crdito
detectado por el mismo sistema computarizado de informacin de contabilidad se distribuye como una
variable aleatoria binomial.

a.- Cul es la probabilidad de que ningn cliente exceda su lmite?

b.- Cul es la probabilidad de que un cliente exceda su lmite?

c.- Cul es la probabilidad de que dos o ms excedan su lmite?

Distribucin probabilstica de Poisson

Es aplicable a casos en los cuales se desea obtener la probabilidad de un evento sobre un intervalo de tiempo
o espacio en el cual se cumplen los siguientes supuestos

a.- Se tiene un conjunto de intervalos contiguos de la misma amplitud

b.- La probabilidad de xito es la misma en cada intervalo

c.- La ocurrencia del evento en uno de los intervalos es independiente de la ocurrencia del evento en
cualquiera de los otros.

La distribucin de Poisson tiene muchas aplicaciones como por ejemplo, el nmero de clientes que llegan a
un establecimiento por unidad de tiempo, nmero de usuarios que llegan a un punto de servicio y van
formando una cola, etc.

p (X) =
x e
x!

= Es la media aritmtica del nmero de ocurrencias (xitos) en un intervalo de tiempo de oportunidad


especfico (de tiempo, de superficie, de volumen, etc.)

e = constante de Euler (2.71828)

X = Numero de ocurrencias (xitos)

p(x) = Es la probabilidad que se va a calcular para un valor dado de X

72
Estadstica General ciclo 2013-I

=En el caso de Poissn puede calcularse como = np

Observacin:

La media y la varianza de una distribucin de Posn coinciden, esto es: = 2

Ejemplo

Un cultivador de semillas hibridas tiene problemas de gusanos barrenadores de maz. Una exploracin
aleatoria de 5000 mazorcas revela estos datos: muchos de ellos no tenan gusanos, algunos tenan uno, unos
cuantos dos y as sucesivamente. El agricultor cont 3500 gusanos en las 5000 mazorcas.

a.- Cul es la probabilidad de que una mazorca seleccionada al azar no contenga barrenadores?

b.- Cul ser la probabilidad de que una mazorca seleccionada al azar contenga uno, dos tres, cuatro, cinco,
seis barrenadores?

Solucin:

Determinamos el promedio de gusanos en una mazorca

3500
= = 0.7
5000
x
e
p (X) =
x!

0.70 e0.7
p (X =0) = = 0.4966
0!
p (x = 1) = 0.3476

p (x = 2) = 0.1217

p (x = 3) = 0.0284

p (x = 4) = 0.005

p (x = 5) = 0.0097

p (x = 6) = 0.0001

Distribucin probabilstica normal

Es una distribucin de probabilidad continua.


La distribucin probabilstica normal y su curva normal tienen la siguiente caracterstica:

1.- La curva normal tiene la forma de una campana y presenta un solo valor mximo en el centro. La media,
mediana y moda son iguales.

73
Estadstica General ciclo 2013-I

Luego la mitad del rea bajo la curva se encuentra a un lado (o por encima del valor central) y la otra
mitad al otro lado (o por debajo)

2.- La distribucin probabilstica normal es simtrica con respecto a su media

3.- La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Es asinttica, lo
cual significa que la curva se acerca cada vez ms al eje X, pero nunca llega a tocarlo. Esto es, los puntos
extremos de la curva se extienden indefinidamente en ambas direcciones
La distribucin normal estndar tiene media igual a 0 y desviacin estndar igual a 1.
Valor z (o desvi normal z) es la diferencia (desviacin) entre un valor seleccionado, denotado por X
y la media poblacional , dividida entre la desviacin estndar de la poblacin.

X
Z=

reas bajo la curva normal

1.- Aproximadamente el 68% del rea bajo la curva normal est dentro ms una y menos una desviacin
estndar respecto de la media. Esto se expresa as 1
2.-Aproximadamente el 95% del rea bajo la curva normal est dentro ms dos y menos dos desviaciones
estndar respecto de la media. Esto se expresa as 2
3.- Aproximadamente el 99% del rea bajo la curva normal est dentro ms tres y menos tres desviaciones
estndar respecto de la media. Esto se expresa as 3
Ejemplo

Una mquina expendedora de gaseosa se ajusta para servir 7.00 onzas de liquido por vaso. La desviacin
estndar es de 0.10 onzas Cul es la probabilidad de que la mquina sirva

a.- Entre 7.10 y 7.25 onzas de gaseosa


b.- 7.25 onzas o ms
c.- Entre 6.8 y 7.25 onzas
ERROR DE MUESTREO
Diferencia entre el estadstico de una muestra y el parmetro de la poblacin correspondiente

DISTRIBUCION MUESTRAL DE LA MEDIA

Distribucin de probabilidad de todas las posibles medias de las muestran de un determinado tamao
demuestra de la poblacin

Ejemplo

Paty Industrias, cuenta con siete empleados de produccin a quienes se le considera la poblacin). En la
siguiente tabla se incluyen los ingresos por hora de cada empleado

74
Estadstica General ciclo 2013-I

EMPLEADO INGRESO POR EMPLEADO INGRESO POR


HORA HORA

Juan $7 Esther $7
Diana 7 Gabriela 8
Julio 8 Steffany 9
Eduardo 8

1.- Cul es la media de la poblacin?


2.- Cul es la distribucin muestral de la media para muestra de tamao 2?
3.- Cul es la media de la distribucin muestral?
4.- Cul es la desviacin estndar de la distribucin muestral?
5.- Encuentre el factor de correccin

ESTIMACIN PUNTUAL Y POR INTERVALO

Toda inferencia que se haga sobre una poblacin tendr necesariamente, que basarse en estadsticos
muestrales, esto es, en funciones de la informacin muestral. La eleccin apropiada de estos estadsticos
depender de cul sea el parmetro de inters de la poblacin. El verdadero parmetro ser desconocido, y un
objetivo ser estimar su valor.

Para estudiar la estimacin de un parmetro desconocido, debe considerarse dos posibilidades: Estimacin
puntual y estimacin por intervalo.

Parmetros y estadsticos

La media y la desviacin estndar de una variable aleatoria poblacional X son conocidos como
parmetros y la media x y la desviacin estndar s de una muestra son conocidos como estadsticos.
En general a cualquier caracterstica numrica de una poblacin se le conoce como parmetro y a cualquier
cantidad calculada de una muestra aleatoria se le conoce como estadstico. Los estadsticos se usan para
estimar parmetros.

Estimacin puntual

Es el valor calculado, a partir de la informacin de muestreo, que se emplea para estimar el parmetro de
poblacin.

El estadstico muestral usado para estimar un parmetro de la poblacin se llama estimador, y un valor
observado especfico se denomina estimacin.

Cuando la estimacin de un parmetro de la poblacin est dada solamente por un nmero, se denomina
estimacin puntual. Por ejemplo la media muestral x es un estimador de la media poblacional y un
valor simple de x es un estimacin puntual.

Se dice que:

75
Estadstica General ciclo 2013-I

x es el estimador puntual de la media poblacional


s es el estimador puntual de la desviacin estndar poblacional
p es el estimador puntual de la proporcin poblacional p.

Luego a los valores numricos obtenidos para x , s , p en una determinada muestra se les llama estimados
puntuales del parmetro.
Ejemplo:

A continuacin se muestra el salario anual de 10 trabajadores de una fbrica y los datos si concluyeron con
un programa de adiestramiento general:

Salario Programa de
anual ($) adiestramiento
Gerencial?
x1 9 094.3 Si
x2 3 263.9 Si
x3 9 643.5 Si
x4 9 984.9 Si
x5 7 621.6 No
x6 5924 Si
x7 9 092.3 No
x8 1 404.4 Si
x9 3 957.7 No
x 10 5 109.7 No

= = 6
509.63

= 9.09

S 3.01

0.4

Luego para una muestra de 10 trabajadores de una fbrica, el estimado puntual de es de $ 6 509.63 nuevos
soles, el de es de 3.01 y el de p es 0,4

Propiedades de los estimadores puntuales

Son tres: Insesgo, eficiencia, consistencia

Insesgo:

Si el valor esperado del estadstico de muestra es igual al parmetro poblacional que se estima, se dice que
este estadstico es un estimador insesgado del parmetro poblacional.

76
Estadstica General ciclo 2013-I

Eficiencia.

Suponga que se puede usar una muestra aleatoria simple de n elementos para obtener dos estimadores
puntuales del mismo parmetro poblacional. En este caso, preferiramos usar el estimador puntual con la
menor desviacin estndar, porque tiende a proporcionar estimados ms cercanos al parmetro poblacional.
Se dice que el estimador puntual con la menor desviacin estndar tiene una mayor eficiencia relativa que el
otro.

Consistencia.

En trminos generales un estimador puntual es consistente si sus valores tienden a acercarse al parmetro de
la poblacin conforme se incrementa el tamao de la muestra. En otras palabras, un tamao grande de muestra
tiende a proporcionar un mejor estimador puntual que un tamao pequeo

Estimacin por intervalo de confianza

Un intervalo de confianza, es una gama de valores obtenidos a partir de datos de muestreo, de modo que el
parmetro ocurre dentro de esta variedad de valores con una probabilidad pre establecida llamada nivel de
confianza.

Intervalo de confianza para la media de una poblacin normal: varianza poblacional conocida.

Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una poblacin con

distribucin normal con una media y una varianza . Si es conocida y el valor observado de la

media muestral es , entonces el intervalo de confianza del 100 (1- para la media poblacional,
viene dada por:

{ - Z +Z } = 1-

Error muestral

Es el valor absoluto de la diferencia entre un estimador puntual insesgado y el parmetro poblacional que
estima se llama error muestral.

Para el caso en el que la media de una muestra estima a una media poblacional, el error muestral es:

77
Estadstica General ciclo 2013-I

Ejemplo.-

Un proceso produce bolsas de azcar refinada. El peso del contenido de estas bolsas tiene una distribucin
normal con desviacin estndar de 15 gramos. Los contenidos de una muestra aleatoria de 25 bolsas tienen un
peso medio de 100 gramos. Calcule un intervalo de confianza del 95% para el verdadero peso medio de todas
las bolsas de azcar producidas por el proceso.

{x z

n
x+ z

n } = 1

{100 1,96 100 +1,96 } =0,95

{94.12

Intervalo de confianza para la media de una poblacin con varianza desconocida y tamao de muestra
grande

Supongamos que tenemos una muestra de n observaciones procedentes de una distribucin con media .

Sean y s la media y la desviacin estndar de la muestra observada, respectivamente, entonces si n es


grande, n 30 una buena aproximacin de un intervalo de confianza del 100 (1 )% para la media dada por:

78
Estadstica General ciclo 2013-I

{ z z } = 1

Ejemplo.-

Se extrajo una muestra aleatoria de 172 estudiantes de Agronoma y se les pidi que evaluasen unas
determinadas condiciones de trabajo en una escala de 1 (no importante) a 5 (extremadamente importante). La
seguridad de trabajo recibi una calificacin media de 4.38 con una desviacin estndar muestral de 0.70.
Calcule un intervalo de confianza del 99% para la media poblacional

{ z +z } = 1

{4.38 2.576 4.38 + 2.576 } = 0.95

{4.2427 } = 0,99

Intervalos de confianza para una proporcin de la poblacin

Una estimacin puntual para una proporcin poblacional se obtiene dividiendo el nmero de xitos de una
muestra entre el nmero total muestreado.

Mientras que para encontrar los intervalos de confianza debemos tener en cuenta lo siguiente:

{ z }=1

Como p no se conoce

Dnde: valor asignado por el nivel de confianza

79
Estadstica General ciclo 2013-I

es la proporcin muestral

n es el tamao de la muestra

Ejemplo.-

En una muestra aleatoria de 900 votantes, el 55 % prefiere al candidato demcrata de presidente. Halle un
intervalo de confianza aproximado para la proporcin de todos los votantes que prefieren al candidato
demcrata con un nivel de confianza del 90%

{ z }=1

0.0165

{ 1.645(0.0165)
}=1

{0.5229 }=1

Ejemplo.-

Se realiz una investigacin de mercado para estimar la proporcin de amas de casa que puedan reconocer la
marca de un limpiador con base en la forma y el color del recipiente. De 1400 personas 420 pudieron
reconocer (identificar) la marca del producto. Si se utiliza el grado de confianza del 99% Cul sern los
intervalos de confianza?

{ z }=1

80
Estadstica General ciclo 2013-I

0,30

0.0122

{ 2.576(0.0122) }=1

{0.2686 }=1

Intervalos de confianza usando la distribucin t

Cuando la poblacin bajo estudio tiene una distribucin normal, o aproximadamente normal, pero no se
conoce la desviacin estndar de la poblacin, y el tamao de la muestra es menor de 30, no podemos usar la
distribucin normal para determinar intervalos de confianza para la media de la poblacin. En este caso
usaremos la distribucin t se Student.

Recordemos que la distribucin de t de Student se utiliza cuando se cumple con las siguientes condiciones.

1.- La muestra es pequea

2.- desconocida
3.- La poblacin es normal.

Caractersticas de la distribucin t de Student


La distribucin t de Student fue desarrollada en 1908 por William S. Gossett, un maestro cervecero de la
Guinness Brewey de Irlanda, quien public su investigacin con el seudnimo de Student. Gossett desarroll
una nueva teora estadstica sobre muestras pequeas al trabajar con muestras pequeas y en experimentos
donde intervenan temperaturas en esta cerveza. A l le interesaba el comportamiento exacto de la expresin:

Cuando s deba usarse como estimador de . En particular le preocupaba la discrepancia entre s y


cuando se calculaba s a partir de una muestra pequea.

Al igual que la distribucin normal estandarizada, la distribucin t tiene forma de campaa y es simtrica
alrededor de la media cero, pero es ms achatada que la distribucin normal estandarizada debido a su mayor
dispersin.

La distribucin t tiene las siguientes caractersticas:

1.- Al igual que la distribucin Z, la distribucin t es una distribucin de variable continua.


2.- Es acampanada y simtrica
3.- No hay una sola distribucin t, sino una familia de distribuciones t.

81
Estadstica General ciclo 2013-I

4.- La distribucin t es ms extendida y menos aguda en el centro, que la distribucin Z. Sin embargo a
medida que n aumenta la curva de la distribucin t se aproxima a la distribucin normal estandarizada.

El intervalo de confianza para la media poblacional usando la distribucin t, est dado por:

.{ S + S }=1

{ + }=1

Ejemplo.-

Una tienda est interesada en conocer los gastos en prendas de vestir de los estudiantes universitarios en el
primer mes del ciclo acadmico. La media y la desviacin estndar de una muestra aleatoria de nueve
alumnos fueron de $ 15 782 y $ 3889, respectivamente. Suponiendo que la poblacin sigue una distribucin
normal, calcule el intervalo de confianza del 95% para el gasto medio poblacional.

{ S + S }=1

{ + }=1

En las tablas 2.3060

{157822.3060 +2.3060 }=1

{12792.65554 }=1

Intervalo de confianza para la varianza de una poblacin normal.

82
Estadstica General ciclo 2013-I

Cuando una variable aleatoria sigue una distribucin de Chi cuadrado con (n-1). Este resultado es clave para
construir un intervalo de confianza para la varianza poblacional cuando se toman muestras de una poblacin
normal.

Supongamos que se dispone de una muestra aleatoria de n observaciones procedentes de una poblacin con

distribucin normal con varianza . Si la varianza muestral observada es , entonces el intervalo de

confianza del 100(1- para la varianza poblacional viene dado por

Ejemplo

Un fabricante quiere estimar la variabilidad de los niveles de impurezas de los envos de materia prima de un
determinado proveedor. Extrae para ello una muestra de quince envos y comprueba que la desviacin
estndar muestral en la concentracin de los niveles de impurezas es de 2.36%. Supngase que la poblacin es
normal.

a.- Calcule el intervalo de confianza del 95% para la varianza poblacional.

b.- Sin hacer los clculos, determine si un intervalo de confianza del 99% tendra una longitud mayor, menor
o igual a la del intervalo calculado anteriormente

Solucin

a.- n 15 g.l. 14

0.05

83
Estadstica General ciclo 2013-I

2.99 13.85

Por lo tanto, diremos que el intervalo de confianza del 95% para la variabilidad de impurezas discurre entre
2.99% y 13.85%

b.- El intervalo de confianza del 99% para la varianza poblacional ser ms ancho

Estimacin por intervalo para la diferencia entre dos medias poblacionales

Se puede hacer comparaciones como:

El promedio de dimetros de tallos de plantas tratadas dos tipos diferentes de nutrientes.

Las producciones promedio en una planta qumica que usa materias primas suministradas por dos proveedores
diferentes.

Cuando muestras aleatorias independientes de tamao n1 y n2 observaciones han sido seleccionadas de entre
2 2
poblaciones con medias 1 y 2 y variancias 1 y 2 respectivamente, la prueba estadstica ser

( x1 x2 ) ( 1 2)

21 22
Z=
+
n1 n2
2 2
Pero si n1 y n2 son grandes (mayores de 30) y 1 , 2 no se conocen, el estimador del estadstico ser

( x1 x2 ) ( 1 2)

s21 s22
Z=
+
n1 n2

El intervalo de confianza en este caso ser:

{ ( x 1x 2 ) z
21 22
+ ( x1 x2 ) + z
n1 n 2 1 2 21 22
+
n1 n 2
} =1-

2 2
En caso de que las muestras sean grandes (mayores de 30) y 1 , 2 no se conocen, el intervalo se podr
calcular de la siguiente forma:


2 2 2 2
s 1 s2 s 1 s2
{ ( x 1x 2 ) z + ( x 1x 2 ) + z + } =1-
n1 n2 1 2 n 1 n2

84
Estadstica General ciclo 2013-I

Ejemplo:

Las resistencia al desgaste de dos tipos de llantas para automvil se compararon en muestras de pruebas de
camino de n1 = n2 = 100 llantas para cada tipo. El nmero de millas hasta el completo desgaste se
defini como una cantidad especfica de desgaste de las llantas. Los resultados de la prueba se muestran a
continuacin

LLANTA 1 LLANTA 2
X 1=26400 Millas X 2=25100millas
2 2
S 1=144000 S 2=1960000

Estime (1 - 2), la diferencia en la media de millas hasta el completo desgaste, usando un intervalo de
confianza del 99%. Hay diferencia en el promedio de calidad de desgaste para los dos tipos de llantas?


Solucin: La estimacin puntual de ( 1 2)

es ( x 1x 2 ) = 26 400 25100 = 1300 millas

El error estndar =
21 22
+
n1 n 2


2 2
s1 s1
Que se puede estimar como = +
n1 n 2

=
1440 000 1960 000
100
+
100
= 184,4 millas

El intervalo de confianza se calcula como:

{ ( x 1x 2 ) z
s 21 s22
+ ( x 1x 2 ) + z
n1 n2 1 2 s 21 s22
+
n1 n2
} =1- {

1300-2,58
1440 000 1960 000
100
+
100
1 2 1300+2,58
1440 000 1960 000 }= 0,99
100
+
100

{1300 2,58(184,4) 12 1300+2,58(184,4)} = 0,99

{824,2 12 1775,8 } = 0,99

Estimacin por intervalo de la diferencia entre dos proporciones poblacionales

85
Estadstica General ciclo 2013-I

Se pueden hacer comparaciones como:

Los porcentajes de germinacin se semillas tratadas y semillas no tratadas con un fungicida


La proporcin de votantes mujeres y la proporcin de votantes hombres que estn a favor de una enmienda de
igualdad de derechos
Suponga que las muestras aleatorias independientes de las observaciones n1 y n 2 han sido seleccionadas
de poblaciones con parmetros p1 y p2 , respectivamente La distribucin muestral de la diferencia entre
proporciones muestrales:

x1 x2
( ^p 1 ^p 2) (
n1 n2 )
La media muestral de ( ^p 1 - ^p 2) es p1 p2

El error estndar es=


p1 q1 p2 q2
n1
+
n2

Que se estima como =


^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2

La estimacin puntual:

{
( ^p 1 ^p 2 ) Z
^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2
< p 1 p 2< ( ^p 1 ^p 2 )+ Z
n1
+

^p 1 q^ 1 ^p 2 q^ 2
n2 } =1
Ejemplo: La propuesta de un bono para la construccin de una escuela ser enviada a los votantes en la
siguiente eleccin municipal. Una parte importante del dinero derivado de esta emisin de bonos se emplear
en construir escuelas en una zona de rpido desarrollo de la ciudad y lo dems se usar para renovar y
actualizar los edificios escolares del resto de sta. Para evaluar la viabilidad de la propuesta de un bono, a una
muestra aleatoria de n1=50 residentes de la zona de rpido desarrollo y n2= 100 de las otras
partes de la ciudad, se les pregunt si piensan votar por la propuesta. Los resultados se dan a continuacin:

Seccin en Resto de la ciudad


desarrollo
Tamao muestral 50 100
Nmero a favor de la propuesta 38 65
Proporcin a favor de la propuesta 0.76 0.65

Estime la diferencia en las proporciones verdaderas a favor de la propuesta del bono con un 99% de intervalo
de confianza.
( ^p 1 ^p 2) = 0,76 0,65 = 0,11

^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2 50
(0.76)(0,24) ( 0,65 ) (0,35)
= +
100
= 0,0770

{ ( ^p 1 ^p 2 ) Z
^p 1 q^ 1 ^p 2 q^ 2
n1
+
n2
< p 1 p 2< ( ^p 1 ^p 2 )+ Z
n1
+
n2
^p 1 q^ 1 ^p 2 q^ 2
= 1
}
86
Estadstica General ciclo 2013-I

{ 0,11 ( 2,58 ) (0,0770)< p 1 p 2<0,11+ ( 2,58 ) (0,0770)}=0,99


{ 0,089< p 1 p 2<0,309 }=0,99

87

Das könnte Ihnen auch gefallen