Beruflich Dokumente
Kultur Dokumente
Estadística l
Guía didáctica
4 créditos
Titulaciones Ciclo
� Licenciado en Psicología VI
Autor:
Mg. Carlos Correa Granda
Estimado estudiante recuerde que la presente guía didáctica está disponible en el EVA en formato PDF interactivo,
lo que le permitirá acceder en línea a todos los recursos educativos.
Asesoría virtual:
www.utpl.edu.ec
ESTADÍSTICA I
Guía didáctica
Carlos Correa Granda
CC Ecuador 3.0 By NC ND
Diagramación, diseño e impresión:
Ediloja Cía. Ltda.
Telefax: 593-7-2611418
San Cayetano Alto s/n
www.ediloja.com.ec
edilojainfo@ediloja.com.ec
Loja-Ecuador
Quinta edición
Primera reimpresión
ISBN-978-9942-08-531-3
Esta versión digital ha sido acreditada bajo la licencia Creative Commons Ecuador 3.0 de reconocimiento -no comercial- sin obras derivadas;
la cual permite copiar, distribuir y comunicar públicamente la obra, mientras se reconozca la autoría original, no se utilice con fines comerciales
ni se realicen obras derivadas. http://www.creativecommons.org/licences/by-nc-nd/3.0/ec/
Octubre, 2014
2. Índice
2. Índice................................................................................................................................................ 3
3. Introducción.................................................................................................................................. 5
4. Bibliografía.................................................................................................................................... 7
4.1. Básica............................................................................................................................... 7
4.2. Complementaria............................................................................................................ 7
5. Orientaciones generales para el estudio....................................................................... 9
5.1. Generales........................................................................................................................ 9
5.2. Específicas....................................................................................................................... 9
6. Proceso de enseñanza-aprendizaje para el logro de competencias................ 11
PRIMER BIMESTRE
SEGUNDO BIMESTRE
3. Introducción
El estudio de la estadística, como componente educativo, reviste gran importancia si nos remontamos en
primer lugar a su origen, pues desde tiempos inmemoriales se vienen utilizando las distintas herramientas
que han servido para llegar a recoger información, organizarla, clasificarla para posteriormente llegar
a describirla y tomar decisiones futuras. Esto generalmente se podía observar cuando se tomaban
decisiones para la administración de un Estado o nación, por ello su nombre se deriva del Estado.
Luego habremos de analizar que en nuestra vida diaria estamos empleando herramientas estadísticas,
lo que implica por tanto que en todos los campos de la actividad humana tenga vigencia su aplicación,
identificando de esta manera la importancia que tiene su estudio y la aplicabilidad en los diferentes
campos de actividad humana. Solo por citar unos ejemplos, la encontramos en la medicina, en el
deporte, en la cocina, en los negocios, etc.
En esta ocasión desarrollaremos la primera parte de la estadística, esto es la estadística descriptiva, como
base para continuar con el estudio de la estadística inductiva o inferencial que se realizará en el siguiente
semestre.
Es así que nos dedicaremos a conocer la forma de recoger información, organizarla, clasificarla para
llegar a describirla con sus características puntuales, de igual manera será la oportunidad para conocer
que la descripción de las características de un conjunto de datos, implica el cálculo de indicadores, de
manera que podamos obtener valores representativos de todo el conjunto.
Tendremos la oportunidad de iniciar el análisis de la estadística inductiva, a través del tratamiento de las
probabilidades, desde sus definiciones básicas hasta llegar a comprender el uso y la aplicabilidad de las
distribuciones de probabilidad.
Estructuralmente podemos decir que durante el primer bimestre se abordarán los temas referentes
al ámbito introductorio hasta el tratamiento de las medidas de tendencia central, luego para el
segundo bimestre continuaremos con las medidas descriptivas analizando las medidas de dispersión.
Posteriormente nos insertaremos en el tratamiento de las probabilidades llegando hasta las distribuciones
de probabilidad.
Le invito a iniciar este estudio que no reviste mayor dificultad, pues, aunque se requiera tener una base
matemática, se podría decir que es lo elemental, lo importante es que llevemos un estudio sistemático
de manera que todos los conocimientos tengan un encadenamiento. Por este motivo le sugiero que
antes de revisar el tema siguiente se debe analizar lo conocido del anterior, para ello es importante el
5
Guía didáctica: Estadística I
desarrollo de las autoevaluaciones, de esta forma se podrá dar cuenta de qué es lo que conoce y qué es
aquello que le falta por revisar.
Siempre estamos dispuestos a prestarle la ayuda que requiera despejando las dudas que tenga sobre
cualquiera de los temas que vamos abordando, recuerde siempre que lo importante es preguntar aquello
que no sabemos o que a lo mejor nos está dando mayor dificultad. En el caso de este componente
educativo, tanto el autor de la guía como los profesores asesores de las correspondientes titulaciones
estamos listos para prestarle la asesoría necesaria.
Finalmente, le recuerdo que si bien no se puede constituir en un requisito legal, con este componente
educativo habrá adquirido las competencias necesarias para tomar el componente educativo Estadística
II.
6
Guía didáctica: Estadística I
4. Bibliografía
4.1. Básica
¾¾ Lind, D., Marchal, W. y Wathen, S. (2012). Estadística aplicada a los negocios y la economía. México,
D.F.: Editorial McGraw–Hill S.A.
Es un texto que cubre los métodos básicos de estadística descriptiva e inferencial, así como todos los
procesos de decisión y análisis de resultados.
Su presentación de forma clara y didáctica permite que el estudiante vaya desarrollando su proceso
de aprendizaje de manera adecuada, resulta de gran utilidad cuando el aprendizaje se realiza con
autonomía.
Las diferentes secciones se encuentran claramente diferenciadas por colores de manera que el estudiante
puede considerar los aspectos que son importantes en cada uno de los temas, de igual manera al
finalizar las secciones se realiza una revisión de los temas abordados en los diferentes capítulos, así
mismo encuentra actividades de autoevaluación que le permitirán al lector ir realizando un análisis de
los conocimientos adquiridos en cada temática desarrollada.
Este documento se convierte en el sustituto de la presencia del profesor, de manera que en su desarrollo
se ha priorizado el diálogo didáctico entre el profesor y el estudiante. Contiene varias explicaciones
adicionales que el texto básico posiblemente no las tiene o en su defecto pueden resultar un poco
complicadas para el estudiante.
4.2. Complementaria
• Anderson, D., Sweeney, D., y Williams, T. (2008). Estadística para administración y economía. México
D.F.: Cengage Learning Editores S.A.
Los contenidos del texto se encuentran desarrollados clara y didácticamente, de tal manera que
le ayudarán mucho en la comprensión de los temas. Al finalizar cada unidad va a encontrar algunos
ejercicios de autoexamen que le sirven para identificar el avance en la comprensión de los temas.
• Berenson, M., Levine, D., y Krenbhiel, T. (2001). Estadística para administración. México D.F.: Editorial
Pearson Educación.
Sus contenidos se encuentran sistemáticamente organizados y mantiene una gran cantidad de ejercicios
resueltos de manera que el lector puede ir comprendiendo la forma de resolver, los métodos que se han
7
Guía didáctica: Estadística I
empleado y sobre todo el uso y aplicación de los elementos recogidos en una investigación, de modo
que se encuentra en capacidad de analizar los resultados obtenidos.
En este texto se podrán revisar especialmente los temas referentes a las probabilidades, en él encontrará
una serie de ejercicios propuestos así como ejercicios resueltos explicados paso a paso.
• Webster, Allen (2000). Estadística aplicada a los negocios y a la economía. Santa Fe de Bogotá:
Editorial McGraw–Hill S.A.
Es un texto que contiene gran cantidad de ejercicios resueltos y propuestos, además en los segmentos
finales de cada capítulo proporciona sitios Web que el lector puede consultar para encontrar datos e
información que puede utilizar para complementar su estudio.
8
Guía didáctica: Estadística I
En esta ocasión, me permito hacerle algunas sugerencias que contribuirán para el éxito en los estudios
de este componente educativo, las cuales se resumen de la siguiente manera:
5.1. Generales
• Siga paso a paso las sugerencias que se realizan en el texto básico y en esta guía didáctica para
que vaya tomando experiencia, a veces pueden parecer procedimientos muy sencillos pero son
necesarios hasta lograr la experiencia suficiente para que en lo posterior se puedan obviar dichos
procesos.
• Recuerde que es necesario trabajar de manera sistemática, de modo que no pase a otro tema
sin haber conocido el anterior, como le había manifestado en la introducción, es importante
desarrollar las autoevaluaciones que constan al final de cada unidad, pues, éste es un estudio
ordenado, sistemático y progresivo.
• Otro aspecto que debemos considerar es la presentación de los trabajos a distancia, una buena
presentación y la puntualidad en la entrega, habla muy claramente del proceso de aprendizaje
que va llevando un estudiante. Cuidemos estos dos aspectos que son muy importantes.
5.2. Específicas
• Para el aprendizaje de este componente educativo, es necesario que usted dedique diariamente
por lo menos una hora a la revisión del texto básico y la guía didáctica, de manera que se puedan
abordar los temas en forma secuencial.
• Le recomiendo contar con material adicional como es un cuaderno de apuntes, con la finalidad de
que vaya realizando cuadros resumen de los temas y en cada uno de ellos se realicen actividades
adicionales como son los ejercicios resueltos y propuestos que constan en el texto básico.
• Cualquier inquietud que se le presente en la revisión de los temas, anótelas para que luego las
transfiera al profesor sea en forma telefónica o a través del EVA enviando correos electrónicos. Si
alguna respuesta no está lo suficientemente clara, vuelva a insistir a fin de que usted resuelva sus
inquietudes.
9
Guía didáctica: Estadística I
• Tome en cuenta las sugerencias sobre las técnicas de estudio que usted aprendió en el componente
educativo de Metodología de Estudio, para que pueda llevar en forma adecuada los estudios no
solo de este componente sino de todos los demás en los que se encuentra matriculado.
• Mientras más ejercicios realice, usted estará asegurándose la comprensión del tema en estudio y
estará preparado para continuar con el siguiente.
En esta parte, finalmente lo que me resta decirle es que la estadística en sí no es difícil, es un componente
educativo que usted lo vive a diario y que puede ir relacionando todos los elementos y herramientas con
su actividad, esto le permite comprender que el uso de ella no es exclusivo de los negocios, sino que es
aplicable a todos los campos del quehacer humano.
Nota importante:
Por su participación en ciertas actividades del EVA en cada bimestre,
usted podrá obtener un punto que complementará la nota obtenida en la
evaluación a distancia; esto quiere decir que si obtiene menos de 6 puntos,
podrá incrementar su nota (hasta 6 puntos) por medio de la participación y los
ejercicios que su tutor(a) le propondrá en el EVA.
10
6. Proceso de enseñanza-aprendizaje para el logro de competencias
PRIMER BIMESTRE
11
1.7. Niveles de medición de la evaluación a
distancia.
Competencias específicas Competencias específicas del Contenidos Actividades de Indicadores de Tiempo de
de titulación componente educativo Unidades aprendizaje aprendizaje dedicación
12
UNIDAD 2: Distribuciones de frecuencia ¾¾ Revisión de la guía Organiza Semanas 3 y 4
• Aplica los conceptos y representaciones gráficas didáctica. información y la
presenta mediante Ocho horas de
estadísticos básicos
Guía didáctica: Estadística I
3.2.4. Moda
3.2.4.1. Definición
3.2.4.2. Características
3.2.4.3. Formas de cálculo
3.2.6.1. Definición
3.2.6.2. Características
3.2.6.3. Formas de cálculo
¾¾ Preparación para la
primera evaluación Ocho horas de
presencial parcial . interacción
13
Guía didáctica: Estadística I
Autoevaluación *
Evaluación a Evaluación
distancia ** presencial
3. Coevaluación
Interacción en el EVA
Parte de ensayo
Prueba objetiva
Parte objetiva
1.
Competencia: criterio
Comportamiento ético x x x x x
Cumplimiento, puntualidad,
Actitudes
x x x x x
responsabilidad
Esfuerzo e interés en los trabajos x x x x x
Respeto a las personas y a las
x
normas de comunicación
Creatividad e iniciativa x x
Habilidades
Contribución en el trabajo
x
colaborativo y de equipo
Presentación, orden y ortografía x x
Emite juicios de valor
x x
argumentadamente
Dominio del contenido x x x x x
Conocimientos
presenciales y en el
distancia)***
evaluación a
(completa la
Puntaje 2 4 6 14
Actividades
EVA
TOTAL 20 puntos
Para aprobar la asignatura se requiere obtener un puntaje mínimo de 28/40 puntos, que equivale al 70%.
* Son estrategias de aprendizaje, no tienen calificación; pero debe responderlas con el fin de autocomprobar su
proceso de aprendizaje.
** Recuerde que la evaluación a distancia consta de dos partes: una objetiva y otra de ensayo, debe desarrollarla y
entregarla en su respectivo centro universitario.
*** Su tutor(a) le planteará una o más actividades en el EVA que serán calificadas por un punto en total. Este solo
computará para complementar la nota del trabajo a distancia, es decir, si Ud. logra menos de seis puntos en el mismo
podrá aumentar dicha nota (hasta completar los 6 puntos) con esas actividades en el EVA.
Señor estudiante:
14
Guía didáctica: Estadística I
Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo
1 del texto básico.
1.1. Introducción
Como habrá podido comprender en este momento introductorio, el autor nos lleva a deliberar sobre
la importancia que tiene el estudio de la Estadística y nos acerca a la reflexión sobre los ámbitos de
aplicación, allí hemos podido observar que este componente educativo nos permite contar con
herramientas suficientes para tomar decisiones sobre diferentes tópicos.
Comprender los fundamentos de la estadística como ciencia, nos permitirá mantener bases suficientes
para llegar a trabajar con las distintas herramientas e instrumentos que luego nos facilitarán la
comprensión, descripción y caracterización de un conjunto de datos investigados.
Al revisar el texto básico, vemos que esta parte se encuentra desarrollada posteriormente a las razones
por las que se debe estudiar estadística, aquí lo hacemos primero, para iniciar entendiendo su significado.
¿Está de acuerdo en que la idea central se relaciona con el tratamiento de información numérica?
¿Le parece a usted que podríamos definir a la estadística como la ciencia que nos proporciona los elementos
de juicio necesarios para llegar a tomar decisiones adecuadas?, si está de acuerdo, reflexione sobre las
razones que le llevan a estarlo; si no lo está también reflexione sobre la definición adecuada y regrese al
texto para constatarlo.
De las diferentes formas de enunciar lo que significa la estadística, realice ahora un cuadro sinóptico en
el que se resuman las ideas claves que se observan en cualquiera de las definiciones encontradas. Para
ello lea detenidamente este acápite que se encuentra en el texto básico y reflexione sobre los distintos
ejemplos que se han planteado allí.
Ahora que ya hemos podido enunciar una definición sobre la estadística, veamos las razones que
justifican el inicio de su estudio. Lea este apartado en el capítulo 1 del texto básico que se encuentra
posterior a la introducción que se realiza por parte de los autores.
15
Guía didáctica: Estadística I
Después de leer cada uno de los ejemplos y explicaciones que se brindan, puede ahora resumir las 3
razones por las que se debe estudiar estadística, diciendo que:
2. Las técnicas estadísticas se emplean para tomar decisiones que afectan a la vida diaria
3. El estudio de la estadística permite comprender las razones por las cuales se toman ciertas
decisiones en los diferentes ámbitos y campos de aplicación.
Muy bien, usted conoce ahora por qué es necesario e importante realizar este estudio.
Ahora que ya hemos definido y sabemos por qué vamos a estudiar, ampliemos un poco más hacia donde
se dirige y cómo se subdivide la estadística.
Podemos identificar dos grandes áreas en las que se divide a las ciencias estadísticas, la estadística
descriptiva y la estadística inferencial.
Le invito a realizar una lectura sobre esta parte y a elaborar en su cuaderno de trabajo, un cuadro resumen
de los tipos de estadística, conforme al que se presenta a continuación.
Una vez identificadas las principales características de cada uno de los tipos de estadística, podemos
afirmar que no reviste mayor complicación su estudio.
Conviene también destacar que en el caso de la estadística inferencial se deben considerar dos conceptos
fundamentales: la población y la muestra.
Gráficamente podemos representar de esta manera a los conceptos, ahora usted puede describirlos,
con la ayuda de su lectura en el texto básico y también le invito a que formulemos algunos ejemplos al
respecto.
16
Guía didáctica: Estadística I
Población
Parámetros: media
aritmética, etc.
Muestra
Estadísticos o estadígrafos:
media aritmética, etc.
Al revisar el texto básico, usted podrá extraer también sus conclusiones al respecto, sin embargo, podría
decir que la respuesta a esta pregunta tiene diferentes análisis:
a. Si analizamos la factibilidad de trabajar, analizar a todos los elementos que componen la población
objeto de estudio, podría volverse un asunto engorroso que puede llevar a confusiones y por
tanto no llegar a conclusiones válidas.
b. Por el tiempo disponible, el trabajar con todos los elementos de la población implica considerar
una cantidad de tiempo mayor que quizá cuando se aborde a las conclusiones ya no tengan
validez.
c. Por el costo, también es un aspecto a meditar, cuando se trabaja con todos los elementos de la
población, significa que se deba disponer de una gran cantidad de recursos y ello determina que
el costo de la investigación sea demasiado alto y no exista el presupuesto suficiente para ello.
Aunque en los temas posteriores se hace una explicación de estos dos conceptos siguientes, aprovechando
que ya hemos definido una muestra y una población, vamos a decir que cuando trabajamos con datos
muestrales, las características que se extraen de ella se denominan estadísticos o estadígrafos, mientras
que cuando se trabaja con datos poblacionales las características se denominan parámetros.
Otros elementos que debemos recordar y saber diferenciar a la hora de trabajar con un conjunto de
datos es la variable utilizada.
Para comprender bien lo que significa una variable realice una lectura detenida en el texto básico, sobre
este tema que es de mucha importancia, porque después de comprender el enunciado usted estará en
capacidad de saber diferenciar cada una de las variables con las que se encuentra trabajando.
Correcto, ya ha definido lo que es una variable, pues como su nombre lo indica será todo aquello que
cambia de un momento a otro o de un lugar a otro.
17
Guía didáctica: Estadística I
Pero, también cuando hablamos de variables debemos diferenciar los tipos de variables existentes. Aquí
identificamos dos grandes grupos de variables: cuantitativas y cualitativas.
En el texto básico, el gráfico 1.2 nos presenta un resumen de los tipos de variables y nos entrega además
ejemplos de cada una de ellas.
Puede hacer usted un cuadro sinóptico en donde además se observen las características de cada uno de
los tipos y ejemplificar cada uno de ellos.
Muy bien, con esto hemos clarificado el tipo de variable y la podemos inmediatamente identificar.
Ahora, hemos hablado de las variables pero ¿cómo es que podemos llegar a obtener esta información
cuando se está investigando?
Esta parte no se encuentra desarrollada en el texto básico por eso me permito desarrollarla a continuación,
para lo cual, le sugiero que vaya subrayando las ideas principales, y recuerde cuando usted ha sido parte
de la construcción de información sobre un determinado tema.
Como hemos afirmado anteriormente, una de las razones por las cuales se estudia la estadística,
es precisamente porque en toda actividad se genera información, sea de tipo cualitativo o de tipo
cuantitativo, como hemos además visto al referirnos a las variables.
Reconocemos que existen dos caminos, una el levantarla directamente del objeto que se está
investigando y la otra, es el recoger información que previamente ha sido ya trabajada y que ya consta
en otras publicaciones, por ello la distinguimos de acuerdo a su procedencia en: primaria y secundaria.
Fuentes primarias: son aquellas que nos proporcionan información directamente desde el objeto de
estudio, para obtenerla, se pueden utilizar:
• Encuestas
• Entrevistas
• Datos recogidos de laboratorio
• Censos
Por ejemplo, si se realiza una encuesta a los consumidores de un producto que está siendo investigado,
los datos que se recogen se constituyen en datos primarios puesto que se ha recurrido a la fuente que
directamente nos otorga los datos. Estos datos se encuentran, si cabe el término, en “bruto”, a partir de lo
cual se inicia el proceso de clasificación, organización, presentación, sea en tablas o en gráficas.
Fuentes secundarias: son aquellas que nos proporcionan información que ha sido previamente
elaborada por otras personas y se encuentran generalmente en:
• Informes escritos
• Revistas
• Periódicos
18
Guía didáctica: Estadística I
• Diferentes publicaciones
• Boletines, etc.
Por ejemplo, si se toma un boletín estadístico del Banco Central, allí podremos encontrar información
que ya ha sido procesada y podemos trabajar con esos datos para establecer promedios o características
adicionales sobre el tema que nos interesa analizar.
En una investigación se puede utilizar tanto fuentes primarias como fuentes secundarias, si nos interesa
no solo describir información sino además relacionar con datos previamente trabajados por otras
organizaciones o personas.
Retomemos la lectura del texto básico para hablar de las variables y la forma en la que se encuentran
expresadas.
Lea detenidamente el acápite sobre los niveles de medición que se encuentra en el texto básico.
Una vez que ha identificado las características de los niveles de medición de las variables, realice un
análisis del gráfico 1.3 en donde se presenta en forma resumida lo concerniente a los niveles de medición
y enuncie alguna otra característica que no conste en el mismo cuadro.
Amplíe el gráfico ubicando los ejemplos sobre variables con cada uno de los niveles de medición.
Ejercicios
Al concluir este tema (1.6 del texto), encontrará ejercicios que le propongo los realice para afirmar los
conocimientos de los temas analizados (ejercicios del 1 al 4).
Actividades recomendadas
El estudio de la estadística requiere poner en práctica cada uno de los temas y conceptos definidos,
y como hemos dicho la estadística es una ciencia que no tiene ningún campo de acción específico o
propio, por ello en cada actividad humana encontramos información numérica.
Hemos concluido con el estudio de la primera unidad, es hora de constatar nuestros avances a través del
desarrollo de la siguiente autoevaluación.
19
Guía didáctica: Estadística I
Autoevaluación 1
A. Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son verdaderas
o falsas respectivamente.
2. ( ) Una de las razones para estudiar estadística es que permite comprender la razón
de las decisiones que se toman y proporciona un entendimiento mayor de la forma
como estas afectan.
4. ( ) Una muestra es aquella parte de la población que reúne todas las características
representativas de la población.
5. ( ) Las variables continuas son aquellas que se originan en la enumeración o el conteo y,
por lo tanto, no pueden tomar valores intermedios.
7. ( ) Una de las propiedades del nivel de medición nominal indica que las categorías de
datos se encuentran representadas por etiquetas o nombres.
8. ( ) En los datos de nivel de intervalo, el punto cero representa la ausencia de características
y la razón entre dos números es significativa.
9. ( ) Cuando se distinguen a los automóviles por la marca, hemos medido los datos en
forma nominal.
Importante: puede revisar la solución a esta evaluación al final de esta guía. Asegúrese de haber
contestado bien a cada una de las preguntas. Si no ha sido así, entonces vuelva a revisar la guía y el texto
básico.
Para recordar:
Hasta aquí hemos analizado y conocemos los fundamentos y las razones por las cuales es importante el estudio
de la estadística. También hemos llegado a comprender cómo se define y de qué manera se ha clasificado,
llegando a un concepto clave de lo que es una VARIABLE.
El punto de partida en el tratamiento de una investigación es la identificación de la variable con la que se está
trabajando y el tipo de variable.
Una vez que hemos recogido la información, pasemos a la siguiente unidad a organizarla y presentarla.
20
Guía didáctica: Estadística I
Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo
2 del texto básico.
2.1. Introducción
Una vez que hemos llegado a comprender los elementos iniciales del estudio de la estadística, vamos a
iniciar el tratamiento de las herramientas que nos permiten llegar a cumplir con su objetivo.
Conforme habíamos indicado, la estadística nos permite llegar a recoger, organizar, clasificar y presentar
los datos.
Cuando tenemos pocos datos, su análisis es sencillo, de manera que no reviste mayor dificultad y no es
necesario establecer ningún proceso adicional para presentarlos.
De igual manera si existen datos con pocos valores de la variable los podemos presentar a través de
una SERIE ORDENADA, por ejemplo, si en un grupo de 30 alumnos las calificaciones obtenidas en un
determinado examen son las siguientes:
15, 12, 16, 18, 14, 15, 12 , 19, 20 , 14, 16, 18, 15, 18, 19, 20, 17, 13, 16, 14, 14, 17, 16, 15, 12, 15, 16, 18, 19, 18
Procedemos primero a ordenar los datos, generalmente lo hacemos en orden ascendente. Rellene usted,
los cuadros con cada uno de los valores:
Xmáx = 20 y Xmin. = 12
Con ello podemos determinar que la variable recorre 9 puestos incluidos los valores máximo y mínimo.
Si contamos los puestos o hacemos la diferencia y sumamos 1, esto se denomina amplitud de variación,
rango o recorrido:
AV = 20 – 12 + 1 = 9
Si el rango o recorrido es menor que 15, se puede trabajar con una serie ordenada de frecuencias, por lo
que los datos quedarían de la siguiente manera:
21
Guía didáctica: Estadística I
Tabla 1
Como vemos, este caso no reviste mayor dificultad, pues lo importante es llegar a determinar la posibilidad
de presentar los datos de esta manera, considerando que se lo puede hacer solamente cuando el rango
o recorrido no es mayor a 15.
De igual manera podemos proceder cuando tenemos un conjunto de datos cuya variable es cualitativa,
en donde a cada una de las categorías le corresponderá una frecuencia.
Por ejemplo, si queremos presentar un informe que nos diga que en una concesionaria de vehículos en
el mes de septiembre del año 2012 se han registrado las siguientes ventas por cada marca: Mazda 15,
Chevrolet 21, Toyota 18 y Nissan 35. Para apreciar mejor la información detallada, la podemos presentar
a través del siguiente cuadro:
Vehículos
Marca
vendidos
Mazda 15
Chevrolet 21
Toyota 18
Nissan 35
Total 89
Cuando tenemos una mayor cantidad de información y la variable recorre un mayor número de
posiciones desde el valor menor hasta el mayor, es necesario llegar a presentarla de manera resumida,
por lo que recurrimos a la construcción de tablas de frecuencia, que permiten llegar a identificar las
características del conjunto de datos.
Para ello es necesario acudir a varios pasos que los detallo en el siguiente apartado.
22
Guía didáctica: Estadística I
Para trabajar esta parte realice una lectura comprensiva del tema que se encuentra desarrollado en
el texto básico y trate de enunciar una definición propia sobre lo que significa una distribución de
frecuencias.
¿Encontró usted que para definir tuvo que referirse a los siguientes elementos?:
Veamos cada uno de ellos, con mayor detalle y con su procedimiento correspondiente, ya que en el texto
se encuentran explicados de manera muy general:
a. Rango, recorrido o amplitud de variación: identifica el número de puestos que recorre la variable
desde el valor mínimo hasta el valor máximo. En este momento consideremos dos casos:
AV = H – L Variable continua
23
Guía didáctica: Estadística I
b. Intervalos de clase o categorías: corresponde a cada uno de los niveles, clases o categorías en los
que se distribuye la variable.
c. Límites de clase: son los límites de los intervalos y por ello vamos a tener el límite inferior y el
límite superior. Cuando la variable es continua el límite superior es igual al límite inferior de la
siguiente clase o intervalo, en cambio cuando se trata de una variable discreta, el límite superior
de una clase es diferente al límite inferior de la siguiente.
Especialmente cuando se está trabajando con una variable discreta, y se requiere volverla continua a
la distribución, se identifican los límites reales de clase, que se los obtiene restando la media unidad al
límite inferior y sumando la media unidad de la variable al límite superior. De esta manera observaremos
que los límites superior e inferior de la clase inmediata son iguales.
Otra manera de establecer los límites reales es a través de la semisuma entre los límites superior de una
clase e inferior de la siguiente, por ejemplo:
Si tenemos los siguientes intervalos, podemos llegar a establecer los límites reales:
Tabla 3
En el ejemplo anterior como la variable cambia en la unidad, entonces se va sumando y restando 0,5. Si
la variable tuviera una separación de 0,1 entonces se debería sumar y restar 0,05 y así hay que considerar
la variable con la que se encuentre trabajando.
d. Número de clases: las clases o intervalos corresponden a cada uno de los niveles en los que se va a
presentar a todo el conjunto de observaciones, vienen a constituirse en cada una de las categorías
en las que se distribuyen los datos recogidos en la investigación.
No existe una norma para definir exactamente cuántas clases se deberían construir, puesto que esto
depende de la información que se haya recogido. Sin embargo, como el objetivo de toda distribución
de frecuencias consiste en presentar de forma resumida una información, se aconseja que no sean
menos de 5 ni más de 20, esto ¿por qué razón?: si hacemos una distribución con menos de 5 intervalos
se pueden perder rasgos o características del conjunto investigado, y luego si se realiza una distribución
de frecuencias con más de 20 intervalos, perdería su función básica, cual es la de resumir la información
y presentarla de forma que pueda analizar e interpretar.
24
Guía didáctica: Estadística I
Al número de clases se lo representa por “k” y se puede adoptar la siguiente regla para determinar el
número de clases a desarrollarse:
2k ≥ n
donde: n es el número total de observaciones
Por ejemplo, si en una investigación hemos recogido 50 valores que ha tomado la variable, entonces
procedemos a sustituir las letras por los números, con lo que tendremos:
2k ≥ 50
Buscamos ahora el valor de k, que cumpla la condición, de manera que por ejemplo, si elevamos a la
quinta, nos quedaría:
25 = 32, esto no cumple con la condición, seguimos con el siguiente valor, entonces:
26 = 64, aquí ya se cumple con la condición.
26 ≥ 50
64 ≥ 50
Para considerar:
Si fuera dado el tamaño de clase o anchura de clase, al número de intervalos lo encontraremos aplicando
la siguiente fórmula:
e. Tamaño o anchura de clase, o intervalo de clase, se refiere al número de puestos que recorre la
variable en cada uno de los intervalos desde el límite inferior hasta el límite superior.
Si ya tenemos la distribución, al tamaño lo podemos establecer a través de la diferencia entre los límites
superior e inferior siempre que la distribución sea continua, en caso contrario, la distribución es de
carácter discreta (cuando existe separación entre los intervalos) y a la diferencia anterior se le suma la
unidad en la que se encuentra identificada la variable. Por ejemplo, en la tabla 3, el tamaño es 10, con los
límites 109 – 100 +1 =10 o si utilizamos los límites reales, el tamaño será: 109,5 -99,5 = 10
25
Guía didáctica: Estadística I
f. Frecuencia (ni): constituye el número de datos u observaciones que se encuentran dentro de cada
uno de los niveles, categorías o intervalos de clase, esta se denomina frecuencia absoluta simple,
observe la tabla 1, para la calificación 12, la frecuencia es 3, ahora usted determine las frecuencias
para las calificaciones 14, 18 y 20.
Para poder determinar esta frecuencia, se aconseja (hasta que se vaya teniendo práctica), realizar una
tabla de conteo para llegar a totalizar la frecuencia de cada intervalo. Una forma de comprobar si se
encuentran distribuidos todos los datos, es a través de la suma de la columna de frecuencias que siempre
será igual al número de datos recogidos y organizados en la tabla.
g. Marcas de clase (Xi): una vez que ha realizado la tabla de frecuencias, se puede considerar
como otro elemento a la marca de clase o también conocido como punto medio, ya que para
su determinación se procede a sumar los límites inferior y superior de la misma clase y dividirlos
entre dos. De otra manera podemos expresar que la marca de clase se constituye en la semisuma
de los límites inferior y superior de cada uno de los intervalos de clase.
Revise ahora en el texto básico el ejemplo desarrollado, en el que se elabora una tabla de frecuencias
para mostrar el precio típico de venta en diversas concesionarias (tabla 2.4).
2 4 2 32 9 9 2 6 3 1
14 9 16 7 8 19 6 4 4 2
4 18 0 6 13 7 2 8 0 1
14 1 2 2 18 8 24 1 8 5
1 3 11 18 26 3 12 23 5 4
Bien, como en el pedido no nos indica ni tamaño ni número de clases en las que se debe presentar la
distribución de frecuencias, procedemos a resolver este pedido de la siguiente manera:
1. Identificamos los valores máximo y mínimo: busque usted los valores máximo y mínimo
Xmáx. = H = 32
Xmin. = L = 0
26
Guía didáctica: Estadística I
2. Establecemos el rango o recorrido de la variable, en este caso podemos identificar que se trata de
una variable discreta porque hablamos de “número de solicitudes”, entonces tendremos:
AV = H – L + 1
AV = 32 – 0 + 1
AV = 33
Significa entonces que la variable recorre 33 puestos desde el valor menor hasta el valor mayor.
Si decimos que K= 5, entonces tendremos que 25 = 32, lo que significa que no se cumple la condición,
puesto que hay 50 datos y 32 es menor a 50.
Luego, si K = 6, tendremos que 26 = 64, esto significa por tanto que la condición 26 > 50, es correcta
porque 64 > 50.
4. Tamaño o anchura de clase, con los datos anteriormente definidos, encontramos el tamaño del
intervalo de clase:
En este caso, como no resultó un valor exacto, aproximamos al inmediato superior que sería 6.
5. Nuevo rango, debido al resultado anterior debemos encontrar un nuevo rango, si hubiéramos
tenido un resultado exacto no hace falta realizar este paso.
Nuevo rango=(6)*(6)=36
Si relacionamos con el rango original (33) vemos que nos van a sobrar 3 datos, los cuales se pueden
distribuir entre los valores menores y mayores pero como en este caso el primer valor es 0 solamente
podemos agregar los nuevos datos al valor mayor, lo que significaría que vamos a llegar hasta 36 en la
distribución de frecuencias.
27
Guía didáctica: Estadística I
6. Elaboración de la tabla de frecuencias (ni). Una vez que ya contamos con todos los elementos
procedemos a elaborar la tabla de frecuencias, considerando los intervalos, el conteo y la frecuencia
correspondiente:
Consideremos que:
Para ubicar los datos se puede tomar un solo criterio para toda la distribución. Por ejemplo:
Si el valor del límite superior de una clase es igual al límite inferior de la siguiente clase, y el
dato es exactamente igual a ese valor, se lo puede ubicar en el intervalo en donde coincide
con el límite superior o ubicarlo en el intervalo en donde es igual al límite inferior, pero ese
mismo criterio se debe aplicar a toda la distribución.
Es hora de practicar lo aprendido, para lo cual le invito a desarrollar los ejercicios 12, 13 y 14, que se
encuentran en el texto básico.
Hasta ahora, hemos determinado las frecuencias absolutas simples, o solamente conocidas como
frecuencias, sin embargo, también podemos determinar las frecuencias relativas que se definen como la
proporción de datos que contiene cada intervalo del total.
Para encontrarla, lo que hacemos es dividir cada frecuencia absoluta simple para el número total de
observaciones y si queremos expresar en porcentaje a este resultado se lo multiplica por 100.
28
Guía didáctica: Estadística I
Se puede presentar en
cualquiera de las dos formas
Como podemos observar la suma de las frecuencias relativas siempre nos tiene que resultar igual a 1,
o si lo estamos presentando de manera porcentual a 100%, puesto que lo que hacemos es definir la
proporción de datos que se encuentra en cada intervalo.
Con lo que hemos revisado hasta ahora puede contestar a la siguiente interrogante:
Bien, si usted indicó que la principal diferencia radica en que la primera se refiere a la cantidad de datos
observados y que la segunda se refiere a la proporción de datos que se encuentra en cada intervalo o
clase, está en lo correcto.
Ahora pasemos a presentar la misma información a través de un gráfico, para ello se utilizan el histograma
y el polígono de frecuencias. Realice la lectura de este tema en el texto básico y luego elabore un cuadro
resumen de las características de cada una.
_______________________________________
_______________________________________
HISTOGRAMA _______________________________________
_______________________________________
_______________________________________
29
Guía didáctica: Estadística I
HISTOGRAMA
28
26
24
22
20
18
16
14
11
12
10
7
8
6
3
4
1 1
2
0
0–6 6 – 12 12 – 18 18 – 24 24 – 30 30 – 36
Número de solicitudes
Fuente: tabla 5
Elaboración: el autor
Es conveniente ahora, que usted, sin observar la tabla con los valores, y solamente observando el gráfico,
enuncie las principales conclusiones a las que puede abordar:
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
___________________________________________________________________
__________________________________________________________________.
Revise ahora en el texto básico, lo referente al polígono de frecuencias y describa las características y
todo aquello que se debería considerar
_____________________________________
_____________________________________
POLIGONO DE
_____________________________________
FRECUENCIAS _____________________________________
_____________________________________
Elaboremos ahora, el gráfico conociendo que previamente hay otros elementos que se debe preparar,
como se muestra en la tabla 6.
30
Guía didáctica: Estadística I
Tabla 6
POLÍGONO DE FRECUENCIAS
30 27
25
20
préstamos
15 11
10 7
3
5 1 1
0 0
0
-6 -3 0 3 6 9 12 15 18 21 24 27 30 33 36 39 42
Número de solicitudes
Fuente: tabla 5
Elaboración: el autor
De igual manera, si usted solamente estuviera observando este gráfico sin conocer los datos, ¿qué
conclusiones puede identificar? y ¿por qué es necesario establecer las “marcas de clase supuestas”?
En cada uno de las representaciones gráficas, usted ha podido revisarlo y por simple observación ha
llegado a establecer conclusiones sobre los valores observados, sin embargo, también ha observado
que el gráfico tiene un título, que cada uno de los ejes de igual manera tiene un título en el que se
identifica la información que se está presentando y también se debe hacer constar la fuente en la que se
origina la información y quién lo elabora.
31
Guía didáctica: Estadística I
Adicionalmente los gráficos deberían ir numerados cuando hay algunos en un mismo documento, de
manera que luego al presentar la investigación se elabore un índice de gráficos y de tablas.
El título de todo gráfico, debe reflejar la información que se está presentando, de manera que el lector
inmediatamente pueda identificarla a través de las representaciones.
Por otro lado cuando hablamos del polígono de frecuencias es necesario establecer marcas de clase
supuestas con la finalidad de cerrar el polígono. Como podemos observar en la tabla 6, las marcas de
clase supuestas son (-3) y (39), una anterior a la primera y otra posterior a la última. Como la primera
marca de clase es (3) entonces le restamos el tamaño de los intervalos que en este caso es (6) lo que nos
daría como resultado una marca de clase de (-3), de igual manera procedemos con la última, como la
marca de clase es (33) entonces le sumamos el tamaño de los intervalos (6) lo que nos da como resultado
(39).
En el caso de querer representar las frecuencias relativas, realizamos exactamente el mismo procedimiento
con la diferencia que en el eje de las Y no ubicaremos una escala con las frecuencias absolutas, sino con
las frecuencias relativas, en lo demás se siguen los mismos procedimientos.
El análisis de la información a veces requiere considerar la cantidad de datos que van quedando después
de unos o también analizar la proporción de datos que se encuentran antes o después de determinado
valor, para ello se emplea el análisis de las frecuencias acumuladas.
Remítase al texto para que establezca la función de las frecuencias acumuladas de manera que las pueda
resumir en un cuadro sinóptico.
En efecto, una frecuencia acumulada nos muestra la cantidad de datos u observaciones que se encuentran
antes o después de un valor de interés y de igual forma podemos llegar a establecer las frecuencias
acumuladas relativas, que siguen el mismo procedimiento.
Adicionalmente a lo que nos presentan los autores del texto básico, podemos explicar lo correspondiente
a las frecuencias acumuladas, de la siguiente manera:
Para encontrar las frecuencias acumuladas, hay que partir de la necesidad de análisis, pues
podemos realizar una distribución “menor que” o una distribución “mayor que”.
La frecuencia acumulada “menor que”, nos muestra el número de datos que se encuentran por
debajo de un determinado valor; para encontrarla lo que hacemos es ir sumando las frecuencias
anteriores.
La frecuencia acumulada “mayor que”, en cambio nos presenta el número de datos que se
encuentra después de determinado valor, por lo que iniciamos con el total de observaciones y
luego vamos restando las frecuencias absolutas simples de cada intervalo.
De igual forma trabajamos con las frecuencias relativas; de manera que podemos encontrar las
frecuencias acumuladas mayor que o menor que.
32
Guía didáctica: Estadística I
Tabla 7
Frecuencia Frecuencia
Frecuencia
Número de acumulada acumulada
absoluta cálculo cálculo
solicitudes “Menor “Mayor
simple
que” que”
0–6 27 27 27 + 0 50 50–0
6 – 12 11 38 27 + 11 23 50–27
12 – 18 7 45 38 + 7 12 23–11
18 – 24 3 48 45 + 3 5 12–7
24 – 30 1 49 48 + 1 2 5–3
30 – 36 1 50 49 + 1 1 2–1
Total 50
En el primer caso respondemos a la pregunta ¿cuántos datos menores que 6 hay? y la respuesta es 27, o si
vemos en el siguiente caso ¿cuántos datos menores que 12 hay?, serán los que van quedando entonces
serán los 27 del primer intervalo más los 11 del segundo, así sucesivamente llegamos hasta el último en
donde tendremos la totalidad de los casos.
Cuando trabajamos con la frecuencia acumulada “mayor que”, vamos a dar respuesta a la interrogante
¿cuántos datos mayores que 0 hay?, en este caso la respuesta será 50, o sea la totalidad de los datos,
luego para el siguiente intervalo preguntamos ¿cuántos datos mayores que 6 hay? y la respuesta vendría
dada por la diferencia entre los 50 y los que van quedando en el primer intervalo que son 27. De igual
forma seguimos hasta llegar al último intervalo que será igual a la frecuencia absoluta simple.
De acuerdo. Para que verifique sus respuestas observe las columnas correspondientes a las frecuencias
acumuladas.
El gráfico que nos permite observar con mayor rapidez la forma en la que se encuentran los datos, se
denomina OJIVA y al igual que las tablas tendremos entonces una ojiva menor que y una ojiva mayor
que.
Este es un gráfico lineal en donde el eje Y contiene las frecuencias acumuladas y en el eje X seguimos
representando los límites de los intervalos.
33
Guía didáctica: Estadística I
De igual forma podemos proceder con las frecuencias relativas acumuladas en donde el eje Y tendría
como escala del 0 al 100%.
Revise unas páginas anteriores en el texto básico (representación gráfica de datos cualitativos) y usted
podrá encontrar otros tipos de gráficos que le permiten representar la información que se recoge en las
investigaciones que se realizan:
Enuncie el uso que cada una de ellas tiene y preséntelo en un cuadro sinóptico:
• Barras verticales
• Barras horizontales
• Lineal
• Circular
• Otros que usted puede identificar
34
Guía didáctica: Estadística I
Ejercicios
Realice los ejercicios 30, 33 y 36 que constan en el texto básico después del resumen del capítulo.
Actividades recomendadas
Vamos ahora a ejercitarnos con la presentación y el análisis de la información que se observa en distintos
medios, para ello le sugiero que haga lo siguiente:
¾¾ Revise los periódicos y observe la información que se muestra en la sección financiera, ubique un
gráfico y extraiga sus propias conclusiones, luego de ello lea la información completa.
¾¾ Realice una encuesta a varias personas y pregunte su edad, luego a esa información preséntela
en una serie de frecuencias, (si es del caso, elabore una tabla de distribución de frecuencias),
represéntela gráficamente.
Es hora de constatar lo que hemos avanzado en el estudio de esta unidad, para lo cual le invito a
desarrollar la siguiente autoevaluación.
35
Guía didáctica: Estadística I
Autoevaluación 2
A. Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son
verdaderas o falsas respectivamente.
4. ( ) Una tabla de distribución de frecuencias nos permite presentar en forma resumida un
conjunto de datos.
6. ( ) La frecuencia relativa simple nos muestra la proporción de datos que se encuentran
en cada uno de los intervalos de clase.
7. ( ) Los límites de clase determinan los valores mínimo y máximo de cada uno de los
intervalos de clase.
Recuerde que usted puede constatar sus respuestas en el solucionario que se encuentra al final de esta
guía.
¿Cómo le fue? Bien, me alegra. Si no es así, le recomiendo volver a revisar los temas de manera que se
encuentre listo para comprender la siguiente unidad.
Para recordar:
En esta unidad hemos conocido la forma de recoger la información y la hemos organizado y presentado
de acuerdo a su origen, tipo y necesidad de información.
Hemos conocido el procedimiento para construir una tabla de distribución de frecuencias con todos
sus elementos y representaciones gráficas.
Ahora nos corresponde seguir con el tratamiento de la información y para ello, nos adentramos a
conocer las características que se pueden extraer del grupo de datos investigados, para llegar a obtener
conclusiones válidas sobre el.
36
Guía didáctica: Estadística I
Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 3 del texto
básico denominado: Descripción de datos–medidas numéricas.
3.1. Introducción
Una vez que conoce la forma de recoger información y de presentarla, sea través de tablas o con el
procedimiento realizado para elaborar una tabla de distribución de frecuencias, ahora es conveniente
seguir con las características que permiten describir a un conjunto de datos que se recogen de un
problema a investigarse.
En esta ocasión iniciamos la búsqueda de esas características y para ello lo hacemos con el estudio de
las medidas de tendencia central que no son más que la determinación de una característica puntual de
acuerdo a la necesidad del investigador y al objeto en estudio.
Para nuestro estudio tomaremos inicialmente en esta unidad una primera parte del capítulo que se
encuentra desarrollado en el texto básico, por ello revisemos la guía para ir luego al texto.
También se conocen como medidas de ubicación. Para comprender estos conceptos remítase al texto
básico en la parte introductoria del capítulo 3.
3.2.1.1. Definición
Lea en el texto básico la explicación sobre la media poblacional y la media muestral; allí se va a encontrar
con dos conceptos previamente analizados en esta guía como son el parámetro y el estadístico, ya
sabemos que son las características de la población y de la muestra respectivamente.
Ahora, luego de la lectura realizada, usted puede enunciar una definición propia de lo que considera
como media aritmética, independientemente si se trata de una población o de una muestra, entonces
escríbala en su cuaderno de trabajo.
3.2.1.2. Características
Remítase ahora al texto básico, donde encontrará desarrolladas las propiedades de la media aritmética,
analice cada una de ellas y preséntelas en un cuadro resumen.
37
Guía didáctica: Estadística I
Para llegar a determinar el valor de la media aritmética podemos resumir la forma de hacerlo de acuerdo
a las características de los datos, puesto que en el texto no se encuentran especificadas las variaciones
que pudieran existir. Esto le ayudará a comprender mejor la aplicación.
Datos no agrupados
Xi= valor observado Xi= valor observado
n = número de datos N = número de datos
Tabla de distribución de
frecuencias Xi= marca de clase Xi= marca de clase
ni= frecuencia de cada clase ni= frecuencia de cada clase
n = número de datos N = número de datos
Para ampliar la comprensión de cada una de estas variantes, revise los ejercicios que se encuentran
desarrollados en el texto básico.
Adicionalmente a determinar el valor, es también, saber intepretar el resultado, en este caso cualquiera
sea el tipo de datos con el que contamos, el resultado obtenido nos indica que es un valor representativo
del conjunto, por tanto, podemos hacer referencia a ese valor obtenido porque representa a todos los
valores observados.
Revise los ejercicios desarrollados en el texto básico, allí usted podrá observar el procedimiento a seguir
para calcular el valor de la media aritmética.
Ahora vamos a desarrollar un ejemplo de cálculo de la media aritmética para datos agrupados, en base
al ejercicio que hemos venido trabajando anteriormente.
38
Guía didáctica: Estadística I
Frecuencia
Número de solicitudes
absoluta (ni)
0–6 27
6 – 12 11
12 – 18 7
18 – 24 3
24 – 30 1
30 – 36 1
Total 50
En efecto, como se trata de una variable discreta se puede tomar el valor entero esto es 8, y se diría que
en los 50 bancos se han tramitado 8 solicitudes de préstamos para casas durante un mes.
Podríamos decir que esta es una variante de la media aritmética, cuando los datos se presentan de otra
manera distinta a las mencionadas anteriormente.
Lea en el texto básico esta parte y defina entonces lo que usted considera que es una ponderación.
Si en el enunciado que usted realiza, hace referencia a la presencia o asignación de algún peso,
importancia o un valor relacionado con el valor que toma la variable, está en lo correcto.
39
Guía didáctica: Estadística I
En el texto usted encuentra que en el ejemplo inicial se hace referencia al precio de las bebidas de
acuerdo a cada una de las presentaciones, entonces se determina el precio promedio.
Como veremos allí es fácil determinar la variable, a través de la interrogante que ha sido: establecer
el precio promedio; luego, la cantidad de bebidas en cada una de las presentaciones constituye la
ponderación porque no se han vendido en iguales cantidades.
Seguimos el mismo procedimiento que para la media aritmética de una serie ordenada, en donde la
diferencia sería que ni, será ahora la ponderación o peso asignado a cada valor (wi).
Una librería especializada se concentra principalmente en libros usados. Los libros de pasta rústica cuestan
1.00 dólar cada uno, y los de pasta dura, 3.50 dólares. De los 50 libros vendidos el pasado martes por la
mañana, 40 fueron de pasta rústica, y el resto de pasta dura. ¿Cuál fue el precio medio ponderado de un libro?
CANTIDAD
TIPO DE LIBRO PRECIO (Xi) (XiWi)
(Wi)
Pasta rústica 1 40 40
Pasta dura 3,5 10 35
50 75
Esto significa que en promedio los 50 libros fueron vendidos a 1,5 dólares, podemos decir también que
el precio típico de los libros es de 1,5 dólares.
Analice ahora el ejemplo que se ha desarrollado sobre la aplicación de la media ponderada que consta
en el texto básico.
40
Guía didáctica: Estadística I
3.2.3. Mediana
3.2.3.1. Definición
Remítase al texto básico y en el acápite titulado como mediana, lea, analice y establezca su propia
definición sobre este indicador.
Con la lectura y reflexión, se ha podido dar cuenta que mientras la media aritmética utiliza todos los
valores que se han recogido de una investigación, la mediana solamente establece el valor que se
encuentra utilizando la posición central dentro del conjunto.
3.2.3.2. Características
Siguiendo con la lectura, ahora puede establecer las características de este indicador, y luego las puede
enunciar de manera resumida.
Al igual que en el cálculo de la media aritmética, también en la mediana debería identificarse el tipo de
datos que se tiene para luego identificar el procedimiento.
Esta parte no se encuentra desarrollada en el texto básico, por lo que lo voy a explicar aquí:
Los datos no agrupados son aquellos que no tienen una ordenación previa para presentarlos; por ello,
se debe realizar lo siguiente:
Para identificar el dato que se encuentra ocupando la posición central dentro de todo el conjunto de
datos, aplicaremos la siguiente ecuación:
Con cuyo resultado contaremos la posición desde el valor menor y desde el valor mayor, por ejemplo, si
tenemos los siguientes datos: 6, 9, 3, 7, 4, 8, 6, 9, 1, 2
PosMe= 5,5
41
Guía didáctica: Estadística I
Como el número de datos es par, significa que deberemos tomar los datos que ocupan la posición
5 y la posición 6. Posteriormente establecemos el promedio entre los valores encontrados y con ello
finalmente hemos determinado el valor mediano:
Me= 6
Este resultado significa que, 6 es el valor que se encuentra ocupando la posición central o que es el valor
que divide en dos partes iguales al conjunto.
PosMe= 6
Identificamos el sexto valor, aquí no hay problema empezar por el menor o por el mayor, puesto que será
un solo valor: 1, 3, 3, 4, 5, 5 , 6, 7, 8, 8, 9.
Me = 5
Tenga presente que primero se encuentra la posición del dato mediano y luego el valor
mediano.
Para calcular la mediana de datos presentados en una tabla de distribución de frecuencias, vamos a
desarrollar el siguiente procedimiento:
b. Establecemos el dato que se encuentra ocupando la posición central. Para ello utilizamos la
siguiente fórmula:
42
Guía didáctica: Estadística I
Ilustremos el procedimiento a través del cálculo del valor mediano, con el siguiente ejercicio:
Un estudio de 241 autores famosos reveló los siguientes datos acerca de la distribución de las edades a las que
fue publicado su mejor libro. Determine la edad que corresponde al 50% de los autores
Número de Frecuencia
Edad del autor
autores (ni) acumulada (FA)
20 a 30 20 20
30 a 40 73 93
Este es el intervalo
40 a 50 80 173 mediano porque hasta
50 a 60 44 217 allí existen 173 datos y a
60 a 70 22 239 nosotros nos interesa el
dato 120,5
70 a 80 2 241
Total 241
PosMe = 120, 5
Una vez que hemos identificado el dato que contiene el valor mediano, y que con ello hemos determinado
el intervalo mediano, continuamos con el procedimiento.
Me = 43, 44
43
Guía didáctica: Estadística I
Si en su interpretación indica que es el valor que se encuentra ocupando la posición central y que es el
que supera al 50% de los valores observados, entonces se encuentra en lo correcto.
3.2.4. Moda
3.2.4.1. Definición
Volvamos a trabajar en el texto básico y revise lo que nos explican al respecto los autores. Con sus propias
palabras, exprese una definición de la moda. Generalmente, este término lo utilizamos para referirnos a
aquello que se encuentra con mayor frecuencia o que muchos utilizan, por ejemplo en el vestir.
3.2.4.2. Características
Con la lectura realizada puede también extraer algunas características de la moda, para establecer las
diferencias y sus aplicaciones con respecto a la media aritmética y a la mediana.
Aquí trabajaremos en forma más amplia, puesto que en el texto no existe mayor detalle de este indicador.
Al igual que en las dos medidas anteriores vamos a diferenciar entre los tipos de datos que tenemos a
disposición.
Para datos no agrupados, por simple observación se puede determinar el valor o los valores de la moda,
si es que existieran.
En este caso el valor modal es 5 porque es el que se repite el mayor número de veces en este grupo.
Para el caso de datos agrupados en una serie ordenada de frecuencias, se considera únicamente la mayor
frecuencia y el valor de la variable será el valor modal.
Cuando trabajamos con datos agrupados en una tabla de distribución de frecuencias, deberemos
observar los siguientes pasos:
a. Considerar el intervalo que mantiene la frecuencia absoluta simple más alta, lo que sería intervalo
modal.
b. Determinar la diferencia entre la frecuencia del intervalo modal y del premodal.
c. Determinar la diferencia entre la frecuencia del intervalo modal y del postmodal.
d. Aplicar la siguiente fórmula:
44
Guía didáctica: Estadística I
Donde:
Δ1= diferencia entre la frecuencia absoluta simple del intervalo modal y del premodal
Δ2= diferencia entre la frecuencia absoluta simple del intervalo modal y del postmodal
Calculemos ahora el valor modal del ejercicio anterior: Frecuencia post modal
Número de
Edad del autor
autores (ni)
20 a 30 20
30 a 40 73
Intervalo modal, porque es
40 a 50 80 el de mayor frecuencia
50 a 60 44
60 a 70 22
70 a 80 2
Total 241 Frecuencia premodal
Mo = 41,63
Con este resultado usted puede extraer una conclusión que le permite describir a la variable en mención.
La relación de estas tres medidas de tendencia central o de ubicación nos permite identificar la forma en
la que se encuentran distribuidos los valores, de manera que así se puede determinar el tipo de sesgo
que contiene el conjunto de datos.
En el texto básico, en el acápite titulado "Posiciones relativas de la media, la mediana y la moda", podrá
leer sobre este tema.
Recuerde usted que hemos trabajado las tres medidas de tendencia central de manera que en un mismo
conjunto se pueden establecer estas tres medidas, salvo las excepciones para la media aritmética como
es el caso de la presencia de valores extremos o cuando existen intervalos abiertos en una tabla de
distribución de frecuencias.
45
Guía didáctica: Estadística I
A través de la relación entre estas medidas, podemos ver que existen tres casos que se pueden determinar
en cuanto se refiere a la forma en la que se presentan los datos y que se resumen a continuación:
SIMÉTRICA
SESGADA A LA DERECHA o
SESGO POSITIVO
SESGADA A LA IZQUIERDA
o SESGO NEGATIVO
Con estas características, ya se puede identificar cada uno de los gráficos que se presentan y el tipo de
sesgo que tienen.
Adicionalmente a las medidas que hemos analizado hasta ahora, existe la media geométrica que nos
permite también calcular promedios de acuerdo al tipo de variable e información con la que estamos
trabajando. Su uso obedece también a la necesidad del investigador, revisemos ahora.
3.2.6.1. Definición
Lea en el texto básico lo referente a esta herramienta y con sus propias palabras defina su significado.
3.2.6.2. Características
De la lectura realizada para establecer la definición también puede llegar a identificar características
propias por las cuales se la aplica en las diferentes investigaciones. Una de ellas, establece que el valor
obtenido al calcular la media geométrica, nunca es mayor que la media aritmética.
Esta medida también se la utiliza cuando queremos identificar el promedio al que cambia una variable
durante un período de tiempo, el caso más ilustrativo del uso de esta medida es cuando se requiere
conocer el promedio de crecimiento anual de la población de un país durante un período; la misma
aplicación encontramos cuando se está trabajando con tasas (porcentuales) que serían a las que cambia
la variable. En el texto básico, usted puede encontrar la ilustración de su uso a través de los ejemplos
desarrollados.
Al revisar el texto básico, va a encontrar que existen dos formas de aplicar la media geométrica, de
acuerdo a la necesidad y a la aplicación que se requiera:
46
Guía didáctica: Estadística I
1. Utilizando la fórmula que considera la raíz n-ésima del producto de las variables.
2. Utilizando la fórmula para establecer el promedio de los porcentajes o incrementos por cada
período en donde se considera la cantidad final y la cantidad inicial.
La población del Ecuador en el año 2001 fue de 12´500.000 habitantes. De acuerdo a los datos registrados
en el censo del año 2010, la población es de 14´483.499 habitantes. ¿Cuál es la tasa de incremento promedio
anual de la población ecuatoriana?
MG=1,65%
Esto significa entonces que cada año la población ha crecido en el 1,65% en promedio
Revise los ejercicios resueltos para cada uno de los casos establecidos que se encuentran en el texto
básico.
En este momento vamos a desarrollar un ejercicio, en el que calculamos las tres medidas de tendencia
central y luego procederemos a considerar una distribución en donde la variable se refiere a las
calificaciones obtenidas en un examen, por lo que emplearemos el concepto de límites reales. Vaya
repasando cada uno de los pasos en el cálculo de las medidas, así como también los elementos que se
utilizan.
47
Guía didáctica: Estadística I
Ejercicio de aplicación
ESTUDIANTES
CALIFICACIONES
(ni)
45–49 2
50–54 3
55–59 5
60–64 6
65–69 7
70–74 8
75–79 6
80–84 6
85–89 5
90–94 3
95–99 3
54
Se solicita calcular, la media aritmética, la mediana y la moda, e identificar el tipo de sesgo que tiene el
conjunto de datos.
Media aritmética
ESTUDIANTES
CALIFICACIONES Xi (Xi*ni)
(ni)
45–49 2 47 94
50–54 3 52 156
55–59 5 57 285
60–64 6 62 372
65–69 7 67 469
70–74 8 72 576
75–79 6 77 462
80–84 6 82 492
85–89 5 87 435
90–94 3 92 276
95–99 3 97 291
54 3908
µ = 72, 37
48
Guía didáctica: Estadística I
De acuerdo a este resultado, podemos afirmar que la calificación representativa del conjunto de 54
estudiantes es de 72,37. Si la variable queda expresada en puntaje exacto, la calificación representativa
sería de 72 puntos.
Mediana
ESTUDIANTES Límites
CALIFICACIONES FA
(ni) reales
45–49 2 44,5–49,5 2
50–54 3 49,5–54,5 5
55–59 5 54,5–59,5 10
60–64 6 59,5–64,5 16
65–69 7 64,5–69,5 23
70–74 8 69,5–74,5 31 Intervalo mediano
75–79 6 74,5–79,5 37
80–84 6 79,5–84,5 43
85–89 5 84,5–89,5 48
90–94 3 89,5–94,5 51
95–99 3 94,5–99,5 54
54
Me = 72
Según el resultado obtenido, quiere decir que el 50% de estudiantes ha obtenido una calificación de 72
puntos, por debajo de esa calificación se encuentra el 50% de estudiantes y sobre esa misma calificación
se encuentra el 50% restante.
49
Guía didáctica: Estadística I
Moda
ESTUDIANTES Límites
CALIFICACIONES
(ni) reales
45–49 2 44,5–49,5
50–54 3 49,5–54,5
55–59 5 54,5–59,5
60–64 6 59,5–64,5
65–69 7 64,5–69,5
70–74 8 69,5–74,5 Intervalo modal
75–79 6 74,5–79,5
80–84 6 79,5–84,5
85–89 5 84,5–89,5
90–94 3 89,5–94,5
95–99 3 94,5–99,5
54
Mo = 71, 17
El resultado de la moda nos explica que la calificación que se presenta con mayor frecuencia en el grupo
de los 54 estudiantes es de 71 puntos.
Sesgo
Al comparar los resultados obtenidos con las tres medidas de tendencia central, tendremos que:
μ = 72,37
Me = 72
Mo = 71,17
El valor de la media aritmética es mayor a los valores de la mediana y de la moda, por lo tanto, la
distribución tiene sesgo levemente positivo, porque como observamos la diferencia entre los valores
resultantes, no es mayor.
50
Guía didáctica: Estadística I
Actividades recomendadas
Para una mejor comprensión y desarrollo de las habilidades en la resolución de problemas que tienen
que ver con la aplicación de estas herramientas, es necesario proceder a resolver ejercicios en donde se
consideren distintas formas en las que se encuentran los datos recogidos y sobre todo las necesidades
de investigación.
Por ello le sugiero que realice los ejercicios que se encuentran en el texto básico al finalizar cada uno de
los temas, así como también aquellos que se encuentran en la primera parte del resumen del capítulo 3
del texto, desde el ejercicio 63 hasta el 74.
Resulta necesario e importante medir el avance en la comprensión de los temas desarrollados, le vuelvo
a insistir que todos los contenidos de este componente educativo se convierten en prerrequisito de
los siguientes, por tanto, asegúrese de haber comprendido todos, para ello le propongo la siguiente
autoevaluación.
51
Guía didáctica: Estadística I
Autoevaluación 3
A. Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son
verdaderas o falsas respectivamente:
1. ( ) El cálculo de la media aritmética toma en cuenta todos los valores del conjunto de
datos.
3. ( ) La suma de las diferencias entre cada uno de los valores con respecto a la media
aritmética, siempre debe ser igual al número de datos recogidos.
4. ( ) La mediana es el valor que se encuentra repetido el mayor número de veces dentro
del conjunto.
5. ( ) El valor mediano ocupa la posición central dentro del conjunto de observaciones.
6. ( ) Para calcular el valor mediano en una tabla de distribución de frecuencias, se requiere
considerar la frecuencia acumulada.
8. ( ) Cuando el valor de la media aritmética es igual a los valores de la mediana y la moda,
se dice que la distribución de los datos es simétrica.
9. ( ) La media geométrica es aquel valor que se encuentra ocupando la posición central
dentro de un conjunto de valores.
10. ( ) La media geométrica siempre es menor o igual (nunca mayor) que la media aritmética.
Importante: al final de esta guía didáctica, usted puede encontrar el solucionario a esta autoevaluación,
esto le permitirá contrastar sus avances. Si en alguna de las preguntas ha fallado en su respuesta, vuelva
a revisar el tema de manera que asegure su comprensión.
No pase a la siguiente unidad hasta que se encuentre convencido de sus habilidades en estos temas.
52
Guía didáctica: Estadística I
Para recordar:
Con los temas desarrollados en esta unidad, hemos podido determinar las principales características de
un conjunto de datos, lo que nos ha permitido a su vez llegar a conclusiones sobre el tema investigado.
Las medidas de tendencia central son fáciles de entender y nos determinan un valor en cada una, luego
al relacionar los valores alcanzados se llega también a identificar el tipo de sesgo o la forma en la que se
encuentran distribuidos los valores.
Cada una de las medidas posee sus características y aplicaciones, por lo que se debe tener bien claro
cuándo y para qué aplicarlas.
Otra de las medidas de tendencia central es la media geométrica, que tiene su aplicabilidad de acuerdo
a las necesidades del investigador y de acuerdo a las características de la información.
También hemos abordado a la media ponderada, que viene a ser un caso especial de la media aritmética.
En el segundo bimestre, tendremos la oportunidad de analizar las medidas de dispersión, que también
nos permitirán caracterizar de mejor manera al conjunto de datos y valores observados.
Hemos concluido con el estudio de todas las unidades correspondientes al primer bimestre, ahora,
estamos preparados para rendir nuestra primera evaluación presencial parcial, le auguro el mejor de los
éxitos, y le invito a que con el mismo o mayor ánimo continúe con los temas a desarrollar en el segundo
bimestre.
53
SEGUNDO BIMESTRE
55
Competencias específicas Competencias específicas Contenidos
Actividades de aprendizaje Indicadores de aprendizaje Tiempo de dedicación
56
de titulación del componente educativo Unidades
• Aplica los conceptos 4.2.3. Varianza y desviación ¾¾ Inicia el desarrollo de la
estadísticos básicos estándar evaluación a distancia
correctamente en el correspondiente al
desarrollo de ejercicios 4.2.3.1. Definición segundo bimestre.
referentes a la realidad 4.2.3.2. Características
en la que se 4.2.3.3. Formas de ¾¾ Desarrollo de las
desenvuelve. cálculo actividades
recomendadas.
• Organiza, analiza e 4.2.4. Coeficiente de
interpreta información variación
recogida en un 4.2.5. Asimetría
Guía didáctica: Estadística I
6.5. Distribución
hipergeométrica
57
Competencias específicas Competencias específicas Contenidos
Actividades de aprendizaje Indicadores de aprendizaje Tiempo de dedicación
58
de titulación del componente educativo Unidades
UNIDAD 7: Distribuciones de ¾¾ Revisión de la guía Reconoce los Semana 6
probabilidad continua didáctica. elementos que
caracterizan a la Cuatro horas de autoestudio
7.1. Distribución de ¾¾ Lectura comprensiva probabilidad normal.
probabilidad normal del capítulo 7 del texto Cuatro horas de interacción
básico. Identifica los
7.1.1. Características y usos elementos de un
7.1.2. Formas de cálculo ¾¾ Desarrollo de las problema investigado.
7.1.3. Uso de las tablas de autoevaluaciones que
probabilidad constan al finalizar Resuelve ejercicios de
cada tema. distribuciones de
7.2. Aproximación normal a la
Guía didáctica: Estadística I
probabilidad normal.
binomial ¾¾ Desarrollo de las
actividades
7.2.1. Características y usos recomendadas en la
7.2.2. Aplicación del factor guía didáctica.
de corrección por
continuidad ¾¾ Continúa desarrollando
7.2.3. Formas de cálculo las evaluaciones a
distancia.
Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 3 del texto
básico (Medidas de dispersión) y capítulo 4 (Otras medidas de dispersión).
4.1. Introducción
Una vez que se han analizado las medidas que permiten determinar características puntuales sobre un
conjunto de datos y dependiendo de las necesidades del investigador, es preciso también abordar el
estudio de otras medidas que nos permiten llegar a mayores conclusiones al respecto.
Las medidas de variación son de gran utilidad porque a través de ellas se puede además llegar a tomar
decisiones adecuadas, pues, si bien las medidas de tendencia central nos permiten tener un valor
referencial, a través de las medidas de dispersión podemos llegar a conocer la variabilidad del conjunto
de datos.
Veamos entonces cuáles son estas medidas y en qué consiste cada una de ellas.
¿Qué entiende por dispersión?, a través de la lectura en el texto básico, vamos a comprender el significado
de la dispersión entre los valores, así como también podemos determinar la importancia de este tipo de
medidas en el análisis de la información recolectada dentro de una investigación.
Ahora puede usted, expresar una definición propia de lo que entiende por dispersión.
Según la necesidad de la investigación, encontramos varios tipos de medidas que tienen su aplicabilidad
específica, las cuales, entre las de mayor uso, se pueden resumir de la siguiente manera:
59
Guía didáctica: Estadística I
Amplitud de variación
o rango
Desviación media
absoluta
Desviación típica o
estándar
Cuartiles, deciles y
percentiles
Este es un concepto que ya se lo abordó cuando trabajamos las distribuciones de frecuencia, recordemos
que el rango o también conocido como recorrido o amplitud de variación, nos ayuda a conocer el número
de puestos o lugares que recorre la variable desde el valor menor hasta el mayor.
Después de la lectura del texto básico sobre el tema, usted puede expresar su propia definición.
Como queda dicho, su resultado nos explica el número de puestos que recorre la variable desde el valor
menor hasta el valor mayor.
4.2.2.1. Definición
Después de la lectura en el texto básico, usted puede enunciar su propia definición diciendo que la
desviación media absoluta, es:
_____________________________________________________________________________________
_____________________________________________________________________________________.
4.2.2.2. Características
La desviación media absoluta, posee ciertas características que la diferencian de las demás. Estas
características las podemos escribir en las siguientes líneas, pues, como toda medida tiene sus ventajas
y tiene también sus limitaciones.
Citemos ahora las ventajas e inconvenientes que hemos podido detectar después de haber leído los
temas:
60
Guía didáctica: Estadística I
1. Es fácil de calcular, porque es el valor medio (promedio) de las diferencias entre cada uno de los
valores con respecto a la media aritmética.
2. Considera todos los valores del conjunto a diferencia del rango que solamente toma los dos
valores extremos.
3. Toma en cuenta los valores absolutos de las diferencias entre cada uno de los valores registrados
y la media aritmética.
4. Al tomar en cuenta los valores absolutos, no identifica la posición real de cada valor con respecto
al valor referencial (media aritmética).
El cálculo de esta medida no reviste mayor dificultad, pues no es más que determinar el promedio de
las diferencias entre cada valor con respecto a la media aritmética, pero cada una de estas diferencias se
encuentra expresada en términos o valores absolutos1.
4, 6, 3, 6, 7, 4, 5, 8, 4, 5
Determinamos primero la media aritmética, usted puede calcularla y obtendrá que la misma es: 5,2
Luego identificamos las diferencias en términos absolutos entre cada valor con respecto a la media de
la siguiente manera:
DM = 1,24
Este resultado significa entonces que, en promedio, la distancia entre cada uno de los valores con
respecto a la media aritmética es de 1,24.
1 Un valor absoluto es aquel que no considera el signo de la operación matemático y se lo denota entre ||, por ejemplo el -3
en valor absoluto será |-3|= 3.
61
Guía didáctica: Estadística I
Desarrollemos un ejemplo:
Vamos a tomar los datos del ejercicio que hemos venido trabajando anteriormente:
DM = 5,57
Para interpretar este resultado, le aconsejo que recuerde la definición desarrollada anteriormente y las
características de la medida.
¿Estaría de acuerdo si decimos que en promedio los valores analizados de la variable, se encuentran
distantes en 5,57 unidades con respecto a la media aritmética?
4.2.3.1. Definición
Continuando con el análisis de las medidas de dispersión, volvamos al texto básico, allí puede encontrar
las definiciones de estas dos medidas de dispersión que son complementarias, pues partimos de la
varianza y luego llegamos a la desviación típica o estándar.
Con la lectura realizada, ahora establezca su propia definición respecto a la varianza y a la desviación
típica.
62
Guía didáctica: Estadística I
4.2.3.2. Características
Después de haber definido estas medidas, también se pueden establecer las características de cada una
de ellas y comparar con la desviación media.
Usted, coincidirá conmigo que, a diferencia de la desviación media absoluta, en donde se toman en
cuenta las diferencias expresadas en valores absolutos entre cada valor con respecto a la media
aritmética, en la desviación típica o estándar no hace falta tomar los valores absolutos sino que se parte
de la determinación de la varianza para llegar a la desviación típica.
También coincidiremos si usted indica que una de las dificultades para la interpretación del valor
obtenido como varianza es que las unidades de medida de la variable vienen expresadas en forma
cuadrática, y que por ello llegamos a calcular la desviación típica o estándar, para analizar la dispersión
del conjunto de datos observados.
Revise en el texto básico este acápite, allí va a encontrar que hacemos una diferenciación en el cálculo
cuando se trata de trabajar una muestra y una población.
En cualquiera de los casos antes mencionados, el procedimiento a seguirse para llegar a determinar el
valor de la varianza, se resume en los siguientes pasos:
Existe una diferencia cuando se tratan datos poblacionales y datos muestrales. Como denominador
en un caso se utiliza el total N y en el otro caso se utiliza el denominador (n – 1); el porqué de esta
diferenciación lo podrá encontrar con la lectura en el texto básico.
Para que vaya tomando experiencia en el cálculo de estos indicadores, conviene que se remita al texto y
repase los ejercicios desarrollados en cada uno de estos temas, de manera que allí podrá habituarse con
el procedimiento seguido. También le sugiero que desarrolle los ejercicios planteados en el texto básico,
así podrá desarrollar las destrezas necesarias para el tratamiento de estos temas.
Este tema no se encuentra desarrollado específicamente en el texto básico, por lo que vamos a abordarlo
aquí.
63
Guía didáctica: Estadística I
Cuando se requiere hacer comparaciones entre dos o más conjuntos de datos, es útil hacerlo a través del
coeficiente de variación ya que no interesa aquí la unidad de medida, pues es adimensional.
Para su cálculo se debe utilizar la desviación típica o estándar y la media aritmética de cada uno de los
conjuntos de datos y lo expresamos en forma porcentual.
Coeficiente de variación de la
muestra
Coeficiente de variación de la
población
Un estudio sobre el monto de bonos pagados y los años de servicio de varios empleados, dio como resultado
los siguientes datos estadísticos: la media de los bonos pagados fue de $200 y la desviación estándar fue
de $40. La media del número de años de servicio fue 20 años y la desviación estándar 2 años. Compare las
dispersiones relativas de las dos distribuciones empleando el coeficiente de variación.
Como observamos, tenemos dos grupos de datos: los primeros expresados en dólares y los segundos
expresados en años.
Necesitamos comparar estos dos grupos, entonces procedemos a aplicar el coeficiente de variación.
CV = 20% CV = 10%
En este caso podemos observar que existe mayor dispersión relativa con respecto a la media aritmética
en los bonos pagados en comparación con el conjunto de datos de los años de servicio. Esto significa
entonces, que existe mayor variabilidad en los valores observados sobre el pago de los bonos que en el
conjunto de valores investigados sobre los años de servicio.
4.2.5. Asimetría
Otra de las medidas que permiten caracterizar un conjunto de datos es la determinación del tipo de
asimetría o sesgo que tiene el conjunto de datos, de modo que con ello podemos determinar si la
64
Guía didáctica: Estadística I
tendencia es a distribuirse de manera similar o de pronto la mayoría de los datos se ubican en los valores
mayores o menores.
Este tema se encuentra desarrollado en el texto básico con el título SESGO, en el capítulo 4.
Allí encuentra los tipos de sesgo y la forma de calcularlo. Bajo esta consideración, vamos a encontrar tres
tipos de conjuntos de valores, que se clasifican según el sesgo:
Para determinar la magnitud de la simetría en un conjunto de datos, se lo puede hacer a través del
cálculo de:
Para conocer las fórmulas que se deben aplicar, remítase al texto básico en su capítulo 4, (acápite 4.5) y
podrá determinar cuáles son las características y aplicaciones que se realiza a cada uno de ellos.
En el caso del coeficiente de sesgo de Pearson, sus resultados van a estar entre -3 y 3, de manera que con
ello podemos llegar a identificar el tipo de sesgo que tiene el conjunto de datos.
Para reafirmar el uso de estas medidas examine el ejemplo resuelto que se encuentra en el texto al
finalizar este tema.
Existen otras medidas que nos permiten también identificar la posición de determinados valores, entre
ellas encontramos a los cuartiles, los deciles y los percentiles.
Volvamos al texto básico donde encontrará el desarrollo de estas medidas en el apartado 4.4.
4.2.6.1. Cuartiles
Los cuartiles, por definición, serían aquellas medidas que dividen en cuatro partes iguales al conjunto de
datos y por ello encontraremos 3 cuartiles. Gráficamente se puede representar de la siguiente manera
esta definición:
65
Guía didáctica: Estadística I
Xmin Q1 Q2 Q3 Xmáx
El cálculo de estas medidas lleva el mismo procedimiento que el cálculo de la mediana, tanto para datos
agrupados como para datos no agrupados, la única diferencia es que en lugar de dividir el conjunto de
datos para 2, ahora lo dividimos para 4; por lo demás el procedimiento es exactamente igual.
Q1, nos indica que el 25% de datos se encuentran por debajo de ese valor y que el 75% supera dicho
valor.
Q2, al igual que el valor de la mediana, es el valor que se encuentra ocupando la posición central y que
por tanto por debajo y sobre él se encuentra el 50% de datos.
Q3, significa que este valor supera al 75% de datos analizados y es superado por el 25% restante.
4.2.6.2. Deciles
Llevando el mismo sentido que la medida anteriormente analizada, los deciles son aquellos que dividen
al conjunto de datos en 10 partes iguales y que por tanto tendremos 9 deciles.
Su cálculo será similar a los cuartiles, con la diferencia que al dividir al conjunto de datos para determinar
la posición del valor ya no dividimos para 2 ni para 4 sino que ahora lo hacemos para 10.
Si tenemos, por ejemplo, el decil 1 (D1), significa que es el valor que supera a la décima parte de los datos
y es superado por las nueve décimas partes del conjunto de datos. Si calculamos el decil 7 (D7), significará
que es aquel valor que supera las siete décimas (7/10) partes del conjunto de datos y es superado por las
restantes tres décimas (3/10) partes de dicho conjunto.
Pasemos a revisar ahora los percentiles, que algunos autores también los denominan como centiles.
4.2.6.3. Percentiles
Seguimos con los mismos procedimientos anteriores y ahora dividimos el conjunto en 100 partes iguales
de manera que tendremos 99 percentiles.
Este tipo de medida nos permite, llegar a identificar el valor que se encuentra ocupando una posición
que sea de nuestro interés como investigadores.
Generalmente cuando se realizan análisis en el ámbito económico sobre la distribución del ingreso, se
utilizan estas medidas.
Para calcular y ejercitar sobre estas medidas le recomiendo primero revisar el ejercicio resuelto y también
desarrollar los otros ejercicios que se encuentran propuestos, en el texto básico.
66
Guía didáctica: Estadística I
Concluyendo con este tema, como usted ha observado, llevamos el mismo procedimiento para calcular
estas medidas conjuntamente con el cálculo de la mediana, de ahí que podemos establecer algunas
relaciones entre estas medidas, por ejemplo:
D1 = P10
D2 = P20
D3 = P30
Q1 = P25
D4 = P40
D5 = P50 = Q2 = Me
En el texto se encuentran desarrollados otros temas que puede usted revisarlos aunque no se encuentran
contemplados en nuestro plan de estudio, sin embargo, le van a aportar conocimientos que le pueden
ser de utilidad posterior.
Vamos a desarrollar el mismo ejercicio planteado anteriormente y con los datos obtenidos aplicaremos
algunos de los conceptos estudiados en esta unidad.
Ejercicio de aplicación
ESTUDIANTES
CALIFICACIONES
(ni)
45–49 2
50–54 3
55–59 5
60–64 6
65–69 7
70–74 8
75–79 6
80–84 6
85–89 5
90–94 3
95–99 3
54
67
Guía didáctica: Estadística I
ESTUDIANTES
CALIFICACIONES Xi
(ni)
45–49 2 47 25,37 50,74
50–54 3 52 20,37 61,11
55–59 5 57 15,37 76,85
60–64 6 62 10,37 62,22
65–69 7 67 5,37 37,59
70–74 8 72 0,37 2,96
75–79 6 77 4,63 27,78
80–84 6 82 9,63 57,78
85–89 5 87 14,63 73,15
90–94 3 92 19,63 58,89
95–99 3 97 24,63 73,89
54 582,96
DM = 10,80
Este resultado significa que en promedio los valores se encuentran separados en 10,80 con respecto a
la media aritmética, es decir, para el ejemplo las calificaciones se encuentran separadas en ese valor con
respecto al valor medio de las calificaciones.
ESTUDIANTES
CALIFICACIONES Xi
(ni)
45–49 2 47 -25,37 643,6369 1287,2738
50–54 3 52 -20,37 414,9369 1244,8107
55–59 5 57 -15,37 236,2369 1181,1845
60–64 6 62 -10,37 107,5369 645,2214
65–69 7 67 -5,37 28,8369 201,8583
70–74 8 72 -0,37 0,1369 1,0952
75–79 6 77 4,63 21,4369 128,6214
80–84 6 82 9,63 92,7369 556,4214
85–89 5 87 14,63 214,0369 1070,1845
90–94 3 92 19,63 385,3369 1156,0107
95–99 3 97 24,63 606,6369 1819,9107
54 9292,5926
68
Guía didáctica: Estadística I
-- Varianza:
Este sería el valor de la varianza, pero estaría expresado en la unidad de medida de la variable al
cuadrado, en este caso serían puntos al cuadrado, lo que no nos permite tener una mayor claridad, por
ello calculamos la desviación estándar
Con este resultado, ya podemos decir, que típicamente las calificaciones de los 54 estudiantes se
encuentran separadas con respecto a la media aritmética de las calificaciones en 13,12 puntos.
Para calcular este coeficiente se requieren los valores de la media aritmética, la mediana y la desviación
típica o estándar. Como ya los hemos calculado anteriormente, procedemos a calcular este coeficiente:
Mediana: Me = 72
sk = 0, 085
El resultado obtenido, nos indica que la distribución de los valores tiene sesgo positivo, pero que la
distribución se encuentra muy ligeramente sesgada. Esto confirma el resultado obtenido anteriormente,
al comparar las tres medidas de tendencia central.
69
Guía didáctica: Estadística I
Cuartil dos
ESTUDIANTES Límites
CALIFICACIONES FA
(ni) reales
45–49 2 44,5–49,5 2
50–54 3 49,5–54,5 5
55–59 5 54,5–59,5 10
Intervalo decílico y
60–64 6 59,5–64,5 16
percentílico
65–69 7 64,5–69,5 23
70–74 8 69,5–74,5 31
Intervalo cuartílico
75–79 6 74,5–79,5 37
80–84 6 79,5–84,5 43
85–89 5 84,5–89,5 48
90–94 3 89,5–94,5 51
95–99 3 94,5–99,5 54
54
Q2 = 69,5 + 2,5
Q2 = 72
70
Guía didáctica: Estadística I
Decil dos
D2 = 59,5 + 0,66
D2 = 60,16
Percentil 25
71
Guía didáctica: Estadística I
Actividades recomendadas
Como lo he venido mencionando en las unidades anteriores, es necesario que todos aquellos contenidos
que los vamos abordando teóricamente, los llevemos a la práctica por ello le recomiendo que:
1. Identifique una variable que desee estudiar de un conjunto de personas, por ejemplo puede
preguntar sobre los niveles de ingreso o sobre los niveles de gasto.
2. Presente los datos, decida usted si los va a presentar a través de una distribución de frecuencia
(sería recomendable).
3. Calcule las medidas de tendencia central que le permiten describir el conjunto de datos.
4. Establezca las medidas de dispersión que se pueden calcular con sus datos y vaya interpretando
cada una de estas medidas.
5. Calcule las medidas de dispersión, observe si los resultados obtenidos como desviación media son
similares con la desviación estándar, explique por qué lo son o no.
6. Determine qué valor se encuentra en la posición del P75 y cómo interpreta este resultado.
72
Guía didáctica: Estadística I
Autoevaluación 4
Al concluir con el análisis de esta unidad, debemos revisar el avance que hemos logrado en la comprensión
de cada uno de los temas. Recuerde que al final de la guía se encuentra la solución a este cuestionario, si
alguna de sus respuestas no le es favorable vuelva a revisar el tema.
A. Conteste dentro del paréntesis, con V o F si considera que las siguientes afirmaciones son
verdaderas o falsas respectivamente:
2. ( ) Para calcular la desviación media, es necesario considerar los valores absolutos de las
diferencias entre cada valor con respecto a la media aritmética.
4. ( ) La desviación típica puede considerarse como una medida de mayor precisión que la
desviación media.
6. ( ) Un conjunto de datos simétrico es aquel cuya media aritmética es menor que la
mediana y que la moda.
8. ( ) Los cuartiles, deciles y percentiles, son medidas que nos permiten establecer la
posición de un determinado valor.
10. ( ) Para calcular los valores de cuartiles, deciles o percentiles, primero se debe localizar la
posición del dato que contiene el valor de la medida a encontrarse.
Importante: no pase a la siguiente unidad hasta que se encuentre seguro de sus habilidades en estos
temas.
73
Guía didáctica: Estadística I
Para recordar:
En esta unidad se han desarrollado los contenidos referentes a las medidas de dispersión, hemos
analizado cada una de estas medidas, con sus características, la forma de cálculo y su aplicabilidad.
Debemos considerar las características de cada una de las medidas para poder diferenciarlas, por
ejemplo, no es lo mismo hablar de la desviación media absoluta y de la desviación típica o estándar,
cada una de ellas tiene sus características que la hacen diferente y por tanto su aplicabilidad.
Hemos confirmado además que se puede llegar a identificar la forma en la que se encuentra distribuidos
los valores, y se puede calcular el grado de asimetría de todo el conjunto de datos observados, esto a
través del coeficiente de sesgo o de asimetría de Pearson.
Hasta aquí podemos decir que se ha llegado a describir a un conjunto de valores que se están
investigando, a partir de la siguiente unidad, empezamos a trabajar los temas relacionados con
la inferencia estadística, principalmente con lo referente a la teoría de las probabilidades, para que
posteriormente se puedan insertar en el análisis de los muestreos y pruebas de hipótesis.
74
Guía didáctica: Estadística I
Para el desarrollo de esta unidad, vaya revisando conjuntamente con esta guía el capítulo 5 del
texto básico.
5.1. Introducción
Hasta ahora hemos avanzado en nuestro estudio con las medidas que nos han permitido describir
un conjunto de datos, estableciendo las medidas descriptivas para conclusiones sobre las principales
características de dicho conjunto.
Al definir a la estadística, habíamos dicho que podemos identificar dos grandes campos de aplicación,
la estadística descriptiva y la estadística inferencial. Con este tema de las probabilidades vamos a
insertarnos ya en la inferencia estadística, pues se trata de que podamos establecer inferencias sobre
determinados eventos que se puedan presentar o vivir.
¿Cuántas veces hemos utilizado la expresión “qué tan probable será esto o aquello”?
Posiblemente hemos contestado y lo hemos realizado en base a alguna información o algún conocimiento
que tenemos del evento, pero no lo hemos cuantificado.
Vamos a leer el texto básico y reflexionemos acerca de lo que hemos venido entendiendo sobre lo que
significa hablar de probabilidades. Puede ahora expresar una definición relativa a esta.
Existen algunos conceptos que es necesario precisar, de manera que se pueda luego diferenciar la
información que se mantiene; así debemos precisar lo que es un experimento, resultado y evento.
Como se observa, podríamos decir que estos conceptos vienen a complementarse, de manera que
el concepto más general es el experimento, luego el resultado que es lo que se obtiene al ejecutar el
experimento y el evento que son el conjunto de uno o más resultados del experimento.
Algo importante a tomarse en cuenta es que primero debemos definir con el experimento, el o los
resultados posibles y los eventos que se pueden obtener.
Revise el cuadro que consta en el texto básico, allí usted puede observar claramente la diferencia entre
estos conceptos a través de los siguientes ejemplos:
• Lanzamiento de un dado
• Listado de los miembros de una junta directiva
75
Guía didáctica: Estadística I
Otro aspecto a considerar es que los resultados van a variar entre 0 y 1, considerando al 0 como la
seguridad de no ocurrencia del evento y el 1 como la certeza de que el resultado se va a presentar.
De manera general para calcular la probabilidad de ocurrencia de un evento se consideran los resultados
favorables y los resultados posibles, a través de la siguiente fórmula:
Ahora bien, una vez que ya hemos definido el término de probabilidad, también es importante reconocer
su enfoque, desde el punto de vista objetivo y subjetivo.
Lea en el texto básico estos enfoques y la clasificación de la probabilidad, luego interprete el siguiente
cuadro:
PROBABILIDAD
OBJETIVO SUBJETIVO
CLÁSICA EMPÍRICA
• Mutuamente excluyentes, que son aquellos eventos que se caracterizan porque la presencia de uno
impide que otro se presente, por ejemplo, en el lanzamiento de una moneda, la presencia del evento
cara, impide que el evento sello se presente al mismo tiempo.
• Colectivamente exhaustivos, implica que por lo menos uno de los eventos se debe presentar. En el
mismo ejemplo, se presenta cara o se presenta sello.
Para ampliar más sobre estos temas, le recomiendo que realice los ejercicios que se encuentran
propuestos en el texto básico, en la página 146.
Cuando existen dos o más eventos que se pueden presentar, es necesario trabajar con las reglas de
adición o multiplicación, según sea el caso.
76
Guía didáctica: Estadística I
Como usted lo habrá revisado en el texto básico, existen dos tipos de reglas que se aplican para la adición:
• La regla especial:
P (A o B) = P(A) + P(B) y,
• La regla general:
P(A o B) = P(A) + P(B) – P(A y B)
La regla especial se utiliza cuando existen eventos mutuamente excluyentes, en cambio la regla general
de adición se emplea cuando los eventos son inclusivos, esto es, que se pueden presentar solos o
también se pueden presentar al mismo tiempo. Por ejemplo, si al lanzar un dado queremos encontrar
la probabilidad de que el número extraído sea un 2 o un número par, se pueden presentar al mismo
tiempo los dos eventos porque el 2 es un número par.
De igual manera, las reglas de multiplicación se utilizan cuando existen dos o más eventos sobre los
cuales se debe calcular la probabilidad.
En este caso, como observará en el texto básico, los eventos se caracterizan por su dependencia e
independencia.
Hablamos de que un evento es independiente, cuando no depende de lo que haya sucedido antes, es
decir, no recibe ninguna influencia de otro evento.
• especial:
P(A y B) = P(A)P(B); y,
• general:
En el primer caso, la fórmula nos presenta la independencia de los eventos, puesto que encontramos la
probabilidad conjunta de A y B a través del producto entre las dos probabilidades.
En el segundo caso, la fórmula nos indica que los eventos son dependientes, y por ello observamos que
el segundo evento (B) depende de lo que ha sucedido antes, esto es, la presencia del evento A.
El término P(B|A), se lee: “probabilidad de que se presente B, dado que se ha presentado A”, aquí hay que
tener presente que no es un cociente (como a veces se confunde).
En algunas ocasiones no se distingue, cuándo utilizar la regla de adición o cuándo aplicar la regla de
multiplicación. Una forma de hacerlo es conociendo bien lo solicitado:
77
Guía didáctica: Estadística I
Realice los ejercicios que se encuentran propuestos al finalizar cada uno de los temas explicados.
Una vez que hemos comprendido estos temas, pasemos ahora a analizar la utilidad de los diagramas de
árbol.
Cuando un experimento implica varias etapas, es conveniente realizar una representación gráfica, en
donde, como a manera de un árbol, se van considerando las diferentes ramas que se desprenden del
primer evento o la primera etapa.
Vaya al texto básico y revise los pasos que se deben seguir para su construcción. Conviene que repase
estos pasos.
El diagrama de árbol le permite tener una mejor visualización de las probabilidades individuales en los
eventos que se puedan presentar de manera conjunta. Recordaremos además que la suma de todas las
probabilidades de todos los eventos que se presentaren debe darnos igual a 1.
Cuando el número de posibles resultados resulta ser grande y no es posible establecerlo por simple
observación o a través de un diagrama de árbol, es necesario recurrir al análisis de las permutaciones y
combinaciones.
5.6.1. Permutación
Revise en el texto básico estos temas, allí verá que utilizamos el factorial de los números.
Para calcular el número de permutaciones o las diferentes maneras en las que se pueden presentar los
objetos, se debe utilizar la siguiente fórmula:
78
Guía didáctica: Estadística I
Significa entonces que se pueden presentar de 60 maneras distintas estas cinco letras tomadas de 3 en
3; así pues, si tomamos el conjunto a,b,c, no será lo mismo al conjunto a,c,b o al conjunto c, a, b, etc.
5.6.2. Combinaciones
A diferencia de las permutaciones, en las combinaciones no interesa el orden de los objetos, lo que
interesa es que los objetos se presenten independientemente del orden.
Si continuamos con el ejemplo anterior, el número de combinaciones que se pueden realizar con las
cinco letras tomadas de tres en tres, será:
79
Guía didáctica: Estadística I
Significa entonces que podremos encontrar 10 formas de presentar las cinco letras tomadas de 3 en 3;
así pues a, b, c es lo mismo si presentamos a, c, b, porque se presentan las mismas letras, o que c, a, b o
que c, b, a.
Para ejercitar estos temas y familiarizarse con el uso de las permutaciones y combinaciones, le sugiero
que realice los ejercicios que constan al finalizar estos temas en el texto básico (ejercicios 39 a 46).
Una vez que hemos concluido el análisis de los temas previstos para esta unidad, pasemos a establecer
actividades que nos pueden ser de utilidad.
Ejercicios de aplicación
Suponga que se va a elegir de manera aleatoria un individuo entre una población de 130 personas.
En esa población hay 40 niños menores de 12 años, 60 adolescentes y 30 adultos. ¿Cuál es la
probabilidad de que el individuo elegido sea un adolescente o un adulto?
-- Luego identificamos lo solicitado: en este caso es elegir un individuo que puede ser adolescente
o adulto.
-- Significa entonces que los eventos son mutuamente excluyentes, porque si se escoge un
adolescente, ya no será adulto, ni será niño.
-- Como la condición es que el escogido sea adolescente o adulto, significa que deberemos utilizar
la regla especial de adición, ya que son mutuamente excluyentes.
P (A o B) = P(A) + P(B)
P (A o B) = 0,6923
P (A o B) = 69,23%
Esto significa entonces que: la probabilidad de que el individuo escogido del grupo de las 130 personas sea
un adolescente o un adulto es del 69,23%.
80
Guía didáctica: Estadística I
Suponga que se extrae al azar dos frutas, una a la vez, de una bolsa que contiene cuatro manzanas, seis
naranjas y cinco duraznos. Las extracciones se realizan sin reemplazamiento. ¿Cuál es la probabilidad
de obtener una naranja y una manzana, en ese orden?
-- Identificamos los datos: 4 manzanas, 6 naranjas, 5 duraznos, en total la bolsa contiene 15 frutas.
-- Se extrae una fruta y no se devuelve a la bolsa, por eso se llama sin reemplazamiento.
-- Los eventos son dependientes, porque la segunda extracción depende de lo primero, esto significa
que debemos emplear la regla general de la multiplicación.
-- Vamos a conocer como evento A la extracción de una naranja y como B la extracción de una
manzana.
P(A y B) = 0,1143
P(A y B) = 11,43%
Significa, por tanto, que existe el 11,43% de probabilidades que las frutas extraídas sean una naranja y una
manzana, en ese orden.
Actividades recomendadas
Para la mejor comprensión de los temas sobre las probabilidades le sugiero realice las siguientes
actividades que le ayudarán a poner en práctica cada uno de los conceptos hasta aquí aprendidos.
1. Identifique los casos en los que se ha referido a la probabilidad, para que recuerde en qué temas
siempre está invocando a esta palabra, haga un listado de aquellas ocasiones, por ejemplo, cuántas
veces usted se ha preguntado ¿qué tan probable es que en este día llueva?
2. Establezca ejemplos en los que pueda determinar las diferencias entre las probabilidades objetiva
y subjetiva, haga un listado y exprese por qué las determina así.
3. En base a sus ejemplos anteriores lleve a cabo ejercicios en donde pueda diferenciar los resultados
posibles y los resultados favorables, por ejemplo, al lanzar una moneda una sola vez cuántos
resultados posibles tiene y cuántos resultados favorables tiene a su evento.
4. Ahora identifique experimentos en donde se presenten dos o más eventos, para que determine
las probabilidades conjuntas, sea utilizando las reglas de adición y/o las reglas de multiplicación.
5. Identifique casos en los que deba utilizar el análisis combinatorio, tanto permutaciones como
combinaciones, y resuélvalos.
81
Guía didáctica: Estadística I
Autoevaluación 5
Revisemos ahora la comprensión que hemos logrado en los temas trabajados en esta unidad. Le recuerdo
que es importante trabajar estas preguntas de autoevaluación que le ayudan a determinar aquellos
temas que no están lo suficientemente claros para que se los vuelva a estudiar.
Al final de esta guía se encuentra el solucionario de las preguntas para que constate su nivel de logro.
A. Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son
verdaderas o falsas respectivamente:
2. ( ) La certeza de que un evento pudiera tener un resultado exitoso es igual a cero, mientras
que la probabilidad de certeza de que un evento tenga un resultado desfavorable es
igual a uno.
3. ( ) La probabilidad se puede calcular a través del cociente entre los resultados posibles
para los resultados favorables a un evento.
4. ( ) Se dice que dos o más eventos resultan ser mutuamente excluyentes cuando la
presencia de uno impide que otro se presente al mismo tiempo.
6. ( ) La regla especial de adición se utiliza cuando los eventos son mutuamente excluyentes.
7. ( ) La regla general de la multiplicación se aplica cuando dos o más eventos son
independientes.
8. ( ) El diagrama de árbol nos ayuda a calcular las probabilidades cuando estos implican la
existencia de varias etapas.
9. ( ) Las combinaciones son útiles cuando al determinar el número de casos que se pueden
presentar interesa mucho el orden en el que se muestren los objetos seleccionados.
10. ( ) En las permutaciones no interesa el orden en el que se presentan los objetos sino que
se tienen que presentar una sola vez.
82
Guía didáctica: Estadística I
Importante: No pase a la siguiente unidad hasta que se encuentre seguro de sus habilidades en estos
temas.
Para recordar:
Con esta unidad hemos iniciado el estudio de los elementos básicos de la estadística inductiva
o inferencial, lo hacemos con el tratamiento de la teoría de la probabilidad, desde entender lo que
significan las probabilidades, con sus concepciones y enfoques hasta llegar a identificar las reglas
de adición y multiplicación de las probabilidades con sus correspondientes variantes, puesto que la
probabilidad no es un evento único sino que se puede presentar de manera conjunta con otros eventos.
También hemos considerado el análisis factorial para adentrarnos a dos conceptos importantes y que
nos van a servir para los siguientes momentos, como son las permutaciones y las combinaciones.
En la siguiente unidad, vamos a trabajar las distribuciones de probabilidad y empezamos revisando las
distribuciones discretas, cada una con sus características y aplicaciones.
83
Guía didáctica: Estadística I
Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 6 del texto
básico.
6.1. Introducción
Como hemos visto en la unidad anterior, existen experimentos en los cuales se pueden presentar varios
eventos, cada uno con su correspondiente probabilidad. Por ello, trabajar de manera única no es posible,
en ese caso se debe llegar a la organización y clasificación de los datos a emplearse.
Una de las maneras de trabajar en estos casos, es utilizando el concepto de las distribuciones de
frecuencias. Recordará además que allí dijimos que para trabajar con los datos precisábamos previamente
determinar el tipo de variable, si era discreta o continua.
De esta manera, resulta exactamente igual trabajar con distribuciones de probabilidades, porque
también vamos a diferenciar entre distribuciones discretas y distribuciones continuas, dependiendo
del tipo de variable analizada. En esta unidad, desarrollamos el estudio del primer tipo, es decir, las
distribuciones discretas.
Le invito a leer su texto básico y a revisar lo que significa una distribución de probabilidad. Lea esta
definición y encontrará que seguimos con la misma definición que para las distribuciones de datos, es
decir, un conjunto organizado de los posibles resultados que se pueden alcanzar en un experimento.
Con la lectura de este tema en el texto básico, puede identificar las características de las distribuciones.
Lea en el texto básico este apartado en donde se explica el uso de las medidas descriptivas cuando se
trabaja con las probabilidades.
Al igual que cuando hablamos de los datos presentados en una tabla de frecuencias y posteriormente
hemos llegado a determinar las medidas que describen al conjunto de datos, así mismo, llegamos a
trabajar cuando se trata de las probabilidades en un conjunto de información.
Por otro lado, podemos decir que cuando se trabaja con las distribuciones de probabilidad, es que estamos
empleando el concepto de la frecuencia relativa simple, porque el número total de observaciones,
vendrían a constituirse en el conjunto total de posibles resultados y cada una de las frecuencias relativas
simples, vendrían a constituirse en las probabilidades de éxito en cada uno de los intervalos, clases o
eventos.
84
Guía didáctica: Estadística I
6.3.1. Media
La media aritmética será así mismo el valor representativo del conjunto de valores probables, o se conoce
también como el valor esperado.
De esta manera lo que estamos haciendo, es multiplicar cada valor por la probabilidad asociada al mismo
y luego sumamos todos los valores obtenidos con este producto.
Sabemos ya lo que significa cada una de estas dos medidas, por lo que es conveniente ahora revisar
nuestro texto básico para determinar cuáles son las características y procedimientos a seguir para su
cálculo.
Recordemos que la varianza viene expresada en forma cuadrática y que la desviación típica se la obtiene
extrayendo la raíz cuadrada a la varianza. La fórmula para calcular esta medida se expresa de la siguiente
manera:
De acuerdo a la fórmula, usted puede ir aplicando con cada uno de los elementos considerados.
Repase el ejemplo que consta en el texto básico para que amplíe su comprensión sobre el uso de estas
medidas en una distribución de probabilidad.
Es necesario comprender que una distribución de probabilidad binomial se caracteriza porque se refiere
a variables discretas.
Un experimento para considerarse como binomial, debe cumplir con algunas características, las cuales
se pueden resumir de la siguiente manera:
-- Cada ensayo es independiente uno del otro, es decir, el resultado obtenido en un ensayo no influye
en el resultado de los demás ensayos.
85
Guía didáctica: Estadística I
Para calcular una probabilidad binomial se lo hace utilizando el análisis combinatorio a través de la
siguiente fórmula:
n = número de ensayos
X = número de éxitos de la variable analizada
π = probabilidad de éxito en cada ensayo
Usted puede, y es aconsejable que aplique la fórmula hasta que vaya tomando mayor criterio sobre este
tipo de probabilidades, luego puede también encontrarla en las tablas que ya los autores han diseñado
y que siguen este mismo procedimiento.
Para cada n tiene un bloque de probabilidades en cuya fila superior se encuentran las probabilidades de
éxito desde 0,05 hasta 0,95 y en la primera columna los valores de X.
Revise el ejemplo resuelto en el texto para que se familiarice con el uso de la tabla de probabilidades.
Adicionalmente a través de este ejemplo puede observar la forma de llegar a determinar la media o el
valor esperado y la desviación típica o estándar.
Luego dentro de este tema también podrá determinar que es posible considerar la probabilidad
acumulada, porque en muchos casos no se requiere una probabilidad puntual sino una probabilidad
dentro de un intervalo. Le invito a que revise en su texto básico, este aspecto junto con las aplicaciones
desarrolladas.
De la lectura que viene realizando del texto básico, podrá observar que la distribución binomial no es la
única distribución para cuando trabajamos con variables discretas, sino que podemos encontrar otras
aplicaciones dependiendo de las características del conjunto de datos a analizarse.
86
Guía didáctica: Estadística I
-- También podría diferenciar en qué casos utilizar la distribución binomial y en qué casos utilizar la
distribución hipergeométrica, ¿puede explicar los casos?:
Ahora puede revisar también el ejemplo resuelto en el texto básico, en donde se hace referencia al
número de empleados en una compañía, por lo que estamos hablando de una variable discreta, luego
hay una condición de que un empleado solo puede ser elegido una vez por lo que el muestreo es sin
reemplazo, eso hace que la probabilidad de éxito para cada empleado sea diferente.
Considere además que la aplicación de la fórmula para obtener un resultado, igual emplea el análisis
combinatorio.
Ejercite su comprensión del tema a través del desarrollo de la autoevaluación planteada en el texto
básico.
Esta es otra de las distribuciones de probabilidad para variables discretas que, al igual que las anteriores,
lleva sus características que le permiten una aplicación a casos específicos.
Se caracteriza porque se trabaja en intervalos definidos, sean de tiempo, espacio, área, etc., se utiliza por
ello, cuando se trata de realizar control de calidad en la producción, ya que allí se trabaja por lotes de
producción.
Para calcular esta probabilidad se precisa el uso de la fórmula (6.7) que consta en el texto básico.
Donde:
87
Guía didáctica: Estadística I
De igual forma podemos determinar la media de la distribución que a su vez es igual a la varianza a
través de la siguiente fórmula:
µ=nπ
Ya sabemos que n es el número de casos y π, es la probabilidad de éxito.
Con la lectura que ha realizado sobre los tipos de distribuciones de frecuencia discretas, usted podrá
establecer las diferencias entre estas distribuciones y también con las características de cada uno de los
eventos, puede determinar la distribución de probabilidad que debe aplicar en cada caso.
En el apéndice B5 del texto básico, puede encontrar las tablas ya construidas sobre la distribución de
probabilidad de Poisson. Para su uso requiere conocer el valor de µ que se encuentra en la fila superior y
en la primera columna se encuentran los valores de X que es la probabilidad a encontrarse, por ejemplo,
si queremos hallar la probabilidad de que X= 4 cuando la media µ es 5, podemos ver que la tabla nos da
como resultado 0,1755.
Con la ayuda de la tabla, al igual que en el caso de la binomial, podemos ir encontrando las probabilidades
acumuladas.
Ejercicios de aplicación
Una estudiante presenta un examen de opción múltiple con 15 preguntas. Cada pregunta propone
cinco opciones. Si la estudiante adivina la respuesta en cada pregunta, ¿cuál es la probabilidad de
que apruebe el examen? La mínima calificación aprobatoria requiere que 60% de las preguntas sean
contestadas en forma correcta. Suponga que todas las opciones de cada pregunta son igualmente
probables.
Para resolver el ejercicio, primero debemos identificar la información que se nos ha proporcionado:
n = 15 preguntas
X = adivinar la respuesta
π = 0,20 (porque existen 5 opciones de respuesta y solo 1 es correcta de manera que 1/5)
Aprobar = significa que debe cumplir con el 60% o más de las 15 preguntas, entonces el 60% de las 15 son
9 preguntas, quiere decir que la probabilidad de aprobar vendría dada por la suma de las probabilidades
de 9, 10, 11, 12, 13, 14, o 15.
Con todas estas características, sabemos que el experimento es binomial, entonces procedemos a
plantearlo:
88
Guía didáctica: Estadística I
Debemos calcular cada una de las probabilidades aplicando la fórmula de la probabilidad binomial, aquí
voy a calcular la primera y luego se ubicarán los resultados de todas las demás.
Le recuerdo que también las puede obtener de la tabla en el apéndice B del texto.
P(X=9) =
P(X=9) =
P(X=9) = 5005*(0,000000512)(0,262144)
P(aprobar) = 0.0008
Diremos entonces que las probabilidades de aprobar el examen por parte de la estudiante son muy
bajas, prácticamente son nulas porque se encuentran cercanas a cero.
Imagine que el 15% de la población es zurda y el resto utiliza la mano derecha (no hay ambidiestros).
Si usted pregunta a las siguientes cinco personas que encuentre. ¿Cuál es la probabilidad de que:
89
Guía didáctica: Estadística I
Datos:
n = 5 personas
P(X = 5) =
P(X = 5) = 1*(0,0000759)(1)
P(X = 5) = 0,0000759
Esto significa también que estamos buscando la probabilidad de que ninguna sea zurda
P(X=0)= 5C0(0,150)(1-0,15)5-0
P(X=0)=
P(X=0)= 1*(1)(0,4437)
El resultado obtenido nos indica que existe el 44,37% de probabilidades de que todas las cinco personas
consultadas sean diestras.
P(X=2)= 5C2(0,152)(1-0,15)5-2
P(X=2)=
P(X=2)= 10*(0,0225)(0,614125)
P(X=2)= 0,13817
90
Guía didáctica: Estadística I
Quiere decir que existe el 13,82% de probabilidades de que en el grupo de las cinco personas, exactamente
dos de ellas sean zurdas.
Cuando se debe establecer la probabilidad en este tipo de eventos, tenemos dos caminos:
Es decir, existe el 55,63% de probabilidades de que por lo menos 1 persona de entre las cinco, sea zurda.
Si un banco recibe en promedio 6 cheques sin fondos por día. ¿Cuáles son las probabilidades de que
reciba:
Para resolver este ejercicio, primero debemos identificar las características del ejercicio en cuanto a la
información otorgada, de lo cual se desprende que corresponde a un experimento que se considera
en un intervalo de tiempo, que la probabilidad de éxito es proporcional al intervalo, los intervalos son
independientes, n es grande y π es pequeña por lo que se establecería que se debe utilizar la distribución
de Poisson. Ahora sí podemos iniciar a resolverlo:
P(X=4)= 0,1339
Este resultado nos permite concluir que existe el 13,39% de probabilidades que en un día cualquiera se
reciban cuatro cheques sin fondo en el banco.
91
Guía didáctica: Estadística I
µ = 6 x 2 días = 12 promedio de cheques sin fondo que llegan en dos días consecutivos
P(X=10)= 0,1048
El resultado del ejercicio nos indica que existe el 10,48% de probabilidades de que en dos días
consecutivos se reciban 10 cheques sin fondo en el banco.
Actividades recomendadas
Como hemos venido trabajando hasta ahora, es recomendable desarrollar algunas actividades que
permitan determinar la comprensión de cada uno de los temas analizados, para ello le propongo que:
1. Realice un listado con algunas variables y clasifíquelas como variables discretas y variables
continuas.
4. Realice un cuadro sinóptico en donde resuma las características de cada una de las distribuciones
de probabilidad discreta, de manera que pueda tener un elemento de ayuda para identificar cada
uno de estos tipos y pueda aplicar su correspondiente fórmula.
5. Es conveniente que realice algunos ejercicios sobre estas distribuciones de probabilidad. Para ello
tome los ejercicios que se encuentran como resumen del capítulo de manera que usted comprenda
los casos que pudiera encontrar en la vida práctica, por ejemplo, en su campo de labor diaria.
92
Guía didáctica: Estadística I
Autoevaluación 6
De igual forma pasemos a revisar ciertos aspectos básicos para determinar el avance que vamos teniendo
en la comprensión de los temas planteados en esta unidad. No está por demás recordarle que si en
alguno de ellos ha tenido alguna dificultad, debe volver a revisar ese tema de manera que vaya teniendo
seguridad y refuerce los conocimientos en este.
A. Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son
verdaderas o falsas respectivamente:
2. ( ) Una distribución de probabilidad binomial se caracteriza porque los resultados son
eventos mutuamente excluyentes.
93
Guía didáctica: Estadística I
Importante: aunque los resultados a estas preguntas usted las puede encontrar al final de esta guía, le
recomiendo no llegar hasta allá sino cuando usted haya completado el cuestionario.
Para recordar:
En esta unidad se han analizado las distribuciones de probabilidad discreta, desarrollando las
características de cada una y su forma de aplicar.
Hemos analizado que este tipo de distribuciones de probabilidad se utilizan cuando la variable que se
está analizando es discreta.
De igual manera se han podido caracterizar estas distribuciones para establecer indicadores de la
distribución de probabilidad.
94
Guía didáctica: Estadística I
Para el desarrollo de esta unidad, revise conjuntamente con esta guía el capítulo 7 del texto
básico.
En la unidad anterior hemos trabajado con las variables discretas y encontramos que se pueden identificar
tres tipos de distribuciones, binomial, hipergeométrica y de Poisson, cada una con sus características
propias que determinan su aplicabilidad en los diferentes casos.
Ahora, cuando trabajamos con una variable continua, lo hacemos básicamente con una que es la
probabilidad normal.
Antes de definir lo que significa esta distribución, haga una revisión de lo que nos dicen los autores del
texto respecto a este tipo de distribuciones de probabilidad, de manera que puede encontrar allí las
características de una familia de distribuciones de probabilidad uniforme.
Como verá, estas distribuciones se caracterizan por ser simétricas y su representación gráfica tiene la
forma de una campana.
Al igual que en las distribuciones anteriores, existe una manera de calcular, conforme lo puede establecer
en la fórmula 7.4 del texto básico. Sin embargo, puede resultar un tanto compleja la aplicación de esta
fórmula, de modo que para encontrar una probabilidad se acude al uso de las tablas de áreas bajo la
curva normal (Apéndice B1, del texto básico).
Pero, ¿cómo podemos llegar a determinar una probabilidad de este tipo?, antes de identificar su
procedimiento, conviene que definamos a la probabilidad normal, esto lo puede hacer con la lectura en
el texto básico, a partir de lo cual puede emitir su propia definición.
Si en su definición ha considerado aspectos tales como: variable continua, forma simétrica o acampanada,
que es simétrica con respecto a la media aritmética, entonces podemos decir que estamos en lo correcto.
Ahora sí, podemos detallar los pasos que se requieren para determinar una probabilidad.
2. El resultado de Z, puede ser negativo y positivo, este signo nos indica la posición del dato con
respecto a la media, cabe indicar que en términos de Z la media es igual a cero.
3. Para determinar el área bajo la curva normal a encontrarse es aconsejable realizar un gráfico como
el siguiente:
95
Guía didáctica: Estadística I
4. Con los valores de Z, pasamos a leer en la tabla de áreas bajo la curva normal el valor correspondiente,
usted puede observar esta tabla en el apéndice B1 del texto básico.
Para observar el uso de estas tablas, remítase a los ejemplos desarrollados en el texto, allí podrá identificar
la forma en la que se puede llegar a conocer los valores de las probabilidades requeridas.
En el texto básico encontramos un apartado denominado REGLA EMPÍRICA, a través de ella usted
descubrirá que existen casos que se pueden deducir directamente como los siguientes:
1. Alrededor del 68% del área bajo la curva normal se encuentra a una desviación estándar con
respecto a la media aritmética: µ ± 1σ.
3. Prácticamente toda (99,7%) el área bajo la curva normal se encuentra distante a tres desviaciones
estándar con respecto a la media aritmética: µ ± 3σ.
Realice también las autoevaluaciones previstas de manera que vaya adquiriendo las competencias
referidas al cálculo de la probabilidad normal.
Estudiemos ahora el caso especial en donde se utiliza la distribución normal cuando la variable es
discreta, se trata de la aproximación normal a la binomial.
En algunas ocasiones, aunque la variable es discreta, los cálculos de las probabilidades pueden resultar
demasiado extensos por el número de observaciones, de allí que otra forma de trabajar este tipo de
casos, es utilizando la aproximación de la distribución normal a la binomial.
Puede leer este acápite en el texto, pues, allí está explicada la forma en la que se debe trabajar en estos
casos.
Quizá conviene relievar en este momento, ¿cuándo se debe utilizar la aproximación normal a la binomial?
En primer lugar para saber si es buena la aproximación de la normal a la binomial, se debería considerar
que nπ y n(1 – π), son 5 por lo menos.
96
Guía didáctica: Estadística I
Ahora bien, dado que se va a trabajar con el procedimiento de la distribución de probabilidad normal
(que corresponde a variables continuas) una distribución de probabilidad discreta (binomial), implica
que previamente se debe realizar un tratamiento a los valores de la variable, el cual se denomina
corrección de continuidad.
Recordemos que en las distribuciones de probabilidad binomial estamos trabajando con variables
discretas que son aquellas que no toman valores intermedios entre uno y otro valor, en cambio la
distribución normal trabaja para variables continuas que sí pueden tomar infinidad de valores entre uno
y otro.
La aplicación del factor de corrección de continuidad establece cuatro casos que se pueden presentar:
1. Cuando la probabilidad a encontrarse dice que por lo menos ocurra X, se utiliza el área por encima
de (X - 0,5)
2. Cuando la probabilidad a encontrarse dice que ocurra más que X, se utiliza el área por encima de
(X + 0,5)
3. Cuando vamos a encontrar la probabilidad de que ocurra X o menos, se utiliza el área por debajo
de (X + 0,5)
4. Cuando vamos a encontrar la probabilidad de que ocurra menos que X, se utiliza el área debajo
de (X - 0,5)
Una vez que hemos aplicado la corrección por continuidad, se sigue los pasos que se contemplan para
encontrar una probabilidad normal.
Revise este apartado en el texto básico, allí se encuentran explicados los pasos que se deben seguir para
trabajar en estos casos.
Ejercicios de aplicación
Una persona con una buena historia crediticia tiene una deuda promedio de $15.015. Suponga que
la desviación estándar es de $3.540 y que los montos de las deudas están distribuidos normalmente.
a. ¿Cuál es la probabilidad de que la deuda de una persona con una buena historia crediticia sea
mayor a $18.000?
b. ¿De que la deuda de una persona con una buena historia crediticia sea de menos de $10.000?
c. ¿De que la deuda de una persona con una buena historia crediticia esté entre $12.000 y
$18.000?
Desarrollo:
En primer lugar por los datos conocemos que se trata de una distribución normal con la siguiente
información:
97
Guía didáctica: Estadística I
Luego de identificados estos elementos informativos, procedemos a trabajar con cada una de las
interrogantes.
a. ¿Cuál es la probabilidad de que la deuda de una persona con una buena historia crediticia sea
mayor a $18.000?
-- Probabilidad solicitada es que la deuda de la persona sea mayor a $18.000 = P(X > 18.000)
-- Con este valor obtenido vamos a leer en la tabla de áreas bajo la curva normal que se encuentra
en el apéndice B.1 del texto básico, pero previamente planteamos el ejercicio, y es conveniente,
hacerlo de manera gráfica para poder establecer el área a encontrarse:
µ x
P(X>18000) = 0,2005
Significa, por tanto, que existe el 20,05% de probabilidades de que la deuda de una persona con una
buena historia crediticia sea mayor a $18.000.
98
Guía didáctica: Estadística I
b. ¿De que la deuda de una persona con una buena historia crediticia sea de menos de $10.000?
-- Probabilidad solicitada es que la deuda de la persona sea menor a $10.000 = P(X < 10.000).
x µ
El resultado significa que existe el 7,78%de probabilidades de que la deuda de una persona con una
buena historia crediticia sea menor a $ 10.000.
c. ¿De que la deuda de una persona con una buena historia crediticia esté entre $12.000 y
$18.000?
-- Ahora la probabilidad solicitada, es de que la deuda de una persona con un buen historial crediticio,
tenga una deuda entre 12000 y 18000, esto es: P(12000 < X < 18000)
X1 µ X2
X1 = 12000
X2 =18000
99
Guía didáctica: Estadística I
Z2= 0,84
P(12000<X<18000) = 0,3023+0,2995
P(12000<X<18000) = 0,6018
El resultado nos explica que existe el 60,18% de probabilidades de que la deuda de un cliente con un
buen historial crediticio, se encuentre entre 12000 y 18000 dólares.
Le propongo desarrollar ahora otro ejercicio, en donde la variable es discreta, pero por el tamaño de la
población investigada, se debe aplicar la aproximación normal a la binomial.
Un hotel de cierta ciudad tiene 120 habitaciones. En los meses de primavera, su ocupación es de
75%.
a. ¿Cuál es la probabilidad de que por lo menos la mitad de las habitaciones estén ocupadas en
un día dado?
b. ¿Cuál es la probabilidad de que 100 o más de las habitaciones estén ocupadas en un día dado?
De acuerdo a la información del ejercicio, podemos confirmar que se trata de una variable discreta,
puesto que se habla de habitaciones. Luego para poder trabajar con el número de habitaciones que
corresponden a la población en estudio, no es posible hacerlo a través de la distribución de probabilidad
binomial, de allí que se hace necesario trabajar con la aproximación normal a la binomial, ahora veamos
si sería una buena aproximación.
La condición para conocer si es una buena aproximación nos dice que nπ y n(1 – π), son 5 por lo menos,
revisemos si se cumple:
n = 120
π = 0,75
nπ=(120)(0,75)
nπ=90
n(1- π)=(120)(1-0,75)
n(1- π)=(120)(0,25)
n(1- π)=30
100
Guía didáctica: Estadística I
Se cumple la condición, por tanto, se puede considerar como una buena aproximación. Con esto
procedemos a calcular las probabilidades solicitadas.
a. ¿Cuál es la probabilidad de que por lo menos la mitad de las habitaciones estén ocupadas en
un día dado?
P(X mayor o igual a 60), esto porque nos pide identificar la probabilidad de que por lo menos la mitad
estén ocupadas, quiere decir que pueden ser 60 o más habitaciones.
Recordemos que al trabajar con una variable discreta, debemos proceder a establecer la corrección por
continuidad, entonces según el caso, debemos expresar que:
Cuando la probabilidad a encontrarse dice que por lo menos ocurra X, se utiliza el área por encima de (X -
0,5):
(X-0,5)=(60-0,5)
(X-0,5)=(59,5)
X µ
Z= - 6,43
P(X≥60)=0,5+0,5
P(X≥60)=1
El resultado nos indica que existe absoluta certeza (100%) de que por lo menos la mitad de las habitaciones
se encuentren ocupadas en un día dado.
Quizá en este caso cabe una aclaración, como el valor de Z es mayor a 3, y si recordamos la regla empírica,
prácticamente a partir de 3 desviaciones típicas con respecto a la media aritmética, se encuentran todas
las observaciones, por ello en la tabla de áreas bajo la curva normal usted encontrará solamente hasta el
valor de Z = 3,09 con el área de 0,4990, por ello a partir de este valor de Z se considera como el área 0,5.
b. ¿Cuál es la probabilidad de que 100 o más de las habitaciones estén ocupadas en un día dado?
Como nos están solicitando calcular la probabilidad de 100 o más, aplicamos la corrección por continuidad
y tendremos:
101
Guía didáctica: Estadística I
(X-0,5)=(100-0,5)
(X-0,5)=99,5
µ X
Z= 2
P(X≥100)=0,5-0,4772
P(X≥100)=0,0228
Como podrá analizar, hemos llegado a concluir los temas previstos para este componente educativo,
espero que le sean de utilidad en su formación profesional, por ello le invito a desarrollar las siguientes
actividades con la finalidad de que vaya adquiriendo las destrezas y habilidades que le permitan analizar
los casos que se presenten.
Luego le propongo una autoevaluación para que confirme su nivel de logro o establezca las acciones
correctivas para mejorar sus resultados.
102
Guía didáctica: Estadística I
Actividades recomendadas
Como he venido insistiendo al finalizar cada unidad temática, es preciso llevar a cabo algunas actividades
que le permitan afianzar los contenidos estudiados, por ello le recomiendo realizar las siguientes
actividades:
1. Realice un cuadro sinóptico con cada una de las características definitorias de una distribución
normal.
2. Repase el procedimiento a seguirse para llegar a resolver un problema de probabilidades con una
distribución normal.
3. Obtenga datos que le permitan llegar a calcular la o las probabilidades con una distribución
normal.
4. Revise los datos para las distribuciones binomiales y trabaje con la aproximación de la normal a la
binomial para que luego llegue a determinar las probabilidades correspondientes.
Ahora es necesario también hacer una revisión de la comprensión de los contenidos desarrollados en la
unidad, para ello le propongo responder al siguiente cuestionario. Al final de esta guía se encuentran las
soluciones para que pueda medir el logro obtenido.
103
Guía didáctica: Estadística I
Autoevaluación 7
A. Conteste dentro del paréntesis con V o F si considera que las siguientes afirmaciones son
verdaderas o falsas respectivamente:
1. ( ) Una variable continua se caracteriza porque puede existir una gran cantidad de
valores intermedios entre dos valores consecutivos.
6. ( ) Por regla general se puede afirmar que el 68% de las observaciones se encuentran
entre la media (µ) ± 2σ.
8. ( ) Para aproximar una probabilidad normal a una distribución de probabilidad binomial,
primero se debe realizar la corrección de continuidad de la variable.
9. ( ) Si se trata de calcular la probabilidad de “por lo menos ocurra X”, entonces a la variable
se le debe sumar 0,5.
Importante: al final de esta guía didáctica puede encontrar las soluciones, pero no pase a esta parte mientras
no haya terminado de contestarla, luego puede definir sus logros y si hay algún tema que no ha quedado
claro, vuelva a revisarlo hasta que se encuentre seguro de su conocimiento.
104
Guía didáctica: Estadística I
Para recordar:
Hemos analizado la distribución de probabilidad normal, que se aplica a una variable de carácter
continuo, como hemos observado, aquí debemos trabajar con la tabla de áreas bajo la curva normal.
Es recomendable que para desarrollar los ejercicios, primero se plantee el problema y se lo realice
gráficamente a fin de que se asegure cuál es el área que debe encontrar.
También hemos visto un caso especial que se presenta en el tema de las probabilidades cuando nos
referimos a variables discretas que por la cantidad de casos investigados no se facilitaría trabajar como
una distribución de probabilidad binomial, en cuyo caso es aconsejable trabajar la variable como si
fuera continua y aplicar la distribución de probabilidad normal.
105
Guía didáctica: Estadística I
7. Solucionario
PRIMER BIMESTRE
Unidad 1
1 V
2 V
3 F
4 V
5 F
6 V
7 V
8 F
9 V
10 V
106
Guía didáctica: Estadística I
Unidad 2
1 F
2 F
3 V
4 V
5 V
6 V
7 V
8 F
9 V
10 V
107
Guía didáctica: Estadística I
Unidad 3
1 V
2 V
3 F
4 F
5 V
6 V
7 V
8 V
9 F
10 V
108
Guía didáctica: Estadística I
SEGUNDO BIMESTRE
Unidad 4
1 V
2 V
3 F
4 V
5 V
6 F
7 V
8 V
9 V
10 V
109
Guía didáctica: Estadística I
Unidad 5
1 V
2 F
3 F
4 V
5 V
6 V
7 F
8 V
9 F
10 F
110
Guía didáctica: Estadística I
Unidad 6
1 V
2 V
3 V
4 F
5 V
6 F
7 V
8 F
9 F
10 V
111
Guía didáctica: Estadística I
Unidad 7
1 V
2 V
3 F
4 V
5 V
6 F
7 F
8 V
9 F
10 V
CCG/vtc/2013-07-16/112
vjg/2013-11-04
2014-09-22
112