Apuntesestadistica2009 PDF

ESTADÍSTICA
Para Antropólogos Físicos

José Luis Castrejón y Diana Troncoso
Versión de agosto de 2009
Notas para el curso de Estadística impartido en el primer semestre de la licenciatura en
Antropología Física de la Escuela Nacional de Antropología e Historia. Versión preliminar.
Estadística para antropólogos físicos
José Luis Castrejón Diana Troncoso
UNIDAD I
1. ELEMENTOS BASICOS DE PROBABILIDAD

1.1. Concepto de Probabilidad
Desde el punto de vista matemático la probabilidad es una medida de la incertidumbre.
Se ha convenido que dicha medida tome como valores entre cero y uno. Hablar de
incertidumbre nos refiere al término azar. En la vida cotidiana estamos a menudo
rodeados de fenómenos donde el azar está impregnado a los que grosso modo se les
ha denominado fenómenos aleatorios. A diferencia de otro conjunto de fenómenos que
se modelan por ecuaciones determinísticas, como los estudiados por la física, la
probabilidad intenta modelar los fenómenos aleatorios a partir de la observancia de
ciertas regularidades en los eventos involucrados. Precisando, llamaremos fenómeno
aleatorio a todo aquel fenómeno en que se involucran factores fortuitos, provocando
que su desenlace esté sujeto al azar. De hecho, aun cuando todos sus posibles
resultados pueden conocerse de antemano, la conclusión particular de un ensayo no
puede determinarse exactamente con anterioridad. Sin embargo, la probabilidad es
una medida para cuantificar el grado de certeza o incertidumbre de que ocurra cierto
resultado. La forma de asignar probabilidades da lugar a diferentes enfoques. Más allá
de un método matemático, la forma de determinar la probabilidad de un evento
depende del tipo de fenómeno aleatorio al que se relaciona.
1.1.1. Probabilidad clásica o “a priori”
Éste enfoque sólo puede utilizarse cuando los posibles resultados simples de un
fenómeno aleatorio son EQUIPROBABLES; es decir, tienen la misma probabilidad de
ocurrir.
Dicha característica permite que, sin necesidad de realizar el experimento, las
probabilidades de los eventos puedan ser asignadas a través del razonamiento
abstracto con simplemente dividir el número de elementos del evento entre el número
de elementos del espacio muestral:
ENFOQUE CLÁSICO EXPRESIÓN

Permite calcular la probabilidad de un
P (E ) =
#E
evento antes de que ocurra, pues los
resultados del fenómeno son equiprobables. #Ω
EJEMPLO
(lanzamiento de dado balanceado)
Número de elementos del espacio
Espacio muestral del fenómeno
muestral
Ω = {1,2,3,4,5,6} #Ω = 6
Sea U el evento en que, al lanzar un dado, se obtiene el número uno.
Sea D el evento en que, al lanzar un dado, se obtiene el número dos.
Sea T el evento en que, al lanzar un dado, se obtiene el número tres.
Sea C el evento en que, al lanzar un dado, se obtiene el número cuatro.
Sea Q el evento en que, al lanzar un dado, se obtiene el número cinco.
Sea S el evento en que, al lanzar un dado, se obtiene el número seis
Espacio muestral del Número de elementos
Probabilidad
evento del espacio muestral
1
U = {1} #U = 1 P (U ) = 1
6
D = {2} #D =1 P ( D) = 1
6
T = {3} #T = 1 P (T ) = 1
6
C = {4} #C = 1 P (C ) = 1
6
Q = {5} #Q =1 P (Q ) = 1
6
S = {6} #S =1 P(S ) = 1
6
Confirmado está entonces que el enfoque clásico es la mejor forma de asignar
probabilidades a priori cuando los eventos de un fenómeno son equiprobables.
1.1.2. Probabilidad frecuentista o “a posteriori”
El enfoque anterior, empero, resulta inoperante cuando la probabilidad de los eventos

de un fenómeno aleatorio no es la misma o no se conoce. Es debido a ello que surge
el enfoque frecuentista, que propone repetir el experimento u observar el fenómeno un
gran número de ocasiones para designar como probabilidad de un evento su
frecuencia relativa.
ENFOQUE FRECUENTISTA EXPRESIÓN

Permite calcular la probabilidad de un P ( E ) = Frecuencia relativa ∴
evento después de haber observado el # de eventos observados
fenómeno repetidamente. P(E) =
# de repeticiones del fenómeno
EJEMPLO
(sexo de un recién nacido)
Sea M el evento en que el recién nacido es mujer.
Sea H el evento en que el recién nacido es hombre.
La probabilidad de estos eventos, sin embargo, no puede calcularse mediante el
enfoque clásico pues, como atestiguan varias investigaciones, en prácticamente todas
las poblaciones del mundo, nacen más hombres que mujeres.
Según el reporte Mujeres y hombres en México, 20071, en el grupo de 0 a 15 años
hay 103 hombres por cada 100 mujeres, que en términos porcentuales se traduce en
50.7% de niños y 49.3% de niñas. Si ésta es la frecuencia relativa del fenómeno “sexo
de un recién nacido”, podemos determinar que la probabilidad de los eventos M y H
son:
P ( M ) = 0.493 P ( H ) = 0.507
Es decir, antes de asignar probabilidades a los resultados de un fenómeno (cuyos
eventos no son equiprobables) es necesario haber registrado la conclusión de
ensayos anteriores.
1.1.3. Probabilidad subjetiva o “bayesiana”
1
Instituto Nacional de Estadística, Geografía e Informática, 2007. “Estructura de la población por edad y
sexo” y “Relación hombres-mujeres por entidad federativa y grupos de edad” en Mujeres y hombres en
México, 2007. 6, 8 p.p. Documento electrónico:
http://www.inegi.gob.mx/prod_serv/contenidos/espanol/bvinegi/productos/integracion/sociodemografico/
mujeresyhombres/2007/MyH_2007_1.pdf
2
Pese a lo anterior, el enfoque frecuentista tampoco es útil cuando no hay posibilidad
de atestiguar el fenómeno gran número de ocasiones, ya sea por falta de tiempo o
simplemente porque el fenómeno ocurrirá una sola vez. El último método disponible
para asignar probabilidades es, por ende, atender la opinión de un experto en el
fenómeno, confiando en que éste tiene la habilidad para juzgar correctamente la
situación.
Dado que ello implica definir probabilidades de manera subjetiva, muchos de esos
juicios se expresan comparando la credibilidad entre los diferentes resultados.
ENFOQUE SUBJETIVO EJEMPLOS DE EXPRESIÓN

Asigna probabilidades de acuerdo al P ( E ) = x ⋅ P ( Ec )
conocimiento de un experto. P ( C ) = creencia en C (factor de apuesta)
EJEMPLO
(terremoto en California)
Sea S el evento en que se da un terremoto en el sur de California.
Sea T el evento en que se da un terremoto tanto en el sur como en el norte de
California.
Bajo órdenes del gobierno de California y a petición de las aseguradoras privadas
estadounidenses, expertos de tres observatorios geológicos (el Servicio Geológico
Estadounidense, el Centro de Observación de Temblores de la Universidad del Sur de
California y el Servicio Geológico Estatal de California) investigaron —basándose en
observaciones satelitales— la posibilidad de que ocurra un terremoto en el territorio
de California.
Comparando su pronóstico con el temblor que hubo en 1994 en la zona de Northridge
(6.7 grados Richter), el reporte entregado afirma que es "virtualmente cierto que
California experimente por lo menos un temblor mayor para el año 2028", y que uno
de mayor magnitud que ese ocurrirá entre los años 2037 y 2038.
Según la información, hay un 97% de probabilidades de que ocurra un terremoto
mayor en el sur de California en ese periodo, y un 93% de posibilidades de que el
movimiento incluya también al norte de California.2
P ( S ) = 0.97 P (T ) = 0.93
Éste caso es, sin duda alguna, ejemplar para explicar que en muchas ocasiones no
hay forma de atestiguar repetidamente un fenómeno para calcular las probabilidades
de sus eventos. Por ende, es necesario acercarse a los conocimientos de un
especialista para realizar tal tarea.
2
“Prevén un gran terremoto en California entre 2008 y 20038” en El Universal, Secc. El Mundo. Martes
15 de abril del 2008. Formato electrónico: http://www.eluniversal.com.mx/notas/498716.html
3
2. EVENTOS Y SUS PROBABILIDADES
2.1. Espacio muestral y eventos
Revisemos ahora algunos conceptos básicos de probabilidad ejemplificándolos con el

lanzamiento de un dado regular de seis caras.
Por un lado, se llama espacio muestral al conjunto de todos los posibles resultados
de un fenómeno aleatorio; el cual se denota por la letra griega “omega”: Ω .
EJEMPLO
(lanzamiento de dado)
Y al definir dicho espacio muestral
Ω = {1,2,3,4,5,6} reconocemos el número de resultados #Ω = 6
que tiene este fenómeno aleatorio:
Por otro, se denomina evento (denotado por cualquier letra mayúscula) al resultado
del ensayo de un fenómeno aleatorio. Dado que todo evento es un subconjunto del
espacio muestral, existen diversos tipos de eventos:
a) Eventos simples: Son aquellos que los que se da sólo un resultado.
EJEMPLO
Sea D el evento en que, al lanzar un dado, se obtiene el número dos.
Donde comprobamos que el evento
D = {2} #D =1
D tiene sólo un resultado posible:
b) Eventos compuestos: Son eventos que comprenden más de un resultado

(secuencia de puntos muestrales).
EJEMPLO
Sea P el evento en que, al lanzar un dado, se obtiene un número par.
P = {2,4,6} Donde observamos que el evento P

#P = 3
tiene más de un resultado posible:
Dos eventos particulares, deben señalarse con más atención:
Evento imposible: No denotado por una letra, sino por el símbolo de “conjunto vacío”
( ∅ ) , el evento imposible es un evento que no contiene elementos.
EJEMPLO
Sea N el evento en que, al lanzar un dado, se obtiene el número nueve.
Ya que ninguna de las caras del dado
N ={ } #N =0
regular posee el número nueve, el
∅ ={ } evento N es imposible ( ∅ ) : #∅ = 0
4
Evento seguro: Es un evento que comprende los mismos elementos que el espacio
muestral; razón por la cual es denotado también mediante Ω .
EJEMPLO
Sea O el evento en que, al lanzar un dado, se obtiene un número menor a ocho.
El evento O posee los mismos
elementos que el espacio muestral.
O = {1, 2,3, 4,5, 6} Como todos los resultados posibles #O = 6
del lanzamiento del dado son
Ω = {1,2,3,4,5,6} menores a seis, se trata de un evento
#Ω = 6
seguro ( Ω ) ;
Eventos ajenos (mutuamente excluyentes): Son eventos que no tienen elementos

en común.
EJEMPLO
Sea C el evento en que, al lanzar un dado, se obtiene un número primo y D , el
evento en que se obtiene un número no primo.
C = {1, 2,3,5} Como puede verse, los eventos A y #C = 4
D = {4, 6} B no poseen elementos en común. #D = 2
Finalmente, se conoce como σ-álgebra al conjunto de todos los subconjuntos del

espacio muestral. El símbolo con que se le denota, 2Ω , sirve además para calcular el
número de eventos que comprende un fenómeno aleatorio. Basta con sustituir Ω con
el número de elementos que tiene el espacio muestral de dicho fenómeno.
EJEMPLO
Como el espacio muestra contiene
#Ω = 6 2 = 64
6
6 elementos, el número total de
eventos es 64.
⎧ ( )()( )( )( )( )( )
, 1 , 2 , 3 , 4 , 5 , 6 , ⎫
⎪ ⎪
⎪(1, 2 ) , (1,3) , (1, 4 ) , (1,5 ) , (1, 6 ) , ( 2,3) , ( 2, 4 ) , ( 2,5 ) , ( 2, 6 ) , ( 3, 4 ) , ( 3,5 ) , ( 3, 6 ) , ( 4,5 ) , ( 4, 6 ) , ( 5, 6 ) , ⎪
⎪ 1, 2,3 , 1, 2, 4 , 1, 2,5 , 1, 2, 6 , 1,3, 4 , 1,3,5 , 1,3, 6 , 1, 4,5 , 1, 4, 6 , 1,5, 6 , 2,3, 4 , ⎪
⎪ ( )( )( )( )( )( )( )( )( )( )( ) ⎪
⎪ ⎪
Ω⎨ ( 2,3,5) , ( 2,3, 6 ) , ( 2, 4,5) , ( 2, 4, 6 ) , ( 2,5, 6 ) , ( 3, 4,5 ) , ( 3, 4, 6 ) , ( 3,5, 6 ) , ( 4,5, 6 ) , ⎬
⎪ ⎪
⎪ (1, 2,3, 4 ) , (1, 2,3,5 ) , (1, 2,3, 6 ) , (1, 2, 4,5 ) , (1, 2, 4, 6 ) , (1, 2,5, 6 ) , (1,3, 4,5 ) , (1,3, 4, 6 ) , (1,3,5, 6 ) , ⎪
⎪ (1, 4,5, 6 ) , ( 2,3, 4,5 ) , ( 2,3, 4, 6 ) , ( 2,3,5, 6 ) , ( 2, 4,5, 6 ) , ( 3, 4,5, 6 ) , ⎪
⎪ ⎪
⎪⎩ (1, 2,3, 4,5 ) , (1, 2,3, 4, 6 ) , (1, 2,3,5, 6 ) , (1, 2, 4,5, 6 ) , (1,3, 4,5, 6 ) , ( 2,3, 4,5, 6 ) , (1, 2,3, 4,5, 6) ⎪⎭
5
EJEMPLOS DE APLICACIÓN
1. Sea la extracción de una carta (de una baraja con 52 cartas) el fenómeno a
estudiar.
a) Defina el espacio muestral de dicho fenómeno aleatorio.

b) Calcule el número de número de subconjuntos del espacio muestral (σ-álgebra).
c) Determine el número de elementos que contienen los eventos estipulados y, a partir
de ello, clasifique los eventos (individuales o por parejas) que se mencionan.
De entrada tenemos que el espacio muestral deL fenómeno aleatorio “extracción de

una carta de una baraja” es el siguiente:
⎧ Α♦, 2♦, 3♦, 4♦, 5♦, 6♦, 7♦, 8♦, 9♦,10♦, J♦,Q♦,R♦, ⎫
⎪ Α♥, 2♥, 3♥, 4♥, 5♥, 6♥, 7♥, 8♥, 9♥,10♥, J♥,Q♥,R♥, ⎪
⎪ ⎪
Ω=⎨ ⎬ ⇒ # Ω = 52
⎪ A♣, 2♣, 3♣, 4♣,5♣, 6♣, 7♣,8♣, 9♣,10♣, J♣,Q♣,R♣, ⎪
⎪⎩ Α♠, 2♠, 3♠, 4♠,5♠, 6♠, 7♠,8♠, 9♠,10♠, J♠,Q♠,R♠ ⎪⎭
a) Gracias a lo cual podemos observar las 52 posibles cartas que pueden ser
extraídas de dicha baraja.
Ahora bien, calculemos el total de subconjuntos de dicho espacio muestral:
2Ω = 252 = 4.5036x1015
b) Como podemos ver, el número de eventos posibles para este fenómeno es
inmenso: 4.5036x1015 .
Finalmente determinemos el número y tipo de los siguientes eventos:
• Sea A el evento en que sale un as de corazones:
A = {Α♥} ⇒ # A = 1
, El evento “sale un as de corazones” tiene sólo un elemento, por ende es un

EVENTO SIMPLE.
• Sea D el evento en que se obtiene un diez de diamantes:
D = {10♦} ⇒ # D = 1
, El evento “se obtiene un diez de diamantes” contiene un elemento, por lo cual

es un EVENTO SIMPLE.
• Sea E el evento en que se extrae una carta de espadas:
E = {Α♠, 2♠, 3♠, 4♠,5♠, 6♠, 7♠,8♠, 9♠,10♠, J♠,Q♠,R♠} ⇒ # E = 13
, El evento “se extrae una carta de espadas” posee 13 elementos; razón por la
que es un EVENTO COMPUESTO.
6
• Sea C el evento en que sale un cuatro:
C = {4♦, 4♥, 4♣, 4♠} ⇒ # C = 4
, El evento “sale un cuatro” comprende 4 elementos. Debido a ello es un

EVENTO COMPUESTO.
• Sea U el evento en que se obtiene una carta con un uno:
U ={ } ⇒ #U = 0
, El evento “se obtiene una carta con un uno” es un EVENTO IMPOSIBLE, ya
que este tipo de barajas, en vez de tener unos, poseen ases.
• Sea J el evento en que se extrae un comodín:
J ={ }⇒ #J =0
, El evento “se obtiene una carta con un uno” no tiene elemento alguno, por lo
cual es un EVENTO IMPOSIBLE.
• Sea P el evento en que sale un diamante, un corazón, un trébol o una

espada:
⎧ Α♦, 2♦, 3♦, 4♦, 5♦, 6♦, 7♦, 8♦, 9♦,10♦, J♦,Q♦,R♦, ⎫
⎪ Α♥, 2♥, 3♥, 4♥, 5♥, 6♥, 7♥, 8♥, 9♥,10♥, J♥,Q♥,R♥, ⎪
⎪ ⎪
P=⎨ ⎬ ⇒ # P = 52
⎪ A♣, 2♣, 3♣, 4♣,5♣, 6♣, 7♣,8♣, 9♣,10♣, J ♣,Q♣ ,R ♣, ⎪
⎪⎩ Α♠, 2♠, 3♠, 4♠,5♠, 6♠, 7♠,8♠, 9♠,10♠, J♠,Q♠,R♠ ⎪⎭
, El evento “sale un diamante, un corazón, un trébol o una espada” es un

EVENTO SEGURO, pues las 52 cartas de la baraja cumplen con tales requisitos.
• Sea Q el evento en que se obtiene una reina:

• Sea T el evento en que se extrae un trébol:
Q = {Q♦,Q♥,Q♣,Q♠} ⇒ # Q = 4
T = { A♣, 2♣, 3♣, 4♣,5♣, 6♣, 7♣,8♣, 9♣,10♣, J♣,Q♣,R♣,} ⇒ # T = 13
, Tanto el evento Q como el T tienen más de un elemento (4 y 13,

respectivamente). Si bien esto hace a cada uno un EVENTO COMPUESTO, es
más importante notar que, como pareja, NO SON EVENTOS AJENOS, pues
7
tienen en común a la reina de tréboles.
• Sea R el evento en que sale una carta de palo rojo:

• Sea N el evento en que se obtiene una carta de palo negro:
⎧ Α♦, 2♦, 3♦, 4♦, 5♦, 6♦, 7♦, 8♦, 9♦,10♦, J♦,Q♦,R♦, ⎫
R=⎨ ⎬ ⇒ # R = 26
⎩ Α♥, 2♥, 3♥, 4♥, 5♥, 6♥, 7♥, 8♥, 9♥,10♥, J♥,Q♥,R♥, ⎭
⎧ A♣, 2♣, 3♣, 4♣,5♣, 6♣, 7♣,8♣, 9♣,10♣, J♣,Q♣,R♣, ⎫

N =⎨ ⎬ ⇒ # N = 26
⎩ Α♠, 2♠, 3♠, 4♠,5♠, 6♠, 7♠,8♠, 9♠,10♠, J♠,Q♠,R♠ ⎭
, Si bien estos eventos son también COMPUESTOS (ya que comprenden 13

elementos), como pareja sí son EVENTOS EXCLUYENTES, ya que ninguno de
sus puntos muestrales es igual.
PROPIEDADES ELEMENTALES DE LA PROBABILIDAD
Ya revisadas las diferentes formas que existen para calcular la probabilidad de un

evento, resta estudiar las bases que sustentan la teoría probabilística. Empero, más
allá de los axiomas, debe verse en estas propiedades una forma más de asignar
probabilidades y de corroborar los resultados.
1. La probabilidad de cualquier evento E P(E) ≥ 0

es un número no negativo.
2. La probabilidad de cualquier evento E P(E) ≤1
es un número igual o menor a uno.
3. Por ende, la probabilidad de cualquier
0 ≤ P(E) ≤1
evento E está entre cero y uno.
4. La suma de las probabilidades de k
todos los resultados posibles de un P ( E1 ) + ... + P ( Ek ) = ∑ P ( Ei ) =P ( Ω ) = 1
fenómeno es igual a uno. i =1
5. Si E es un evento cualquiera, el
evento que contiene todos los elementos
P ( E ) + P ( Ec ) = 1
del espacio muestral que no están en E
es su EVENTO COMPLEMENTO: E c .
Por tanto, la suma de sus probabilidades
es igual a uno.
C. EJEMPLOS DE APLICACIÓN
1. Defina, justificando su respuesta, el enfoque necesario para asignar

probabilidad a los siguientes eventos:
• Se está apostando por color en una ruleta europea (que además de 36

números tiene una casilla para el cero, que es verde). ¿Cuál es la probabilidad
de que la bola caiga en una casilla roja?
Dado que los resultados de la ruleta son equiprobables, podemos utilizar el
8
enfoque clásico:
⎧0,1, 2, 3, 4, 5, 6, 7,8, 9,10,11,12,13,14,15,16,17,18,19, 20, ⎫

Ω=⎨ ⎬ ⇒ # A = 37
⎩ 21, 22, 23, 24, 25, 26, 27, 28, 29, 30,31, 32,33, 34,35, 36 ⎭
R = {1, 3, 5, 7, 9,12,14,16,18,19, 21, 23, 25, 27, 30, 32, 34, 36} ⇒ # R = 18
18
P ( R) = = 0.4865 , Según éste enfoque, la probabilidad de que la bola caiga
37
en una casilla roja es de 48.65%.
• Se lanza una moneda. Cuál es la probabilidad de que caiga “sol” si en 80 de

200 lanzamientos anteriores ha caído dicha cara.
La notable diferencia de resultados en ensayos anteriores nos indica que la

moneda no está bien balanceada. Por ende es mejor utilizar el enfoque
frecuentista para asignar probabilidad a este evento:
80
P(S ) = = 0.4000 , Gracias a él sabemos que la probabilidad de que salga
200
“sol” en el próximo lanzamiento es de 40.00%.
• Cuál es de que uno infante padezca una enfermedad alérgica si:

a) Ambos padres fueron alérgicos ( D ) .
b) Sólo uno de sus padres fue alérgico (U ) .
Si bien podrían averiguarse las frecuencias relativas de dichos eventos, el

desarrollo de una enfermedad alérgica se relaciona con factores genéticos. Por
ende, es mejor confiar en juicios como el del doctor Gerardo López Pérez, médico
adscrito al servicio de Alergia del Instituto Nacional de Pediatría (INP) de la
Secretaría de Salud, quien afirma que “…si ambos padres fueron alérgicos, el
niño tiene hasta 50% de posibilidad de serlo, si es uno de ellos, el riesgo es de
30%...”3
P ( D ) = 0.5000 P (U ) = 0.3000
• ¿Cuál es la probabilidad de que, en un juego de perinola, alguien o todos

pongan una ficha?
Bajo el supuesto de que dicha perinola no está trucada, podemos aplicar el

enfoque clásico:
Ω = {pon una, pon dos, todos ponen (una), toma una, toma dos, toma todo} # Ω = 6
P = {pon una,todos ponen (una),} ⇒ # P = 2
3
“El 30% de la población presenta durante su vida algún tipo de alergia” en Comunicado de prensa No.
318. Secretaría de Salud. 7 de junio del 2006. Documento electrónico:
http://www.salud.gob.mx/ssa_app/noticias/datos/2006-06-07_2254.html
9
2
P ( P) = = 0.3333 , Según lo cual, la probabilidad de que alguien o todos
6
pongan una ficha es de 33.33%.
• ¿Cuál es la probabilidad de que una denuncia presentada ante la Procuraduría

General de Justicia del Distrito Federal (PGJDF) se relacione a un delito
ambiental de tala, cometido en nuestra ciudad?
Samuel Ibarra Vargas, titular de la Fiscalía Especial para la Atención de Delitos

Ambientales de la PGJDF, precisa: “de 38 a 40 por ciento de las denuncias que
tenemos en la Fiscalía son de tala…”4.
Dicha afirmación implica ya una observación repetida del evento (denuncia por
tala), razón por la cual podemos aplicar el enfoque frecuentista:
38 40
P (T ) = = 0.3800 P (T ) = = 0.4000
100 100
, Por tanto, la probabilidad de que una denuncia se relacione a la tala es de 38 a

40%.
• ¿Cuál es la probabilidad de que llueva durante las ceremonias de inauguración

y clausura de los Juegos Olímpicos en China (2008)?
Si bien no hay forma de aquí tampoco hay forma de repetir el evento, “los
registros históricos muestran una probabilidad del 50 por ciento de que haya
precipitaciones en los días en que se llevarán a cabo las citadas ceremonias, el 8
y el 24 de agosto, respectivamente.”5
Por ende, la probabilidad del evento “lluvia durante las ceremonias” ( L ) es de:
P ( L ) = 0.5000
2. Compruebe con ayuda de los siguientes fenómenos las reglas de probabilidad:
a) El lanzamiento de una moneda balanceada.

b) La tirada de un dado no trucado.
Definamos primero el espacio muestral de ambos eventos:
MONEDA Ω = {águila, sol} #Ω = 2

DADO Ω = {1,2,3,4,5,6} #Ω = 6
4
“Aumentan denuncias por delitos ambientales en el DF” en El Universal, Secc. DF. 1° de junio del
2008. Formato electrónico: http://www.eluniversal.com.mx/notas/511216.html
5
“Controlarán clima en JO 2008 con cohetes” en El Siglo de Durango. 2 de enero del 2008. Dirección
electrónica: http://www.elsiglodedurango.com.mx/noticia/152651.controlaran-clima-en-jo-2008-con-
cohetes.siglo
10
Comprobemos ahora que la probabilidad de todos los eventos de dichos fenómenos
es mayor a cero y menor a uno:
MONEDA
Salga águila ( A ) A = {águila} # A =1 P ( A ) = 1 = 0.5000
2
Salga sol ( S ) S = {sol} #S =1 P ( S ) = 1 = 0.5000
2
DADO
Caiga uno (U ) U = {1} #U = 1 P (U ) = 1 = 0.1667
6
Caiga dos ( D ) D = {2} #D =1 P ( D ) = 1 = 0.1667
6
Caiga tres (T ) T = {3} #T = 1 P (T ) = 1 = 0.1667
6
Caiga cuatro ( C ) C = {4} #C = 1 P ( C ) = 1 = 0.1667
6
Caiga cinco ( Q ) Q = {5} #Q =1 P ( Q ) = 1 = 0.1667
6
Caiga seis ( S ) S = {6} #S =1 P ( S ) = 1 = 0.1667
6
Ahora confirmemos que la suma las probabilidades de todos los eventos de cada
fenómeno es igual a uno:
MONEDA
Salga águila ( A ) P ( A ) = 1 = 0.5000
P ( A) + P ( S ) = 1 + 1 = 2 = 1
2
Salga sol ( S ) P ( S ) = 1 = 0.5000
2 2 2
2
DADO
Caiga uno (U ) P (U ) = 1 = 0.1667 Caiga cuatro ( C ) P ( C ) = 1 = 0.1667
6 6
Caiga dos ( D ) P ( D ) = 1 = 0.1667 Caiga cinco ( Q ) P ( Q ) = 1 = 0.1667
6 6
Caiga tres (T ) P (T ) = 1 = 0.1667 Caiga seis ( S ) P(S ) = 1 = 0.1667
6 6
P (U ) + P ( D ) + P (T ) + P ( C ) + P ( Q ) + P ( S )
TOTAL
= 1 + 1 + 1 + 1 + 1 + 1 = 6 =1
6 6 6 6 6 6 6
Finalmente, elijamos o estipulemos algunos eventos para comprobar la propiedad

relativa a los eventos complementos:
MONEDA
Sea A el evento en que sale un águila.
A = {águila} # A =1 P ( A ) = 1 = 0.5000
2
Como el lanzamiento de una moneda sólo tiene dos resultados, el evento
complementos es “sale sol”
S = {sol} #S =1 P ( S ) = 1 = 0.5000
2
La suma de estos eventos debe ser, por tanto, igual a uno:
11
P ( A) + P ( S ) = 1 + 1 = 2 = 1
2 2 2
DADO
Sea N el evento en que cae un número non.
N = {1,3,5} #N =3 P ( N ) = 3 = 0.5000
6
El evento complemento de tal evento es: “cae un número par”
P = {2, 4, 6} #P =3 P ( P ) = 3 = 0.5000
6
Eventos cuya suma es igual a uno:
P ( N ) + P ( P) = 3 + 3 = 6 = 1
6 6 6
Ya estudiados los enfoques y axiomas de la teoría probabilística, en este capítulo

analizaremos cómo se aplican dichos principios al cálculo de probabilidades de
diversos tipos de eventos.
Como anteriormente mencionamos, un evento imposible ( ∅ ) es aquél que no
contiene elementos. Dado que dicho suceso no puede ocurrir, la probabilidad de un
evento imposible siempre será la mínima ⎡⎣ P ( E ) ≥ 0 ⎤⎦ ; es decir, cero:
EXPRESIÓN PARA ASIGNAR

PROBABILIDAD A UN EVENTO P (∅) = 0
IMPOSIBLE
Por el contrario, dijimos que el evento seguro ( Ω ) es aquél que contiene los mismos
elementos que el espacio muestral. El hecho de que este suceso comprenda todos los
⎡ k
⎤
eventos posibles ⎢ P ( E1 ) + ... + P ( Ek ) =
⎣
∑ P ( E ) =P ( Ω )⎥⎦
i =1
i implica, por tanto, que la
probabilidad del evento seguro siempre sea la máxima ⎡⎣ P ( E ) ≤ 1⎤⎦ ; esto es, igual a
uno:

PROBABILIDAD A UN EVENTO P (Ω) = 1
SEGURO
Evento complemento
Por otro lado, revisamos que un evento complemento (E )c
es aquél que contiene
todos los elementos del espacio muestral que no están en el evento E . Si la suma de
⎣ ( )
sus probabilidades es igual a uno ⎡ P ( E ) + P E c = 1⎤ , la probabilidad del evento
⎦
complemento puede calcularse restando a uno la probabilidad del evento E :

PROBABILIDAD A UN EVENTO P ( Ec ) = 1− P ( E )
COMPLEMENTO
12
Evento intersección y unión
Las cosas cambian, no obstante, cuando un evento comprende dos o más eventos
( E1 , E2 , E3 ,..., Ek ) . Por ello es que estudiando la teoría de conjuntos recordaremos:
1. Que el conjunto que contiene los elementos comunes a dos conjuntos ( A y B ) es
llamado intersección y denotado por A ∩ B .
2. Que el conjunto que contiene todos los elementos de A y B es llamado unión y
denotado por A ∪ B .
Ahora bien, igual que en la teoría de conjuntos, en probabilidad se denomina evento
intersección al evento que comprende sólo los elementos comunes a dos o más
eventos ( E1 , E2 , E3 ,..., Ek ) :
EVENTO INTERSECCIÓN I = ( E1 ∩ E2 )
Por otro lado, se llama evento unión al evento que contiene los elementos de dos o
más eventos ( E1 , E2 , E3 ,..., Ek ) :
EVENTO UNIÓN U = ( E1 ∪ E2 )
Intersección y unión de eventos cualesquiera

La ocurrencia de estos eventos y la asignación de probabilidad son, por ende, distintas
a las de otros sucesos:
1) Un evento intersección ocurre cuando se dan uno y otro evento; es decir,

ambos. Debido a ello, la probabilidad del evento intersección se puede calcular
dividiendo el número de elementos que comparten los eventos entre el número
de elementos del espacio muestral:
EVENTO INTERSECCIÓN
Evento en que suceden todos I = ( E1 ∩ E2 )
los eventos.
EXPRESIÓN PARA ASIGNAR P ( I ) = P ( E1 ∩ E2 )
PROBABILIDAD A LA
# de elementos comunes entre E1 y E 2
INTERSECCIÓN DE P ( E1 ∩ E2 ) =
EVENTOS CUALESQUIERA # de elementos del espacio muestral
2) Un evento unión sucede cuando se da uno u otro evento. Por tal motivo, la
probabilidad de un evento unión se puede calcular sumando las probabilidades
individuales de los eventos y restando a ello la probabilidad de su intersección:
EVENTO UNIÓN
Evento en que sucede al menos U = ( E1 ∪ E2 )
uno u otro de los eventos.
PROBABILIDAD A LA P (U ) = P ( E1 ∪ E2 ) = P ( E1 ) + P ( E2 ) − P ( E1 ∩ E2 )
UNIÓN DE EVENTOS
CUALESQUIERA
13
Intersección y unión de eventos ajenos
Los eventos ajenos son, sin embargo, un caso especial de las expresiones anteriores.
Dado que no tienen elementos en común ⎡⎣( E3 ∩ E4 ) = ∅ ⎤⎦ , la probabilidad de
intersección entre dos o más de ellos es siempre igual a cero; además, por deducción,
la probabilidad de su evento complemento es igual a uno:
PROBABILIDAD DE EVENTO
PROBABILIDAD DE
COMPLEMENTO RESPECTO A UN
ENTRE EVENTOS AJENOS
ENTRE EVENTOS AJENOS
P ( E3 ∩ E4 ) = 0 P ( E3 ∩ E4 ) = 1
c
Asimismo, como su intersección es igual a cero, su probabilidad de unión es

simplemente igual a la suma de las probabilidades individuales de sus eventos:
P (U ) = P ( E3 ∪ E4 ) = P ( E3 ) + P ( E4 ) − P ( E3 ∩ E4 )
P (U ) = P ( E3 ∪ E4 ) = P ( E3 ) + P ( E4 ) − 0
P (U ) = P ( E3 ∪ E4 ) = P ( E3 ) + P ( E4 )
EXPRESIÓN PARA ASIGNAR PROBABILIDAD A LA

UNIÓN DE EVENTOS AJENOS
P ( E3 ∪ E4 ) = P ( E3 ) + P ( E4 )
⎛ k ⎞
⇒ P ( E1 ∪ E2 ∪ E3 ∪ ... ∪ EK ) = P ⎜ ∪ Ei ⎟
⎝ i =1 ⎠
k
⇒ P ( E1 ∪ E2 ∪ E3 ∪ ... ∪ EK ) = ∑ P ( Ei )
i =1
Leyes de probabilidad
Habiendo revisado los eventos intersección y unión, podemos mencionar ya otras de

las leyes que se aplican al cálculo de probabilidad.
Leyes D’Morgan
LEYES D’MORGAN
P ( A ∩ B) = P ( A ∪ B ) P ( A ∪ B ) = P ( Ac ∩ B c )
c c c c
Leyes distributivas
LEYES DISTRIBUTIVAS
P ( A ∩ ( B ∪ C )) = P (( A ∩ B ) ∪ ( A ∩ C )) P ( A ∪ ( B ∩ C )) = P (( A ∪ B ) ∩ ( A ∪ C ))
Revisemos y apliquemos ahora todo lo anterior utilizando, una vez más, un sencillo
fenómeno aleatorio: el lanzamiento de un dado.
14
Ejemplos de aplicación
1. Si se lanza un dado no trucado, cuál es la probabilidad de los siguientes

eventos:
Lanzamiento de un dado balanceado

Número de elementos del espacio
Espacio muestral del fenómeno
muestral
Ω = {1,2,3,4,5,6} #Ω = 6
• Sea el evento D en que se obtiene un número mayor a ocho:
D ={ }⇒ #D = 0
El evento es imposible; por tanto: P ( ∅ ) = 0
, La probabilidad de que se obtenga un número mayor a ocho es nula (0.00%).
• Sea E el evento en que aparece un número menor a diez:
E = {1, 2,3, 4,5, 6} ⇒ # E = 6

El evento es seguro; por tanto: P ( Ω ) = 1
, La probabilidad de que aparezca un número menor a diez es de 100.00%.
• Sea F el evento en que sale el número uno:
F = {1} ⇒ # F = 1 P ( F ) = 1 = 0.1667
6
, La probabilidad de que salga el número uno es de 16.67%.
• Sea G el evento en que se obtiene un número diferente al uno:
G = {2,3, 4,5, 6} ⇒ # G = 5 P ( G ) = 5 = 0.8333

6
No obstante, como el evento G = número ≠ 1 es complemento del evento

F = número 1 , podemos también calcular su probabilidad mediante la siguiente
expresión:
P ( G ) = 1 − P ( F ) = 1 − 0.1667 = 0.8333
, La probabilidad de que se obtenga un número diferente al uno es de 83.33%.
Ahora veamos un poco sobre la probabilidad de intersección y unión entre eventos

cualesquiera y ajenos con tres diferentes sucesos:
15
• Sea H el evento en que aparece el número cinco:
H = {5} ⇒ # H = 1 P ( H ) = 1 = 0.1667
6
, La probabilidad de que aparezca el número cinco es de 16.67%.
• Sea I el evento en que sale un número non:
I = {1,3,5} ⇒ # I = 3 P ( I ) = 3 = 0.5000
6
, La probabilidad de que salga un número non es de 50.00%.
• Sea J el evento en que se obtiene un número menor a cuatro:
J = {1, 2,3} ⇒ # J = 3 P ( J ) = 3 = 0.5000

6
, La probabilidad de que se obtenga un número menor a cuatro es de 50.00%.
Intersección de los eventos:
• Determine la probabilidad del evento ( H ∩ I ) :
H = {5} I = {1,3,5}
Los eventos H e I comparten un elemento: el cinco ⎡⎣( H ∩ I ) = {5}⎤⎦ ; por lo cual:
# de elementos comunes entre E1 y E 2

P ( E1 ∩ E2 ) = ⇒ P ( H ∩ I ) = 1 = 0.1667
# de elementos del espacio muestral 6
, La probabilidad del evento ( H ∩ I ) es de 16.67%.
• Determine la probabilidad del evento ( H ∩ J ) :
H = {5} J = {1, 2,3}
Los eventos H e J son ajenos, ya que no tienen elementos en común

⎡⎣( H ∩ J ) = { }⎤⎦ . Debido a ello: P ( H ∩ J ) = 0
, La probabilidad del evento ( H ∩ J ) es nula (0.00%).
16
• Por deducción, determine la probabilidad del complemento para el evento

(H ∩ J ) :
P ( H ∩ J ) = 1− P ( H ∩ J ) = 1− 0 = 1
c
, La probabilidad del complemento del evento ( H ∩ J ) es de 100.00%.
Unión de los eventos:
• Determine la probabilidad del evento ( H ∪ I ) :
Sabemos que: H = {5} y que I = {1,3,5} . Por tanto, al unir los dos eventos
tenemos: ( H ∪ I ) = {1,3,5,5} . Pero, para calcular la probabilidad, hay que
eliminar el elemento común: ( H ∩ I ) = {5} ⇒ ( H ∪ I ) = {1,3,5} , resultando en:
P ( H ∪ I ) = 3 = 0.5000
6
Esto, claro está, es más sencillo aplicando la expresión para probabilidad de unión
de eventos cualesquiera (no ajenos):
FÓRMULA DATOS PARA SUSTITUIR

P ( E1 ∪ E2 ) = P ( E1 ) + P ( E2 ) − P ( E1 ∩ E2 ) H = {5} ⇒ # H = 1 ⇒ P ( H ) = 1
6
P(H ∪ I ) = P(H ) + P(I ) − P(H ∩ I ) I = {1,3,5} ⇒ # I = 3 ⇒ P ( I ) = 3
6
P ( H ∪ I ) = 1 + 3 − 1 = 3 = 0.5000 ( H ∩ I ) = {5} ⇒ P ( H ∩ I ) = 6
1
6 6 6 6
, La probabilidad del evento ( H ∪ I ) es de 50.00%.
• Determine la probabilidad del evento ( H ∪ J ) :
Sabemos que: H = {5} y que J = {1, 2,3} . Por tanto, al unir los dos eventos
tenemos: ( H ∪ J ) = {1, 2,3,5} . Así que: P ( H ∪ J ) = 4 = 0.6667 . Pero ya que

6
existe una expresión para calcular la probabilidad de unión de eventos ajenos,
ocupémosla:
FÓRMULA DATOS PARA SUSTITUIR

P ( E3 ∪ E4 ) = P ( E3 ) + P ( E4 )
H = {5} ⇒ # H = 1 ⇒ P ( H ) = 1
P(H ∪ J ) = P(H ) + P(J ) 6
J = {1, 2,3} ⇒ # J = 3 ⇒ P ( J ) = 3
P ( H ∪ J ) = 1 + 3 = 4 = 0.6667 6
6 6 6
, La probabilidad del evento ( H ∪ J ) es de 66.67%.
17
Finalmente comprobemos las leyes D’Morgan y las leyes distributivas con ayuda de
tres eventos:
• Sea A el evento en que aparece un número par:
A = {2, 4, 6} ⇒ # A = 3 P ( A ) = 3 = 0.5000
6
, La probabilidad de que aparezca un número par es de 50.00%.
• Sea B el evento en que sale un número mayor a tres:
B = {4,5, 6} ⇒ # B = 3 P ( B ) = 3 = 0.5000
6
, La probabilidad de que salga un número mayor a tres es de 50.00%.
• Sea C el evento en que se obtiene un número primo:
C = {1, 2,3,5} ⇒ # C = 4 P ( C ) = 4 = 0.6667

6
, La probabilidad de que se obtenga un número primo es de 66.67%.
Leyes D’Morgan:
P ( A ∩ B ) = P ( Ac ∪ B c ) P ( A ∪ B ) = P ( Ac ∩ B c )
c c
Elementos para comprobar
A = {2, 4, 6} ⇒ # A = 3 P ( A) = 3
6
Ac = {1,3,5} P ( A) = 1 − P ( A) = 1 − 3 = 3
c
6 6
B = {4,5, 6} ⇒ # B = 3 P ( B) = 3
6
B c = {1, 2,3} P ( B) = 1− P ( B) = 1− 3 = 3
c
6 6
( A ∩ B ) = {4, 6} P ( A ∩ B) = 2
6
P ( A ∩ B) = 1− P ( A ∩ B) = 1− 2 = 4
c
, 6 6
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B )
( A ∪ B ) = {2, 4,5, 6}
no ajenos P ( A ∪ B) = 3 + 3 − 2 = 4
6 6 6 6
P ( A ∪ B) = 1− P ( A ∪ B) = 1− 4 = 2
c
, 6 6
18
(A c
∩ B c ) = {1,3} P ( Ac ∩ B c ) = 2
6
P ( Ac ∪ B c ) = P ( Ac ) + P ( B c ) − P ( Ac ∩ B c )
(A c
∪ B c ) = {1, 2,3,5}
no ajenos P ( Ac ∪ B c ) = 3 + 3 − 2 = 4
6 6 6 6
P ( A ∩ B) = 4 P ( A ∪ B) = 2
c c
6 6
P( A ∪ B ) = 4
c c
P( A ∩ B ) = 2
c c
6 6
P ( A ∩ B ) = P ( Ac ∪ B c ) P ( A ∪ B ) = P ( Ac ∩ B c )
c c
= 4 = 0.6667 = 2 = 0.3333
6 6
,
, Finalmente, si sustituimos letras por eventos y elementos, podemos concluir que:
1. Por un lado, la probabilidad de que aparezca un 1, 2, 3 ó 5

⎡ P ( A ∩ B )c = P ( Ac ∪ B c ) ⎤ es de 66.67%.
⎣ ⎦
(
2. Por otro, la probabilidad de que salga 1 y 3 ⎡ P ( A ∪ B ) = P Ac ∩ B c ⎤ es de
⎣
c
)⎦
33.33%.
Leyes distributivas:
Elementos para comprobar
A = {2, 4, 6} ⇒ # A = 3 P ( A) = 3
6
B = {4,5, 6} ⇒ # B = 3 P ( B) = 3
6
C = {1, 2,3,5} ⇒ # C = 4 P (C ) = 4
6
( A ∩ B ) = {4, 6} P ( A ∩ B) = 2
6
P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B )
( A ∪ B ) = {2, 4,5, 6}
no ajenos P ( A ∪ B) = 3 + 3 − 2 = 4
6 6 6 6
( A ∩ C ) = {2} P( A∩C) = 1
6
P ( A ∪ C ) = P ( A) + P ( C ) − P ( A ∩ C )
( A ∪ C ) = {1, 2,3, 4,5, 6}
no ajenos P( A∪C) = 3 + 4 − 1 = 6
6 6 6 6
( ( A ∪ B ) ∩ ( A ∪ C ) ) = {2, 4,5, 6} P (( A ∪ B ) ∩ ( A ∪ C )) = 4
6
P (( A ∩ B ) ∪ ( A ∩ C )) = P ( A ∩ B ) + P ( A ∩ C )
( ( A ∩ B ) ∪ ( A ∩ C ) ) = {2, 4, 6}
ajenos P (( A ∩ B ) ∪ ( A ∩ C )) = 2 + 1 = 3
6 6 6
19
( B ∩ C ) = {5} P(B ∩C) = 1

6
P ( B ∪ C ) = P ( B ) + P (C ) − P ( B ∩ C )
( B ∪ C ) = {1, 2,3, 4,5, 6}
no ajenos P(B ∪C) = 3 + 4 − 1 = 6
6 6 6 6
( A ∩ ( B ∪ C ) ) = {2, 4, 6} P ( A ∩ ( B ∪ C )) = 3
6
P ( A ∪ ( B ∩ C ) ) = P ( A) + P ( B ∩ C )
( A ∪ ( B ∩ C ) ) = {2, 4,5, 6}
ajenos P ( A ∪ ( B ∩ C )) = 3 + 1 = 4
6 6 6
P ( A ∩ ( B ∪ C )) = 3 P ( A ∪ ( B ∩ C )) = 4
6 6
P (( A ∩ B ) ∪ ( A ∩ C )) = 3 P (( A ∪ B ) ∩ ( A ∪ C )) = 4
6 6
= 3 = 0.5000 = 4 = 0.6667
6 6
, Es decir:
1. La probabilidad de que se obtenga un 2, 4 ó 6

⎡⎣ P ( A ∩ ( B ∪ C ) ) = P ( ( A ∩ B ) ∪ ( A ∩ C ) ) ⎤⎦ es de 50.00%.
2. La probabilidad de que aparezca un 2, 4, 5 ó 6
( ) ( )
⎡⎣ P A ∪ ( B ∩ C ) = P ( A ∪ B ) ∩ ( A ∪ C ) ⎤⎦ es de 66.67%.
Probabilidad condicional
Otra forma de analizar dos o más eventos es investigar si la ocurrencia de uno

depende de otro. En vistas de tal objetivo, la teoría probabilística ha desarrollado la
probabilidad condicional, que por definición es la probabilidad de que suceda un
evento dado que haya ocurrido otro y se denota por: P A B . ( )
Probabilidad condicional de eventos cualesquiera
Para asignar dicha probabilidad, basta dividir la probabilidad de intersección de los

eventos entre la probabilidad del evento que debió haberse dado:
EXPRESIÓN PARA DETERMINAR LA

PROBABILIDAD CONDICIONAL DE DOS EVENTOS CUALESQUIERA
P ( A ∩ B) P ( A ∩ B)
P ( A B) = P ( B A) =
P ( B) P ( A)
Pese a su parecido, la operación “probabilidad condicional” no tiene propiedad

conmutativa. Por ello debe vigilarse con atención cuál es la probabilidad del evento
causante y cuál es la de evento consecuencia.
Probabilidad condicional de eventos ajenos
20
Dicho esto, podemos hacer otra excepción a la fórmula general: al ser la probabilidad
de intersección de eventos ajenos igual a cero, su probabilidad condicional deviene
también cero:
PROBABILIDAD CONDICIONAL DE EVENTOS AJENOS

P (C ∩ D ) P (C ∩ D )
P (C D ) = P(D C) =
0 0
= =0 = =0
P ( D) P ( D) P (C ) P (C )
Eventos independientes
Si bien la operación probabilidad condicional proporciona la probabilidad de que

suceda un evento dado otro, también nos permite identificar cuando los eventos
analizados son eventos independientes: eventos cuya probabilidad de suceso no se
ve afectada por la ocurrencia de otros.
Para ello basta simplemente comprobar si, y sólo si, la probabilidad condicional
calculada es igual a la probabilidad de evento consecuencia:
EVENTOS INDEPENDIENTES P ( A B ) = P ( A)
A y B son eventos independientes ⇔ P ( B A) = P ( B )
Intersección de eventos independientes
Sabiendo que la probabilidad condicional se calcula mediante la expresión

P ( A ∩ B)
P ( A B) = y que la probabilidad condicional de eventos independientes es
P ( B)
( )
igual a P A B = P ( A ) ; dada la relación entre elementos podemos aplicar la
P ( A ∩ B)
propiedad transitiva de igualdad y deducir lo siguiente: = P ( A ) . Por ende:
P ( B)
P ( A ∩ B ) = P ( A) ⋅ P ( B ) .
REGLA DE LA
P ( A ∩ B)
P ( A B) = MULTIPLICACIÓN DE
P ( B) P ( A ∩ B) EVENTOS
⇒ = P ( A) ⇒ INDEPENDIENTES
P ( B)
P ( A B ) = P ( A) P ( A ∩ B ) = P ( A) ⋅ P ( B )
Es debido a ello que la probabilidad de intersección de eventos independientes es, no

igual a la suma de sus probabilidades individuales, sino a la multiplicación de éstas:
EXPRESIÓN PARA ASIGNAR PROBABILIDAD A LA

INTERSECCIÓN DE EVENTOS INDEPENDIENTES
21
P ( E1 ∩ E2 ) = P ( E1 ) ⋅ P ( E2 )
⇒ P ( E1 ∩ E2 ∩ E3 ∩ ... ∩ EK ) = P ( E1 ) ⋅ P ( E2 ) ⋅ P ( E3 ) ⋅ ... ⋅ P ( EK )
k
⇒ P ( E1 ∩ E2 ∩ E3 ∩ ... ∩ EK ) = ∏ P ( Ei )
i =1
1. Veamos primero un ejemplo abstracto de la probabilidad condicional de

eventos cualesquiera y eventos ajenos con algunos de los casos que estudiamos
sobre el lanzamiento de un dado:
• Sea H el evento en que aparece el número cinco:

• Sea I el evento en que sale un número non:
• Sea J el evento en que se obtiene un número menor a cuatro:
Elementos para cálculo de probabilidad condicional

H = {5} ⇒ # H = 1 P(H ) = 1
6
I = {1,3,5} ⇒ # I = 3 P(I ) = 3
6
J = {1, 2,3} ⇒ # J = 3 P(J ) = 3
6
( H ∩ I ) = {5} P(H ∩ I ) = 1
6
(H ∩ J ) = { } P(H ∩ J ) = 0
P(H ∩ I ) 1 6 6 P(H ∩ I ) 1 6 6
P(H I ) = = = = 0.3333 P(I H ) = = = =1
P(I ) 3 6 18 P(H ) 16 6
P(H ∩ J ) P(H ∩ J ) 0
P(H J ) = P(J H ) =
0
= =0 = =0
P(J ) 36 P(H ) 16
, De dichos cálculos concluimos que:
1. La probabilidad de que en el próximo lanzamiento aparezca el número cinco,

dado que salió un número non, es de 33.33%
2. La probabilidad de que en el próximo lanzamiento salga un número non, dado
que apareció previamente el número cinco, es de 100.00%.
Por otra parte, como los eventos H y J son ajenos:
3. La probabilidad de que en el próximo lanzamiento aparezca el número cinco,

dado que se obtuvo un número menor a cuatro, es nula (0.00%).
4. La probabilidad de que en el próximo lanzamiento se obtenga un número
menor a cuatro, dado que apareció el número cinco, es nula (0.00%).
2. Considérense ahora los siguientes datos correspondientes a cráneos

clasificados por sexo y grado de criba orbitaria:
22
CRIBA
AUSENCIA INCIPIENTE SEVERA
( A) (I ) (S ) TOTAL
FEMENINO
21 34 52 107
(F )
SEXO
MASCULINO
36 20 17 73
(M )
TOTAL 57 54 69 180
Si se selecciona un caso de la población, ¿cuál es la probabilidad de que…
a) sea femenino?
b) presente criba incipiente?
c) sea femenino y presente criba incipiente?
d) sea femenino o presente criba incipiente?
e) presente criba incipiente dado que es femenino?
f) presente criba dado que es masculino?
Veamos cómo, al registrar la información en una tabla de contingencia, la asignación

de probabilidades es mucho más sencilla, especialmente en los casos de probabilidad
condicional.
a) sea femenino?
Probabilidad que requiere observar 107

la frecuencia relativa de dicho P(F ) = = 0.5944
evento: 180
, La probabilidad de que el caso sea femenino es de 59.44%.
b) presente criba incipiente?

Se trata, igualmente, de una 54
P(I ) = = 0.3000
probabilidad por frecuencia relativa: 180
, La probabilidad de que el caso presente criba incipiente es de 30.00%.
c) sea femenino y presente criba incipiente?

Esto implica, por tanto, buscar la 34
intersección de los eventos P(F ∩ I ) = = 0.1889
femenino y criba incipiente: 180
, La probabilidad de que el caso sea femenino y presente criba incipiente es de
18.89%.
d) sea femenino o presente criba incipiente?

Esto implica, por tanto, buscar la P ( F ∪ I ) = P ( F ) + P (U ) − P ( F ∩ I )
unión de los mismos eventos, que 107 54 34 127
comprobamos no son ajenos: P(F ∪ I ) = + − = = 0.7056
180 180 180 180
, La probabilidad de que el caso sea femenino o presente criba incipiente es de
70.56%.
23
e) presente criba incipiente dado que es femenino?
OPCIÓN 1 Para tal probabilidad
condicional necesitamos las
P ( F ∩ I ) 34 180
probabilidades individuales
de ambos eventos y la
P I F =
P(F )
= ( = )
6120
107 180 19260
= 0.3178
probabilidad de su
intersección:
OPCIÓN 2
Para su cálculo sólo es

necesario tomar en cuenta
P(I F ) =
34
= 0.3178
los casos femeninos con 107
criba incipiente:
, La probabilidad de que el caso presente criba incipiente dado que es femenino es

de 31.78%.
e) presente criba severa dado que es masculino?

OPCIÓN 2
Por ser más fácil, sólo

P(S M ) =
17
consideramos los casos que = 0.2329
cumplen ambos requisitos: 73
, La probabilidad de que el caso presente criba severa dado que es masculino es de

23.29%.
3. Supongamos que se contesta al azar una quiniela Progol (con 14 partidos y 3

resultados). ¿Cuál es la probabilidad de ganar así el premio mayor?
De entrada tenemos que, al haber tres casillas posibles (local, empate y visita), la
probabilidad de atinarle al resultado de cada partido es:
1
P ( Ai ) =
3
Ahora bien, sabemos que para ganar el premio mayor deben marcarse correctamente
el resultado de todos los encuentros. Esto es:
P ( G ) = P ( A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5 ∩ A6 ∩ A7 ∩ A8 ∩ A9 ∩ A10 ∩ A11 ∩ A12 ∩ A13 ∩ A14 )
Finalmente, como el resultado de los partidos es independiente, podemos aplicar la

regla de la multiplicación de eventos independientes y calcular la probabilidad de
ganar:
⎡ P ( A1 ) ⋅ P ( A2 ) ⋅ P ( A3 ) ⋅ P ( A4 ) ⋅ P ( A5 ) ⋅ P ( A6 ) ⋅ P ( A7 ) ⎤
P (G ) = ⎢ ⎥
⎣⎢⋅P ( A8 ) ⋅ P ( A9 ) ⋅ P ( A10 ) ⋅ P ( A11 ) ⋅ P ( A12 ) ⋅ P ( A13 ) ⋅ P ( A14 ) ⎦⎥
⎡⎛ 1 ⎞ ⎛ 1 ⎞⎛ 1 ⎞⎛ 1 ⎞⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞⎛ 1 ⎞⎛ 1 ⎞⎛ 1 ⎞⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞ ⎤
P ( G ) = ⎢⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎥
⎣⎝ 3 ⎠ ⎝ 3 ⎠⎝ 3 ⎠⎝ 3 ⎠⎝ 3 ⎠ ⎝ 3 ⎠ ⎝ 3 ⎠ ⎝ 3 ⎠⎝ 3 ⎠⎝ 3 ⎠⎝ 3 ⎠⎝ 3 ⎠ ⎝ 3 ⎠ ⎝ 3 ⎠ ⎦
14
⎛1⎞
P ( G ) = ⎜ ⎟ = 2.0908 x10−7
⎝ 3⎠
24
, Gracias a esto sabemos que la probabilidad de ganar el premio mayor de Progol

(contestando la quiniela al azar), es casi nula: de 0.000020908%.
4. Ante la decepción anterior, intentamos ahora con el Melate. ¿Cuál es la

probabilidad de que la combinación elegida sea idéntica a la que sale en el sorteo?
Primero que nada observemos que el Melate consiste en

seleccionar 6 números entre el 1 y el 56. Es por ello que con
cada elección hay menos números que se pueden escoger,
provocando que las probabilidades de acertar cambien:
1 1 1
P (U ) = P ( D) = P (T ) =
56 55 54
1 1 1
P (C ) = P (Q ) = P(S ) =
53 52 51
Dado que la aparición de los números en el sorteo es

también independiente:
P ( G ) = P (U ∩ D ∩ T ∩ C ∩ Q ∩ S )
P ( G ) = ⎡⎣ P (U ) ⋅ P ( D ) ⋅ P (T ) ⋅ P ( C ) ⋅ P ( Q ) ⋅ P ( S ) ⎤⎦
⎡⎛ 1 ⎞ ⎛ 1 ⎞⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞ ⎤ 1
P ( G ) = ⎢⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎥ =
⎣⎝ 56 ⎠ ⎝ 55 ⎠⎝ 54 ⎠ ⎝ 53 ⎠ ⎝ 52 ⎠ ⎝ 51 ⎠ ⎦ 2.3377 x10
10
P ( G ) = 4.2777 x10−11
, Y así nos percatamos de que atinarle al Melate es mucho más difícil; de hecho, la
probabilidad de acertar por azar a los seis números es de 0.0000000042777%.
5. Resignados ante la improbabilidad de conquistar los juegos de Pronósticos, los

amigos han decidido ganar dinero apostando entre ellos. Su objetivo: acertar el
resultado de una moneda, un dado y una ruleta. Si uno de ellos apuesta a “sol”,
“número primo” y “número par”, respectivamente, ¿cuál es la probabilidad de que
gane?
Analicemos primero los espacios muestrales de dichos fenómenos y la probabilidad de

tales eventos:
MONEDA
Ω = {águila, sol} #Ω = 2
Aparece “sol”
S = {sol} #S =1 P(S ) = 1
2
25
DADOS
Ω = {1,2,3,4,5,6} #Ω = 6
Sale “número primo”
R = {1, 2,3,5} #R = 4 P ( R) = 4
6
RULETA
⎧0,1, 2, 3, 4, 5, 6, 7,8, 9,10,11,12,13,14,15,16,17,18,19, 20, ⎫
Ω=⎨ ⎬ # Ω = 37
⎩ 21, 22, 23, 24, 25, 26, 27, 28, 29, 30,31, 32,33, 34, 35, 36 ⎭
Cae “número par”
A = {2, 4, 6,8,10,12,14,16,18, 20, 22, 24, 26, 28, 30, 32, 34, 36} # A = 18 P ( A ) = 18
37
Dado que los resultados de estos juegos son independientes:
P ( G ) = P ( R ∩ S ∩ A)
P ( G ) = ⎡⎣ P ( R ) ⋅ P ( S ) ⋅ P ( A ) ⎤⎦
⎛ 1 ⎞ ⎛ 4 ⎞⎛ 18 ⎞ 72
P ( G ) = ⎜ ⎟ ⎜ ⎟⎜ ⎟ = = 0.1622
⎝ 2 ⎠ ⎝ 6 ⎠⎝ 37 ⎠ 444
, La probabilidad de que esa persona gane es de 16.22%

6. Cambiando de tema, en una muestra de la Ciudad de México se obtuvo que la
distribución de grupos sanguíneos es la siguiente:
GRUPO PORCENTAJE
A 20.00%
B 8.00%
AB 1.00%
O 71.00%
Calcular la probabilidad de que una persona X pueda recibir sangre de una persona Y
(ambas elegidas al azar), a sabiendas de las siguientes limitaciones:
SANGRE PUEDE RECIBIR DONACIÓNES DE:

A AyO
B ByO
AB A, B, AB y O
O O
Observemos primero el espacio muestral para el tipo de sangre de dos personas:
⎪⎧ ( A, A) , ( A, B ) , ( A, AB ) , ( A, O ) , ( B, A ) , ( B, B ) , ( B, AB ) , ( B, O ) , ⎪⎫
Ω=⎨ ⎬
⎪⎩( AB, A ) , ( AB, B ) , ( AB, AB ) , ( AB, O ) , ( O, A ) , ( O, B ) , ( O, AB ) , ( O, O ) , ⎪⎭
Ahora definamos los puntos muestrales para el evento de la posible donación:
D = {( A, A), ( A, O ), (B, B ), (B, O ), ( AB, A), ( AB, B ), ( AB, AB ), ( AB, O ), (O, O )}
Si la donación puede realizarse con cualquiera de esos sub-eventos:
26
P ( D ) = P ( ( A, A ) ∪ ( A, O ) ∪ ( B, B ) ∪ ( B, O ) ∪ ( AB, A ) ∪ ( AB, B ) ∪ ( AB, AB ) ∪ ( AB, O ) ∪ ( O, O ) )
⎡ P ( A, A ) + P ( A, O ) + P ( B, B ) + P ( B, O ) + P ( AB, A ) ⎤
P ( D) = ⎢ ⎥
⎢⎣ + P ( AB, B ) + P ( AB, AB ) + P ( AB, O ) + P ( O, O ) ⎥⎦
Y el tipo de sangre de una persona es independiente del grupo sanguíneo que tiene la
otra:
⎡( P ( A ) ⋅ P ( A ) ) + ( P ( A ) ⋅ P ( O ) ) + ( P ( B ) ⋅ P ( B ) ) + ( P ( B ) ⋅ P ( O ) ) + ( P ( AB ) ⋅ P ( A ) ) ⎤
P ( D) = ⎢ ⎥
⎢⎣ + ( P ( AB ) ⋅ P ( B ) ) + ( P ( AB ) ⋅ P ( AB ) ) + ( P ( AB ) ⋅ P ( O ) ) + ( P ( O ) ⋅ P ( O ) ) ⎥⎦
P ( D) = ⎢
( ) ( )
⎡ P ( A )2 + ( P ( A ) ⋅ P ( O ) ) + P ( B )2 + ( P ( B ) ⋅ P ( O ) ) + ( P ( AB ) ⋅ P ( A ) ) ⎤
⎥
⎢
⎢⎣ ( )
+ ( P ( AB ) ⋅ P ( B ) ) + P ( AB ) + ( P ( AB ) ⋅ P ( O ) ) + P ( O )
2 2
( )
⎥
⎥⎦
Simplemente sustituimos, multiplicamos los sub-eventos y sumamos la probabilidad de

los eventos:
P ( D) = ⎢
( ) ( )
⎡ ( 0.2 )2 + ( ( 0.2 ) ⋅ ( 0.71) ) + ( 0.08 )2 + ( ( 0.08 ) ⋅ ( 0.71) ) + ( ( 0.01) ⋅ ( 0.2 ) ) ⎤
⎥
⎢
⎢⎣ ( )
+ ( ( 0.01) ⋅ ( 0.08 ) ) + ( 0.01) + ( ( 0.01) ⋅ ( 0.71) ) + ( 0.71)
2
( 2
) ⎥
⎥⎦
P ( D ) = [ 0.0400 + 0.1420 + 0.0064 + 0.0568 + 0.0020 + 0.0008 + 0.0001 + 0.0071 + 0.5041]
P ( D ) = 0.7593
, La probabilidad de que una persona X pueda recibir sangre de una persona Y
(siendo ambas elegidas al azar) es de 75.93%.
7. Revisemos por último el caso de una familia mexicana que, a fin de llevar a
cabo una planificación familiar, ha decidido tener descendientes hasta que nazca la
primer niña; claro está, con un máximo de cinco retoños. De acuerdo al INEGI la
probabilidad de que el recién nacido sea hombre es de 0.507, mientras que la
probabilidad de que nazca una mujer es de 0.493. Suponiendo que dichos eventos son
independientes, calcular las siguientes probabilidades:
a) ¿Cuál es la probabilidad de que finalmente haya más niños que niñas?

b) Si el primer hijo es varón, ¿cuál es la probabilidad de que finalmente tengan tres
hijos en total?
Como siempre, definamos primero el espacio muestral del fenómeno:
Ω = {( F ) , ( M , F ) , ( M , M , F ) , ( M , M , M , F ) , ( M , M , M , M , F ) , ( M , M , M , M , M )}
a) ¿Cuál es la probabilidad de que finalmente haya más niños que niñas?
27
O = {( M , M , F ) , ( M , M , M , F ) , ( M , M , M , M , F ) , ( M , M , M , M , M )}
P (O ) = P (( M , M , F ) ∪ ( M , M , M , F ) ∪ ( M , M , M , M , F ) ∪ ( M , M , M , M , M ))
P ( O ) = ⎡⎣ P ( M , M , F ) + P ( M , M , M , F ) + P ( M , M , M , M , F ) + P ( M , M , M , M , M ) ⎤⎦
⎡ ( P ( M ) ⋅ P ( M ) ⋅ P ( F )) + ( P ( M ) ⋅ P ( M ) ⋅ P ( M ) ⋅ P ( F )) ⎤
P (O ) = ⎢ ⎥
⎢⎣ + ( P ( M ) ⋅ P ( M ) ⋅ P ( M ) ⋅ P ( M ) ⋅ P ( F ) ) + ( P ( M ) ⋅ P ( M ) ⋅ P ( M ) ⋅ P ( M ) ⋅ P ( M ) ) ⎥⎦
⎡( 0.507 ⋅ 0.507 ⋅ 0.493) + ( 0.507 ⋅ 0.507 ⋅ 0.507 ⋅ 0.493) ⎤

⎢ ⎥
P (O ) = ⎢ + ( 0.507 ⋅ 0.507 ⋅ 0.507 ⋅ 0.507 ⋅ 0.493) + ⎥
⎢ ⎥
⎣ ( 0.507 ⋅ 0.507 ⋅ 0.507 ⋅ 0.507 ⋅ 0.507 ) ⎦
⎣ ( 2
) ( 3
) (
P ( O ) = ⎡ ( 0.507 ) ⋅ 0.493 + ( 0.507 ) ⋅ 0.493 + ( 0.507 ) ⋅ 0.493 + ( 0.507 ) ⎤
4 5
⎦ ) ( )
⎣ ( 2
) ( 3
) (
P ( O ) = ⎡ ( 0.507 ) ⋅ 0.493 + ( 0.507 ) ⋅ 0.493 + ( 0.507 ) ⋅ 0.493 + ( 0.507 ) ⎤
4 5
⎦ ) ( )
P ( O ) = ⎡⎣( 0.257 ⋅ 0.493) + ( 0.130 ⋅ 0.493) + ( 0.066 ⋅ 0.493) + ( 0.033) ⎤⎦
P ( O ) = ⎡⎣( 0.127 ) + ( 0.064 ) + ( 0.033) + ( 0.033) ⎤⎦ = 0.257
, La probabilidad de que esta familia tenga más niños que niñas es de 25.7%.
b) Si el primer hijo es varón, ¿cuál es la probabilidad de que finalmente tengan tres

hijos en total?
P (( M , M , F ) ∩ M ) P (( M , M , F ))
P (T ) = P ( ( M , M , F ) M ) =
0.127
= = = 0.250
P(M ) P(M ) 0.507
,La probabilidad de que, dado que el prime hijo es varón, la familia tenga finalmente
tres hijos es de 25.00%
Ley de probabilidad total y teorema de Bayes
Veamos por último otro par de formas para analizar la probabilidad de eventos
relacionados: 1) la ley de probabilidad total, que tomando en cuenta la probabilidad de
todas las causas posibles, permite determinar la probabilidad de un evento
consecuencia y 2) el teorema de Bayes, que habiendo observado un evento
consecuencia, hace posible deducir la probabilidad de los diferentes eventos
causantes.
28
Ley de probabilidad total
Considérese primero un conjunto finito de eventos ({ B } i i =1...k ) diferentes al vacío,
mutuamente excluyentes y que conforman un espacio muestral ( Ω ) :
( B1 ∩ B2 ∩ B3 ∩ ... ∩ Bk ) = ∅
k
( B1 ∪ B2 ∪ B3 ∪ ... ∪ Bk ) = ∪ Bi = Ω
i =1
⎛ k ⎞
P ( B1 ∪ B2 ∪ B3 ∪ ... ∪ Bk ) = P ⎜ ∪ Bi ⎟ = P ( Ω )
⎝ i =1 ⎠
P ( B1 ) + P ( B2 ) + P ( B3 ) + ... + P ( Bi ) = 1
Imagínese ahora un evento cualquiera ( A) relacionado con el mismo espacio

muestral:
( A ∩ Ω) = A
( A ∪ Ω) = Ω
Si los eventos ajenos ( Bi ) tienen partes en común con A , dicho evento cualquiera, su
tamaño y probabilidad pueden ser descritos de la siguiente manera:
A = ⎡⎣ A ∩ ( B1 ∪ B2 ∪ B3 ∪ ... ∪ Bk ) ⎤⎦
A = ⎡⎣( A ∩ B1 ) ∪ ( A ∩ B2 ) ∪ ( A ∩ B3 ) ∪ ... ∪ ( A ∩ Bk ) ⎤⎦
P ( A ) = ⎡⎣ P ( A ∩ B1 ) + P ( A ∩ B2 ) + P ( A ∩ B3 ) + ... + P ( A ∩ Bk ) ⎤⎦
29
Ahora bien, si vemos cada evento desde la perspectiva de la probabilidad condicional:
P ( A ∩ Bi )
P ( A Bi ) = ⇒ P ( A ∩ Bi ) = P ( A Bi ) ⋅ P ( Bi )
P ( Bi )
Podemos afirmar que:
P ( A ) = ⎡⎣ P ( A B1 ) ⋅ P ( B1 ) + P ( A B2 ) ⋅ P ( B2 ) + P ( A B3 ) ⋅ P ( B3 ) + ... + P ( A Bk ) ⋅ P ( Bk ) ⎤⎦
Expresión que, al ser resumida, da origen a la ley de probabilidad total:
⎡ k ⎤
LEY DE PROBABILIDAD TOTAL ( )
P ( A) = ⎢∑ P A B j ⋅ P ( B j )⎥
⎣ j =1 ⎦
Como su nombre lo dice, dicha ley permite calcular la probabilidad total de un evento
cualquiera ( A ) tomando en cuenta su probabilidad condicional ⎡⎣ P A B ⎤⎦ , así como ( )
la existencia y probabilidad a priori de otros sucesos ⎡⎣ P ( Bi ) ⎤⎦ .
Gracias a ello, la ley de probabilidad total permite determinar la contribución de cada
uno de los posibles eventos “causa” ( Bi ) a la probabilidad de un evento
“consecuencia” ( A ) .
Teorema de Bayes
Sabiendo que:
(
P ( A ∩ Bj ) = P A Bj ⋅ P ( Bj ) )
Podemos considerar a la probabilidad condicional como:
P ( B j A) =
P ( A ∩ Bj )
=
(
P A Bj ⋅ P ( Bj ))
P ( A) P ( A)
Empero, si un fenómeno cumple con las condiciones para que la ley de probabilidad
total se verifique:
⎡ k ⎤
(
P ( A) = ⎢∑ P A B j ⋅ P ( B j )⎥ )
⎣ j =1 ⎦
La anterior probabilidad condicional se puede definir como:
P ( B j A) =
( )
P A Bj ⋅ P ( Bj )
=
( )
P A Bj ⋅ P ( Bj )
P ( A)
∑ P( A B )⋅ P(B )
k
j j
i =1
Expresión que corresponde al Teorema de Bayes:
30
P ( B j A) =
(
P A Bj ⋅ P ( Bj ))
TEOREMA DE BAYES
∑ P( A B )⋅ P(B )
k
j j
i =1
Que, al suponer que la probabilidad de ocurrencia del evento A es distinta según el

suceso Bi que haya ocurrido, permite determinar la probabilidad de las causas a partir
del efecto observado.
1. Defina, en abstracto, los elementos necesarios para desarrollar la ley de

probabilidad total y el teorema de Bayes en un fenómeno cuyo espacio muestral está
compuesto por sólo dos eventos ajenos:
Ω = ( B ∪ Bc )
Dado que sólo hay dos eventos causa, la probabilidad total del evento consecuencia
conlleva dos sumandos donde lo que cambia en la probabilidad condicional y en la
individual es el evento ajeno que se utiliza:
LEY DE ⎡ k ⎤
PROBABILIDAD ( )
P ( A) = ⎢∑ P A B j ⋅ P ( B j )⎥
TOTAL ⎣ j =1 ⎦
APLICACIÓN
⎣ (
P ( A) = ⎡ P ( A B ) ⋅ P ( B ) + P A Bc ⋅ P ( Bc )⎤
⎦ )
En lo que respecta al teorema de Bayes hay dos expresiones posibles: una para
calcular la probabilidad de cada causa, y aunque los denominadores son iguales entre
ellos e iguales a la expresión para la ley de probabilidad total, el numerador difiere de
nuevo en el evento ajeno que se busca:
TEOREMA DE P ( B j A) =
( )
P A Bj ⋅ P ( Bj )
∑ P( A B )⋅ P(B )
k
BAYES
j j
i =1
P ( A B) ⋅ P ( B)
P ( B A) =
P ( A B) ⋅ P ( B) + P ( A B ) ⋅ P ( B )
APLICACIÓN c c
31
P ( B A) =
c
( )
P A Bc ⋅ P ( Bc )
( )
P ( A B ) ⋅ P ( B ) + P A Bc ⋅ P ( Bc )
2. Supongamos que en la ENAH, la estatura del 8.0% de los hombres y del 1.0%
de las mujeres es mayor de 1.75 metros ( E ) . Si el 60.0% de los estudiantes son
mujeres y se selecciona un alumno cuya estatura es mayor de 1.75 m.: ¿cuál es la
probabilidad de que el estudiante sea:
a) mujer ( M ) ? b) hombre ( H ) ?
Vemos primero los datos que nos aporta el problema:
DATOS
Probabilidad de que el alumno mida
más de 1.75 m. dado que es hombre:
P E H = 0.08 ( )
Probabilidad de que el alumno mida
más de 1.75 m. dado que es mujer:
P E M = 0.01 ( )
Probabilidad de que el alumno sea P ( M ) = 0.60
mujer:
alumno sea hombre:

( ) ( ) ( )
, Se infiere la probabilidad de que el P H = P M c = 1 − P M = 1 − 0.60 = 0.40
Al buscar la probabilidad condicional inversa (de que el estudiante sea hombre o mujer
dado que mide más de 1.75m.) aplicamos el teorema de Bayes:
( )
P A Bj ⋅ P ( Bj )
∑ P( A B )⋅ P(B )
k
BAYES
j j
i =1
a) Sea mujer:
P(E M )⋅ P(M )
P(M E) =
P(E M )⋅ P(M ) + P(E H )⋅ P(H )
⇒ P(M E) =
( 0.01)( 0.60 ) = 0.1579
( 0.01)( 0.60 ) + ( 0.08 )( 0.40 )
, La probabilidad de que el estudiante de más de 1.75 metros escogido al azar sea
mujer es de 15.79%.
a) Sea hombre:
P(E H )⋅ P(H )
P(H E) =
P(E M )⋅ P(M ) + P(E H )⋅ P(H )
⇒ P(H E) =
( 0.08 ) ⋅ ( 0.40 ) = 0.8421
( 0.01)( 0.60 ) + ( 0.08 )( 0.40 )
, Dicho resultado también puede alcanzarse por evento complemento gracias a que
el fenómeno posee sólo dos eventos ajenos:
P ( H E ) = P ( M c E ) = 1 − P ( M E ) = 1 − 0.1579 = 0.8421
32
, En conclusión, dado que el estudiante elegido al azar mide más de 1.75 m., la
probabilidad de que sea hombre es de 84.21%.
3. Supóngase ahora que la proporción de personas que en una comunidad

padece cierta enfermedad ( E ) es muy pequeña (0.005); no obstante, se ha
desarrollado una prueba para diagnosticarla. Si un individuo le padece, la probabilidad
de que la prueba dé positivo ( + ) es de 0.99, mientras que, si la persona no está
enferma, la probabilidad de que la prueba dé una señal positiva ( + ) es de 0.01. ¿Cuál
es entonces la probabilidad de que:
a) el sujeto esté realmente enfermo porque la prueba dio positivo?

b) la persona no esté enferma, aunque la prueba haya resultado positiva?
c) el individuo padezca la enfermedad, pese a que la prueba sea negativa?
d) el sujeto no esté enfermo, pues la prueba salió negativa?
DATOS
Probabilidad de que una persona P( E ) = 0.005
padezca la enfermedad:
, Se infiere la probabilidad de que una P( E c ) = 1 − P ( E ) = 1 − 0.005 = 0.995
persona NO padezca la enfermedad:
Probabilidad de que, dado que el
individuo está enfermo, aparezca una P (+ | E ) = 0.99
prueba positiva:
, Se infiere la probabilidad de que la
prueba sea negativa, aunque el sujeto P (+ c | E ) = 1 − P(+ | E ) = 1 − 0.99 = 0.01
padezca la enfermedad:
Probabilidad de que, dado que el
individuo NO está enfermo, aparezca una P (+ | E c ) = 0.01
prueba positiva:
, Se infiere la probabilidad de que la
prueba sea negativa, dado que el sujeto P (+ c | E c ) = 1 − P (+ | E c ) = 1 − 0.01 = 0.99
no está enfermo:
En vistas de que buscamos de nuevo la probabilidad condicional, aplicamos el

teorema de Bayes:
( )
P A Bj ⋅ P ( Bj )
∑ P( A B )⋅ P(B )
k
BAYES
j j
i =1
a) el sujeto esté realmente enfermo porque la prueba dio positivo?

P(+ | E ) ⋅ P( E )
P( E | +) =
P(+ | E ) ⋅ P( E ) + P(+ | E c ) ⋅ P( E c )
⇒ P( E | +) =
( 0.99 )( 0.005) = 0.3322
( 0.99 )( 0.005) + ( 0.01)( 0.995 )
, La probabilidad de que el sujeto esté realmente enfermo dado que la prueba dio
positivo es de 33.22%.
33
b) la persona no esté enferma, aunque la prueba haya resultado positiva?
P(+ | E c ) ⋅ P( E c )
P( E c | +) =
P(+ | E c ) ⋅ P( E c ) + P(+ | E ) ⋅ P( E )
P( E c | +) =
( 0.01)( 0.995) = 0.6678
( 0.01)( 0.995) + ( 0.99 )( 0.005)
O bien, por evento complemento:

P( E | + ) = 1 − P( E | + ) = 1 − 0.3322 = 0.6678
c
, La probabilidad de que la persona no esté enferma, aunque la prueba haya

resultado positiva, es de 66.78%. Es decir, la probabilidad de un falso positivo es
bastante alta y debería buscarse una forma de confirmar el resultado de la prueba.
c) el individuo padezca la enfermedad, pese a que la prueba sea negativa?

P(+ c | E ) ⋅ P( E )
P( E | + c ) =
P(+ c | E ) ⋅ P( E ) + P(+ c | E c ) ⋅ P( E c )
P( E | + c ) =
( 0.01)( 0.005) = 0.00005
( 0.01)( 0.005) + ( 0.99 )( 0.995)
, La probabilidad de que el individuo padezca la enfermedad, pese a un resultado
negativo en la prueba, es de 0.005%. Por lo cual podemos afirmar que la probabilidad
de un falso negativo es muy pequeña.
d) el sujeto no esté enfermo, pues la prueba salió negativa?

P ( E c | + c ) = 1 − P ( E | + c ) = 1 − 0.00005 = 0.99995
, La probabilidad de que el sujeto no esté enfermo dado que la prueba salió negativa
es de 99.99%.
4. Digamos que una población está conformada por tres grupos étnicos
⎡⎣ Ω = ( X , Y , Z ) ⎤⎦ en la siguiente proporción: 0.30, 0.10 y 0.60. Si el porcentaje de
personas con ojos claros ( C ) en cada grupo es, respectivamente, de 20%, 40% y 5%,
calcular la probabilidad de que:
a) Un sujeto de dicha comunidad entrevistado al azar tenga los ojos claros.

b) Un individuo de esa comunidad (elegido al azar) tenga los ojos oscuros y sea del
grupo X.
c) La persona seleccionada sea de uno de los tres grupos, si tiene los ojos claros.
DATOS
Probabilidad de que el sujeto pertenezca
P ( X ) = 0.3
al grupo X:
Probabilidad de que el sujeto pertenezca
P (Y ) = 0.1
al grupo Y:
Probabilidad de que el sujeto pertenezca P( Z ) = 0.6
al grupo Z:
Probabilidad de que tenga los ojos claros,
dado que pertenece al grupo X: P (C | X ) = 0.2
34
Probabilidad de que tenga los ojos claros, P(C | Y ) = 0.4
dado que pertenece al grupo Y:
Probabilidad de que tenga los ojos claros, P(C | Z ) = 0.05
dado que pertenece al grupo Z:
Para contestar el primer inciso requerimos la probabilidad total del evento “ojos claros”,
por ende aplicamos la ley de probabilidad total:
⎡ k ⎤
LEY DE PROBABILIDAD TOTAL ( )
P ( A) = ⎢∑ P A B j ⋅ P ( B j )⎥
⎣ j =1 ⎦
a) Un sujeto de dicha comunidad entrevistado al azar tenga los ojos claros:

P ( C ) = ⎡⎣ P ( C X ) ⋅ P ( X ) + P ( C Y ) ⋅ P (Y ) + P ( C Z ) ⋅ P ( Z ) ⎤⎦
⇒ P ( C ) = ⎡⎣( 0.2 )( 0.3) + ( 0.4 )( 0.1) + ( 0.05 )( 0.6 ) ⎤⎦ = 0.1300
, La probabilidad de que el sujeto entrevistado tenga los ojos claros es de 13.00%.
Y a partir de ello podemos calcular la probabilidad de que tenga ojos oscuros:
P ( C c ) = 1 − P ( C ) = 1 − 0.1300 = 0.8700
, La probabilidad de que el sujeto tenga los ojos oscuros es de 87.00%.
Ahora bien, como el problema nos especifica la probabilidad de que un individuo tenga
los ojos claros y sea del grupo X, basta calcular el evento complemento para asignar la
siguiente probabilidad:
b) Un individuo de esa comunidad (elegido al azar) tenga los ojos oscuros y sea
del grupo X:
P (C c | X ) = 1 − P(C | X ) = 1 − 0.2 = 0.8000
, La probabilidad de que el individuo tenga los ojos oscuros y sea del grupo X es de
80.00%.
Finalmente buscamos las probabilidades condicionales inversas. No obstante, cabe

observar que hemos simplificado el denominador, pues la probabilidad total del evento
consecuencia fue ya determinada:
c) La persona seleccionada sea de uno de los tres grupos, si tiene los ojos
claros:
P(C | X ) ⋅ P ( X ) ( 0.2 )( 0.3)
P( X | C ) = = = 0.4615
P(C ) ( 0.13)
P(C | Y ) ⋅ P(Y ) ( 0.4 )( 0.1)
P(Y | C ) = = = 0.3077
P(C ) ( 0.13)
P (C | Z ) ⋅ P( Z ) ( 0.05 )( 0.6 )
P(Z | C ) = = = 0.2308
P(C ) ( 0.13)
, La probabilidad de que una persona sea del grupo X, Y o Z es, respectivamente:
46.15%, 30.77% y 23.08%. Por tanto, es más probable que una persona de ojos
claros sea del grupo X.
35
3. VARIABLES ALEATORIAS
Una variable aleatoria es una característica en la cual los valores que toma dependen
de los resultados de un fenómeno aleatorio. Las variables aleatorias pueden ser sólo
de dos clases:
1. Discretas: Si la variable aleatoria tiene un número finito de valores posibles.
2. Continuas: Si existe un número infinito de valores posibles para dicha variable.
Por ejemplo:
FENÓMENO
Se lanza una moneda Ω = {águila,sol}
VARIABLE ALEATORIA (discreta)
Sea X la variable aleatoria discreta
que toma los siguientes valores: X = 0,1
X = 0 si cae águila, 1 si cae sol
FENÓMENO
Nace un bebé Ω = {mujer,hombre}
VARIABLE ALEATORIA (discreta)
Sea X la variable aleatoria discreta
que toma los siguientes valores: X = 0,1
X = 0 si es mujer, 1 si es hombre
Caracterización de una variable aleatoria discreta
Función de distribución de probabilidades
Se denomina función de probabiidades a la tabla donde se especifican todos los

valores que la variable aleatoria discreta puede tomar, así como sus correspondientes
probabilidades (cuya suma siempre es igual a uno ∑
P ( x ) = 1 ).
x
Dichos valores pueden ser además representados mediante una gráfica de
distribución de probabilidad, en cuyos ejes ( X , Y ) se ubican los valores de la
variable y sus valores de probabilidad, respectivamente; razón por la cual, a diferencia
del eje Y , el eje X sí puede tomar valores negativos.
Siguiendo con los ejemplos, su tabla y gráfica distribución de probabilidades serían:
LANZAMIENTO DE UNA MONEDA

FUNCIÓN GRÁFICA
x P ( x)
Gráfica de distribución de probabilidades
x=0 P ( x = 0 ) = 0.5 1.0
x =1 P ( x = 1) = 0.5
36
∑ P ( x ) = P ( x = 0 ) +P ( x = 1)
TOTAL ∑ P ( x ) = 0.5 + 0.5
∑ P ( x) = 1
NACIMIENTO DE UN BEBÉ
FUNCIÓN GRÁFICA
x P ( x)
Gráfica de distribución de probabilidades
x=0 P ( x = 0 ) = 0.493 0.510
x =1 P ( x = 1) = 0.507
0.505
P(x)
∑ P ( x ) = P ( x = 0 ) +P ( x = 1)
0.500
TOTAL ∑ P ( x ) = 0.493 + 0.507

∑ P ( x) = 1
0.495
0.490
-5 -4 -3 -2 -1 0 1 2 3 4 5
Esperanza matemática: promedio o valor esperado
Ahora bien, la esperanza de una variable aleatoria discreta es el promedio de los

valores de X que toma en cuenta la probabilidad de que éstos ocurran. Por ello es
que, a fin de calcular la esperanza de una variable aleatoria, sus valores deben
ponderarse de acuerdo a sus probabilidades.
Para el caso de la moneda:

0 +1 1
x= = = 0.5
2 2
Que también puede entenderse como:
0 +1 0 1 1
ESPERANZA x= = + = = 0.5
2 2 2 2
Lo cual es igual a:
0 +1 0 1 ⎛1⎞ ⎛1⎞ 1
x= = + = 0 ⎜ ⎟ + 1⎜ ⎟ = = 0.5
2 2 2 ⎝2⎠ ⎝2⎠ 2
De ahí que, para obtener el promedio, podemos multiplicar el valor de X por su

probabilidad:
ESPERANZA x = 0 ( 0.493) + 1( 0.507 ) = 0.507
37
La esperanza de una variable aleatoria discreta cualquiera es, por ende:
ESPERANZA DE UNA
VARIABLE ALEATORIA X CON E ( x ) = µx = ∑ x ⋅ P ( x )
FUNCIÓN DE PROBABILIDAD P ( x ) x
Comprobemos su aplicación con los ejemplos anteriores:

E ( x ) = µx = ∑ x ⋅ P ( x )
x
1
ESPERANZA E ( x) = ∑ x ⋅ P ( x)
x =0
E ( x ) = 0 ( 0.5 ) + 1( 0.5 ) = 0.5
E ( x ) = µx = ∑ x ⋅ P ( x )
x
1
ESPERANZA E ( x) = ∑ x ⋅ P ( x)
x =0
E ( x ) = 0 ( 0.493) + 1( 0.507 ) = 0.507
Varianza
Igual que la varianza de una variable cualquiera, la varianza de una variable aleatoria
discreta X con función de probabilidad P ( x ) es el promedio de la resta de los
valores con respecto a su media (en este caso, esperanza) elevada al cuadrado para
evitar signos:
Varianza de una variable cualquiera Varianza de una variable aleatoria

n
∑ (x i − x)
2
Var ( x ) = E ⎡⎣ x − E ( x ) ⎤⎦
2
s =
2 i =1
n −1
Y se puede demostrar que ello deviene en:
Var ( x ) = E ( x 2 ) − ⎡⎣ E ( x ) ⎤⎦
2
VARIANZA DE UNA
VARIABLE ALEATORIA X CON
FUNCIÓN DE PROBABILIDAD P ( x ) Donde: E x 2 = ( ) ∑x 2
⋅ P ( x)
x
38
Apliquémoslo a nuestros ejemplos:
Var ( x ) = E ( x 2 ) − ⎡⎣ E ( x ) ⎤⎦
2
VARIANZA
Elementos que la componen
E ( x2 ) = ∑ x2 ⋅ P ( x )
x
E ( x2 ) = ∑ x2 ⋅ P ( x )
1
E(x 2
) x =0
E(x 2
) = 0 ( 0.5) + 1 ( 0.5)
2 2
E ( x 2 ) = 0 ( 0.5 ) + 1( 0.5 ) = 0.5
⎡⎣ E ( x ) ⎤⎦ ⎡⎣ E ( x ) ⎤⎦ = ( 0.5 ) = 0.25
2 2 2
VARIANZA , Var ( x ) = 0.5 − 0.25 = 0.25
Var ( x ) = E ( x 2 ) − ⎡⎣ E ( x ) ⎤⎦
2
VARIANZA
E ( x2 ) = ∑ x2 ⋅ P ( x )
x
E ( x2 ) = ∑ x2 ⋅ P ( x )
1
E(x 2
) x =0
E(x 2
) = 0 ( 0.493) + 1 ( 0.507 )
2 2
E ( x 2 ) = 0 ( 0.493) + 1( 0.507 ) = 0.507
⎡⎣ E ( x ) ⎤⎦ ⎡⎣ E ( x ) ⎤⎦ = ( 0.507 ) = 0.257
2 2 2
VARIANZA , Var ( x ) = 0.507 − 0.257 = 0.250
Recapitulando, se dice que se conoce una variable aleatoria (cuyo valor está sometido
al azar y recibe una asignación numérica en el contexto de los resultados de un
fenómeno aleatorio) si se le caracteriza mediante:
1. Su función de probabilidades P ( x ) , donde ∑ P(x ) = 1 .

x
2. Su esperanza E ( x ) = ∑ x ⋅ P(x ) .
x
( )
3. Su varianza Var ( x ) = E x 2 − [E ( x )] , donde E x 2 =
2
( ) ∑x 2
⋅ P ( x) .
x
1. Se tiran dos dados no trucados. Sea X la variable aleatoria que denota los
valores resultantes de:
a) La suma de sus puntos.

b) La resta de sus puntos.
c) El producto de sus puntos.
39
Caracterizar la variable aleatoria X para cada caso.
Dado que el fenómeno es el mismo, conviene primero analizar su espacio muestral:
⎧(1,1), (1,2 ), (1,3), (1,4 ), (1,5), (1,6 ), (2,1), (2,2 ), (2,3), (2,4 ), (2,5), (2,6 ), ⎫
⎪ ⎪
Ω = ⎨(3,1), (3,2 ), (3,3), (3,4 ), (3,5), (3,6 ), (4,1), (4,2 ), (4,3), (4,4 ), (4,5), (4,6 ),⎬ # Ω = 36
⎪(5,1), (5,2 ), (5,3), (5,4 ), (5,5), (5,6 ), (6,1), (6,2 ), (6,3), (6,4 ), (6,5), (6,6 ),⎪
⎩ ⎭
Ahora, para resolver el primer inciso, observemos los valores que toma la variable
aleatoria:
X = Suma de puntos de dos dados.

Puntos muestrales Valor de X No. de eventos
(1,1) 2 1
(1,2), (2,1) 3 2
(1,3), (2,2), (3,1) 4 3
(1,4), (2,3), (3,2), (4,1) 5 4
(1,5), (2,4), (3,3), (4,2), (5,1) 6 5
(1,6), (2,5), (3,4), (4,3), (5,2), (6,1) 7 6
(2,6), (3,5), (4,4), (5,3), (6,2) 8 5
(3,6), (4,5), (5,4), (6,3) 9 4
(4,6), (5,5), (6,4) 10 3
(5,6), (6,5) 11 2
(6,6) 12 1
TOTAL 36
Hecho esto, podemos construir ya su tabla y gráfica de función de probabilidades:
P(x) para X = Suma de puntos de dos dados.

x 2 3 4 5 6 7 8 9 10 11 12 36/36
P(x ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 =1
Distribución de probabilidad (SUMA)
1/5
1/6
3/20
5/36 5/36
1/9 1/9
P(x)
1/10
1/12 1/12
1/20 1/18 1/18
1/36 1/36
0
0 2 4 6 8 10 12 14
x
40
Resta entonces calcular su esperanza y varianza:
ESPERANZA: X = Suma de puntos de dos dados.

12
E ( x) = ∑ x ⋅ P ( x)
x=2
⎡ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 3 ⎞ ⎛ 4 ⎞ ⎛ 5 ⎞ ⎛ 6 ⎞⎤
⎢ 2 ⎜ 36 ⎟ + 3 ⎜ 36 ⎟ + 4 ⎜ 36 ⎟ + 5 ⎜ 36 ⎟ + 6 ⎜ 36 ⎟ + 7 ⎜ 36 ⎟ ⎥
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
E ( x) = ⎢
⎢ ⎛ 5 ⎞ ⎛ 4 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎥
⎢ +8 ⎜ ⎟ + 9 ⎜ ⎟ + 10 ⎜ ⎟ + 11⎜ ⎟ + 12 ⎜ ⎟ ⎥
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎦
2 + 6 + 12 + 20 + 30 + 42 + 40 + 36 + 30 + 22 + 12 252
E ( x) = = =7
36 36
VARIANZA: X = Suma de puntos de dos dados.

E ( x2 ) = ∑ x2 ⋅ P ( x )
12
x=2
⎡ 2 ⎛ 1 ⎞ 2 ⎛ 2 ⎞ 2 ⎛ 3 ⎞ 2 ⎛ 4 ⎞ 2 ⎛ 5 ⎞ 2 ⎛ 6 ⎞⎤
⎢ 2 ⎜ 36 ⎟ + 3 ⎜ 36 ⎟ + 4 ⎜ 36 ⎟ + 5 ⎜ 36 ⎟ + 6 ⎜ 36 ⎟ + 7 ⎜ 36 ⎟ ⎥
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
E(x ) = ⎢
2
⎢ 2⎛ 5 ⎞ 2⎛ 4 ⎞ 2⎛ 3 ⎞ 2⎛ 2 ⎞ 2⎛ 1 ⎞ ⎥
⎢ +8 ⎜ ⎟ + 9 ⎜ ⎟ + 10 ⎜ ⎟ + 11 ⎜ ⎟ + 12 ⎜ ⎟ ⎥
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎦
E ( x2 ) ⎡ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 3 ⎞ ⎛ 4 ⎞ ⎛ 5 ⎞ ⎛ 6 ⎞⎤
⎢ 4 ⎜ 36 ⎟ + 9 ⎜ 36 ⎟ + 16 ⎜ 36 ⎟ + 25 ⎜ 36 ⎟ + 36 ⎜ 36 ⎟ + 49 ⎜ 36 ⎟ ⎥
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
E ( x2 ) = ⎢
⎢ ⎛ 5 ⎞ ⎛ 4 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎥
⎢ +64 ⎜ ⎟ + 81⎜ ⎟ + 100 ⎜ ⎟ + 121⎜ ⎟ + 144 ⎜ ⎟ ⎥
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎦
4 + 18 + 48 + 100 + 180 + 294 + 320 + 324 + 300 + 242 + 144

E ( x2 ) =
36
E ( x2 ) =
1974
= 54.83
36
⎡⎣ E ( x ) ⎤⎦ ⎡⎣ E ( x ) ⎤⎦ = ( 7 ) = 49
2 2 2
, Var ( x ) = 54.83 − 49 = 5.83
Claro está que tanta operación no sirve de nada si los resultados no son
adecuadamente interpretados:
CONCLUSIONES: X = Suma de puntos de dos dados.

a) , A partir de todo lo anterior comprendemos que, de los treinta y seis resultados
posibles, su suma puede tomar 11 valores, siendo el mínimo 2 y el máximo 12.
41
Empero, como puede verse en la función de probabilidades y en la esperanza, el
valor que mayor posibilidad tiene de salir al repetir varias veces el experimento es el 7
(6/36); no por nada ése es el número de la casa en los casinos. Por su parte, la
varianza nos indica que la dispersión de los valores con respecto al 7 es de 5.83.
Resolvamos ahora los otros dos incisos:
X = Resta de puntos de dos dados.

Puntos muestrales Valor de X No. de eventos
(1,6) -5 1
(1,5), (2,6) -4 2
(1,4), (2,5), (3,6) -3 3
(1,3), (2,4), (3,5), (4,6) -2 4
(1,2), (2,3), (3,4), (4,5), (5,6) -1 5
(1,1), (2,2), (3,3), (4,4), (5,5), (6,6) 0 6
(2,1), (3,2), (4,3), (5,4), (6,5) 1 5
(3,1), (4,2), (5,3), (6,4) 2 4
(4,1) (5,2), (6,3) 3 3
(5,1) (6,2) 4 2
(6,1) 5 1
TOTAL 36
P(x) para X = Resta de puntos de dos dados.

x -5 -4 -3 -2 -1 0 1 2 3 4 5
x 2
25 16 9 4 1 0 1 4 9 16 25 36/36
=1
P( x ) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Distribución de probabilidad (RESTA)
1/6
5/36 5/36
1/9 1/9
P(x)
1/12 1/12
1/18 1/18
1/36 1/36
-6 -4 -2 0 2 4 6
x
ESPERANZA: X = Resta de puntos de dos dados.

5
E ( x) = ∑ x ⋅ P ( x)
x =−5
⎡ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 3 ⎞ ⎛ 4 ⎞ ⎛ 5 ⎞ ⎛ 6 ⎞⎤
⎢ −5 ⎜ 36 ⎟ + −4 ⎜ 36 ⎟ + −3 ⎜ 36 ⎟ + −2 ⎜ 36 ⎟ + −1⎜ 36 ⎟ + 0 ⎜ 36 ⎟ ⎥
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
E ( x) = ⎢
⎢ ⎛ 5 ⎞ ⎛ 4 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎥
⎢ +1 ⎜ ⎟ + 2 ⎜ ⎟ + 3 ⎜ ⎟ + 4 ⎜ ⎟ + 5 ⎜ ⎟ ⎥
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎦
E ( x) =
( −5) + ( −8) + ( −9 ) + ( −8) + ( −5) + 0 + 5 + 8 + 9 + 8 + 5 = 0
=0
36 36
42
VARIANZA: X = Resta de puntos de dos dados.
E ( x2 ) = ∑ x2 ⋅ P ( x )
12
x=2
⎡ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 3 ⎞ ⎛ 4 ⎞ ⎛ 5 ⎞ ⎛ 6 ⎞⎤
⎢ 25 ⎜ 36 ⎟ + 16 ⎜ 36 ⎟ + 9 ⎜ 36 ⎟ + 4 ⎜ 36 ⎟ + 1⎜ 36 ⎟ + 0 ⎜ 36 ⎟ ⎥
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
E ( x2 ) = ⎢
⎢ ⎛ 5 ⎞ ⎛ 4 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎥
+1⎜ ⎟ + 4 ⎜ ⎟ + 9 ⎜ ⎟ + 16 ⎜ ⎟ + 25 ⎜ ⎟
E ( x2 ) ⎢
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠
⎥
⎦
25 + 32 + 27 + 16 + 5 + 0 + 5 + 16 + 27 + 32 + 25
E ( x2 ) =
36
E ( x2 ) =
210
= 5.83
36
⎡⎣ E ( x ) ⎤⎦ ⎡⎣ E ( x ) ⎤⎦ = ( 0 ) = 0
2 2 2
, Var ( x ) = 5.83 − 0 = 5.83
CONCLUSIONES: X = Resta de puntos de dos dados.

b) , De los treinta y seis resultados posibles, su resta puede tomar 11 valores (el
mínimo -5 y el máximo 5). Si bien existe una variabilidad de 5.83 en los valores
posibles, el valor esperado en la repetición del ensayo es 0.
P(x) de X = Producto de puntos de dos dados.

Puntos muestrales x x2 No. de eventos P(x)
(1,1) 1 1 1 1/36
(1,2), (2,1) 2 4 2 2/36
(1,3), (3,1) 3 9 2 2/36
(1,4), (2,2), (4,1) 4 16 3 3/36
(1,5), (5,1) 5 25 2 2/36
(1,6), (2,3), (3,2), (6,1) 6 36 4 4/36
(2,4), (4,2) 8 64 2 2/36
(3,3) 9 81 1 1/36
(2,5), (5,2) 10 100 2 2/36
(2,6), (3,4), (4,3), (6,2) 12 144 4 4/36
(3,5), (5,3) 15 225 2 2/36
(4,4) 16 256 1 1/36
(3,6), (6,3) 18 324 2 2/36
(4,5), (5,4) 20 400 2 2/36
(4,6), (6,4) 24 576 2 2/36
(5,5) 25 625 1 1/36
(5,6), (6,5) 30 900 2 2/36
(6,6) 36 1296 1 1/36
TOTAL 36 36/36=1
43
Distribución de probabilidad (PRODUCTO)
3/25
1/10
2/25
P(x)
3/50
1/25
1/50
0
0 5 10 15 20 25 30 35 40
x
ESPERANZA: X = Producto de puntos de dos dados.

36
E ( x) = ∑ x ⋅ P ( x)
x =1
⎡ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 2 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ ⎛ 4 ⎞ ⎛ 2 ⎞⎤
⎢1⎜ 36 ⎟ + 2 ⎜ 36 ⎟ + 3 ⎜ 36 ⎟ + 4 ⎜ 36 ⎟ + 5 ⎜ 36 ⎟ + 6 ⎜ 36 ⎟ + 8 ⎜ 36 ⎟ ⎥
⎢ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
⎢ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 4 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎥
E ( x ) = ⎢ +9 ⎜ ⎟ + 10 ⎜ ⎟ + 12 ⎜ ⎟ + 15 ⎜ ⎟ + 16 ⎜ ⎟ + 18 ⎜ ⎟ ⎥
⎢ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎥
⎢ ⎛ 2 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎥
⎢ +20 ⎜ ⎟ + 24 ⎜ ⎟ + 25 ⎜ ⎟ + 30 ⎜ ⎟ + 36 ⎜ ⎟ ⎥
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎦
1 + 4 + 6 + 12 + 10 + 24 + 16 + 9 + 20 + 24 + 30 + 16 + 36 + 40 + 48 + 25 + 60 + 36
E ( x) =
36
417
E ( x) = = 11.58
36
44
VARIANZA: X = Producto de puntos de dos dados.
E ( x2 ) = ∑ x2 ⋅ P ( x )
36
x =1
⎡ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 2 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞ ⎛ 4 ⎞ ⎛ 2 ⎞⎤
⎢ 1⎜ 36 ⎟ + 4 ⎜ 36 ⎟ + 9 ⎜ 36 ⎟ + 16 ⎜ 36 ⎟ + 25 ⎜ 36 ⎟ + 36 ⎜ 36 ⎟ + 64 ⎜ 36 ⎟ ⎥
⎢ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎥
⎢ ⎛ 1 ⎞ ⎛ 2 ⎞ ⎛ 4 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎛ 2 ⎞⎥
E ( x 2 ) = ⎢ +81⎜ ⎟ + 100 ⎜ ⎟ + 144 ⎜ ⎟ + 225 ⎜ ⎟ + 256 ⎜ ⎟ + 324 ⎜ ⎟ ⎥
⎢ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎥
⎢ ⎥
E ( x2 ) ⎢
⎛ 2 ⎞ ⎛ 2 ⎞ ⎛ 1 ⎞ ⎛ 2 ⎞
+400 ⎜ ⎟ + 576 ⎜ ⎟ + 625 ⎜ ⎟ + 900 ⎜ ⎟ + 1296 ⎜ ⎟
⎛ 1 ⎞
⎥
⎣ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎝ 36 ⎠ ⎦
⎛ 1 + 8 + 18 + 48 + 50 + 144 + 128 + 81 + 200 + 576 ⎞

⎜ ⎟
+450 + 256 + 648 + 800 + 1152 + 625 + 1800 + 1296 ⎠
E(x ) =
2 ⎝
36
E ( x2 ) =
8281
= 230.03
36
⎡⎣ E ( x ) ⎤⎦ ⎡⎣ E ( x ) ⎤⎦ = (11.58 ) = 134.10
2 2 2
, Var ( x ) = 230.03 − 134.10 = 95.93
CONCLUSIONES: X = Producto de puntos de dos dados.

c) , De los treinta y seis resultados posibles, su producto puede tomar 18 valores (el
mínimo 1 y el máximo 36). El valor esperado es, no obstante, 11.58, con una varianza
de 95.93.
2. Se lanzan una moneda y un dado. Sea X = 0 si la moneda cae sol y X = 1 si

cae águila. Asimismo, sea Y = # de puntos obtenidos al tirar el dado. Caracterícese
entonces a la variable aleatoria W , definida como W = X + Y .
Si:
X = {0,1} Y = {1,2,3,4,5,6} W = X +Y
El espacio muestral de la variable aleatoria es:
Ω = {( 0,1) , ( 0, 2 ) , ( 0,3) , ( 0, 4 ) , ( 0,5 ) , ( 0, 6 ) , (1,1) , (1, 2 ) , (1,3) , (1, 4 ) , (1,5) , (1, 6 )} ⇒ # Ω = 12
Y los valores que puede tomar (con su respectiva probabilidad) son:
P(w) de W = Suma del resultado de una moneda y un dado lanzados

x 1 2 3 4 5 6 7
x2 1 4 9 16 25 36 49 12/12
=1
P(x ) 1/12 2/12 2/12 2/12 2/12 2/12 1/12
45
Distribución de probabilidad
1/5
3/20
P(w)
1/10
1/20
0
0 1 2 3 4 5 6 7 8
w
ESPERANZA: W = Suma del resultado de una moneda y un dado lanzados

7
E ( w) = ∑ w ⋅ P ( w)
w =1
⎛1⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 1⎞
E ( w ) = 1⎜ ⎟ + 2 ⎜ ⎟ + 3 ⎜ ⎟ + 4 ⎜ ⎟ + 5 ⎜ ⎟ + 6 ⎜ ⎟ + 7 ⎜ ⎟
⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠
1 + 4 + 6 + 8 + 10 + 12 + 7
E ( w) =
12
48
E ( w) = =4
12
VARIANZA: W = Suma del resultado de una moneda y un dado lanzados

E ( w 2 ) = ∑ w2 ⋅ P ( w )
7
w =1
⎛1⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 2⎞ ⎛ 1⎞
E ( w2 ) = 1⎜ ⎟ + 4 ⎜ ⎟ + 9 ⎜ ⎟ + 16 ⎜ ⎟ + 25 ⎜ ⎟ + 36 ⎜ ⎟ + 49 ⎜ ⎟
⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠ ⎝ 12 ⎠
E ( w2 )
1 + 8 + 18 + 32 + 50 + 72 + 49
E ( w2 ) =
12
E ( w2 ) =
230
= 19.17
12
⎡⎣ E ( w ) ⎤⎦ ⎡⎣ E ( w ) ⎤⎦ = ( 4 ) = 16
2 2 2
, Var ( x ) = 19.7 − 16 = 3.17
46
CONCLUSIONES: W = Suma del resultado de una moneda y un dado lanzados
, Gracias a esto comprendemos que, de los doce resultados posibles al mezclar los
puntos del dado y la moneda, su suma puede tomar 7 valores, siendo el mínimo 1 y el
máximo 7. Las probabilidades de estos dos (1/12) son menores a la de los
intermedios (2/12), pero, como su nombre lo dice, la esperanza nos indica que 4 es el
promedio o número esperado a obtener si se repite muchas veces el experimento,
mientras que la varianza nos señala que la dispersión del resto de los valores es de
3.17.
EJERCICIOS DE REPASO DE LA UNIDAD I

1. Escribe la definición de los siguientes conceptos:
a) Fenómeno aleatorio b) Evento c) Espacio muestral
d) Probabilidad e) Probabilidad clásica f) Probabilidad frecuentista
g) Probabilidad subjetiva h) Eventos ajenos i) Eventos independientes
j) Probabilidad condicional k) Ley de probabilidad total l) Teorema de Bayes
m) Variable aleatoria n) Variable aleatoria discreta o) Variable aleatoria continua
p) Función de probabilidad q) Esperanza r) Varianza
2. Escribe las propiedades de probabilidad
3. Se lanza una moneda y se observa si es sol o águila. Si resulta sol, la moneda se
lanza por segunda ocasión. Si resulta águila se tira un dado.
a) Escribe el espacio muestral para este experimento
b) ¿Cuál es la probabilidad de que en la segunda parte de este experimento se lance
un dado?
4. Determinar la probabilidad para cada uno de los siguientes eventos
a) La aparición de un número impar en una tirada de un dado.
b) La aparición de un sol en dos lanzamientos de una moneda.
c) La aparición de un as, o el diez de diamantes, o el dos de corazones en una
extracción de una baraja de 52 cartas.
d) La obtención de 7 puntos en una tirada de un par de dados.
e) La aparición de “sol” en el siguiente lanzamiento de una moneda, si en 100
lanzamientos previos aparecieron 56 “águilas”.
5. Determinar si cada una de las siguientes parejas de eventos son o no
mutuamente excluyentes (ajenos):
a) Se tiran cinco monedas: “se observa un sol”; “se observa al menos un sol”
b) Un antropólogo físico toma la estatura de una persona: “la estatura es superior a
165 cm.”; “la estatura es mayor de 175 cm.”
c) Un estudiante es seleccionado en la ENAH: “la persona elegida es hombre”; “la
persona elegida es mayor de 21 años”.
d) Se lanzan dos dados. El total de puntos obtenidos es:
d.1) “menor que 7”; “mayor que 9” d.2) “es par”; “es impar”
d.3) “siete”; “nueve”
6. Supóngase que el 80% de todos los capitalinos que vacacionan en alguna playa
visitan Acapulco, 80% visitan Veracruz y 70% visitan tanto Acapulco como
Veracruz.
a) ¿Cuál es la probabilidad de que un turista capitalino vacacione en Acapulco o
Veracruz?
b) ¿Cuál es la probabilidad de que el turista no visite ninguna de estas ciudades?
7. Determine si las siguientes parejas de eventos son independientes o no:
47
a) Lanzar un par de dados y observar un punto en el primer dado y un punto en el
segundo dado.
b) Ser propietario de un automóvil rojo y tener el cabello rubio.
c) Ser propietario de un automóvil rojo y sufrir una picadura de llanta.
d) Estudiar para un examen y aprobarlo.
8. Si p(A)=0.3, p(B)=0.4 y si A y B son eventos independientes, ¿cuál es el valor de
cada una de las siguientes probabilidades?
a) p(A∩B) b) p(A|B) c) p(B|A)
9. Si p(A)=0.3, p(B)=0.5 y p(A∩B)=0.15, calcular:
a) p(A|B) b) p(B|A) c)¿son independientes A y B?
10. Si p(A)=0.4, p(B)=0.7 y p(A∩B)=0.22, calcular:
a) p(A|B) b) p(B|A) c)¿son independientes A y B?
11. En la siguiente tabla se presentan los resultados de una encuesta durante una
investigación para estudiar las opiniones de los habitantes de cierta ciudad
respecto a la legalización del aborto. Los datos están clasificados de acuerdo
con el área en la que fue aplicada la entrevista. Si un cuestionario es elegido
aleatoriamente,
I. ¿cuál es la probabilidad de que:
a) El entrevistado vote a favor de la legalización del aborto?
b) El entrevistado vote en contra de la legalización?
c) El entrevistado se abstenga?
d) Que el entrevistado viva en el área A? B? C? D? E?
e) El entrevistado vote a favor de la legalización del aborto dado que vive en el
área B?
II) Calcular las siguientes probabilidades
a) P(A∩R) b)P(Q∪R) c) P(D) d) P(Q|D) e)P(B|R) f)P(R)
g)P(A) h)P(F∩E) i)P(R|A) j) P(F∩Q∩R) k)P(B∪E)
Área de la ciudad A favor (F) En contra (Q) Indecisos (R)

A 100 20 5
B 115 5 5
D 50 60 15
E 35 50 125
12. Por descuido se colocan dos pastillas para el resfriado en un frasco que
contiene dos aspirinas. Las cuatro pastillas son idénticas en apariencia. Del
frasco se selecciona una tableta al azar y se le administra al primer paciente. De
las tres tabletas restantes se selecciona una al azar y se administra al segundo
paciente.
a) Escribir el espacio muestral
Calcula la probabilidad de que:
b) El primer paciente tomó una pastilla para el resfriado
c) Uno de los dos pacientes tomó una tableta para el resfriado
d) Ningún paciente tomó una tableta contra el resfriado
13. Supóngase que la Cd. de México se divide en tres zonas A, B y C de acuerdo al
nivel de contaminación. El 50% de la población vive en la zona A, el 40% en B
y el resto en C. El nivel de contaminación influye en la incidencia de cierta
enfermedad pulmonar, dicha enfermedad afecta a 10 de cada 100 personas que
viven en A, mientras que sólo afecta a 1 de cada 100 de los que viven en B y a 5
de cada 1000 de los que viven en C. Calcular:
48
a) La probabilidad de que una persona elegida al azar sufra la enfermedad y viva en
la zona A.
b) La probabilidad de que una persona elegida al azar viva en la zona B sabiendo
que está afectada por dicha enfermedad.
14. Una prueba sanguínea para detectar hepatitis tiene los siguientes niveles de
precisión: si el individuo tiene hepatitis, la prueba da positivo con probabilidad
0.9, mientras que en el 99% de los individuos sin hepatitis la prueba da
negativo.
a) La tasa de incidencia de la enfermedad en la población estudiada es de un
enfermo por cada 10,000 personas. Calcular la probabilidad de que un individuo
que ha dado positivo en la prueba tenga hepatitis.
b) Un individuo es enviado a hacerse la prueba porque tiene pérdida de apetito e
ictericia. El médico sabe que el 50% de los individuos con dichos síntomas
presentan hepatitis. Si la prueba da positivo, ¿cuál es la probabilidad de que el
paciente tenga hepatitis?
15. Una variable aleatoria x puede asumir cinco valores: 0, 1,2 3 y 4. Se muestra
enseguida una parte de de la distribución de probabilidad:
x 0 1 2 3 4
p(x) 0.1 0.3 0.3 ? 0.05
a) Encuentra p(3)
b) Realiza una gráfica de probabilidad para describir p(x)
c) Calcula esperanza y varianza
d) ¿Cuál es la probabilidad de que x sea mayor de 2?
e) ¿Cuál es la probabilidad de que x sea 3 o menos?
16. Verifique si las siguientes expresiones son o no funciones de probabilidad:
5− x
a) p ( x) = para x=1,2,3,4
10
x2 −1
b) p( x) = para x=1,2,3,4
50
17. Sea X la variable aleatoria que representa el número de niños varones en
familias de tres hijos, sabiendo que la probabilidad de que nazca un niño varón
es de 0.45:
a) Encontrar la función de distribución de probabilidades.
b) Graficar la función de probabilidad
c) Calcular Esperanza y Varianza.
49
UNIDAD II
4. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDAD
Introducción
A fin de explicar las variables aleatorias y su caracterización, en el capítulo anterior
vimos el ejemplo del nacimiento de un bebé:
FENÓMENO: Nacimiento de un bebé

X = 0 si es mujer, 1 si es hombre
Ω = {mujer,hombre}
X = 0,1
FUNCIÓN DE PROBABILIDAD [P(x)] de X = Nacimiento de un bebé
x P ( x)
x=0 P ( x = 0 ) = 0.493
x =1 P ( x = 1) = 0.507
∑ P ( x ) = P ( x = 0 ) +P ( x = 1)
TOTAL ∑ P ( x ) = 0.493 + 0.507
∑ P ( x) = 1
Otra forma de expresar su función de probabilidades P ( x ) es mediante una expresión
matemática:
P ( x ) = 0.493x ⋅ ( 0.507 )
1− x
; x = 0,1
Puesto que, si le sustituimos con los valores de la variable aleatoria, también

obtenemos la probabilidad correspondiente a cada valor de X :
P ( x = 0 ) = 0.4930 ⋅ ( 0.507 ) = 1 ⋅ ( 0.507 ) = 1 ⋅ ( 0.507 ) = 0.507

1− 0 1
P ( x = 1) = 0.4931 ⋅ ( 0.507 ) = 0.493 ⋅ ( 0.507 ) = 0.493 ⋅ (1) = 0.493

1−1 0
Porque a0 = 1 a1 = a
Ahora bien, igual que en este caso, la función de probabilidades de todas las variables
aleatorias dicotómicas (que toman dos valores: 0 y 1), puede expresarse a través del
siguiente modelo:
P(x p ) = p x (1 − p ) ; x = 0,1
1− x
De hecho, el estudio de muchos fenómenos ha permitido formular modelos teóricos

para determinar la función de probabilidad, la esperanza y la varianza de muchos tipos
de variables aleatorias (discretas y continuas).
Los que veremos a continuación son sólo algunos, pero deberá recordarse que cada
uno está fundamentado en un criterio; motivo por el cual se afirmará que cada variable
posee un tipo de distribución con cierto parámetro. Por ejemplo:
A~B(C) La variable A posee una distribución B con parámetro C.
50
De entrada, veamos entonces tres modelos de distribución de probabilidad para
variables aleatorias discretas dicotómicas que pueden utilizarse en tres casos: cuándo
se desea calcular probabilidades de sólo un ensayo, cuando se realizan varios
ensayos y cuando el número de ensayos es muy grande.
Distribución Bernoulli X ~ Be ( p )
Cuando la variable aleatoria de un fenómeno tiene sólo dos resultados posibles

mutuamente excluyentes (0 y 1) y se realiza un ensayo, se designa arbitrariamente
éxito1 a la aparición de la característica de interés y fracaso a la ausencia de dicha
característica.
Por convención, el valor de la variable aleatoria en el éxito es 1 y su probabilidad es p,
mientras que su valor en el fracaso es 0 y su probabilidad es q, que (al ser eventos
ajenos) es igual a 1-p.
Dicho esto podemos afirmar que las variables aleatorias discretas que cumplen con
tales condiciones tienen una distribución de probabilidad Bernoulli con parámetro p :
Variable aleatoria: X = {0,1}

Valores y P ( x = 1) = p P ( x = 0) = q = 1 − p
probabilidades:
Distribución de X ~ Be ( p )
probabilidad
Cuya función de distribución de probabilidad obedece al siguiente modelo:
P(x p ) = p x (1 − p ) ; x = 0,1
1− x
Función de probabilidad:
P ( x = 0 ) = p 0 (1 − p ) = 1(1 − p ) = 1(1 − p ) = 1 − p
1− 0 1
P ( x = 1) = p1 (1 − p ) = p (1 − p ) = p (1) = p
1−1 0
Porque:
1
∑ P ( x ) =P ( x = 0 ) + P ( x = 1) = (1 − p ) + p = 1
x =0
Esperanza
Si el valor esperado de una variable aleatoria discreta cualquiera es:
E ( x) = ∑ x ⋅ P ( x)
x
El valor esperado de una variable aleatoria discreta con distribución Bernoulli es:
1
E ( x p ) = ∑ x ⋅ P ( x ) = 0 (1 − p ) + 1( p ) = p
x =0
Varianza
De igual forma, si la varianza de una variable aleatoria cualquiera es:
( )
Var ( x ) = E x 2 − [E ( x )]
2
1
Debemos remarcar que esta asignación es arbitraria y no tiene ninguna connotación positiva. Baste el
ejemplo de los estudios de mortalidad, en que el éxito es igual a la muerte de un individuo.
51
La varianza de una variable aleatoria discreta con distribución Bernoulli es:
( )
Var ( x ) = E x 2 − [ p ]
2
( )
Y sólo nos falta deducir el valor de E x 2 p para calcularle:
1
E ( x2 p ) = ∑ x2 ⋅ P ( x )
x =0
E ( x p ) = 0 (1 − p ) + 12 ( p )
2 2
E ( x 2 p ) = 0 (1 − p ) + 1( p )
E ( x2 p ) = p
Por ende, la varianza de una variable aleatoria discreta con distribución Bernoulli se
puede calcular como:
Var ( x ) = p − [ p ] = p − p 2 = p (1 − p )
2
En resumen, para calcular las probabilidades de una variable discreta dicotómica en

un ensayo podemos utilizar el modelo de distribución de probabilidad Bernoulli
(basado en el parámetro p ):
X ~ Be ( p )
P(x p ) = p x (1 − p ) ; x = 0,1
1− x
FUNCIÓN DE PROBABILIDAD
ESPERANZA E (x ) = p
VARIANZA Var( x ) = p(1 − p )
Realicemos ahora unos cuantos ejemplos:
1. Por se materia curricular, todos los alumnos de antropología física cursan la

materia de estadística, pero se sabe que sólo el 85% de ellos aprueban. Angustiado,
un estudiante le pide ayuda para comprender cómo se comporta dicha variable.
Dado que la calificación (aprobatoria o no) es una variable dicotómica, podemos

utilizar el modelo de distribución Bernoulli para caracterizarle, suponiendo que aprobar
es ÉXITO ( x = 1) y reprobar es FRACASO ( x = 0 ) :
CARACTERIZACIÓN
Aprobar = ÉXITO Reprobar = FRACASO
= P(x = 1) = p = 0.85 = P ( x = 0) = 1 − p = 1 − 0.85 = 0.15
TIPO DE X ~ Be ( p ) ⇒ X ~ Be ( p = 0.85)
VARIABLE
P ( x p ) = p x (1 − p )
1− x
FUNCIÓN DE
; x = 0,1
PROBABILIDAD ⇒ P ( x p = 0.85 ) = 0.85 x ( 0.15 )
1− x
; x = 0,1
52
E ( x) = p
ESPERANZA
E ( x ) = 0.85
Var ( x ) = p (1 − p )
VARIANZA
Var ( x ) = 0.85 ( 0.15 ) = 0.1275
, Aprobar o no la clase de estadística es una variable con distribución Bernoulli, con
un valor esperado de 0.85 y una varianza de 0.1275.
2. Expertos consideran que la probabilidad de que México pase a la final de la

próxima Copa América es del 20%. Caracterice la variable (considerando un éxito el
que nuestra selección pase) para definir la variabilidad de este resultado.
CARACTERIZACIÓN
Pase = ÉXITO No pase = FRACASO
= P(x = 1) = p = 0.20 = P( x = 0) = 1 − p = 1 − 0.20 = 0.80
TIPO DE VARIABLE X ~ Be ( p = 0.20 )
P ( x p = 0.20 ) = 0.20 x ( 0.80 )
1− x
FUNCIÓN DE PROBABILIDAD ; x = 0,1
ESPERANZA E (x ) = 0.20
VARIANZA Var ( x ) = 0.20(0.80) = 0.1600
, El pase de México a la final de la Copa América es una variable con distribución
Bernoulli, con una verdadera esperanza de 0.20 y una variabilidad de 0.1600.
3. Si se contesta al azar una pregunta con tres opciones, la probabilidad de elegir

la respuesta adecuada es de 1/3, y se considera al acierto como éxito, ¿cómo se
comporta esta variable?:
CARACTERIZACIÓN
Acertar = ÉXITO Errar = FRACASO
= P ( x = 1) = p = 1 3 = P ( x = 0) = 1 − p = 1 − 1 3 = 2 3
TIPO DE VARIABLE X ~ Be ( p = 1 3)
P ( x p = 1 3) = (1 3) ( 2 3)
1− x
; x = 0,1
x
ESPERANZA E ( x ) = 1 3 = 0.3333
VARIANZA Var ( x ) = 1 3 ( 2 3) = 2 9 = 0.2222
, Elegir al azar la respuesta correcta a una pregunta con 3 opciones es una variable
con distribución Bernoulli, con un valor promedio de 0.3333 y una varianza de 0.2222.
4. Durante una investigación en la Sierra Norte de Puebla se encontró que la

probabilidad de hallar un niño en edad preescolar con algún tipo de desnutrición es del
65%. Si se selecciona al azar un individuo de esta población, sea X la variable
aleatoria discreta tal que x = {0 con desnutrición, 1 sin desnutrición} :
CARACTERIZACIÓN
Con desnutrición = ÉXITO Sin desnutrición = FRACASO
= P(x = 1) = p = 0.65 = P( x = 0 ) = 1 − p = 1 − 0.65 = 0.35
TIPO DE VARIABLE X ~ Be ( p = 0.65)
53
P ( x p = 0.65 ) = 0.65x ( 0.35 )

1− x
VARIANZA Var (x ) = 0.65(0.35) = 0.2275
, El que un niño en edad preescolar de la Sierra Norte de Puebla presente
desnutrición es una variable con distribución Bernoulli, con un promedio de 0.65 y
una varianza de 0.2275.
5. Si la presencia de patologías o marcadores es considerado un ÉXITO en el

estudio de restos osteológicos, caracterice las siguientes variables aleatorias de
acuerdo a la información que se aporta:
a) Se tiene una colección de esqueletos donde la probabilidad de que un cráneo

manifieste trepanación es del 5%.
CARACTERIZACIÓN
Presencia = ÉXITO Ausencia = FRACASO
( )
= P x = 1 = p = 0.05 = P x = 0) = 1 − p = 1 − 0.05 = 0.95
(
P ( x p = 0.05 ) = 0.05x ( 0.95 )
1− x
VARIANZA Var (x ) = 0.05(0.95) = 0.0475
, La presencia de trepanación en un cráneo de esta colección es una variable con
distribución Bernoulli, con un valor esperado de 0.05 y una varianza de 0.0475.
b) Dentro de una muestra estudiada, la probabilidad de que un cráneo presente criba
orbitaria es de 35%.
CARACTERIZACIÓN
= P(x = 1) = p = 0.35 = P( x = 0) = 1 − p = 1 − 0.35 = 0.65
TIPO DE FENÓMENO X ~ Be ( p = 0.35)
P ( x p = 0.35 ) = 0.35x ( 0.65 )
1− x
VARIANZA Var (x ) = 0.35(0.65) = 0.2275
, La presencia de criba orbitaria en un cráneo de esta muestra es una variable con
distribución Bernoulli, con una esperanza de 0.35 y una varianza de 0.2275.
c) Supóngase que el 28% de los cráneos de una colección de esqueletos de Cholula

presentan deformación.
CARACTERIZACIÓN
= P(x = 1) = p = 0.28 = P( x = 0) = 1 − p = 1 − 0.28 = 0.72
P(x p = 0.28) = 0.28 x (0.72) ; x = 0,1
1− x
VARIANZA Var ( x ) = 0.28(0.72) = 0.2016
, La presencia de deformación en un cráneo de la colección de Cholula es una
54
variable con distribución Bernoulli, con un valor promedio de 0.28 y una varianza de
0.2016.
d) Se cree que en la colección de esqueletos “La Fuentes”, procedente del estado de

Colima, 12% de los individuos presentan hiperostosis porótica.
CARACTERIZACIÓN
= P(x = 1) = p = 0.12 = P( x = 0) = 1 − p = 1 − 0.12 = 0.88
P(x p = 0.12) = 0.12 x (0.88) ; x = 0,1
1− x
VARIANZA Var ( x ) = 0.12(0.88) = 0.1056
, La presencia de hiperostosis porótica en un individuo de la colección de “Las
Fuentes” es una variable con distribución Bernoulli, con un promedio de 0.12 y una
varianza de 0.1056.
Distribución binomial X ~ Bin ( n, p )
Ahora bien, si la variable aleatoria discreta es dicotómica pero en vez de una sola
observación tenemos n número de casos ( xi ) , cada observación tiene una
distribución de probabilidad de tipo Bernoulli:
Observación Valores posibles Tipo de variable

1 x1 = {0,1} x1 ~ B ( p )
2 x2 = {0,1} x2 ~ B ( p )
3 x3 = {0,1} x3 ~ B ( p )
… … …
n xn = {0,1} xn ~ B ( p )
La variable aleatoria X a estudiar debe entonces comprender todas estas

observaciones independientes:
X = x1 + x2 + x3 + ... + xn
Por lo cual la variable aleatoria X toma valores entre cero y n :
X = {0,1, 2,3,..., n}
Y su distribución de probabilidad está definida por el siguiente modelo Binomial con

parámetros n y p :
P ( x n, p ) = n Cx p x (1 − p )
n− x
; x = 0,1, 2,3,..., n
55
Analicemos paso a paso el porqué de dicha expresión con el ejemplo de hiperostosis
porótica, cuya probabilidad de presencia en un esqueleto de la colección de “Las
Fuentes” era de 12%:
CARACTERIZACIÓN
= P ( xi = 1) = p = 0.12 = P ( xi = 0 ) = 1 − p = 1 − 0.12 = 0.88
P(x p = 0.12) = 0.12 x (0.88) ; x = 0,1
1− x
ESPERANZA E ( xi ) = 0.12
VARIANZA Var ( xi ) = 0.12 ( 0.88 ) = 0.1056
Si un investigador toma tres esqueletos, asignando 1 a todo caso que presente

hiperostosis y 0 a todo el que no le manifieste, las posibles observaciones serían:
Caso
Escenario posible
x1 x2 x3
A 0 0 0
B 1 0 0
C 0 1 0
D 0 0 1
E 1 1 0
F 1 0 1
G 0 1 1
H 1 1 1
Y la variable aleatoria X tendría 4 valores posibles entre 0 y 3: X = {0,1, 2,3}
x1 x2 x3 x1 + x2 + x3 = X X
0 0 0 0+0+0=0 0
1 0 0 1+0+0=1 1
0 1 0 0+1+0=1 1
0 0 1 0+0+1=1 1
1 1 0 1+1+0=2 2
1 0 1 1+0+1=2 2
0 1 1 0+1+1=2 2
1 1 1 1+1+1=3 3
Ahora, si en cada caso la probabilidad de acierto es igual a p y la probabilidad de

fracaso es (1 − p ) , como las observaciones son independientes resulta que la
probabilidad de cada valor X sería:
x1 x2 x3 x1 + x2 + x3 = X X P ( x) P ( x)
P ( x ) = (1 − p ) ⋅ (1 − p ) ⋅ (1 − p ) P ( x = 0 ) = (1 − p )
3
0 0 0 0+0+0=0 0
56
1 0 0 1+0+0=1 1 P ( x ) = p ⋅ (1 − p ) ⋅ (1 − p )
P ( x ) = (1 − p ) ⋅ p ⋅ (1 − p ) P ( x = 1) = 3 ⎡ p ⋅ (1 − p ) ⎤
2
0 1 0 0+1+0=1 1
⎣ ⎦
0 0 1 0+0+1=1 1 P ( x ) = (1 − p ) ⋅ (1 − p ) ⋅ p
1 1 0 1+1+0=2 2 P ( x ) = p ⋅ p ⋅ (1 − p )
1 0 1 1+0+1=2 2 P ( x ) = p ⋅ (1 − p ) ⋅ p P ( x = 2 ) = 3 ⎡⎣ p 2 ⋅ (1 − p ) ⎤⎦
0 1 1 0+1+1=2 2 P ( x ) = (1 − p ) ⋅ p ⋅ p ⋅
1 1 1 1+1+1=3 3 P ( x) = p ⋅ p ⋅ p ⋅ P ( x = 3) = p 3
Que en términos del valor del parámetro p serían:
P ( x)
P ( x = 0 ) = (1 − p ) = 0.883 = 0.6815
3
P ( x = 1) = 3 ⎡ p ⋅ (1 − p ) ⎤ = 3 ( 0.12 ⋅ 0.882 ) = 0.2788

2
⎣ ⎦
P ( x = 2 ) = 3 ⎡⎣ p ⋅ (1 − p ) ⎤⎦ = 3 ( 0.12 2 ⋅ 0.88 ) = 0.0380
2
P ( x = 3) = p 3 = 0.123 = 0.0017
3
∑ P ( x ) = 0.6815 + 0.2788 + 0.0380 + 0.0017 = 1

x =0
Si bien la probabilidad de los eventos totales o extremos (donde en todos los casos se
presenta o no la característica) es fácil de calcular sin necesidad de la tabla, pues
simplemente se eleva la probabilidad de éxito o fracaso a la potencia del número de
casos; la probabilidad de los eventos combinados es más complicada de predecir.
A fin de evitar tal desarrollo puede determinarse el número que antecederá a las
combinaciones a partir del desarrollo de binomios. Por ejemplo:
( a + b ) = a 2 + 2ab + b 2
2
donde el exponente es el número
( a + b ) = a 3 + 3a 2b + 3ab 2 + b3
3 de casos ( n ) , en tanto que a es
( a + b ) = a 4 + 4a3b + 6a 2b2 + 4ab3 + b4

4 (1 − p ) y b es p :
n = 3 ⇒ (a + b)
3
( a + b ) = a5 + 5a 4b + 10a3b2 + 10a 2b3 + 5ab4 + b5

5
De hecho, se dice que la variable tiene distribución Binomial porque su probabilidad es

un binomio elevado a la potencia del número de casos ( n ) .
Ahora bien, si el desarrollo de binomios resulta igual de complicado, existen otras tres
formas para descubrir el número que antecede a las combinaciones: una es
observando el Triángulo de Pascal:
57
En el cual se busca el renglón cuyo

número de elementos sea igual al
número de valores que la variable
aleatoria X puede tomar:
X = {0,1, 2,3} ⇒ # X = 4
Otra es, aplicando la expresión de combinaciones:
n!
Cx =
x !( n − x ) !
n
Donde n es el número total de casos y

Sabiendo que:
x el número de observaciones sobre las
n ! = n ⋅ (n − 1) ⋅ (n − 2) ⋅ (n − 3) ⋅ ... ⋅ ( 3) ⋅ ( 2 ) ⋅ (1) cuales se desea asignar probabilidad
y que:
0! = 1
Que para el ejemplo sería:
3! 3! 3 ⋅ 2 ⋅1 6 6
C1 = = = = = =3
2!( 3 − 2 ) ! 2!(1!) ( 2 ⋅1)(1) ( 2 )(1) 2
3
O finalmente está la opción de acudir a la tecla n C x de la calculadora2, que permite

determinar el número de combinaciones de n observaciones en conjuntos de x
elementos.
Dicho todo esto podemos comprender ya el porqué de la expresión:
P ( x n, p ) = n Cx p x (1 − p )
n− x
; x = 0,1, 2,3,..., n
Porque, a fin de calcular probabilidades de éxito en n casos de una variable aleatoria

discreta dicotómica, debemos considerar no sólo la probabilidad de éxito, sino también
las posibles combinaciones ( n Cx ) en que se puede manifestar.
Por ejemplo, para el caso de la hiperostosis porótica:
HIPEROSTOSIS PORÓTICA X ~ Bin ( n = 3, p = 0.12 )

P ( x n = 3, p = 0.12 ) = 3 Cx ( 0.12 ) ( 0.88 )
3− x
; x = 0,1, 2,3
x
PROBABILIDADES
2
La tecla puede variar de acuerdo al modelo de la calculadora, sobre todo en la letra del segundo
subíndice; no obstante, siempre incluye la letra C, que le distingue de la tecla para permutaciones n Pr .
58
P ( x n = 3, p = 0.12 ) = 3 C0 ( 0.12 ) ( 0.88 ) = 1(1)( 0.88 ) = 0.6815

0 3− 0 3
P ( x n = 3, p = 0.12 ) = 3 C1 ( 0.12 ) ( 0.88) = 3 ( 0.12 )( 0.88) = 0.2788

1 3−1 2
P ( x n = 3, p = 0.12 ) = 3 C2 ( 0.12 ) ( 0.88 ) = 3 ( 0.12 ) ( 0.88 ) = 0.0380

2 3− 2 2 1
P ( x n = 3, p = 0.12 ) = 3 C3 ( 0.12 ) ( 0.88 ) = 1( 0.12 ) ( 0.88 ) = 0.0017

3 3− 3 3 0
, Si se analizan tres restos, existe un 68.15% de probabilidad de que ninguno

presente hiperostosis porótica; un 27.88% de que sólo uno la manifieste; 3.80% que
dos y sólo un remoto 0.17% de probabilidad de que todos le presenten.
Esperanza
Partiendo de nuevo de la esperanza de una variable aleatoria cualquiera, sabemos
que cada observación tiene como valor promedio:
E ( xi ) = ∑ xi ⋅ P ( xi )
x
Por lo que la esperanza de la variable que les comprende es:
n
E ( x ) = ∑ xi ⋅ P ( xi )
x =0
E ( x ) = ∑ x1 ⋅ P ( x1 ) + ∑ x2 ⋅ P ( x2 ) + ∑ x3 ⋅ P ( x3 ) + ... + ∑ xn ⋅ P ( xn )
E ( x ) = x1 ⋅ P ( x1 ) + x2 ⋅ P ( x2 ) + x3 ⋅ P ( x3 ) + ... + xn ⋅ P ( xn )
E ( x ) = E ( x1 ) + E ( x2 ) + E ( x3 ) + ... + E ( xn )
Que, a sabiendas de que el valor esperado de cada observación es la probabilidad de

éxito ⎡⎣ E ( xi ) = p ⎤⎦ , deviene en:
E ( x ) = p + p + p + ... + p
E ( x) = n ⋅ p
Que en nuestro ejemplo sería:
HIPEROSTOSIS PORÓTICA
X ~ Be ( p = 0.12 )
Esperanza de E ( x1 ) = 0.12 E ( x2 ) = 0.12 E ( x3 ) = 0.12
cada observación
X ~ Bin ( n = 3, p = 0.12 )
E ( x ) = E ( x1 ) + E ( x2 ) + E ( x3 )
Esperanza de la E ( x ) = 0.12 + 0.12 + 0.12
variable
E ( x ) = 3 ( 0.12 ) = 0.3600
Varianza de una variable aleatoria

De manera similar, si la varianza de una variable aleatoria con distribución Bernoulli
es:
Var ( x ) = p (1 − p )
59
La varianza de una variable aleatoria con distribución Binomial es3:
n
Var ( x ) = ∑ p (1 − p ) ⇒ Var ( x ) = n ⋅ p (1 − p )
x =0
Lo que en el caso del ejemplo es:
HIPEROSTOSIS PORÓTICA
X ~ Be ( p = 0.12 )
Varianza de
cada Var ( x1 ) = 0.12 ( 0.88 ) Var ( x2 ) = 0.12 ( 0.88 ) Var ( x3 ) = 0.12 ( 0.88 )
observación
X ~ Bin ( n = 3, p = 0.12 )
Var ( x ) = Var ( x1 ) + Var ( x2 ) + Var ( x3 )
Esperanza de Var ( x ) = 0.12 ( 0.88 ) + 0.12 ( 0.88 ) + 0.12 ( 0.88 )
la variable
Var ( x ) = 3 ( 0.12 )( 0.88 ) = 0.3168
En conclusión, el modelo de distribución Binomial (basado en los parámetros n y p )

nos permite caracterizar y calcular las probabilidades de éxito de una variable aleatoria
discreta dicotómica cuando se tiene más de una observación:
X ~ Bin ( n, p )
P ( x n, p ) = n Cx p x (1 − p )
n− x
FUNCIÓN DE PROBABILIDAD ; x = 0,1, 2,3,..., n
ESPERANZA E ( x) = n ⋅ p
VARIANZA Var ( x ) = n ⋅ p (1 − p )
1. Durante la clase se aplica un examen de 5 preguntas con tres opciones cada

una. Establecer la función de probabilidad de éste fenómeno y calcular su esperanza y
varianza. Posteriormente, calcular la probabilidad de obtener 0, 1, 2, 3 ,4 y 5 aciertos:
DATOS GENERALES
n=5 Acertar = P( x = 1) = p = 1 Errar = P( x = 0 ) = 1 − p = 1 − 1 = 2
3 3 3
TIPO DE FENÓMENO X ~ Bin ( n = 5, p = 1 3)
P ( x n, p ) = n C x p x (1 − p )
n− x
; x = 0,1, 2,3,..., n
FUNCIÓN DE
( 3)
= C ( 1 ) (2 )
5− x
PROBABILIDAD P x n = 5, p = 1
x
; x = 0,1, 2,3, 4,5
5 x3 3
E ( x) = n ⋅ p
( 3 ) = 5 3 = 1.6667
ESPERANZA
E ( x) = 5 1
3
Si los eventos no fueran independientes habría que restar la covarianza.
60
Var ( x ) = n ⋅ p (1 − p )
( 3 )( 2 3 ) = 10 9 = 1.1111
VARIANZA
Var ( x ) = 5 1
a) 5 aciertos:
( 3) (23)
5 5 −5
P ( x = 5 ) = 5 C5 1 = 0.0041
, La probabilidad de obtener, al azar, 5 aciertos en un examen de 5 preguntas con
tres opciones es de 0.41%.
b) 4 aciertos:
( 3) (23)
4 5− 4
P ( x = 4 ) = 5 C4 1 = 0.0412
c) 3 aciertos:
( 3) (23)
3 5−3
P ( x = 3) = 5 C3 1 = 0.1646
d) 2 aciertos:
( 3) ( 3)
2 5− 2
P ( x = 2 ) = 5 C2 1 2 = 0.3292
e) 1 acierto:
( 3) ( 3)
1 5 −1
P ( x = 1) = 5 C1 1 2 = 0.3292
, La probabilidad de obtener, al azar, 1 acierto en un examen de 5 preguntas con
f) 0 aciertos:
( ) (23 )
P( y = 0)= 5 C 0 1
3
0 5−0
= 0.1317
Si comparamos las probabilidades anteriores, obtener un acierto es lo más probable,

seguido por 2, 3 y 0 aciertos. Empero, según la esperanza, 1.667 será el número de
aciertos esperados si aplicamos el examen muchas veces.
No. aciertos 5 4 3 2 1 0 Total

(%) 0.41 4.12 16.46 32.92 32.92 13.17 100.00
Como puede verse, la suma de probabilidades es 1 (100%). Veamos por qué esta
propiedad es tan importante:
61
Cuando nos piden la probabilidad de más de un valor de X , debemos sumar sus
probabilidades individuales:
g) Menos de 2 aciertos:
P ( x < 2 ) = P ( x = 0 ) + P ( x = 1) = 0.1317 + 0.3292 = 0.4609
Pero cuando nos piden el evento complementario, basta con restar a 1:
h) 2 o más aciertos:
P ( x ≥ 2 ) = 1 − P ( x < 2 ) = 1 − 0.4609 = 0.5391
, Así, sabiendo que la probabilidad de tener menos de dos aciertos es de 46.09%,
fácilmente sabemos que la probabilidad de obtener 2 o más aciertos es el resto:
53.91%.
2. El examen de ingreso a la ENAH posee 120 preguntas, cada una con 5

opciones, pero una está cancelada. Si el examen fuera contestado completamente al
azar, ¿cuántas preguntas con 5 y con 4 opciones serían contestadas en promedio?
a) Con 5 opciones: DATOS GENERALES

Acertar =
n = 120 Errar = P( x = 0 ) = 1 − p = 1 − 1 = 4
P( x = 1) = p = 1 5 5
5
TIPO DE FENÓMENO X ~ Bin ( n = 120, p = 1 5 )
( 5) ( 5) (45)
120 − x
FUNCIÓN DE x
P x n = 120, p = 1 = Cx 1 ; x = 0,1, 2,...,120
PROBABILIDAD 120
ESPERANZA ( 5 ) = 120 5 = 24.0000

E ( x ) = 120 1
VARIANZA Var ( x ) = 120(1 )(4 ) = 480 = 19.2000

5 5 25
b) Con 4 opciones: DATOS GENERALES

Acertar =
n = 120 Errar = P( x = 0 ) = 1 − p = 1 − 1 = 3
P( x = 1) = p = 1 4 4
4
TIPO DE FENÓMENO X ~ Bin ( n = 120, p = 1 4 )
( ) ( 4) ( 3 4)
120 − x
FUNCIÓN DE x
P x n = 120, p = 1 = 120 Cx 1 ; x = 0,1, 2,...,120
PROBABILIDAD 4
ESPERANZA ( 4 ) = 120 4 = 30.0000
E ( x ) = 120 1
VARIANZA Var ( x ) = 120(1 )(3 ) = 360 = 22.5000

4 4 16
, Si las 120 preguntas fueran contestadas al azar y tuvieran 5 opciones, el promedio

de respuestas correctas sería 24, pero como sólo son 4 opciones, el promedio de
aciertos aumenta a 30, lo cual implica aún una calificación reprobatoria de 2.5.
3. Habíamos comentado que la quiniela de pronósticos deportivos Progol consiste

en adjudicar el resultado de catorce partidos: local, empate o visitante. Si la planilla se
contesta al azar, ¿cuál es el número promedio de aciertos y cuál es su varianza?
62
Por otro lado, ¿cuál es la probabilidad de adivinar los 14 resultados y cuál es la
probabilidad de no adivinar ninguno?
DATOS GENERALES
n = 14 Acertar = P( x = 1) = p = 1 Errar = P( x = 0 ) = 1 − p = 1 − 1 = 2
3 3 3
TIPO DE FENÓMENO X ~ Bin ( n = 14, p = 1 3)
( ) ( 3) ( 3)
14 − x
FUNCIÓN DE x
P x n = 14, p = 1 = 14 Cx 1 2 ; x = 0,1, 2,...,14
PROBABILIDAD 3
ESPERANZA ( 3 ) = 14 3 = 4.6667
E ( x ) = 14 1
VARIANZA Var ( x ) = 14(1 )(2 ) = 28 = 3.1111

3 3 9
a) Adivinar todos los resultados:
( 3) (23)
14 14 −14
P ( x = 14 ) = 14 C14 1 = 2.0908 x10−7
, Con otro procedimiento mucho más sencillo hemos calculado de nuevo que la
probabilidad de acertar al azar los 14 resultados de la quiniela es ínfima: de
2.0908x10-5%. Sabiendo de fútbol esto se puede modificar, pero así tampoco se evita
las posibles trampas en la liguilla que llegan a afectar los resultados.
a) No adivinar ningún resultado:
( 3) (23)
0 14 − 0
P ( x = 0 ) = 14 C0 1 = 3.4255 x10−3
, La probabilidad de no acertar ninguno de los 14 resultados de la quiniela es
también muy pequeña: ínfima: 3.4255x10-5%.
Veamos, empero, una forma de comparar estas probabilidades mediante razones de

momios:
e) Razón de momios “ninguno/todos”:

⎡ ⎛ x = 0 ⎞ ⎤ 2.0908 x10−7
⎢ P ⎜ x = 14 ⎟ ⎥ = 3.4255 x10−3 = 0.0001
⎣ ⎝ ⎠⎦
, La probabilidad de no acertar ningún resultado es 0.0001 veces la probabilidad de
adivinar todos el resultado de todos los partidos.
4. Dentro de una colección de cráneos, la probabilidad de encontrar trepanación

en ellos es de 0.14. Si se toma una muestra de 6 cráneos, ¿cuál es la probabilidad de
que se descubra el siguiente número de cráneos con trepanación?
a) 0 cráneos b) 6 cráneos c) 4 cráneos d) Más de 4 cráneos
e) Momios de ninguno/todos
DATOS GENERALES
Presencia
n=6 Ausencia = P( x = 0) = 1 − p = 1 − 0.14 = 0.86
= P( x = 1) = p = 0.14
TIPO DE FENÓMENO X ~ Bin ( n = 6, p = 0.14 )
63
FUNCIÓN DE P ( x n = 6, p = 0.14 ) = 6 Cx ( 0.14 ) ( 0.86 )
6− x
; x = 0,1, 2,3, 4,5, 6
x
PROBABILIDAD
ESPERANZA E ( x ) = 6 ( 0.14 ) = 0.8400
VARIANZA Var ( x ) = 6(0.14)(0.86) = 0.7224
a) 0 cráneos:
P ( x = 0 ) = 6 C0 ( 0.14 ) ( 0.86 )
0 6−0
= 0.4046
, La probabilidad de no encontrar ningún cráneo con trepanación en la colección es
de 40.46%
b) 6 cráneos:
P ( x = 6 ) = 6 C6 ( 0.14 ) ( 0.86 )
6 6−6
= 7.5295 x10 −6
, La probabilidad de encontrar 6 cráneos con trepanación en la colección es de
7.5295x10-4%.
c) 4 cráneos:
P ( x = 4 ) = 6 C4 ( 0.14 ) ( 0.86 )
4 6−4
= 0.0043
, La probabilidad de encontrar 4 cráneos con trepanación en la colección es de
0.43%.
d) Más de 4 cráneos:
P ( x > 4 ) = P ( x = 5) + P ( x = 6) = ⎡ 6 C5 ( 0.14 ) ( 0.86 ) ⎤ + 7.5295 x10−6
5 6 −5
⎣ ⎦
P ( y > 4 ) = 2.7752 x10 + 7.5295 x10 = 2.8505 x10−4
−4 −6
, La probabilidad de encontrar más de 4 cráneos con trepanación en la colección es

de 2.8505x10-2%.
e) Momios de ninguno/todos:
⎡ ⎛ y = 0 ⎞⎤ 0.4046
⎢ P⎜⎜ ⎟⎟⎥ = −6
= 53735.3078
⎣ ⎝ y = 6 ⎠⎦ 7.5295 x10
, La probabilidad de no encontrar ningún cráneo con trepanación (40.46%) es
53735.3078 veces la probabilidad de encontrar 6 cráneos con esta característica
(7.5295x10-4%).
5. Supongamos finalmente que, en una colección del posclásico originaria de

Cholula, la probabilidad de encontrar deformación craneana es de 0.28. Si se analizan
15 cráneos, cuál es la posibilidad de hallar esta característica en:
a) 0 cráneos b) 15 cráneos c) 4 cráneos

d) Más de 13 cráneos e) Menos de 3 cráneos f) Más de 2 cráneos
DATOS GENERALES
Presencia
n=6 Ausencia = P( x = 0) = 1 − p = 1 − 0.14 = 0.86
= P( x = 1) = p = 0.14
TIPO DE FENÓMENO X ~ Bin ( n = 15, p = 0.28)
FUNCIÓN DE P ( x n = 15, p = 0.28) = 15 Cx ( 0.28) ( 0.72 )
15− x
; x = 0,1, 2,...,15
x
PROBABILIDAD
64
ESPERANZA E ( x ) = 15 ( 0.28 ) = 4.2000

VARIANZA Var ( x ) = 15 ( 0.28 )( 0.72 ) = 3.0240
a) 0 cráneos:
P ( x = 0 ) = 15 C0 ( 0.28 ) ( 0.72 )
0 15 − 0
= 0.0072
, La probabilidad de no encontrar ningún cráneo con deformación en la colección es
de %.
b) 15 cráneos:
P ( x = 15 ) = 15 C15 ( 0.28 ) ( 0.72 )
15 15 −15
= 5.0977 x10−9
, La probabilidad de que los 15 cráneos analizados de la colección presenten
deformación es de 5.0977x10-7%.
c) 4 cráneos:
P ( x = 4 ) = 15 C4 ( 0.28 ) ( 0.72 )
4 15 − 4
= 0.2262
, La probabilidad de encontrar cuatro cráneos con deformación en la colección es de
22.62%. Lo cual es un resultado coherente, ya que la probabilidad de casos exitosos
siempre será más alta mientras más se acerque al valor de la esperanza de la
variable aleatoria, que en este caso era de 4.2.
d) Más de 13 cráneos:
P ( x > 13) = P ( x = 14 ) + P ( x = 15 ) = ⎡ 15 C14 ( 0.28 ) ( 0.72 ) ⎤ + 5.0977 x10−9
14 15 −14
⎣ ⎦
P ( x > 13) = 1.9662 x10 + 5.0977 x10 = 2.0172 x10 −7
−7 −9
, La probabilidad de descubrir deformación en más de trece cráneos de la colección

es de 2.0172x10-5%.
e) Menos de 3 cráneos:
P ( x < 3) = P ( x = 0 ) + P ( x = 1) + P ( x = 2 )
P ( x < 3) = 0.0072 + ⎡ 15 C1 ( 0.28 ) ( 0.72 ) ⎤ + ⎡ 15 C2 ( 0.28 ) ( 0.72 ) ⎤
1 15 −1 2 15− 2
⎣ ⎦ ⎣ ⎦
P ( x < 3) = 0.0072 + 0.0423 + 0.1150 = 0.1645
, La probabilidad de que tres de los cráneos estudiados presenten deformación es
de 16.45%.
f) Más de 2 cráneos:
P ( x > 2 ) = 1 − P ( x ≤ 2 ) = 1 − ⎡⎣ P ( x = 0 ) + P ( x = 1) + P ( x = 2 ) ⎤⎦ = 1 − P ( x < 3)
P ( x > 2 ) = 1 − 0.1645 = 0.8355
, La probabilidad de hallar más de dos cráneos con deformación es de 83.55%.
Distribución Poisson X ~ Po ( λ )
65
Finalmente tenemos a la distribución Poisson: un modelo particular de la distribución
Binomial que permite analizar el comportamiento una variable aleatoria discreta
dicotómica cuando la probabilidad de éxito es muy pequeña ( p ≈ 0 ) y la muestra es
muy grande.
Si bien esto implicaría que es posible usar tanto la distribución Binomial como la
Poisson para asignar probabilidades cuando se tienen varias observaciones, es mejor
aplicar la segunda, ya que cuando la n tiende a infinito ( n → N ) la distribución de
probabilidades de la variable tiende a ser exponencial, provocando un cambio
importante en la función de probabilidades:
Expresión donde se
DISTRIBUCIÓN
P ( x n, p ) = n Cx p x (1 − p )
n− x
; x = 0,1, 2,3,..., n especifican los
BINOMIAL
valores que toma X
⇓
Expresión en que no
se hacen explícitos
DISTRIBUCIÓN e− λ λ x
POISSON
P(x λ) = ; x = 0,1, 2,... los valores de X
x! porque la muestra
( n ) es muy grande.
Debe notarse además que en la segunda función de probabilidades los parámetros n
y p no aparecen, pues como no existen criterios universales para determinar cuán
pequeña debe ser la probabilidad de éxito y cuán grande debe ser la muestra, la
distribución Poisson considera como parámetro al número promedio de ocurrencias
del evento, denotado por la letra λ .
Esperanza
Ahora bien, dado que la esperanza de una variable aleatoria discreta dicotómica con
distribución Binomial era:
E ( x) = n ⋅ p
Y si el valor promedio de una variable con distribución Poisson es:
E ( x) = λ
Podemos concluir que:
λ = n⋅ p
Varianza
Por otro lado, si la varianza de una variable aleatoria discreta dicotómica con
distribución Binomial era:
Var ( x ) = n ⋅ p (1 − p )
Pero sabemos que en la distribución Poisson p ≈ 0 y que, por ende, (1 − p ) ≈ 1 ; la
varianza de una variable con tal distribución queda como:
Var ( x ) = n ⋅ p (1 − p )
Var ( x ) = λ (1) = λ
66
En resumidas cuentas: cuando se tiene una variable aleatoria discreta dicotómica de la
cual sólo se sabe el número promedio de ocurrencias o se ha investigado, en una
muestra muy grande, que la probabilidad de éxito es muy pequeña, la mejor forma de
caracterizarla es a través del modelo de distribución Poisson:
X ~ Po ( λ )
e− λ λ x
FUNCIÓN DE PROBABILIDAD P ( x) = ; x = 0,1, 2,...
x!
ESPERANZA E (x ) = λ
VARIANZA Var(x ) = λ
1. Investigaciones indican que en nuestro país 50 de cada 100 mil mexicanos

pueden desarrollar el mal de Parkinson4: trastorno degenerativo que afecta al sistema
nervioso central. Si se toma una muestra de 10 mil personas, ¿cuál es la probabilidad
de que dicho padecimiento esté presente en:
a) Ningún sujeto b) Todos c) 5 individuos

d) Menos de 5 personas e) Más de 5 personas
DATOS GENERALES
50
n = 10000 Presencia = P ( x = 1) = = 0.0005 λ = (10000 )( 0.0005) = 5
100000
TIPO DE FENÓMENO X ~ Po ( λ = 5)
e− λ λ x
P ( x) = ; x = 0,1, 2,...
FUNCIÓN DE x!
PROBABILIDAD e−5 ( 5 )
x
P ( x λ = 5) = ; x = 0,1, 2,...
x!
E (x ) = λ
ESPERANZA
E ( x) = 5
Var(x ) = λ
VARIANZA
Var ( x ) = 5
a) Ningún sujeto:
e −5 ( 5 )
0
P ( x = 0) = = 0.0067
0!
, La probabilidad de que ningún sujeto presente el mal de Parkinson es de 0.67%.
b) Todas las personas:
4
“Se conmemora el Día Mundial del Mal del Parkinson” por Monire Pérez López en Sistema e-once
noticias Internet. 11 de abril del 2007. Página: http://oncetv-
ipn.net/noticias/index.php?modulo=despliegue&dt_fecha=2007-04-11&numnota=3
67
e −5 ( 5 )
10000
P ( x = 10000 ) = ≈0
10000!
, La probabilidad de que todas las personas manifiesten el mal de Parkinson es nula.
c) 5 individuos:
e −5 ( 5 )
5
P ( x = 5) = = 0.1755
5!
, La probabilidad de que 5 individuos manifiesten el mal de Parkinson es de 17.55%.
d) Menos de 5 personas:
P ( x < 5 ) = P ( x = 0 ) + P ( x = 1) + P ( x = 2 ) + P ( x = 3) + P ( x = 4 )
⎛ e−5 ( 5 )1 ⎞ ⎛ e −5 ( 5 )2 ⎞ ⎛ e−5 ( 5 )3 ⎞ ⎛ e −5 ( 5 )4 ⎞
P ( x < 5 ) = 0.0067 + ⎜ ⎟+⎜ ⎟+⎜ ⎟+⎜ ⎟
⎜ 1! ⎟ ⎜ 2! ⎟ ⎜ 3! ⎟ ⎜ 4! ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
P ( x < 5 ) = 0.0067 + 0.0337 + 0.0842 + 0.1404 + 0.1755
P ( x < 5 ) = 0.4405
, La probabilidad de que menos de 5 personas manifiesten el mal de Parkinson es
de 44.05%.
e) Más de 5 personas:
P ( x > 5) = 1 − P ( x ≤ 5)
P ( x > 5 ) = 1 − ⎡⎣ P ( x = 0 ) + P ( x = 1) + P ( x = 2 ) + P ( x = 3) + P ( x = 4 ) + P ( x = 5 ) ⎤⎦
P ( x > 5 ) = 1 − ⎡⎣ P ( x < 5 ) + P ( x = 5 ) ⎤⎦
P ( x > 5 ) = 1 − ( 0.4455 + 0.1755 )
P ( x > 5 ) = 1 − 0.6210 = 0.3790
, Por ende, la probabilidad de que más de 5 personas manifiesten el mal de
Parkinson es de 37.90%.
El Instituto Mexicano del Seguro Social (IMSS), empero, ha informado que más de 50
mil mexicanos padecen el mal de Parkinson5 y que tan sólo durante 2007 otorgó
24,587 consultas a nivel nacional por esta causa6. Así que pese a nuestros cálculos,
existe razón suficiente para seguir investigando los motivos y posibles tratamientos
para este padecimiento.
2. La Secretaría de Salud de Jalisco ha reportado que existen de 3 a 4 casos de

cáncer de mamá y cervicouterino por año en su estado7. Al ser ésta una de las causas
principales de muerte entre las mujeres, el gobierno ha decidido tomar una muestra
grande y calcular la probabilidad de que:
a) Ninguna mujer le presente
5
“El IMSS Otorgó más de 24 mil consultas por mal de parkinson en un año” en CDN. 11 de abril de
2008. Página: http://www.cdn.com.mx/?c=118&a=22677
6
“Padecen Parkinson casi 50 mil mexicanos: IMSS” en El siglo de Durango. 23 de diciembre de 2007.
Página: http://www.elsiglodedurango.com.mx/noticia/151670.padecen-parkinson-casi-50-mil-mexicanos-
imss.siglo
7
“El cáncer es la principal causa de muerte en Tuxpan” en Informativo del Sur de Jalisco. 8 de marzo del
2007. Nota en internet: http://www.periodicoelsur.com/noticias_tuxpan.aspx?idnoticia=8858
68
b) Menos 4 mujeres le padezcan c) Más de 4 lo presenten.
DATOS GENERALES
n=? Presencia = P ( x = 1) = ? λ =3
TIPO DE FENÓMENO X ~ Po ( λ = 4 )
e−3 ( 3)
x
FUNCIÓN DE
PROBABILIDAD P ( x λ = 3) = ; x = 0,1, 2,...
x!
ESPERANZA E ( x) = 3
VARIANZA Var ( x ) = 3
a) Ninguna mujer le presente

e −3 ( 3)
0
P ( x = 0) = = 0.0498
0!
, La probabilidad de que ninguna mujer padezca cáncer (de mama o cervicouterino)
es de 4.98%.
b) Menos de 3 le padezcan:
P ( x < 3) = P ( x = 0 ) + P ( x = 1) + P ( x = 2 )
⎛ e−3 ( 3)1 ⎞ ⎛ e−3 ( 3)2 ⎞
P ( x < 3) = 0.0498 + ⎜ ⎟+⎜ ⎟
⎜ 1! ⎟ ⎜ 2! ⎟
⎝ ⎠ ⎝ ⎠
P ( x < 3) = 0.0498 + 0.1494 + 0.2240
P ( x < 3) = 0.4232
, La probabilidad de que menos de 3 mujeres le padezcan es de 42.32%.
c) Más de 3 le presenten:
P ( x > 3) = 1 − P ( x ≤ 3)
P ( x > 3) = 1 − ⎡⎣ P ( x < 3) + P ( x = 3) ⎤⎦
⎡ ⎛ e −3 ( 3)3 ⎞ ⎤
P ( x > 3) = 1 − ⎢0.4232 + ⎜ ⎟⎥
⎢⎣ ⎜ 3! ⎟ ⎥
⎝ ⎠⎦
P ( x > 3) = 1 − [ 0.4232 + 0.2240]
P ( x > 3) = 1 − 0.6472 = 0.3528
, La probabilidad de que más de 3 mujeres le presenten es de 35.28%.
3. La monosomía del cromosoma X es la causante del denominado síndrome de

Turner que, por definición, afecta exclusivamente a mujeres. Sus principales síntomas
son el retraso de crecimiento, el infantilismo sexual y la posesión de ovarios
rudimentarios sin epitelio germinativo8. Si bien el desarrollo psicomotor varía entre
8
Existen, no obstante, otros síntomas, por ejemplo: edema acentuado del dorso de los pies en el
nacimiento, tórax saliente “en escudo”, pezones hipoplásicos y muy separados, acortamiento del IV
metacarpiano y un sinfín de signos que pueden ir desde una malformación cardiaca a la abundancia de
nevus pigmentarios.
69
pacientes, las malformaciones suelen ser discretas y la supervivencia es normal. Si la
frecuencia de este cariotipo (45,X) es de 0.4 por cada 1,000 niñas; dentro de una
muestra de 10,000 mujeres, ¿qué probabilidad hay de que se encuentren el siguiente
número de casos con síndrome de Turner?
a) 0 casos b) 1 caso c) Más de 3 casos
DATOS GENERALES
0.4
n = 10000 Presencia = P ( x = 1) = = 0.0004 λ = (10000 )( 0.0004 ) = 4
1000
TIPO DE FENÓMENO X ~ Po ( λ = 4 )
e−4 ( 4 )
x
FUNCIÓN DE
PROBABILIDAD P ( x λ = 4) = ; x = 0,1, 2,...
x!
ESPERANZA E ( x) = 4
a) 0 casos:
e −4 ( 4 )
0
P ( x = 0) = = 0.0183
0!
, La probabilidad de que ningún caso presente síndrome de Turner es de 1.83%.
b) 1 caso:
e−4 ( 4 )
1
P ( x = 1) = = 0.0733
1!
, La probabilidad de que aparezca un caso con síndrome de Turner es de 7.33%.
b) Más de 3 casos:
P ( x > 3) = 1 − P ( x ≤ 3)
P ( x > 3) = 1 − ⎡⎣ P ( x = 0 ) + P ( x = 1) + P ( x = 2 ) + P ( x = 3) ⎤⎦
⎡ ⎛ e −4 ( 4 )2 ⎞ ⎛ e−4 ( 4 )3 ⎞ ⎤
P ( x > 3) = 1 − ⎢ 0.0183 + 0.0733 + ⎜ ⎟+⎜ ⎟⎥
⎢⎣ ⎜ 2! ⎟ ⎜ 3! ⎟ ⎥
⎝ ⎠ ⎝ ⎠⎦
P ( x > 3) = 1 − [ 0.0183 + 0.0733 + 0.1465 + 0.1954]
P ( x > 3) = 1 − 0.4335 = 0.5665
, La probabilidad de que aparezcan más de tres casos con síndrome de Turner es
de 56.65%.
4. 1.18 de cada 1000 niños manifiestan el síndrome de Klinefelter, cuyo cariotipo

es 47,XXY. Los varones que lo padecen presentan ginecomastia (desarrollo de
mamas), atrofia testicular con azoospermia (sin atrofia de las células de Leydig) y
aumento de la excreción de FSH. Asimismo, los sujetos poseen una talla elevada y, a
veces, cierta desproporción. Si bien su aspecto puede ser masculino, en ciertos casos
la ausencia de barba y las caderas anchas les dan una morfología femenina. Si
durante una investigación se analizará a 5,000 varones, ¿qué probabilidad hay de que
este síndrome se presente en el siguiente número de casos?
70
a) 2 casos b) 0 casos c) Más de 2 casos
DATOS GENERALES
1.18
n = 5000 Presencia = P ( x = 1) = = 0.0012 λ = ( 5000 )( 0.0012 ) = 5.9
1000
TIPO DE FENÓMENO X ~ Po ( λ = 5.9 )
e−5.9 ( 5.9 )
x
FUNCIÓN DE
PROBABILIDAD P ( x λ = 5.9 ) = ; x = 0,1, 2,...
x!
ESPERANZA E ( x ) = 5.9
VARIANZA Var ( x ) = 5.9
a) 2 casos:
e −5.9 ( 5.9 )
2
P ( x = 2) = = 0.0477
2!
, La probabilidad de que se presenten 2 casos con el síndrome de Klinefelter es de
4.77%.
b) 0 casos:
e −5.9 ( 5.9 )
0
P ( x = 0) = = 0.0027
0!
, La probabilidad de que ningún caso presente el síndrome de Klinefelter es de
0.27%.
c) Más de 2 casos:
P ( x > 2) = 1 − P ( x ≤ 2)
P ( x > 2 ) = 1 − ⎡⎣ P ( x = 0 ) + P ( x = 1) + P ( x = 2 ) ⎤⎦
⎡ ⎛ e −5.9 ( 5.9 )1 ⎞ ⎤
P ( x > 2 ) = 1 − ⎢ 0.0027 + ⎜ ⎟ + 0.0477 ⎥
⎢⎣ ⎜ 1! ⎟ ⎥⎦
⎝ ⎠
P ( x > 2 ) = 1 − [ 0.0027 + 0.0162 + 0.0477 ] = 1 − 0.0666 = 0.9334
, La probabilidad de que más de dos casos presenten el síndrome de Klinefelter es
de 93.34%.
Distribuciones de probabilidad para variables continuas
Una vez revisadas las distribuciones de probabilidad para variables discretas, es turno
de revisar las enfocadas a las variables continuas, donde el área total delimitada por la
curva y el eje de las X es igual a 1; la cual se fragmenta cuando se levantan líneas
perpendiculares para buscar la probabilidad en ciertos intervalos.
Distribución uniforme: X~U(a,b)
Tipo de distribución en la que, dentro de un intervalo (a, b ) , la variable X tiene una

función de probabilidad constante, como puede verse en la siguiente gráfica:
71
0.6
0.5
0.4
P(x)
0.3
0.2 1
0.1
a b
Por sus características se comprende que, la probabilidad de X (igual en todos los
puntos) en el intervalo, suma 1. Por ende: A = P( x )(b − a ) = 1 y de ello de deriva lo
siguiente:
1
FUNCIÓN DE PROBABILIDAD P(x ) = ; x ∈ (a, b )
(b − a )
E (x ) =
(b + a )
ESPERANZA
2
VARIANZA Var ( x ) =
(a − b )2
12
Veamos algunos ejemplos:
1. El tiempo de espera para ser atendido en la ventanilla de Servicios escolares

de la ENAH es una variable con distribución uniforme dentro del horario de 10:00 a
13:00.
TIPO DE FENÓMENO X ~ U (10.00,13.00)

1 1
FUNCIÓN DE PROBABILIDAD P(x ) = = ; x ∈ (10.00,13.00)
(13.00 − 10.00) 3
E (x ) =
(13.00 + 10.00) = 23 = 11.5000
ESPERANZA
2 2
VARIANZA Var ( x ) =
(10.00 − 13.00) = − 3 2 = 9 = 3 = 0.7500
2
12 12 12 4
, De lo cual concluimos que la probabilidad de ser atendido en la ventanilla de

Servicios escolares entre las 10 y las 13 horas es de 1/3, aunque la hora más probable
en que nos atenderán es a las 11:50 a.m.
Ahora, cabe preguntarse cuestiones como:
a) ¿Cuál es la probabilidad de que nos atiendan entre las 10:30 y las 12:00 horas?
3
( ) 3 3
( )
P(10.50 < x < 12.00 ) = (12.00 − 10.50) 1 = 1.50 1 = 1.50 = 0.5000
, La probabilidad de que nos atiendan entre las 10:30 y las 12:00 horas es del
50.00%.
b) ¿Cuál es la probabilidad de que nos atiendan después de las 12:45?
72
3 3
( )
P( x > 12.75) = (13.00 − 12.75) 1 = 0.25 1 = 0.25 = 0.0833
3
( )
, La probabilidad de que nos atiendan después de las 12.45 p.m. es de 8.33%.
c) ¿Cuál es la probabilidad de que nos atiendan a las 12:00 en punto?

P(x = 12.00) = (0) 1 = 0
3
( )
, La probabilidad de que nos atiendan exactamente a las 12:00 p.m. es de 0%. Más
que por cuestiones reales, esto se debe a que en la distribución uniforme y en el resto
de las distribuciones de probabilidad para variables continuas, la probabilidad se saca
por áreas entre la curva y el eje de las X . Para delimitarlas, se requiere en el eje de
las X un intervalo; esto es, más de un punto. Siendo la gráfica de probabilidades
continua, es imposible calcular la probabilidad de que la variable aleatoria tome sólo
un valor, pues la probabilidad en éste será 0.
Distribución normal: X~N(µ,σ)
Llamada también distribución gaussiana, esta distribución es la más importante para la

estadística. Veamos algunas de sus características:
a) La curva se acerca pero nunca toca el eje de las X , por lo cual es una curva
asintótica
b) El área bajo la curva (y por ende, la suma de todas las probabilidades) es igual a 1.
>σ
σ
<σ
c) La media (µ ) divide la gráfica simétricamente así como la probabilidad del área

bajo la curva.
d) La media (µ ) desplaza la gráfica a lo largo del eje X .
e) La desviación estándar (σ ) es la distancia entre la media y el punto de inflexión.
f) El valor de la desviación estándar (σ ) determina el aplanamiento o levantamiento
de la curva (A mayor σ , más plana; y a menor σ , más alta).
g) µ y σ son los parámetros de la distribución; motivo por el cual para cada valor
diferente de ellos se conforma una distribución y una gráfica distinta.
( x − µ )2
FUNCIÓN DE 1 −
PROBABILIDAD
P( x ) = ⋅e 2σ 2
;−∞ < x < ∞
2πσ 2
73
ESPERANZA E (x ) = µ
VARIANZA Var ( x ) = σ 2
El punto es que, por más que tengamos una función de probabilidades específica, al
variar la probabilidad de X continuamente, es necesario resolver integrales para
encontrar la probabilidad de X en un intervalo.
B.3) DISTRIBUCIÓN NORMAL ESTÁNDAR: X~N(0,1)
Esta distribución es un caso especial de la familia de las distribuciones normales, pues

en ella la media (µ ) es igual a 0 y la desviación estándar (σ ) es igual a 1; razón por la
cual su función de probabilidad es la siguiente:
z2
FUNCIÓN DE 1 −
PROBABILIDAD
P(z ) = ⋅ e 2 ;−∞ < x < ∞
2π
Si bien es necesario calcular el valor de Z mediante la función de probabilidad, saber

la probabilidad de esta variable no requiere integrales, pues basta consultar las tablas
ya existentes para ello de la siguiente forma:
Uso de las tablas de probabilidad para las áreas de la curva normal:

Las tablas para áreas de la curva normal presentan los valores de menos infinito a un
valor Z :
Por ello:
1. Cuando se busca la probabilidad de que Z sea menor a un valor, éste se busca
directamente en tablas:
P(z < valor a) , La probabilidad de valor a se busca en tablas.
2. Cuando se busca la probabilidad de que Z sea mayor a un valor, se invierten los

signos +/- y >/<; procedimiento que, debido a la simetría de la curva, evita restar
eventos complementarios.
74
P(z >valor a) , Se transforma a P(z < valor -a) y se busca la probabilidad de valor –a
P(z >valor -a) , Se transforma a P(z < valor a) y se busca la probabilidad de valor a.
3. Cuando se busca la probabilidad de que Z esté en un intervalo (a, b ) , se resta la

probabilidad del mayor al menor (sin cambiar signos) pues para delimitar el intervalo
basta con calcular primero toda el área que es menor al número más grande (b) y
restarle el área menor al número más pequeño (a):
P(valor a < z < valor b) , Se resta P(z < valor b) - P(z < valor a), es decir, se busca
la probabilidad de valor b y se le resta la de valor a.
Estandarización
Estandarizar una variable significa transformar sus valores originales para que los
valores estandarizados tengan una media µ = 1 y una desviación estándar σ = 0 .
Con ello logramos que la distribución de la variable se vuelva de tipo normal estándar,
permitiéndonos el acceso a las tablas de probabilidad.
EXPRESION xi − µ En donde los valores de X i , µ y σ

PARA Z= corresponden a los de la variable original.
ESTANDARIZAR σ
Veamos, ahora sí, para que nos sirve todo lo anterior con un ejemplo:
1. La estatura de la población de las estudiantes femeninas de la ENAH tiene una

distribución aproximadamente normal con media µ = 162 cm. y varianza σ 2 = 17.5 .
¿Qué probabilidad hay de que…
a) elijamos al azar a una chica que mida menos de 160 cm?

b) elijamos al azar a una chica que mida más de 163 cm?
c) elijamos al azar a una chica que mida entre 159 y 161 cm?
75
DATOS GENERALES
X~N(µ,σ) µ = 162 σ 2 = 17.5 σ = 4.18 (
X~N µ = 162, σ 2 = 17.5 )
( x −162 ) 2
1 −
P(x ) = ⋅e 2 (17.5 )
2π (17.5)
( x −162 )2
1 −
P(x ) = ⋅e 35
6.28(17.5)
FUNCIÓN DE ( x −162 )2
1 −
PROBABILIDAD P(x ) = ⋅e 35
109.9
( x −162 )2
1 −
P( x ) = ⋅e 35
10.48
−
( x −162 )2
P ( x ) = 0.10 ⋅ e 35
ESPERANZA E ( x ) = 162
VARIANZA Var( x ) = 17.5
Ahora sí, respondamos los incisos:
a) ¿Qué probabilidad hay de que elijamos al azar a una chica que mida menos de 160
cm?
160
−
( x −162 )2
P( x < 160) = ∫ 0.10 ⋅ e 35
dx
−∞
Como se puede ver, calcular la probabilidad de que X sea menor a 160 implica
resolver esta integral. Si X tuviera una distribución normal estándar con µ = 1 y
σ = 0 , podríamos acceder a las tablas. Entonces lo que haremos es estandarizar la
variable para lograr tal objetivo y poder obtener la probabilidad:
EXPRESIÓN x −µ
PARA Z= i
ESTANDARIZAR σ
⎛ 160 − 162 ⎞ ⎛ −2 ⎞
APLICACIÓN P( x < 160 ) ⇒ P⎜ Z < ⎟ = P⎜ Z < ⎟ = P (Z < −0.48)
⎝ 4.18 ⎠ ⎝ 4.18 ⎠
Observación 1: -0.48 no es la probabilidad de que la chica sea menor a 160 cm., sino el valor
que se ubicará en las tablas intersectando -0.40 (horizontal) y .008 (vertical).
Observación 2: Como se busca la probabilidad de que Z sea MENOR a tal valor, éste se
busca directamente en tablas.
PROBABILIDAD P(Z < −0.48) = 0.3156

, P(x<160)= 0.3156. Esto es: la probabilidad de que la mujer que elijamos sea menor
a 160 cm. es de 0.3156; o bien del 31.56%.
b) ¿Qué probabilidad hay de que elijamos al azar a una chica que mida más de 163
cm?
⎛ 163 − 162 ⎞ ⎛ 1 ⎞
ESTANDARIZACIÓN P( x > 163) ⇒ P⎜ Z > ⎟ = P⎜ Z > ⎟ = P (Z > 0.24 )
⎝ 4.18 ⎠ ⎝ 4.18 ⎠
76
Observación 3: Como se busca la probabilidad de que Z sea MAYOR a tal valor, se cambian
signos y se busca ese nuevo dato en tablas.
PROBABILIDAD P(Z > 0.24) ⇒ P(Z < −0.24) = 0.4052

, P(x>163)= 0.4052. Esto es: la probabilidad de que la mujer que elijamos sea mayor
a 163 cm. es de 0.4052; o bien del 40.52%.
c) ¿Qué probabilidad hay de que elijamos al azar a una chica que mida entre 159 y
161 cm?
Observación 1: Además de estandarizar para encontrar esta probabilidad, es necesario hallar

la probabilidad de X en el intervalo, lo cual logramos restando la probabilidad del valor mayor al
del menor [P(x<161)-P(X<159)]:
⎛ 159 − 162 161 − 162 ⎞

ESTANDARIZACIÓN P (159 < x < 161) ⇒ P⎜ <Z< ⎟
⎝ 4.18 4.18 ⎠
⎛ −3 −1 ⎞
⎟ = P(− 0.72 < Z < −0.24 )
VALORES PARA = P⎜ Z<
TABLAS ⎝ 4.18 4.18 ⎠
PROBABILIDAD ⇒ P(− 0.24) − P(− 0.72) = 0.4052 − 0.2358 = 0.1694
, P(159<x<161)= 0.1694. Esto es: la probabilidad de que la mujer que elijamos mida
entre 159 y 161 cm. es de 0.1694; o bien del 16.94%.
2. El número de respiraciones por minuto de personas adultas en reposo es una

variable que se distribuye de una manera aproximadamente normal con media
µ = 20.5 y desviación estándar σ = 4.3 . Si elegimos al azar a una persona, ¿qué
probabilidad hay de que su número de respiraciones por minuto…
a) sea menor a 18.3? b) sea mayor a 22? c) esté entre 19 y 21?
DATOS GENERALES
X~N(µ,σ) µ = 20.5 σ 2 = 18.49 σ = 4.3 X~N (µ = 20.5, σ = 4.3)
( x − 20.5 )2
1 −
P(x ) = ⋅ e 2 (18.49 )
2π (18.49 )
( x − 20.5 )2
1 −
P(x ) = ⋅e 36.98
FUNCIÓN DE 6.28(18.49 )
PROBABILIDAD ( x − 20.5 )2
1 −
P( x ) = ⋅e 36.98
116.12
( x − 20.5 )2 ( x − 20.5 )2
1 −
P( x ) =
−
⋅e 36.98
P( x ) = 0.09 ⋅ e 36.98
10.78
ESPERANZA E ( x ) = 20.50
VARIANZA Var( x ) = 18.49
a) sea menor a 18.3?
77
⎛ 18.3 − 20.5 ⎞ ⎛ − 2.20 ⎞

P( x < 18.3) ⇒ P⎜ Z < ⎟ = P⎜ Z < ⎟ = P(Z < −0.51)
⎝ 4 .3 ⎠ ⎝ 4 .3 ⎠
P(Z < −0.51) = 0.3050
, P(x<18.3)= 0.3050. Esto es: la probabilidad de que el número de respiraciones por
minuto de la persona elegida al azar sea menor a 18.3 es de 30.50%.
b) sea mayor a 22?

⎛ 22.0 − 20.5 ⎞ ⎛ 1.50 ⎞
P( x > 22 ) ⇒ P⎜ Z > ⎟ = P⎜ Z > ⎟ = P (Z > 0.35)
⎝ 4 .3 ⎠ ⎝ 4 .3 ⎠
P(Z > 0.35) ⇒ P(Z < −0.35) = 0.3632
, P(x>22)= 0.3050. Esto es: la probabilidad de que el número de respiraciones por
minuto de la persona elegida al azar sea mayor a 22 es de 36.32%.
c) esté entre 19 y 21?

⎛ 19.0 − 20.5 21.0 − 20.5 ⎞
P(19 < x < 21) ⇒ P⎜ <Z< ⎟
⎝ 4 .3 4 .3 ⎠
⎛ − 1.50 0.50 ⎞
= P⎜ <Z< ⎟ = P (− 0.35 < Z < 0.12 )
⎝ 4 .3 4 .3 ⎠
P(− 0.35 < Z < 0.12) = P(Z < 0.12) − P(Z < −0.35) = 0.5478 − 0.3632 = 0.1846
, P(19<x<21)= 0.1846. Esto es: la probabilidad de que el número de respiraciones
por minuto de la persona elegida al azar esté entre 19 y 21 es de 18.46%.
Para cerrar este tema, veremos ahora otras distribuciones basadas en las anteriores,
algunas de las cuales utilizaremos posteriormente.
Distribución exponencial
Caso de la familia de funciones de supervivencia, donde la variable aleatoria X es

mayor a cero (motivo por el que toma sólo valores positivos) y mantiene una relación
inversa con su probabilidad, debido a lo cual su gráfica es asintótica con respecto al
eje X y al Y .
FUNCIÓN DE P ( x ) = λ e − λx ; x > 0
PROBABILIDAD
ESPERANZA E (x ) = 1
λ
λ2
Distribución ji-cuadrada o chi-cuadrada: χ2
Distribución resultante de la suma de variables con distribución normal estándar al

cuadrado. Más específicamente, si Z 1 , Z 2 , Z 3 ,..., Z k son variables con distribución
normal estándar [Zi~N(0,1)] y elevadas cada una al cuadrado suman X
( )
x = Z 12 + Z 22 + Z 32 + ... + Z k2 , entonces X toma valores positivos (x ≥ 0) teniendo
( )
una distribución ji-cuadrada χ 2 con K grados de libertad: X~ χ 2 (k)
78
1
P(x ) =
k −1 −x
⋅ X 2 ⋅e 2 La letra Γ representa la función
FUNCIÓN DE k ⎛k⎞ gamma, que sirve para calcular el
PROBABILIDAD 2 2 Γ⎜ ⎟ factorial de funciones continuas.
⎝2⎠
ESPERANZA E (x ) = k
VARIANZA Var ( x ) = 2k
Distribución t de student o distribución-t t~t(k)
Z
La variable t se obtiene dividiendo dos variables independientes t = 9
: una con
x
k
distribución normal estándar [Z~N(0,1)] entre una con distribución ji-cuadrada
[X~ χ 2 (k)]; razón por la cual la variable t tiene una distribución-t con K grados de
libertad.
⎛ k +1 ⎞
−⎜ ⎟
⎛ k + 1⎞ ⎛ t ⎞
2 ⎝ 2 ⎠
Γ⎜ ⎟ ⋅ ⎜⎜1 + ⎟⎟
FUNCIÓN DE ⎝ 2 ⎠ ⎝ k⎠
PROBABILIDAD P(t ) = ;−∞ < t < ∞
⎛k⎞
kΠ ⋅ Γ⎜ ⎟
⎝2⎠
ESPERANZA E (t ) = µ = 0
⎛3⎞ ⎛k −2⎞
Γ⎜ ⎟ ⋅ Γ⎜ ⎟⋅k
⎝ 2⎠ ⎝ 2 ⎠
VARIANZA Var (t ) =
⎛1⎞ ⎛k ⎞
Γ ⎜ ⎟ ⋅ Γ⎜ ⎟
⎝2⎠ ⎝ 2⎠
Distribución F de fisher F~F(K1,K2)
La variable F resulta de dividir dos variables independientes (X 1 , X 2 ), ambas con

distribución ji-cuadrada χ ( ) y con
2
K1 y K 2 grados de libertad en el numerador y en
x1
k1
el denominador, respectivamente: F =
x2
k2
⎛ k + k2 ⎞
Γ⎜ 1 ⎟ k1
−
k1 + k 2
2 ⎠ ⎛ k1 ⎞ ⎛ k ⋅f ⎞
k
FUNCIÓN DE P( f ) = ⎝ ⋅⎜
2
⎟⎟ ⋅ f 2
−1
⋅ ⎜⎜1 + 1 ⎟⎟
2
;f >0
PROBABILIDAD ⎛ k1 ⎞ ⎛ k 2 ⎞ ⎜⎝ k 2 ⎠ ⎝ k2 ⎠
Γ⎜ ⎟ ⋅ Γ⎜ ⎟
⎝2⎠ ⎝ 2⎠
k
ESPERANZA E( f ) = 1
k 2−2
9
Si K es mayor a 30, √x/k ≈ 1; por lo cual la segunda variable tendría una distribución normal estándar.
79
2 ⋅ k 2 (k1 + k 2 − 2)
2
VARIANZA Var ( f ) =
k1 (k 2 − 2 ) ⋅ (k 2 − 4)
2 2
Distribuciones muestrales
Se llama distribución muestral a la distribución de todos los valores posibles que
puede tomar una estadística, calculada a partir de muestras del mismo tamaño (n )
seleccionadas aleatoriamente de la misma población (N ) . En otras palabras, es el
procedimiento para inferir los valores estadísticos de una muestra a partir de los
parámetros de una población.
Distribuciones muestrales para poblaciones con distribución normal X~N(µ,σ)
Distribución de la media muestral (x )
Si en la población de estudio, X tiene una distribución de tipo normal con media µ y

desviación estándar σ , en las muestras seleccionadas aleatoriamente, x es una
variable aleatoria con la misma media de la población y con una desviación estándar
igual a la de la población pero dividida entre la raíz del tamaño de la muestra. Esto es:
X~N(µ,σ) (
x ∼ N µ ,σ n )
MEDIA µ µ
DESVIACIÓN ESTÁNDAR σ
σ
n
VARIANZA σ 2 σ 2
n
xi − µ
FÓRMULA PARA Xi − µ Z=
Z= σ
ESTANDARIZAR σ
n
Analicemos, con un ejemplo, la importancia de esto:
1. Una investigación realizada en cierta escuela versó sobre el uso de drogas,.

Siendo una de las variables estudiadas los años de uso, se encontró que dentro de la
población esta variable tiene una distribución normal con media µ = 4.5 y desviación
estándar σ = 1.7 . Si se toma una muestra de doce estudiantes que usan drogas, ¿qué
probabilidad hay de que la media de la muestra…
a) sea menor de 4 años? b) sea mayor de 7 años? c) esté entre 5.5 y 6.8 años?
DATOS GENERALES
X~N(µ,σ) µ = 4 .5 σ = 1.7 X~N (µ = 4.5, σ = 1.7 )
X~N(µ=4.5,σ=1.7) (
x ∼ N µ ,σ n )
MEDIA µ = 4.5 µ = 4.5
DESVIACIÓN
σ = 1.7 σ = 1.7 = 0.49
ESTÁNDAR 12
σ 2 = (1.7 ) 12 = 0.24
2
VARIANZA σ2 = 2.89
80
a) sea menor de 4 años?
FÓRMULA xi − µ
Z=
PARA σ
ESTANDARIZAR n
⎛ ⎞
⎜ ⎟
4 − 4.5 ⎟
APLICACIÓN P(x < 4) = P Z <
⎜ = P(Z < −1.02)
⎜ 1.7 ⎟
⎜ ⎟
⎝ 12 ⎠
P(Z < −1.02) = 0.1539
, La probabilidad de que la media de las muestra de doce estudiantes que usan
drogas sea menor a 4 años es de 15.39%
b) sea mayor de 7 años?

⎛ ⎞
⎜ ⎟
7 − 4.5 ⎟
P(x > 7 ) = P Z >
⎜ = P(Z > 5.09 )
⎜ 1.7 ⎟
⎜ ⎟
⎝ 12 ⎠
P(Z > 5.09) = P(Z < −5.09) ≈ 0
drogas sea mayor a 7 años es casi nula.
c) esté entre 5.5 y 6.8 años? P(5.5 < x < 6.8)

⎛ ⎞
⎜ ⎟
5.5 − 4.5 6.8 − 4.5 ⎟ = P⎛⎜ 1.00 < Z < 2.30 ⎞⎟ = P(2.04 < Z < 4.69)
P⎜ <Z<
⎜ 1.7 1.7 ⎟ ⎝ 0.49 0.49 ⎠
⎜ ⎟
⎝ 12 12 ⎠
P(2.04 < Z < 4.69) = P(Z < 4.69) − P(Z < 2.04) = 1 − 0.9793 = 0.0207
drogas esté entre los 5.5 y 6.8 años es del 2.07%.
Distribución de la proporción muestral ( p̂ )
Cuando X es una variable que toma 2 valores ( x = {0,1}) en una población (N ) , M

es el número de eventos exitosos (x = 1) . Por ende, dividiendo M entre N
obtenemos la proporción de eventos que poseen la característica de interés.
Si la población tiene una distribución normal, en las muestras seleccionadas
aleatoriamente la media de las proporciones es igual a la proporción real de la
población, con una desviación estándar igual a la raíz cuadrada de los eventos
exitosos por los no exitosos entre el número de elementos de la muestra:
81
PROPORCIÓN PROPORCIÓN
POBLACIONAL MUESTRAL
PROPORCIÓN p=M pˆ = m
N n
P (1 − P )
DESVIACIÓN ESTÁNDAR σ
n
P (1 − P )
VARIANZA σ2
n
pˆ − P
FÓRMULA PARA Xi − µ Z=
Z= P(1 − P )
ESTANDARIZAR σ
n
Comprobemos, mediante ejemplos, cómo funciona esto:
1. Se sabe que la proporción de estudiantes de la ENAH que simpatizan con el

movimiento del EZLN es de 0.38. Se selecciona una muestra de 15 estudiantes al
azar. ¿Cuál es la probabilidad de que la proporción muestral ( p̂ ) :
a) sea menor de 0.30? b) sea mayor de 0.35? c) esté entre 0.36 y 0.40?
DATOS GENERALES
p = 0.38 1 − p = 0.62 n = 15
a) sea menor de 0.30?

FÓRMULA pˆ − P
Z=
PARA P(1 − P )
ESTANDARIZAR n
⎛ ⎞
⎜ ⎟
⎜ 0.30 − 0.38 ⎟
APLICACIÓN P( pˆ < 0.30 ) = P Z < = P (Z < −0.64 ) = 0.2611
⎜ 0.38(0.62 ) ⎟
⎜ ⎟
⎝ 15 ⎠
P(Z < −0.64) = 0.2611
, La probabilidad de que la proporción muestral de simpatizantes con el movimiento
del EZLN sea menor de 0.30 es del 26.11%.
b) sea mayor de 0.35?

⎛ ⎞
⎜ ⎟
⎜ 0.35 − 0.38 ⎟
P ( pˆ > 0.35) = P Z > = P (Z > −0.24 )
⎜ 0.38(0.62 ) ⎟
⎜ ⎟
⎝ 15 ⎠
P(Z > −0.24) ⇒ P(Z < 0.24) = 0.5948
del EZLN sea mayor de 0.35 es del 59.48%.
82
c) esté entre 0.36 y 0.40?
⎛ ⎞
⎜ ⎟
⎜ 0.36 − 0.38 0.40 − 0.38 ⎟
P(0.36 < pˆ < 0.40 ) = P <Z< = P(− 0.16 < Z < 0.16 )
⎜ 0.38(0.62 ) 0.38(0.62 ) ⎟
⎜ ⎟
⎝ 15 15 ⎠
P(− 0.16 < Z < 0.16) = P(Z < 0.16) − P(Z < −0.16) = 0.5636 − 0.4364 = 0.1272
del EZLN esté entre 0.36 y 0.40 es del 12.72%.
2. Se sabe que la proporción de estudiantes que al mismo tiempo lleva otra

licenciatura es de 0.12. Si se toma una muestra de 15 estudiantes de la ENAH, ¿cuál
es la probabilidad de que en esta muestra la proporción de estudiantes con esa
característica:
a) sea mayor del 10%? b) sea menor del 0.15%? c) esté entre 0.11 y 0.14?
DATOS GENERALES
p = 0.12 1 − p = 0.88 n = 15
a) sea mayor del 10%?

⎛ ⎞
⎜ ⎟
⎜ 0.10 − 0.12 ⎟
P ( pˆ > 0.10 ) = P Z > = P (Z > −0.24 )
⎜ 0.12(0.88) ⎟
⎜ ⎟
⎝ 15 ⎠
P(Z > −0.24) ⇒ P(Z < 0.24) = 0.5948
, La probabilidad de que en esta muestra la proporción de estudiantes que cursan, a
la vez, dos licenciaturas, sea mayor a 0.10 es de 59.48%.
b) sea menor del 0.15%?

⎛ ⎞
⎜ ⎟
⎜ 0.15 − 0.12 ⎟
P( pˆ < 0.15) = P Z < = P (Z < 0.36 )
⎜ 0.12(0.88) ⎟
⎜ ⎟
⎝ 15 ⎠
P(Z < 0.36) = 0.6406
la vez, dos licenciaturas, sea menor a 0.15 es de 64.06%.
c) esté entre 0.11 y 0.14?

⎛ ⎞
⎜ ⎟
⎜ 0.11 − 0.12 0.14 − 0.12 ⎟
P (0.11 < pˆ < 0.14 ) = P <Z< = P(− 0.12 < Z < 0.24 )
⎜ 0.12(0.88) 0.12(0.88) ⎟
⎜ ⎟
⎝ 15 15 ⎠
= P(− 0.12 < Z < 0.24) = P(Z < 0.24) − P(Z < −0.12) = 0.5948 − 0.4522 = 0.1426
la vez, dos licenciaturas, esté entre 0.11 y 0.14 es de 14.26%.
83
Comparación de dos medias muestrales ( x1 − x 2 )
Sabiendo cómo se calcula la media muestral, es posible comparar las estadísticas de

dos muestras mediante las siguientes fórmulas:
PARA UNA MUESTRA PARA DOS MUESTRAS
MEDIA µ µ1- µ2
DESVIACIÓN ESTÁNDAR
σ σ1 2
+
σ 2
2
n n1 n2
VARIANZA σ2 σ 12 +
σ 22
n n1 n2
xi − µ x1 − x 2 − (µ1 − µ 2 )
FÓRMULA PARA Z= Z=
σ σ 12 +σ2
2
ESTANDARIZAR
n n1 n2
Comparación de dos proporciones muestrales ( pˆ 1 − pˆ 2 )
Sabiendo cómo se calcula la proporción muestral, es posible comparar las

proporciones de dos muestras mediante la siguiente fórmula:
PARA UNA MUESTRA PARA DOS MUESTRAS

m m
µ pˆ = µ pˆ =
n n
pˆ − P pˆ 1 − pˆ 2 − (P1 − P2 )
Z= Z=
FÓRMULA PARA
P(1 − P ) P1 (1 − P1 ) P2 (1 − P2 )
ESTANDARIZAR +
n n1 n2
Distribuciones muestrales para poblaciones sin distribución normal X~?(µ,σ)
Distribución de la media muestral (x )
Según el TEOREMA CENTRAL DE LÍMITE (TCL), “Dada una población de cualquier

forma funcional no normal, con una media µ y una varianza σ 2 , la distribución
muestral de x , calculada a partir de muestras de tamaño n de dicha población, será
casi normal con media µ y una varianza σ
2
cuando la muestra es muy grande”.
n
En otras palabras, cuando X es una variable cuyo tipo de distribución no se conoce,
pero tiene una media µ y una varianza σ 2 , pude asumirse que esta variable tiene
una distribución normal con media µ y una varianza σ
2
, siempre y cuando el
n
tamaño de la muestra sea grande (n → N ) , lo cual, según simulaciones de muestras
y probabilidades implica que tenga más de 30 elementos (n > 30) .
Por tal motivo, para calcular probabilidades sobre esta variable puede utilizarse la
siguiente fórmula:
84
X~?(µ,σ) Si n > 30 , X~N(µ,σ)
xi − µ
FÓRMULA PARA Z=
X , σ
ESTANDARIZAR
n
Apliquemos esto para reafirmar cuándo sí aplica el TCL y cuando no:
1. En una población de jóvenes de 17 años de edad, la media del espesor del

pliegue subescapular (en milímetros) es de 9.7 con una desviación estándar de 6.0. A
partir de una muestra de tamaño 14 extraída de esa población, calcular la probabilidad
de que la media de la muestra:
a) sea mayor de 11. b) sea menor de 7.5 c) esté entre 7 y 10.5.
DATOS GENERALES
µ = 9 .7 σ = 6.0 n = 14X~? (µ = 4.5, σ = 1.7 )
, No se pueden calcular probabilidades, puesto que no se sabe el tipo de distribución
de probabilidad de este fenómeno y la muestra no es grande (mayor a 30) como para
considerarla de tipo normal.
2. En una población de jóvenes de 17 años de edad, la media del espesor del

pliegue subescapular (en milímetros) es de 9.7 con una desviación estándar de 6.0. A
partir de una muestra de tamaño 40 extraída de esa población, calcular la probabilidad
de que la media de la muestra:
a) sea mayor de 11. b) sea menor de 7.5 c) esté entre 7 y 10.5.
DATOS GENERALES
µ = 9 .7 σ = 6.0 n = 40 X~? (µ = 4.5, σ = 1.7 )
a) sea mayor de 11.

⎛ ⎞
⎜ 11 − 9.7 ⎟
P( x > 11) = P⎜ z > ⎟ = P( z > 1.37 )
⎜ 6.0 ⎟
⎝ 40 ⎠
P( z > 1.37) ⇒ P( z < −1.37 ) = 0.0853
, La probabilidad de que la media del espesor del pliegue subescapular en esta
muestra sea mayor de 11 es del 8.53%.
b) sea menor de 7.5

⎛ ⎞
⎜ 7.5 − 9.7 ⎟
P( x < 7.5) = P⎜ z < ⎟ = P( z < −2.32 )
⎜ 6.0 ⎟
⎝ 40 ⎠
P( z < −2.32) = 0.0102
muestra sea menor de 7.5 es del 1.02%.
c) esté entre 7 y 10.5.
85
⎛ ⎞
⎜ 7 − 9.7 10.5 − 9.7 ⎟
P(7 < x < 10.5) = P⎜ <z< ⎟ = P(− 2.85 < z < 0.84 )
⎜ 6.0 6.0 ⎟
⎝ 40 40 ⎠
P(− 2.85 < z < 0.84) = P( z < 0.84) − P( z < −2.85) = 0.7795 − 0.0022 = 0.7773
muestra esté entre los 7 y 10.5 milímetros es de 77.73%.
EJERCICIOS DE REPASO DE LA UNIDAD II

1. En una excavación de entierros de cierta población se sabe que el 35% son
mujeres. Se toma una muestra de 40 entierros. Hallar la probabilidad de que
en la muestra
a) ningún entierro sea mujer
b) todos los entierros correspondan a mujeres
c) el número de mujeres sea distinto de 15
d) haya más de dos mujeres en los entierros
e) más de la mitad de los entierros sean de mujeres
2. En un determinado sitio arqueológico con vestigios de diferentes tipos de
animales, se sabe que en promedio hay 3 huesos de caballo.
a) Escribe la función de probabilidad, su valor esperado y varianza.
Calcular la probabilidad de que:
b) ninguna de las muestras tenga restos de hueso de caballo.
c) 4 muestra tenga restos de hueso de caballo.
d) al menos tres de las muestras tengan restos de hueso de caballo.
3. El tiempo que un estudiante de Osteología tarda en determinar si un cráneo
es de mujer u hombre obedece una ley de probabilidades uniforme. Si el
tiempo de identificación varía entre 5 y 18 minutos:
a) Escribe la función de probabilidad de esta variable, calcula el tiempo promedio
que se tardará y calcula su varianza.
b) ¿Cuál es la probabilidad de un cráneo sea identificado en menos de 4 minutos?
c) ¿Cuál es la probabilidad de un cráneo sea después de 15 minutos?
d) Si se tiene una muestra de 270 cráneos ¿cuántos se identificarán antes de 15
minutos?
4. En un restaurante de comida rápida, 25% de las órdenes para beber es una
bebida pequeña, 35% de una mediana y 40% una grande. Sea x=1 si se
escoge aleatoriamente una orden de bebida pequeña, y x=0 en cualquier otro
caso. Sea y=1 si se escoge aleatoriamente una orden de bebida mediana,
y=0 en cualquier otro caso. Sea z=1 si se escoge aleatoriamente una orden de
bebida grande, z=0 para cualquier otro caso.
a) Si px es la probabilidad de éxito de x, determina la función de probabilidad.
b) Si p y es la probabilidad de éxito de x, determina la función de probabilidad.
c) Si pz es la probabilidad de éxito de x, determina la función de probabilidad.
d) ¿Es pz = px + p y ?
e) ¿Es z = x + y ?
f) ¿Es posible que x e y sean iguales a 1 simultaneamente?
5. Sea X el número de horas semanales que los estudiantes de la ENAH dedican
al estudio. Se cree que X se distribuye aproximadamente normal con media
de 43 hrs. y desviación estándar de 10 hrs. Se selecciona un alumno al azar,
¿cuál es la probabilidad de que estudie:
86
a) más de 45.2 hrs. Semanales
b) menos de 41.5 hrs. Semanales
c) menos de 38 hrs. Semanales
d) entre 39 y 44 hrs. Semanales
6. El tiempo de gestación para los bebés humanos tiene una distribución
aproximadamente normal con media de 278 días y desviación estándar de 12
días.
a) Encuentre los cuartiles superior e inferior para los tiempos de gestación
b) ¿Sería raro que un bebé naciera antes de 6 meses de gestación? Explique.
7. En una cierta población 15% de las personas tiene sangre Rh negativo. Un
banco de sangre recibe 92 donadores un día particular.
a) ¿Cuál es la probabilidad de que 10 o menos tengan Rh negativo?
b) ¿Cuál es la probabilidad de que entre 15 y 20 de los donadores tengan Rh
negativo?
c) ¿Cuál es la probabilidad de que más de 80% de los donadores tengan Rh
positivo?
8. El 9% de los hombres y el 0.25% de las mujeres no pueden distinguir entre
los colores rojo y verde. Este tipo de daltonismo causa problemas con las
señales de tránsito. Los investigadores necesitan al menos 50 hombres con
este tipo de ceguera al color, de manera que seleccionan aleatoriamente a
600 hombres para un estudio de percepción de las señales de tránsito.
Estima la probabilidad de que al menos 50 de los hombres no distingan entre
el rojo y el verde.
¿Es el resultados lo suficientemente alto como para que los investigadores
puedan confiarse de obtener al menos 50 hombres con daltonismo?
9. La calificación media en un examen de estadística fue de 7.2 y la desviación
estándar de 0.9. En vista de esta situación, el profesor decide que el 12% de
los alumnos con calificaciones mayores obtendrán la nota más alta del
sistema de evaluación. Suponiendo distribución normal en la variable
calificación:
a) ¿Cuál es la calificación mínima que un estudiante debe tener para recibir la
nota más alta?
b) Si el profesor considera que sólo no aprobará el 5% ¿cuál es la calificación
mínima aprobatoria?
10. En cierta población el 98% de las personas tienen Rh positivo. Suponga que
se casan dos personas de esta población que consta de 3643 pobladores.
¿cuál es la probabilidad de que el factor Rh de los dos sea negativo, con lo
cual sería inevitable que sus hijos tuvieran Rh negativo?
11. La enfermedad de Tay-Sachs es una enfermedad mortal del sistema nervioso
que se transmite de padres a hijos. Si ambos padres son portadores de la
enfermedad, la probabilidad de que su descendencia la desarrolle es de 0.25.
Suponga que que una pareja es portadora de la enfermedad y que la esposa
ha estado embarazada en tres ocasiones. Si la ocurrencia de la enfermedad
de Tay-Sachs en cualquier descendiente es independiente de la ocurrencia
en cualquier otro, ¿cuál es la probabilidad de que:
a) Los tres niños desarrollarán la enfermedad de Tay-Sachs?
b) Sólo un niño desarrollará la enfermedad de Tay Sachs?
12. Cada vez más investigaciones y análisis se centran en el número de
enfermedades asociadas con el organismo Escherichia coli que provoca la
descomposición de los glóbulos rojos y hemorragias intestinales en sus
víctimas. En la Cd. de México se han presentado brotes esporádicos de
Escherichia coli a una tasa de 2.5 por cada 100,000 individuos en un periodo
de 2 años.
a) ¿Cuál es la probabilidad de que a lo sumo se den cinco casos de Escherichia
coli en un año determinado?
87
b) ¿Cuál es la probabilidad de que se presenten más de 5 caos de Escherichia
coli en un año determinado?
c) ¿Una frecuencia de 95% de Escherichia coli tiene que ver con a lo más cuántos
casos?
13. Supongamos que el peso en niños de último grado de jardín de niños en la
delegación Milpa Alta tiene una distribución aproximadamente normal con
media 18.25 kg. y una desviación estándar de 2.96 kg. Suponiendo que se
toma un niño al azar en esta población, ¿cuál es la probabilidad de que su
peso
a) sea menor de 14 kg.? b) sea menor de 23 kg.?
c) sea mayor de 17 kg.? d) sea mayor de 15 kg.?
e) esté entre 15 y 19 kg.? f) se encuentre entre 24 y 28 kg.?
14. En relación con la población mencionada en el ejercicio 13, se supone que la
variable estatura sigue una distribución aproximadamente normal, con media
de 1066 mm. y una desviación estándar de 46.10 mm. Supongamos que se
selecciona un niño al azar ¿cuál es la probabilidad de que su estatura:
a) sea menor de 1000 mm. b) sea mayor de 1120 mm.
c) se encuentre entre 960 y 1140 mm. d) se encuentre entre 1150 y 1200 mm.
e) Si deseamos seleccionar al 5% de estatura más baja, ¿a partir de qué valor se
consideran?
f) Si deseamos seleccionar al 15% de estatura más alta, ¿a partir de qué valor se
consideran?
15. Investiga la expresión de la función de probabilidades geométrica, su
esperanza y varianza y describe un ejemplo simulado en antropología física.
16. Investiga la expresión de la función de probabilidades hipergeométrica, su
esperanza y varianza y describe un ejemplo simulado en antropología física.
88
UNIDAD III
5. ESTADÍSTICA DESCRIPTIVA
Breve historia de la estadística
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones
lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población
y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza
y población se hizo con el objetivo de preparar la construcción de las pirámides. En el
mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo
reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los
datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por
otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de
conocer el número de la población[3].
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos
efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y
militares (cálculo de recursos y hombres disponibles). La investigación histórica revela
que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto
y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor
supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de
la población y sus funcionarios públicos tenían la obligación de anotar nacimientos,
defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las
riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía
uno de estos empadronamientos de la población bajo la autoridad del imperio[4].
Durante los mil años siguientes a la caída del imperio Romano se realizaron muy
pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en
el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de
siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del
Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las
tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra[5].
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra,
trataron de revivir la técnica romana, los métodos estadísticos permanecieron casi
olvidados durantes la Edad Media.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás
Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron
grandes operaciones al método científico, de tal forma que cuando se crearon los Estados
Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de
aplicarse a los datos económicos.
Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al
temor que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la
ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un
brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a
publicar estadística semanales de los decesos. Esa costumbre continuó muchos años, y
en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y
fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban
treinta años y efectuó predicciones sobre el número de personas que morirían de varias
89
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabía

esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ...
Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis
estadístico.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de
los recursos nacionales, comprensiva de datos sobre organización política, instrucciones
sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más
concretas de métodos de observación y análisis cuantitativo y amplió los campos de la
inferencia y la teoría Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística
Demográfica como resultado de la especulación sobre si la población aumentaba,
decrecía o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo
lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en
Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los
años terminados en siete moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de
partidas de defunción pudo demostrar que en tales años no fallecían más personas que
en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés
Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida
humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan
todas las compañías de seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante
durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de
azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos.
Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la
palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con
sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el
término latino status, que significa estado o situación; Esta etimología aumenta el valor
intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de las más
variadas situaciones.
Jacques Quételet es quien aplica las Estadísticas a las ciencias sociales. Este
interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la
aplicación del principio de promedios y de la variabilidad a los fenómenos sociales.
Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico,
entonces conocido, a las diversas ramas de la ciencia.
Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos
matemáticos fundamentales para la teoría Estadística; la teoría de los errores de
observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados
desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston
ideó el método conocido por Correlación, que tenía por objeto medir la influencia relativa
de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de
correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J.
Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la
medida de las relaciones.
90
Los progresos más recientes en el campo de la Estadística se refieren al ulterior

desarrollo del cálculo de probabilidades, particularmente en la rama denominada
indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la
Física como resultado de las investigaciones atómicas y que este principio se juzga
aplicable tanto a las ciencias sociales como a las físicas.
Etapas de Desarrollo de la Estadística
La historia de la estadística está resumida en tres grandes etapas o fases.
1.- Primera Fase: Los Censos:
Desde el momento en que se constituye una autoridad política, la idea de inventariar de

una forma más o menos regular la población y las riquezas existentes en el territorio está
ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos.
2.- Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política:
Las ideas mercantilistas extrañan una intensificación de este tipo de investigación.

Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la
población: los intendentes del Reino envían a París sus memorias. Vauban, más
conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un
impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más
tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia natural.
La escuela inglesa proporciona un nuevo progreso al superar la fase puramente
descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo
es autor de la famosa Aritmética Política.
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de
población, desarrolla los estudios industriales, de las producciones y los cambios,
haciéndose sistemáticos durantes las dos terceras partes del siglo XIX.
3.- Tercera Fase: Estadística y Cálculo de Probabilidades:
El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis

extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en
general para el estudio de fenómenos “cuyas causas son demasiados complejas para
conocerlos totalmente y hacer posible su análisis”.
Conceptos básicos
Hemos visto ya cómo, superando una actividad al servicio gubernamental y

enriqueciéndose con teorías como el cálculo de probabilidades, la estadística logró
consolidarse para el siglo XIX como disciplina científica per se. Pese a ello, las
posibilidades que esta ciencia ofrece para analizar y entender datos numéricos han sido
razón suficiente para que muchos otros campos sigan encontrando en ella una
herramienta para alcanzar conclusiones y tomar decisiones.
Variables
91
Cuando el cuestionar un fenómeno deriva en un estudio, lo primero que debe hacerse es

definir el problema concreto y sugerir una hipótesis. Ésta puede contemplar que uno o
más elementos conforman dicho fenómeno o interactúan con él, motivo por el cual ha de
investigárseles.
Sin importar la temática del estudio, debe considerarse como constantes a los factores
que se descubre son inmutables y como variables a todas las características
“cambiantes”, porque demuestran poseer valores diferentes, sean números resultantes de
una medición o números asignados a partir de un conteo u otra pauta. Pero es
precisamente esta sutil diferencia lo que permite especificar y clasificar el género y tipo de
las variables a investigar:
Variables cualitativas
Variables que dan información respecto a los atributos de una entidad; razón por la que
sus valores son únicamente categorías que no pueden ser medidas, sólo contadas para
encontrar su frecuencia.
Nominales: Variables en las que sólo se nombra o designa con etiquetas a las
observaciones, por lo cual sus valores no pueden ser comparados o
jerarquizados de forma alguna.
Ejemplos: Sexo, nacionalidad, idioma y color de piel.
Ordinales: Variables cuyos valores son categorías, las cuales pueden

ordenarse de acuerdo a la relación que exista entre ellas (de menor a mayor
grado, por ejemplo) o a otro criterio cuya escala no es necesariamente precisa
y/o equitativa.
Ejemplos: Escolaridad, estado de salud y nivel socioeconómico.
Variables cuantitativas
Variables que aportan información respecto a cantidades; por tal motivo su valor puede
ser medido y representado numéricamente.
Discretas: Variables que, al poseer un número finito de valores posibles,

muestran interrupciones en su escala. Es por ello que los números de las
variables cuantitativas discretas son generalmente enteros.
Ejemplos: Número de personas y objetos.
Continuas: Variables en cuyo intervalo posible existe un número infinito de

valores; debido a ello pueden mostrar valores decimales o fraccionarios.
Empero, cabe remarcar que las variables cuantitativas continuas terminan por
ser registradas como discretas debido a las formas e instrumentos de
medición.
Ejemplos: Peso, estatura, edad, diámetros y perímetros antropométricos.
Datos, investigación y estadística
Decididos los factores a investigar (constantes y variables), es necesario recopilar

información y datos sobre ellos. Una primera opción es echar mano de fuentes como:
92
Registros: Cédulas, libros y demás formatos donde las instituciones registran su

actividad cotidiana.
Literatura: Informes, artículos y publicaciones en los que puede indagarse la
respuesta dada a una pregunta para ver si es aplicable a la problemática actual.
Empero, cuando la información requerida no se halla disponible, no ha sido almacenada o

no existe, uno deben generar sus propios datos mediante diversos procedimientos; entre
ellos:
Encuesta: Metodología para recolectar información a través de elementos como

cuestionarios y entrevistas.
Experimentación: Proceso en que un fenómeno es recreado de manera
controlada a fin de registrar sus resultados.
La observación de estos materiales o procesos tiene por resultado el registro de

información que, al ser contada o medida, puede representarse con números y conformar
un grupo de datos. La simple necesidad de manejarlos sugiere entonces el uso de la
estadística descriptiva; es decir, el conjunto de técnicas que esta disciplina posee para
recolectar, organizar, resumir y analizar la información contenida en datos.
Ahora bien, por cuestiones de tiempo, recursos o costo, las investigaciones pocas veces
recaban información sobre la población; esto es, el conjunto total de entidades de interés
para su estudio, sean individuos, objetos o lugares. Los datos se obtienen entonces de
muestras: subconjuntos o fracciones de la población.
Por ende, si el objetivo de la investigación es, más allá de analizar un caso, estudiar un
fenómeno, es la estadística inferencial quien, basada en la teoría de probabilidades
(bajo el principio de que pese al azar es posible determinar un orden y regularidad en los
procesos), permite hacer afirmaciones sobre la población a partir de lo observado en una
muestra.
Cabe mencionar, sin embargo, que aun manteniéndose en el nivel de la estadística

descriptiva, el objetivo de dicha metodología es investigar y evaluar la naturaleza y el
significado de los datos, razón por la cual, además de dominar las técnicas, cualquier
usuario de la estadística debe estar preparado para interpretar los números y comunicar
sus resultados.
ORGANIZACIÓN Y ANÁLISIS DE VARIABLES
A menos que sean muy pocos, los datos recolectados (crudos) no permiten determinar la
información contenida en ellos. Para lograr su análisis la estadística ha propuesto una
serie de técnicas que, dependiendo del tipo de variable, echan mano de herramientas
como tablas, gráficas y ciertas medidas.
A fin de revisar su aplicación, en este capítulo realizaremos algunos ejercicios con las
observaciones recolectadas a través de la cédula “Autopercepción, sexualidad y
antropometría”. Dicha encuesta fue aplicada a los alumnos del turno matutino y vespertino
que asistieron a la materia de Estadística (en la licenciatura de Antropología física de la
Escuela Nacional de Antropología e Historia) en el periodo 2008-1. Para futuras
referencias, la cédula y base de datos generada se anexan como apéndices.
Heramientas para el análisis de variables cualitativas
93
Tablas de frecuencias
Son tablas en las que señala: primero, cuántas veces aparece cada etiqueta de la variable
a lo largo de toda la muestra; es decir, su frecuencia (simple). Después, cuál es su
densidad; esto es, su frecuencia relativa: valor que puede calcularse dividiendo el
número de casos observados entre el tamaño de la muestra (n ) y que, multiplicado por
cien, indica el porcentaje de la etiqueta respecto al total:
FRECUENCIA
VARIABLE FRECUENCIA PORCENTAJE
RELATIVA
Etiqueta 1 # de casos casos n (casos n ) ⋅ 100
(…)
Etiqueta n # de casos casos n (casos n ) ⋅ 100
Tamaño de
muestra (n )
TOTAL 1.0000 100.00
En el caso de variables cualitativas ordinales también es posible obtener dos tipos de

frecuencias más: la frecuencia acumulada (que consiste en la suma de las frecuencias
simples) y la frecuencia relativa acumulada (donde la frecuencia acumulada se divide
entre el tamaño de la muestra), siendo la última sumamente útil cuando se desea
encontrar la frecuencia total de los precedentes de una categoría con el objetivo de
reconocer el porcentaje de casos que se encuentran por debajo de su nivel:
FRECUENCIA
FRECUENCIA FRECUENCIA
VARIABLE FRECUENCIA RELATIVA
RELATIVA ACUMULADA
ACUMULADA
Categoría
1
Casos (c1 ) (c1 n) [(c1 )] [(c1 ) n]
⎡ (c1 ) + (c 2 ) ⎤
Categoría
Casos (c2 ) (c2 n) [(c1 ) + (c2 )] ⎢ ⎥
2 ⎣ n ⎦
⎡ (c1 ) + (c 2 ) + (c3 )⎤
Categoría Casos (c3 ) (c3 n ) [(c1 ) + (c2 ) + (c3 )] ⎢ ⎥
3 ⎣ n ⎦
(…) (…) (…) (…) (…)
Casos (c n ) (cn n )
Categoría Tamaño de
muestra (n )
n 1.00
Tamaño de
muestra (n )
TOTAL 1.00
Gráficas de frecuencias
94
Otra forma de resumir y a la vez representar los datos de una variable cualitativa es a
través de gráficos. Por tratarse de características cuyos valores son categorías con
determinada frecuencia relativa se sugiere entonces el uso de gráficas de barras o de
gráficas circulares:
a) Gráficas de barras: Las gráficas de barras se caracterizan por construirse en

base a dos ejes: en el horizontal (abscisas, X) se distinguen las categorías de la
variable y a partir de él se construyen los rectángulos con la altura (frecuencia) que
ésta presentó, de acuerdo a la escala que se indica en el eje vertical (ordenadas,
Y).
Cabe remarcar ahora, dos cosas sobre este tipo de gráficas:
Las barras pueden estar separadas debido a que no hay continuidad entre las
categorías.
Se sugiere que las frecuencias utilizadas en la construcción del gráfico sean las
relativas, ya que estas permiten observar y comparar las proporciones o
porcentajes que presentaron las categorías.
DISTRIBUCIÓN DE LA VARIABLE RIESGO

DE PADECER ENF. CARDIOVASCULAR
Alumnos de estadística 2008-1 (n=66)
80
76
60
Porcentaje
40
20
17
0 8
Bajo Elevado Muy elevado
Riesgo de padecer enfermedad cardiovascular
b) Gráficas circulares: Por su parte, las gráficas circulares son más difíciles de
trazar manualmente, pues debe dividirse un círculo (100% = 360°) de acuerdo al
porcentaje que cada categoría mostró (K % = X °) y para ello, más que una regla
de tres, se requiere de un compás y un transportador. Pese a todo, las gráficas
circulares permiten comparar de manera mucho más clara los porcentajes de las
categorías.
DISTRIBUCIÓN DE LA VARIABLE RIESGO

DE PADECER ENFERMEDAD CARDIOVASCULAR
Por último es necesario mencionar
Muy elevado que, no importando cuál sea el tipo
de gráfica, siempre debe añadirse al
Elevado
gráfico un título que dé claridad a lo
16.7%
representado y hacer explícito el
tamaño de la muestra (n ) .
75.8%
Bajo 95
Tablas de contingencia
Cuando lo que se desea es descubrir si entre dos variables cualitativas existe asociación
(y, dado el caso, su intensidad) se echa mano de las tablas de contingencia: tablas de
dos entradas donde se colocan los datos cruzados de las variables; es decir,
especificando en las celdas el número de casos que cumplen con ambas categorías:
VARIABLE DEPENDIENTE
Categoría Categoría Categoría Categoría TOTAL
(…)
A B C X
Categoría
1
casos(1A) casos(1B ) casos(1C ) (…) casos(1X ) casos(1)
INDEPENDIENTE
Categoría
casos(2 A) casos(2 B ) casos(2C ) (…) casos(2 X ) casos(2)
VARIABLE
2
Categoría
3
casos(3 A) casos(3B ) casos(3C ) (…) casos(3 X ) casos(3)
(…) (…) (…) (…) (…) (…) (…)
Categoría
n casos(nA) casos(nB ) casos(nC ) (…) casos(nX ) casos(n )
Tamaño
TOTAL casos( A) casos(B ) casos(C ) (…) casos( X ) de la
muestra
Sin embargo, interpretar un fenómeno a partir de los datos de las celdas es un error, pues
el valor que éstas presentan depende directamente de los casos observados en cada
categoría. Por ende, en vista de hacer conclusiones correctas es necesario obtener
porcentajes (según se requiera) a partir de una de las siguientes formas:
• Del total: Para obtener estos porcentaje se divide el valor de la celda entre el
tamaño total de la muestra (celda n ) . No obstante, al igual que los valores reales,
dichos porcentajes no proporcionan mucha información ya que se ven afectados
por el número de casos presente en cada categoría.
• Por columnas: Porcentajes que se obtienen dividiendo el valor de la celda entre el

total de cada columna [celda (n )columna], permitiendo comparar, para cada
categoría de la variable independiente, las categorías de la variable dependiente.
• Por renglones: Porcentajes que se obtienen dividiendo el valor de la celda entre

el total de cada reglón [celda (n )reglón] , lo cual permite, por ende, comparar cada
categoría de la variable dependiente entre las categorías de la independiente.
Aunque pudiera parecer indistinto el uso de porcentajes por columna o por renglón, éste
último resulta más fácil de interpretar y, debido a la estructura de la tabla, permite analizar
de manera más adecuada si alguna característica posee relación con una variable
independiente.
96
Gráficas de análisis bivariado
Hemos visto ya que las tablas de contingencia permiten descubrir la asociación entre dos
variables cualitativas. No obstante, el número de datos y porcentajes obtenidos a partir de
ellas pueden confundir a cualquier lector; veamos entonces qué alternativas gráficas
tenemos para representar sus resultados:
a) Gráficas de barras: Una opción es, de nuevo, el uso de gráficas de barras. No

obstante, el representar dos variables genera un cambio en su construcción: la
variable dependiente se estipula en el eje de las abscisas y, en vez de construir
una barra para cada una de sus categorías, deben construirse tantas barras como
clases tiene la variable independiente.
DISTRIBUCIÓN DE LA VAR. RIESGO DE PADECER
ENFERMEDAD CARDIOVASCULAR POR SEXO
100
80 88
Porcentaje
60 68
40
Sexo
20 Femenino
22
0 8 10 Masculino
b) Gráficas de líneas: Al igual que en la gráfica de barras, la variable dependiente se

ubica en el eje de las abscisas y la frecuencia en el de las ordenadas. Pero en vez
de tener que construir tantas barras, basta con separar las categorías de la
variable independiente, ubicar con un punto los porcentajes que cada una mostró
respecto a las categorías de la variable dependiente y unir estas marcas mediante
una línea. Esto permite no sólo simplificar el copioso número de barras a tantas
líneas como categorías tiene la variable independiente, sino además observar de
manera más clara cualquier tendencia en la asociación.
97
TENDENCIA DE LA VAR. RIESGO DE PADECER

ENFERMEDAD CARDIOVASCULAR POR SEXO
100
80
Porcentaje
60
40
Sexo
20 Femenino
0 Masculino
Heramientas para el análisis de variables cuantitativas
Arreglo ordenado
El primer paso para organizar y analizar las variables cuantitativas es, sin duda alguna,
ordenar los datos de manera creciente, pues la lista resultante nos permitirá encontrar los
valores extremos que la variable analizada mostró.
Intervalos de clase
Sean discretas o continuas, las variables cuantitativas poseen un sinfín de valores

posibles, cuya frecuencia en un conjunto de datos suele ser muy baja. Dado que su
organización en una tabla de frecuencias no permite sacar conclusiones, la estadística ha
encontrado que la mejor forma de analizarlos es agrupar sus valores en clases (también
conocidas como intervalos) a través de los siguientes pasos:
1) Establecer el rango (R ) : El rango es la diferencia entre el valor más pequeño y el

más grande observados en un conjunto de datos, razón por la cual éste puede calcularse
haciendo una simple resta: Rango = Valor mayor – valor menor, que de ahora en
adelante simplificaremos como:
R = Vmax − Vmin
Aunque dicha expresión aplica para la mayoría de los casos, si en la muestra se observan
datos atípicos es mejor excluirlos del cálculo y dejar abiertos los intervalos.
2) Estipular el número de intervalos de clase (ni ) : Se entiende por intervalo de clase

al subconjunto del rango que contiene varios valores; es decir, los grupos en que se
categorizan los valores de la variable. Si bien existen muchas reglas para definir su
número, en este manual se sugiere que no sean más de cinco si los datos son menos de
doscientos (n < 200) .
98
3) Calcular el ancho del intervalo (W ) 1: El ancho del intervalo es la diferencia entre el

límite inferior de un intervalo y el límite inferior del intervalo siguiente; por otro lado, su
valor es el cociente del rango entre el número de intervalos:
W =R .
ni
4) Definir los intervalos: Calculado lo anterior, resta hacer explícitos los intervalos:
4.1) Defínanse primero los límites INTERVALO DE

inferiores de cada intervalo: El primero CLASE (ni ) LÍMITE INFERIOR
es el valor más pequeño observado
entre los datos, el segundo ese valor n1 Vmin
más el ancho del intervalo, el tercero ese n2 (Vmin + W )
valor más dos anchos de intervalo y así
consecutivamente:
n3 (Vmin + 2W )
n4 (Vmin + 3W )
n5 (Vmin + 4W )
4.2) Defínanse después los límites superiores de cada intervalo: El límite superior
de cada intervalo debe ser justo menor al límite inferior del siguiente intervalo con el fin
de evitar que un dato pueda considerarse en dos clases. Una opción para lograr esto
es hacer que el último decimal del límite superior sea una cifra menor al último decimal
del límite inferior del siguiente intervalo. No obstante, la mejor alternativa es utilizar
corchetes y paréntesis: símbolos matemáticos que, en un intervalo, señalan cuando un
valor debe o no tocarse, respectivamente:
INTERVALO DE CLASE (ni ) LÍMITE INFERIOR LÍMITE SUPERIOR

n1 [Vmin (Vmin + W ))
n2 [(Vmin + W ) (Vmin + 2W ))
n3 [(Vmin + 2W ) (Vmin + 3W ))
n4 [(Vmin + 3W ) (Vmin + 4W ))
n5 [(Vmin + 4W ) Vmax ]
Igual que las tablas de frecuencias de las variables cualitativas de tipo ordinal, las tablas
de frecuencias para las variables cuantitativas están conformadas por cinco columnas: la
primera hace referencia al intervalo y las otras cuatro a las frecuencias de éste:
FRECUENCIA FRECUENCIA FRECUENCIA

VARIABLE FRECUENCIA
RELATIVA ACUMULADA RELATIVA
1
Letra asignada por la palabra ancho en inglés (wide).
99
ACUMULADA
Intervalo 1 Casos (n1 ) (n1 n ) [(n1 )] [(n1 ) n]
⎡ (n1 ) + (n 2 ) ⎤
Intervalo 2 Casos (n2 ) (n2 n) [(n1 ) + (n2 )] ⎢ ⎥
⎣ n ⎦
⎡ (n1 ) + (n 2 ) + (n3 ) ⎤
Intervalo 3 Casos (n3 ) (n3 n ) [(n1 ) + (n2 ) + (n3 )] ⎢ ⎥
⎣ n ⎦
(…) (…) (…) (…) (…)
Casos (nn ) (nn n )

Intervalo Tamaño de
muestra (n )
n 1.00
Tamaño de
muestra (n )
TOTAL 1.00
Histogramas
Histograma es el nombre que se da a las gráficas de barras que se utilizan para

representar gráficamente las variables cuantitativas. Aunque programas como el SPPS
generan dichos gráficos considerando en el eje de las ordenadas a las frecuencias
simples, nosotros optaremos por realizar histogramas de frecuencias relativas con el fin
de analizar mejor las variables respecto a la muestra.
De cualquier forma, las barras de este tipo de gráficas son adyacentes ya que, con saltos
en su escala o no, las variables cuantitativas poseen valores con un orden continuo.
DISTRIBUCIÓN DE LA VAR. EDAD EXACTA

SEXO MASCULINO
30
28
Porcentaje
20
20 20
16 16
10
0
18
20
22
24
26
.3
.3
.3
.4
.4
3-
6-
9-
2-
5+
20
22
24
26
.3
.3
.4
.4
8
5
Edad exacta
Polígonos de frecuencia
Los polígonos de frecuencia son gráficas de tipo lineal que también permiten reconocer
la distribución de frecuencia de una variable cuantitativa. Su construcción requiere ubicar
la intersección entre la frecuencia relativa de cada intervalo y las MARCAS DE CLASE;
es decir, los valores situados exactamente a la mitad de cada intervalo. Una vez que se
100
marcan dichas intersecciones, éstas se unen mediante una línea que se extiende hasta
tocar el eje de las abscisas en ambos extremos para delimitar un polígono.
El área de éste es igual al área que ocupan las barras de un histograma, razón por la cual
un polígono de frecuencia se interpreta igual que aquél, pero su ventaja es que, al ocupar
menos espacio, permite comparar diferentes grupos respecto a una variable.
DISTRIBUCIÓN DE HOMBRES
POR EDAD EXACTA
30.00%
25.00%
Porcentaje
20.00%
15.00%
10.00%
5.00%
0.00%
18.33 - 20.36 - 22.39 - 24.42 - 26.45 +
20.35 22.38 24.41 26.44
Edad exacta
Ojivas
Finalmente tenemos a las ojivas, gráficos lineales que muestran de manera más clara la
tendencia de una variable y nos permiten inspeccionar visualmente el porcentaje de casos
menores o mayores a uno de sus valores (no necesariamente presente en los datos).
Debido a esto, las ojivas contemplan en el eje de las ordenadas la frecuencia relativa
acumulada (o porcentaje acumulado) y los límites de los intervalos en el eje de las
abscisas:
a) Ojivas menos de: Son las que permitan ubicar el porcentaje de casos menores a
un valor, por tal motivo, su trazo e interpretación implica la siguiente metodología:
1) Reconocer los límites de los intervalos: De manera más específica. distinguir el

valor del límite inferior de cada intervalo (L inf i ) .
2) Observar las frecuencias de los intervalos: Advertir la frecuencia acumulada y

relativa acumulada antes de cada intervalo (ni ) .
FREC. FREC, FREC. REL.

INTERVALOS FRECUENCIA
RELATIVA ACUMULADA ACUMULADA
n1 = (L inf1 , L sup1 )
n2 = (L inf 2 , L sup 2 )
n3 = (L inf 3 , L sup 3 )
(…)
n n = (L inf n , L sup n ) n 1.0000
TOTAL n 1.0000
101
3) Construir una tabla con los datos para la ojiva: En esta tabla debe señalarse
las frecuencias anteriores, cada una con la etiqueta correspondiente “Menos de
L inf i ”. Nótese que las frecuencias acumuladas van en aumento y que:
FREC. FREC. REL.

VARIABLE • Si el primer intervalo era abierto,
ACUMULADA ACUMULADA
Menos de debe considerarse una categoría
L inf1 + + para las frecuencias acumuladas
hasta su límite inferior (lo cual
Menos de
+ + normalmente deviene en 0 y 0%)
L inf 2 • Si el primer intervalo era cerrado,
Menos de puede iniciarse las categorías
L inf 3 + + registrando las frecuencias
(…) (…) (…) acumuladas hasta el segundo
Menos de intervalo.
L inf n + +
Menos de
> L inf n
n 1.0000
•
Si el último intervalo fue
cerrado, basta registrar las
frecuencias acumuladas hasta el penúltimo intervalo.
• Si el último intervalo era abierto, debe considerarse además una categoría de las
frecuencias acumuladas para el resto de sus valores (que deben corresponder al
tamaño de la muestra y al 100% del total).
4) Trazar la ojiva:
OJIVA MENOS DE EDAD
(n=95,429,611)
Calculado esto se traza una gráfica 120
de dos ejes: en el de las abscisas se 100

indican los límites inferiores de los
Porcentaje acumulado
intervalos y en el de las ordenadas 80
se elabora la escala para la 60
frecuencia relativa acumulada.

40
Hecho esto, se señala con un punto
la frecuencia de cada categoría 20
“Menos de L inf i ” y se les une 0

10 20 30 40 50 60 70 Más
mediante una línea, que siempre es
Edad
creciente:
5) Ubicar el porcentaje menor a un valor: Finalmente, para calcular el porcentaje

de casos menores a un valor se eleva una línea vertical desde la posición de éste
(en el eje de las abscisas) hasta la ojiva, y de ahí se tiende una línea perpendicular
hasta el eje de las ordenadas. Dicha línea horizontal cruzará el eje vertical, de
manera aproximada, a la altura del porcentaje buscado:
102
b) Ojivas más de: Ojivas que hacen posible ubicar el porcentaje de casos mayores a
un valor al indicar en el eje de las abscisas los límites superiores de los intervalos.
Su construcción, por ende, implica seguir una metodología diferente a la que vimos
anteriormente:
1) Reconocer los límites de los intervalos: De manera más específica. distinguir el

valor del límite superior de cada intervalo (L sup i ) .
2) Observar las frecuencias de los intervalos: Observar la frecuencia simple de

cada intervalo (ni ) .
FREC. FREC, FREC. REL.

INTERVALOS FRECUENCIA
RELATIVA ACUMULADA ACUMULADA
n1 = (L inf1 , L sup1 )
n2 = (L inf 2 , L sup 2 )
n3 = (L inf 3 , L sup 3 )
(…)
n n = (L inf n , L sup n ) n 1.0000
TOTAL n 1.0000
3) Construir una tabla con los datos para la ojiva: En esta tabla cada categoría
“Más de L sup i ” implica ir restando la frecuencia simple del intervalo previo.
FREC. FREC. REL.

VARIABLE
ACUMULADA ACUMULADA
Más de
Vmin + +
Más de
L sup1 + +
Más de + +
103
L sup 2 Véase que:

(…) (…) (…)
La primer categoría es “Más que •
Más de
Fn Frel n Vmin ”, ya que el valor más
L sup n
pequeño que se haya observado
deja a todos los casos (100.00%) por encima de él. Su frecuencia acumulada es,
por ende, igual al tamaño de la muestra (n ) .
• Para obtener las frecuencias de los siguientes renglones basta ir restando, a la

frecuencia acumulada de la categoría anterior, la frecuencia simple del intervalo
cuyo límite superior se usó. Por ejemplo, para obtener la frecuencia acumulada de la
categoría “Más de L sup1 ” restamos al tamaño de la muestra la frecuencia simple
del intervalo 1 (n1 ) . Para calcular la frecuencia acumulada de la categoría “Más de
L sup 2 ” restamos a la frecuencia acumulada de “Más de L sup1 ” la frecuencia
simple del intervalo 2 (n2 ) . Y así consecutivamente, hasta que la frecuencia
acumulada y frecuencia acumulada relativa de la última categoría coinciden con la
frecuencia simple y la frecuencia relativa del último intervalo ( Fn y Frel n ).
• En cuanto a las frecuencias relativas acumuladas no hay problema alguno, pues
como siempre se calculan dividiendo el valor de la frecuencia acumulada entre el
total de observaciones.
OJIVA MÁS DE EDAD

(n=95,429,611)
4) Trazar la ojiva:
120%
Porcentaje acumulado
Este paso es igual al de las 100%

80%
“ojivas menos de” con excepción de
60%
que en el eje de las abscisas se 40%
indican los límites superiores de 20% los
intervalos y que línea resultante 0%
(por su intersección con la Más de Más de Más de Más de Más de Más de Más de Más de
0 9 19 29 39 49 59 69
frecuencia acumulada) es Edad
siempre decreciente:
5) Ubicar el porcentaje mayor a un valor:
Para encontrar dicho

porcentaje debe también
elevarse una línea
vertical a partir del valor y
trazarse la perpendicular
hasta el eje de las
ordenadas.
104
1. En 2001 el Instituto Nacional de Estadística, Geografía e Informática (INEGI) y

diversos investigadores de las Universidades de Pennsylvania, Maryland, y Wisconsin de
los Estados Unidos de Norteamérica aplicaron la primera encuesta del Estudio Nacional
sobre Salud y Envejecimiento en México (ENASEM-2001), investigación con que se
busca crear una base inicial de datos de la que se pueda obtener información sobre
características diversas de la población de 50 años y más residente en México, cuyos
resultados sean representativos a nivel nacional2.
Entre las características a investigar se hallaba el sexo y alfabetismo del individuo;
variables que entre la muestra de indígenas (n = 796) tuvieron los siguientes resultados:
VARIABLE
Masculino 405
SEXO
Femenino 391
Alfabeta 487
ALFABETISMO
No alfabeta3 309
a.1 y a.2) Construir una tabla de frecuencia y gráfica circular para cada variable.
b) Si 289 de los hombres eran alfabetos y de las mujeres 198 también, comprobar si
existe una asociación entre ambas variables mediante una tabla de contingencia y una
gráfica de barras.
Para resolver el primer inciso ordenamos los datos de cada variable y obtenemos
entonces sus frecuencias relativas y los porcentajes que éstas implican.
FRECUENCIA
SEXO FRECUENCIA PORCENTAJE
RELATIVA
Masculino 405 405 796 = 0.5088 50.88
Femenino 391 391 796 = 0.4912 49.12
TOTAL 796 1.0000 100.00
FRECUENCIA
ALFABETISMO FRECUENCIA PORCENTAJE
RELATIVA
Alfabeta 487 487 796 = 0.6118 61.18
No alfabeta 309 309 796 = 0.3882 38.82
TOTAL 796 1.0000 100.00
a.1) , De acuerdo a las frecuencias obtenidas podemos afirmar que, en la muestra de

indígenas de 50 años o más, se encuestaron y entrevistaron a más mujeres que a
hombres. Por otro lado, el porcentaje de personas que sabían leer y escribir un recado
(alfabetos) era 1.6 veces mayor [(61.18 38.82) = 1.6] .
2
s/a, 2004. Estudio Nacional de Salud y Envejecimiento en México (ENASEM) 2001. Documento
metodológico y reporte de proyecto. Formato electrónico:
http://www.mhas.pop.upenn.edu/english/documents/Methodological/Doc_metodologico-v2.pdf
3
Según la afirmación de que no sabían leer ni escribir un recado.
105
Ahora bien, generamos las gráficas circulares para dichas variables:
FUENTE:
Estudio Nacional sobre Salud y Envejecimiento en México (ENASEM), 2001
DISTRIBUCIÓN POR SEXO DISTRIBUCIÓN DEL ALFABETISMO
Indígenas de 50 años o más (n=796) Indígenas de 50 años o más (n=796)
No alfabeta
Femenino Masculino 38.8%
49.1% 50.9% Alfabeta
61.2%
a.2) , Si bien el porcentaje femenino era mayor, más que las frecuencias, la gráfica nos
permite ver que no hubo una gran diferencia en la cantidad de mujeres y hombres
encuestados. Por el contrario, aunque aquí la diferencia en el alfabetismo no es tan fuerte
como en la comparación numérica, la gráfica comprueba un mayor porcentaje de alfabetas.
Ahora, para analizar si existe una asociación entre las variables, construimos la tabla de
contingencia:
ALFABETISMO
TOTAL
Alfabeta No alfabeta
Masculino 289 405
SEXO
Femenino 198 391
TOTAL 487 309 796
Como no se hicieron explícitas las frecuencias de los casos que no sabían leer ni escribir
un recado, basta realizar un par de restas al número total de casos de cada sexo para
obtenerlos: 405 − 289 = 116 y 391 − 198 = 193 ; valores que suman el total de casos no
alfabetas: 116 + 193 = 309
Una vez calculado esto, terminemos de elaborar la tabla y saquemos los porcentajes por
renglón:
ALFABETISMO ALFABETISMO
TOTAL
289 116 405
Masculino
71.36% 28.64% 100%
SEXO
198 193 391
Femenino
50.64% 49.36% 100%
487 309 796
TOTAL TOTAL
61.18% 38.82% 100%
106
, El porcentaje de alfabetismo es mayor en el sexo masculino, mientras que el porcentaje

de analfabetismo es mayor en el femenino. Tal distribución puede deberse a una cuestión
genérica; es decir, cultural, pues al menos en décadas atrás se daba prioridad a que los
hombres fueran a la escuela para prepararse, mientras que las mujeres se quedaban en
casa a fin de ayudar con las labores domésticas.
Finalmente realicemos la gráfica de barras correspondiente:
DISTRIBUCIÓN DEL ALFABETISMO

POR SEXO
Indígenas de 50 años o más (n=796)
80
71
FUENTE:
60 Estudio Nacional sobre
Salud y Envejecimiento
Porcentaje
51 49
40 en México (ENASEM),
Sexo 2001.
29
20
Masculino
0 Femenino
Alfabetismo
, Las barras muestran las diferencias entre el alfabetismo femenino y masculino.

Incluso cuando la causa sea diferente a la planteada anteriormente, este gráfico
confirma también una asociación entre las variables.
2. Otra de las cuestiones a estudiar en el ENASEM-2001 fue la salud del individuo y

su autopercepción de ésta; por tanto, una de las variables consideradas fue si el
encuestado tenía o no dificultades para caminar de un lado a otro de su cuarto. He aquí
los resultados de hombres y mujeres por grupo quinquenal:
HOMBRES MUJERES
GRUPO Con Sin Con Sin
QUINQUENAL dificultad dificultad dificultad dificultad
50-54 17 1598 44 1927
55-59 26 1459 46 1686
60-64 33 1116 49 1326
65-69 46 998 46 981
70-74 72 638 60 641
75-79 54 476 61 441
80+ 129 370 202 422
a) Determinar mediante una gráfica de líneas si existe alguna asociación entre estas
variables.
107
Como el interés reside en averiguar si existe asociación entre la edad y la dificultad para
caminar (presencia de una característica), sólo graficaremos los porcentajes
correspondientes a ésta separando los datos por sexo.
DIFICULTAD PARA CAMINAR POR

GPO. QUINQUENAL Y SEXO
Indígenas de 50 años o más (n=796)
50
FUENTE:
40
Estudio Nacional sobre
Salud y Envejecimiento
Porcentaje
30
en México (ENASEM),
20
Sexo 2001.
10 Masculino
0 Femenino
50-54 55-59 60-64 65-69 70-74 75-79 80+
Grupo quinquenal
a) , La gráfica de líneas nos muestra que efectivamente existe una asociación

directa entre el grupo quinquenal y los problemas para caminar; pues a mayor edad
los sujetos aseguraron tener más dificultad en hacerlo. En cuanto a la comparación
por sexo, más mujeres afirmaron padecer este problema a edades menores y
mayores que los hombres.
3. De acuerdo a los Programas Integrados de Salud (PREVENIMSS) del Instituto

Mexicano del Seguro Social (IMSS), hay dos tipos de distribución de grasa en el
organismo que se asocian a la aparición de enfermedades:
1. Ginecoide (en forma de pera): Acumulación de grasa en muslos y cadera que

deriva usualmente en várices y dolor de rodillas.
2. Androide (en forma de manzana): Distribución de grasa al nivel de la cintura que
predispone al desarrollo de diabetes, cáncer de colon, mama o endometrio;
elevación del colesterol y triglicéridos (grasas en sangre), infartos, embolias y
muerte prematura por enfermedad cardiovascular4.
Ante dicha circunstancia, el IMSS sugiere que las personas estén al pendiente de sus
medidas; especialmente de la circunferencia de su cintura, y la interpreten de acuerdo a la
siguiente tabla a fin de tomar acciones preventivas en caso necesario:
CIRCUNFERENCIA DE CINTURA (cm.)

INTERPRETACIÓN
MUJERES HOMBRES
Menor de 80.0 Menor de 94.0 Normal – Sin riesgo
4
IMSS, 2005. “Prevención, detección y control de sobrepeso y obesidad” en Guía de la salud de la mujer,
36-42 p.p. Documento electrónico: http://www.imss.gob.mx/NR/rdonlyres/E36D4BB0-C252-4B7C-A44E-
6DE664C76609/0/GCSmuj3150.pdf
108
De 80.0 a 87.9 De 94.0 a 101.9 Riesgo elevado para la salud

Igual o mayor a Igual o mayor a
Riesgo muy elevado para la salud
88.0 102.0
Basándose en esta información:

a) Construir una tabla de frecuencias, histograma y ojiva con los datos de Perímetro de la
cintura recolectados entre los estudiantes de estadística (por sexo) para reconocer la
distribución de esta variable y analizar si existen casos con riesgo.
Para empezar, ordenemos los datos y definamos los cinco intervalos sin considerar
ningún caso como atípico:
MUJERES - PERÍMETRO DE CINTURA

556 606 649 655 686 712 738 754 786 850 946
599 640 653 659 691 719 745 765 820 859
599 643 654 660 703 735 750 770 831 881
605 645 655 664 703 736 750 784 837 906
R = 946 − 556 = 390.00 W = 390 = 78

5
HOMBRES - PERÍMETRO DE CINTURA

697 702 719 729 737 750 782 809 842 859 918 950 1080
700 712 720 730 746 772 795 809 858 861 932 990
R = 1080 − 697 = 383.00 W = 383 = 76.60

5
, Si bien pareciera existir un rango mayor en las medidas del perímetro de cintura
femenino, esto se debe a las unidades. Si convertimos dichos valores a la escala más
común (centímetros) el rango del perímetro de cintura masculino fue sólo 0.7 centímetros
menor que el femenino.
Especifiquemos ahora los intervalos para hacer las tablas de frecuencia y los histogramas
correspondientes:
PER. CINTURA FREC. FREC. FREC.REL.

FRECUENCIA
MUJERES RELATIVA ACUMULADA ACUMULADA
556-633 5 0.1220 5 0.1220
634-711 15 0.3659 20 0.4878
712-789 13 0.3171 33 0.8049
790-867 5 0.1220 38 0.9268
868-946 3 0.0732 41 1.00
TOTAL 41 1.00
109
, Gracias a las tablas de frecuencia y el

DISTRIBUCIÓN DE LA VAR. PERÍMETRO histograma podemos ubicar que, para el
sexo femenino, el mayor número de
DE CINTURA, SEXO FEMENINO alumnas se encontraba en los intervalos 2 y
Alumnas de estadística 2008-1 (n=41) 3 (634-711 y 712-789), medidas que de
40 acuerdo a la tabla del IMSS no corren
37
riesgo; de hecho, el 80.49% de las mujeres
30 32 tenía una perímetro de cintura menos a 79.0
centímetros. No obstante, se registró un
Porcentaje
20 12.20% de las alumnas con circunferencia

de 79 a 86.7 centímetros y un 7.32% con
10 12 12 perímetro entre 86.8 y 94.6 centímetros. Ya
7 veremos en las ojivas si los casos de estos
0
556-633 634-711 712-789 790-867 868-946
intervalos caen en las categorías de riesgo.
Perímetro de cintura
PER. CINTURA FREC. FREC. FREC.REL.

FRECUENCIA
HOMBRES RELATIVA ACUMULADA ACUMULADA
697-773.5 12 0.4800 12 0.4800
773.6-850.1 5 0.2000 17 0.6800
850.2-926.7 4 0.1600 21 0.8400
926.8-1003.3 3 0.1200 24 0.9600
1003.4-1080 1 0.0400 25 1.00
TOTAL 25 1.00
DISTRIBUCIÓN DE LA VAR. PERÍMETRO , En cuanto al sexo masculino, el mayor

porcentaje (48.00%) se registró en el
DE CINTURA, SEXO MASCULINO
intervalo más pequeño (697-773.5) y
Alumnos de estadística 2008-1 (n=25) más de la mitad de los hombres
60 (68.00%) tuvo un perímetro de cintura
50 menor a los 85 centímetros. Pese a esto,
40
48
un 12.00% entró en el intervalo 926.8-
Porcentaje
1003.3 y un 4.00% en el intervalo más

30
grande (10003.4-1080), así que antes de
20
20
consultar directamente los datos
10
16
12
usaremos la ojiva para ver si sus valores
0
caen o no en las categorías de riesgo.
697-773.5 773.6-850.1 850.2-926.7 926.8-1003.3 1003.4-1080
Construyamos entonces las tablas

necesarias para trazar las ojivas. Nótese
que, como los intervalos fueron cerrados, podemos utilizar el límite superior de los últimas
clase con el objetivo de delimitar cuando el porcentaje llega a cero:
PER. DE CINTURA - MUJERES

FREC.
FREC.
EDAD REL.
ACUM.
ACUM.
Más de 556 41 100.00%
110
Más de 633 36 87.80% , Esta tabla señala que un 7.32% de los casos
Más de 711 21 51.22% poseía un perímetro de cintura mayor a 867
Más de 789 8 19.51% milímetros; medida que, al superar los 80.0
Más de 867 3 7.32% centímetros, indica que tales alumnas corrían algún
Más de 946 0 0.00% tipo de riesgo (todavía indiferenciado).
Ahora bien, la ojiva sugiere que menos de un 20% (línea azul claro) tenía una
circunferencia mayor a 80.0 centímetros y que el perímetro de aproximadamente un 10%
era mayor a 88 centímetros .
Si corroboramos dicha afirmación con los

datos tenemos que 8 casos (19.51%)
cumplían con la primer afirmación y 3
observaciones (7.32%) con la segunda.
PERÍMETRO DE CINTURA - ,
HOMBRES Para
FREC. ir
FREC. por
EDAD REL.
ACUM.
ACUM.
Más de 697 25 100.00%
Más de 773.5 13 52.00%
orden de riesgo primero observemos el Más de 850.1 8 32.00%
gráfico: la ojiva señala que Más de 926.7 4 16.00%
aproximadamente un 15.0% de los Más de 1003.3 1 4.00%
hombres corría un riesgo elevado ya Más de 1080 0 0.00% que
tenía una circunferencia mayor a 94
centímetros; estimación no muy alejada al porcentaje real: 12.0% (3 casos). Por otro lado,
si bien la tabla manifiesta que el caso del último intervalo tenían un perímetro mayor a
1003.3, la ojiva confirma que su valor (1080) caía en la zona de riesgo elevado.
111
De acuerdo al IMSS, a los siete casos con riesgo elevado (cinco mujeres y 2 hombres) se
les debió sugerir disminuir los alimentos ricos en grasa, colesterol y azúcares refinados,
además de realizar ejercicio aeróbico por lo menos sesenta minutos. En tanto que los
cuatro casos con riesgo muy elevado (tres mujeres y un hombre) debían urgentemente
disminuir su peso corporal, cambiar los malos hábitos de alimentación y realizar también
sesenta minutos de ejercicio aeróbico como mínimo.
Medidas para la estadística descriptiva
Como anteriormente mencionamos, más allá del análisis de frecuencias, otra forma de
resumir los datos y analizar la distribución de una variable son las medidas descriptivas:
números individuales que contienen información importante sobre las observaciones
originales.
Antes de revisar algunas de ellas debemos mencionar que, si éstas se obtienen a partir
de datos poblacionales, las medidas descriptivas reciben la denominación de
parámetros; empero, si son producto de un conjunto de datos muestrales, su expresión
cambia y son llamadas estadísticos, números cuyo valor se intenta sea lo más parecido
al de su parámetro correspondiente.
Medidas de tendencia central
Las medidas de tendencia central son aquellas que intentan resumir el conjunto de
datos señalando su valor representativo, por ejemplo:
(
Moda Xˆ , xˆ )
La moda es el valor que se presenta con mayor frecuencia en una serie de
observaciones. Esta medida es, por tanto, ideal para encontrar la categoría
representativa en una serie de datos cualitativos. No obstante, es poco confiable
cuando se manejan variables cuantitativas ya que, si todos los valores son diferentes o si
son varios los valores que se repiten (con la misma frecuencia) ha de concluirse que los
datos no tienen moda o que el conjunto es multimodal.
De cualquier forma ha de señalarse que, para denotar su valor, basta añadir un acento
circunflejo (^) a la letra con que se designó la variable:
PARÁMETRO ESTADÍSTICO
X̂ x̂
Mediana ( X , ~
x)
~
La mediana es el valor intermedio de un conjunto de datos cuantitativos ordenados de

forma creciente o decreciente. Si el total de datos es un número non, la mediana es el
valor que se encuentra justo a la mitad de la lista, en tanto que si el total de datos es un
número par, la mediana es el promedio de los datos centrales:
NON PAR
x (1) x (1)
112
x(2 ) x(2 )
x (3 ) Mediana x (3 )
Mediana
x(4 ) x(4 )
x (5 ) x (5 )
x (6 )
Ahora bien, si el número de observaciones impide reconocer visualmente la mediana, su

valor puede encontrarse de la siguiente manera:
a) Si el total de observaciones es un número impar, el valor de la mediana es igual

⎛n ⎞
al del dato cuya posición es ⎜ + 0.5 ⎟ .
⎝2 ⎠
b) Si el total de observaciones es un número par, el valor de la mediana es el
⎛n⎞ ⎛n ⎞
promedio de los datos que están en las posiciones ⎜ ⎟ y ⎜ + 1⎟ .
⎝2⎠ ⎝2 ⎠
Explicado eso puede afirmarse que la mediana (señalada con una tilde ~) es una medida
de tendencia central muy fácil de calcular cuyo valor, al ser único, resulta sumamente útil
para indicar (por posición) el promedio de un conjunto de datos cuando éstos presentan
cierta simetría o incluyen valores extremos.
X~ ~
x
Media (aritmética) (µ , x )
La media es, sin duda alguna, la medida de tendencia central más utilizada en la
estadística descriptiva de variables cuantitativas. Si bien su parámetro se representa
con la letra griega µ (Mi), su estadístico se señala agregando una barra horizontal sobre
la letra de la variable:
N n
∑ xi ∑x i
µ= i =1
x= i =1
N n
Como puede verse, la media es simplemente el producto de sumar todos los valores
observados y dividir el resultado entre el número total de datos5. Es decir, a diferencia de
la mediana, la media es un promedio que toma en cuenta todas las observaciones; sin
5
A diferencia de la moda y la mediana, la media es la única medida de tendencia central que, por su cálculo
aritmético, puede obtenerse con ayuda de la calculadora. Sólo es necesario ingresar los datos en el modo
estadístico y acceder a la función x .
113
embargo, dicha característica implica que su cálculo pueda verse afectado por valores
extremos al grado de provocar que su valor no sea verdaderamente representativo.
Medidas de dispersión
Aún cuando las medidas anteriores nos permiten encontrar los valores centrales de un
conjunto de datos, poco dicen sobre el resto de las observaciones: si son parecidas o
difieren por mucho. Precisamente para reconocer dicha variabilidad en la distribución de
una variable es que la estadística ha propuesto las medidas de dispersión6, entre ellas:
Rango (R )
Como vimos en el capítulo anterior, el rango es la diferencia entre el valor más pequeño y
el más grande en un conjunto de datos:
R = Vmax − Vmin
La sencillez del cálculo de esta medida de dispersión (que echa mano de sólo dos
observaciones) es, sin embargo, contrarrestada por su deficiencia en la explicación de la
variabilidad, que se limita a la diferencia más general.
Debido a esto es que, para comprender la cantidad total de variabilidad y resumirla en un
solo número es preciso sacar el promedio de la desviación de los datos con respecto a su
media:
n
∑ (X i − x)
Dispersión = i =1
Esta fórmula, empero, no funciona porque, como veremos a continuación, la suma de las
desviaciones de los datos respecto a la media es siempre igual a cero:
n n n
∑ (X
i =1
i − x) = ∑ Xi − ∑ x
i =1 i =1
n n n
Porque ∑ ( X i + Yi ) = ∑ X i + ∑ Yi
i =1 i =1 i =1
n n
∑ (X
i =1
i − x ) = ∑ X i − xn
i =1
n
Porque ∑ C = cn
i =1
∑ (X
i =1
i − x ) = xn − xn
6
Tales medidas sólo deben aplicarse cuando los datos son distintos, pues si el valor de todas las
observaciones fuera idéntico no habría variabilidad.
114
∑X i n
⇒ ∑ X i = xn
Porque
x= i =1
n i =1
n
Entonces ∑ (X
i =1
i − x) = 0
Por lo 0
Dispersión = =0
que n
A fin de salvar este problema, el resto de las medidas de dispersión ocupa entonces una
serie de estrategias para transformar las desviaciones de los datos en distancias, cuyo
valor es siempre positivo o igual a cero.
Desviación media (DM , dm)
La desviación media, por ejemplo, es la medida de dispersión que obtiene el promedio

de las desviaciones de los datos en valor absoluto:
N n
∑ Xi − µ ∑X i −x
DM = i =1
dm = i =1
N n
[
No obstante, como el valor absoluto es una función f ( x ) = x que no tiene propiedades ]
algebraicas para realizar desarrollos matemáticos inferenciales, la desviación media es
una medida de dispersión que no se utiliza en la práctica.
(
Varianza σ 2 , s 2 )
La varianza es la medida de dispersión que, para evitar los signos de las desviaciones,
saca el promedio7 de las diferencias de los datos respecto a su media elevadas al
cuadrado:
7
El promedio se obtiene dividiendo entre n − 1 de acuerdo a los principios teóricos de los grados de libertad:
Basa conocer los valores de n − 1 de las desviaciones, pues el n − ésimo valor queda automáticamente
determinado por la restricción de que todos los valores de n suman siempre cero.
115
N n
∑ (X − µ) ∑ (X − x)
2 2
i i
σ2 = i =1
s2 = i =1
N n −1
Desgraciadamente, elevar al cuadrado las desviaciones conlleva a elevar al cuadrado sus

unidades.
Desviación estándar (típica) (σ , s )
La desviación estándar es simplemente la raíz cuadrada de la varianza:
N n
∑ (X i − µ ) ∑ (X − x)
2 2
i
σ= i =1
s= i =1
N n −1
A sabiendas de que ésta es la medida de dispersión más utilizada y que el cálculo de

cada desviación es laborioso, ofrecemos aquí una expresión alternativa para la obtención
de su estadístico:
n
• ∑ (X − x) :
2
Primero desarrollemos el binomio i
i =1
n n n n
∑ (X − x ) = ∑ X i2 − ∑ 2X i x + ∑ x 2
2
i
i =1 i =1 i =1 i =1
• Y atendamos las constantes:

n n n
∑ (X
i =1
i − x ) = ∑ X i2 − 2 x ∑ X i + x 2 n
2
i =1 i =1
n n n
Porque ∑ CX i = C ∑ X i
i =1 i =1
∑ C = cn
i =1
• Ahora sustituyamos algunos términos por sus equivalentes:

n n
∑ (X − x ) = ∑ X i2 − 2 x ( x n ) + x n
2
i
i =1 i =1
n
∑X i n
⇒ ∑ X i = xn
Porque
x= i =1
n i =1
• Y resolvamos las expresiones interiores:

n n
∑ (X − x ) = ∑ X i2 − 2 x 2 n + x n
2
i
i =1 i =1
116
n n
∑ (X − x ) = ∑ X i2 − x 2 n
2
i
i =1 i =1
Basado en esto tenemos que una forma más sencilla de calcular manualmente8 la
desviación estándar es a través de la siguiente expresión:
ESTADÍSTICO
n
∑X i
2
− nx 2
s= i =1
n −1
Finalmente, sin importar el método utilizado para su cálculo, debemos remarcar que el
obtener la raíz cuadrada de la varianza implica regresar a las unidades originales. La
desviación estándar, por tanto, puede interpretarse literalmente como el promedio de la
desviaciones de los datos respecto a la media: el que su valor sea muy pequeño indica
que las observaciones están muy cerca de esta medida de tendencia central; en tanto que
un valor grande señala que los datos se hallan muy dispersos y que la media pudiera no
ser un valor realmente representativo del conjunto.
Medidas de posición
Otra forma de analizar la distribución de una variable son las medidas de posición:
números que sirven para descubrir la localización de un dato específico con respecto el
resto de la muestra.
Percentiles (centiles)
Son números que dividen al

conjunto de datos en cien partes
iguales, motivo por el cual
existen noventa y nueve
percentiles que se designan
mediante la letra Pk , donde el
subíndice k indica el centil al
que se hace referencia.
En cualquier caso, el k − ésimo

percentil (Pk ) es un valor de X
tal que k % o menos de las
8
Igual que la media, el valor de la desviación estándar de un conjunto de observaciones puede obtenerse
mediante las funciones σ n −1 ó s x de la calculadora una vez que se han ingresado los datos en el modo
estadístico.
117
observaciones son menores que él y (100 − k )% o menos de las observaciones son

mayores a k ; razón por la que los percentiles permiten descubrir si hay casos extremos
en un conjunto de datos.
Dicho esto, si el número total de datos (n ) es el 100%, la forma más sencilla de encontrar
el número k que deja, a los más, al k % por debajo de él y al (100 − k )% por encima de
él es:
nk
=X
100
El valor descubierto, empero, sólo representa la posición que ocupa el percentil en el

conjunto de datos ordenados. Por ende, el percentil es en realidad el valor del dato que se
encuentra en la posición X 9.
Cuartiles
Los cuartiles son tres números que dividen a los datos ordenados en cuatro partes
iguales. Sus valores, por tanto, pueden hacerse equivalentes a los de cuatro percentiles:
PERCENTIL CUARTIL DEFINICIÓN

Primer cuartil Número respecto al que 25% de los datos son
P25
(q1 ) menores que él.
Número que divide al conjunto de datos
Segundo cuartil exactamente en dos partes, dejando una mitad
P50
(q2 = ~x ) con valores menores y otra mitad con valores
mayores. Su valor, por tanto, es igual al de la
mediana de un conjunto de datos.
Tercer cuartil Número que deja al 75% de los datos con un valor
P75
(q3 ) menor al suyo.
Como su ubicación es mucho más precisa, los cuartiles no sirven para analizar casos
extremos; no obstante, se utilizan para designar ciertas posiciones cuando se elabora una
gráfica de caja.
Gráficas de caja
Las gráficas de caja (también conocidas como diagramas de caja y bigotes) son
gráficos que muestran la distribución de una variable. Veamos los pasos necesarios para
construirlas:
9
Si el valor de X tiene decimales debe redondearse al número entero que le sigue.
118
1) ORDENAR LOS DATOS Y UBICAR VALORES CLAVE: Los primero que debe
hacerse es ordenar los datos para reconocer los valores mínimo, máximo y de los tres
( )
cuartiles: Vmin, q1 , q 2 , q 3 , Vmax .
2) CONSTRUIR EL ESPACIO GRÁFICO: Es decir, trazar dos ejes: en el de las

ordenadas se señala la variable y su escala, y en el de las abscisas se indica el grupo de
estudio .
3) TRAZAR LA CAJA: Hecho eso se traza un rectángulo (caja): si bien su ancho no

importa, su altura debe corresponder a la distancia del primer al tercer cuartil (q1 − q3 ) .
4) UBICAR LA MEDIANA: Posteriormente se divide al rectángulo mediante una línea a la

altura del segundo cuartil (q 2 ) .
5) TRAZAR LOS BIGOTES: Finalmente se ubican los valores mínimo y máximo, y a partir
de ellos se traza una línea hasta los extremos inferior y superior de la caja.
Gracias a su forma, las gráficas

DISTRIBUCIÓN DE LA VARIABLE
de caja permiten hacer una
exploración visual del PERÍMETRO DE CADERA
comportamiento de la variable:
Mientras mayor sea la altura de Alumnos de estadística 2008-1 (n=66)
1300
la caja, mayor dispersión habrá
mostrado la variable. Ahora
Perímetro de cadera
1200 52
32
bien, una mayor distancia de la 1100
mediana a uno de los cuartiles
(q1 , q3 ) implica, por ejemplo,
1000
900
una mayor variabilidad en esa 800
mitad del grupo de estudio. 700
Asimismo, una mayor distancia N= 41 25
de la caja a los valores mínimo Femenino Masculino
o máximo señala a éstos como Sexo

datos atípicos.
Por último debe mencionarse que este tipo de gráficas permite también comparar la
distribución de la variable entre las categorías del grupo de estudio. Si es este el caso,
basta con separar los datos de cada categoría, ubicar sus valores y trazar una caja para
cada grupo.
119
PERÍMETRO DE CADERA
1300
1200
1100
1000
Turno
900
800 Matutino
700 Vespertino
N= 26 15 13 12
Femenino Masculino
Sexo
1. Son muchos ya los alumnos de la ENAH que han expresado lo incómodo de las
sillas de esta escuela. Si bien resulta imprescindible un cambio en este mobiliario, el costo
que dicho proyecto pudiera alcanzar es inquietante.
Echando mano de los datos de Estatura total, Estatura sentado, Altura de rodilla y Peso
recolectados en los grupos de estadística:
a) Calcule las medidas de tendencia central: moda, mediana y media.

b) Calcule las medidas de dispersión: rango y desviación estándar.
c) Calcule los cuartiles y elabore una gráfica de caja.
A fin de analizar el comportamiento de estas variables y presentar a un diseñador

industrial algunos datos con los que éste pueda hacer una cotización sobre los materiales
y diseños necesarios para producir sillas más funcionales y cómodas.
Veamos primero los datos, ya ordenados, donde se señalan algunos de los valores que
se mencionaran posteriormente:
Estatura total Estatura sentado Altura de rodilla Peso

1477 1599 787 855 411 477 37.6 61.1
1490 1605 802 859 414 478 41.9 61.3
1492 1614 809 865 426 478 44.4 61.4
1506 1619 809 866 436 479 44.4 61.6
1515 1622 813 868 442 481 44.9 61.6
1521 1625 815 870 443 481 45.1 61.7
1527 1641 816 872 443 481 45.2 62.6
1529 1642 820 875 444 482 45.8 62.6
1541 1657 821 878 446 484 47.2 62.7
1552 1658 823 879 448 484 47.5 64.4
1554 1660 825 879 453 484 48.0 64.5
1555 1664 826 887 454 486 48.3 65.6
1559 1669 826 887 457 486 49.2 67.2
1560 1675 827 888 457 486 49.8 67.4
1562 1675 828 889 458 487 51.1 68.3
1563 1679 829 889 458 489 51.5 68.4
120
1563 1683 829 890 458 491 52.1 68.7

1566 1685 832 891 459 491 53.1 68.8
1570 1686 834 894 459 491 53.1 69.6
1571 1689 834 897 459 496 54.4 70.0
1571 1699 838 901 461 502 55.4 70.2

1576 1701 838 902 464 504 55.8 71.5
1576 1705 839 908 464 504 55.9 72.5
1577 1719 839 911 464 506 56.4 74.5
1582 1721 841 914 464 516 57.5 76.6

1583 1724 844 919 465 519 57.5 76.7
1584 1728 848 921 465 519 58.0 77.6

1585 1742 849 921 467 522 58.1 78.8
1591 1751 849 928 469 525 58.4 87.3
1594 1767 850 939 469 536 58.4 91.6
1594 1786 850 940 471 554 58.6 93.1
1595 1833 850 941 471 588 59.5 94.7
1597 1852 854 969 475 590 60.4 98.0
Ahora bien, ejemplifiquemos la aplicación de todas las medidas y las gráficas de caja con
la variable Estatura total:
I. Estatura total
Lo primero que observamos en esta variable es que cinco valores se repiten dos veces a
lo largo de la muestra:
MODA xˆ = 1563, 1571, 1576, 1584 y 1675
, Por tal motivo puede afirmarse que entre los alumnos de estadística la variable Estatura
es multimodal.
Sin embargo, como la moda ha señalado demasiados valores, buscaremos la mediana del
conjunto para ver si su valor es más representativo. Dado que el número total de datos es
par (n = 66) , debemos averiguar el promedio de los datos que están al centro de la lista.
POSICIÓN
(n = 66) ⎛ 66 ⎞
⎜ ⎟ = 33
⎛ 66 ⎞
⎜ + 1⎟ = 34
⎝ 2 ⎠ ⎝ 2 ⎠
VALOR 1597 1599
MEDIANA 1597 + 1599
x=
~ = 1598.0000
(PROMEDIO) 2
, Es decir, de acuerdo a esta medida de tendencia central el valor promedio de la

estatura total en los grupos de estadística 1598 milímetros (1.60 metros). Mientras tanto:
MEDIA 107153
1623 5303
121
∑x i
x= i =1
n
, El cálculo aritmético indica que el promedio de la estatura entre los alumnos es de
1623.5303 milímetros (1.62 metros); así que habrá que analizar si la diferencia de dos
centímetros se debe a la variabilidad.
Primero encontremos la diferencia general:
RANGO
R = Vmax − Vmin R = 1852 − 1477 = 375.0000
, El cálculo del rango señala que, entre la menor y la mayor estatura hay 375 milímetros
(37.5 centímetros). No obstante, la cantidad total de variabilidad manifestada por la
variable es de:
DESVIACIÓN ESTÁNDAR
174411215 − 66(1623.5303)
n 2
∑X i
2
− nx 2 s= = 82.7483
s= i =1 66 − 1
n −1
, Esto significa que la distancia promedio de los datos de estatura total respecto a su
media es de 82.7483 milímetros (8.2 centímetros).
Finalmente, para analizar gráficamente la distribución de la variable obtenemos el valor de

los cuartiles y construimos la gráfica de caja:
(n = 66) POSICIÓN VALOR

MÍNIMO 1 1477
66(25)
Primer cuartil (q1 ) = 16.5 ⇒ 17 1563
100
Segundo cuartil (q 2 ) ~
x 1598
66(75)
Tercer cuartil (q3 ) = 49.5 ⇒ 50 1683
100
MÁXIMO 66 1852
ESTATURA TOTAL
, Como podemos observar, la mayor
Alumnos de estadística 2008-1 (n=66) variabilidad de la estatura se
1900 manifiesta en la mitad de los alumnos
más altos. Asimismo se observa que el
1800
estudiante con la estatura más alta se
encuentra más alejado del valor
Estatura total
1700
promedio (mediana) que el de menor
1600
estatura.
1500
122
1400
Alumnos
Para analizar más detalladamente dicho comportamiento, elaboremos otra gráfica de

cajas comparando por sexo:
, El gráfico señala ahora que la
ESTATURA TOTAL POR SEXO estatura de las mujeres es, en
general, menor a la de los hombres.
1900
Dicha afirmación no sólo es
37
39
confirmada al observar una mayor
1800 variabilidad en estaturas mayores
Estatura total
1700
para el sexo femenino, sino también
15
54
44 al descubrir que fue una mujer quien
1600 presentó una estatura atípicamente
1500
baja.
6
1400
N= 41 25
Femenino Masculino
Sexo
Habiendo reconocido la posición de
muchos valores y, echando mano de la tecnología (calculadora o computadora), resulta
sencillo analizar el comportamiento del resto de las variables:
II. Estatura sentado
MODA xˆ = 850
, La estatura sentado observada con mayor frecuencia entre los alumnos de
estadística fue de 850 milímetros (85.0 centímetros).
POSICIÓN
(n = 66) ⎛ 66 ⎞
⎜ ⎟ = 33
⎛ 66 ⎞
⎜ + 1⎟ = 34
⎝ 2 ⎠ ⎝ 2 ⎠
VALOR 854 855
MEDIANA 854 + 855
x=
~ = 854.5000
(PROMEDIO) 2
, El valor promedio del conjunto de datos sobre estatura sentado es de 854.5
milímetros (85.4 centímetros).
MEDIA x = 863.42
, La estatura sentado promedio de los alumnos de estadística es de 863.42
RANGO R = 969 − 787 = 182.00

, La diferencia máxima en la estatura sentado de los alumnos es de 182 milímetros
123
(18.2 centímetros).
DESVIACIÓN ESTÁNDAR s = 40.11

, La distancia promedio de los datos de estatura sentado respecto a su media es
de 40.11 milímetros (4.0 centímetros).

MÍNIMO 1 787
66(25)
Primer cuartil (q1 ) = 16.5 ⇒ 17 829
100
x 854.5
66(75)
Tercer cuartil (q3 ) = 49.5 ⇒ 50 890
100
MÁXIMO 66 969
DISTRIBUCIÓN DE LA VARIABLE DISTRIBUCIÓN DE LA VARIABLE

ESTATURA SENTADO ESTATURA SENTADO POR SEXO
Alumnos de estadística 2008-1 (n=66) Alumnos de estadística 2008-1 (n=66)
1000 1000
Estatura sentado
Estatura sentado
900 900
60
800
800
700
700 N= 41 25
N= 66 Femenino Masculino
Alumnos Sexo
, Igual que la estatura total, la variable Estatura sentado muestra mayor variabilidad en la
mitad con valores más altos y pese a que dicha estatura es mayor entre los hombres y
sus valores manifiestan mayor dispersión en las mujeres, se observó un caso atípico del
sexo masculino, que presentó una estatura sentado notoriamente baja.
III. Altura de rodilla
MODA xˆ = 464
, La altura de rodilla observada con mayor frecuencia entre los alumnos de
estadística es de 464 milímetros (46.4 centímetros).
POSICIÓN
(n = 66) ⎛ 66 ⎞
⎜ ⎟ = 33
⎛ 66 ⎞
⎜ + 1⎟ = 34
⎝ 2 ⎠ ⎝ 2 ⎠
124
VALOR 475 477

MEDIANA 475 + 477
x=
~ = 476
(PROMEDIO) 2
, El valor promedio del conjunto de datos sobre altura de rodilla es de 476
MEDIA x = 478.35
, La altura de rodilla promedio de los alumnos de estadística es de 478.35
RANGO R = 590 − 411 = 179

, La diferencia máxima en la altura de rodilla de los alumnos es de 179 milímetros
(17.9 centímetros).

, La distancia promedio de los datos de altura de rodilla respecto a su media es de
33.48 milímetros (3.3 centímetros).

MÍNIMO 1 411
66(25)
Primer cuartil (q1 ) = 16.5 ⇒ 17 458
100
x 476
66(75)
Tercer cuartil (q3 ) = 49.5 ⇒ 50 491
100
MÁXIMO 66 590
DISTRIBUCIÓN DE LA VARIABLE DISTRIBUCIÓN DE LA VARIABLE

ALTURA DE RODILLA ALTURA DE RODILLA POR SEXO
Alumnos de estadística 2008-1 (n=66) Alumnos de estadística 2008-1 (n=66)
700 700
Altura de rodilla
600 600 54 37
Altura de rodilla
54
37
39
500
500
42
50
400
400
300
300 N= 41 25
N= 66 Femenino Masculino
Alumnos Sexo
, A comparación de las variables anteriores, la altura de rodilla es una característica que

muestra una distribución más concentrada. Aunado a ello, es en el sexo masculino donde
se observa mayor variabilidad, incluso cuando las mujeres mostraron más casos atípicos
(menores y mayores).
125
IV. Peso
MODA xˆ = 44.4,53.1,57.5,58.4,61.6,62.6
, La repetición de seis valores a lo largo de la muestra señala a los alumnos de
estadística como una muestra multimodal respecto al peso corporal.
POSICIÓN
(n = 66) ⎛ 66 ⎞
⎜ ⎟ = 33
⎛ 66 ⎞
⎜ + 1⎟ = 34
⎝ 2 ⎠ ⎝ 2 ⎠
VALOR 60.4 61.1
MEDIANA 60.4 + 61.1
x=
~ = 60.75
(PROMEDIO) 2
, El valor promedio del conjunto de datos sobre peso es de 60.75 kilogramos.
MEDIA x = 61.62
, El peso promedio de los alumnos de estadística es de 61.6 kilogramos.
RANGO R = 98 − 37.6 = 60.4

, La diferencia máxima en peso de los alumnos es de 60.4 kilogramos.

, La distancia promedio de los datos de peso respecto a su media es de 13.17
kilogramos.

MÍNIMO 1 37.6
66(25)
Primer cuartil (q1 ) = 16.5 ⇒ 17 52.1
100
x 60.75
66(75 )
Tercer cuartil (q3 ) = 49.5 ⇒ 50 68.7
100
MÁXIMO 66 98.0
126
PESO CORPORAL
110
100 37
39
Peso corporal 90
80
70
60
50
40
30
N= 66
Alumnos
DISTRIBUCIÓN DE LA VARIABLE , Como podemos observar, el peso

corporal es una característica que
PESO CORPORAL POR SEXO
presenta una variabilidad diferencial:
Alumnos de estadística 2008-1 (n=66) es mayor en los valores más pequeños
110 del grupo femenino y mayor en los
100 valores más grandes del sexo
52
90 masculino. Pese a ello, los dos casos
Peso corporal
54
80
atípicos registrados se deben a
70
mujeres.
60
50
40
30
N= 41 25
Femenino Masculino
Sexo Evaluación de la media y la

distribución de una variable
En el capítulo anterior revisamos cómo, mientras las medidas de tendencia central

señalan el valor representativo o promedio de un conjunto de datos, las medidas de
dispersión indican su variabilidad.
Una observación, empero, quedó pendiente: la media puede verse afectada por valores
extremos. Por tal motivo, en este capítulo analizaremos diversas medidas que permiten
evaluar, por un lado, si el valor de dicha medida de tendencia central es verdaderamente
representativo y, por otro, la variabilidad y distribución de una variable.
Evaluación de la media y comparación de variabilidad entre grupos o variables
Comprobamos anteriormente que la desviación estándar es la medida de dispersión más

adecuada para definir la variabilidad en una serie de observaciones, pues permite
expresar la distancia promedio de los datos respecto a su media en las unidades
originales.
127
Esta característica es, empero, la misma razón por la cual la desviación estándar de
distintos grupos (con medias considerablemente diferentes) o variables (con otras
unidades y escalas de medición) no puede ser comparada. Otros procedimiento deben
realizarse entonces para cotejar la variabilidad de dos o más conjuntos de datos:
Coeficiente de variación (variabilidad) (C.V , c.v )
La forma más sencilla de obtener un valor de dispersión que sea independiente a

cualquier unidad de medición y que tome en cuenta a la media es calcular el coeficiente
de variación; medida de variabilidad relativa que relaciona la desviación estándar con la
media de un conjunto de datos:
⎛σ ⎞ ⎛s⎞
C.V . = ⎜⎜ ⎟⎟100 c.v.. = ⎜ ⎟100
⎝µ⎠ ⎝x⎠
Esto debido a que, al dividir la desviación estándar entre la media no sólo cancelamos las
unidades, sino que también establecemos una medida que, multiplicada por cien, indica
qué tanto por ciento de dispersión existe respecto a la media.
Ahora bien, aunque son los términos porcentuales del coeficiente de variación los que
permiten comparar la variabilidad entre dos o más conjuntos de datos, es su carácter
relativo a la media lo que permite evaluar dicha medida de tendencia central y concluir
que: si el coeficiente de variación es mayor a 30%, la dispersión de las
observaciones afecta el valor de la media; razón por la cual es mejor utilizar a la
mediana como valor promedio.
Teorma de Tchebysheff (Chebyshev)
Otro técnica para cotejar la variabilidad entre dos o más conjuntos de datos es calcular la
proporción o porcentaje aproximado de elementos que se encuentran en una parte de la
distribución manifestada por cada variable.
Según el teorema de Tchebysheff: La proporción de cualquier distribución situada dentro

de k desviaciones estándares (s ) de la media es, por lo menos, 1 −
1
, donde k es
k2
cualquier número positivo mayor que uno.
Por lo tanto, si:
1 ⎡ ⎛ 1 ⎞ ⎤
k 1− ⎢1 − ⎜ k 2 ⎟100%⎥ INTERPRETACIÓN
k2 ⎣ ⎝ ⎠ ⎦
Al menos 75% de los datos
2 1−
1
2
1 3
= 1 − = = 0.75 (0.75)100% = 75% está a dos desviaciones
2 4 4 estándares de la media.
3 1−
1
2
1 8
= 1 − = = 0.89 (0.89)100% = 89% está a tres desviaciones
128

4 1−
1
2
= 1−
1 15
= = 0.94 (0.94)100% = 94% está a cuatro desviaciones
En otras palabras, dicho teorema nos permite:
1. Averiguar el número de desviaciones estándares (k ) que contiene al menos cierta

proporción ( x ) de los datos. Para ello debe calcularse el valor de k :
1
Si 1− =x
k2
1
1− x = 2
k
Despejamos k
1
= k2
1− x
1
Y tenemos que =k
1− x
2. Dado un valor de k desviaciones estándares y la proporción (porcentaje)

correspondiente, definir el intervalo que contiene dichos valores. Esto implica
simplemente restar y sumar a la media k veces el valor de la desviación estándar:
EXPRESIÓN PARA DETERMINAR EL

INTERVALO QUE CONTIENE AL
MENOS 1 − 1 PORCIENTO [x − ks, x + ks]
k2
DE LOS DATOS
B. EVALUACIÓN DE LA DISTRIBUCIÓN DE UNA VARIABLE
Los histogramas que representan gráficamente la distribución de las variable pueden

tomar muchas formas; basta con dibujar una curva sobre sus barras para comprobarlo:
unas serán ascendentes, algunas descendentes y otras parecerán campanas de Gauss,
normales, aplanadas o puntiagudas. No obstante, como veremos a continuación, más allá
de su forma, la evaluación de dichas características permite analizar la distribución de una
variable.
Coeficiente de asimetría de Fisher
El coeficiente de asimetría de Fisher es una medida que indica el nivel de asimetría de

los datos respecto a su media:
1 n
COEFICIENTE DE ∑ ( X i − x )3
n
ASIMETRÍA DE FISHER a = i =1 3
s
129
Pese a que su cálculo puede resultar complicado, su interpretación es muy sencilla:
VALOR
INTERPRETACIÓN REPRESENTACIÓN GRÁFICA
DE a
Todo coeficiente negativo indica

que la distribución de la variable
es asimétrica y está cargada a la
a<0 izquierda, pues predominan las
observaciones con valores
menores al promedio.
Ahora bien, si el coeficiente es

aproximadamente cero puede
afirmarse que los datos se
a≈0 encuentran cerca de su media y
presentan un alto grado de
simetría respecto a dicha medida
de tendencia central.
Por último, cuando el coeficiente

es positivo, la distribución de la
variable es también asimétrica
a>0 pero cargada a la derecha, ya
que los datos mayores al
promedio presentan una
frecuencia más alta.
Coeficiente de curtosis
Por otro lado está el coeficiente de curtosis, medida que analiza el grado de
concentración que presentan los datos en torno a la media y señala cuán puntiaguda es la
distribución de la variable respecto a la curva gaussiana (distribución normal):
1 n
COEFICIENTE ∑ ( X i − x )4
n
DE CURTOSIS c = i =1 4 −3
s
Veamos ahora su interpretación:
VALOR
INTERPRETACIÓN REPRESENTACIÓN GRÁFICA
DE a
130
Un valor negativo en el
coeficiente de curtosis indica que
los datos se encuentran muy
c<0 dispersos, motivo por el que la
curva que delinea su distribución
es más plana y ancha; esto es
platicúrtica.
Por otra parte, cuando el
coeficiente de curtosis es
aproximadamente cero puede
concluirse que la variable se
c≈0 distribuye con un grado de
concentración medio, así que la
curva es muy parecida a la
gaussiana: mesocúrtica.
Finalmente, un coeficiente de
curtosis positivo es señal de que
los datos se concentran alrededor
c>0 de la media; razón por la cual su
curva es más esbelta y
apuntalada; es decir,
leptocúrtica.
1. A lo largo del último ejercicio del capítulo anterior realizamos algunas gráficas de
cajas para explorar el comportamiento de las variables Estatura total, Estatura sentado,
Altura de rodilla y Peso en los grupos de estadística 2008-1. Si bien establecimos
algunas comparaciones sobre su variabilidad por sexo, todas las conclusiones fueron
hechas visualmente. Calcule entonces las medidas necesarias para:
a) Cotejar la dispersión de los valores y evaluar la media.

b) Determinar en qué intervalo se halla el 95% de los datos.
c) Reconocer el grado de simetría y apuntamiento de su distribución.
Comparar la variabilidad por grupos implica, sin duda alguna, calcular el coeficiente de
variación. Empero, dado que las medidas de tendencia central y dispersión para estas
variables habían sido determinadas a partir de la muestra total, calcularemos también
(con ayuda del SPSS) su valor por sexo:
SEXO FEMENINO SEXO MASCULINO

VARIABLE ~
x x s ~
x x s
Estatura
1571.00 1576.39 50.01 1699.00 1700.84 65.99
total
Estatura
838.00 841.46 25.46 901.00 899.44 33.18
sentado
Altura de 464.00 464.80 28.13 491.00 500.56 29.84
131
rodilla
Peso
57.50 57.30 11.56 65.60 68.71 12.77
corporal
Ahora sí, calculemos los coeficientes de variación:

VARIABLE COEFICIENTE DE VARIACIÓN COEFICIENTE DE VARIACIÓN
Estatura total ⎛ 50.01 ⎞ ⎛ 65.99 ⎞
c.v.. = ⎜ ⎟100 = 3.17 c.v.. = ⎜ ⎟100 = 3.88
⎝ 1576.39 ⎠ ⎝ 1700.84 ⎠
Estatura ⎛ 25.46 ⎞ ⎛ 33.18 ⎞
sentado c.v.. = ⎜ ⎟100 = 3.03 c.v.. = ⎜ ⎟100 = 3.69
⎝ 841.46 ⎠ ⎝ 899.44 ⎠
Altura de rodilla ⎛ 28.13 ⎞ ⎛ 29.84 ⎞
c.v.. = ⎜ ⎟100 = 6.05 c.v.. = ⎜ ⎟100 = 5.96
⎝ 464.80 ⎠ ⎝ 500.56 ⎠
Peso corporal ⎛ 11.56 ⎞ ⎛ 12.77 ⎞
c.v.. = ⎜ ⎟100 = 20.17 c.v.. = ⎜ ⎟100 = 18.59
⎝ 57.30 ⎠ ⎝ 68.71 ⎠
a) , De entrada vemos que ninguno de los coeficientes de variación es mayor a 30, por lo
que puede afirmarse que la media calculada en cada caso es un valor verdaderamente
representativo de los datos. Ahora, aunque en general fue el peso la característica que
presentó mayor variabilidad, la dispersión de las observaciones muestra una diferencia
por sexo: es mayor en la estatura total y la estatura sentado masculina, y mayor en la
altura de rodilla y el peso femenino. Cultural es seguramente el motivo por el que las
mujeres presentan tal variabilidad… pero esa es harina de otro costal a investigar.
Hecho esto, revisemos la distribución de las variables. Primero, para deducir el intervalo
que contiene al 95% de los datos de cada caso, es necesario calcular el valor de k :
Si: Entonces:
1 1
1− = 0.95 = 4.47
k2 1 − 0.95
Sabiendo esto, construyamos los intervalos para cada variable por sexo:
SEXO FEMENINO
VARIABLE DATOS INTERVALO
Estatura total [1576.39 − 4.47(50.01),1576.39 + 4.47(50.01)] [1352.85,1799.93]
Estatura sentado [841.46 − 4.47(25.46),841.46 + 4.47(25.46)] [727.65,955.27]
Altura de rodilla [464.80 − 4.47(28.13),464.80 + 4.47(28.13)] [339.06,590.54]
Peso corporal [57.30 − 4.47(11.56),57.30 + 4.47(11.56)] [5.63,108.97]
SEXO MASCULINO
VARIABLE DATOS INTERVALO
132
Estatura total [1700.84 − 4.47(65.99),1700.84 + 4.47(65.99)] [1405.86,1995.82]

Estatura sentado [899.44 − 4.47(33.18),899.44 + 4.47(33.18)] [751.13,1047.75]
Altura de rodilla [500.56 − 4.47(29.84),500.56 + 4.47(29.84)] [367.18,633.94]
Peso corporal [68.71 − 4.47(12.77),68.71 + 4.47(12.77)] [11.63,125.79]
b) INTERPRETACIÓN
Finalmente calculemos10 los coeficientes de asimetría y de curtosis para reconocer el

grado de simetría y apuntamiento de su distribución.
SEXO FEMENINO
VARIABLE COEFICIENTE DE ASIMETRÍA
1 n
∑ ( X i − 1576.39) 1
(1470507.05)
3
Estatura 35866.03
41 i =1 41
total a= ⇒ a = ⇒a= = 0.29
(50.01) 3
125075.02 125075.02
1 n
Estatura ∑ ( X i − 841.46)3 1
(168650.29)
41 i =1 41 4113.42
sentado a= ⇒a= ⇒a= = 0.25
(25.46) 3
16503.47 16503.47
1 n
Altura de ∑ ( X i − 464.80)3 1
(1666542.97 )
41 i =1 41 40647.39
rodilla a= ⇒ a = ⇒a= = 1.83
(28.13) 3
22259.18 22259.18
1 n
Peso ∑ ( X i − 57.30)3 1
(51861.56)
41 i =1 41 1264.92
corporal a= ⇒a= ⇒a= = 0.82
(11.56) 3
1544.80 1544.80
SEXO FEMENINO
VARIABLE COEFICIENTE DE CURTOSIS
1 n
∑ ( X i − 1576.39)4 1
(717595453.77 )
41 i =1 41
c= −3⇒ c = −3
Estatura
total
(50.01)4 6255001.50
17502328.14
⇒c= − 3 ⇒ c = 2.80 − 3 = −0.20
6255001.50
1 n
∑ ( X i − 841.46) 1
(38946197.76)
4
41 i =1 41
c= − 3 ⇒ c = −3
Estatura
sentado
(25.46)4 420178.28
949907.26
⇒c= − 3 ⇒ c = 2.26 − 3 = −0.74
420178.28
10
Debido a que obtener la diferencia de cada dato respecto a su media es sumamente laborioso, hemos
ocupado un programa de hojas de cálculo para calcular su suma total ya elevada al cubo y a la cuarta potencia.
133
1 n
∑ ( X i − 464.80)4 1
(268696141.65)
41 i =1 41
c= −3⇒ c = −3
Altura de
rodilla
(28.13)4 626150.78
6553564.43
⇒c= − 3 ⇒ c = 10.47 − 3 = 7.47
626150.78
1 n
∑ ( X i − 57.30) 1
(2727396.16)
4
41 i =1 41
c= − 3 ⇒ c = −3
Peso
corporal
(11.56)4 17857.94
66521.86
⇒c= − 3 ⇒ c = 3.73 − 3 = 0.73
17857.94
SEXO MASCULINO
VARIABLE COEFICIENTE DE ASIMETRÍA
1 n
Estatura ∑ ( X i − 1700.84)3 1
(2700333.72)
25 i =1 25 108013.35
total a= ⇒a= ⇒a= = 0.38
(65.99) 3
287365.34 287365.34
1 n
Estatura ∑ ( X i − 899.44)3 1
(- 162763.66)
25 i =1 25 - 6510.55
sentado a= ⇒ a = ⇒a= = −0.18
(33.18) 3
36528.27 36528.27
1 n
Altura de ∑ ( X i − 500.56)3 1
(661857.82)
25 i =1 25 26474.31
rodilla a= ⇒a= ⇒a= = 1.00
(29.84) 3
26570.30 26570.30
1 n
Peso ∑ ( X i − 68.71)3 1
(42502.64)
25 i =1 25 1700.11
corporal a= ⇒ a = ⇒a= = 0.82
(12.77 ) 3
2082.44 2082.44
SEXO MASCULINO
VARIABLE COEFICIENTE DE CURTOSIS
1 n
∑ ( X i − 1700.84)4 1
(1323083865.85)
25 i =1 25
c= − 3 ⇒ c = −3
Estatura
total
(65.99)4 18963238.77
52923354.63
⇒c= − 3 ⇒ c = 2.79 − 3 = −0.21
18963238.77
134
1 n
∑ ( X i − 899.44)4 1
(77756609.48)
25 i =1 25
c= −3⇒ c = −3
Estatura
sentado
(33.18)4 1212008.11
3110264.38
⇒c= − 3 ⇒ c = 2.57 − 3 = −0.43
1212008.11
1 n
∑ ( X i − 500.56) 1
(77960641.22)
4
25 i =1 25
c= − 3 ⇒ c = −3
Altura de
rodilla
(29.84)4 792857.75
3118425.65
⇒c= − 3 ⇒ c = 3.93 − 3 = 0.93
792857.75
1 n
∑ ( X i − 68.71)4 1
(1803668.36)
25 i =1 25
c= −3⇒ c = −3
Peso
corporal
(12.77 )4 26592.77
72146.73
⇒c= − 3 ⇒ c = 2.71 − 3 = −0.29
26592.77
Resumiendo estos datos en una tabla tenemos que:

VARIABLE a c a c
Estatura total 0.29 -0.20 0.38 -0.21
Estatura sentado 0.25 -0.74 -0.18 -0.43
Altura de rodilla 1.83 7.47 1 0.93
Peso corporal 0.82 0.73 0.82 -0.29
Por lo cual podemos concluir que, por sexo, las variables presentan la siguiente
distribución:

VARIABLE DISTRIBUCIÓN DISTRIBUCIÓN
Asimétrica (cargada a la Asimétrica (cargada a la
Estatura total derecha) y platicúrtica. derecha) y platicúrtica.
Estatura sentado derecha) y platicúrtica. izquierda) y platicúrtica.
Altura de rodilla derecha) y leptocúrtica. derecha) y leptocúrtica
Peso corporal derecha) y leptocúrtica. derecha) y platicúrtica.

VARIABLE a SPSS c SPSS a SPSS c SPSS
Estatura total 0.29 0.31 -0.20 0.09 0.38 0.43 -0.21 0.32
Estatura sentado 0.25 0.27 -0.74 -0.55 -0.18 -0.20 -0.43 0.02
135
Altura de rodilla 1.83 1.97 7.47 9.23 1.00 1.13 0.93 1.85
Peso corporal 0.82 0.88 0.73 1.20 0.82 0.92 -0.29 0.22
POR LO CUAL LAS DISTRIBUCIONES SERÍAN:

VARIABLE DISTRIBUCIÓN DISTRIBUCIÓN
Estatura total derecha) y mesocúrtica. derecha) y leptocúrtica.
Estatura sentado derecha) y platicúrtica. izquierda) y mesocúrtica.
Altura de rodilla derecha) y leptocúrtica. derecha) y leptocúrtica.
Peso corporal derecha) y leptocúrtica. derecha) y leptocúrtica.
Estatura total Estatura total
Sexo: Femenino Sexo: Masculino

12 10
10
8
8
Frecuencia
Frecuencia
4
4
2
2
Media =1576.39 Media =1700.84

Desviación típica =50.01 Desviación típica =65.
987
N =41 N =25
0 0
1450 1500 1550 1600 1650 1700 1500 1600 1700 1800 1900
Estatura total Estatura total
Estatura sentado Estatura sentado

10 6
5
8
4
Frecuencia
Frecuencia
4
2
2
1
Media =841.46 Media =899.44
Desviación típica =25. Desviación típica =33.
457 183
0 N =41 0 N =25
780 800 820 840 860 880 900 800 850 900 950 1000
Estatura sentado Estatura sentado
136
Altura de rodilla Altura de rodilla

20 12
10
15
8
Frecuencia
Frecuencia
10 6
2
Media =464.8 Media =500.56
127 836
0 N =41 0 N =25
400 450 500 550 600 460 480 500 520 540 560 580 600
Altura de rodilla Altura de rodilla
Peso corporal Peso corporal

10 6
5
8
4
Frecuencia
Frecuencia
4
2
2
1
Media =57.3 Media =68.71
556 766
0 N =41 0 N =25
40.0 60.0 80.0 100.0 50.0 60.0 70.0 80.0 90.0 100.0
Peso corporal Peso corporal
Análisis bivariado
Correlación lineal
Cuando se tienen dos variables cuantitativas, la forma más sencilla para comprobar si
existe una relación lineal entre ellas es construyendo un diagrama de dispersión con base
en coordenadas ( X , Y ) . Empero, como veremos a continuación, la estadística cuenta con
estimadores y pruebas más precisas (acordes al tipo y la distribución probabilística de las
variables) para determinar si existe una asociación significativa o no.
Coeficiente de correlación de Pearson
Medida sobre la asociación entre dos variables continuas ( X , Y ) , cuyas expresiones para
calcularlo en poblaciones y muestras son:
PARÁMETRO ESTIMADOR
137
− µ x )( y i − µ y )
N n
∑ (x i ∑ (x i − x )( y i − y )
ρ= i =1
r= i =1
N ⋅σ x ⋅σ y (n − 1) ⋅ s x ⋅ s y
No obstante, para reducir la labor que implica restar a cada dato su media
correspondiente, podemos simplificar la expresión del numerador de este estimador:
• Desarrollamos primero el binomio:

n
∑ (x y
i =1
i i − xi y − x y i + x y )
• Repartimos la sumatoria:
n n n n
∑ x y − ∑ x y − ∑ xy + ∑ xy
i =1
i i
i =1
i
i =1
i
i =1
• Donde las medias son constantes y por ello pueden multiplicar a las sumatorias y
multiplicarse por el tamaño de la muestra:
n n n
∑x y
i =1
i i − y ∑ x i − x ∑ y i + nx y
i =1 i =1
• Lo cual puede abreviarse a:

n
∑x y
i =1
i i − y ⋅ nx − x ⋅ ny + n x y
n n
∑x i n ∑y i n
⇒ ∑ xi = x ⋅ n ⇒ ∑ yi = y ⋅ n
Porque:
x= i =1
y= i =1
n i =1 n i =1
• Y eliminando los términos en común obtenemos:

n
∑x y
i =1
i i − nx y
• Con lo cual la expresión queda así:
EXPRESIÓN PARA CALCULAR EL n

ESTIMADOR DEL COEFICIENTE DE
CORRELACIÓN DE PEARSON PARA
∑x y i i − nx y
r= i =1
VARIABLES CUANTITATIVAS CON (n − 1) ⋅ s x ⋅ s y
DISTRIBUCIÓN NORMAL11.
11
Si bien esta es la forma más sencilla para calcular manualmente el coeficiente de correlación de Pearson,
cabe mencionar que muchas calculadoras científicas lo pueden arrojar directamente al ingresar los datos de
ambas variables en el modo estadístico de regresión lineal; este dato tendrá un valor muy parecido al que se
obtiene haciendo los cálculos manualmente con 4 decimales.
138
Imprescindible resulta mencionar que el valor de este coeficiente sólo puede encontrarse
en el rango (− 1 < r < 1) y de acuerdo a ello debe interpretarse:
VALOR DEL COEFICIENTE INTERPRETACIÓN

(r ≈ −1) Existe asociación lineal inversa entre las variables.
(r ≈ 0) No existe asociación entre las variables.
(r ≈ 1) Existe asociación lineal directa entre las variables.
Esta conclusión, sin embargo, no es 26
suficiente; pues en el caso de que haya

asociación entre las variables, falta 24
comprobar que ésta sea estadísticamente
significativa.
22
Y
20
18
16
12 14 16 18 20 22
X
1. Los siguientes datos corresponden las longitudes de húmero y fémur de restos

óseos masculinos de la Cueva de La Candelaria, Coahuila.
HÚMERO FÉMUR
329 444
311 426
297 449
323 427
323 428
290 427
297 417
287 414
333 417
336 440
313 416
322 408
321 420
315 443
309 472
304 466
300 422
¿es posible afirmar que existe una relación lineal entre la longitud del húmero y del fémur?
139
Hagamos una primera conclusión a partir del diagrama de dispersión correspondiente:
480
470
460
450
Fémur
440
430
420
410
400
280 290 300 310 320 330 340
Húmero
, En esta gráfica podemos observar que no existe una linealidad clara entre las
variables.
Pero es necesario comprobar lo que los sentidos nos dicen con un poco de estadística.
En este primer ejemplo desarrollaremos todos los datos necesarios para calcular
manualmente el coeficiente de correlación; no obstante, en los próximos casos
recurriremos simplemente a los valores obtenidos con ayuda de una calculadora.
HÚMERO FÉMUR X i Yi
329 444 146076
311 426 132486
297 449 133353
323 427 137921
323 428 138244
290 427 123830
297 417 123849
287 414 118818
333 417 138861
336 440 147840
313 416 130208
322 408 131376
321 420 134820
315 443 139545
309 472 145848
304 466 141664
140
300 422 126600

TOTAL 2291339
DATOS GENERALES
n = 17 x = 312.3529 y = 431.5294 s x = 14.8195 s y = 18.2384
n
EXPRESIÓN DEL
COEFICIENTE DE ∑x y i i − nx y
CORRELACIÓN r= i =1
DE PEARSON (n − 1) ⋅ s x ⋅ s y
CÁLCULO 2291339 − 17(312.3529 ⋅ 431.5294)
r= = −0.0189
MANUAL (17 − 1)14.8195 ⋅ 18.2384
VALOR EN
r = −0.0190
CALCULADORA
, El signo negativo indica que la asociación entre la longitud del húmero y la del
fémur sería inversa, pero su cercano valor a cero nos da una segunda prueba para
afirmar que la asociación entre estas variables es casi nula.
3. Los siguientes datos corresponden a la población juvenil masculina de Cholula,

Puebla (recopilados entre 1968-1970).
LONGITUD MIEMBRO SUPERIOR ESTATURA

771 1715
740 1701
743 1652
775 1691
745 1611
722 1620
764 1701
711 1655
756 1734
721 1635
728 1598
727 1635
756 1684
768 1622
735 1674
141
¿Puede afirmarse que existe asociación entre la longitud del miembro superior y la
estatura?
1740
1720
1700
1680
Estatura
1660
1640
1620
1600
1580
710 720 730 740 750 760 770 780
Longitud miembro superior
, Aunque existe dispersión en los datos, puede entre verse una linealidad entre estas
variables y, por ende, una posible asociación.
DATOS GENERALES
n = 15 r = 0.5310
, El valor del coeficiente de correlación de Pearson nos indica una asociación lineal
directa aunque no parece ser importante.
Regresión Lineal
El análisis de regresión lineal consiste en aplicar una serie de técnicas para encontrar si
hay causalidad entre dos variables cuantitativas; es decir, si el valor de una variable (Y )
depende y puede explicarse a partir de otra variable (X ) , que se postula como
independiente.
Fundamentos
La regresión es un método que permite encontrar relaciones lineales entre las variables
de un fenómeno. Por ende, primero debemos revisar cómo, a partir de una serie de datos
(como los a continuación que se grafican) podemos encontrar la recta que los define:
Se toman dos coordenadas [(x1 , y1 ), (x2 , y 2 )]
142
y 2 − y1
Se calcula la pendiente m=
x 2 − x1
Teniendo ese valor y el de un punto, se puede
y − y1 = m( x − x1 )
aplicar la ecuación punto-pendiente
Que se desarrolla de la siguiente forma y − y1 = mx − mx1
Como el objetivo es encontrar la ordenada al
origen; es decir, el valor de Y cuando X es igual a y = y1 + mx − mx1
cero, despejamos Y
y = y1 + m(0) − mx1
Y damos a X el valor de cero
Por lo que el valor de la ordenada al origen (b ) es b = y1 − mx1

Y teniendo esos valores podemos establecer la y = mx + b
ecuación de la recta
También denotada por la expresión y = a + bx
26
24
Como podemos ver, cuando la relación
entre dos variables es clara y constante,
modelos basados en la forma y = a + bx 22
Y
son de gran utilidad para expresar y

20
describir con precisión su asociación.
18
16
12 14 16 18 20 22
Los datos de fenómenos relacionados al ser

humano, empero, no son tan fáciles de
trabajar, ya que la diversidad y variabilidad
bio-psico-socio-cultural que estos reflejan
impide hallar una ecuación concreta que
generalice sus resultados.
Echando mano de la probabilidad, la

estadística se arriesga entonces a suponer
que la mejor recta para describir un
143
fenómeno de este tipo es la que une las medias de los valores posibles de Y para cada
( )
X i µ y x ; sin dejar de reconocer como error en este modelo la desviación que cada dato
Yi pueda tener con respecto a la recta µ y x .
De esta forma, para su análisis, la estadística no sólo se apropia de los modelos de

regresión lineal y les cambia las letras con que se denota a la ordenada al origen
(b, a ⇒ β 0 ) y a la pendiente (m, b ⇒ β1 ) , sino también los adapta para manifestar el nivel
de incertidumbre o error (e ) presente en ellos:
MODELO TEÓRICO DE REGRESIÓN y = β 0 + β1 x + e

LINEAL SIMPLE EN ESTADÍSTICA
Ajuste del modelo de regresión lineal simple (optativo)
Conociendo la forma del modelo de regresión lineal que la estadística utiliza para describir
la relación entre dos variables, es ahora necesario saber cómo ajustarlo; es decir, cómo
partiendo de los datos X i , Yi de una muestra de tamaño n , calcular la ordenada al origen
y la pendiente de la recta, logrando que los errores ei del modelo sean mínimos (razón
por la cual ocuparemos el procedimiento de mínimos cuadrados).
• Para hallar los valores β 0 y β 1 , tomamos un punto ( X i , Yi ) :

y i = β 0 + β 1 x i + ei
• Y despejamos lo que nos importa: el error

ei = y i − β 0 − β 1 x i
• Que en una muestra de tamaño n esperamos su suma de cuadrados sea mínima; lo

cual depende de β 0 y β 1 .
n n
e = ( y i − β 0 − β 1 xi ) ∑ ei2 = ∑ ( yi − β 0 − β1 xi )
2 2 2
i
i =1 i =1
n
f (β 0 , β 1 ) = ∑ ( y i − β 0 − β 1 xi )
2
i =1
• Por lo cual hay que encontrar la forma en que esta función sea mínima. El punto es
que, al haber dos variables, mantendremos a la vez una constante; esto es,
haremos derivadas parciales de la función.
Empecemos por derivar la función respecto a β 0 :

n
f (β 0 , β 1 ) = ∑ ( y i − β 0 − β 1 xi )
2
i =1
144
df (β 0 , β1 ) n
= 2∑ ( y i − β 0 − β1 xi )(− 1)
dβ 0 i =1
d [ f ( x )]
n
= n[ f ( x )] ⋅ f ( x )
n −1
Porque
dx
• Y al igualar a cero, β 0 y β 1 se convierten en estimadores βˆ 0 , βˆ1 ( ) que son los

valores donde la función es mínima:
2∑ ( y i − βˆ0 − βˆ1 xi )(− 1) = 0

n
i =1
• Sinteticemos ahora lo ajeno a la sumatoria y despejémosla:
− 2∑ ( y i − βˆ 0 − βˆ1 xi ) = 0
n
i =1
∑ (y − βˆ0 − βˆ1 xi ) = 0
n
i =1
i −2
Como 0 =0
#
∑ (y − βˆ 0 − βˆ1 xi ) = 0
n
i
i =1
• Ahora repartamos la sumatoria:

n n n
∑ y − ∑ βˆ − ∑ βˆ x
i =1
i
i =1
0
i =1
1 i =0
• Expresión que también puede denotarse como:

ny − nβˆ 0 − βˆ1 nx = 0
n n
∑ yi n ∑x i n
∑ C = nC
⇒ ∑ y i = yn ⇒ ∑ xi = x n
Porque
y= i =1
x= i =1
n i =1 n i =1
• Y al dividir eso entre n resulta:

ny nβˆ0 βˆ1 nx
− − =0 y − βˆ 0 − βˆ1 x = 0
n n n
• Ecuación de la cual ya podemos despejar βˆ 0 :

βˆ 0 = y − βˆ1 x
Ahora bien, resta hacer lo mismo con β 1 :
145
• Derivamos la función respecto a β 1 :

n
f (β 0 , β 1 ) = ∑ ( y i − β 0 − β 1 xi )
2
i =1
df (β 0 , β1 ) n
= 2∑ ( y i − β 0 − β1 xi )(− xi )
dβ1 i =1
d [ f ( x )]
n
= n[ f ( x )] ⋅ f ( x )
n −1
Porque
dx
• Igualamos a cero:
2∑ ( y i − βˆ 0 − βˆ1 xi )(− xi ) = 0
n
i =1
• Desarrollamos y despejamos la sumatoria:
( )
n
− 2∑ xi y i − βˆ 0 xi − βˆ1 xi2 = 0
i =1
∑ (x y − βˆ0 xi − βˆ1 xi2 ) = 0

n
i =1
i i −2
• Ahora la repartimos y liberamos a las constantes:

n n n
∑ xi yi − ∑ βˆ0 xi − ∑ βˆ1 xi2 = 0

i =1 i =1 i =1
n n n
∑x y
i =1
i i − βˆ 0 ∑ xi − βˆ1 ∑ xi2 = 0
i =1 i =1
• Despejemos el término que incluye a βˆ1 :

n n n
βˆ1 ∑ xi2 = ∑ xi y i − βˆ0 ∑ xi
i =1 i =1 i =1
• Que puede denotarse como:
βˆ1 ∑ xi2 = ∑ xi y i − ( y − βˆ1 x )(nx )

n n
i =1 i =1
n
βˆ 0 = y − βˆ1 x ∑x i n
⇒ ∑ xi = x n
Porque
x= i =1
n i =1
• Lo cual se desarrolla de la siguiente manera:

n n
βˆ1 ∑ xi2 = ∑ xi y i − nx y + βˆ1 nx 2
i =1 i =1
146
• Así que queda otro término con βˆ1 por despejar:

n n
βˆ1 ∑ xi2 − βˆ1 nx 2 = ∑ xi y i − nx y
i =1 i =1
• Lo cual se puede simplificar como:

⎛ n
⎞ n
βˆ1 ⎜ ∑ xi2 − nx 2 ⎟ = ∑ xi y i − nx y
⎝ i =1 ⎠ i =1
• Y a partir de ello despejar completamente el término βˆ1 :

n
∑x y i i − nx y
βˆ1 = i =1
n
∑x
i =1
2
i − nx 2
Puede decirse entonces que, para encontrar el modelo de regresión lineal

y i = β 0 + β 1 xi + ei que mejor se ajusta a los datos X i , Yi de una muestra de tamaño n ,
basta calcular los estimadores de β 0 y β 1 12 que por mínimos cuadrados se definen como:
EXPRESIÓN PARA CALCULAR

EL ESTIMADOR βˆ 0
βˆ 0 = y − βˆ1 x
n
EXPRESIÓN PARA CALCULAR

∑x y i i − nx y
βˆ1 = i =1
EL ESTIMADOR βˆ1 n
∑x
i =1
2
i − nx 2
Si bien ambos datos son fundamentales para construir el modelo de regresión lineal, el
valor de βˆ 0 sólo indica el punto donde la recta corta el eje de las Y ; esto es, el valor de
Y cuando X = 0 . Mientras tanto, el valor de βˆ1 resulta mucho más significativo para la
interpretación ya que, dependiendo de su signo y magnitud, indica el cambio en la
variable Y cuando X cambia una unidad. Por ejemplo:
Si X disminuye una unidad Si X aumenta una unidad

y = βˆ0 + βˆ1 ( x − 1) y = βˆ0 + βˆ1 ( x + 1)
y = βˆ 0 + βˆ1 x
y = βˆ 0 + βˆ1 x − βˆ1 y = βˆ 0 + βˆ1 x + βˆ1
y = βˆ 0 − βˆ1 x y = βˆ0 − βˆ1 (x − 1) y = βˆ0 − βˆ1 (x + 1)
12
Igual que en el caso del coeficiente de correlación de Pearson, el valor de la ordenada a la origen y la
pendiente de la recta pueden obtenerse sin hacer manualmente los cálculos, pues son ya muchas las
calculadoras científicas que arrojan sus valores (a,b) al ingresar los datos de la muestra en el modo estadístico
de regresión lineal.
147
y = βˆ 0 − βˆ1 x + βˆ1 y = βˆ 0 − βˆ1 x − βˆ1
Por tanto:
y X aumenta una
Si la pendiente es: y X disminuye una unidad:
unidad:
( )
positiva β̂1 Y disminuye βˆ1 unidades Y aumenta βˆ1 unidades
negativa (− βˆ )1 Y aumenta βˆ1 unidades Y disminuye βˆ1 unidades
1. Los siguientes datos de altura y peso en jóvenes adultos son parte de la muestra
recolectada durante la investigación en Cholula, Puebla (1968-1970).
ESTATURA PESO
1649 49.5
1635 57.5
1611 50.0
1622 53.5
1583 43.0
1613 57.5
1636 50.5
1650 56.0
1579 50.0
1568 50.0
1522 44.5
1554 48.0
1627 51.0
1535 46.0
1565 49.5
Comprobemos entonces si existe asociación lineal entre estas variables por medio de un
diagrama de dispersión y el coeficiente de correlación.
148
58
56
54
Peso jóvenes adultos

52
50
48
46
44
42
1520 1540 1560 1580 1600 1620 1640 1660
Estatura jóvenes adultos
a.1) , Si bien en los valores más pequeños de la estatura puede verse una
asociación lineal clara con respecto al peso, conforme la estatura aumenta este
patrón no es tan claro
COEFICIENTE DE PEARSON
r = 0.6786
a.2) , El valor del coeficiente de correlación de Pearson nos indica una asociación
lineal directa considerable entre la estatura y el peso de esta población.
A continuación saquemos los datos necesarios para calcular los estimadores βˆ1 y βˆ 0 a
fin de establecer el modelo de regresión.
DATOS GENERALES
n = 15 x = 1596.6000 y = 50.4333 s x = 41.5379 s y = 4.3006
n n
∑x y
i =1
i i = 1209525 .000 ∑x
i =1
2
i = 38261129.00
Si bien en esta ocasión se mostrará el cálculo explícito, después se mostrará únicamente

el obtenido directamente con ayuda de la calculadora.
EXPRESIÓN PARA n
CALCULAR ∑x y i i − nx y
EL ESTIMADOR βˆ1 = i =1
n
βˆ1 EXPRESIÓN ∑x 2
i − nx 2
PARA i =1
1209525.000 − 15(1596.6000 )(50.4333)

CÁLCULO βˆ1 = = 0.0703
38261129.00 − 15(1596.6000 )
2
MANUAL
CALCULADORA βˆ1 = 0.0703
CALCULAR
EL ESTIMADOR βˆ 0
βˆ 0 = y − βˆ1 x
149
CÁLCULO
βˆ 0 = 50.4333 − 0.0703(1596.6000 ) = −61.8077
MANUAL
CALCULADORA βˆ 0 = −61.7390
Por lo que el modelo de regresión lineal ajustado queda como:
MODELO TEÓRICO y = β 0 + β1 x + e
MODELO AJUSTADO peso = −61.7390 + 0.0703estatura
b) , Según el modelo ajustado, por cada milímetro que cambia la estatura, el peso
cambia 0.0703 kilogramos.
Los siguientes datos de altura y peso también son parte de la muestra recolectada
durante la investigación en Cholula, Puebla (1968-1970), pero pertenecen a adolescentes
hombres:
ESTATURA PESO
1674 58.5
1672 53.5
1710 58.0
1651 57.0
1702 58.0
1656 58.0
1672 56.5
1590 51.5
1612 56.0
1652 57.5
1594 51.5
1566 47.0
1645 54.5
1678 54.0
1740 62.0
64
62
60
Peso adolescentes
58
56
54
52
50
48
46
1500 1600 1700 1800
Estatura adolescentes
a.1) , Pese a la dispersión de algunos datos puede verse una asociación lineal entre
150
la estatura y el peso, así como se define una pendiente bastante grande.
COEFICIENTE DE PEARSON
r = 0.8382
a.2) , El coeficiente de correlación de Pearson señala una asociación lineal directa
fuerte entre la estatura y el peso de los adolescentes de Cholula.
ESTIMADORES Y AJUSTE DEL MODELO

βˆ1 = 0.0646 βˆ0 = −51.3759
peso = −51.3759 + 0.0646 estatura
b) , De acuerdo al modelo ajustado, por cada milímetro que cambia la estatura, el
peso cambia 0.0646 kilogramos.
Ejercicios de Repaso
I. Definir los siguientes términos estadísticos:
1. Población. 11. Mediana.

2. Muestra. 12. Moda.
3. Variable. 13. Varianza.
4. Variable categórica nominal. 14. Desviación estándar.
5. Variable categórica ordinal. 15. Coeficiente de variación.
6. Variable numérica discreta. 16. Percentil.
7. Variable numérica continua. 17. Cuartel.
8. Medida de tendencia central. 18. Modelo de regresión lineal.
9. Medida de dispersión. 19. Coeficiente de correlación.
10. Media aritmética. 20. Pendiente de la recta de regresión
lineal
II. Clasificar las siguientes variables como categórica nominal, categórica ordinal,
numérica discreta o numérica continua:
1. Temperatura máxima diaria. 12. Último grado escolar obtenido

2. Número de camiseta de los (primaria, secundaria, etc.).
jugadores de un equipo de 13. Número de carros propios por
baloncesto. familia
3. Calificación obtenida en un 14. Ocupación.
examen. 15. Tasa de criminalidad.
4. Marca de un refresco consumido. 16. Calificación en el examen de
5. Estado civil de una persona. admisión a la UNAM.
6. Número de tepalcates obtenidos 17. La calificación del examen de
en un sitio arqueológico Estadística en el grupo.
determinado. 18. Sexo.
7. El número de niños nacidos en 19. Edad al morir.
mujeres de más de 40 años. 20. Estatus de empleo (empleado,
8. Número de hermanos. desempleado)
9. Preferencia política partidaria.
10. Años de escuela completados.
11. Creencia religiosa.
151
III. Hay 15 números en una lista y la media es 25. Un estudiante se ha equivocado
con el número más pequeño que era 12.9 y lo captura como 1.29.
1. ¿Es posible determinar cuánto cambia la media? Si es así, ¿cuánto cambia?

2. ¿Es posible determinar el valor de la media después del cambio? Si es así
¿cuál es el valor?
3. ¿Es posible determinar cuánto cambia la mediana? Si es así, ¿cuánto cambia?
4. ¿Es posible determinar cuánto cambia la desviación estándar? Si es así,
¿cuánto cambia?
IV. Designar, según sea el caso, como “verdadero” o falso” las siguientes
afirmaciones:
1. La media de una muestra divide siempre a los datos en dos partes, la mitad
con valores mayores y la otra con valores menores que aquella.
2. Una medida de tendencia central es un valor cuantitativo que describe la
variabilidad de los datos con respecto a un valor central.
3. Algunas veces la suma de los cuadrados de las diferencias con respecto a la
media es negativa.
4. En cualquier distribución, la suma de las desviaciones con respecto a la media
es igual a cero.
5. La desviación estándar del conjunto de valores, 2, 2, 2, 2, y 2 es 2.
6. En un examen, la calificación de Carlos ocupa el percentil 50, y la de Guillermo
el 25; por lo tanto la calificación de Carlos es dos veces la de Guillermo.
7. La frecuencia de una clase es el número de datos cuyos valores se encuentran
dentro de las fronteras de esa clase.
8. En estadística se utilizan las distribuciones de frecuencias para presentar, en
forma concisa, cantidades grandes de datos repetidos.
9. Las gráficas de caja permiten comparar dos grupos con respecto a una
variable.
10. Las gráficas de dispersión (tipo XY) permiten comparar dos grupos con
respecto a una variable.
V. Se desea realizar un estudio sobre el estatus nutricional de una comunidad.

a) Proponer de forma razonada diez variables que podrían utilizarse para realizar
dicha investigación.
b) ¿Qué tipo de variable es cada una de ellas?
c) Describir brevemente el tipo de estadística descriptiva a realizar en este
estudio.
VI. Los siguientes datos se obtuvieron en una investigación sobre actividad

ocupacional a partir de una muestra de restos óseos femeninos
(correspondientes a la época de la Colonia) procedentes del hospital Real de
Naturales (ubicado en lo que ahora es el Eje Central de la Ciudad de México).
1. Clasificar cada una de las variables.

2. Realizar tablas de frecuencias para las variables Aplanamiento por mecapal e
Inserción en músculo suboccipital y realizar gráficas circulares para cada
variable.
3. Realizar una tabla cruzada entre Aplanamiento por mecapal e Inserción en el
músculo suboccipital obteniendo porcentajes por renglón.
4. Para la variable Longitud máxima de húmero graficar el histograma, calcular la
media, mediana, moda, desviación estándar y coeficiente de variación.
152
Inserción
Longitud Inserción Longitud
Aplanamient en Aplanamient
Cas máxima Cas en músculo máxima
o músculo o
o de o suboccipita de
por mecapal suboccipita por mecapal
húmero l húmero
l
1 Ausencia Ligera 254 33 Ausencia Moderada 310
2 Ausencia Moderada 254 34 Ausencia Ligera 313
3 Ausencia Moderada 262 35 Ausencia Ligera .
4 Ausencia Moderada 270 36 Ausencia Moderada .
6 Ausencia Ligera 272 38 Ausencia Moderada .
7 Ausencia Marcada 275 39 Ausencia Moderada .
13 Ausencia Moderada 280 45 Presencia Marcada 262
14 Ausencia Marcada 280 46 Presencia Moderada 264
16 Ausencia Moderada 282 48 Presencia Moderada 271
24 Ausencia Ligera 290 56 Presencia Marcada 295
25 Ausencia Marcada 291 57 Presencia Marcada 302
26 Ausencia Marcada 294 58 Presencia Marcada 302
28 Ausencia Moderada 295 60 Presencia Moderada .
29 Ausencia Moderada 297 61 Presencia Moderada .
30 Ausencia Marcada 300 62 Presencia Marcada .
31 Ausencia Moderada 301 63 Presencia Marcada .
32 Ausencia Moderada 307 64 Presencia Marcada .
VII. Con los datos recolectados en el grupo mediante la Cédula de percepción

corporal, sexualidad y antropometría:
1. Realizar una tabla cruzada entre Sexo y Persona con la que tuvieron su
primera relación sexual (pregunta 13) utilizando los casos que contestaron SÍ
haber tenido relaciones sexuales.
2. Llenar la siguiente tabla con los datos indicados:
VARIABLE MUJERES HOMBRES

Estatura ~ ~
x x s c.v. x x s c.v.
autopercibida
Peso autopercibido
Estatura
antropométrica
Peso antropométrico
3. Para cada valor en la muestra, calcule el Índice cintura-cadera (ICC)
153
ICC=
a fin de realizar una gráfica de de caja para comparar los valores de este índice
por sexo.
VIII. En varias ocasiones ciertos problemas de salud no permiten que un

individuo se coloque en posición para poder medir directamente su estatura
total; para estimar su valor se utilizan entonces medidas indirectas, como la
altura de rodilla, que se suponen están fuertemente correlacionadas con dicha
variable.
1. Utilizando los datos recolectados para mujeres, considerando la estatura

total como variable dependiente y la altura a la rodilla como variable
independiente:
a) Graficar los datos en un diagrama de dispersión.

¿Se observa una tendencia lineal en los datos?
b) Calcular el coeficiente de correlación lineal.
c) Ajustar el modelo de regresión lineal.
d) ¿Es un modelo adecuado? Calcular R 2 .
e) Ejemplificar el uso del modelo prediciendo dos valores y graficando la recta
sobre el diagrama de dispersión.
2. Repetir el ejercicio con los datos de hombres.
154
Sexo Turno Edad Lug_soc jos_mam L_hijos PIC Estatura Peso Rel_sex Edad_rel_sex P13 P14 P15 P16 P17 P18 Estatura_total
F M 20.9 Ciudad 3 3 1 1.39 44.00 Si 16 Mayor Novio (a) Si Condones A veces 5 1,547
F M 20.4 Ciudad 3 3 5 1.61 63.00 No 1,594
F M 18.2 Ciudad 1 1 2 1.55 50.00 Si 18 Misma edad Novio (a) Si Condones Siempre 1 1,573
F M 21.4 Ciudad 5 5 7 1.56 62.00 Si 18 Mayor Novio (a) Si Condones Siempre 2 1,553
F M 24.0 Ciudad 3 1 7 1.62 70.00
F M 29.8 Ciudad 3 2 4 1.54 51.00 Si 23 Menor Novio (a) Si Condones Siempre 1 1,524
F M 24.0 Ciudad 4 1 5 1.55 70.00 Si 15 Mayor Amigo (a) No A veces 7 1,544
F M 18.9 Ciudad 2 2 2 1.60 50.00 No 1,594
F M 24.1 Ciudad 2 2 3 1.54 49.00 Si 17 Misma edad Novio (a) Si Condones A veces 1 1,521
F M 21.0 Ciudad 2 3 1.68 57.00
F M 19.8 Ciudad 3 3 6 1.68 69.00 Si 15 Misma edad Amigo (a) No Siempre 13 1,666
F M 20.1 Ciudad 2 2 6 1.53 Si 18 Mayor Novio (a) Si Pastillas de emergencia A veces 3 1,513
F M 19.0 Ciudad 2 1 4 1.53 54.00 No 1,494
F M 19.5 Ciudad 5 5 2 1.65 49.00 Si 17 Misma edad Novio (a) No Siempre 4 1,630
F M 22.3 Ciudad 2 1 5 1.69 68.00 Si 16 Misma edad Novio (a) No Siempre 9 1,625
F 25.7 Ciudad 3 1 3 1.60 51.00 Si 14 Mayor Novio (a) Si Condones A veces 3 1,586
F M 24.4 Pueblo 4 1 3 1.55 50.00 Si 23 Misma edad Novio (a) Si Condones Siempre 1 1,518
F M 17.8 Ciudad 3 1 3 1.52 51.00 Si 16 Mayor Novio (a) Si otro Siempre 3 1,500
F M 21.2 Ciudad 3 1 3 1.47 40.00 Si 19 Misma edad Novio (a) Si Condones A veces 1 1,475
F M 25.2 Ciudad 3 1 2 1.62 53.40 No 1,604
F M 20.7 Ciudad 2 2 3 1.56 52.80 Si 17 Mayor Novio (a) Si Condones Siempre 3 1,512
F M 18.3 Pueblo 1 1 5 1.60 61.00 Si 16 Mayor Novio (a) Si Pastillas de emergencia Siempre 3 1,581
F V 22.8 Ciudad 3 2 4 1.60 57.00 Si 15 Mayor Novio (a) Si Condones Siempre 2 1,560
F V 21.7 Ciudad 3 1 5 1.52 No 1,516
F V 18.4 Ciudad 2 1 3 1.57 47.50 No 1,557
F V 20.2 Ciudad 4 1 6 1.57 60.00 Si 16 Mayor Novio (a) Si Condones A veces 3 1,575
F V 30.7 Ciudad 3 1 3 1.56 52.00
F V 18.3 Ciudad 2 2 6 1.72 62.00 Si 17 Misma edad Novio (a) Si Condones Siempre 1 1,724
F V 19.4 Ciudad 3 1 6 1.54 65.00 No 1,505
F V 19.6 Ciudad 2 2 4 1.56 56.00 Si 15 Mayor Novio (a) Si Pastillas Siempre 3 1,534
F V 21.4 Ciudad 4 3 3 1.62 48.00 Si 18 Misma edad Novio (a) Si Condones Siempre 2 1,610
F V 18.8 Ciudad 6 4 5 1.67 64.00 Si 18 Mayor Esposo (a) Si Pastillas de emergencia Siempre 3 1,638
M M 18.7 Pueblo 2 2 3 1.77 71.00 No 1,736
M M 26.9 Ciudad 3 1 3 1.83 77.00 Si 16 Mayor Conocido (a) Si Condones A veces 30 1,812
M M 22.1 Pueblo 4 4 4 1.68 82.00 Si 16 Misma edad Conocido (a) Si Pastillas de emergencia Siempre 21 1,662
M M Ciudad 1 7 2 1.67 67.50 Si 17 Mayor Novio (a) Si Condones A veces 1 1,668
M M 21.8 Ciudad 2 2 3 1.84 72.00 Si 21 Menor Novio (a) No 1 1,780
M M 21.0 Ciudad 2 1 2 1.62 61.00 No 1,617
M M 37.8 Ciudad 3 1 7 1.80 90.00 Si 18 Misma edad Novio (a) Si Ritmo Siempre 35 1,790
M M 23.6 Ciudad 3 2 2 1.64 60.00 Si 18 Menor Novio (a) Si Condones A veces 16 1,617
M V 19.8 Ciudad 3 2 3 1.65 66.00 Si 15 Misma edad Amigo (a) No 99 Siempre 2 1,632
M V 21.8 Ciudad 2 2 3 1.73 75.00 Si 17 Mayor Novio (a) Si Condones Siempre 3 1,716
M V 20.9 Ciudad 2 1 4 1.78 68.00 Si 18 Misma edad Novio (a) Si Condones Siempre 2 1,771
M V 24.5 Ciudad 1 1 2 1.75 66.00 No 1,697
M V 25.0 Ciudad 4 3 5 1.65 66.50 Si 17 Mayor Novio (a) No Retiro A veces 4 1,614
M V 29.5 Ciudad 6 6 4 1.76 72.00 Si 21 Mayor Amigo (a) Si Condones A veces 3 1,729
M V 30.6 Ciudad 2 1 3 1.74 70.00 Si 18 Misma edad Novio (a) Si Condones A veces 5 1,725
Estat_m Peso_corp Peri_cint Est_sent Alt_rod Peri_cad
1.55 36.00 548 814 422 790
1.59 63.50 920 822 444 982
1.57 47.00 680 804 440 860
1.54 54.00 749 804 424 945
1.55 58.50 650 819 434 1,000
1.56 43.00 630 824 430 835
1.52 48.50 723 809 448 939

1.53 54.00 680 826 405 940
1.54 69.00 860 830 404 1,077
1.59 44.00 623 844 425 883
1.52 52.00 680 797 439 990
1.67 75.00 845 871 465 1,054

1.51 48.00 712 784 425 907
1.49 51.50 853 801 404 921
1.63 46.00 620 841 456 850
1.63 64.50 823 871 479 986
1.68 65.00 823 869 454 1,032
1.59 45.00 649 851 423 865
1.52 48.50 679 794 421 885
1.50 47.00 660 791 416 802
1.48 41.00 640 765 430 830
1.60 48.00 667 808 452 894
1.51 46.00 632 841 396 930
1.58 56.00 740 805 442 960
1.56 53.00 705 829 451 915
1.47 65.00 903 801 430 998
1.54 46.00 671 838 425 870
1.52 41.50 650 804 426 860
1.56 46.00 706 821 452 864
1.58 64.50 866 801 452 994
1.72 62.00 800 920 485 1,010

1.51 68.00 840 750 441 1,084
1.53 53.50 775 821 414 920
1.57 49.50 695 825 451 880
1.58 68.00 850 845 424 1,030
1.54 51.00 688 826 439 841
1.61 47.00 656 830 454 863
1.64 58.50 743 859 458 982
1.74 65.50 745 931 481 950
1.81 71.00 774 971 483 1,014
1.66 89.00 997 857 499 1,097
1.67 62.50 850 878 434 1,020
1.78 76.50 897 917 528 1,003
1.62 54.50 700 831 484 857
1.79 90.50 1,050 926 501 1,069
1.62 52.00 770 840 495 860
1.63 60.50 755 892 464 914
1.72 71.50 846 861 512 973
1.77 68.50 857 895 525 983
1.70 71.00 911 885 504 1,023
1.61 55.00 755 839 469 907
1.73 65.50 810 904 491 932
1.73 66.00 815 910 495 927
1
Curso: Estadística
Práctica I: Diseño de base de datos en SPSS
Elaboró: José Luis Castrejón Caballero
El objetivo de esta práctica es que el alumno presentar un panorama general del
uso del SPSS. Ilustraremos el uso del programa creando una base de datos
relacionada con la cedula que se anexa a la práctica. Se utiliza la versión 15 en
español.
I. El ambiente de SPSS.
La pantalla inicial del SPSS se presenta en la figura siguiente. Esta pantalla
corresponde al editor de datos, es decir donde podremos observar la información
que estaremos analizando. Las columnas identifican las variables y los renglones
corresponde a los casos. En la parte superior podemos observar el menú principal:
Archivo, Edción, Ver, Datos,..., Ventana, ?. Los iconos de la parte inferior de
este menú corresponden a instrucciones que uno puede llamar con sólo dar clic en
la figura correspondiente.
En la ventana inferior se pueden apreciar dos pestañas: Vista de datos que se

encuentra activada y Vista de variables que aparece inactiva. El primer paso
para elaborar una base de datos consiste en definir los nombres y características
2
de las variables a utilizar, lo cual podemos realizar dando clic en la pestaña
Variable View, con lo cual aparece la siguiente pantalla.
La primera columna (Nombre) corresponde al nombre de la variable; a diferencia

de versiones anteriores en ésta se permiten nombres que pueden exceder 8
caracteres pero que no debe contener espacios ni símbolos como $, %, &, /, etc.
Lo que si puede utilizarse es el guión bajo (_). La segunda columna (Tipo),
corresponde al tipo de variable que puede ser numérica, alfanumérica o carácter
(cadena), fecha, entre otras. Anchura permite definir la anchura de la variable, es
decir el espacio máximo que ocupará el dato que será almacenado en esta
variable. El número de decimales (Decimales) a utilizar (cuando la variable es
numérica) corresponden se define en la siguiente columna. La columna Etiqueta
permite especificar una identificación a la variable que puede ser el nombre
completo de la variable en la cédula o encuesta. Esta etiqueta puede contener
espacios y cualquier símbolo. La columna Valores permite definir el nombre de las
categorías en las variables cualitativas. La columna Perdidos permite definir los
valores que toma una variable cuyo dato es perdido. Otra opción es no asignar
ningún valor a los datos perdidos con lo que el programa denota con un punto en
3
lugar del dato. Columnas se refiere al ancho de la columna donde esta definida la
variable. La alineación (centrada, derecha o izquierda) de los datos en la columna
de la variable correspondiente se define con la opción Alineación. Algunos
análisis estadísticos se realizan para determinados tipos de variables, por lo que es
conveniente definir en la columna Medida si se trata de una variable cuantitativa
(Escala), Ordinal o Nominal.
Ahora se ilustrará con el diseño de la base correspondiente a la cédula anexa.
Aunque no está numerada como item o pregunta, el folio es la primera variable. Se
supone que la cédula no se aplica a más de 1000 personas, por lo que esta
variable la podemos definir con su nombre folio y con un ancho de 3, sin
decimales, y con una etiqueta que diga Folio de la cédula. La pantalla
correspondiente queda como se muestra en la figura siguiente:
La variable sexo tiene dos posibles valores F para las mujeres y M para los
hombres. Convendremos la siguiente codificación: 1=Femenino, 2=Masculino. Por
lo tanto el nombre de la variable será sexo, será numérica de ancho 2, con 0
decimales y la etiqueta será Sexo del individuo. Al introducir estos valores y
dándole clic en la columna Valores, y enseguida en el botón se muestra la
siguiente pantalla:
4
El cuadro gris con tres puntos es un símbolo usado por SPSS que indica que
existe un menú al dar clic en él. Realizando esta acción nos queda el siguiente
menú:
En Valor se introduce el valor numérico o código y en Etiqueta el significado de
ese código. Hay que dar clic en el botón Añadir para adicionar la codificación. En
nuestro caso tenemos 1=Femenino y 2=Masculino. Por lo que debe quedar como
se ve en el siguiente cuadro:
5
Los botones Cambiar y Eliminar se utilizan en el caso de cometer algún error en

la definición de las categorías. Dar clic en Aceptar para regresar a la ventana de
Vista de variables
De manera similar definimos la variable turno, la cual la dejamos numérica con
ancho 2, 0 decimales, con etiqueta Turno en la ENAH, y codificamos
1=Matutino, 2=Vespertino. Nos queda la siguiente pantalla:
Es el momento de guardar el archivo en disco. Se puede guardar dando clic en el
icono , seleccionando la carpeta y dándole un nombre, por ejemplo: cedula

estadística. Se recomienda guardar cotidianamente para no perder demasiada
información por fallas de energía o del equipo de cómputo.
La siguiente variable es el lugar de nacimiento, que tendrá como nombre
l_nacimiento, daremos clic en
el campo Tipo para cambiar a
Cadena, ya que se capturará el
nombre del estado tal cual,
tendrá un ancho de 35, y como
Etiqueta le pondremos Lugar
de nacimiento. Aunque esta
variable es categórica, tal y
como la hemos definido no tiene Valores.
6
La variable Fecha de
Nacimiento tendrá por
nombre f_nacimiento,
la definiremos como tipo
Fecha y con formato dd-
mmm-yyyy, dando clic en
la celda correspondiente
a la columna Tipo y
seleccionando Fecha como se muestra en la figura de junto. En este caso la
Anchura se define automáticamente de 11 espacios, por lo que el ancho de c
Columnas deberá tener al menos esta longitud.
La pregunta 5 de la cédula es conocida como lugar de socialización es una variable
categórica, la cual llamaremos lug_soc y tendrá por etiqueta Lugar de
socialización, con los códigos 1=Rancho, 2=Pueblo y 3=Ciudad.
La variable número de hijos de tu mamá (hijos_mama) es cuantitativa discreta,
por lo tanto es numérica, sin decimales, la definiremos con ancho 2 y la etiqueta
será el enunciado de la pregunta; no tiene Valores ya que no tiene categorías. La
variable paridad (lugar que ocupas entre los hijos de tu mamá) es similar a la
anterior.
La variable autopercepcion tiene que ver con la figura o silueta seleccionada de
un total de nueve posibilidades. Es una variable categórica ordinal y le pondremos
como etiqueta Figura seleccionada.
Las variables estatura y peso autodefinidas las llamaremos estatura_auto y
peso_auto, son cuantitativas, las definiremos con dos decimales. La primera
parte de la cédula queda definida como se muestra en la siguiente figura.
7
Ejercicio: Completar el diseño de la base de datos, con la parte de sexualidad y

antropometría y capturar la información contenida en las hojas anexas.
Folio:
ESCUELA NACIONAL DE ANTROPOLOGÍA E HISTORIA

CÉDULA PERCEPCIÓN CORPORAL
CURSO: ESTADÍSTICA (2008)
1. Sexo F M 2. Turno M V
3. Lugar de nacimiento (Estado):
4. Fecha de nacimiento:
día mes año
5. Los primeros 10 años de tu vida los pasaste en:

1) Un rancho 2) Un pueblo 3) Una ciudad
6. ¿Cuántos hijos tuvo o ha tenido tu mamá?:
7. ¿Qué lugar ocupas entre los hijos de tu mamá?:
8. De acuerdo a tu sexo, considera las nueve siluetas que se presentan a

continuación ¿cuál es la que más representa la tuya? Táchala
9. ¿Cuál es tu estatura actual (metros)?:
10. ¿Cuál es tu peso actual (kg)?:

Folio:
ESCUELA NACIONAL DE ANTROPOLOGÍA E HISTORIA

CÉDULA SEXUALIDAD Y ANTROPOMETRÍA
CURSO: ESTADÍSTICA (2008)
11. ¿Has tenido relaciones sexuales? 1) Sí 2) No
12. ¿A qué edad tuviste tu primera relación sexual?
13. La persona con la que tuviste tu primera relación sexual era:

1) De tu misma edad 2) Mayor que tú 3) Menor que tú
14. ¿Qué relación tenías con la persona con la que tuviste tu primera relación
sexual?
1) Novio(a) 2) Esposo(a) 3) Amigo(a) 4) Conocido(a)
5) Prostituto(a) 6) Familiar 7) Otra relación
15. En tu primera relación sexual ¿tú o tu pareja

1) Sí 2) No
hicieron algo para evitar tener un embarazo?
16. ¿Qué fue lo que hicieron para evitar un embarazo?

2) Pastillas de anticoncepción de
1) Pastillas 3) Inyecciones
emergencia
4) Dispositivo 5) Condones 6) Óvulos, espumas, jaleas
7) Ritmo 8) Retiro 9) Otro
17. ¿Cuándo tienes relaciones sexuales acostumbras usar alguno de los métodos
anteriores para evitar un embarazo?
1) Siempre 2) A veces 3) Nunca
18. ¿Durante toda tu vida con cuántas personas

diferentes has tenido relaciones sexuales?
DATOS ANTROPOMÉTRICOS
Estatura total: Estatura sentado:
Peso corporal: Altura de rodilla:
Perímetro de cintura: Perímetro de cadera:
Estadística para antropólogos físicos 1
Estadística
Práctica II: Construcción de variables e índices y estadística descriptiva con SPSS
Elaboró: José Luis Castrejón Caballero
La práctica utiliza la base de datos contenida en el archivo cedula estadistica.sav creada en la
práctica I, y utiliza la versión 15 del SPSS en español.
Edad exacta
A) A partir de la variable fecha de nacimiento y considerando que la fecha de toma de
información fue el 16 de enero del 2008 determinar la edad exacta de cada elemento de la
muestra.
Razonamiento: Si determinamos el número de días entre las dos fechas y dividimos esta cifra
entre 365 tendremos una aproximación a la edad exacta. En SPSS existe una función que
determina el número de días entre dos fechas, llamada CTIME.DAYS(time), donde time es un
intervalo de tiempo, que en nuestro caso es la diferencia entre la fecha de toma y la fecha de
nacimiento. Por lo tanto el procedimiento será el siguiente:
1. Crear una variable tipo fecha llamada fechat, tipo fecha, que tenga el valor 16-01-2008 en
todos los casos. Lo haremos en el ambiente de variables (Variable View) insertando la nueva
variable después de la fecha de nacimiento (fecha_nac) lo cual puede realizarse colocándonos
después de esta variable y después seleccionar del menú Edición la opción Insertar variable o
rápidamente con el icono . Después de esta variable insertaremos una nueva variable
llamada edad, numérica con dos decimales, la ventana de variables debe quedar como sigue:
2. En el ambiente Vista de Datos, llenamos todas las celdas de la nueva variable fechat con el
valor de la fecha de toma: 16-01-2008 (usando copiar, pegar), quedando como se muestra en la
figura siguiente:
3. Utilizaremos las
variables fechat y f_nac
con la función
CTIME.DAYS. Damos
clic en el menú
Transformar luego en
Calcular variable, tal
como se muestra en la
figura de al lado.
En el recuadro resultante
introducir el nombre edad
en el espacio de Variable
de destino.
Del Grupo de funciones
seleccionamos Extracción
de duración del tiempo y
de las Funciones y
variables especiales
seleccionamos la función
CTIME.DAYS,
introduciéndola en el
espacio de Expresión
numérica, mediante el
botón correspondiente,
cambiando el argumento
figura, escribiendo los
paréntesis cono se indica.
4. Dar clic en el botón . Si el programa pregunta sobre cambiar la variable existente dar
clic en el botón . En la ventana de Vista de datos pueden apreciarse los valores de la
variable edad.
Índice de Masa Corporal

El Índice de Masa Corporal (IMC) es una de las medidas más usadas en estudios
antropométricos y de nutrición, siendo uno de los indicadores del nivel de obesidad. La
expresión matemática, debida al físico de origen belga Quetelet, es:
peso(kg )
IMC =
estatura 2 (m)
El antropólogo físico mexicano Luis Vargas ha propuesto la siguiente clasificación de los
valores del índice, por lo que utilizaremos los valores de categoría indicados en este ejercicio.
Valor Categoría IMC
1 Emaciación < 15
2 Bajo peso 15 - 18.9
3 Normal 19 - 24.9
4 Sobrepeso 25 - 29.9
5 Obesidad 30 - 39.9
6 Obesidad severa > 40
Para calcular este índice con los datos antropométricos que estamos trabajando, en primer lugar,
tenemos que convertir la estatura a metros (está en milímetros). Para lograrlo dividiremos la
estatura entre 1000. En el menú (Transformar, Calcular variable) introducimos esta
operación como sigue, después de dar clic en el botón para borrar la operación
anterior.
Nombre de la nueva
variable.
Expresión
matemática.
Ahora estamos en
condiciones de calcular el
IMC. En el mismo menú,
introducimos la expresión
matemática, llamaremos
imca a esta nueva variable.
El botón es el operador
que permite elevar a
cualquier potencia un valor
determinado.
Nombre de la nueva variable.
Expresión matemática.
Lo que sigue es clasificar los valores del IMC según la propuesta de Luis Vargas y que hemos
explicitado en el cuadro anterior. Para lograr esto construiremos una nueva variable llamada
CIMC la cual tendrá valores que van de 1 a 6 según el valor del IMC.
Utilizaremos de nuevo la opción Transformar–Calcular como se muestra en la siguiente

figura:
Para definir los valores

correspondientes al
código 1 daremos clic
en el botón Si…
En el cuadro de
dialogo resultante,
primero activamos la
opción Incluir si el
caso satisface la
condición:
En el cuadro pasamos
la variable imca y
escribimos la
condición usando los
botones de
calculadora.
Dar clic en
Continuar.
Dar clic en Aceptar.
Repetimos el
procedimiento para
definir el código 2 como
se muestra en la figura.
Daremos clic en el
botón Si… para
modificar la condición.
Ahora la nueva
condición se escribe
como se indica en el
cuadro.
El símbolo & indica
el conector lógico y,
es decir que se
cumple al mismo
tiempo. Para la opción
o utilizaremos el
símbolo |
De una manera
similar se construyen
los códigos 3 a 6,
situación que queda
como ejercicio para el
estudiante.
Similar a lo que se hizo en la práctica 1, en el ambiente de Vista de variables se pueden definir

las etiquetas de las
variables que hemos
construido hasta ahora y
los valores o códigos de
la nueva variable CIMC,
lo que se vería como
sigue:
Las nuevas variables
construidas tendrán como
etiqueta Estatura en
metros, Índice de masa
corporal
antropométrico y
Clasificación del índice
de masa corporal
antropométrico.
Índice Cadera-Cintura
Uno de los indicadores más usados para determinar riegos cardiovasculares por problemas de
obesidad es la relación entre el perímetro de la cintura y el de la cadera cuya expresión
matemática es:
ICC=
Los valores del ICC se clasifican de manera diferente según el sexo. La siguiente tabla es una
propuesta de la OMS en función del riego de padecer una enfermedad de tipo cardiovascular:
Tipo de riesgo
1= Bajo 2 = Elevado 3 = Muy elevado
Hombres <0.90 0.90 a 1.00 >1.00
Mujeres <0.80 0.80 a 0.85 >0.85
Tarea
1. Calcular el valor del ICC
2. Elaborar una variable que contenga la clasificación según sea el sexo, llamarla CICC.
Estadística descriptiva
En este apartado obtendremos algunos estadísticos descriptivos con el auxilio del SPSS.
1. Obtendremos las tablas de
frecuencias de las variables sexo,
turno e imca.
En el opción Analizar del menú
principal seleccionar
Estadísticos Descriptivos y
luego Frecuencias, apareciendo
al cuadro que se muestra a un
lado. Seleccionaremos las
variables Sexo, Turno y CIMC
pasándolas al cuadro de
Variables, como se muestra en la
figura. Dar clic en el botón
.
La pantalla de resultados muestra, entre otros los siguientes cuadros:
Sexo
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos Femenino 41 62.1 62.1 62.1
Masculino 25 37.9 37.9 100.0
Total 66 100.0 100.0
Turno
Válidos Matutino 39 59.1 59.1 59.1
Vespertino 27 40.9 40.9 100.0
Total 66 100.0 100.0
Clasificación de índice de masa corporal antropométrico
Válidos Bajo peso 7 10.6 10.6 10.6
Normal 40 60.6 60.6 71.2
Soberpeso 16 24.2 24.2 95.5
Obesidad 3 4.5 4.5 100.0
Total 66 100.0 100.0
Tablas cruzadas
Se desea establecer si existe o no relación entre entre las variables sexo y ¿has tenido relaciones
sexuales? En SPSS utilizaremos el menú Analizar, de donde seleccionaremos la opción
Estadísticos Descriptivos y luego Tablas de contingencia
En el cuadro Filas introducir la variable
sexo y en el de Columnas la variable que
tiene que ver con la primera relación
sexual como se muestra en la figura que se
presenta a un lado.
Dar clic en el botón y
seleccionar de la opción Porcentajes la
opción Fila para obtener porcentajes por
renglón, como se muestra en el cuadro de
abajo. Dar clic en Continuar y después en
Aceptar.
Se obtiene la siguiente tabla:

Tabla de contingencia Sexo * ¿Has tenido relaciones sexuales?
Obsérvese que el porcentaje
de hombres que declararon ¿Has tenido
que ya han tenido relaciones relaciones sexuales?
sexuales es mayor que el de Sí No Total
Sexo Femenino Recuento 28 13 41
mujeres.
% de Sexo 68.3% 31.7% 100.0%
Masculino Recuento 22 3 25
% de Sexo 88.0% 12.0% 100.0%
Total Recuento 50 16 66
% de Sexo 75.8% 24.2% 100.0%
Gráficas de barras
Realizaremos una gráfica de barras para cada sexo de la variable ¿Durante toda tu vida con
cuántas personas diferentes has tenido relaciones sexuales?
En primer lugar utilizaremos la opción
Segmentar archivo de la opción Datos
del menú principal. Esta opción nos
permite realizar las mismas instrucciones
para los grupos definidos en la variable;
en nuestro caso usaremos la variable
sexo lo que nos permitirá que todas las
instrucciones que hagamos mientras este
activada esta opción se realice para
hombres y mujeres por separado.
Después de seleccionar la opción
Comparar los grupos, se introduce la
variable sexo como se muestra en la figura.
Para realizar la gráfica de barras, de la opción Gráficos

seleccionamos Cuadro de diálogo antiguos y escogemos
Barras apareciendo la figura que se muestra a la izquierda.
Dejamos la opción Simple seleccionada por default y damos
clic en el botón Definir, obteniendo el cuadro que se muestra
abajo. Seleccionamos la opción % de casos e introducimos la
variable de interés en el cuadro Eje de categorías.
Después de dar clic en

Continuar y luego en
Aceptar, se obtienen las
gráficas que se presentan a
continuación.
40.0% 40.0%
30.0% 30.0%
Porcentaje
Porcentaje
20.0% 20.0%
10.0% 10.0%
0.0% 0.0%
1 2 3 4 5 6 7 15 1 2 3 4 5 6 10 17
Durante toda tu vida ¿con cuántas personas diferentes has tenido Durante toda tu vida ¿con cuántas personas diferentes has tenido
relaciones sexuales? relaciones sexuales?
Media, mediana, moda, desviación estándar, coeficientes de asimetría y curtosis.

En esta sección ejemplificaremos como obtener las medidas de tendencia central y de dispersión
para variables cuantitativas. Ilustraremos las técnicas para el caso de las variables estatura total
y peso para cada sexo.
Recordemos que en el apartado anterior dejamos activa la opción Segmentar archivo por lo
cual los resultados que se obtengan se repetirán para mujeres y hombres.
En el opción Analizar del menú

principal seleccionar
Estadísticos Descriptivos y
enseguida Frecuencias,
apareciendo al cuadro que se
muestra a un lado.
Seleccionaremos las variables
Peso Corporal y Estatura total
pasándolas al cuadro de
Variables, como se muestra en
la figura.
Desactivar la opción Mostrar
tablas de frecuencias.
Dar clic en el botón
para seleccionar las medidas solicitadas.
En el menú resultante
seleccionar las medidas
figura. Dar clic en
Continuar y luego en
Aceptar. Se obtiene el
cuadro con los resultados
por sexo que se muestra
abajo.
Estadísticos
Sexo Estatura total Peso corporal

Femenino N Válidos 41 41
Perdidos 0 0
Media 1576.39 57.300
Mediana 1571.00 57.500
Moda 1563a 44.4a
Desv. típ. 50.010 11.5560
Asimetría .309 .883
Error típ. de asimetría .369 .369
Curtosis .094 1.204
Error típ. de curtosis .724 .724
Masculino N Válidos 25 25
Perdidos 0 0
Media 1700.84 68.712
Mediana 1699.00 65.600
Moda 1675 53.1a
Desv. típ. 65.987 12.7657
Asimetría .426 .925
Error típ. de asimetría .464 .464
Curtosis .320 .220
Error típ. de curtosis .902 .902
a. Existen varias modas. Se mostrará el menor de los valores.
Gráficas de caja
Recordemos que las gráficas de caja se construyen con base en los cuartiles y permiten
comparar dos o más grupos respecto a los valores de una variable cuantitativa. Ilustraremos el
uso del SPSS creando una figura que permita comparar el IMC respecto al sexo y turno de los
alumnos.
En primer lugar desactivaremos la

opción Segmentar archivo. Del
menú principal seleccionamos
Datos y luego Segmentar archivo.
Ahora activamos la opción
Analizar todos los casos, no crear
los grupos, como se muestra en la
figura de al lado. Dar clic en
Aceptar.
Para realizar la gráfica, del menú Gráficos elegimos la opción Cuadros de dialogo antiguos y
Diagramas de caja. Seleccionamos el tipo Agrupado y damos clic en el botón , con lo
cual aparece la ventana que se ve abajo a la derecha, donde introducimos las variables como se
indica en la ventana. Dar clic en Aceptar.
La gráfica que se obtiene es la siguiente:
Turno
35.00
Matutino
Vespertino
30.00
imca
25.00
20.00
15.00
Femenino Masculino
Sexo
Tarea
3. Realiza una tabla de frecuencias para las variables: En tu primera relación sexual ¿tú o
tu pareja hicieron algo para evitar tener un embarazo? ¿Qué fue lo que hicieron para
evitar un embarazo? Y Clasificación del índice de masa corporal.
4. Realiza una gráfica de barras para la variable Clasificación del índice cadera-cintura
(CICC) para todos los casos.
5. Realiza una tabla cruzada entre las variables Sexo del individuo y La persona con la que
tuviste la primera relación sexual era.
6. Realiza una gráfica de caja para la variable ICC comparando por sexo.
7. Realiza gráficas de caja para las variables Estatura autopercibida y Peso autopercibido
comparando por sexo.
8. Calcula media, mediana, mínimo, máximo y desviación estándar comparando por sexo
para las variables altura de rodilla, estatura sentado, peso corporal, índice de masa
corporal e índice cintura-cadera.
9. Realiza histogramas para las variables estatura total y estatura sentado para cada sexo.
10. Considerando la estatura total como variable dependiente y la altura a la rodilla como
variable independiente:
a) Graficar los datos en un diagrama de dispersión. ¿Se observa una tendencia lineal en
los datos?
b) Calcular el coeficiente de correlación lineal. Interpretar
c) Ajustar el modelo de regresión lineal. Interpretar
d) ¿Es un modelo adecuado? Calcular R 2 .

Apuntesestadistica2009 PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apuntesestadistica2009 PDF

Hochgeladen von

Copyright:

Verfügbare Formate

ESTADÍSTICA

1. ELEMENTOS BASICOS DE PROBABILIDAD

1.1.1. Probabilidad clásica o “a priori”

ENFOQUE CLÁSICO EXPRESIÓN

1.1.2. Probabilidad frecuentista o “a posteriori”

El enfoque anterior, empero, resulta inoperante cuando la probabilidad de los eventos

ENFOQUE FRECUENTISTA EXPRESIÓN

1.1.3. Probabilidad subjetiva o “bayesiana”

ENFOQUE SUBJETIVO EJEMPLOS DE EXPRESIÓN

2.1. Espacio muestral y eventos

Revisemos ahora algunos conceptos básicos de probabilidad ejemplificándolos con el

a) Eventos simples: Son aquellos que los que se da sólo un resultado.

b) Eventos compuestos: Son eventos que comprenden más de un resultado

P = {2,4,6} Donde observamos que el evento P

Dos eventos particulares, deben señalarse con más atención:

Eventos ajenos (mutuamente excluyentes): Son eventos que no tienen elementos

Finalmente, se conoce como σ-álgebra al conjunto de todos los subconjuntos del

a) Defina el espacio muestral de dicho fenómeno aleatorio.

De entrada tenemos que el espacio muestral deL fenómeno aleatorio “extracción de

Finalmente determinemos el número y tipo de los siguientes eventos:

• Sea A el evento en que sale un as de corazones:

, El evento “sale un as de corazones” tiene sólo un elemento, por ende es un

• Sea D el evento en que se obtiene un diez de diamantes:

, El evento “se obtiene un diez de diamantes” contiene un elemento, por lo cual

• Sea E el evento en que se extrae una carta de espadas:

E = {Α♠, 2♠, 3♠, 4♠,5♠, 6♠, 7♠,8♠, 9♠,10♠, J♠,Q♠,R♠} ⇒ # E = 13

• Sea C el evento en que sale un cuatro:

C = {4♦, 4♥, 4♣, 4♠} ⇒ # C = 4

, El evento “sale un cuatro” comprende 4 elementos. Debido a ello es un

• Sea U el evento en que se obtiene una carta con un uno:

• Sea J el evento en que se extrae un comodín:

• Sea P el evento en que sale un diamante, un corazón, un trébol o una

, El evento “sale un diamante, un corazón, un trébol o una espada” es un

• Sea Q el evento en que se obtiene una reina:

T = { A♣, 2♣, 3♣, 4♣,5♣, 6♣, 7♣,8♣, 9♣,10♣, J♣,Q♣,R♣,} ⇒ # T = 13

, Tanto el evento Q como el T tienen más de un elemento (4 y 13,

• Sea R el evento en que sale una carta de palo rojo:

⎧ A♣, 2♣, 3♣, 4♣,5♣, 6♣, 7♣,8♣, 9♣,10♣, J♣,Q♣,R♣, ⎫

, Si bien estos eventos son también COMPUESTOS (ya que comprenden 13

PROPIEDADES ELEMENTALES DE LA PROBABILIDAD

Ya revisadas las diferentes formas que existen para calcular la probabilidad de un

1. La probabilidad de cualquier evento E P(E) ≥ 0

1. Defina, justificando su respuesta, el enfoque necesario para asignar

• Se está apostando por color en una ruleta europea (que además de 36

Dado que los resultados de la ruleta son equiprobables, podemos utilizar el

⎧0,1, 2, 3, 4, 5, 6, 7,8, 9,10,11,12,13,14,15,16,17,18,19, 20, ⎫

• Se lanza una moneda. Cuál es la probabilidad de que caiga “sol” si en 80 de

La notable diferencia de resultados en ensayos anteriores nos indica que la

• Cuál es de que uno infante padezca una enfermedad alérgica si:

Si bien podrían averiguarse las frecuencias relativas de dichos eventos, el

• ¿Cuál es la probabilidad de que, en un juego de perinola, alguien o todos

Bajo el supuesto de que dicha perinola no está trucada, podemos aplicar el

• ¿Cuál es la probabilidad de que una denuncia presentada ante la Procuraduría

Samuel Ibarra Vargas, titular de la Fiscalía Especial para la Atención de Delitos

, Por tanto, la probabilidad de que una denuncia se relacione a la tala es de 38 a

• ¿Cuál es la probabilidad de que llueva durante las ceremonias de inauguración

2. Compruebe con ayuda de los siguientes fenómenos las reglas de probabilidad:

a) El lanzamiento de una moneda balanceada.

Definamos primero el espacio muestral de ambos eventos:

MONEDA Ω = {águila, sol} #Ω = 2

Finalmente, elijamos o estipulemos algunos eventos para comprobar la propiedad

Ya estudiados los enfoques y axiomas de la teoría probabilística, en este capítulo

EXPRESIÓN PARA ASIGNAR