Sie sind auf Seite 1von 232

ESTADÍSTICA Y

PROBABILIDAD
JUSTIFICACIÓN DEL ESPACIO
ACADÉMICO
Los profesionales de Ingeniería Industrial deben en su
profesión tomar decisiones que requieren de análisis de
un conjunto de información disponible o que deben
obtener, para poder elegir entre diferentes alternativas.
En estos aspectos es en donde la Estadística Descriptiva
presenta un apoyo por cuanto presenta los
procedimientos para recolectar datos necesarios y su
posterior procesamiento, interpretación y análisis. De
otra parte, en modelos que se utilizan en diferentes áreas
de la Ingeniería Industrial (Investigación de Operaciones,
Logística, Control de calidad, Producción) es necesario
tener un buen conocimiento de los modelos
probabilísticos, parte integrante de este curso.
LOS PROPÓSITOS

• Adquirir un conocimiento preciso de las bases


necesarias de la Estadística Descriptiva y de las
probabilidades para su aplicación en la vida
profesional, como herramienta determinante en la
toma de decisiones.
• El curso de Estadística pretende desarrollar en los
estudiantes las competencias propias del área, para
poder realizar un análisis estadístico básico como la
media, la varianza y la desviación estándar a partir de
un conjunto de datos dado, al igual podrá describir
probabilísticamente una distribución de datos,
identificando el tipo de variable (discreta o continua).
OBJETIVO GENERAL

• Conocer los principales métodos de la


Estadística Descriptiva para recolectar,
resumir, interpretar y analizar información
numérica y de los fundamentos de la teoría de
probabilidades y de algunos modelos
probabilísticos.
OBJETIVOS ESPECÍFICOS
• Análisis de datos: Representar datos en forma gráfica y tabular.
• Determinar de forma manual las medidas de posición y de
dispersión. Interpretar el resumen de las estadísticas que brinda un
software.
• Determinar la probabilidad de un evento en ejercicios
seleccionados.
• Operar con las principales distribuciones de variables discretas.
• Operar con las principales distribuciones de variables continuas.
• Determinar funciones generadoras de momentos.
• Operar con múltiples variables aleatorias discretas y continuas.
• Conocer los principales modelos de probabilidades para variables
aleatorias discretas y variables aleatorias continuas.
• Utilizar las funciones de distribución conjuntas.
LA ESTADÍSTICA

La estadística, en general, es la ciencia que


trata de la recopilación, organización,
presentación, análisis e interpretación de
datos numéricos con el fin de realizar una
toma de decisión más efectiva.
HISTORIA DE LA ESTADÍSTICA
Historia.
DIVISIÓN DE LA ESTADÍSTICA

• Estadística • Estadística
Descriptiva Inferencial
ESTADÍSTICA DESCRIPTIVA:

• Consiste en la presentación de datos en


forma de tablas y gráficas. Esta comprende
cualquier actividad relacionada con los datos
y está diseñada para resumir o describir los
mismos sin factores pertinentes adicionales;
esto es, sin intentar inferir nada que vaya
más allá de los datos.
ESTADÍSTICA INFERENCIAL:
• Se deriva de muestras, de observaciones
hechas sólo acerca de una parte de un
conjunto numeroso de elementos y esto
implica que su análisis requiere de
generalizaciones que van más allá de los
datos. La Estadística Inferencial investiga
o analiza una población partiendo de una
muestra tomada.
MÉTODO ESTADÍSTICO
• El conjunto de los métodos que se utilizan para medir las
características de la información, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el
máximo de información, es lo que se llama métodos
estadísticos. Los métodos de análisis para la información
cuantitativa se pueden dividir en los siguientes siete pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
7. Toma de decisiones.
APLICACIÓN DE LA ESTADÍSTICA
• La estadística prácticamente se puede
utilizar en todas las actividades del ser
humano, donde se presenta con mayor
incidencia es en: Economía, Agricultura,
Informática, Prevención de Riesgos,
Control de Medio Ambiente, Química
Analítica, Medicina, Ingeniería,
Psicología, etc.
DEFINICIONES BÁSICAS
• LA POBLACIÓN: es el conjunto de todos los elementos
sobre los que se quiere realizar un estudio estadístico.
• LA MUESTRA: es una parte representativa de la población
que se elige para hacer el estudio estadístico.
• VARIABLE: Característica de la población que se analiza en
el estudio estadístico. Hay dos tipos de variables
estadísticas:
 Cuantitativas, (variables) son los que se pueden
expresar con números (estatura de todas la personas
de la U.) se pueden describir por medio números.
 Cualitativas, (atributos) son los que no se pueden
expresar con números (el estado civil, el sexo, la raza,
etc.) se pueden describir por medio de palabras.
VARIABLES CUANTITATIVAS
• Datos Discretos: Son aquellos que surgen por el
procedimiento de conteo. Es decir, los datos
discretos toman valores enteros (ej., el número
de hijos por familia; el número de automóviles
que pasan por una avenida en una hora, etc.).

• Datos Continuos: Son aquellos que surgen


cuando se mide alguna característica. Es decir,
toman al menos teóricamente cualquier valor
dentro de un intervalo (ej., el peso, la estatura, la
tensión arterial de las personas, etc.)
EJERCICIOS
1. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes caracteres
estadísticos estudiados en los carros de cierta
marca:
a) Modelo de carro
b) Color de su carrocería
c) Potencia de su motor
d) Consumo medio de gasolina en 100 km
e) Número de piezas
EJERCICIOS
2. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes
caracteres estadísticos estudiados en una
fábrica de tornillos:
a) La producción diaria de tornillos.
b) Las longitudes de los tornillos.
c) El color de los tornillos.
d) Las anchuras de los tornillos.
¿QUÉ ES UN DATO?
• Dato es una representación simbólica (numérica,
alfabética, etc.), un atributo o una característica
de una entidad. El dato no tiene valor semántico
(sentido) en sí mismo, pero si recibe un
tratamiento (procesamiento) apropiado, se
puede utilizar en la realización de cálculos o toma
de decisiones. Es de empleo muy común
prácticamente en cualquier disciplina científica.
• Un Conjunto de datos es una colección de datos
normalmente tabulada. Por cada elemento (o
individuo) se indican varias características.
FORMAS DE RESUMIR LOS DATOS
• Tablas
Tablas de frecuencias (distribución de frecuencias)
Frecuencias relativas (porcentaje del total)
• Gráficos
Histogramas
Polígonos de Frecuencias
Diagrama de Puntos
Diagrama de Cajas (Box plots) etc.
Diagrama de Pareto
DISTRIBUCIÓN DE FRECUENCIAS
• Es un método para clasificar, organizar y
resumir datos.

SÍMBOLOS:
TABLAS DE FRECUENCIAS
• Variables discretas:
Ejemplo: En un estudio con un grupo de 2.000 personas
que habían sido tratadas psicológicamente por problemas
de ansiedad, se desea preguntar a las mismas, cuántas
veces habían sufrido un ataque de ansiedad desde que
terminó el tratamiento recibido. Pero no se quiere
realizar una investigación exhaustiva, por lo cual se
selecciono una muestra de 20 personas. El resultado de
esta encuesta, se anota a continuación:

X1= 2 X6= 4 X11= 4 X16= 0


X2= 2 X7= 0 X12= 0 X17= 2
X3= 1 X8= 1 X13= 0 X18= 3
X4= 2 X9= 0 X14= 4 X19= 0
X5= 1 X10= 0 X15= 4 X20= 3
TABLAS DE FRECUENCIAS
• N=
• n=

Yi ni hi Ni Hi
0 7 35% 7 35%
1 3 15% 10 50%
2 4 20% 14 70%
3 2 10% 16 80%
4 4 20% 20 100%
n= 20 100%
• La siguiente es una muestra que representa un
estudio hecho en la ciudad de Bogotá, este se
realizó con fin de conocer la principal causa de
muerte en esta ciudad. ¿Cuál sería la principal
causa de muerte? ¿Con qué porcentaje?; ¿Cuál
sería la menor causa de muerte? ¿Con qué
porcentaje?; ¿Qué quiere decir N2? ¿Qué quiere
decir H3? 1 5 3 1 2 4 1 3 1 5
2 1 1 5 3 1 2 1 4 1
4 1 3 1 5 1 2 1 1 2
5 1 1 5 1 5 3 1 2 1
2 3 1 1 2 1 5 1 5 1
1 2 5 1 1 2 3 4 1 1
1 1 2 1 1 2 1 1 2 3
3 3 1 5 2 3 5 1 3 4
1 1 2 4 5 4 1 5 1 5
5 1 1 5 1 1 5 1 1 5
LOS GRÁFICOS ESTADÍSTICOS MÁS
UTILIZADOS SON:
• DIAGRAMA DE BARRAS, consiste en dibujar una
barra sobre cada uno de los datos con una altura
proporcional a la frecuencia absoluta o relativa. Si
en un diagrama de barras unimos los extremos
superiores de cada una obtenemos una línea
poligonal que se llama polígono de frecuencias
• EL DIAGRAMA DE SECTORES, es un círculo
dividido en sectores circulares de amplitudes
proporcionales a las frecuencias absolutas o
relativas
EJEMPLOS DE GRÁFICOS VARIABLES
DISCRETAS:
TABLAS DE FRECUENCIAS
• Variables continuas:
Tomamos como ejemplo una muestra de 20
alumnos a fin de conocer su peso en kilos:
1 67,9 6 56,4 11 50,2 16 47,4
2 61,6 7 75,3 12 80,2 17 78,7
3 64,4 8 65,8 13 68,5 18 43,5
4 62,6 9 72,3 14 61,1 19 59,0
5 47,2 10 58,3 15 68,8 20 99,5
PASOS PARA ELABORAR TABLA DE
FRECUENCIAS EN DATOS CONTINUOS
• Determinar el valor máximo y mínimo.
• Calcular el rango: R =Xmax - Xmin
• Introducir dos nuevos símbolos:
M = número de intervalos
C = amplitud del intervalo.
• Calcular:
Y´j-1 = Límite inferior del intervalo Y
Y´j = Límite superior del intervalo Y
Donde Y´j-1 - Y´j = C
Y´0 = Xmin Y´j-1 Y´j
Y´0 Y´1
Y´1 Y´2
Y´2 Y´3
Y´3 Y´4
Y´4 Y´5
• Calcular: frecuencia absoluta, relativa, etc.
PASOS
1. X MAX= 99,5
X MIN= 43,5
2. R= 55,9
3. n= 20
m= 5 5 < m < 16
4. C= 11,19 m= 1 + 3.3 log n
m= √n

Y´j-1 Y´j ni hi Ni Hi
1 43,54 54,73 4 20,0% 4 20,0%
2 54,73 65,92 8 40,0% 12 60,0%
3 65,92 77,11 5 25,0% 17 85,0%
4 77,11 88,30 2 10,0% 19 95,0%
5 88,30 99,49 1 5,0% 20 100,0%
RESPUESTA
Ejercicio
• En un barrio de Bogotá, en el año 2012, se entrevistó a
un cierto número de mujeres casadas nacidas entre los
años 1935 y 1944 y se les preguntó a qué edad
contrajeron matrimonio. A continuación se muestran
los datos correspondientes a 50 de estas mujeres:
Realizar tablas de frecuencias, con 6 intervalos.

15 17 25 15 16 11 15 13 12 10
15 14 16 14 17 13 14 20 29 19
16 18 10 18 12 11 20 34 13 22
19 14 17 16 16 15 12 24 25 9
21 15 13 23 24 10 10 16 14 18
FORMAS DE RESUMIR LOS DATOS
CONTINUOS
• Gráficos
Histogramas. Está formado por rectángulos cuyas
bases miden la amplitud de las clases y cuyas
alturas son proporcionales a las frecuencias
absolutas (o relativas, si es el caso).
Polígonos de Frecuencias. Si en un histograma
unimos los extremos superiores de cada una
obtenemos una línea poligonal que se llama
polígono de frecuencias
DIAGRAMA DE PARETO
El diagrama de Pareto, es una gráfica para organizar datos de
forma que estos queden en orden descendente, de izquierda a
derecha y separados por barras. Permite asignar un orden de
prioridades. El diagrama permite mostrar gráficamente el
principio de Pareto (pocos vitales, muchos triviales), es decir, que
hay muchos problemas sin importancia frente a unos pocos muy
importantes. Mediante la gráfica colocamos los "pocos que son
vitales" a la izquierda y los "muchos triviales" a la derecha.

Fuente: https://es.wikipedia.org/wiki/Diagrama_de_Pareto
LAS VENTAJAS DEL DIAGRAMA DE
PARETO
• Permite centrarse en los aspectos cuya mejora
tendrá más impacto, optimizando por tanto los
esfuerzos.
• Proporciona una visión simple y rápida de la
importancia relativa de los problemas.
• Ayuda a evitar que se empeoren algunas causas
al tratar de solucionar otras y ser resueltas.
• Su visión gráfica del análisis es fácil de
comprender y estimula al equipo para continuar
con la mejora.
Ejemplo
Número de
En una empresa textil se Factores
defectos
desea analizar el Seda 13
número de defectos en Algodón 171
los tejidos que fabrica. Tul 105
En la tabla siguiente se
Tafetán 7
muestran los factores
Raso 7
que se han identificado
como causantes de los Encaje 8
mismos así como el Lana 4
número de defectos Lino 9
asociado a ellos: Satén 11
Viscosa 9
Tul es un tejido ligero con estructura abierta, en forma de red
Tafetán es un tejido de seda 344
Raso es un tipo de ligamento empleado generalmente para realizar un
tejido de seda muy liso, pastoso y lustros
DIAGRAMA DE PARETO
Frecuancia
Número de Frecuencia Frecuancia
Factores relativa
defectos acomulada relativa
acomulada
De mayor
a menor
DIAGRAMA DE PARETO
Frecuancia
Número de Frecuencia Frecuancia
Factores relativa
defectos acomulada relativa
acomulada
Algodón 171 171 0,49709 0,49709
Tul 105 276 0,30523 0,80233
Seda 13 289 0,03779 0,84012
Satén 11 300 0,03198 0,87209
Lino 9 309 0,02616 0,89826
Viscosa 9 318 0,02616 0,92442
Encaje 8 326 0,02326 0,94767
Tafetán 7 333 0,02035 0,96802
Raso 7 340 0,02035 0,98837
Lana 4 344 0,01163 1,00000
344
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
Número de
Causas de reprobar una materia
personas
No entregar taller 153
No presentar parciales 213
No asistir a clase 87
No se estudia 372
Falta de empatía con el profesor 27
Desinterés por la materia 7
No participar activamente en clase 16
No se realiza un análisis crítico de los temas estudiados 34
Problemas de aprendizaje 6
MEDIDAS DE TENDENCIA
CENTRAL
• Media (aritmética, ponderada, geométrica,
armónica)

• Mediana

• Moda

• Cuartiles, deciles, percentiles


MEDIA ARITMÉTICA
• Datos originales: El índice de tendencia central
más utilizado es la media. Se define como la
suma de los valores observados, dividida por
el número de ellas. Se representa con la X, en
mayúsculas , con una barra horizontal encima.
Datos originales:

Calcula la media de los siguientes datos

14 25 14 8 22 14 14 14 13 21 15
MEDIA ARITMÉTICA
• Datos agrupados:

• Hallar la media de los ejercicios:


 En un estudio con un grupo de 2.000 personas…..
 Tomamos como ejemplo una muestra de 20…….
 En cierto barrio de Bogotá, en el año 2012, se
entrevistó….
MEDIA ARITMÉTICA PONDERADA

• Es una media aritmética que se emplea en distribuciones


de tipo unitario, en las que se introducen unos coeficientes
de ponderación, denominados ω , que son valores
i

positivos, que representan el número de veces que un valor


de la variable es más importante que otro.

• Ejemplo: un alumno de estadística I, obtuvo las siguientes


notas durante los tres cortes: 1º corte 2.3; 2º corte 3.1; y
3º corte 2.9; ¿cuál será la nota definitiva del este alumno?
MEDIA GEOMÉTRICA
• El empleo más frecuente de la media
geométrica es el de promediar variables tales
como porcentajes, tasas, números índices.
etc., es decir, en los casos en los que se
supone que la variable presenta variaciones
acumulativas.
Para datos originales

Para datos agrupados


EJERCICIO
DATOS ORIGINALES
• Suponga que tenemos 5 observaciones cuyos
valores son:
X1 = 3
X2 = 8
X3 = 9
X4 = 7
X5 = 6

Calcular la media geométrica.


EJERCICIO
DATOS AGRUPADOS
• Suponga que tenemos 10 observaciones cuyos
valores son:
X1 = 2
X2 = 6
X3 = 3
X4 = 3
X5 = 4
X6 = 2
X7 = 5
X8 = 4
X9 = 3
X10 = 2

Calcular la media geométrica.


MEDIA GEOMÉTRICA
𝑛−1 𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜
𝐺= −1
𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑝𝑟𝑖𝑛𝑐𝑖𝑝𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜

• Suponga que la población de un lugar en 1980


fue de 2 personas, y el número estimado para
1990 es 22. ¿Cuál fue el incremento porcentual
promedio anual estimado? R=27,09%

• Una producción se incrementó de 23,000


unidades en 1971 a 120.520 unidades en 1991.
Obtenga la media geométrica del incremento
porcentual anual. R=8,63%
MEDIA ARMÓNICA
• Obsérvese que la inversa de la media
armónica es la media aritmética de los
inversos de los valores de la variable. Se suele
utilizar para promediar variables tales como
productividades, velocidades, tiempos,
rendimientos, cambios, etc.
Para datos originales

Para datos agrupados


EJERCICIO
• Suponga que tenemos 10 observaciones cuyos
valores son:
X1 = 11
X2 = 13
X3 = 10
X4 = 12
X5 = 11

Calcular la media armónica.


EJERCICIO
DATOS AGRUPADOS
• Suponga que tenemos 10 observaciones cuyos
valores son:
X1 = 8
X2 = 4
X3 = 7
X4 = 4
X5 = 7
X6 = 8
X7 = 8
X8 = 6
Calcular la media armónica.
X9 = 6
X10 = 5
LA MEDIANA
• La mediana de un conjunto de datos es un
valor tal, que cuando escribimos todos los
datos ordenados de menor a mayor ocupa el
lugar central de la lista ordenada. Si el número
de datos es impar, la mediana es el dato
central; si el número de datos es par, la
mediana es la media de los dos datos
centrales.
EJEMPLOS DATOS ORIGINALES
X1= 14
X2= 15
X3= 12
X4= 5
Número impar de observaciones. X5= 9
X6= 6
X7= 11

X1= 27
X2= 38
X3= 23
Número par de observaciones. X4= 28
X5= 36
X6= 39
X7= 35
X8= 26
PASOS A SEGUIR EN EL CÁLCULO DE LA
MEDIANA DATOS AGRUPADOS
1) Obtener las frecuencias absolutas acumuladas.
2) Buscar la mitad de las observaciones, por medio
de n/2.
3) Localizar el resultado anterior n/2 en las
columnas de las frecuencias absolutas
acumuladas. Si no aparece, se toma el valor
inmediatamente anterior y se simboliza con Nj-1
y al inmediatamente superior por Nj.
4) Casos.
CASOS DATOS AGRUPADOS

CASO A
• Variables discretas
Ó

CASO B

CASO A

Ó
• Variables continuas
CASO B
EJERCICIOS
• Variables discretas, caso a:
Yj nj Nj
0 2 2
1 3 5
2 6 11
3 5 16
4 4 20

• Variables discretas, caso b:


Yj nj Nj
0 2 2
1 3 5
2 5 10
3 6 16
4 4 20
EJERCICIOS
• Variables continuas, caso a:
Y´j-1 Y´j ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 5 10
14,1 18 6 16
18,1 22 4 20

• Variables continuas, caso b:


Y´j-1 Y´j ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 6 11
14,1 18 5 16
18,1 22 4 20
LA MODA
• La moda es el valor de la variable que más
veces se repite, y en consecuencia, en una
distribución de frecuencias, es el valor de la
variable que viene afectada por la máxima
frecuencia de la distribución.
EJERCICIOS
• Datos originales:

Calcula la moda los


siguientes datos:

14 25 14 8 22 14 14 14 13 21 15
EJERCICIOS
• Datos agrupados:
Variables discretas
Yj nj
0 2
1 3
2 6
3 5
4 4
Variables continuas

Y´j-1 Y´j ni Yi
𝑑1
𝑀𝑂 = Ý𝑗−1 + 𝐶 2,1 6 2 4,05
𝑑1 + 𝑑2
6,1 10 3 8,05
10,1 14 5 12,05
14,1 18 6 16,05
18,1 22 4 20,05

Ý𝑗−1 =limite inferior de la clase modal (la clase que contiene la moda)

d1 = la diferencia entre la frecuencia de la clase modal y la frecuencia


de la clase anterior

d2 = la diferencia entre la frecuencia de la clase modal y la frecuencia


de la clase siguiente
MEDIDAS DE POSICIÓN
• Las medidas de posición dividen un conjunto
ordenado de datos en grupos con la misma
cantidad de individuos.

• Esto cuando se requiere obtener un promedio


de una parte de ella, se puede dividir la
distribución en cuatro, diez o en cien partes.
Hablamos entonces del primer caso de
cuartiles, el segundo de deciles y percentiles.
PERCENTIL

Son 99 valores que dividen en cien porciones


iguales el conjunto de datos ordenados.
Ejemplo, el percentil de orden 15 deja por
debajo al 15% de las observaciones, y por
encima queda el 85%.
𝐾
• Datos originales: 𝑃 = 𝑛+1
P = Posición
100
PERCENTIL
Con los siguientes datos: 16, 10, 4, 8, 12, 10, 8,
20, 4, 13, 12, 22, 16, 26, 20. Hallar:
Primero y tercer cuartil
Cuarto y sexto decíl
El 30 y 90 percentil

Respuestas:
Q1=8; Q3=20
D4=10,8; D6=14,8
P30=9,6; P90=23,6
PERCENTIL
• En la tabla siguiente se muestran los números de
acciones negociadas de cierta empresa (en
miles), en 50 días de operaciones. Determinar los
valores de los cuartiles, decíl 2, decíl 6, percentil
82 y 32.
PASOS A SEGUIR EN EL CÁLCULO DEL
PERCENTIL K EN DATOS AGRUPADOS
1) Obtener las frecuencias absolutas acumuladas.
2) Buscar el valor K de las observaciones, por
medio de K*n/100.
3) Localizar el resultado anterior K*n/100 en las
columnas de las frecuencias absolutas
acumuladas. Si no aparece, se toma el valor
inmediatamente anterior y se simboliza con Nj-1
y al inmediatamente superior por Nj.
4) Formula.
PERCENTIL
Cuando los datos están agrupados en una tabla
de frecuencias, y son datos continuos, se
calculan mediante la fórmula:
EJEMPLO DATOS AGRUPADOS CON
VARIABLES CONTINUOS.
• Con los siguientes datos, hallar el primer
cuartil, tercer cuartil, sexto decíl, el noveno
decíl, el percentil 80 y el percentil número 50.

Y´j-1 Y´j ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60
DIAGRAMAS DE CAJA Y BIGOTES
• A partir del valor de la mediana y los cuartiles se
pueden representar las distribuciones
estadísticas mediante los llamados “diagramas
de caja y bigotes”. Una vez ordenados los datos,
se calculan los valores mínimo y máximo, los
cuartiles y la mediana. mín=1300; Q1=1675 ;
Me=1900; Q3=2150; máx=2500
Datos
atípicos
𝑋𝑀𝐼𝑁 = 𝑄1 − 1.5 𝑄3 − 𝑄1

𝑋𝑀𝐴𝑋 = 𝑄3 + 1.5 𝑄3 − 𝑄1
EJERCICIO
• Analiza el siguiente diagrama de caja y bigotes
y calcula, a partir de él, los valores máximo y
mínimo, la mediana y los cuartiles.
Resultados del primer corte 2017-3
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA Y PROBABILIDAD ESTADÍSTICA Y PROBABILIDAD GRUPO=015-23
Grupo: 015-25 Grupo: 015-21
4.50 4.50 4.50

4.00 4.00
4.00

3.50
3.50 3.50

3.00
3.00 3.00

2.50

2.50 2.50
2.00

2.00 2.00
1.50

1.00 1.50 1.50


EJERCICIO
• Analiza el siguiente diagrama de caja y bigotes.
Muestra los minutos que tarda en hacer efecto
un medicamento en una población. Interpreta la
información que presenta y responde a las
preguntas.
preguntas
 ¿A qué porcentaje de la población había hecho
efecto al cabo de 30 minutos?.
 ¿Al cabo de cuántos minutos había hecho efecto al
50 % de la población?.
 ¿Cuántos minutos tardó en hacer efecto al 100% de
la población?
 ¿A qué porcentaje había hecho efecto a los 55
minutos?.
 ¿Cuánto tardó en hacer efecto a las tres cuartas
partes de la población?
EJERCICIO
• Con los siguientes datos graficar el diagrama
de caja y bigotes.

Y´j-1 Y´j ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60
EJERCICIO
En la siguiente tabla se presentan los días con índice de
contaminación en la ciudad de Bogotá. Graficar el
diagrama de caja para cada año.
2010 2011 2012
248 221 248
208 171 184
113 131 104
128 101 79
106 95 69
118 89 67
60 33 35
79 63 32
55 56 30
47 54 30
88 55 26
47 69 21
58 59 20
82 48 11
EJEMPLO
Los siguientes datos son puntuaciones obtenidas por
50 estudiantes en una prueba psicológica; agrupar los
datos en 5 intervalos. Hallar media aritmética,
mediana, moda y el diagrama de caja y bigotes.

26 49 37 21 49 16 12 39 38 49
16 17 15 36 35 45 36 17 12 34
26 38 12 17 35 22 31 28 22 48
30 26 16 45 34 29 42 10 12 42
23 35 49 22 45 47 49 19 35 20
DIAGRAMA DE TALLO Y HOJA
Es un diagrama de gran utilidad para representar un
conjunto de datos cuantitativos, este tipo de
representación presenta similitudes con el histograma en
cuanto que proporciona información del recorrido de la
distribución de datos en estudio, muestra la ubicación de
la mayor concentración de mediciones y revela la
presencia o ausencia de simetría.
Cabe señalar que el diagrama de tallo y hojas tiene
ventajas sobre el histograma, porque conserva la
información que puede arrojar las mediciones
individuales, situación que se pierde en los intervalos del
histograma, otra ventaja, es que ésta representación
elimina el paso de los datos originales a clases.
DIAGRAMA DE TALLO Y HOJA
Supongamos que durante el presente mes, se
mide el tiempo en minutos que tardan un grupo
de estudiantes para llegar a clase.
Datos de Tiempo (minutos): 12, 13, 13, 14, 14,
15, 15, 20, 21, 22, 22, 22, 25, 27, 28, 29, 31, 31,
33, 34, 36, 38, 39, 40, 41, 41, 42, 44, 45, 50, 51
52.
Construir el diagrama de tallo y hojas; hallar la
moda, la mediana, los cuartiles Q1 y Q3.
DIAGRAMA DE TALLO Y HOJA

Tallo Hojas ni
1 2 3 3 4 4 5 5 7
2 0 1 2 2 2 5 7 8 9 9
3 1 1 3 4 6 8 9 7
4 0 1 1 2 4 5 6
5 0 1 2 3
n= 32
MEDIDAS DE DISPERSIÓN
• Las medidas de dispersión tratan de medir el grado de
dispersión que tiene una variable estadística en torno a
una medida de posición o tendencia central,
indicándonos lo representativa que es la medida de
posición. A mayor dispersión menor representatividad
de la medida de posición y viceversa.

 Variancia (Poblacional, Muestral)


 Desviación Estándar (típica)
 Coeficiente de variación
VARIANZA (POBLACIONAL, MUESTRAL)
• La varianza mide la mayor o menor dispersión
de los valores de la variable respecto a la
media aritmética. Cuanto mayor sea la
varianza mayor dispersión existirá y por tanto
menor representatividad tendrá la media
aritmética.
EJEMPLOS
• Una aseguradora vende 5 pólizas de seguros, sus
valores fueron 110, 145, 125, 95 y 150 dólares, hallar
la media, la varianza y la desviación estándar.
• Hallar la varianza y la desviación estándar de la variable
ansiedad, que siente una persona cuando se encuentra
mucha gente alrededor de ella, de una muestra de 7
personas. 9; 3; 10; 5; 9; 4; 9
• Calcular la varianza y la desviación estándar para la
variable “Tiempo empleado en completar un
laberinto” por una muestra de 20 ratas:
Tiempo (seg) ni
9 3
10 8
11 6
12 2
13 1
DESVIACIÓN ESTÁNDAR
• Desviación estándar: también llamada desviación típica, es
una medida de dispersión usada en estadística que nos dice
cuánto tienden a alejarse los valores puntuales del
promedio en una distribución. Específicamente, la
desviación estándar es "el promedio de la distancia de cada
punto respecto del promedio". Se suele representar por
una S o con la letra sigma, según se calcule en una muestra
o en la población.
• Una desviación estándar grande indica que los puntos están
lejos de la media, y una desviación pequeña indica que los
datos están agrupados cerca de la media.

 POBLACIONAL
 MUESTRAL
COEFICIENTE DE VARIACIÓN

• Se utiliza para comparar la variabilidad de dos series de datos.

• Tenemos datos sobre el gasto anual en nuevas tecnologías en los


colegios públicos de 2 ciudades ¿En cuál de las 2 ciudades presenta
más homogeneidad esta variable?

 Ciudad A
X = 240.000
Sx = 3.300
 Ciudad B
X = 150.000
Sx = 2.900
MEDIDAS DE ASIMETRÍA
• En una distribución simétrica se cumple que: X=Me=Mo. Ver figura
(c).
• Si en una distribución existen muy pocos valores altos respecto a los
demás, entonces la media aritmética se verá influenciada por éstos y
la asimetría es a la derecha o asimetría positiva o distribución con
sesgo positivo. En éstas condiciones: X>Me>Mo. Ver figura (a)
• Si en una distribución existen muy pocos valores bajos respecto a los
demás, entonces, la media aritmética se verá influenciada por éstos
y la asimetría será a la izquierda o asimetría negativa o distribución
con sesgo negativo. En estas condiciones: X< Me < Mo. Ver figura (b)
COEFICIENTE DE KARL PEARSON
Si una distribución es simétrica, entonces: 𝑋ത = 𝑀𝑒 = 𝑀𝑜 . Entre
mas diferencia halla entre la 𝑋ത y la 𝑀𝑜 , mas asimétrica es la
diferencia. El coeficiente de Karl Pearson que simbolizamos como
SK, mide ésta diferencia en unidades de desviación estándar así:

𝑋ത − 𝑀𝑜 3 𝑋ത − 𝑀𝑒
𝑆𝐾 = 𝑜 𝑆𝐾 =
𝑆 𝑆

 Primer coeficiente de sesgo de Pearson y segundo coeficiente


de sesgo de Pearson.
COEFICIENTE DE KARL PEARSON
Otras medidas del sesgo, que se definen en términos de
cuartiles y percentiles, son las siguientes:

𝑄3 − 2𝑄2 + 𝑄1
Coeficiente cuartil de sesgo=
𝑄3 − 𝑄1

𝑃90 − 2𝑃50 + 𝑃10


Coeficiente de sesgo percentil 10–90 =
𝑃90 − 𝑃10
COEFICIENTE DE KARL PEARSON

• Si la media es mayor que la moda, entonces,


SK es positivo. Es decir, el sesgo es positivo.
• Si la media es menor que la moda, entonces,
SK es negativo. Es decir, el sesgo es negativo.
• Si la media es igual a la moda, SK = 0 y la
distribución es simétrica.
EJEMPLO
• El tiempo utilizado para atender entrevistas de
unos aspirantes a empleo en una empresa, se
clasifican de acuerdo a la siguiente tabla.
NÚMERO DE
TIEMPO NECESARIO ENTREVISTAS
(ni)
1 12 20 6
2 21 29 9
3 30 38 14
4 39 47 72
5 48 56 95
n= 196

a) Calcular la media aritmética, la mediana, la moda


y el histogramas.
b) Identificar el tipo de asimetría y curtosis.
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
• Curtosis o Apuntamiento es utilizado para mostrar el grado
apuntamiento o de concentración de los datos.
• En la medida en que los diferentes tramos de la variable
presenten frecuencias muy similares en todo su recorrido.
Esta situación contribuye a que la dispersión sea alta. Una
distribución con éstas características, se denomina
PLATICÚRTICA O ACHATADA.
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
• Por el contrario, si existe una cantidad muy
significativa de datos que se encuentran
concentrados en algún tramo de la variable,
entonces decimos que la distribución es
altamente concentrada o que tiene alta
curtosis. Una distribución de éstas
características se denomina LEPTOCÚRTICA
O APUNTADA.
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
• Si la concentración es intermedia entre las dos
situaciones anteriores, se dice que la distribución es
MESOCÚRTICA o MODERADA CONCENTRACIÓN DE LOS
DATOS. Una distribución con esta característica es
propia de la distribución normal. Una manera de medir
el grado de curtosis, es mediante el coeficiente de
curtosis A4.
COEFICIENTE DE CURTOSIS A 4

Éste coeficiente, resulta del cociente existente entre el momento de


orden cuatro respecto a la media y la desviación estándar elevada a la
cuarta.

La mayoría de los autores consideran que:


a) Si A4 - 3 = 0, la distribución es mesocúrtica o moderada
concentración de los datos. Tal es el caso de la distribución
normal.
b) Si A4 - 3 > 0, la distribución es apuntada o leptocúrtica o alta
concentración de los datos.
c) Si A4 - 3 < 0, la distribución es achatada o platicúrtica o baja
concentración de los datos.
REGRESIÓN LINEAL Y CORRELACIÓN
• La regresión y la correlación aunque son dos conceptos
diferentes guardan una intima relación:
 La regresión es una expresión cuantitativa de la
naturaleza de la relación entre las variables que se
expresa mediante una ecuación matemática, que se
puede utilizar para estimar o predecir los valores
futuros que puede tener una variable cuando se
conocen o suponen los valores de la otra variable.
 La correlación determina la fuerza de la relación entre
las variables.
• El análisis de regresión y correlación se constituye en
una de las principales herramientas a la hora de llevar a
cabo cualquier investigación y/o estudio en las
mayorías de las disciplinas científicas; de allí que sea
muy utilizado en las investigaciones medicas,
ingenieriles, administrativas, sociales, económicas,
psicológicas etc, ya que su medio se pueden establecer
ecuaciones predictivas, la naturaleza de la relación y su
grado o fuerza de unión.
• Aunque existe una gran variedad de ecuaciones de
regresión para diferentes curvas de ajuste por mínimos
cuadrados, entre las cuales tenemos las lineales
simples y múltiples, las cuadráticas, las polinómicas, las
exponenciales , las logarítmicas, las logísticas, etc.
• La finalidad de una ecuación de regresión es estimar
los valores de una variable basándose en los valores
conocidos de la otra.
• Otra forma de utilizar las ecuaciones de regresión es
explicar los valores de una variable en función de la
otra, es decir, una relación de causa y efecto.
• por ejemplo:
 Un economista puede intentar explicar los cambios en
la demanda de vivienda, en términos de las altas tasas
de interés.
 Los adictos creen que el encarecimiento de la cocaína
es consecuencia de los altos niveles de fumigación.
 El profesor que el bajo rendimiento académico es
consecuencia de la poca dedicación de los estudiantes
REGRESION LINEAL
• La regresión lineal simple es el método mediante
el cual se intenta hallar la ecuación de una línea
recta que describa la relación entre las dos
variables. En un Análisis de Regresión simple
existe siempre una variable respuesta o
dependiente (Y) y una variable explicativa o
independiente (X). El propósito es obtener una
función sencilla de la variable explicativa, que sea
capaz de describir lo más ajustadamente posible
la variación de la variable dependiente.
• Como los valores observados de la variable
dependiente difieren generalmente de los que
predice la función, ésta posee un error. La función
más eficaz es aquella que describe la variable
dependiente con el menor error posible o, dicho
en otras palabras, con la menor diferencia entre
los valores observados y calculados. La diferencia
entre los valores observados y calculados (el
error de la función) se denomina variación
residual o residuos.
• Para estimar los parámetros de la función se
utiliza el ajuste por mínimos cuadrados. Es decir,
se trata de encontrar la función en la cual la suma
de los cuadrados de las diferencias entre los
valores observados y esperados sea menor. Sin
embargo, con este tipo de estrategia es necesario
que los residuos o errores estén distribuidos
normalmente y que varíen de modo similar a lo
largo de todo el rango de valores de la variable
dependiente.
• Cuando la variable dependiente es cuantitativa y
la relación entre ambas variables sigue una línea
recta, la función es del tipo Y = A + BX, en donde
A es el intercepto o valor del punto de corte de la
línea de regresión con el eje de la variable
dependiente y B es la pendiente o coeficiente de
regresión.
• La finalidad de una ecuación de regresión es
estimar los valores de una variable basándose en
los valores conocidos de la otra.
DIAGRAMA DE DISPERSIÓN
• Es la representación en un plano cartesiano de las
parejas de puntos de los datos de las variables
independiente y dependiente. De su observación
podemos estimar que o cual es mejor tipo de
ajuste que se puede hacer manualmente de estos
puntos en lo que llamamos ajuste de curvas por
el método de ajuste por mínimos cuadrados. En
el diagrama de dispersión se acostumbra colocar
en eje horizontal la variable independiente y en el
vertical la variable dependiente.
Ejemplo
LA RECTA REGRESION DE MINIMOS
CUADRADOS
• La recta de ajuste de mínimos cuadrados o de
regresión que aproxima a un conjunto de
parejas ordenadas (X1,Y1),(X2,Y2),.....(Xn,Yn)
tiene la siguiente ecuación:
ECUACIONES
EJEMPLO
COEFICIENTE CAPACIDAD
INTELECTUAL LECTORA
80 25
70 20
60 15
90 30
100 35
40 5
50 10
COEFICIENTE DE DETERMINACIÓN
• El coeficiente de determinación es el termino
que mide el poder explicativo del modelo de
regresión, es decir, la parte de la variación de
Y explicada por la variación de X. Se designa
como r2. El valor de este coeficiente varía
entre 0 y 1, ya que es imposible explicar mas
del 100%.; a mayor valor de r2 mayor poder
explicativo tendrá nuestro modelo .
COEFICIENTE DE CORRELACIÓN
• La correlación mide la fuerza o grado de unión
entre las variables dependiente y la
independiente y para su medición utilizamos el
coeficiente de Pearson, comúnmente llamado
coeficiente de correlación. Este coeficiente de
correlación y el coeficiente de determinación
sirven para determinar la bondad de ajuste, es
decir, si el modelo encontrado es adecuado para
el análisis de regresión lineal. El coeficiente de
correlación es igual a la raíz cuadrada del
coeficiente de determinación y se designa con la
letra r, revela qué porcentaje del cambio en Y se
explica por un cambio en X.
FORMULA
• El valor del coeficiente de correlación fluctúa entre –1
y +1 y siempre tiene el mismo signo del coeficiente de
regresión (B), es decir, la inclinación o pendiente de la
recta de regresión. Si r > 0, la pendiente será positiva y
ascendente pero si r< 0, la pendiente ser negativa y
descendente. El valor absoluto de r mide la fuerza de la
relación entre las variables mientras que el signo nos
dice si están relacionadas en forma directa o inversa.
Cuando r =+1 se dice que hay una correlación positiva
perfecta y si r = -1, la correlación es negativa y perfecta.
Si r = 0, se dice que no hay correlación, es decir, no hay
ninguna relación entre las variables. Cabe decir que
hay mucha discrepancia para decir cuales son
intervalos que determinan si una correlación es buena,
lo que es aceptado que en la medida que nos
acercamos a –1 o a +1 la correlación es buena y a
medida que nos acercamos a cero la correlación tiende
a ser mala.
El grado de correlación lo podemos clasificar en los
siguientes intervalos:

Correlación perfecta: cuando r=1 o r=-1


Correlación excelente: (0,9<r<1) o (-1<r<-0,9)
Correlación aceptable: (0,8<r<0,9) o (-0,9<r<-0,8)
Correlación regular: (0,6<r<0,8) o (-0,8<r<-0,6)
Correlación mínima: (0,3<r<0,6) o (-0,6<r<-0,3)
No hay correlación: (-0,3<r<0,3)
EJERCICIO
• El gerente técnico del Acueducto de una ciudad,
desea establecer la relación entre el consumo
mensual domiciliario de agua y el tamaño de las
familias. Se recogió una muestra aleatoria con los
datos que se muestran en la tabla. Para los datos
de esta tabla desarrolle las siguientes tareas:
a) Dibuje un diagrama de dispersión
b)Determine manualmente la ecuación de
regresión, el coeficiente de determinación y el
coeficiente de correlación
Consumo de agua potable por grupo familiar
Tamaño de la familia Galones de agua utilizados
3 700
7 1200
9 1700
4 800
10 1700
6 1000
9 1800
3 640
3 700
2 500
2 500
2 550
4 650
5 900
5 850
6 1100
6 1200
2 550
3 450
3 640
6 1200
6 1350
7 1320
8 1750
• ¿Merece la pena estudiar? Para contestar esta
pregunta un estudiante curioso de una clase de
estadística preguntó a otros 10 estudiantes
cuantas horas dedicaron al estudio para el último
examen y la nota que obtuvieron. Los datos se
muestran en la tabla.
a) Calcule la ecuación de regresión y el coeficiente
de correlación ¿ Cual es la conclusión ?
b) ¿Si usted estudia 30 horas para el examen ¿Cuál
seria la calificación que obtendrías en virtud del
modelo ?
Calificación Horas (T)
75 30
85 40
35 15
95 45
90 40
30 10
75 25
85 35
50 15
60 20
ESPACIO MUESTRAL
Al conjunto de todos los resultados posibles de un
experimento se le llama espacio muestral del
experimento. Se representa con el símbolo S.

En el experimento de lanzar una moneda, el espacio


muestral es:
S {cara, cruz}

En el experimento de sacar una carta, el espacio muestral


tiene 52 elementos:
S { as de corazones, dos de corazones, etcétera}
ESPACIO MUESTRAL
Un evento es uno o más de los posibles resultados de
hacer algo. Al lanzar una moneda al aire, si cae cruz es un
evento, y si cae cara es otro. De manera análoga, si
sacamos una carta de un mazo de naipes, el tomar el as
de espadas es un evento.
 Un ejemplo de evento que, quizá, esté más cercano a
su quehacer diario es ser elegido de entre cien
estudiantes para que responda a una pregunta.
 Cuando escuchamos las poco gratas predicciones del
índice de mortalidad en accidentes de tránsito,
esperamos no ser uno de tales eventos.

La actividad que origina uno de dichos eventos se conoce


como experimento.
Hallar el espacio muestral de:
• Lanzar un dado.
• Lanzar dos dados.
• Jugar un partido de futbol.
• Tomar una pieza para inspeccionar.
• Tomar dos componentes y clasificarlos conforme
cumple o no los requerimientos.
• Considere el experimento en el que, cada diez
minutos, se verifica el volumen de llenado de las
latas de refresco de una maquina llenadora
automática, con la finalidad de determinar si las
latas cumplen con las especificaciones de
volumen que debe contener. La evaluación
continúa hasta encontrar una lata que no cumpla
con las especificaciones.
DIAGRAMA DE VENN
Los diagramas de Venn tienen el nombre de su
creador, John Venn, matemático y filósofo
británico. Los diagramas de Venn son esquemas
usados en la teoría de conjuntos.
La teoría de conjuntos es una rama de
las matemáticas que estudia las propiedades y
relaciones de los conjuntos: colecciones
abstractas de objetos, consideradas como
objetos en sí mismas.
CONJUNTOS EXCLUYENTES O
INCOMPATIBLES
𝑨 ∪𝑩=𝑨+𝑩

𝑨 ∩𝑩=∅
CONJUNTOS NO EXCLUYENTES O
COMPATIBLES

𝑨∩𝑩=𝑨𝑩
CONJUNTOS NO EXCLUYENTES O
COMPATIBLES

𝑨 ∪ 𝑩 = 𝑨 + 𝑩 − (𝑨 ∩ 𝑪)
CONJUNTOS NO EXCLUYENTES O
COMPATIBLES

𝑨 −𝑩
COMPLEMENTO

𝑪
𝑨
Para poder abordar cualquier problema de teoría
de conjuntos de sucesos excluyentes, necesitamos
como mínimo conocer tantos datos como sucesos
excluyentes existan menos uno, es decir, 2n-1

Sucesos compatibles Sucesos excluyentes


𝐴 𝐵 𝐴𝐵
𝐴𝐵ത 𝐵𝐴ҧ 𝐴ҧ𝐵ത
Ejemplos
• En un conjunto de 100 trabajadores hay 50
con estudios universitarios, 35 que son
casados y 20 son casados con estudios
universitarios. Representar este conjunto de
trabajadores mediante el diagrama de Venn.
TRES SUBCONJUNTOS
TRES SUBCONJUNTOS
𝑆𝑢𝑐𝑒𝑠𝑜𝑠 𝑠𝑖𝑚𝑝𝑙𝑒𝑠 = 𝐴, 𝐵, 𝐶
𝑆𝑢𝑐𝑒𝑠𝑜𝑠 𝑑𝑜𝑏𝑙𝑒𝑠 = 𝐴𝐵; 𝐴𝐶; 𝐵𝐶
𝑆𝑢𝑐𝑒𝑠𝑜𝑠 = 𝑡𝑟𝑖𝑝𝑙𝑒𝑠 𝐴𝐵𝐶
Las posibilidades de los diferentes
sucesos excluyentes serán:
𝐴𝐵𝐶ҧ = 𝐴𝐵 − 𝐴𝐵𝐶
𝐴𝐵𝐶 ത = 𝐴𝐶 − 𝐴𝐵𝐶
ҧ
𝐴𝐵𝐶 = 𝐶𝐵 − 𝐴𝐵𝐶
𝐴𝐵ത 𝐶ҧ = 𝐴 − 𝐴𝐶 − 𝐴𝐵 + 𝐴𝐵𝐶
𝐴𝐵 ҧ 𝐶ҧ = 𝐵 − 𝐴𝐵 − 𝐶𝐵 + 𝐴𝐵𝐶
𝐴ҧ𝐵𝐶ത = 𝐶 − 𝐴𝐶 − 𝐶𝐵 + 𝐴𝐵𝐶
𝐴ҧ𝐵ത 𝐶ҧ = 𝑆 − 𝐴 ∪ 𝐵 ∪ 𝐶
= 𝑆 − (𝐴 + 𝐵 + 𝐶 − 𝐴𝐵 − 𝐴𝐶 − 𝐶𝐵
+ 𝐴𝐵𝐶)
Ejemplos
• Se consulto a un grupo de 200 personas sobre el
medio de comunicación que utilizan a diario para
mantenerse informados sobre la situación actual
del país; los resultados fueron los siguientes: 93
personas utilizan la televisión, 90 la radio, 28
personas ven televisión y lee prensa, 35 ven
televisión y escuchan radio, 10 leen la prensa y
escuchan la radio pero no ven televisión, 38
personas solo leen la prensa y 12 personas
utilizan con la misma frecuencia los tres medios.
Ejemplos
Con base a esta información responder:
• ¿Cuántas personas consultan solamente un
medio?
• ¿Cuántas personas consultan solamente dos
medios?
• ¿Cuantas personas no consultan la prensa?
• ¿Cuántas personas no consultan ningún medio
de información?
Respuestas
TÉCNICAS DE CONTEO
Con mucha frecuencia puede ser muy difícil y
engorroso determinar el número posible de arreglos
de un número finito de elementos, por medio de la
enumeración directa. Tomemos como ejemplo: Un
investigador desea seleccionar una persona de un
grupo de personas que fueron tratadas con dos
medicamentos (A y B) sobre un tipo de ejecución
motora, tres niveles de medicamentos (alto, medio
bajo), de edad entre 30 y 35 años, medicamento
barato y caro, ¿De cuántas formas posibles el
investigador puede seleccionar una persona?
Una empresa que requiere comprar una
máquina troqueladora que puede ser clasificada
por un equipo evaluador, como de operatividad
fácil, mediana o difícil; como cara, barata o costo
adecuado, como muy comercial o poco
comercial, con velocidad V1 y V2. Es decir, que la
máquina puede ser evaluada desde cuatro
frentes diferentes (operatividad; costo;
comercial y velocidad)
Las técnicas de conteo, se refieren a un conjunto
de métodos utilizados para calcular sin
necesidad de contar en forma directa, el número
de posibles arreglos u ordenaciones de un
conjunto determinado de elementos. Para
solucionar un problema de probabilidad en
muchas ocasiones es fundamental llevar a cabo
algún tipo de conteo, lo cual garantiza el éxito
en la solución. Las técnicas de conteo, se
fundamentan en dos principios importantes
como son el “principio de la multiplicación y el
“principio de la adición” .
PRINCIPIO DE LA MULTIPLICACIÓN

Teorema: si una operación se puede llevar a


cabo en n1 formas, y si para cada una de estas se
puede realizar de una segunda forma operación
en n2 formas, entonces las dos operaciones se
pueden ejecutar de n1 n2 formas.
PRINCIPIO DE LA MULTIPLICACIÓN
Un urbanista ofrece a los futuros compradores
de una casa la elección del estilo de la fachada
entre Tudor, rustica, colonial y tradicional; en
una planta, dos pisos y desniveles. ¿En cuantas
formas diferentes puede ordenar un comprador
una de estas casas? Construir el diagrama del
árbol.
EJERCICIO
Una persona vive en el extremo norte de la ciudad y
solo cuenta con dos rutas para poder llegar a la
llamada autopista Norte. Una vez alcanzada la
autopista tiene tres rutas de menor congestión para
llegar al centro de la ciudad. Ya en el centro de la
ciudad puede seleccionar dos rutas para llegar al
parqueadero más cercano a su oficina. ¿De cuántas
maneras o rutas podría conducir su automóvil de la
casa al parqueadero más próximo a la oficina? Halle
el diagrama de árbol.
PRINCIPIO DE LA MULTIPLICACIÓN
Teorema: si una operación se puede llevar a
cabo en n1 formas, y si para cada una de estas se
puede realizar de una segunda forma operación
en n2 formas, y para cada una de las primeras
dos se puede realizar una tercera operación en
n3 formas, y así sucesivamente, entonces la seria
de k operaciones se pude realizar en n1, n2,…..,nk
formas.
PRINCIPIO DE LA MULTIPLICACIÓN
Supongamos que un cierto componente eléctrico
consta de tres piezas diferentes, de tal manera que
cada pieza puede ser ensamblada de diferentes
formas alternativas así: La pieza A puede ser
ensamblada de tres formas diferentes, la pieza B
puede ser ensamblada de dos formas diferentes y la
pieza C puede ser ensamblada de dos formas
diferentes. Se quiere conocer el número total de
formas como puede ser ensamblado el
componente.
DIAGRAMA DE ÁRBOL
PRINCIPIO DE LA MULTIPLICACIÓN
¿Cuántos almuerzos que consisten en una sopa,
emparedado, postre y una bebida, si son
posibles seleccionar de 4 sopas, 3 tipos de
emparedados, 5 postres y 4 bebidas? Construir
el diagrama del árbol.
PRINCIPIO DE LA MULTIPLICACIÓN
Una permutación es una arreglo de todo o parte
de un conjunto de objetos.
Considera las tres letras a, b, c. ¿Cuántos
arreglos distintos se pueden formar con estas
tres letras? Hallarlos todos los arreglos.

𝑛 𝑛 − 1 𝑛 − 2 … . . 3 2 1 𝑓𝑜𝑟𝑚𝑎𝑠 = 𝑛!
NOTACIÓN FACTORIAL
• 6!=
• 0!=
• 1!=
• 10!=
• 12!/8! =
• 3!/0! =
• 0!/5! =
• 3!*5!/4!*6! =
• ¿De cuántas maneras pueden acomodarse en
una reunión de 7 personas en una fila, si
deben acomodarse de derecha a izquierda en
orden de llegada?
• En una universidad de Bogotá a 5 estudiantes
se les califica con las letras A, B, C, D, E. De
cuántas maneras se les pueden calificar:
si todos los estudiantes obtienen
calificaciones diferentes.
si los estudiantes obtienen la misma
calificación.
• ¿De cuántas maneras se pueden acomodar en
un estante 5 libros diferentes si se toman
todos a la vez?
• Un número telefónico consta de siete cifras
enteras. Suponga que la primera cifra debe
ser un número entre 2 y 9, ambos inclusive.
Las segunda y tercera cifra debe ser números
entre 1 y 9, ambos inclusive. Cada una de las
restantes cifras es un número de 0 al 9, ambos
inclusive. ¿Cuántos números de teléfonos
distintos pueden formarse con estas
condiciones?
PERMUTACIÓN
Una permutación es un arreglo u ordenación de los
“n” elementos que conforman un conjunto tomados
todos a la vez o tomados parte a la vez; de tal
manera que el orden interesa. Es decir, aunque
varios arreglos u ordenaciones contengan los mismos
elementos, por el solo hecho de tener un orden
diferente, tales arreglos u ordenaciones se
consideran diferentes. En éstas condiciones cada
arreglo u ordenación se denomina una permutación.
𝑛!
𝑛𝑃𝑟 =
𝑛−𝑟 !
EJERCICIOS
• ¿Cuál será el número de permutaciones de
cuatro letras a, b, c, d al tomar dos a la vez?
• Formar cifras de tres dígitos con los cuatro
números naturales: 1, 2, 3, 4 sin repetición.
• Formar cifras de dos dígitos con los cuatro
números naturales.
• Se sacan dos billetes de lotería de 20 para un
primer y segundo premios. Encuentre el
número de puntos muestrales en el espacio S.
PERMUTACIONES CIRCULARES
El número de permutaciones de n objetos
distintos arreglados en un circulo es 𝑛 − 1 !

Dos permutaciones circulares no se consideran


diferentes a menos que los objetos
correspondientes en los dos arreglos estén
precedidos o seguidos por un objeto diferente
conforme recorramos en la dirección de las
manecillas del reloj.
Ejercicio
Cuatro personas juegan cartas ¿De
cuantas formas distintas podemos
organizar estas cuatro personas
alrededor de una mesa?
RESPUESTA
Teorema: el número de permutaciones distintas
de n cosas de las n1 son de una clase, n2 de una
segunda clase, ….., nk de una k-ésima clase es:

𝑛!
𝑛1 ! 𝑛2 ! … . . 𝑛𝑘 !

¿De cuántas formas diferentes se puede arreglar


3 focos rojos, 4 amarrillos y 2 azules en una serie
de luces navideñas con 9 portalámparas?
¿Cuál será el número de permutaciones de tres
letras a, b, c?

¿Cuál será el número de permutaciones de tres


letras a, b, c; si las letras b y c son iguales a X?
Con frecuencia nos interesa el número de
formas de dividir un conjunto de n objetos en r
subconjunto denominado celdas. El orden de los
elementos dentro de una celda no importa.
Teorema: el número de formas de partir un
conjunto de n objetos en r celdas con n1
elementos en la primera celda, n2 elementos en
la segunda celda, y así sucesivamente, es:

𝑛 𝑛!
𝑛1 𝑛2 … . 𝑛𝑟 = 𝑛1 ! 𝑛2 ! … . . 𝑛𝑟 !

Donde 𝑛1 + 𝑛2 + ⋯ 𝑛𝑟 = 𝑛.
Considere el conjunto (a, e, i, o, u). ¿Cuántas
particiones en dos celdas en las que la primera
celda contiene cuatro elementos y la segunda
celda un elemento?

(a,e,i,o)(u) ; (a,e,i,u)(o) ; (a,e,o,u)(i) ;


(a,i,o,u)(e) ; (e,i,o,u)(a) = 5
¿En cuantas formas se puede asignar siete
científicos a una habitación de hotel triple y a
dos dobles?
¿Cuántas es el número de permutaciones de las
letras en la palabra statistics?
COMBINACIONES
Una combinación es un arreglo u ordenación de
“n” objetos disponibles tomados todos a la vez o
parte a la vez, sin que el orden interese.

𝑛! 𝑛
𝑛𝐶𝑟 = =
𝑛 − 𝑟 ! 𝑟! 𝑟
EJERCICIOS
• Tenemos las 4 letras del alfabeto A, B, C, D. Se
desea combinarlas, ¿cuántas combinaciones se
podrán hacer?
• Se desea combinar las 4 letras de dos en dos,
¿Cuántas combinaciones se podrán hacer?
• Se desea combinar las 4 letras de tres en tres,
¿Cuántas combinaciones se podrán hacer?
• ¿Cuántas comisiones de 3 personas se pueden
formar seleccionándolas de entre 10 personas?
• Un Jefe de producción debe elegir tres de seis
obreros disponibles para realizar un trabajo, de
tal manera que cada uno de los obreros debe
realizar un trabajo idéntico. ¿Cuántas formas de
seleccionar son posibles?

• La junta directiva de un sindicato compuesta por


6 miembros, debe nombrar una comisión
compuesta por 3 de ellos para estudiar una
propuesta que se quiere pasar a la presidencia de
la compañía, relacionada con modificaciones en
los turnos actuales. ¿De cuantas formas posibles
puede formarse la comisión?
• ¿De cuántas formas puede un sindicato elegir un
presidente y un vicepresidente, entre sus 25
miembros?
• De un grupo de 11 edecanes se deben
seleccionar a cuatro para que asistan a una
exposición. Determinar el número de selecciones
distintas que se pueden hacer.
• Un vendedor tiene una portafolio de 15
empresas. ¿Cuántas recorridos distintos puede
realizar para visitar a seis de estos clientes en un
día determinado?
PROBABILIDAD
Primeros teóricos que desarrollaron teorías sobre
probabilidad:
• Jacob Bernoulli (1654-1705)
• Abraham de Moivre (1667-1754)
• El reverendo Thomas Bayes (1702-1761)
• Joseph Lagrange (1736-1813) desarrollaron fórmulas y
técnicas para el cálculo de la probabilidad.
• En el siglo XIX, Pierre Simon, marqués de Laplace
(1749-1827), unificó todas estas ideas y compiló la
primera teoría general de probabilidad.
PROBABILIDAD
La probabilidad se refiere a problemas
aleatorios o de resultados imprevisibles y es un
factor importante para estudiar todos aquellos
fenómenos que suceden bajo incertidumbre. El
concepto de probabilidad fue aplicado por
primera vez en los juegos de mesa en Francia en
el siglo XVII, bajo el supuesto de que todos los
resultados posibles de un experimento son
igualmente probables y fue Laplace, quien más
influencia tuvo en éste sentido.
APLICACIONES
Hoy en día la probabilidad reviste gran importancia
en matemáticas y la estadística aplicada a ciencias
tales como la ingeniería, la administración, la
química, la antropología, la sociología, la psicología,
la medicina, la economía, la astrología, etc.
En la actualidad, la teoría matemática de la
probabilidad es la base para las aplicaciones
estadísticas, tanto en investigaciones sociales como
en la toma de decisiones.
La probabilidad constituye parte importante de
nuestra vida cotidiana. En la toma de decisiones
personales y administrativas, nos enfrentamos a
la incertidumbre y utilizamos la teoría de la
probabilidad.

Cuando escuchamos una predicción de un 70%


de posibilidades de lluvia, cambiamos nuestros
planes de salir al parque y nos quedamos en
casa divirtiéndonos con juegos de mesa.
PROBABILIDAD
Cuando se realiza un experimento, la posibilidad
de que se presente un resultado determinado,
se denomina probabilidad, que se encuentra
dentro del rango cero a uno. A cada uno de los
posibles resultados del experimento, se le asigna
una probabilidad tal que la suma de todas las
probabilidades es uno.
PROBABILIDAD
La probabilidad de un evento X lo denotamos
como 𝑃(𝑋).
0 ≤ 𝑃(𝑋) ≤ 1

෍ 𝑃 𝑋𝑖 = 1
𝑖=1

𝑃 𝑋ത = 1 − 𝑃 𝑋
Si se realiza un experimento en el cual tenemos una gran
posibilidad de que un determinado resultado va a ocurrir,
entonces el valor de probabilidad que debe asignársele a
dicho resultado debe ser cercano a uno.

Un suceso se considera CIERTO o SEGURO, si en un


experimento dado, dicho evento tiene la absoluta
probabilidad de ocurrir.

¿Cuál es la probabilidad que una persona muera algún día?


Sea 𝑀: 𝐸𝑣𝑒𝑛𝑡𝑜 𝑞𝑢𝑒 𝑢𝑛𝑎 𝑝𝑒𝑟𝑠𝑜𝑛𝑎 𝑚𝑢𝑒𝑟𝑎
𝑃 𝑀 =1
Si por el contrario, pensamos que al realizar el
experimento un determinado resultado tiene muy poca
posibilidad de ocurrir, entonces a éste resultado debe
asignársele un valor de probabilidad cercano a cero.

Un suceso IMPOSIBLE, es aquel que no puede ocurrir.

¿Cuál es la probabilidad de atravesar a nado el océano


atlántico?
Sea 𝐴: 𝐸𝑣𝑒𝑛𝑡𝑜 𝑎𝑡𝑟𝑎𝑣𝑒𝑠𝑎𝑟 𝑎 𝑛𝑎𝑑𝑜 𝑒𝑙 𝑜𝑐é𝑎𝑛𝑜 𝑎𝑡𝑙á𝑛𝑡𝑖𝑐𝑜
𝑃 𝐴 =0
ALGUNAS DEFINICIONES BÁSICAS
Se dice que dos resultados son IGUALMENTE
PROBABLES, o equiprobables cuando estos dos
resultados tienen la misma probabilidad de
ocurrir.
Ejemplo:
En el lanzamiento del dado una vez al aire.
Selecciono aleatoriamente una persona entre
diez.
ALGUNAS DEFINICIONES BÁSICAS

Dos sucesos se consideran OPUESTOS, si no


pueden ocurrir simultáneamente y además sus
probabilidades se complementan. También
llamados Sucesos INCOMPATIBLES o
MUTUAMENTE EXCLUYENTES.
EJEMPLO
¿Cuál es la probabilidad de obtener un par al lanzar el
dado corriente una vez al aire?

¿Cuál es la probabilidad de pasar la signatura o reprobar,


desertar o no obtener calificación?

¿Cuál es la probabilidad de seleccionar un hombre o una


mujer?

¿Cuál es la probabilidad de seleccionar un artículo de un


lote que cumpla o no cumpla las especificaciones?
ALGUNAS DEFINICIONES BÁSICAS

Cuando una lista incluye todos los eventos que


pueden resultar de un experimento, se dice que
la lista es colectivamente exhaustiva.
EJEMPLOS
Proporcione una lista colectivamente exhaustiva
de:
Lanzar dos dados.
Lanzar una moneda tres veces.
Un experimento que consta de tres pasos; para
el primer paso hay tres resultados posibles, para
el segundo hay dos resultados posibles y para el
tercer paso hay cuatro resultados posibles.
ALGUNAS DEFINICIONES BÁSICAS

Dos sucesos son INDEPENDIENTES, cuando la


probabilidad de la ocurrencia del uno, no afecta
la probabilidad de la ocurrencia del otro.

Ejemplo: Si lanzo una moneda dos veces al aire


y obtengo cara en el primer lanzamiento ¿Éste
resultado afecta el siguiente resultado?
ALGUNAS DEFINICIONES BÁSICAS
Dos sucesos son DEPENDIENTES, cuando la
probabilidad de la ocurrencia del uno, depende
de si el otro ocurrió o no ocurrió.

Ejemplo. Se selecciona dos cartas de una baraja


de 52 naipes sin reposición.
PROBABILIDAD A PRIORI
Es aquella que se puede determinar de
antemano, sin necesidad de realizar el
experimento.
Ejemplos:
La probabilidad de que aparezca cara en el
lanzamiento de una moneda.
La probabilidad de que aparezca el tres en la
cara superior después de lanzar un dado.
La probabilidad de seleccionar una mujer al
escoger una persona al azar.
PROBABILIDAD EMPÍRICA
Se determina mediante experimentos u
observaciones previas, la probabilidad se cuantifica
a través de una proporción, de tal manera que el
numerador está representado por el número de
resultados favorables encontrados en el
experimento, mientras que el denominador se
refiere al número de casos posibles, o a la totalidad
de las observaciones o ensayos hechos en el
experimento.

𝑛° 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃 𝑋𝑖 =
𝑛° 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
EJEMPLO
Determinar el éxito de una operación quirúrgica
practicada por un determinado medico. Si se sabe
que el medico a tenido 36 operaciones exitosas y a
operado a 40 pacientes.

Un lote contiene 15 artículos, de los cuales, 7 son


tipo X, 3 son tipo Y y 5 son tipo Z. Si se selecciona
aleatoriamente un artículo del lote, se pide calcular
la probabilidad de que dicho artículo sea tipo X.
CONCEPTO SUBJETIVO
Puede interpretarse como el grado en que uno
cree que va ocurrir el evento, en razón al buen
criterio, sentido común o experiencia. Este
enfoque es llamado también personalista.
EJEMPLO
Un médico cardiólogo de acuerdo con su
experiencia, afirma que existe una probabilidad
del 70%, que su paciente superará la cirugía que
tiene proyectada.
EJERCICIO
Un magnate reflexiona sobre la compra de 500
acciones, en la bolsa de valores. En un estudio de
las 100 ultimas sesiones de la bolsa, se ve que el
precio bajo en 20 oportunidades, subió en otras 50
y no se alteró el resto de los días.
Determinar la probabilidad de que el día de hoy el
precio de la acción:
1. Baje.
2. Suba
3. No se altere.
EJEMPLO
En una junta directiva compuesta por 7
miembros, existen 4 miembros de acuerdo con
un proyecto y 3 que no están de acuerdo con el
mismo. Se selecciona aleatoriamente un
miembro para gestionar una autorización
relacionada con dicho proyecto, ante una
entidad gubernamental. ¿Cual es la probabilidad
de que la persona seleccionada esté de acuerdo
con el proyecto?
EJERCICIOS
• Hallar el diagrama del árbol y la probabilidad
de cada rama de:
Lanzar un dado.
Lanzar dos monedas.
Familia con tres hijos “hombre o mujer”.
Una moneda y un dado.
Un experimento que consiste en el lanzamiento de
dos dados.
Cuál es la probabilidad de obtener en el
experimento:
 La suma de sus caras sean 7.
 La suma de sus caras sean menor a 5.
Que en una cara aparezca un 3 y en la otra un
valor mayor de 4.
Que en el primer dado aparezca un 3 o un 5, y en
el segundo 2 o 6.
Que la suma de sus caras de cómo resultado un
número impar.
¿Cuál es la probabilidad de que en el lanzamiento
de un dado, se alcance en la cara superior un valor
par? y ¿cuál es la probabilidad de obtener un
número mayor a dos?
¿Cuál es la probabilidad de obtener en el
lanzamiento de 3 monedas, que todas sean caras?
¿De que dos sean caras? ¿De que dos sean sellos?
¿Cuál es la probabilidad de que sean varones, los
tres hijos de una familia?
¿Cuál es la probabilidad de que al menos una mujer
de los tres hijos de una familia?
¿Cuál es la probabilidad de que sea un varón y dos
mujeres los tres hijos de una familia?
• De las 1.200 cuentas por cobrar que tiene una
compañía, estas se han clasificado así: 1.000 de
fácil cobro, 100 de difícil cobro, 70 de dudoso
cobro y 30 irrecuperables. ¿Si se selecciona una
cuenta aleatoriamente, cuál es la probabilidad de
que la cuenta sea de fácil o de difícil cobro?
• Una caja contiene 12 productos de los cuales 4
están defectuosos. Si se selecciona un producto al
azar,
 ¿Cuál es la probabilidad de obtener un producto
defectuoso?
 ¿Un producto no defectuoso?
• La clase de estadística tiene 12 hombres y 13
mujeres. Si se selecciona al azar a un estudiante.
Encuentre la probabilidad de que sea hombre.

• Una persona compra un boleto para una rifa en la


cuál hay 13 premios mayores y 57 premios
menores. Si la emisión de boletos fue de 2000,
encuentre la probabilidad de que la persona: a)
Se gane un premio mayor; b) no se gane un
premio; c) Se gane un premio menor; d) Se gane
un premio.
FRECUENCIA RELATIVA
En el siglo XIX, los estadísticos británicos, interesados en
la fundamentación teórica del cálculo del riesgo de
pérdidas en las pólizas de seguros de vida y comerciales,
empezaron a recoger datos sobre nacimientos y
defunciones. En la actualidad, a este planteamiento se le
llama frecuencia relativa de presentación de un evento y
define la probabilidad como:
1. La frecuencia relativa observada de un evento
durante un gran número de intentos.
2. La fracción de veces que un evento se presenta a la
larga, cuando las condiciones son estables.
FRECUENCIA RELATIVA
Los datos a continuación
representan el número de # de Accidentes Frecuencia
accidentes que ocurren por día en 0 62
un cruce determinado. 1 48
Hallar la probabilidad de que en 2 32
un día determinado ocurran:
3 25
a) Exactamente 3 accidentes.
4 17
b) A lo más 3 accidentes.
5 10
c) 4 o mas accidentes.
6 o más 6
d) Al menos 3 accidentes.
200
• Se tiene un lote de diez baterías para un celular.
Se sabe que tres de ellas no funcionan.
• ¿Cuántas formas posibles puedo seleccionar tres
baterías?
• ¿De cuántas maneras distintas se pueden sacar
tres baterías al azar y que todas funcionen?
• Si se extraen tres baterías al azar, ¿cuál es la
probabilidad de que las tres funcionen?
• ¿De cuántas maneras se pueden extraer tres
baterías al azar y obtener solamente una que no
funcione?
• ¿Cuál es la probabilidad de que al extraer tres
pilas al azar obtener solo una sin funcionar?
RESPUESTAS
• (10C3) = 120
• (7C3) = 35
• P(tres funcionen) = (7C3) / (10C3) = 35 / 120 =
0.2917
• (3C1) (7C2) = (21)(3)= 63
• P(Sólo una no funcione) =(3C1) (7C2) / (10C3)
= 63 / 120 = 0.5203
PROBABILIDADES BAJO CONDICIONES
DE INDEPENDENCIA ESTADÍSTICA
Cuando se presentan dos eventos, el resultado del
primero puede, o no, tener un efecto en el resultado del
segundo. Esto es, los eventos pueden ser dependientes o
independientes. Los eventos que son estadísticamente
independientes, es decir, aquellos en donde la
presentación de uno no tiene efecto sobre la probabilidad
de presentación de cualquier otro. Existen tres tipos de
probabilidades que se presentan bajo la independencia
estadística:
1. Marginal.
2. Conjunta.
3. Condicional.
PROBABILIDADES MARGINALES BAJO
CONDICIONES
DE INDEPENDENCIA ESTADÍSTICA
La probabilidad marginal o incondicional es la
probabilidad simple de presentación de un evento.
En el lanzamiento de una moneda no cargada,
P(cara) = 0.5 y P(sello) = 0.5. Esto es cierto para
cada lanzamiento, no importa cuántas veces se
lance la moneda o cuáles hayan sido los resultados
anteriores. Cada lanzamiento de la moneda es
único y no hay manera de conectarlo con ningún
otro. En consecuencia, el resultado de cada
lanzamiento de una moneda es un evento
estadísticamente independiente de los resultados
de cualquier otro lanzamiento de ella.
Sucesos
mutuamente 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵
excluyentes
Regla
de la
suma
Sucesos NO
mutuamente 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵
excluyentes
Reglas de la
probabilidad Prob. Marginal 𝑃 𝐴
básica
Sucesos Prob. Conjunta 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝑃 𝐵
independientes
Regla Prob. Condicional 𝑃 𝐵/𝐴 = 𝑃 𝐵
de la
multiplicación Prob. Marginal 𝑃 𝐴

Sucesos 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃 𝐵/𝐴
Prob. Conjunta
dependientes
Prob. Condicional 𝑃 𝐵/𝐴 = 𝑃 𝐴 ∩ 𝐵
𝑃 𝐴
Una óptica elabora la siguiente tabla de
contingencias, donde se clasifica las gafas por
tamaño y material.
Plástico Metal Mixto
Grande 12 8 5
Mediano 23 31 1
Pequeño 6 6 8

A. Hallar la matriz de probabilidad


B. Hallar las probabilidades marginales
C. Hallar el diagrama del árbol por tamaño
D. Hallar las probabilidades condicionales
E. Hallar las probabilidades conjuntas
MATRIZ DE PROBABILIDAD CONJUNTA

Prob.
Prob. Conjunta Plástico Metal Mixto
Marginal
Grande 0,12 0,08 0,05 0,25
Mediano 0,23 0,31 0,01 0,55
Pequeño 0,06 0,06 0,08 0,2
Prob. Marginal 0,41 0,45 0,14 1
• ¿Cuál es la probabilidad de seleccionar unas gafas
y esta sea de metal?
• ¿Cuál es la probabilidad de seleccionar unas gafas
y esta sea pequeña?
• ¿Cuál es la probabilidad de seleccionar una
montura y esta sean grande y plástico?
• ¿Cuál es la probabilidad de seleccionar un marco
mixto o de metal?
• ¿Cuál es la probabilidad de seleccionar un marco
de metal o mediano?
𝑃 𝑃𝑙𝑎𝑠 ∩ 𝐺
𝑃 𝑃𝑙𝑎𝑠/𝐺 = = 0,48 𝑃 𝑃𝑙𝑎𝑠 ∩ 𝐺 = 𝑃 𝐺 𝑃 𝑃𝑙𝑎𝑠/𝐺
𝑃 𝐺
𝑃 𝑀𝑒 ∩ 𝐺
𝑃 𝐺 = 0,25 𝑃 𝑀𝑒/𝐺 = = 0,32 𝑃 𝑀𝑒 ∩ 𝐺 = 𝑃 𝐺 𝑃 𝑀𝑒/𝐺
𝑃 𝐺
𝑃 𝑀𝑖𝑥 ∩ 𝐺
𝑃 𝑀𝑖𝑥/𝐺 = = 0,2 𝑃 𝑀𝑖𝑥 ∩ 𝐺 = 𝑃 𝐺 𝑃 𝑀𝑖𝑥/𝐺
𝑃 𝐺
𝑃 𝑃𝑙𝑎𝑠 ∩ 𝑀
𝑃 𝑃𝑙𝑎𝑠/𝑀 = = 0,4182 𝑃 𝑃𝑙𝑎𝑠 ∩ 𝑀 = 𝑃 𝑀 𝑃 𝑃𝑙𝑎𝑠/𝑀
𝑃 𝑀
𝑃 𝑀𝑒 ∩ 𝑀
I 𝑃 𝑀 = 0,25 𝑃 𝑀𝑒/𝑀 = = 0,5636 𝑃 𝑀𝑒 ∩ 𝑀 = 𝑃 𝑀 𝑃 𝑀𝑒/𝑀
𝑃 𝑀
𝑃 𝑀𝑖𝑥 ∩ 𝑀
𝑃 𝑀𝑖𝑥/𝑀 = = 0,0182 𝑃 𝑀𝑖𝑥 ∩ 𝑀 = 𝑃 𝑀 𝑃 𝑀𝑖𝑥/𝑀
𝑃 𝑀

𝑃 𝑃𝑙𝑎𝑠 ∩ 𝑃
𝑃 𝑃𝑙𝑎𝑠/𝑃 = = 0,3 𝑃 𝑃𝑙𝑎𝑠 ∩ 𝑃 = 𝑃 𝑃 𝑃 𝑃𝑙𝑎𝑠/𝑃
𝑃 𝑃
𝑃 𝑀𝑒 ∩ 𝑃
𝑃 𝑃 = 0,25 𝑃 𝑀𝑒/𝑃 = = 0,3 𝑃 𝑀𝑒 ∩ 𝑃 = 𝑃 𝑃 𝑃 𝑀𝑒/𝑃
𝑃 𝑃
𝑃 𝑀𝑖𝑥 ∩ 𝑃
𝑃 𝑀𝑖𝑥/𝑃 = = 0,4 𝑃 𝑀𝑖𝑥 ∩ 𝑃 = 𝑃 𝑃 𝑃 𝑀𝑖𝑥/𝑃
Probabilidad 𝑃 𝑃
marginal Probabilidad condicional Probabilidad conjunta
MATRIZ DE PROBABILIDAD
CONDICIONAL

Prob. Condicional
Plástico Metal Mixto
(Material/Tamaño)
Grande 0,48 0,32 0,20
Mediano 0,4182 0,5636 0,0182
Pequeño 0,3 0,3 0,4
REVISIÓN DE LAS ESTIMACIONES
ANTERIORES
DE PROBABILIDADES: TEOREMA DE BAYES

𝑃(𝐴𝐾 ∩ 𝐵) 𝑃(𝐴𝐾 )𝑃 𝐵 𝐴𝐾
P 𝐴𝑘 𝐵 = = 𝑘
𝑃(𝐵) σ𝑖=1 𝑃(𝐴𝑖 )𝑃 𝐵 𝐴𝑖
MATRIZ DE PROBABILIDAD
CONDICIONAL

Prob. Condicional
Plástico Metal Mixto
(Tamaño/Material)
Grande 0,2927 0,1778 0,3571
Mediano 0,5610 0,6889 0,0714
Pequeño 0,1463 0,1333 0,5714
EJEMPLO
Supongamos que los 200 obreros de una compañía
se clasifican desde el punto de vista de su
calificación y desde el punto de vista de la
antigüedad, según la tabla siguiente:
Antigüedad Menos de 5 Más de 5
Totales
Calificación años(M) años(N)

Experto(E) 25 115 140


Aprendíz(A) 15 45 60
Totales 40 160 200

Si se selecciona un obrero aleatoriamente, ¿cuál


es la probabilidad de que sea un obrero experto
(E) ó tenga menos de 5 años de antigüedad (M)?
• Las probabilidades de que una familia aleatoriamente
seleccionada en una encuesta realizada en una gran
ciudad, posea un televisor a color, un televisor blanco y
negro o ambos, son respectivamente: 0.87, 0.36 y 0.29.
¿Cuál es la probabilidad de que una familia en esa
ciudad posea un tipo o ambas clases de televisor?
• La probabilidad de que una persona que se detiene en
una gasolinera solicite revisión de neumáticos es 0.12,
la probabilidad de que pida revisión de aceite es 0.29 y
la probabilidad de que pida ambas cosas es 0.07. a)
¿Cuál es la probabilidad de que una persona que se
detenga en una gasolinera, pida la revisión de
neumáticos o de aceite? b) ¿Cuál es la probabilidad de
que no solicite la revisión de neumáticos ni de aceites?
Distribuciones de probabilidad
• Son todos los posibles valores que resultan de
un experimento aleatorio, junto con su
probabilidad asociada a cada valor.

Variable aleatoria:
• Es una variable cuyos valores es el resultado
de un suceso aleatorio.
• Variables aleatorias discretas.
Binomial
Poisson
Hipergeométrica
Uniforme
• Variables aleatorias continuas.
Normal
Exponencial
Uniforme
Variables aleatorias discretas
Binomial
Muchos problemas estadísticos, implican la
realización de varios ensayos repetidos. Es decir,
en cada experimento de éste tipo hay “n”
número de ensayos repetidos y queremos
conocer la probabilidad de que en éstos “n”
ensayos, se presenten x éxitos; entendiendo por
éxito, no necesariamente un resultado de buena
o agradable aceptación.
1)En el experimento, podría hacerse un número infinito de
ensayos, puesto que la distribución binomial supone el
reemplazo después de cada ensayo.

2) Solo existen dos resultados posibles en cada ensayo,


opuestos entre si. Dichos resultados los denominamos éxito y
fracaso, cuyas probabilidades las simbolizamos por “p” y “q”
respectivamente, complementarias entre si.

3) Los ensayos son independientes entre si, porque el éxito o


fracaso en un ensayo no afectará la probabilidad de éxito o de
fracaso en los siguientes ensayos.

4) La suma de las probabilidades de todos los sucesos posibles


en un experimento de n ensayos, cada uno de ellos
compuesto de X éxitos y (n - X) fracasos es igual a uno (1).
Formulas

𝑛 𝑋 𝑛−𝑋
𝑃 𝑋 = 𝑝 𝑞
𝑋
𝜇=𝐸 𝑋 =𝑛𝑝
2
𝜎 =𝑛𝑝𝑞
𝜎 = 𝑛𝑝𝑞
Ejemplo
Si la probabilidad de que cierta columna falle
ante una carga axial específica es 0.05.
a) ¿Cual es la probabilidad de que entre 16 de
tales columnas fallen exactamente 2?
b) ¿Cual es la probabilidad de que al menos 3
fallen?
c) Calcular la media o valor esperado y la
varianza de la distribución.
Ejemplo
Se sabe que en cierta comunidad el 70% de la
población está de acuerdo con una norma legal.
a) Se pide calcular la probabilidad que de 4
personas seleccionadas aleatoriamente, 3
estén a favor de dicha norma.
b) Se pide calcular la media o valor esperado, la
varianza y la desviación estándar de la
distribución.
Ejemplo
Considere las decisiones de compra de los
próximos tres clientes que lleguen a la tienda de
ropa Martin Clothing Store. De acuerdo con la
experiencia, el gerente de la tienda estima que
la probabilidad de que un cliente realice una
compra es 0.30. ¿Cuál es la probabilidad de que
dos de los próximos tres clientes realicen una
compra?
DISTRIBUCIÓN DE POISSON
• Se usa en muchas situaciones que se refieren a
fenómenos que ocurren en un intervalo continuo
de espacio o de tiempo, aunque dicha
continuidad puede dividirse en intervalos más
pequeños. Mientras que la distribución Binomial
está orientada a resolver problemas relacionados
con los éxitos esperados en “n” ensayos, la
distribución de Poisson busca dar respuesta a
problemas relacionados con los éxitos esperados
en un intervalo de tiempo o de espacio.
La distribución de Poisson se simboliza como:
P(X,λ), que se lee como la probabilidad de que
ocurran X éxitos en un intervalo de tiempo o de
espacio dado, sabiendo que el promedio de
éxitos por “idéntico intervalo”, es λ. La
distribución de Poisson se puede considerar
como el límite de una distribución binomial
cuando “n” es muy grande y “p” es muy
pequeña. Cuando n es grande (n ≥ 30) y crece
indefinidamente y “p” es pequeña con
tendencia a cero, de tal manera que la media
(n.p < 5), entonces las probabilidades
binomiales se aproximan a la fórmula de
Poisson.
FORMULAS
𝑋 −λ
λ 𝑒
𝑃 𝑋, λ =
𝑋!
λ=𝐸 𝑋 =𝑛𝑝
2
𝜎 =λ
𝜎= λ
Al inspeccionar la aplicación de estaño por un
proceso electrolítico continuo se descubren en
promedio 0.8 imperfecciones por minuto.
Calcular la probabilidad de descubrir:
a) Una imperfección en un minuto P(1;0.8).
b) 4 imperfecciones en 5 minutos P(4;4).
c) Calcular la media o valor esperado y la
varianza correspondiente.
En un laboratorio radiológico, se sabe por
experiencia que 650 de cada 10.000 radiografías
resultan defectuosas. Cual es la probabilidad de
que de n=40 radiografías que se han
programado para el día de hoy, se tengan X=4
defectuosas. P(4;2.6).
• Suponga que desea saber el número de llegadas, en un
lapso de 15 minutos, a la rampa del cajero automático
de un banco. En un análisis de datos pasados
encuentra que el número promedio de automóviles
que llegan en un lapso de 15 minutos es 10. Si la
administración desea saber la probabilidad de que
lleguen exactamente cinco automóviles en 15 minutos.
• En el ejemplo anterior se usó un lapso de 15 minutos,
pero también se usan otros lapsos. Suponga que desea
calcular la probabilidad de una llegada en un lapso de 3
minutos.
• Durante el periodo en que una universidad
recibe inscripciones por teléfono, llegan llamadas
a una velocidad de una cada dos minutos.
a. ¿Cuál es el número esperado de llamadas en
una hora?
b. ¿Cuál es la probabilidad de que haya tres
llamadas en cinco minutos?
c. ¿De que no haya llamadas en un lapso de cinco
minutos?
Distribución de probabilidad
hipergeométrica

Está estrechamente relacionada con la


distribución binomial. Pero difieren en dos
puntos: en la distribución hipergeométrica los
ensayos no son independientes y la probabilidad
de éxito varía de ensayo a ensayo.
FORMULA
𝑟
𝑁−𝑟
𝑋
𝑛−𝑋
𝑃 𝑋 =
𝑁
𝑛
𝑟
𝐸 𝑋 =𝜇=𝑛
𝑁
𝑟 𝑟 𝑁−𝑛
𝑉𝑎𝑟 𝑋 = 𝜎2 =𝑛 1−
𝑁 𝑁 𝑁−1
Donde
𝑃 𝑋 = Probabilidad de X éxitos en n ensayos
𝑛 = Número de ensayos
𝑁 =Número de elementos en la población
𝑟 =Numero de elementos en la población considerados
como éxitos
• Una empresa fabrica fusibles que empaca en
cajas de 12 unidades cada una. Asuma que un
inspector selecciona al azar tres de los 12
fusibles de una caja para inspeccionarlos. Si la
caja contiene exactamente cinco fusibles
defectuosos, ¿cuál es la probabilidad de que el
inspector encuentre que uno de los tres
fusibles está defectuoso?
• Ahora suponga que desea conocer la
probabilidad de hallar por lo menos un fusible
defectuoso.
• Hallar la media, la varianza y la desviación
estándar.
• Un almacén de juguetes recibe un
embarque de 25 juegos de modelos de
aviones, entre los cuales hay 4
incompletos. Si un comprador escoge
aleatoriamente 3 juegos de estos
modelos sin derecho a cambio, ¿cual es
la probabilidad que los 3 resulten
incompletos?
• Suponga que N =10 y r =3.
Calcule las probabilidades hipergeométricas
correspondientes a los valores siguiente de n y x.
a. n = 4, x = 1.
b. n = 2, x = 2.
c. n = 2, x = 0.
d. n = 4, x = 2.
• Suponga que N = 15 y r = 4. ¿Cuál es la
probabilidad de x = 3 para n =10?
LA DISTRIBUCIÓN O CURVA NORMAL
Se trata de un modelo teórico
de distribución de
probabilidad para variables
aleatorias cuantitativas
continuas, que se caracteriza
gráficamente, por tener forma
similar a la de una campana.
Por ello, y por haber sido
estudiada inicialmente por el
matemático Karl Gauss, se le
denomina también como
curva o campana de Gauss.
CARACTERÍSTICAS DE LA CURVA
NORMAL
• Una distribución normal es una distribución de datos continuos (no
discretos).
• Da lugar a una curva simétrica y en forma de campana.
• Las observaciones de cada extremo ocurren con una frecuencia
baja.
• En una distribución normal la media aritmética, la mediana y la
moda son iguales.
• Se destaca que la mitad de las observaciones están por debajo de la
media y la otra mitad por encima.
• Regla empírica:
El 68.3% de las observaciones se sitúan dentro de mas o
menos una distribución típica de la media.
El 95.5% de las observaciones se sitúan dentro de mas o
menos dos distribuciones típica de la media.
99.7% de las observaciones se sitúan dentro de mas o menos
tres distribuciones típica de la media.
PUNTAJE ESTÁNDAR
• Puntaje estándar indica a cuantas desviaciones estándar una
observación o dato está encima o por debajo del promedio. Es un
número sin dimensiones, derivado por restar el promedio
poblacional a un puntaje crudo individual y luego dividiendo la
diferencia por la deviación estándar de la población estadística. Este
proceso de conversión se llama estandarización o normalización.
• Los puntajes estándares también se conocen como valores z,
puntajes z, puntajes normales y variables estandarizadas. El uso de
"Z" es porque la distribución normal también se conoce como la
"distribución Z". Frecuentemente se utiliza para poder comparar
una muestra al derivado estándar normal (distribución estándar
normalizada, con μ = 0 y σ = 1), aunque pueden ser definidos sin
asumir normalidad.
• El puntaje-z es únicamente definido si uno conoce los parámetros
de la población.
EJERCICIOS
A. Hallar el área bajo la curva normal de los
siguientes puntos estándar:
1. Z= -1,2 Y Z=2,4*
2. Z=1.23 Y Z=1.87*
3. Z=-2.35 Y Z=-0.50
4. A la izquierda de Z=-1.78*
5. A la izquierda de Z= 0.56
6. A la derecha de Z= -1.45*
7. Correspondiente a Z < 2.16
8. Correspondiente a -0.80< Z <1.53
EJERCICIOS
B. Encontrar el valor de Z:
1. El área a la derecha de Z es igual a 0,2266.*
2. El área a la izquierda de Z es 0,0314.
3. El área entre -0,23 y Z es igual a 0,5722*
4. El área entre 1,15 y Z es 0,0730
• Supongamos que un conocido nos dice que ha obtenido en
un test de inteligencia una puntuación CI igual a 95.
Asumiendo que las puntuaciones en un test de inteligencia
se distribuyen normalmente y sabiendo que las
puntuaciones CI tienen media 100 y desviación típica 15.
(a) ¿qué porcentaje de sujetos es de esperar que obtengan
un valor inferior o igual a 95?
(b) ¿qué porcentaje de sujetos es de esperar que obtengan
un valor superior a 95?
(c) Supongamos también que nos pregunta qué puntuación
CI habría que sacar en el test de inteligencia para estar en
el 30% inferior (puntuación de CI que deja el 30% de
sujetos por debajo);
(d) ¿y para estar en el 10% superior? (puntuación de CI que es
superada solo por el 10% de los sujetos)
(e) ¿entre qué valores de CI se encuentra el 50% central de
los sujetos?
EJEMPLO
• ¿Cuál es la probabilidad de obtener un As o un
Rey, sacando una sola carta en una baraja
española de 40 cartas?
• ¿Cuál es la probabilidad de obtener un 2 o un 5
en el lanzamiento de un dado?
• Tenemos en una caja con 16 bolas de 4 colores
diferentes. 3 bolas azules, 6 bolas negras, 2 bolas
blancas y 5 bolas verdes. ¿Qué probabilidad
tenemos de ganar o perder si las premiadas son
las blancas y azules?
• ¿Cuál es la probabilidad de obtener un 2 o un 4 o
un 6 en el lanzamiento de un dado?

Das könnte Ihnen auch gefallen