Sie sind auf Seite 1von 48

Estadística Descriptiva

CONCEPTOS BÁSICOS

INTRODUCCIÓN

La investigación cuya finalidad es: el análisis o experimentación de situaciones para el descubrimiento de


nuevos hechos, la revisión o establecimiento de teorías y las aplicaciones prácticas de las mismas, se basa en
los principios de Observación y Razonamiento y necesita en su carácter científico el análisis técnico de Datos
para obtener de ellos información confiable y oportuna. Este análisis de Datos requiere de la Estadística como
una de sus principales herramientas, por lo que los investigadores de profesión y las personas que de una y
otra forma la realizan requieren además de los conocimientos especializados en su campo de actividades, del
manejo eficiente de los conceptos, técnicas y procedimientos estadísticos.

ESTADÍSTICA

Es el conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, los cuales
sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o
naturales.

ESTADÍSTICA INDUCTIVA Y DEDUCTIVA

Uno de los problemas fundamentales de la Estadística es el estudio de la relación existente entre una
población y sus muestras. Según la dirección de tal relación la Estadística puede ser:

Deductiva, cuando a partir del conocimiento de la población se trata de caracterizar cada muestra posible.

Inductiva, cuando a partir del conocimiento derivado de una muestra se pretende caracterizar la población.

ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

Estadística Descriptiva se refiere a la recolección, presentación, descripción, análisis e interpretación de una


colección de datos, esencialmente consiste en resumir éstos con uno o dos elementos de información
(medidas descriptivas) que caracterizan la totalidad de los mismos. La estadística Descriptiva es el método de
obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento
proporcionado por éstos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de
una población o de una muestra, cuando en la etapa preliminar de la Inferencia Estadística se conocen los
elementos de una muestra.

Estadística Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo,
población, partiendo de lo específico, muestra. las cuales llevan implícitos una serie de riesgos. Para que
éstas generalizaciones sean válidas la muestra deben ser representativa de la población y la calidad de la
información debe ser controlada, además puesto que las conclusiones así extraídas están sujetas a errores,
se tendrá que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadística
inferencial es el conjunto de técnicas que se utiliza para obtener conclusiones que sobrepasan los límites del
conocimiento aportado por los datos, busca obtener información de un colectivo mediante un metódico
procedimiento del manejo de datos de la muestra.

En sus particularidades la Inferencia distingue la Estimación y la Contrastación de Hipótesis. Es estimación


cuando se usan las características de la muestra para hacer inferencias sobre las características de la
población. Es contrastación de hipótesis cuando se usa la información de la muestra para responder a
interrogantes sobre la población.

ANALISIS ESTADÍSTICO
El análisis estadístico es todo el proceso de organización, procesamiento, reducción e interpretación de datos
para realizar inferencias.

DATOS Y VARIABLES

Cuando se consideran los métodos de organización, reducción y análisis de datos estadísticos, se hace
necesario aclarar los siguientes conceptos.

Variables: es toda característica que varía de un elemento a otro de la población.

Datos: son medidas o valores de las características susceptibles de observar y contar, se originan por la
observación de una o más variables de un grupo de elementos o unidades

CLASIFICACIÓN DE VARIABLES

Las variables pueden clasificarse en: categóricas o cualitativas (atributos), no tienen ningún grado de
comparación numérica, ejemplo: sexo, estado civil; y numéricas o cuantitativas, son características factibles
de expresar por medio de números, estas pueden ser Discretas, que solo pueden tomar ciertos valores
aislados en un intervalo, y Continuas, que pueden tomar cualquier valor en un intervalo.

REPRESENTACIÓN DE DATOS

Los datos son colecciones de un número cualquiera de observaciones relacionadas entre si, para que sean
útiles se deben organizar de manera que faciliten su análisis, se puedan seleccionar tendencias, describir
relaciones, determinar causas y efectos y permitan llegar a conclusiones lógicas y tomar decisiones bien
fundamentadas; por esa razón es necesario conocer lo métodos de Organización y Representación, la
finalidad de éstos métodos es permitir ver rápidamente todas las características posibles de los datos que se
han recolectado.

Representación Tabular:

Presenta las variable y las frecuencias con que los valores de éstas se encuentran presentes en el estudio.

Representación Gráfica :

Se llaman gráficas a las diferentes formas de expresar los datos utilizando los medios de representación que
proporciona la geometría.

METODOS DE REPRESENTACIÓN DE DATOS CUANTITATIVOS

Arreglo de Datos. Es una forma de presentar los datos en un arreglo ascendente o descendente. Ofrece las
ventajas siguientes: describe los valores mínimos y máximos, en él se pueden dividir los datos fácilmente en
secciones, permite darse cuenta de los valores que aparecen más de una vez, se puede observar la distancia
entre valores consecutivos.

Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los valores

Diagrama de Tallo y Hoja. Es útil para realizar una exploración preliminar del conjunto, genera una imagen
adecuada de ellos sin perder información.

Distribución de Frecuencias. Es una forma de sintetizar los datos y consiste en valerse de una tabla para
clasificar los datos según su magnitud, en ella se señala el número de veces que aparece cada uno de los
valores. Cuando se dispone de un gran número de valores discretos o cuando las variables son continuas,
tiene sentido formar una tabla que presente la distribución de frecuencias de los datos agrupados en
intervalos o clases, de igual tamaño si es posible, sin embargo una tabla de este tipo supone una
concentración de datos que produce pérdida de información.
DISTRIBUCIÓN DE FRECUENCIAS

Organización de datos agrupados

Definiciones

Clases o intervalos de clase: Grupo de valores que describen una característica. Deben incluir todas las
observaciones y ser excluyentes. Los intervalos contienen los límites de clase que son los puntos extremos
del intervalo. Se denominan intervalos cerrados, cuando contienen ambos límites e intervalos abiertos si
incluyen solo un límite.

Limites Reales: Sirven para mantener la continuidad de las clases

Anchura o tamaño del intervalo: es la diferencia entre los límites reales de una clase

Número de clases: es el número total de grupos en que se clasifica la información, se recomienda que no sea
menor que 5 ni mayor que 15

Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los puntos medios
coincidan con los datos observados para minimizar el error.

Frecuencia: es el número de veces que aparece un valor

Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un determinado valor o límite de
clase.

Frecuencia Relativa: Indica la proporción que representa la frecuencia de cada intervalo de clase en relación
al total, es útil para comparar varias distribuciones con parámetros de referencia uniformes.

Frecuencia Acumulada Relativa: Indica la proporción de datos que se encuentra por arriba o debajo de cierto
valor o límite de clase.

Gráficos de una Distribución de Frecuencias

Los gráficos son útiles porque ponen en relieve y aclaran las tendencias que no se captan fácilmente en la
tabla, ayudan a estimar valores con una simple ojeada y brinda una verificación gráfica de la veracidad de las
soluciones.

Histograma:

Esta formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie
que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de
valores, puede construirse con clases que tienen el mismo tamaño o diferente ( intervalo variable). La
utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos , de
amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea
mucho mayor que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del
intervalo.

Polígono de Frecuencias

Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas
rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar
la igualdad del áreas.

Curvas de frecuencia

No es más que la curva suavizada que se traza sobre el polígono y representa la asimetría y la curtosis que
tiene la distribución, permite visualizar un esquema más claro del patrón de datos. Existen varios tipos de
curva de frecuencia: Curvas J, Simétricas o Asimétricas (sesgada a la derecha o a la izquierda), Unimodales,
Bimodales y Multimodales.

Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no
es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estándar, la
frecuencia relativa. La ojiva representa gráficamente la forma en que se acumulan los datos y permiten ver
cuantas observaciones se hallan por arriba o debajo de ciertos valores. Es útil para obtener una medida de los
cuartiles, deciles , percentiles.

MEDIDAS DESCRIPTIVAS

Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de observaciones de una
variable y describir con ellas ciertas características de los conjuntos, logrando una comparación más precisa
de los datos que la que se puede conseguir con tablas y gráficas.

MEDIDAS DE TENDENCIA CENTRAL: PROMEDIOS

Los promedios son una medida de posición que dan una descripción compacta de como están centrados los
datos y una visualización más clara del nivel que alcanza la variable, pueden servir de base para medir o
evaluar valores extremos o raros y brinda mayor facilidad para efectuar comparaciones.

Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y que este
número promedio debe cumplir con la condición de ser representativo de conjunto de datos.

El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la
variable.

MEDIA ARITMÉTICA

Es una medida matemática, un número individual que representa razonablemente el comportamiento de todos
los datos.

Para datos no agrupados X = S xi / n

Para datos agrupados X = S fi Xi / S fi

donde Xi es la marca de clase para cada intervalo y fi es la frecuencia de clase

Características de la Media:

1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la media.

2. La suma algebraica de las desviaciones de los valores individuales respecto a la media es cero.

3. La suma del cuadrado de las desviaciones de una serie de datos a cualquier número A es mínimo si A = X

4. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada por los
valores extremos, y de esa forma llegar a ser una medida menos representativa, por lo que si la distribución
es asimétrica, la media aritmética no constituye un valor típico.

LA MODA

Es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de
una serie de datos.

Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia.
La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos relativos se
designan de modo general como bimodales o multimodales.

Características de la Moda.

1. Representa más elementos que cualquier otro valor

2. No está afectada por los valores extremos pero para datos continuos es dudoso su cálculo.

3. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el
valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase.

4. La moda no permite conocer la mayor parte de los datos

5. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita
frecuentemente.

6. Puede usarse para datos cuantitativos como cualitativos

7. La moda como estadístico, varía mucho de una muestra a otra

8. Cuando se tienen dos o más modas es difícil su interpretación

9. Tiene la ventaja de que los datos desproporcionados con respecto al resto no la distorsionan, pero no se
presta para un tratamiento matemático.

LA MEDIANA

Es el valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su
magnitud. Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable
que deja por debajo de él un número de casos igual al que deja por arriba.

Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma
en dos áreas iguales.

Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a
los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos
casos es conveniente utilizar la mediana como medida de tendencia central.

Características de la mediana

1. Es un promedio de posición no afectado por los valores extremos.

2. No está definida algebraicamente

3. Cuando la localización del elemento central puede ser determinada y los límites de clase mediana son
conocidos, la mediana para la distribución de frecuencias puede ser calculada por interpolación, no
importando que ésta contenga intervalos abiertos, cerrados, iguales o diferentes.

4. La suma de los valores absolutos, sin considerar el signo, de las desviaciones individuales respecto a la
mediana es mínimo.

5 La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central.

6. Si el universo tiene curtosis excesiva la mediana como estadístico, varía menos que cualquier otra medida.

7. Si la mediana se calcula por interpolación y hay lagunas en los valores de la clase mediana o los datos son
irregulares, esta medida no es buena ya que su ubicación puede resultar falsa.
8. Si se desea ubicar las condiciones de un elemento en una clase, la mediana resulta se indicada, ya que por
comparación pone en evidencia si un elemento está en la mitad superior a ella o en la inferior.

MEDIA ARITMETICA PONDERADA

En ésta, para cada uno de los valores de xi se asigna un factor wi de peso, que depende de la importancia
que el investigador desee darle.

Xp = S ( xi wi) / S wi

MEDIA GEOMÉTRICA

Útil cuando la variable cambia a lo largo del tiempo, esto es, en el calculo del promedio de tasas, razones,
proporciones geométricas y relaciones de variables. Se utiliza en Matemáticas Financieras y Finanzas para
promediar números índices, tasas de cambio, etc.

La media Geométrica de una serie de números es la raíz n-ésima del producto de esos números

M = n e (x 1 * x 2 * x 3 *.....*x n )

Se ve afectada por todos los números y valores extremos pero en menor grado que la Media Aritmética, su
valor siempre es menor que el de ésta.

MEDIA ARMÓNICA

Se utiliza para el promedio de rendimientos y velocidades. La Media Armónica de una serie de números es el
reciproco de la media aritmética del recíproco de esos números.

1 / MH = [ S 1 / xi ] / n

MEDIA CUADRÁTICA

Es la raíz cuadrada de la media aritmética de los cuadrados de los números, se usa eficientemente para
promediar los errores o desviaciones porque es más susceptible a los mismos.

MC = 2 e S [ xi 2 ] / n

LOS CUANTILES

Son valores que dividen a la distribución en n partes iguales

Cuartiles, cuatro partes iguales: Q1, Q2, Q3

Deciles, diez pares iguales : D1, D2..........D9

Percentiles o centiles, cien partes iguales: P1, P2.....P99

Los cuantiles permiten hacer un análisis minucioso de la distribución, se utilizan generalmente cuando se
quiere ubicar un dato dentro del conjunto. Por ejemplo. Pertenece el dato x al 50% superior ?, al 10% inferior?
, al 50 % central?, etc.

MEDIDAS DE DISPERSIÓN

Un rasgo principal de los datos es su dispersión o amplitud, que se refiere a su variabilidad, a la evaluación de
cuán separados o extendidos están estos datos o bien cuanto difieren unos de otros.

Variación: es el grado en que los datos numéricos tienden a extenderse al rededor de un valor, generalmente
el valor medio

¿Por qué es importante la variación?


1. Al menudo una medida de posición de un conjunto de datos se vincula con la indicación de cuán típico o
representativo es para la población y para ello es necesario contar con la información que proporcionan las
mediadas de variación. Solo el conocimiento de un estadístico de tendencia central no aclara o define toda la
distribución, además que no existe un valor de tendencia central ideal, por lo que es significativo tener una
idea de la dispersión de los valores y determinar si es mucha o poca al rededor de la media, pues si la
variación es muy grande entonces esta medida de tendencia central no es buena selección como valor típico.

2. La medida de tendencia central no indica la relación de un dato con los otros, es necesario para ello las
medidas de variabilidad o dispersión.

3. Al tratar problemas con datos dispersos se requiere conocer que problemas puede esto traer, hasta que
punto la dispersión tiene un riesgo aceptable o inaceptable en la toma de decisiones.

4. Al comparar dos distribuciones por lo general centramos la atención en la posición y en la dispersión.

RANGO

Mide la dispersión de la totalidad de los datos. Es la más obvia de las mediadas ya que es la distancia entre
los valores máximo y mínimo.

El rango o recorrido da alguna idea del grado de variación que ocurre en la población, pero con frecuencia los
resultados pueden ser engañosos, pues este depende de los valores extremos e ignora la variación de las
demás observaciones. Está afectado por ocurrencias raras o extraordinarias.

INTERVALO INTERDECIL

Mide la dispersión del 80% de los datos centrales y se obtiene de la diferencia entre el decil 9 y el decil 1,
evitando así los puntos extremos.

INTERVALO INTERCUARTIL

Cuando aumenta la dispersión de una distribución de frecuencias, se amplía la distancia entre los cuartiles,
por lo que esta distancia puede usarse como base de una medida de variabilidad

El intervalo intercuartil, es el recorrido entre el cuartil 3 y el cuartil 1. Es el intervalo en el cual está


comprendido el 50% de los datos centrales.

DESVIACIÓN CUARTÍLICA

Mide el intervalo promedio de un cuarto de los datos [Q3-Q1)/2]

Si la distribución es perfectamente simétrica, los dos cuartiles Q1 y Q3 equidistan de la mediana y la mitad de


la distancia entre los cuartiles representa la distancia promedio entre ellos y la mediana.

Si en una distribución simétrica se mide una distancia igual a la desviación cuartílica a ambos lados de un
punto ubicado en el centro de los cuartiles, el 50% de los valores estarán incluidos dentro de esos límites y el
valor del punto medio coincide con la mediana.

La ventaja de la desviación cuartílica es que evita los valores extremos utilizando únicamente la mitad
intermedia de los datos.

DESVIACIÓN MEDIA

La desviación Media o Desviación absoluta promedio, es la media aritmética de las desviaciones absolutas de
cada una de las observaciones con respecto a su valor central, la media aritmética, o la mediana

Cuanto mayor es su valor, mayor es la dispersión de los datos


DM =[ S | xi . X | ] / n

DM = [ S fi | xi - X | ] / S fi

Las características de esta media de dispersión son:

1. Su valor depende del valor de cada observación.

2. Se puede calcular al rededor de la media o de la mediana.

3. La desviación promedio respecto a la mediana es un mínimo

4. Mide la desviación de una observación sin notar si está por encima o por debajo del promedio.

VARIANZA

Otro tratamiento para evadir la suma cero de las desviaciones de las observaciones respecto a su Media
Aritmética, consiste en recurrir al proceso de elevar al cuadrado estas desviaciones y sumar los cuadrados,
dividiendo la suma por el número de casos, a esta cantidad se le denomina varianza, y es la más importante
de las medidas de variación porque tiene la ventaja de no prescindir de los signos de las desviaciones, pero al
igual que la desviación media los valores extremos pueden distorsionarla

s 2 = S ( xi - X ) 2 / n

s 2 = S fi (xi-X ) 2 / S fi

S 2 = S (xi-X) 2 / ( n)

S 2 = S fi ( xi-X ) 2 / ( S fi )

S 2 * = S (xi-X) 2 / ( n-1)

S 2 *= S fi ( xi-X ) 2 / ( S fi -1)

En inferencia, con una muestra tomada de una población grande se pretende descubrir cuanto varían los
datos al rededor de la media poblacional, si embargo cuando no se conoce la media de la población se estima
a partir de la media aritmética de la muestra y esto hace que parezca menos variable de o que es en realidad,
al dividir por n-1 se está compensando por la variabilidad más pequeña que se observa en la muestra, por lo
que S 2 * , la suma de cuadrados dividida por n-1 es considerado un estimador más eficiente para la varianza
poblacional.

DESVIACION ESTANDAR

Cuando se utiliza la varianza como medida de dispersión, para salvar el problema de trabajar con distintas
dimensiones en la media y en la medida de variabilidad es necesario definir la Desviación estándar como la
raíz cuadrada de l varianza.

La Desviación Estándar es útil para describir cuanto se apartan de la media de la distribución los elementos
individuales. Una medida de ello se denomina puntuación estándar número de desviaciones a las que
determinada observación se encuentra con respecto a la media.

Puntuación estándar de xi = (xi - X) / s

Al comparar distribuciones también hacemos uso de la calificación estándar.

Característica de la Desviación Estándar:

1. Es afectada por el valor de cada observación


2. Como consecuencia de considerar desviaciones cuadráticas pone mayor énfasis en las desviaciones
extremas que en las demás desviaciones.

3. Si en el eje X de la distribución de frecuencias normal, se mide a ambos lados de la media una distancia
igual a :

Una desviación estándar se forma un intervalo en el cual se encuentra el 68.27% de los valores centrales de
la variable

Dos desviaciones estándar, se forma un intervalo donde se encuentra el 95.43% de los valores centrales

Tres desviaciones estándar, se forma un intervalo que contiene el 99.73% de los valores centrales

4. Al construir la tabla de frecuencias de una variable discreta y calcular a partir de ella la desviación estándar
no hay pérdida de información por lo que la desviación para los datos observados es igual que para los datos
tabulados.

En la construcción de una tabla de una variable continua hay pérdida de información por el agrupamiento de
los valores en intervalos y se traduce en la discrepancia entre el valor de la desviación observada y tabulada.

MEDIADAS DE DISPERSIÓN RELATIVAS

Cuando se necesita comparar dos o más series de datos a veces no es posible hacerlo con las medidas
absolutas, ya sea porque las unidades son diferentes o porque tienen diferente media, en éstos casos deben
utilizarse cantidades relativas definida generalmente como:

Dispersión relativa = Dispersión absoluta / media

COEFICIENTE DE VARIACIÓN

Es la medida de dispersión relativa más usada y se define como el cociente de la desviación estándar entre el
promedio aritmético, expresado en porcentaje y es adimensional

V=S/X

MEDIDAS DE ASIMETRÍA Y CURTOSIS


MEDIDAS DE SESGO O ASIMETRIA

En las distribuciones que no toman la forma de una curva acampanada Normal, interesa muchas veces
obtener dos medias adicionales, las de asimetría y curtosis. Las medidas de asimetría muestran si en la
distribución hay concentración de datos en un extremo, superior o inferior, y se denomina Sesgo positivo o a
la derecha si la concentración es en el extremo inferior y Sesgo Negativo o a la izquierda si la concentración
es en el superior.

COEFICIENTE DE PEARSON

En las distribuciones simétricas, la media , la mediana y la moda coinciden y conforme la distribución se


separa de la simetría estos valores se separan, por lo que la más corriente de las medidas de asimetría es la
diferencia entre la moda y la media que se la más sensible a los valores extremos

Sk = ( X -Mo) / S

Para cuando la moda no se encuentra bien definida se puede sustituir por la mediana

Sk= 3 ( X -Me) / S

Estas medidas se conocen como el primero y segundo coeficiente de Pearson y varían entre el intervalo + 3,
es cero para la distribución normal.
MEDIDA CUARTIL DE ASIMETRIA

En una distribución simétrica los cuartiles quedan simétricamente colocados respecto a la mediana, pero si es
asimétrica un cuartil se separa más que otro. La medida cuartil de asimetría marca esta relación

Sk =[ ( Q3-Me) -( Me-Q1) ]/ ( Q3-Q1)

Si la asimetría es a la derecha Q3 está más lejos de la mediana que Q1, si la asimetría es a la izquierda Q1
está mas alejada de la mediana que Q3.Esta medida varía siempre entre + 1, si es cero la distribuciones
normal.

COEFICIENTE DE SESGO PERCENTÍLICO

Se aplica con el mismo criterio de la medida Cuartil de Asimetría

Sk = [( P90-P50) -(P50-P10) ]/ ( P90-P10)

MEDIDAS DE CURTOSIS

Al comparar cuán aguda es una distribución en relación con la Distribución Normal, se pueden presentar
diferentes grados de apuntalamiento.

1. Mesocúrtica, Normal

2. PlarticúrtiCa, Menor apuntalamiento

3. Leptocúrtica, Mayor apuntalamiento

COEFICIENTE DE CURTOSIS PERCENTILICO

Una medida del apuntalamiento o curtosis de la distribución está basada en los cuartiles y percentiles, y está
dada por el coeficiente de Curtosis Percentílico

K= ( 0.5 ( Q3- Q1) ) / ( P90-P10)

Para la distribución normal K toma un valor de 0.263 y las distribuciones se definen como:

Leptocúrtica si k es mayor que 0.263

Platicúrtica si k es menor que 0.263

Problemas
1 Variables Aleatorias Continuas Especiales
2 Variables Aleatorias Discretas Especiales

3 Variables Aleatorias Bidimensionales Continuas


4 Variables Aleatorias Bidimensionales Discretas

5 Variables Aleatorias Unidimensionales Continuas


6 Variables Aleatorias Unidimensionales Discretas

7 Reglas Aditivas
8 Probabilidad Condicional

9 Espacio Muestral
Variables Aleatorias Continuas Especiales

25.Las bombillas eléctricas de una fabrica han presentado una duración media de 1000 hrs. El
fabricante garantiza una duración mayor de 900 hrs, en caso contrario devuelve la bombilla perdiendo
Q 0.30 y gana Q 0.20 por bombilla que vende cumpliendo la garantía. De la producción de un día, que
es de 1000 bombillas prueba 1. Determine:
a) ¿La probabilidad de que cumpla la garantía.
b) ¿Que utilidad puede esperar en la producción diaria de 1000 bombillas.
SOLUCION:

Por los datos que nos dan el problema se resuelve por la distribución exponencial por lo que debemos de
aclarar primero que es cada dato que nos dan:

X = duración de las bombillas eléctricas con una desviación exponencial.

= 1000 = E (x)

= 1 / E (x) = 1/1000

Se garantiza una duración mayor de 900 hrs.

P( t < 900) entonces pierde Q 0.30

P( t > 900) entonces gana Q 0.20

N = 1000 bombillas de la producción de un día.

Por lo que nuestra formula exponencial es:

-t

P( t < 900) = 1 - e = 1 - e -(1/1000)*900 = 1- 0.4065 = 0.5934

- t --

P( t > 900) = e = e -(1/1000)*900 = 0.4065

a) La probabilidad que se cumpla la garantía es 0.4065

Sea U la utilidad de la empresa por la ganancia o pago de garantía.

b) por lo que la utilidad esperada para la producción.

en 1000 bombillas = -97.2


26.Suponer que se obtienen barras de chocolate de 1/2 libra, con una maquina a partir de pedazos más
grandes. Si se supone que los pedazos más grandes son de densidad uniforme y si la longitud de la
barra es exactamente 3 3/8 de pulgada, entonces la barra pesa 1/2 libras.
Suponga que la longitud real X de una barra tiene la misma probabilidad de estar comprendida en el
intervalo 3.35 y 3.45 pulgadas. Suponiendo que las longitudes cortadas por esta maquina son
independientes; Cuál es la probabilidad de que de 4 barras determinadas dos pesen menos de 1/2
libras y 2 mas de 1/2 libras.
SOLUCION:

Primero debemos de tomar encuentra los datos que nos dan para entender que es lo que se nos esta
preguntando.

Si la longitud de la barra es 3 3/8 pulgadas, pesa 1/2 libras, entonces;

X = longitud de la barra, que tiene una distribución uniforme entre

3.35 X 3.45 pulg.

Ya teniendo claro por que forma se va a trabajar procedemos a calcular las probabilidades que nos piden:

P( pesen menos de 1/2 libras) = P( mide menos de 3.375 pulg.)

P( pesen mas de 1/2 libras) = 1 - P( pesen menos de 1/2 libras)

P( X 3.375) = (3.375 - 3.35)10

P( X 3.375) = 0.25

P( X > 3.375) = 0.75

Suponiendo que las longitudes cortadas son independientes entonces;

Si n = 4 barras la probabilidad de que 2 pesen menos de 1/2 libras y 2 pesen mas de 1/2 libras es:

Y= numero de barras que pesan menos de 1/2 libras

P(Y=2) = 4 C 2 * 0.25 2 * 0.75 2 = 0.2109

27.Suponga que X, el largo de una varilla, tiene una distribución normal con media 10 pulgadas y
variancia 4 pulgadas cuadradas. En vez de medir el valor de x, sólo se especifica si se cumplen ciertas
exigencias. Específicamente, cada varilla fabricada se clasifica como sigue:
A) X menor que 8, B) 8<X<12 y C) X mayor que 12. Si se fabrican 15 de tales varillas, cuál es la
probabilidad de que un número igual de varillas caigan en cada una de las categorías anteriores?
SOLUCION:

Si la variancia es 4, entonces la desviación Estándar es 2. De modo que la distribución normal tiene


parámetros:

m =10 s =2
La probabilidad de que las varillas midan menos de 8 pulgadas:

Z= (8-10) / 2 =-1, su área externa es: 0.1587

Por simetría, la probabilidad de midan mas de12 pulgadas también es 0.1587

El área que representa P(8<X<12)=1-2*0.1587= 0.6826

Si se fabrican 15 varillas y se considera la fabricación de cada una como eventos independientes, la


probabilidad de que 5 de ellas midan menos de 8, 5 entre 8 y 12 y las otras 5 midan más de 12 se calcula de
acuerdo a la distribución multinomial.

N= 15 P(X 1 = 5, X 2 = 5, X 3 = 5) = 15! / (5! 5 ! 5!) * 0.1587 5 0.1587 5 *0.6826 5

= 0.0011364

28.Los trenes de cierta línea del Metro corren cada media hora entre media noche y las 6 de la mañana.
¿Cuál es la probabilidad de que un hombre que entre en la estación en un tiempo al azar durante ese
periodo tenga que esperar por lo menos 20 minutos; esto es el tiempo hasta la salida del siguiente tren
sea mayor o igual a 20 minutos?
PLANTEAMIENTO

Los trenes llegan cada media hora entre las 12 PM y las 6 AM Un hombre entra a la estación en un tiempo al
azar

Si X es la variable aleatoria en que el hombre llega, X tiene una distribución uniforme entre las 12 PM y las 6
AM.

f(x) = 1 / 360 Donde X = tiempo en minutos

PREGUNTA
Cual es la probabilidad de que el tiempo entre la llegada del hombre y la salida del próximo tren sea
mayor o igual a 20 minutos?
SOLUCION:

Para la solución de este problema se debe plantear la probabilidad en base a un intervalo de tiempo menor o
igual a 10 minutos, ya que este es el tiempo en el cual el hombre tendría que llegar a la estación luego de
haber salido un tren de la misma para poder tener una probabilidad de espera mayor o igual a 20 minutos, por
ejemplo ya que en el problema se nos dice que los trenes salen cada 30 minutos. Debe de esperar mas de 20
minutos si llega entre la 1:00 y 1:10.

Del gráfico elaborado en el planteamiento previo, nos damos cuenta que existen 12 intervalos posibles de
tiempo en el cual el hombre puede llegar a la estación, en donde cada rectángulo pequeño representa un
intervalo de tiempo de 10 minutos, por lo que la probabilidad que buscamos queda planteada de la siguiente
manera:

P(0 < X £ 10) = P(0 < X £ 10) + P(30 < X £ 40) + P(60 < X £ 70) + .......................... + P(330 < X £ 340)
Puesto que para todos los intervalos la posibilidad es igual, ya que la variable de tiempo siempre es 10
minutos, entonces nos queda lo siguiente:

P(0 < X £ 10) = 10 / 360 = 1 / 36

Ya que existen 12 intervalos de tiempo con una longitud de 10 minutos, entonces la probabilidad que
buscamos nos queda:

P(esperar ³ 20min) = 1 / 36 x 12 = 0.3333


29.Una compañía está planeando producir impresoras de matrices de puntos que se emplearán con
microcomputadoras. Un problema que afronta es la decisión de fabricar o comprar las cabezas de
impresión. Puede comprarlas a un fabricante a $35 cada una o producirlas en su propia planta con
costos variables de $24 por unidad. Si opta por lo segundo tendrá que erogar costos fijos de $28000 al
año. Debido a las unidades defectuosas cada impresora requiere 1.15 cabezas de impresión. La
compañía prevee que la demanda anual de sus impresoras tendrá una distribución normal con media
3000 unidades y una desviación estándar de 700 unidades.¿Qué probabilidades hay de que el uso
requerido de las cabezas de impresión sea suficientemente grande para justificar la producción y no
su adquisición? Si la política de la compañía es fabricar los componentes solo cuando hay
probabilidad mayor de 60% de que el uso se encuentre 1.5 desviaciones estándar sobre el punto de
equilibrio entre la fabricación y la compra, ¿Qué decisión habrá que tomarse en ese caso?
PLANTEAMIENTO

Sea X la variable demanda anual de impresoras, tienen una distribución normal con media 3000 y desviación
estándar 700

Las unidades que se necesitan producir o comprar, están en función de la demanda 1.15 X

La decisión de producir o comprar debe tomarse con el objetivo de minimizar los costos, sea A el número de
cabezas compradas o fabricadas, los costos asociados son

Si se compran 35 A, si se fabrican 24 A + 28000

SOLUCION

Los costos de las dos alternativas son iguales cuando A = 2546 unidades

35 A = 24 A + 28000

11 A = 28000

A = 2545.45

La demanda de Cabezas de impresión X = 2546/1.15= 2213.43

Si la demanda es mayor que 2213 es mejor producir que comprar.

La probabilidad de que la demanda justifique producir es igual a la probabilidad que la demanda sea mayor
que 2213

P( X ³ 2213) = P( Z ³ -1.124) = 0.8686

Si la política de la compañía es fabricar solo cuando hay una probabilidad mayor de 60% de que la demanda
se encuentre a 1.5 desviaciones sobre el punto de equilibrio entre la fabricación y la compra, 2213, esto es la
demanda es mayor a 2213 +1.5 *700 = 3263

La probabilidad de que la demanda sea mayor a 3263 es igual a la probabilidad de que la variable Z sea
mayor 0.375,
P(Z ³ 0.375) = 0.355 por lo tanto deben comprarse los módulos.

30. Una compañía presta servicios de jardinería a los dueños de casas y a las empresas pequeñas.
Está planeando comprar un nuevo distribuidor de fertilizantes que cuesta $43.50. Se estima que con él
ahorrará 8 minutos de trabajo por cada hora de uso. El especialista en el cuidado del césped estima
que la vida esperada del distribuidor es apenas 48 horas debido a la corrosión y que las
probabilidades son de 7 a 5 de la que su vida oscile entre 42 y 54 horas siguiendo una distribución
normal. Si la compañía paga a sus jardineros $12.50 por hora ¿Cuál es la probabilidad de que el
distribuidor se pague con su trabajo antes de deteriorarse?
PLANTEAMIENTO

Costo del distribuidor $43.50

Pago al personal $12.50 por hora

Ahorro 8 minutos por hora esto es$1.667 por hora

El distribuidor se paga si trabaja 26.09 horas

SOLUCION

La vida del distribuidor es una Variable Aleatoria con media 48 horas

La probabilidad de que la vida oscile entre 42 y 54 horas es 7/12, entonces ,si se supone que la distribución es
normal, la probabilidad de que la vida oscile entre 42 y 48 horas es 0.2916

P( 42 £ X £ 48)= 0.2916

El valor Normal estándar para esta área es Z = 0.81

Por lo que la desviación estándar es 7.4

La probabilidad de que el distribuidor se pague con su trabajo antes de deteriorarse es

P( X ³ 26.09) = P( Z ³ -2.96) = 0.9985

31. Los eslabones usados en la fabricación de cadenas están normalmente distribuidos con respecto a
su resistencia media de 1000 kg. Y desviación estándar de 50 kg. . Cada cadena es fabricada
empleando 20 eslabones.
Cuál es la probabilidad que una cadena se rompa soportando un peso de 900 kg.Cuál debe ser la
resistencia mínima promedio para que el 99% de las cadenas fabricadas soporten 900 kg sin romperse
PLANTEAMIENTO

La resistencia de los eslabones es una variable aleatoria normal con media 1000 Kg y desviación estándar 50
Kg

Cada cadena se fabrica con 20 eslabones, la cadena se rompe si al menos uno de los eslabones se rompe.

La probabilidad de que se rompa la cadena P(A) es

P(A)= 1-P(ninguno de los eslabones se rompe)

SOLUCION

Para cada eslabón

P(X £ 900) = P(Z £ (900-1000)/50) = P(Z £ -2)= 0.0228

P( X ³ 900) = 1- 0.228 = 0.977


La probabilidad de que se rompa la cadena es 1- 0.977 20

La resistencia mínima para que el 99% de las cadenas no se rompa R es:

Probabilidad de que no se rompa la cadena = 0.99 = V 20

Donde V es la probabilidad de que un eslabón no se rompa, es decir soporte

una resistencia mayor que 900 gr

V = 0.99999

La variable Z normal estándar que le corresponde es Z= -3.5

-3.5 = (900 -R) / 50

De donde R es como mínimo 1075 gr

Variables Aleatorias Discretas Especiales


22.El lanzamiento de un cohete se considera seguro después de que se han realizado tres pruebas
exitosas. La probabilidad de una prueba con éxito es de 0.8.
a) Que probabilidad hay de obtener 3 éxitos en 6 pruebas del cohete?
b) Cual es la probabilidad de que el primer éxito se obtenga en la tercera prueba?
c) Al completar las tres pruebas con éxito, el cohete es lanzado. Este lanzamiento proporciona una
información que obtiene ingresos por Q.200,000 y para cada prueba se invierten Q.10,000. Cual es la
ganancia esperada en cada lanzamiento de un cohete?
SOLUCION:

a) Este es un caso de distribución Binomial, ya que tenemos:

Pruebas independientes

Éxito o fracaso

No interesa el orden

X = # de éxitos en "n" pruebas

p = probabilidad de éxito es constante

q=1-p

Entonces la probabilidad que buscamos es:

n=6

X=3

p = 0.8

q = 0.2

P(X = 3) = 6 C 3 (0.8) 3 (0.2) 3 = 0.08192

b) Este es un caso de distribución Geométrica, ya que tenemos:

Pruebas independientes

Éxito o fracaso
Interesa el "primer" éxito

X = # de pruebas hasta obtener el "primer" éxito

p = probabilidad de éxito es constante

q=1-p

Entonces la probabilidad que buscamos es:

X=3

p = 0.8

q = 0.2

P(X = 3) = (0.8)(0.2) 3-1 = 0.032

c) Para la solución de este inciso, se debe de plantear primeramente una ecuación matemática que nos
permita conocer la ganancia esperada en un determinado numero de pruebas.

El problema nos dice que el cohete es lanzado al haber obtenido 3 pruebas con éxito, lo que representa tener
un ingreso de Q.200,000 por cada lanzamiento y nos dice que en cada prueba se invierten Q.10,000.

Puesto que no se conoce el # de pruebas necesarias para conseguir las 3 pruebas exitosas, entonces
tenemos que involucrar un variable que afecte al dinero invertido en cada prueba, a esta variable la
llamaremos X y nos representara el # de pruebas necesarias para obtener 3 éxitos. Por lo que la ecuación que
se necesita para este problema nos queda de la siguiente forma:

G = 200,000 - 10,000X

Donde:

G = ganancia esperada

X = numero de pruebas realizadas hasta obtener los 3 éxitos Puesto que X representa una variable de
distribución de Pascal, aplicamos E(x) a toda la ecuación y nos quedara de la siguiente forma:

E(G) = 200,000 - 10,000E(X)

Donde:

E(X) = r / p

Entonces la ganancia esperada es de:

r=3

p = 0.8

E(G) = 200,000 - 10,000(3 / 0.8) = Q.162,500


23.El número de buques tanques, N, que llegan cada día a cierta refinería tiene una distribución de
Poisson con parámetro l = 2. Las actuales instalaciones portuarias pueden despachar tres buques al
día. Si más de tres buques llegan en un día, los que están en exceso deben enviarse a otro puerto.
a) En un día determinado, cuál es la probabilidad de tener que hacer salir buques tanques?
SOLUCION :

Como el máximo diario que se puede atender es tres, significa que si llegan más de tres será necesario
desviarlos. Por lo tanto, se reduce a calcular P(N £ 3)
Usando la distribución de Poisson:

P(N £ 3)=P(N=0)+P(N=1)+P(N=2)+P(N=3)

b ) En cuánto deben aumentarse las instalaciones actuales para asegurar con una probabilidad del
90% la atención de los buques tanques que lleguen?
SOLUCION:

En esta caso, debe calcularse las probabilidades acumuladas para 3,4,5.... buques, lo cual se facilita en la
siguiente tabla:

BUQUES P(X=N) ACUM. P(x £ N)

N=3 0.1804 0.8569

N=4 0.0902 0.9407

N=5 0.0360 0.9834

Conclusión: Si se aumenta la capacidad a 4 barcos diarios, se tiene más del 90% de probabilidad, lo que
equivale a la capacidad de atención diaria de más de 90% de los días.

c ) ¿Cuál es el número esperado de buques tanques que llegan al día?

Respuesta: 2 (lambda es la media o valor esperado)

d) ¿Cuál es el número más probable de buques que llegan al día?

Respuesta: 1 o 2 tienen la misma probabilidad de ocurrir.

e) ¿Cuál es el número esperado de buques atendidos diariamente?


SOLUCION: en la refinería pueden atender como máximo 3 buques tanques.

Si la variable aleatoria Y es el número de buques atendidos, Y tiene la siguiente

Distribución de Probabilidades

0 1 2 3
Y

0.1353 0.2706 0.2706 0.3235


P(Y)

El numero esperado de buques atendidos es 1.7823

f) Cuál es el número esperado de buques devueltos diariamente?


SOLUCION: Los buques son devueltos cuando llegan más de 3. Z es la variable número de buques devueltos
y tiene la siguiente distribución de probabilidades
Z 0 1 2 3 4 5 6 7 o más

P(Z) 0.8571 0.0902 0.036 0.012 0.0034 0.0009 0.0002 aprox.0

El valor esperado de Z es aproximadamente 0.217

24.El juego de Juan con Suerte se juega como sigue: Se tiran 3 dados legales y el jugador apuesta
Q1.00 a la ocurrencia del numero 5. Entonces si ocurre un 5 en alguno de los tres dados, gana Q.2.00.
Si aparecen dos 5 gana Q.3.00, y si aparecen tres 5 gana Q4.00 de lo contrario pierde el quetzal. Si una
persona juega 5 veces consecutivas, ¿Cuál es la probabilidad que 2 veces gane Q.3.00, una vez Q2.00
y una vez pierda el quetzal?
PLANTEAMIENTO

- Tiran 3 dados legales y el jugador apuesta Q.1.00 a la ocurrencia del #5 y sabemos que por la ocurrencia de:

Un 5 ® gana Q.2.00

Dos 5 ® gana Q.3.00

Tres 5 ® gana Q.4.00

Ningún 5 ® pierde Q1.00

Si X es la variable aleatoria ganancia del juego,

Si Y representa el numero de cincos que aparecen en el lanzamiento, entonces:

Procedemos a calcular las probabilidades para cada una de las apariciones del #5.

Por no importar el orden de aparición y existir pruebas independientes, las probabilidades se calculan en base
a una distribución binomial y nos quedan de la manera siguiente:

Por consiguiente la distribución de probabilidades para la variable X es:

PREGUNTA
¿Cuál es la probabilidad de que 2 veces gane Q.3.00, una vez gane Q.2.00 y una vez pierda Q.1.00?
SOLUCION:

Este es un caso de distribución Multinomial, ya que existen:

Pruebas independientes

Varios resultados posibles


No interesa el orden

X 1 = # de veces que aparece tres 5 en "n" lanzamientos

X 2 = # de veces que aparece dos 5 en "n" lanzamientos

X 3 = # de veces que aparece un 5 en "n" lanzamientos

X 4 = # de veces que aparece ningún 5 en "n" lanzamientos

P = probabilidad que tiene cada aparición del numero 5

P(X 1 =n 1 ; X 2 =n 2 ; X 3 =n 3 ) = n! P1 n 1 P2 n 2 P3 n 3 ....
n1!n2!n3!...

Entonces con:

n=5

X 2 = 2 P 2 = 0.06944

X 3 = 1 P 3 = 0.3472

X 4 = 1 P 4 = 0.5787

P(X 2 =2; X 3 =1; X 4 =1) = 5! (0.06944) 2 (0.3472)(0.5787) = 0.058130


2!1!1!

Variables Aleatorias Bidimensionales Continuas




Distribuciones de Probabilidad, Distribución Marginal y Esperanza Matemática.


16.Si x,y son variables aleatorias continuas con funcion de densidad de
Probabilidad:
f(x,y) = 18x 2 y 2 0 £ x £ 1 ; 0 £ y £ x
a) encuentre la probabilidad P( x < 1/2, y < 1/3 )
b) la distribución marginal de x
c) la distribución marginal de y

RECORRIDO XY

a) P(x < 1/2, y < 1/3) = P(0 £ x £ 1/3, 0 £ y £ x) + P(1/3 £ x £ 1/2, 0 £ y £ 1/3)
1/ 3 x 1/ 2 1/ 3

= ò ò 18x 2 y 2 dydx + ò ò 18x 2 y 2 dydx

0 0 1/ 3 0

= 0.0013717 + 0.0065157

= 0.007887

b) g(x) = ò 18x 2 y 2 dy = 18/3 x5 0 £ x £ 1

c) h(y) = ò 18x 2 y 2 dx = 6y 2 (1 - y 3 ) 0 £ y £ 1

17.Una cafetería de servicio tanto a clientes que llegan en automóvil como a los que llegan caminando.
En un día elegido al azar, sean x,y respectivamente, las proporciones del tiempo en las que se utilizan
las instalaciones para atender automovilistas y a los que llegan caminando. Suponga que la función de
densidad conjunta de las variables esta dada por:
f(x,y) = 2/3(x + 2y) 0 < x £ 1, 0 £ y £ 1
Encuentre la probabilidad de que las instalaciones para atender a los que llegan caminando estén
ocupados menos de la mitad del tiempo.

g(y) = ò 2/3(x + 2y)dx = 1/3 + 4/3y 0 £ y £ 1


0

0.5

P(y < 0.5) = ò (1/3 + 4/3y)dy = 1/3

18.En cierto proceso, para elaborar una sustancia química, el producto final Contiene dos tipos de
impurezas. En una muestra de este producto "x" denota la proporción de impurezas y "y" la
proporción de impurezas tipo 1, entre todas las impurezas encontradas. Suponga que se puede
elaborar un modelo de la distribución conjunta x,y mediante la función:
f(x,y) = 2(1 - x) 0 £ x £ 1, 0 £ y £ 1
Encuentre el valor esperado de la proporción de impurezas tipo 1 en la muestra.
SOLUCION:

Sea Z la variable proporción de impurezas tipo 1 en la muestra:

Z = xy 1 1

E(z) = E(xy) = ò ò (xy)(2(1 - x))dydx

00

11

= ò ò 2xy(1 - x)dydx = 1/6


19.Si x,y tienen función de densidad conjunta:
f(x,y) = 1/y 0 < x < y ; 0 < y < 1
Encuentre:
P(x+y > 1/2)

P(x+y > 1/2) = 1 - P(x+y < 1/2)

0.25 y 0.5 0.5 - y

= 1 - [ ò ò 1/y dxdy + ò ò 1/y dxdy ]

0 0 0.25 0

P(x+y > 1/2) = 1 - 0.3465 = 0.6535


20. Dos variables aleatorias tienen una densidad conjunta dada por: f (X) = K ( X 2 + Y 2 ) 0 £ X £ 2
1£Y£4
A) Encuentre el valor de la constante K.
B) Encuentre la probabilidad de P ( 1 £ X £ 2 , 2 £ Y £ 3 )
C) Encuentre la probabilidad P ( X + Y > 4 )
P(0 £ X £ 2 , 1 £ Y £ 4)

24

ò ò K ( X 2 + Y 2 ) dx dy = 1

01

Entonces: 50 K = 1

K = 1/50

f ( XY ) = 1/50 ( X 2 + Y 2 )

23

B) P ( 1 £ X £ 2 , 2 £ Y £ 3 ) = ò ò 1/50 ( X 2 + Y 2 ) dy dx = 26/150

12

C) P ( X + Y > 4 ) = P ( 0 £ X £ 2 , 4-X £ Y £ 4 ) = ò ò 1/50 ( X 2 + Y 2 ) dy dx

0 4-X

= 0.533
x+y=4,y=4-y

21. La función de densidad conjunta para las variables aleatorias ( XY ) es: f (XY ) = 6 X , cuando 0 £ X £
1 , 0 £ Y £ 1 - X.
Encuentre la probabilidad de que X sea mayor que 0.3 dado que Y es Igual a 0.5.

f (XY) = 6 X 0 £ X £ 1 0 £ Y £ 1-X

P ( X > 0.3 / Y = 0.5 )

1-Y1-Y

g (Y ) = ò 6 X dx = 6 X 2 = 6 ( 1 - Y ) 2 = 3 ( 1 - Y ) 2

0202

f ( X/Y ) = 6 X f ( X/Y = 0.5 ) = 6X = 8 X

3 ( 1 - Y ) 2 0.75

cuando 0 £ X £ 0.5

0.5

P ( X > 0.3 / Y = 0.5 ) = ò 8X dx = 0.64

0.3

Variables Aleatorias Bidimensionales Discretas

VARIABLES. ALEATORIAS. BI- DIMENSIONALES. DISCRETAS:


Distribución Conjunta de Probabilidades y Esperanza Matemática .
11. Una fábrica tiene funcionando dos máquinas A y B. Si X y Y representan el número de veces que
pueden fallar en un día determinado la máquina A y la máquina B respectivamente y C(x) y C(y)
representan los costos que implica el número de fallas y cuyas funciones de probabilidad son las
siguientes :
X ¦ (x) C(x)

1 0.14 30

2 0.42 40

3 0.19 70
4 0.25 100

Y ¦ (y) C(y)

1 0.29 35

2 0.71 58

a) Cuál es la probabilidad de que en un día dado falle más la máquina B que la máquina A?
b) Si la máquina A falló menos de cuatro veces Cuál es la probabilidad de que ambas máquinas fallen
dos veces?
c) Cuál es la función de probabilidad del número total de fallas que pueden sucederle a la empresa en
sus máquinas en determinado día?
d) Cuál es el costo esperado para un día cualquiera en arreglos de descomposturas?
SOLUCION:

Podemos elaborar una distribución conjunta de las variables X & Y. Puesto que dichas variables son
independientes:

¦ (x,y) = f(x) * f(y)

X
Y 1 2 3 4 ¦ (y)

0.0406 0.1218 0.0551 0.0725 0.29


1

0.0994 0.2982 0.1349 0.1775 0.71


2

0.14 0.42 0.19 0.25 1


¦ (x)

a) Simbólicamente lo pedido es : P(Y > X), evento que sucede únicamente cuando Y=2 y X= 1, por lo tanto la
probabilidad pedida es P(X=1 y Y=2 ) que es f (1,2)= 0.0994.

b) Si definimos los siguientes eventos:

A: Evento que consiste en que la máquina A falle 2 veces y que la máquina B falle 2 veces.

B: Evento que consiste en que la máquina A falle menos de 4 veces.

Entonces:

P(A/ B ) = P(A Ç B ) / P(B) = f (2, 2) /[ g( 1 ) + g( 2) + g ( 3)]

= 0.2982 / (0.14+0.42+0.19) = 0.3976

R/ La probabilidad es de 0.3976

c) Cuál es la función de probabilidad del número total de fallas que pueden sucederle a la empresa en sus
máquinas en determinado día?

Si T = Número total de fallas,

T = {2, 3, 4, 5, 6}

Entonces :

P(T=2) = f(1,1) = 0.0406


P(T=3) = f(1,2) + f(2,1) = 0.0994 + 0.1218 = 0.2212

P(T=4) = f(2,2) + f(3,1) = 0.2982 + 0.0551 = 0.3533

P(T=5) = f(3,2) + f(4,1) = 0.1349 + 0.0725 = 0.2074

P(T=6) = f(4,2) = 0.1775

Por consiguiente la distribución de probabilidad es:

T ¦ (T)

2 0.0406

3 0.2212

4 0.3533

5 0.2074

6 0.1775

d) Sea Z (X, Y) la variable de costo, que combine el costo de las dos máquinas:

Z(X,Y) = C(x) + C(y), siendo la probabilidad de Z igual a f(x,y):

Podemos elaborar la siguiente distribución de probabilidad del costo de Z:

Z(x,y) = C(x) + C(y) ¦ (Z) = f(x,y) Z * ¦ (Z)

Z(1,1) = 65 0.0406 2.369

Z(1,2) = 88 0.0994 8.7472

Z(2,1) = 75 0.1218 9.135

Z(2,2) = 98 0.2982 29.2236

Z(3,1) = 105 0.0551 5.7855

Z(3,2) = 128 0.1349 17.2672

Z(4,1) = 135 0.0725 9.7875

Z(4,2) = 158 0.1775 28.045

S= 110.36

R/ El costo esperado es de Q 110.36.


Variables Aleatorias Unidimensionales Continuas

Distribución de Probabilidades, Esperanza Matemática y Varianza.


11. Sea X una variable aleatoria con función de densidad de probabilidad siguiente:

Hallar:
a) El valor de a
b) P(1.5 £ x £ 2.5)
c) La función de distribución
d) La esperanza matemática
e) La variancia
SOLUCION:

a) Sabemos que

ó¥

ô f(x)dx = 1

õ-¥

Por lo tanto

ó1ó2ó3

ô axdx + ô adx + ô a(3 - x)dx = 1

õ0õ1õ2

Integrando nos queda

ù1ù2ù3

a(x²/2) ú + ax ú + a(3x - x²/2) ú = 1

û0û1û2

Valuando en los limites correspondientes

a(1/2) + a(2 - 1) + a[(9 - 9/2) - (6 - 2)] = 1

Operamos

1/2a + a + (9/2 - 4)a = 1 Þ a/2 + a + a/2 = 1

2a = 1 Þ a = 1/2

Por lo tanto la función f(x) resulta:

b) P(1.5 £ x £ 2.5) = ?

Tenemos que:

ób
P(a<x<b) = ô f(x)dx

õa

Como el intervalo de probabilidad corresponde al segundo y tercer términos de la función de densidad


valuamos directamente en estos.

ó 2 ó 2.5

P(1.5 £ x £ 2.5) = ô 1/2dx + ô 1/2(3-x)dx

õ 1.5 õ 2

Integramos

ù 2 ù 2.5

P(1.5 £ x £ 2.5) = 1/2x ú + 1/2(3x - x²/2) ú

û 1.5 û 2

Evaluamos los limites

P(1.5 £ x £ 2.5) = 1/2(2 - 1.5) + 1/2[(7.5 - 3.125) - (6 - 2)]

Operando

P(1.5 £ x £ 2.5) = 0.25 + 1/2(4.375 - 4) Þ P(1.5 £ x £ 2.5) = 0.25 + 0.1875

P(1.5 £ x £ 2.5) = 0.4375

a) Tenemos la función de distribución de probabilidad o función de distribución acumulada

óx

F(x) = ô f(t)dt

õ-¥

Por lo tanto para el intervalo 1 £ x<2 tenemos

óx

F(x) = ô (1/2t)dt

õ0

Integrando

ùx

F(x) = 1/2(t²/2) ú

û0

Valuando los limites

F(x) = 1/4x²

Para el intervalo 1 £ x £ 2 tenemos

ó1óx
F(x) = ô (1/2t)dt + ô (1/2)dt

õ0õ1

Integrando

ù1ùx

F(x) = 1/4(t²) ú + 1/2(t) ú

û0û1

Valuando

F(x) = 1/4 + 1/2x -1/2

Operando resulta

F(x) = 1/2x - 1/4

Para el resto de la función

ó1ó2óx

F(x) = ô (1/2t)dt + ô 1/2dt + ô 1/2(3 - t)dt

õ0õ1õ2

Integrando nos queda

ù1ù2ùx

F(x) = 1/2(t²/2) ú + 1/2t ú + 1/2(3t - t²/2) ú

û0û1û2

Valuando en los limites correspondientes

F(x) = 1/4 + 1 - 1/2 + 1/2[(3x - x²/2) - (6 - 2)]

Operando

F(x) = 1/4 + 1/2 + 3/2x - x²/4 - 2

F(x) = - x²/4 + 3/2x - 5/4

Por lo tanto la función de distribución es

b) E(x) = ?

Sabemos que

ó¥

E(x) = ô xf(x)dx

õ-¥
Por lo tanto:

ó1ó2ó3

E(x) = ô x(1/2x)dx + ô x(1/2)dx + ô x[1/2(3 - x)]dx

õ0õ1õ2

Integrando:

ù1ù2ù3

E(x) = 1/2(x³/3) ú + 1/2(x²/2) ú + 1/2(3/2 x² - x³/3) ú

û0û1û2

Valuando los limites

E(x) = 1/6 + 3/4 + 1/2[(27/2 - 9) - (6 - 8/3)]

Operando

E(x) = 1/6 + 3/4 + 1/2(9/2 - 10/3) Þ E(x) = 1/6 + 3/4 + 9/4 - 10/6

Þ E(x) = 18/12 Þ E(x) = 1.5

c) V(x) = ?

Sabemos que:

s ²(x) = E(x²) - m ²

Calculando E(x²)

ó¥

E(x²) = ô x²f(x)dx

õ-¥

Por lo tanto:

ó1ó2ó3

E(x²) = ô x² (1/2x)dx ô x² (1/2)dx + ô x² [1/2(3 - x)]dx

õ0õ1õ2

Integrando:

ù1ù2ù3

E(x²) = 1/2(x^4/4) ú + 1/2(x³/3) ú + 1/2(3/3 x³ - x^4/4) ú

û0û1û2

Valuando los limites

E(x²) = 1/8 + 7/6 + 1/2[(27 - 81/4) - (8 - 4)]

Operando

E(x²) = 1/8 + 7/6 + 1/2(27/4 - 4) Þ E(x²) = 1/8 + 7/6 + 11/8


Þ E(x²) = 64/24 Þ E(x ² ) = 2.67

Entonces:

s ²(x) = E(x²) - m ²

Sustituyendo valores:

s ²(x) = 8/3 - (3/2)² Þ s ²(x) = 5/12 = 0.42

Variables Aleatorias Unidimensionales Discretas

Distribución de Probabilidades.
10. Se lanza una serie de cohetes hasta que el primer lanzamiento sea exitoso. Si esto no ocurre en 5
ensayos el experimento se detiene. Suponga que hay una probabilidad constante de 0.9 de tener un
lanzamiento exitoso y los ensayos son independientes.
El costo del primer lanzamiento es K quetzales, mientras que los lanzamientos siguientes cuestan K/3
quetzales. Cada vez que hay un lanzamiento exitoso se obtiene un beneficio de C quetzales. Si T es la
ganancia neta del experimento, encuentre la distribución de probabilidades de T.

Eventos f(T) f(P)

1 K 0.9

2 4K/3 0.09

3 5K/3 0.009

4 2K 0.0009

5 7K/3 0.00009

Un quinto intento con fracaso

Eventos f(T) f(P)

5 8K/3 0.00001
11. De 5 trabajadores de una fabrica uno mide 5.7', uno 5.6', dos miden 5.5´y el otro mide 5.0´. Se
escogen 2 trabajadores al azar sin reemplazo. Sea Z la variable aleatoria que representa la estatura
promedio de los trabajadores escogidos. Hallar:
a) La distribución de probabilidades de Z y graficarla;
b) La función de distribución acumulada de Z y graficarla
c) P (Z < 5.4)
PLANTEAMIENTO

- Se tienen 5 trabajadores:

# ESTATURA TRABAJADOR

1 5.7' A

2 5.6' B

3,4 5.5' C,D

5 5.0' E

- Se seleccionan 2 trabajadores al azar sin reemplazo.

- Z = altura promedio de los trabajadores

- Para encontrar el numero de formas de seleccionar 2 trabajadores, se utilizan combinaciones ya que no nos
importa el orden, es selección al azar y sin reemplazo, por lo que tenemos:

5 C 2 = 10

Por lo que nos queda el siguiente conjunto de soluciones:

R Z = {AB, AC, AD, AE, BC, BD, BE, CD, CE, DE}
Y por consiguiente tendremos el siguiente promedio de estaturas para cada solución:

RZ = {5.65, 5.6, 5.6, 5.35, 5.55, 5.55, 5.3, 5.5, 5.25, 5.25}

SOLUCION:

a) y b) Para la solución de estos dos incisos es necesario elaborar una tabla que nos indique la probabilidad
de cada una de las alturas promedios antes encontradas, así como también a partir de estas probabilidades
se calculan las acumuladas que nos servirán para la solución del inciso b). Para el calculo de estas
probabilidades se utilizara la siguiente formula:

P(Z) = n / 10

Donde:

n = # de veces que aparece la estatura promedio en el conjunto de soluciones antes descrito

Z P(Z) A(Z)

5.25 0.2 0.2

5.3 0.1 0.3

5.35 0.1 0.4

5.5 0.1 0.5

5.55 0.2 0.7

5.6 0.2 0.9

5.65 0.1 1.0

Esperanza Matemática.
12. Los registros de una compañía de Seguros de automóviles dan la siguiente información sobre
accidentes: la probabilidad de que un conductor asegurado tenga un accidente es de 0.15, si ocurre un
accidente, la magnitud del daño al vehículo es el 20% de su valor con probabilidad 0.8, 60% del valor
con probabilidad 0.12 y pérdida total con probabilidad 0.08. Qué prima debe cobrar la companía por un
automóvil de Q 40,000 para que la ganancia esperada de la compañía sea cero?
SOLUCION:

1) Inicialmente, para que la compañía tenga ganancia cero, implica que lo que cobre es lo mismo que pague
por daño a un vehículo

2) Hay dos eventos que deben ocurrir: que tenga un accidente y el grado de daño, si es que tiene el
accidente, por lo tanto, se multiplica 0.15 por cada una de las probabilidades, así por ejemplo, la probabilidad
de que el daño sea del 20% es la probabilidad de que tenga accidente multiplicada por la probabilidad de que
el daño sea de 20% dado que tiene un accidente, finalmente se construye una nueva tabla:

20% 60% 100% 0%


% DAÑO

0.12 0.018 0.012 0.85


PROB. OCURRENCIA.
3) con esta información se calcula la esperanza de daño:

20*.12+60*.018+100*.012 + 0*0.85 =4.68%

4) Finalmente, se multiplica el daño esperado por el precio del vehículo:

Precio a cobrar= Q40,000*.0468=Q 1872

13. Juan Pérez, director de las publicaciones de los Orioles de Villa Nueva está tratando de decidir
cuántos programas imprimir para la próxima serie de juegos que el equipo sostendrá contra los
Dodgers de Amatitlán. La impresión de cada programa cuesta Q 0.25, se venden a Q 1.25. Los
programas que no se venden deben ser eliminados al terminar la serie. El señor Pérez estima la
siguiente distribución de probabilidades para las ventas del programa:
Volumen de Ventas 25,000 40,000 50,000 70,000
Probabilidad 0.10 0.30 0.45 0.15
Si debe decidir entre 25,000, 40,000, 50,000, 70,000, cuál debe ser el tiraje recomendable para
maximizar las ganancias esperadas?
SOLUCION:

1) Se identifican los siguientes costos: Costo de la impresión Q0.25, Costo de pérdida de oportunidad por
faltantes Q1.25 - Q0.25 = Q1.00

2) Se calcula para todas las posibles alternativas para el tiraje el valor esperado de la ganancia.

Para un tiraje de 25000 ejemplares

Ventas Probabilidad Ingresos Costos Ganancia

25000 0.10 31250 6250 25000

40000 0.30 31250 6250+15000 10000

50000 0.45 31250 6250+15000 0000

70000 0.15 31250 6250+ 25000 - 2000

Ganancia esperada Q2500

Para un tiraje de 40000 ejemplares

Ventas Probabilidad Ingresos Costos Ganancia

25000 0.10 31250 10000 21250

40000 0.30 50000 10000 40000

50000 0.45 50000 10000+10000 30000

70000 0.15 50000 10000+ 30000 10000

Ganancia esperado Q29125


Para un tiraje de 50000 ejemplares

Ventas Probabilidad Ingresos Costos Ganancia

25000 0.10 31250 12500 18750

40000 0.30 50000 12500 37500

50000 0.45 62500 12500 50000

70000 0.15 62500 12500+ 20000 30000

Ganancia esperado Q40125

Para un tiraje de 70000 ejemplares

Ventas Probabilidad Ingresos Costos Ganancia

25000 0.10 31250 17500 13750

40000 0.30 50000 17500 32500

50000 0.45 62500 17500 45000

70000 0.15 87500 17500 70000

Ganancia esperado Q41875

3) De acuerdo con la tabla anterior la ganancia máxima esperada ocurre cuando se imprimen 70000
ejemplares.

Reglas Aditivas
3. En la figura se supone que la probabilidad de que cada relé esté cerrado es "p" y que cada relé se
abre o se cierra independientemente de cualquier otro. Encontrar la probabilidad de que la corriente
pase de I hasta D.

SOLUCION:

La probabilidad de que pase corriente en cada relé es la probabilidad de que esté cerrado ("p"). Y la
probabilidad de que no pase la corriente es "q" = 1 - p.
Notas a considerar:

- Cada relé es independiente de los otros.

- Para que pase corriente de I hasta D esta puede pasar por lo menos en alguna de las siguientes rutas:

Ruta A( Relé 1 y 2); Ruta B(Relé 1 y 3 y 5); Ruta C (Relé 4 y 3 y 2); Ruta D ( Relé 4 y 5.)

Esto es:

P(A U B U C U D) = P(A) + P(B) +P(C) + P(D) - P(A Ç B) - P(A Ç C) - P(A Ç D ) -

P (B Ç C) - P (B Ç D) - P(C Ç D) + P(A Ç B Ç C) + P(A Ç B Ç D)

+P(A Ç C Ç D) + P( B Ç C Ç D) - P(A Ç B Ç C Ç D)

Para que la corriente pase por alguna ruta, TODOS los relés involucrados en esa ruta deben estar cerrados.

P(A) = p * p = p 2

P(B) = p * p * p = p 3

P(C) = p * p * p = p 3

P(D) = p * p = p 2

Para que la corriente pase en las rutas A y B es necesario que 4 relés (1,2,3,5) estén cerrados. Es decir:

P(A Ç B) = p *p *p *p = p 4 .

Este mismo concepto aplicamos para las otras intersecciones:

P(A Ç C) = p 4 P (B Ç C)= p 5

P(A Ç D ) = p 4 P (B Ç D)= p 4

P(C Ç D) = p 4 P(A Ç B Ç C) = p 5

P(A Ç B Ç D)= p 5 P(A Ç C Ç D)= p 5

P( B Ç C Ç D) = p 5 P(A Ç B Ç C Ç D) = p 5

P(A U B U C U D) = p 2 + p 3 + p 3 + p 2 - p 4 -p 4 - p 4 - p 5 - p 4 - p 4 + p 5 + p 5

+p 5 + p 5 - p 5 = 2p 2 + 2p 3 - 5p 4 + 2p 5

R/ La probabilidad de que la corriente pase de I hasta D es 2p 2 + 2p 3 - 5p 4 + 2p 5 .


4. Suponga que una persona viaja a Europa, la probabilidad que ira a Londres es 0.7, a París es 0.64 a
Roma 0.58 a Amsterdam 0.58, que visitara Londres y París 0.45, Roma y Londres 0.42, Londres y
Amsterdam 0.41, París y Roma 0.35, París y Amsterdam 0.39, Roma y Amsterdam 0.32, que visitara
Londres, París y Roma 0.23. Londres, París y Amsterdam 0.26, Londres, Roma y Amsterdam 0.21. Que
conocerá París, Roma y Amsterdam 0.20 y que conocerá las 4 ciudades 0.12. ¿Cual es la probabilidad
que una persona que viaja a Europa conozca
a) Cuando menos una de las 4 ciudades?
b) Exactamente una de las cuatro ciudades?
SOLUCION:

Para la solución del problema se usara la siguiente simbología:

L = Londres
P = París

R = Roma

A = Amsterdam

Datos:

- L = 0.7 - R Ç L = 0.42 - L Ç P Ç R = 0.23

- P = 0.64 - L Ç A = 0.41 - L Ç P Ç A = 0.26

- R = 0.58 - P Ç R = 0.35 - L Ç R Ç A = 0.21

- A = 0.58 - P Ç A = 0.39 - P Ç R Ç A = 0.20

- L Ç P = 0.45 - R Ç A = 0.32 - L Ç P Ç R Ç A = 0.12

Para la solución de problemas de este tipo, se utiliza para visualizar de mejor manera el diagrama de Venn,
con los datos de las intersecciones, restaría calcular las probabilidades de cada evento por sí solo; para ello
tenemos:

Dos eventos:

AyB

P(A solo) = P(A) - P(A Ç B)

Tres eventos:

A, B y C

P(A solo) = P(A) - P(A Ç B) - P(A Ç C) - P(A Ç B Ç C)

Cuatro eventos:

A, B, C y D

P(A solo) = P(A) - P(A Ç B) - P(A Ç C) - P(A Ç D) + P(A Ç B Ç C) + P(A Ç B Ç D) + P(A Ç C Ç D) - P(A Ç B Ç
C Ç D)

Por lo tanto

Para solo L:

P(L) = 0.70 - 0.45 - 0.42 - 0.41 + 0.23 + 0.26 + 0.21 - 0.12

Calculando:

P(L) = 0

Para solo P:

P(P) = 0.64 - 0.45 - 0.35 - 0.39 + 0.23 + 0.26 + 0.20 - 0.12

Calculando:

P(P) = 0.02

Para solo R:

P( R ) = 0.58 - 0.42 - 0.35 - 0.32 + 0.23 + 0.21 + 0.20 - 0.12


Calculando:

P( R ) = 0.01

Para solo A:

P(A) = 0.58 - 0.41 - 0.39 - 0.32 + 0.26 + 0.21 + 0.20 - 0.12

Calculando:

P(A) = 0.01

a) P(cuando menos una de las cuatro ciudades) = ?

Þ P(cuando menos una) = P(L È R È A È P)

Si sabemos que

P(L È R È A È P) = P(L) + P( R ) + P(A) + P(P) - P(L Ç R) - P(L Ç A) - P(L Ç P) - P(R Ç A) - P(R Ç P) - P(A Ç
P) + P(L Ç R Ç A) + P(L Ç R Ç P) + P(L Ç A Ç P) + P(R Ç A Ç P)

- P(L Ç R Ç A Ç P)

Ingresándole valores:

P(L È R È A È P) = 0.7 + 0.64 + 0.58 + 0.58 - 0.45 - 0.42 - 0.41 - 0.35 - 0.39 - 0.32

+ 0.23 + 0.26 + 0.21 + 0.20 - 0.12

P(L È R È A È P) = 0.94

b) P(exactamente una de las cuatro ciudades) = ?

Del diagrama de Benn observamos:

Þ P(ex. Una) = P(solo L) + P(solo R) + P(solo A) + P(solo P)

y concluimos:

P(ex. Una ciudad) = 0.0 + 0.01 + 0.01 + 0.02 = 0.04


5. Una travesía puede hacerse con aviones bimotores o con cuatrimotores. Los bimotores pueden
volar al menos con un solo motor y los cuatrimotores con dos. La probabilidad de que un motor falle
durante la travesía es P. ¿Cuáles aviones son los mas seguros?
SOLUCION:

Para la solución sabemos que P = probabilidad de que un motor que falle y

1 - P = la probabilidad de que no falle.

Por lo tanto:

P = Averiado (malo)

1 - P = funcionando (bueno)

El avión más seguro es el que tiene mayor probabilidad de volar.

Como los motores son independientes sabemos que:

P(A Ç B) = P(A)*P(B) o sea que se den ambos

Avión Bimotor

Posibles combinaciones dado que al menos tiene que funcionar un motor

- M 1 bueno y M 2 malo Þ que funcione 1 motor

- M 1 malo y M 2 bueno Þ "

- M 1 bueno y M 2 bueno Þ que funcionen los dos motores

Entonces:

P(v) = P(M 1 b Ç M 2 m) + P(M 1 m Ç M 2 b) + P(M 1 b Ç M 2 b)

P(v) = (1 - P)P + P(1 - P) + (1 - P)(1 - P)

Operando

P(v) = P - P² + P - P² + 1 - 2P + P²

P(v) = 1 - P² Þ Probabilidad de volar aviones bimotores.

Lo cuál se puede calcular, además con la distribución binomial, donde se limita que pueden volar con al
menos un motor.

Por lo tanto

P(x ³ 1) = P(x=2) + P(x=1)

P(x ³ 1) = 2 C 2 (P) 0 (1 - P)² + 2C1(P)¹(1 - P)¹

Þ P(x ³ 1) = (1 - P)² + 2P(1 - P) Þ P(x ³ 1) = 1 - 2P + P² + 2P - 2 P²

Þ P(x ³ 1) = 1 - P²

Avión Cuatrimotor

Se sigue la misma mecánica que para el avión bimotor, a diferencia que en este serán 4 motores.

P(v) = P(B 1 B 2 M 3 M 4 ) + P(B 1 M 2 B 3 M 4 ) + P(B 1 M 2 M 3 B 4 ) + P(M 1 B 2 B 3 M 4 ) + P(M 1 B 2 M 3


B 4 ) + P(M 1 M 2 B 3 B 4 ) + P(B 1 B 2 B 3 M 4 ) + P(B 1 B 2 M 3 B 4 ) + P(B 1 M 2 B 3 B 4 ) + P(M 1 B 2 B 3
B 4 ) + P(B 1 B 2 B 3 B 4 )
P(v) = (1 - P)(1 - P)PP + (1 - P)P(1 - P)P + (1 - P)PP(1 - P) + P(1 - P)(1 - P)P + (1 - P)P(1 - P)P + PP(1 - P)(1 -
P) + (1 - P)(1 - P)(1 - P)P + (1 - P)(1 - P)P(1 - P) + (1 - P)P(1 - P)(1 - P) + P(1 - P)(1 - P)(1 - P) + (1 - P)(1 -
P)(1 - P)(1 - P)

Operando:

P(v) = 6(1 - P)²P² + 4(1 - P)³P + (1 - P) 4

Þ P(v) = (1 - P)²(6P² + 4(1 - P)P + (1 - P)²)

Þ P(v) = (1 -2P + P²)(6P² + 4P - 4P² + 1 - 2P + P²)

Þ P(v) = (1 -2P + P²)(3P² + 2P + 1)

Þ P(v) = 3P 4 - 4P³ + 1

Para distintos valores de P la probabilidad de vuelo en los dos tipos de aviones se observa en la siguiente
tabla, la cuál muestra el comportamiento en las probabilidades y se observa que a menos probabilidad de falla
el mas seguro es el avión cuatrimotor, y a mayor probabilidad de falla los bimotores, por lo que se concluye
que son mas seguros los aviones bimotores.

VALORES DE P AVION BIMOTOR AVION. CUATRIMOTOR

0.05 0.9975 0.99951875

0.1 0.99 0.9963

0.2 0.96 0.9728

0.3 0.91 0.9163

0.4 0.84 0.8208

0.5 0.75 0.6875

0.6 0.64 0.5248

0.7 0.51 0.3483

0.8 0.36 0.1808

0.9 0.19 0.0523

0.95 0.0975 0.01401875

Probabilidad Condicional
9. Durante el mes cero cierto producto es preferido por el 60% del mercado y otros varios por el resto.
Los clientes compran una vez al mes . Si alguien compra el producto A, la probabilidad que lo vuelva a
comprar en el siguiente mes es de 75% y de un 25% de que se cambie. Si un cliente compra un
producto de la competencia en un mes la probabilidad que se cambie al producto A es de 45% y 55%
de que permanezca fiel a la marca de la competencia. Encuentre el porcentaje de participación
esperado en el mercado por A al final del segundo mes.
SOLUCION:

Aquí realizaremos un diagrama de árbol donde definiremos primero la probabilidad de aceptación en el primer
mes por el producto A que en este caso seria el 60%, y el 40% seria el del producto de la competencia.

Para sacar las probabilidades del segundo mes primero debemos de hacerlo para el producto A donde del
60% que compran aquí el 75% sigue comprando este producto y el 25% se cambia al otro producto. Para los
que en el primer mes compraron el producto de la competencia que era el 40% , en el segundo mes que
compraron el 45% se cambio al producto A y el 55% siempre compró el producto de la competencia , tomando
encuentra que el porcentaje es igual a la probabilidad de cada uno por lo que nuestro diagrama del árbol
quedaría de esta forma:

En este caso solo nos interesa que en el segundo mes o sea al final los clientes compren el producto A, esto
quiere decir, que solo vamos a tomar encuentra los porcentajes de aceptación del producto A, ya sea que
desde el inicio compro el producto A o no pero que al final si compro A.

Por lo que nos quedaría de esta forma:

P( C ) = ( 0.6*0.75) + (0.4*0.45) = 0.63

Donde el primer paréntesis representa que al inicio prefiere A y luego permanece en A, y el segundo
paréntesis representa que al inicio prefiere B pero que luego al final prefiere A. Obteniendo así las 2 formas
donde terminan comprando al final el producto A.

También se puede hacer de la siguiente forma:

P( C ) = (A 1 A 2 ) U (B 1 A 2 )

P( C ) = P(A 1 ) * P(A 2 /A 1 ) + P(B 1 ) * P(A 2 /B 1 )

En donde;

P(A)= 0.6

P(B)= 0.4

P(A 2 /A 1 ) = 0.75

P(B 2 /A 1 )= 0.25
P(B 2 /B 1 )= 0.55

P(A 2 /B 1 )= 0.45

Por lo que nos quedaría de la siguiente forma;

P( C ) = (0.6) * (0.75) + (0.4) * ( 0.45) = 0.63

Espacio Muestral
Conteo de Puntos Muestrales:
1. Un restaurante ofrece cebolla, salsa, mostaza y picante como condimento para su agregado a una
hamburguesa simple

a) Cuántas clases de hamburguesas puede preparar si los sabores se clasifican en: sin sabor, con uno, con
dos, tres o cuatro condimentos a la vez?

b) Si se prepara una de cada sabor, cuál es la probabilidad de que una persona que tome una al azar, tome
una que tiene salsa?

SOLUCIÓN:

a) Las clases de hamburguesas que el restaurante puede preparar están en función del número de
condimentos que las mismas lleven. Por lo tanto habría que contar las distintas clases de hamburguesas de
acuerdo al número de condimentos que ellas lleven:

#de condimentosa utilizar Condimentos disponibles Clases de hamburguesas

Ninguno (sin sabor) Cebolla, salsa, mostaza, picante 4 C 0 = 1clase

1 condimento Cebolla, salsa, mostaza, picante 4 C 1 = 4 clases

2 condimentos Cebolla, salsa, mostaza, picante 4 C 2 = 6 clases

3 condimentos Cebolla, salsa, mostaza, picante 4 C 3 = 4 clases

4 condimentos Cebolla, salsa, mostaza, picante 4 C 4 = 1 clase

16 clases
Nótese que se han usado combinaciones para encontrar las distintas clases de hamburguesas. Esto
se debe a que no nos interesa el orden que lleven los condimentos en las hamburguesas.
R/ Se pueden preparar 16 clases de hamburguesas, las cuales representan nuestro espacio muestral de 16
elementos.

b) Sea A el evento que consiste en seleccionar una hamburguesa que tenga salsa. Habría que encontrar el #
de hamburguesas distintas que tengan salsa:

Condimentos Clases de hamburguesas con salsa

Sólo salsa 1 clase

Salsa y otro más 1 * 3 C 1 = 3 clases


Salsa y dos más 1 * 3 C 2 = 3 clases

Salsa y tres más 1 * 3 C 3 = 1 clase

8 clases

R/ Los elementos de A son 8, por lo tanto P(A) = 8/16 = 1/2.


Probabilidad de un Evento:

2. Una maquina tiene un indicador con dos cilindros numéricos, cada uno

marcado de 0 a 9. Por medio de un resorte se hace girar los cilindros al

azar. Calcular las probabilidades de que:

A) La suma de los números de los dos cilindros sea igual a 9.

B) Aparezcan dos números cuya suma sea igual a 10.

C) La suma de los dos números sea por lo menos 5.

SOLUCIÓN:

A) Los números a utilizar son 0,1,2,3,4,5,6,7,8,9, por lo que para el primer inciso debemos ver de cuantas
formas podemos lograr que la suma de ellos nos den 9.

S 1 = { (0,9) (1,8) (2,7) (3,6) (4,5) (5,4) (6,3) (7,2) (8,1) (9,0) }

Luego conociendo las formas de obtener la sumatoria de 9 con los dos números calculamos la probabilidad de
cada uno de ellos:

P(S 1 )= P(0,9)+ P(1,8)+ P(2,7)+ P(3,6)+ P(4,5)+ P(5,4)+ P(6,3)+ P(7,2)+ P(8,1)+ P(9,0)

Por lo que son diez formas diferentes.

La probabilidad de cada número es 1/10, si se consideran los cilindros independientes entonces la


probabilidad de:

P(S 1 )= (1/10)*(1/10)*10 = 0.1

Donde 1/10 representa la probabilidad de cada número que en este caso lo multiplicamos dos veces ya que
son dos números a sumar, multiplicado por 10 también que son las diez formas de que dan la sumatoria de 9.

B) Su procedimiento es igual al anterior solo que en este caso, son 9 formas las que dan como resultado de la
suma 10.

S 2 = {(1,9) (2,8) (3,7) (4,6) (5,5) (6,4) (7,3) (8,2) (9,1)}

P(S 2 ) = P(1,9)+ P(2,8)+ P(3,7)+ P(4,6)+ P(5,5)+ P(6,4)+ P(7,3)+ P(8,2)+ P(9,1)

P(S 2 ) = (1/10)*(1/10)*9 = 0.09

C) Debe de hacerse una relación con los 2 números que aparezcan en los cilindros donde por lo menos la
sumatoria de los dos números nos dé por lo menos 5 y en este caso lo máximo sería (9+9) =18.
Para poder sacar cada una de las probabilidades que en este caso sería del 5 al 18 que es el resultado
obtenido por la suma de los dos números lo hacemos uno por uno siguiendo el procedimiento de los
anteriores.

P(5) = P(0,5)+ P(1,4)+ P(2,3)+ P(3,2)+ P(4,1)+ P(5,0)

P(5) = (1/10)*(1/10)*6 = 0.06

P(6) = P(0,6)+ P(1,5)+ P(2,4)+ P(3,3)+ P(4,2)+ P(5,1)+ P(6,0)

P(6) = (1/10)*(1/10)*7 = 0.07

P(7) = (1/10)*(1/10)*8 = 0.08

P(8) = (1/10)*(1/10)*9 = 0.09

P(9) = (1/10)*(1/10)*10 = 0.1

P(10) = (1/10)*(1/10)*9 = 0.09

P(11) = (1/10)*(1/10)*8 = 0.08

P(12) = (1/10)*(1/10)*7 = 0.07

P(13) = (1/10)*(1/10)*6 = 0.06

P(14) = (1/10)*(1/10)*5 = 0.05

P(15) = (1/10)*(1/10)*4 = 0.04

P(16) = (1/10)*(1/10)*3 = 0.03

P(17) = (1/10)*(1/10)*2 = 0.02

P(18) = (1/10)*(1/10)*1 = 0.01

En donde nuestra probabilidad total es la sumatoria de la probabilidad del 5 al 18.

P(S 3 )= 6+0.07+0.08+0.09+0.1+0.09+0.08+0.07+0.06+0.05+0.04+0.03+0.02+0.01

= 0.85

También se puede resolver de la siguiente manera;

P(S 3 ) = 1 - P( la suma es menor o igual a 4)


P(S 3 ) = 1 - [ P(suma=0) + P(suma=1) + P(suma=2) + P(suma=3) + P(suma=4)]

P(S 3 ) = 1 - 0.15 = 0.85

3. Catorce monedas de 25 centavos y una que es de oro con valor de Q5.00


están en una bolsa; 15 monedas de 25 centavos están en otra. Se toman monedas de la primera bolsa
y se colocan en la segunda. A continuación se toman 5 monedas de la segunda bolsa y se colocan en
la primera. ¿ Cuál es la probabilidad, después de estas transacciones, que la moneda de oro se
encuentre aun en la primera bolsa?

SOLUCION:

Tenemos al inicio 2 bolsas con las siguientes monedas

Bolsa 1 Bolsa 2

14----------Q 0.25 15-------------Q 0.25

1----------Q 5.00

Por lo que vamos a considerar 2 formas de experimentos que consisten en;

Experimento 1 ; Donde seleccionamos 5 monedas de la primera bolsa y la colocamos en la segunda. Aquí


puede darse 2 formas A y B.

A) Que seria que al pasar las 5 monedas de la bolsa 1 para la bolsa 2 solo pasen las 5 monedas de 25 ctvs y
que la de oro se quede en la bolsa1.

Bolsa 2 ------------- 15 monedas + 5 monedas = 20 monedas de 25 ctvs.

B) Que seria que al pasar las 5 monedas de la bolsa 1 a la bolsa 2 entre ellas se pase la moneda de oro,
quedando así la bolsa 2 de la siguiente forma.

Bolsa 2---------------15 monedas +(4 monedas + 1 moneda de oro)= 19 monedas de 25ctv. 1 moneda de oro.

Experimento 2: Donde tomamos 5 monedas de la bolsa 2 y las colocamos en la bolsa 1. Quedando aquí
también 2 alternativas C y D, dado que la moneda de oro pasa a la bolsa 2.

C) Que seria que al pasar las 5 monedas de la bolsa 2 a la bolsa 1 , las 5 monedas sean de 25 ctvs y que la
de oro no pase. Quedando así la bolsa 1 de esta manera;

Bolsa 1 ------------ 10 monedas que quedaron + 5 monedas = 15 monedas de 25 ctvs

D) Que al pasar las 5 monedas de la bolsa 2 a la bolsa 1, entre ellas valla la moneda de oro quedando así:

Bolsa 1----------------10 monedas que quedaron + (4 monedas + 1 moneda de oro)=

= 14 monedas de 25 ctvs.

1 moneda de oro.

Como se puede observar las 4 alternativas son:

a) Se queda la moneda de oro y se trasladan 5 monedas de 25 ctvs.

b) Se va la moneda de oro y 4 de 25 ctvs.

C) Regresan las 5 monedas de 25 ctvs, dado que paso la de oro a la bolsa 2.

D) Regresa la moneda de oro, dado que paso a la bolsa 2.


Quedando nuestro resultado de la siguiente forma;

P(la moneda de oro en la bolsa 1) = P(que la moneda de oro permanezca en la bolsa 1) + P(que la moneda
de oro pase a la bolsa 2 y regrese a la bolsa 1)=

R/ La probabilidad es de 0.7433
4. Una firma de construcción A debe tener cuando menos 2 obras a su cargo dentro de una semana
para mantener el empleo de su personal básico. Ha sometido proyectos para cada una de tres obras
del tipo I y para cada una de dos obras del tipo II. Las firmas ganadoras serán anunciadas dentro de la
semana crucial. Supóngase que la firma A tiene probabilidad de 1/2 de que le otorguen una obra del
tipo I y la probabilidad de 3/4 de que le otorguen una obra del tipo II. Las decisiones serán hechas
independientemente. Cuál es la probabilidad de que la firma A esté en condiciones de continuar con el
empleo de su personal básico?
SOLUCION:

La firma debe tener por lo menos 2 obras a su cargo de las 5 posibles (3 tipo I y 2 tipo II).

Sea X el evento que sea aprobado un proyecto tipo I & Y el evento que sea aprobado un proyecto tipo II:

P(X) = 0.5 P(X c ) = 1 -P(X) =0.5

P(Y) =0.75 P(Y c ) = 1 - P(Y) = 0.25

Hay que encontrar entonces la probabilidad de que sean aprobados por lo menos 2 proyectos (2, 3, 4 ó 5
proyectos).

Probabilidad (Por lo menos 2 proyectos aprobados) = 1 - ( Probabilidad(Ninguno aprobado) +


Probabilidad(Uno aprobado) )

Puesto que las decisiones de aprobación de los proyectos son independientes:

Probabilidad (Ninguno aprobado)= P(X c ) * P(X c ) * P(X c ) * P(Y c ) * P(Y c )

= 0.5 * 0.5 * 0.5 * 0.25 * 0.25 = 0.0078125

Probabilidad (Uno aprobado) = P(X) * P(X c ) * P(X c ) * P(Y c ) * P(Y c )

+ P(X c ) * P(X) * P(X c ) * P(Y c ) * P(Y c )

+ P(X c ) * P(X c ) * P(X) * P(Y c ) * P(Y c )

+ P(X c ) * P(X c ) * P(X c ) * P(Y) * P(Y c )

+ P(X c ) * P(X c ) * P(X c ) * P(Y c ) * P(Y)

= 0.5 * 0.5 * 0.5 * 0.25 * 0.25

+ 0.5 * 0.5 * 0.5 * 0.25 * 0.25

+ 0.5 * 0.5 * 0.5 * 0.25 * 0.25

+ 0.5 * 0.5 * 0.5 * 0.75 * 0.25


+ 0.5 * 0.5 * 0.5 * 0.25 * 0.75

= 0.0703125

Probabilidad (Ninguno aprobado) + Probabilidad (uno aprobado) = 0.078125

Probabilidad (por lo menos 2 proyectos aprobados) = 1- 0.078125 = 0.9218

R/ La probabilidad de que la firma pueda mantener su personal básico es 0.9218.


5. La probabilidad de cerrar cada uno de los relés del circuito siguiente está dada por P. Si todos los
relés funcionan independientemente, Cuál es la probabilidad de que exista una corriente entre las
terminales I, D? Si la probabilidad de que el relé esté abierto al llegar la corriente es igual a 0.2.

SOLUCION:

La corriente pasará por un relé cuando esté cerrado, y la probabilidad de que eso suceda es P= 1 -0.2 = 0.8.
También podemos observar que la corriente NO pasará por el relé con probabilidad de 0.2.

Considerando los siguientes eventos:

A= La corriente pasa por 1 & 2.

B= La corriente pasa por 3

C= La corriente pasa por 4 & 5.

D= La corriente pasa por 6

E= La corriente pasa por 7 & 8.

Hay que encontrar la probabilidad de que la corriente pase de I hasta D. Esto es posible si la corriente pasa en
POR LO MENOS UNA ruta anteriormente mencionadas. Es decir que la corriente puede pasar por una, dos,
tres, cuatro o cinco rutas SIMULTANEAMENTE.

Lo más fácil en éste caso es encontrar la probabilidad por medio del complemento. Es decir :

La probabilidad de que pase la corriente en por lo menos una ruta es igual a 1 menos la probabilidad de que la
corriente NO pase en alguna de las Rutas (que no pase la corriente); en otras palabras:

P(pase)= 1 - P(no pase)

Puesto que hay que encontrar la probabilidad de que la corriente NO pase, debemos estudiar cada una de las
rutas.

Probabilidad de que la corriente no pase por A

La corriente no pasará por A sí y solo si por lo menos un relé está abierto y puesto que los relés son
independientes:
P(A c ) = P(abierto 1) + P (abierto 2) - P(Abierto 1 & Abierto 2)

P(A c )= 0.2 +0.2 -(0.2) 2 = 0.36

Que sería la misma probabilidad para las rutas C y E.

PUESTO QUE LAS RUTAS SON INDEPENDIENTES, ya que no tienen relés comunes; la probabilidad de que
la corriente no pase en ALGUNA de las rutas sería:

P(no pase) = P(no pase A)* P(no pase B)*P(no pase C)*P(no pase D) *P(no pase E)

= 0.36*0.2*0.36*0.2*0.36 = 0.00186624

Por lo tanto, la probabilidad de que la corriente pase en por lo menos una ruta es:

P(pase)= 1 - 0.00186624 = 0.9981

R/ La probabilidad de que la corriente pase de I hasta D es 0.9981.

Das könnte Ihnen auch gefallen