Sie sind auf Seite 1von 22

Muchos fenómenos observados siguen modelos de matemáticos

teóricos, cuya variable aleatoria está definida dentro de un intervalo


Se estudiarán los siguientes modelos matemáticos:
1. La distribución Normal
2. La distribución t
3. La distribución chi cuadrado
4. La distribución F

Existen otros modelos de distribuciones de probabilidad como la


Logística, la Weibull, la Exponencial Negativa, etc.
La mayoría de las observaciones del mundo real, siguen una distribución normal. Al
procesar los datos y clasificarlos en una tabla de distribución de frecuencias se
construye:
Curva de tendencia es una curva
Histograma de
Curva de tendencia del acampanada = curva de Gauss o
frecuencias absoluta
histograma curva de distribución normal
Histograma de Edad de la población
Histograma de Edad de la población con curva de tendencia normal
18 Curva de distribución normal del ejemplo
18 Normal; Media=44.26; Desv.Est.=14.93
16
16 0.030

14
14
0.025
12
12
Frecuencia

10 0.020

Densidad = f(X)
Frecuencia

10
8
8 0.015
6
6
4 0.010
4
2
0.005
2
0
20 30 40 50 60 70 80
0 0.000
Edad 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80 90
Edad X
Características de la distribución de probabilidad normal

1. Es una curva acampanada, simétrica


6. Aprox el 68,3% de las observaciones
respecto a su eje central. están dentro del intervalo   1
2. La media μ, la mediana y la moda son 7. Aprox el 95,5% de las observaciones Función de
iguales. están dentro del intervalo   2 probabilidad, o
3. La desviación estándar  define la 8. Aprox el 99,7% de las observaciones función de
distancia desde su eje, al punto de están dentro del intervalo   3 densidad de la
inflexión de la curva. 9. P(a  x  b): normal = f(x)
4. El área bajo la curva, limitada por el 𝒃
= 𝑨𝒓𝒆𝒂𝒂 𝒙 𝒃) = ‫𝒙𝒅 𝒙 𝒇 𝒂׬‬
eje X, es igual a uno.
5. La curva es asintótica respecto al eje X
Ejemplo: Planteamiento de problema de una distribución normal

Los ingresos mensuales de los ingenieros de sistemas, se


distribuyen normalmente con un promedio de S/ 3 500 y una
desviación estándar de S/ 1 050.
Se seleccionará al azar a un ingeniero de sistemas: Determine la
probabilidad de que esté ganando:

a) Más de S/4 000 Habrá que desarrollar,


para cada caso:
b) Menos de S/3 200 𝒃
c) Entre S/3 400 y S/3 700 න 𝒇 𝒙 𝒅(𝒙)
d) Menos de S/3 800 𝒂
Fórmulas sencillas para integrales definidas:
𝒃
𝒃 𝒙𝒏+𝟏
Si f(x) = 𝒙𝒏 para n ≠ -1, entonces: ‫𝒇 𝒂׬‬ 𝒙 𝒅𝒙 = = (𝒃𝒏+𝟏 − 𝒂𝒏+𝟏 )
𝒏+𝟏 𝒂
𝟏 𝒃 𝒅𝒙
Si n = -1, en f(x) = entonces: ‫𝒙 𝒂׬‬ = Ln(b) – Ln(a)
𝒙

𝒏 𝒃 𝒃 𝒏
Si A es una constante cualquiera, entonces si f(x) = A*𝒙 , ‫𝒇 𝒂׬‬ 𝒙 𝒅𝒙 = A*‫)𝒙(𝒅 𝒙 𝒂׬‬

Si f(x) = A + B*𝒙𝒏 , donde A y B son constantes cualesquiera, entonces:


𝒃 𝒃 𝒃
‫𝒇 𝒂׬‬ 𝒙 𝒅𝒙 = A*‫ 𝒙𝒅 𝒂׬‬+ B*‫𝒙𝒅 𝒏𝒙 𝒂׬‬
Planteamiento gráfico del problema:

a) P(x>4000) = ‫׬‬4000 𝑓 𝑥 𝑑(𝑥)
3200
f(x) b) P(x<3200 = ‫׬‬− 𝑓 𝑥 𝑑(𝑥)
𝟑𝟕𝟎𝟎
c) P(3400<x<3700) = ‫𝒇 𝟎𝟎𝟒𝟑׬‬ 𝒙 𝒅(𝒙)
μ = 3500 X
 = 1050
𝟑𝟖𝟎𝟎
Función de probabilidad de f(x) d) P(x<3800) = ‫׬‬− 𝒇 𝒙 𝒅(𝒙)
−𝟏 𝒙−𝟑𝟓𝟎𝟎 𝟐
( ) Desarrollando estas integrales se puede
𝒆 𝟐 𝟏𝟎𝟓𝟎
f(x) =
𝟐∗𝟏𝟎𝟓𝟎 obtener la respuesta buscada
Distribución normal estándar
−𝟏 𝒙−μ 𝟐
𝒆𝟐
(
 )
Cualquier distribución de probabilidad normal de la forma: f(x) = para x  < -, >,
𝟐
−𝟏 𝟐
𝒛
𝒆𝟐
puede llevarse a una forma estándar de ecuación f(z) = , para z  <- , > donde
𝟐
la media es  = 0 (0rigen del sistema de coordenadas del eje Z) y desviación estándar  = 1
𝒙−μ
y donde z es la variable estándar definido por: z = .

f(z)
f(x)

0 Media =  Media = 0
X
Desviación =  Desviación = 1 Z

Curva normal de la forma Y = f(x) Curva normal estandarizada de la forma


Y = f(z)
Características de la curva de distribución normal estándar

1. La curva normal estándar tiene las mismas propiedades que


cualquier otra distribución normal, con la única diferencia, es que
dado que el cálculo de las integrales impropias en la ecuación de
la curva normal de la forma y = f(x), es difícil, se han tabulado
áreas para diferentes valores de x, con los cuales se resuelven
fácilmente problemas de cálculo de probabilidades. Con los
avances de las tecnologías de la información y el desarrollo de
softwares especializados en el área de la estadística, los cálculos
de probabilidades con estas tablas, van quedando obsoletas.
Características de la curva de distribución normal estándar

2. En una curva normal estándar, se pueden presentar áreas hacia el


lado derecho de su media, y por simetría se puede estimar los
valores de x, que están a su izquierda.
3. El software Minitab, proporciona solución a estos problemas; para
ello en su menú principal, seguir la secuencia: Gráfica  Gráfica de
probabilidad  Ver probabilidad  Distribución normal, e indicar
Media μ = 0, Desviación estándar σ = 1, y desarrollar los cálculos de
probabilidades, según la naturaleza del problema.
Cálculo de probabilidades con la distribución normal estándar:  = 0; =1

1. P(z > 1,26) 2. P(z < 0,67) 3. P(-0,81 < z < 1.89)

Gráfica de distribución Gráfica de distribución Gráfica de distribución


Normal; Media=0; Desv.Est.=1 Normal; Media=0; Desv.Est.=1 Normal; Media=0; Desv.Est.=1

0.4 0.4 0.4

0.7617

0.3 0.3 0.3


Densidad

Densidad

Densidad
0.2 0.2 0.7486 0.2

0.1 0.1 0.1

0.1038

0.0 0.0 0.0


0 z = 1.26 0 z = 0.67 z1 = -0.81 0 z2 = 1.89
z z z
Cálculo de probabilidades inversas con la distribución normal estándar: μ = 0; σ=
1
Para las figuras dadas sus probabilidades, determine su correspondiente valor de
z
Gráfica de distribución Gráfica de distribución Gráfica de distribución
Normal; Media=0; Desv.Est.=1 Normal; Media=0; Desv.Est.=1 Normal; Media=0; Desv.Est.=1

0.4 0.4 0.4

0.3 0.3 0.3


Densidad

Densidad

Densidad
0.2 0.2 0.2

0.1 0.32 0.1 0.1


0.275
0.0921 0.0921
0.0 0.0 0.0
0 z z 0 z1 0 z2
Ejemplo de aplicación de la distribución normal
1. Los precios de venta de las laptop se distribuyen
normalmente con un promedio de S/2 015 y una desviación
estándar de S/ 600. Una persona está interesado en comprarse
uno de estos equipos; determine la probabilidad de que se
compre una que cueste:
a) Más de S/2 400
b) Menos de S/2 000
c) Entre S/1 900 y S/2 300

2. Los sueldos de los ingenieros de sistemas se distribuyen normalmente; si se


sabe que solo 9,18% ganan más de S/ 5 000 al mes, y solo el 12,10% ganan
menos de S/ 2 000 al mes; determine:
a) Promedio y desviación estándar de ingresos mensuales de estos ingenieros.
b) La probabilidad de que un ingeniero de sistemas esté ganando entre S/ 3 000 y
S/ 4 000 mensuales
Distribución de la media muestral
Cuando se estudia las características poblacionales, es difícil trabajar con todos sus
elementos, ya sea porque este es muy grande, ya sea porque su estudio puede demandar
costos elevados, los cuales se expresan en términos de tiempo y dinero.

El problema se resuelve tomando referencias de pequeñas muestras extraídas de la población,


seleccionadas al azar, teniendo en cuenta que cada elemento de la población, tiene la misma
posibilidad de ser seleccionada. La técnica de selección de estas muestras que representan a la
población se llama, técnicas de muestreo aleatorio; a los elementos de la población se les conoce
como parámetros y los de la muestra, estadísticos. NOTACIÓN
Estadísticos Parámetros
Elementos utilizados
Media aritmética 𝐱 

Desviación estándar S 

Media proporcional ps P

Desviación estándar proporción ps p

Error estándar de la media Sx x

Número de elementos n N
Técnicas de muestreo
1. Muestreo ALEATORIO SIMPLE: Se asigna a cada elemento de la población un
código único, y al azar se elige a uno de éstos códigos.
2. Muestreo SISTEMÁTICO: Se numera a los elementos de la población en orden
consecutivo, luego se los divide en tantos grupos como elementos muestrales se
quisiera tener; luego del primer grupo se selecciona un elemento muestral, y el
número de ése elemento muestral determinará el segundo elemento de la segunda
muestra, y así sucesivamente.
3. Muestreo ESTRATFICADO: Se divide a la población de acuerdo a sus
características particulares, llamadas estratos, y de cada estrato se seleccionan las
muestras siguiendo los métodos precedentes.

4. Muestreo por CONGLOMERADOS: Se divide a la población en conglomerados, y


al azar se selecciona los conglomerados, con los cuales se obtienen los elementos
muestrales, siguiendo los procedimientos anteriores.
Posibles errores al seleccionar la muestra

Error muestral: Proviene de la naturaleza misma de la población, debido a que una muestra, no
siempre será igual al de la población; así cuando la muestra seleccionada es una mujer que
representa a la población compuesta también de varones, la mujer estaría representando a un
varón.

Errores no muestrales: Ocurre cuando se escoge el tamaño de la muestra, o puede producirse


un sesgo direccionado por una tendencia.

Error por tamaño de muestra: Se genera cuando la muestra es pequeña y puede no


representar adecuadamente a la población.

Error por sesgo: Sucede cuando la muestra es elegida de manera tendenciosa o parcializada;
también puede suceder cuando faltan respuestas, o cuando hay parcializaciones o subjetivismo en
las preguntas.
Distribución de la media muestral
Si de una población que se distribuye normalmente, con media μ y varianza
conocida 𝝈𝟐 , se extrae una muestra aleatoria de tamaño n, entonces la
media de esta muestra 𝒙ഥ, es igual a la media poblacional µ; sin embargo su
varianza muestral 𝒔𝟐𝒙 no es igual a su varianza poblacional σ𝟐 , ya que la
varianza depende del tamaño de la muestra; de este modo, cuanto más
pequeño sea la muestra 𝒔𝟐𝒙 será cada vez más grande, y cuanto más grande
sea esta, menor será 𝒔𝟐𝒙 ; así que cuando se trabaja con muestras
poblacionales, la media muestral 𝒙 ഥ es igual a la media poblacional µ, pero
𝝈𝟐
no así su varianza muestral; la varianza muestral se define 𝒔𝟐
𝒙 = σഥ
𝒙 2=
𝒏
σ𝟐 𝑵−𝒏
cuando la población es infinita, o por 𝒔𝟐
𝒙 = ∗ ( ) cuando la población
𝒏 𝑵−𝟏
es finita.
Error estándar de la media muestral
1. Cuando la población es infinita o muy grande el error estándar de la media
𝝈
muestral se expresa por ∈ = , siendo n el tamaño de la muestra.
𝒏

𝝈 𝑵−𝒏
2. Cuando la población es finita, el error muestral se define ∈ = ∗ , donde
𝒏 𝑵−𝟏
N es el tamaño de la población.
Puede deducirse de cualquiera de estas expresiones, que en la medida de que el
tamaño de la muestra sea cada vez más grande, menor será el error estándar de la
media muestral, y en cuanto a que cada vez sea más pequeño la muestra, el error
estándar de la media muestral, será cada vez más grande.
Lo mismo se puede deducir, que cuando la muestra sea cada vez más grande, la
varianza de la muestra, se irá aproximando cada vez más a la varianza poblacional.
.
Cálculo de probabilidades de la media muestral
El cálculo de probabilidades de Distribución de la media muestral
medias muestrales de las formas: Y= f(x)
P(𝐱 > a), P(𝐱 < a) o P(a < 𝐱 < b) se
procede similarmente como el cálculo
de probabilidades de poblaciones
normales, solo que en este caso la
(𝒂−⧖)
variable estándar será z = 𝝈 si la
𝒏
(𝒂−⧖) Media = X
población es infinita o z = , si
𝝈 𝑵−𝒏
∗ 𝑵−𝟏 Tamaño = n
𝒏
Desviación = σ
la población es finita.
Ejemplo de cálculo de probabilidades con la media muestral
La presión sistólica de los pobladores que consumen alimentos orgánicos se distribuye
normalmente con una media de 105 mm/Hg y una desviación estándar de 22 mm/Hg.
a) Se selecciona al azar a una persona que consume alimento orgánico; determine la
probabilidad de que su presión sistólica sea mayor de 112 mm/Hg.
b) Si se selecciona una muestra de 35 personas, determine la probabilidad de que la presión
sistólica de este grupo sea mayor de 112 mm/Hg.
c) Si la población está compuesta de 567 personas, y se extrae de ella una muestra de 35
personas, determine la probabilidad de que su presión sistólica del grupo sea mayor de
112 mm/Hg.

Si es la v.a. presión sistólica de las personas, e trata de hallar:


a) P (x > 112)
b) P(⧖ > 112), para n = 35
c) P(⧖ > 112), para n = 35 y N = 567
d) ¿Cuál será la probabilidad de que la media sistólica del grupo de las 35
personas se encuentre entre 100 y 120 mm/Hg?; Res: 91,06%

Los sueldos mensuales de los ingenieros de sistemas se distribuyen


normalmente con una media de S/ 3500 y una desviación estándar de
S/ 1200. En la ciudad de Lima se selecciona una muestra de 65
ingenieros de sistemas, de una población de 348 ingenieros;
determine la probabilidad de que sus sueldos estén comprendidos
entre los S/ 4000 y S/ 5000.
Solución

a) P(x > 112); se trata de una distribución normal, por lo que el cálculo de
probabilidades se hace en forma directa; esto es: P(x > 112) = 37,52%

b) P(⧖ > 112); Se trata de calcular la probabilidad de la media de esta


muestra; como la población es infinita, su variable estándar es z = 1,882 y
p(⧖ > 112) = P(z > 1,882 ) = 2,99%

c) P(⧖ > 112); se trata de calcular la probabilidad de la media de esta


muestra, cuando la población es finita, su variable estándar es z = 1,943 y
P(z > 1,943 ) = 2,60%

!! Extraiga sus conclusiones sobre estos sucesos !!

Das könnte Ihnen auch gefallen