Distribucion de Probabilidades

Control de calidad Aplicado a la Ingeniería [ESTADISTICA INFERENCIAL]
MÓDULO 5: CONCEPTOS PROBABILÍSTICOS

AZAR y DESCONOCIMIENTO.
El azar está relacionado con el desconocimiento. Un ejemplo nos puede ayudar; piense en un
proceso industrial que produce grandes cantidades de un artículo determinado. No todos los
artículos producidos son idénticos, cada artículo puede calificarse como "bueno'' o "defectuoso''.
Si de toda la producción se escoge un artículo "a ciegas'', ese artículo puede resultar bueno o
defectuoso. Esta es una situación azarosa (o aleatoria) y la parte esencial de este azar es que no
sabemos si el artículo seleccionado es defectuoso. Claro que con experiencia en el proceso es
posible cuantificar de una manera numérica qué tan probable es que el artículo sea defectuoso o
nó.
AZAR e INCERTIDUMBRE.
Hay otro concepto asociado al azar y es el de incertidumbre. Veamos un ejemplo. Respecto a una
inversión, podemos estar contemplando invertir una cantidad de dinero. El retorno sobre la
inversión puede ser fijo, como en el caso de una cuenta en un banco con interés fijo; pero
pensemos en una empresa. El negocio puede resultar desde un gran éxito hasta un fracaso, es
decir, la ganancia no es fija, sino que depende del éxito a obtener. Si no podemos evaluar qué tan
factible es cada monto posible de la ganancia, tenemos una situación de incertidumbre. Por el
contrario, si podemos tener una idea de qué tan probables son los diferentes resultados y
entonces tendremos una situación de riesgo. Esta última es la que llamamos aleatoria o azarosa.
DEFINICIONES
Probabilidad: valor entre cero y uno, inclusive, que describe la posibilidad relativa de que ocurra
un evento.
Experimento: proceso que conduce a la ocurrencia de una de varias observaciones posibles.
Resultado: lo que resulta en particular de un experimento.
Evento: conjunto de uno o más resultados de un experimento.
ENFOQUES DE LA PROBABILIDAD
Probabilidad clásica se basa en la consideración de que los resultados de un experimento son
igualmente posibles. Utilizando el punto de vista clásico, tenemos lo siguiente:
ESPACIO MUESTRAL Y PROBABILIDAD.

El párrafo anterior se resume diciendo que en las situaciones o experimentos aleatorios tenemos
dos elementos esenciales:
 Una lista de posibilidades a futuro: espacio muestral
 Una cuantificación de la incertidumbre sobre esa lista de posibilidades: asignación de
probabilidades.
 Cualquier problema o situación en la probabilidad, parte de esos dos elementos: Espacio
Muestral y Probabilidades.
ESPACIO MUESTRAL (S).
El espacio muestral es el conjunto de todos los posibles resultados de un experimento o situación
aleatoria.
< Ing. Edmundo Alarcón Cáceres > 1

S = : { a1, a2, a3, ..., an }

Ejemplo: Si en una caja hay 10 manzanas y 2 están echadas a perder, al extraer tres manzanas y
ver cuantas son buenas podemos obtener 1, 2 o 3 buenas (¡0 buenas es imposible!). De modo
que en este ejemplo el espacio muestral es: S = { 1, 2, 3 }.
Ejemplo: Considere el experimento de lanzar dos monedas al mismo tiempo.
El espacio muestral S = {CC, CS, SC, SS}
Considere el evento de una cara.
Probabilidad de una cara = 2/4 = 1/2
EVENTOS o SUCESOS.
Cuando se tiene un espacio muestral llamamos, formalmente evento o suceso a cualquier
subconjunto del espacio muestral.
Decimos que un suceso se realiza, cuando el resultado del experimento aleatorio es uno de los
sucesos posibles.
Eventos mutuamente excluyentes: la ocurrencia de cualquier evento implica que ningún otro
puede ocurrir al mismo tiempo.
En el anterior, los cuatro resultados posibles son mutuamente excluyentes.
Eventos colectivamente exhaustivos: por lo menos uno de los eventos debe ocurrir cuando se
realiza un experimento.
En el EJEMPLO, los cuatro resultados posibles son colectivamente exhaustivos.
En otras palabras, la suma de las probabilidades es = 1 = (0.25 + 0.25 + 0.25 + 0.25)
Concepto de frecuencias relativas.
La probabilidad de que un evento ocurra a largo plazo se determina observando en qué fracción
de tiempo sucedieron eventos semejantes en el pasado:
Ejemplo: A lo largo de su carrera, el profesor de física ha otorgado 186 calificaciones de A entre

sus 1200 estudiantes.
¿Cuál es la probabilidad de que un estudiante de su clase en este semestre reciba una A?
Aplicando el concepto de frecuencias relativas, la probabilidad de una A es:
186 /1200 = 0.155
Probabilidad subjetiva: la posibilidad (probabilidad) de que suceda un evento específico que
asigna una persona con base en cualquier información disponible.
Ejemplos de la probabilidad subjetiva son estimar la probabilidad de que los Salgado de Salta
ganen la Lotería el próximo año y estimar la probabilidad de que ocurra un terremoto en Los
Ángeles este año.
Reglas básicas de probabilidad
Si los eventos son mutuamente excluyentes, la ocurrencia de cualquier evento impide que otro
evento ocurra.

Reglas de adición: Si dos eventos A y B son mutuamente excluyentes, la regla especial de

adición indica que la probabilidad de que ocurra A o B es igual a la suma de sus probabilidades
respectivas:
P(A o B) = P(A) + P(B)
Ejemplo: Aerolíneas Argentinas acaba de proporcionar la siguiente información de sus vuelos de
Buenos Aires a Rosario:
Llegada Frecuencia
Antes de tiempo 100
A tiempo 800
Demorado 75
Cancelado 25
Total 1000
Si A es el evento de que un vuelo llegue antes de tiempo, entonces: P(A) = 100 /1000 = 0.1
Si B es el evento de que un vuelo llegue demorado, entonces: P(B) = 75 /1000 = 0.075
La probabilidad de que un vuelo llegue antes de tiempo o demorado es:
P(A o B) = P(A) + P(B) = 0.1 + 0.075 = 0.175
Regla del complemento: La regla del complemento se utiliza para determinar la probabilidad de
que ocurra un evento restando del número 1 la probabilidad de que un evento no ocurra.
Si P(A) es la probabilidad del evento A y P(~A) es el complemento de A,
P(A) + P(~A) = 1 o P(A) = 1 - P(~A).
Diagrama de Venn que ilustra la regla del complemento:
Ejemplo: Si C es el evento de que un vuelo llegue a tiempo, entonces: P(C) = 800 /1000 = 0.8
Si D es el evento de que un vuelo sea cancelado, entonces: P(D) = 25 /1000 = 0.025
Utilice la regla del complemento para mostrar que la probabilidad de que el vuelo llegue antes de
tiempo (A) o demorado (B) es: P(A o B) = 1 - P(C o D) = 1 - [0.8 + 0.025] = 0.175
Regla general de adición

Si A y B son dos eventos que no son mutuamente excluyentes, entonces P(A o B) se calcula con
la siguiente fórmula:
P(A o B) = P(A) + P(B) - P(A y B)
Diagrama de Venn que ilustra esta regla:

AyB
A
Ejemplo: En una muestra de 500 estudiantes, 320 dijeron tener un estéreo, 175 dijeron tener una
TV y 100 dijeron tener ambos:
TV
175
Ambos
100
Estéreo
320
Si un estudiante es seleccionado aleatoriamente, ¿cuál es la probabilidad de que tenga sólo un
estéreo, sólo una TV y uno de cada uno?
P(S) = 320 /500 = 0.64
P(T) = 175 /500 = 0.35
P(S y T) = 100 /500 = 0.20
Si un estudiante es seleccionado aleatoriamente, ¿cuál es la probabilidad de que tenga un estéreo
o una TV en su habitación?
P(S o T) = P(S) + P(T) - P(S y T) = 0.64 +0.35 - 0.20 = 0.79
Regla especial de multiplicación.
La regla especial de multiplicación requiere que dos eventos A y B sean independientes.
Dos eventos A y B son independientes si la ocurrencia de una no afecta la probabililidad de
ocurrencia del otro. La regla especial se escribe:
P(A y B) = P(A) * P(B)
Ejemplo: Chris posee dos inventarios independientes uno de otro. La probabilidad de que el
inventario A aumente su valor el próximo año es 0.5; La probabilidad de que el B aumente el suyo
es 0.7 ¿Cuál es la probabilidad de que ambos aumenten su valor el próximo año?
P(A y B) = (0.5)(0.7) = 0.35
¿Cuál es la probabilidad de que al menos uno aumente su valor el próximo año (esto implica que
cualquiera de los dos o ambos aumenten)?
Así, P(A)(al menos uno) = (0.5)(0.35) + (0.5)(0.7) + (0.7)(0.5) = 0.875
Así, P(B)(al menos uno) = (0.7)(0.35) + (0.5)(0.7) + (0.7)(0.5) = 0.945
Probabilidad conjunta: Probabilidad conjunta es una probabilidad que mide la posibilidad de que
dos o más eventos ocurran juntos.
Un ejemplo sería el hecho de que un estudiante tenga tanto un estéreo como una TV en su
habitación.
Probabilidad condicional: Probabilidad condicional es la probabilidad de que ocurra un evento
en particular, dado que ocurrió otro evento.
NOTA: la probabilidad de que ocurra el evento A dado que ya ocurrió B se denota como P(A|B).
Regla general de multiplicación
La regla general de multiplicación se utiliza para determina la probabilidad conjunta de que

ocurran dos eventos y establece: para dos eventos A y B, la probabilidad conjunta que ambos
ocurran se encuentra multiplicando la probabilidad de A por la probabilidad condicional de B dado
que A ocurrió.
La probabilidad conjunta, P(A y B) está dada por la siguiente fórmula:
P(A y B) = P(A) * P(B|A) o P(A y B) = P(B) * P(A|B)
Ejemplo: La directora de la escuela de administración en Miami recolectó la siguiente información
acerca de los estudiantes de licenciatura del colegio:
Área Hombre Mujer Total
Contabilidad 170 110 280
Finanzas 120 100 220
Mercadotecnia 160 70 230
Administración 150 120 270
Total 600 400 1000
Si un estudiante se selecciona al azar, ¿cuál es la probabilidad de que el estudiante sea mujer del
área de contabilidad?
P(A y F) = 110 / 1000.
Dado que la estudiante es mujer, ¿cuál es la probabilidad que esté en el área de contabilidad?
P(A|F) = [P(A y F)] / [P(F)] = [110 / 1000] /[400 / 1000] = 0.275
Diagrama de árbol.
El diagrama de árbol es muy útil para visualizar las probabilidades condicional y conjunta y en
particular para el análisis de decisiones administrativas que involucran varias etapas.
Ejemplo: una bolsa contiene 7 fichas rojas (R) y 5 azules (B), se escogen 2 fichas, una después
de la otra sin reemplazo. Construya el diagrama de árbol con esta información.
6/11 R2
R1
7/12
5/11 B2
7/11 R2
5/12
B1
4/11
B2
Teorema de Bayes

Las formulas de Bayes nos permiten calcular la probabilidad condicional de un evento cualquiera
perteneciente a una familia de eventos exhaustivos y mutuamente excluyentes, si sabemos que
ha ocurrido un evento B del espacio, siempre que P(Ai) y P(B/Ai) sean conocidas.
El Teorema de Bayes se apoya en el proceso inverso del Teorema de la Probabilidad Total, el
cual indica que a partir de las probabilidades del suceso A (probabilidad de que llueva o de que
haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente). Por lo
tanto, el Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente)
deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía buen tiempo?).
El teorema de Bayes se representa con la fórmula:
𝑃(𝐴𝑖 ) ∗ 𝑃(𝐵/𝐴𝑖 )
𝑃(𝐴𝑖 ⁄𝐵) = 𝑛
∑𝑖=1 𝑃(𝐴𝑖 ) ∗ 𝑃( 𝐵/𝐴𝑖 )
Ejemplo: El parte meteorológico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Según estos posibles estados meteorológicos, la posibilidad de que ocurra un accidente es la
siguiente:
a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estábamos en la ciudad no sabemos
que tiempo hizo (llovío, nevó o hubo niebla). El teorema de Bayes nos permite calcular estas
probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan
"probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el 20%).
Una vez que incorporamos la información de que ha ocurrido un accidente, las probabilidades del
suceso A cambian: son probabilidades condicionadas P(A/B), que se denominan "probabilidades
a posteriori".
Vamos a aplicar la fórmula:
a) Probabilidad de que estuviera lloviendo:
La probabilidad de que efectivamente estuviera lloviendo el día del accidente (probabilidad a

posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:
La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%

Ejemplo: La compañía Duff Beer ha recibido varias quejas debido a que sus botellas no van bien
llenas. Una queja fue recibida hoy pero el gerente de producción no puede identificar cuál de las
dos plantas Springfield (A o B) llenó esta botella. ¿Cuál es la probabilidad de que la botella mal
llenada haya salido de la planta A?
Plantas Springfield % de producción total % de faltante en botellas
A1 (A) 55 3
A2 (B) 45 4
[(0.55)(0.03)]
𝑃(𝐴1 ⁄𝐵) = = 0.4783
[(0.55)(0.03) + (0.45)(0.04)]
Algunos principios de conteo.
Fórmula de la multiplicación: si hay m modos de hacer una cosa y n formas de hacer otra,
existen m x n formas de hacer ambas.
Ejemplo: el Doctor Périssé tiene 10 camisas y 8 corbatas. ¿Cuántos conjuntos de camisas
/corbatas tiene?
(10)(8) = 80
Permutación: un arreglo de r objetos seleccionados a partir de un grupo único de n objetos
posibles.
NOTA: el orden del arreglo es importante en las permutaciones.
Combinación: el número de modos para elegir r objetos de un grupo de n objetos sin considerar
el orden.
Ejemplo: El entrenador Alexis tiene que elegir 5 jugadores entre los doce del equipo para incluirlos
en alineación.
¿Cuántos grupos diferentes se pueden formar?
12C5 = ( 12! ) / [ 5! ( 12 - 5 )! ] =792
Suponga que el entrenador Alexis debe clasificarlos en orden:
12P5 = ( 12! ) / ( 12 - 5 )! = 95,040
MÓDULO 6: DISTRIBUCIONES PROBABILÍSTICAS DISCRETAS
Variables aleatorias
Una variable aleatoria es un valor numérico determinado por el resultado de un experimento.
Ejemplo: considere un experimento aleatorio en el que se lanza tres veces una moneda. Sea X el
número de caras. Sea H el resultado de obtener una cara y T el de obtener una cruz.
El espacio muestral para este experimento será: TTT, TTH, THT, THH, HTT, HTH, HHT, HHH.
Entonces, los valores posibles de X (número de caras) son x = 0, 1, 2, 3.
El resultado “cero caras” ocurrió una vez.
El resultado “una cara” ocurrió tres veces.

El resultado “dos caras” ocurrió tres veces.
El resultado “tres caras” ocurrió una vez.
De la definición de variable aleatoria, la X definida en este experimento, es una variable aleatoria.
Distribuciones probabilísticas
Una distribución probabilística es la enumeración de todos los resultados de un experimento junto
con las probabilidades asociadas.
Para el Ejemplo anterior,
Números de caras Probabilidad de los resultados
0 1/8 = 0.125
1 3/8 = 0.375
2 3/8 = 0.375
3 1/8 = 0.125
total 8/8 = 1
Características de una distribución probabilística
La probabilidad de un resultado siempre debe estar entre 0 y 1.
La suma de todos los resultados mutuamente excluyentes siempre es 1.
Variable aleatoria discreta
Una variable aleatoria discreta es una variable que puede tomar sólo ciertos valores diferentes
que son el resultado de la cuenta de alguna característica de interés.
Ejemplo: sea X el número de caras obtenidas al lanzar 3 veces una moneda. Aquí los valores de X
son X = 0, 1, 2, 3
Variable aleatoria contínua.
La media: Indica la ubicación central de los datos. Es el promedio, a la larga, del valor de la
variable aleatoria, también se conoce como el valor esperado, E(x), en una distribución de
probabilidad. Es un promedio ponderado.
La media se calcula con la fórmula:
Varianza de una distribución probabilística discreta: La varianza mide la cantidad de
dispersión (variación) de una distribución. La varianza de una distribución discreta se denota por la
letra griega σ2 (sigma cuadrada).
La desviación estándar se obtiene tomando la raíz cuadrada de σ2
La variancia de una distribución de probabilidad discreta se calcula a partir de la fórmula:
Donde μ representa la media y P(x) es la probabilidad de los diferentes resultados X.

Ejemplo: Dan Desch, propieatario de College Painters, estudió sus registros de las últimas 20
semanas y obtuvo los siguientes números de casas pintadas por semana:
# de casas pintadas semanas
10 5
11 6
12 7
13 2
TOTAL 20
Distribución probabilística:
# de casas pintadas, X Probabilidad, P(X)
10 5/20 = 0.25
11 6/20 = 0.30
12 7/20 = 0.35
13 2/20 = 0.10
Total 20/20 = 1.00
Calcule el número medio de casas pintadas por semana:
Μ = (10)(0.25)+(11)(0.30)+(12)(0.35)+(13)(0.10) = 11.3
Calcule la variancia del número de casas pintadas por semana:
σ2 = 0.4225 + 0.0270 + 0.1715 + 0.2890

σ2 = 0.91
Distribución probabilística binomial.
Las distribución binomial es parte de la distribución de Bernouilli debido a que la distribución de
Bernouilli se aplica cuando se realiza una sola vez un experimento que tiene únicamente dos
posibles resultados (éxito o fracaso), por lo que la variable sólo puede tomar dos valores: el 1 y 0.
La distribución binomial se aplica cuando se realizan un número"n" de veces el experimento de
Bernouilli, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre:
 0: si todos los experimentos han sido fracaso
 n: si todos los experimentos han sido éxitos
Su expresión matemática es X  B( n, p ) donde: n = población y p = probabilidad
La distribución binomial tiene las siguientes características:
 un resultado de un experimento se clasifica en una de dos categorías mutuamente
excluyentes: éxito o fracaso.
 los datos recolectados son resultados de contar.
 la probabilidad de éxito es la misma para cada ensayo.
 los ensayos son independientes.
Para elaborar una distribución binomial, sea n el número de ensayos x el número de éxitos
observados,  la probabilidad de éxito en cada ensayo. La fórmula para la distribución de
probabilidad binomial es:
𝑛
ó P(x = k) = ∑ (𝑛𝑘)𝑝𝑘 𝑞𝑛−𝑘
𝑘=0
Ejemplo: La Secretaría del Trabajo del estado de Alabama reporta que 20% de la fuerza de
trabajo en Mobile está desempleada. De una muestra de 14 trabajadores, calcule las siguientes
probabilidades con la fórmula de la distribución binomial (n=14, =0.2):
Tres están desempleados (20% de 14): P(x=3)=0.250
NOTA: éstos también son ejemplos de distribuciones probabilísticas acumulativas:

Tres o más están desempleados:
P(x ≥ 3) = 0.250 + 0.172 + 0.086 + 0.032 + 0.009 + 0.002 = 0.551
Al menos un trabajador está desempleado:
P(x ≥ 1) = 1 - P(x=0) =1 - 0.044 = 0.956
A lo más dos trabajadores están desempleados:
P(x ≤ 2) = 0.044 + 0.154 + 0.250 = 0.448
Media y varianza de la distribución binomial
La media está dada por:
La varianza está dada por:
Del ejemplo anterior, recuerde que = 0.2 y n = 14

Así, la media = n  = 14(0.2) = 2.8
La varianza = n  (1 -  ) = (14)(0.2)(1 - 0.2) = 2.24
Distribución hipergeométrica
La distribución hipergeométrica suele aparecer en procesos muestrales sin reemplazo, en los que
se investiga la presencia o ausencia de cierta característica.
Por ejemplo, en un procedimiento de control de calidad en una empresa farmacéutica, durante el
cual se extraen muestras de las cápsulas fabricadas y se someten a análisis para determinar su
composición. Durante las pruebas, las cápsulas son destruidas y no pueden ser devueltas al lote
del que provienen. En esta situación, la variable que cuenta el número de cápsulas que no
cumplen los criterios de calidad establecidos sigue una distribución hipergeométrica. Por tanto,
esta distribución es la equivalente a la binomial, pero cuando el muestreo se hace sin reemplazo.
Fórmula:
Donde N es el tamaño de la población, S es el número de éxitos en la población, x es el número

de éxitos de interés, n es el tamaño de la muestra, y C es una combinación.
Use la distribución hipergeométrica para encontrar la probabilidad de un número específico de
éxitos o fracasos si:
 La muestra se selecciona de una población finita sin reemplazo (recuerde que un criterio para
la distribución binomial es que la probabilidad de éxito es la misma de un ensayo a otro).
 El tamaño de la muestra n es mayor que 5% del tamaño de la población N.
Ejemplo: La National Air Safety Board tiene una lista de 10 violaciones a la seguridad reportadas
por ValueJet. Suponga que sólo 4 de ellas son en realidad violaciones y que el Safety Board sólo
podrá investigar cinco de las violaciones. ¿Cuál es la probabilidad de que tres de las cinco
violaciones seleccionadas al azar para investigarlas sean en realidad violaciones?
N=10, S=4, X=3, n=5

MÓDULO 7: DISTRIBUCIÓN PROBABILÍSTICA NORMAL

Características de la distribución probabilística normal
La curva normal tiene forma de campana con un solo pico justo en el centro de la distribución.
La media, mediana y moda de la distribución aritmética son iguales y se localizan en el pico.
La mitad del área bajo la curva (50% ) está a la derecha del pico, y la otra mitad (50% ) está a la
izquierda.
La distribución normal es simétrica respecto a su media.
La distribución normal es asintótica - la curva se acerca cada vez más al eje x pero en realidad
nunca llega a tocarlo.
Esta distribución viene definida por dos parámetros:
X  N ( )
Donde: es el valor medio de la distribución y es precisamente donde se sitúa el centro de la
curva (campana de Gauss).
 : es la varianza, indica si los valores están más o menos alejados del valor central: si la
varianza es baja los valores están próximos a la media; si es alta, entonces los valores
están muy alejados de ella. Se representa por  porque su raíz cuadrada, , es la
denominada desviación estándar.
Distribución normal estándar

Cuando una distribución normal tiene una media igual a 0 y una varianza igual a 1 se denomina
distribución normal estándar, y su ventaja reside en que hay tablas, o rutinas de cálculo que
permiten obtener esos mismos valores, donde se recoge la probabilidad acumulada para cada
punto de la curva de esta distribución.
Z  N ( 0 )
Además, toda distribución normal se puede transformar en una normal tipificada llamada
estandarización, donde X se distribuye en la distribución normal estandarizada de valor “Z”, la cual
es la distancia entre un valor seleccionado, designado como X, y la población media μ, dividida
entre la desviación estándar de la población σ.

La distribución normal tipificada o estandarizada tiene la ventaja de que las probabilidades para
cada valor de la curva se encuentran recogidas en una tabla de Distribución de Frecuencia
Acumulada Normal (anexo 1).
¿Cómo se lee esta tabla? La columna de la izquierda indica el valor cuya probabilidad acumulada
queremos conocer. La primera fila nos indica el segundo decimal del valor que estamos
consultando.
Áreas bajo la curva normal. Para poder determinar la probabilidad del valor obtenido de Z,
existen siete casos para calcular la probabilidad según le corresponda la posición en la curva de la
normal estandarizada (anexo 2).
Ejemplo: Una corporación grande ofrece a los graduados en MBA un ingreso mensual que tiene
una distribución normal con media de $2000 y desviación estándar de $200.
¿Cuál es el valor z para un ingreso de $2200? y ¿cuál para uno de $1700?
Para X = $2200, z = (2200 - 2000) /200 = 1.0  probabilidad = 0.3416 (ver tabla 1)
Para X = $1700, z = (1700 - 2000) /200 = - 1.5  probabilidad = 0.4332 (ver tabla 1)
Un valor z igual a 1 indica que el valor de $2200 es mayor que la media de $2000, así como el
valor z igual a -1.5 indica que el valor de $1700 es menor que la media de $2000.
Ejemplo: El consumo de agua diario por persona en New Providence, Nueva Jersey tiene una
distribución normal con media de 20 galones y desviación estándar de 5 galones.
a). ¿Cuál es la probabilidad de que una persona de New Providence seleccionada al azar use
menos de 20 galones por día?
El valor z asociado es:
P(X<20)  z = (20 - 20) /5 = 0.0 P(z<0) = 0.0 (ver tabla 1) Así es 0.0%
b). ¿Qué porcentaje usan entre 20 y 24 galones?
P(20≤X≤24) El valor z asociado con X = 20 es: z = 0.0
y con P(0≤X≤24), z = (24 - 20) /5 = 0.8  P(0≤Z≤0.8)
Así, P(0<z<0.8) = 0.2881
= 0.0 + 0.2881 = 0.2881 = 28.81%

c). ¿Qué porcentaje de la población utiliza entre 18 y 26 galones?

El valor z asociado con:
X = 18 es: z = (18 -20) /5 = -0.4
y para X = 26, z = (26 - 20) /5 = 1.2
P[ -0.4 ≤ Z ≤ 1.2 ]
P[ -0.4 ≤ Z ≤ 0 ] + P[ 0 ≤ Z ≤ 1.2 ]
Positivizando  P[ (-1) -0.4 ≤ Z ≤ (-1) 0 ] + P[ 0 ≤ Z ≤ 1.2 ]
P[ 0 ≤ Z ≤ 0.4 ] + P[ 0 ≤ Z ≤ 1.2 ]
= 0.1554 + 0.3849 = 0.5403
-0.4 0 1.2
Así, P(18<X<26) = P(-0.4<z<1.2) = 0.1554 + 0.3849 = .5403
Ejercicios propuestos.
1.- El profesor Mann determinó que el promedio final en su curso de estadística tiene una
distribución normal con media de 72 y desviación estándar de 5. Decidió asignar las calificaciones
del curso de manera que 15% de los alumnos reciban una calificación de A. ¿Cuál es el promedio
más bajo que un alumno puede tener para obtener una A?
2.- La cantidad de propina que un mesero recibe por turno en un restaurante exclusivo tiene una
distribución normal con media de $80 y desviación estándar de $10. Shelli siente que ha dado un
mal servicio si el total de sus propinas del turno es menor que $65. ¿Cuál es la probabilidad de
que ella haya dado un mal servicio?
La distribución lognormal.
La prevención de fallos en instalaciones industriales de proceso está basada en gran parte en la
aplicación de los probabilísticos de análisis de riesgos. Todo ello se ha llevado a cabo a través de
una disciplina denominada ingeniería de fiabilidad, para la cual se dispone de las adecuadas
técnicas de predicción y prevención, que han sido fundamentales para el aseguramiento de la
calidad y la seguridad de productos y procesos.
Los elementos y dispositivos con funciones clave de seguridad, además de ser idóneos ante unas
exigencias del sistema, deben asegurar una correcta respuesta en el tiempo. Para ello es
imprescindible establecer un programa de mantenimiento que permita su operación en buenas
condiciones de uso, renovándolos antes de que su tasa de fallos sea inaceptable.
Todo ello requiere conocer a priori la fiabilidad de los elementos de seguridad que se ubiquen en
las instalaciones, información que debería ser suministrada por los fabricantes, considerando
como datos primordiales los empíricos existentes en bancos de datos de fiabilidad de
componentes, funcionando en condiciones y ambientes determinados. Esta fiabilidad debe ser
debidamente controlada y contrastada a través del propio programa de mantenimiento, a fin de
verificar que se está dentro de las condiciones de respuesta del sistema esperadas. Sólo entonces
se podrá afirmar que la probabilidad de fallo de un componente es conocida y está controlada.
El objetivo es dar a conocer un tipo de distribución estadística aplicable al estudio de la fiabilidad
de componentes técnicos que, dentro de una misma clase, presentan distintos valores como
consecuencia de la conjunción de una serie de factores tales como su procedencia, carga,
temperatura de su entorno, presión de trabajo, medio ambiente de trabajo (agua, aire, ácidos.) etc.
La distribución lognormal tiene, principalmente, las siguientes aplicaciones:
a. Representa la evolución con el tiempo de la tasa de fallos, λ(t), en la primera fase de vida de
un componente, la correspondiente a los fallos infantiles en la "curva de la bañera"
entendiéndose como tasa de fallos la probabilidad de que un componente que ha funcionado
hasta el instante t, falle entre t y t + dt. En este caso la variable independiente de la distribución
es el tiempo (ver figura).
b. Permite fijar tiempos de reparación de componentes, siendo también en este caso el tiempo la
variable independiente de la distribución.
c. Describe la dispersión de las tasas de fallo de componentes, ocasionada por diferente origen
de los datos, distintas condiciones de operación, entorno, bancos de datos diferentes, etc. En
este caso la variable independiente de la distribución es la tasa de fallos.
Curva típica de la evolución de la tasa de fallos “Curva de la bañera”
Características de la distribución.
La distribución lognormal se obtiene cuando los logaritmos de una Variable se describen mediante
una distribución normal. Es el caso en el que las variaciones en la fiabilidad de una misma clase
de componentes técnicos se representan considerando la tasa de fallos λ aleatoria en lugar de
una variable constante.
Es la distribución cuando las desviaciones a partir del valor del modelo están formadas por
factores, proporciones o porcentajes más que por valores absolutos como es el caso de la
distribución normal.
La distribución lognormal tiene dos parámetros:
 m* = media aritmética del logaritmo de los datos o tasa de fallos.
 σ = desviación estándar del logaritmo de los datos o tasa de fallos.
Propiedades
La distribución lognormal se caracteriza por las siguientes propiedades:

 Asigna a valores de la variable < 0 la probabilidad 0 y de este modo se ajusta a las tasas y
probabilidades de fallo que de esta forma sólo pueden ser positivas.
 Como depende de dos parámetros, se ajusta bien a un gran número de distribuciones
empíricas.
 Es idónea para parámetros que son a su vez producto de numerosas cantidades aleatorias
como son los múltiples efectos que influyen sobre la fiabilidad de un componente.
 La esperanza matemática o media en la distribución lognormal es mayor que su mediana. De
este modo da más importancia a los valores grandes de las tasas de fallo que una distribución
normal con los mismos percentiles del 5% y 50% tendiendo, por tanto, a ser pesimista (ver
figura).
Comparación entre una distribución normal y una lognormal con los mismos percentiles del 5% y 50%.
Variable independiente: el tiempo

La distribución lognormal se ajusta a ciertos tipos de fallos (fatiga de componentes metálicos), vida
de los aislamientos eléctricos, procesos continuos (procesos técnicos) y datos de reparación y
puede ser una buena representación de la distribución de los tiempos de reparación. Es también
una distribución importante en la valoración de sistemas con reparación.
La distribución lognormal esta expresada por:
1 -(1/2((x α)/β) 2 )
f ( x)  e ó
x 2
Donde  - media de los logaritmos de x

 - desviación estándar de los logaritmos de x
Siendo:
σ = desviación estándar en la distribución normal
tm = tiempo medio
t = tiempo
La dispersión es también un parámetro de forma según se ve en la figura, donde aparece la
función densidad de probabilidad de la distribución lognormal para distintos valores de σ(0,4; 0,6;
1,0 y 1,4).

Variable independiente: la tasa de fallos

La aplicación más importante de la distribución lognormal es la descripción de la dispersión
existente en los datos de tasas de fallos de componentes. La función densidad de λ, se puede
escribir de la siguiente forma:
con λ > 0; σ > 0; - α < m* < α

Donde: m* y σ2 son la esperanza o media y la varianza, respectivamente, de los logaritmos de las
tasas de fallos. Sus valores se obtienen mediante las siguientes estimaciones:
Siendo N el número total de valores de la tasa de fallos de un componente.

La expresión de algunos de los parámetros de la distribución lognormal de las tasas de fallo son:
Siendo m* y σ la media y la desviación estándar del logaritmo neperiano de las tasas de fallos.
Para caracterizar la distribución lognormal, normalmente se indica, además de su mediana, su
factor de dispersión D, que tiene la siguiente expresión:

En la ecuación los subíndices indican los percentiles correspondientes de la tasa de fallo λ al 95%.
Distribución exponencial.
La distribución exponencial es el equivalente continuo de la distribución geométrica discreta. Esta
ley de distribución describe procesos en los que nos interesa saber el tiempo hasta que ocurre
determinado evento, sabiendo que, el tiempo que pueda ocurrir desde cualquier instante dado t,
hasta que ello ocurra en un instante tf, no depende del tiempo transcurrido anteriormente en el que
no ha pasado nada.
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución
exponencial. Se usa para la planeación del tiempo entre dos sucesos.
Las aplicaciones de este tipo de distribuciones son:
 El tiempo que tarda una partícula radiactiva en desintegrarse. El conocimiento de la ley que
sigue este evento se utiliza en Ciencia para, por ejemplo, la datación de fósiles o cualquier
materia orgánica mediante la técnica del carbono 14, C14;
 el tiempo que tardara un GPS en aviar la información a la central de procesos. Esta función
puede usarse para determinar la probabilidad de que el proceso tarde como máximo un
minuto.
 El tiempo que puede transcurrir en un servicio mantenimiento de equipos, para la llegada de
una unidad móvil.
En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de tiempo
iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos sigue un
modelo probabilístico exponencial. Por ejemplo, el tiempo que transcurre entre que sufrimos dos
veces un desperfecto de una unidad de transporte importante.
Concretando, si una variable aleatoria continua X esta distribuida a lo largo de , es tal que su
función de densidad es:
La ecuación de la distribución exponencial es: Distribución acumulada:

f x;    e  x
F x;    1  e x
Siendo  el valor del parámetro y x el valor de la función.
Se dice que sigue una distribución exponencial de parámetro λ X  Exp (λ)
Figura: Función de densidad, f, de una Exp (λ).

Para calcular el valor esperado y la varianza de la distribución exponencial, obtenemos en primer

lugar la función característica:
E [X] = 1 / λ
E [X2] = 2 / λ2
Entonces la varianza vale:
MÓDULO 8: EL TEOREMA DEL LÍMITE CENTRAL

Sea cual sea la distribución de los datos originales, y para muestras de tamaños lo bastante
grandes, la distribución de la media muestral es normal sea cual sea la distribución original. Este
resultado fundamental de la estadística tiene un nombre propio: el teorema del límite central.
El teorema del límite central dice que si una muestra es lo bastante grande (n > 30), sea cual sea
la distribución de la variable de interés, la distribución de la media muestral será
aproximadamente una normal. Además, la media será igual a μ y la varianza será igual a σ2/n.
Una consecuencia de este teorema es la siguiente: dada cualquier variable aleatoria con
esperanza μ y para n lo bastante grande, la distribución de la variable es:
𝜎2 𝑋̅ − 𝜇
𝑋̅ ↝ 𝑁 (𝜇, ) , 𝑍 =
𝑛 2
√𝜎
𝑛
Ejemplo: El consume de combustible por las unidades de transporte de mineral se distribuyen
casi normalmente con una media de 11.8 galones y una desviación estándar de 3.5 gl., se toma
una muestra de tamaño 49.
a). ¿Cuál es la probabilidad que el promedio muestral sea mayor que 12 gl.? y
b). ¿Cuál es la probabilidad de que el promedio muestral varíe entre 10.5 y 12.5 galones
respectivamente?
Consideremos la variable X = “consumo de combustible”. Sabemos que su media es 11.8 galones
y su desviación estándar es 3.5 gl. la muestra evaluada es n = 49 unidades. Es decir, tenemos
una muestra x1, x2, ..., xn de nuestra variable.
Por el teorema del límite central sabemos que la media muestral se comporta como una normal
de esperanza 11.8 y desviación estándar de 3.5:
𝜎2 3.52
𝑋̅ ↝ 𝑁 (𝜇, ) ⟹ 𝑋̅ ↝ 𝑁 (11.8, ) ⟹ 𝑋̅ ↝ 𝑁(11.8 , 0.25)
𝑛 49
a. Debemos calcular:
𝑃(𝑋̅ > 12)
̅̅̅̅̅̅̅̅̅̅̅̅
𝑋̅ − 11.8 12 − 11.8
𝑃( > )
√0.25 √0.25
11.8 X>12
𝑃 = (𝑍 > 0.4)
= 0.5 - P[ 0 ≤ Z ≤ 0.4 ]

= 0.5 – 0.15542 = 0.3446

b. Debemos calcular:
𝑃(10.5 < 𝑋̅ < 12.5) = 0.4953 + 0.4192 = 0.9145
La desviación estándar de la distribución muestral de un estadístico se conoce como error
estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por x,
es 1.58. Con esto se puede demostrar que si de una población se eligen muestras de tamaño n
con reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la
distribución de los errores muestrales.
Comienzo
¿Es la población Si
infinita?
No
¿Se muestrea Si
con reemplazo?
No
Si
¿Es N≥30n?
Donde  es la desviación estándar de la población de donde se toman las muestras, n es el

tamaño de la muestra y N el de la población. Como regla de cálculo, si el muestreo se hace sin
reemplazo y el tamaño de la población es al menos 30 veces el tamaño de la muestra (N≥30),
entonces se puede usar la fórmula.
Este factor se denomina factor de corrección para una población finita.

Fórmula Obtiene
x
x  Error estándar de la media para una población infinita.
n
x Nn
x  Error estándar de la media para una población finita.
n N 1

Estimaciones puntuales
Una estimación puntual es un valor (punto) que se usa para estimar un parámetro de la población.
Ejemplos de estimaciones puntuales son media muestral, desviación estándar muestral, variancia
muestral, relación proporcional de la muestra.
Ejemplo 2: se registra el número de defectos producidos durante 5 horas seleccionadas al azar en
una semana de 40 horas. Los defectos observados fueron 12, 4, 7, 14 y 10. La media muestral es
9.4. Entonces la estimación puntual para el promedio de defectos por hora es 9.4.
Estimaciones de intervalo
Una estimación de intervalo establece la amplitud en la que quizá se encuentre un parámetro
poblacional. El intervalo dentro del cual se espera que esté un parámetro poblacional se llama
intervalo de confianza.
Para ello vamos a establecer la notación a utilizar:
Hemos dicho que vamos a proponer un intervalo donde se encontrará el parámetro a estimar,
con una probabilidad de acierto alta. Al valor de esta probabilidad la representaremos por 1-α, y
la llamaremos nivel de confianza. A mayor valor de 1- α, más probabilidad de acierto en nuestra
estimación, por tanto eso implica que α tendrá que ser pequeño, próximo a 0.
Recordemos que 1- α representa siempre una probabilidad por lo que será un valor entre 0 y 1, si
bien en la mayoría de los enunciados de los problemas suele ser enunciado en términos de tanto
por ciento. Así cuando, por ejemplo, se dice que el nivel de confianza es del 90%, significa que
1- α vale 0,9 y por tanto α vale 0,1.
(-Z) ó (-t) (Z) ó (t)
Intervalos de Confianza para la media (µ) conocida la deviación típica de la población.

En general, un intervalo de confianza para la media se calcula mediante:
Ejemplo: El director de la escuela de administración desea estimar el número medio de horas por
semana que estudian los alumnos. Una muestra de 49 estudiantes dio una media de 24 h con
desviación estándar de 4 h.
La estimación puntual es 24 h (media muestral).

¿Cuál es el intervalo de confianza de 95% para el número promedio de horas por semana que
estudian los alumnos?
Si se usa un IC de 95% para la media poblacional, se tiene
Los puntos terminales del intervalo de confianza son los límites de confianza. El límite inferior de
confianza es 22.88 y el límite superior de confianza es 25.12
25.12
L.C.S.
24.00
μ
22.88
L.C.I.
Intervalos de Confianza para la media (µ) desconocida la deviación típica de la población.

Sigue una distribución llamada t-Student con (n-1) grados de libertad y para un alfa de (1-
confianza), que presenta una forma en la curva muy similar a la de la distribución normal.
Estamos pues ante la siguiente situación:
𝑺 𝑺𝒏−𝟏
̅ ±𝒕
𝑿 ó ̅ ±𝒕
𝑿
√𝒏 √𝒏
Ejemplo: La puntuación media de una muestra de 20 bolsas de mineral, elegidos al azar, para
una misma prueba, presentó una media de 9,8525 kilos y una cuasi desviación típica muestral de
0,0965 kilos. Calcular un intervalo de confianza con un 95% para el peso medio. (Suponemos que
la variable que mide el peso sigue una distribución normal.)
Estamos en el caso de un intervalo de confianza para la media desconociendo la desviación
típica de la población.
Datos:
Media = 9,8525, cuasi desviación = 0,0965, n = 20, confianza 0,95
Tenemos que buscar un valor t, de modo que en la distribución t-Student con g.l. = (n-1) = 19
grados de libertad deje una área de probabilidad es igual a α = (1-0.95) = 0.05. Dicho valor le
corresponde un valor de t =2,0930.
Así pues el intervalo buscado es:
𝑺 𝟎.𝟎𝟗𝟔𝟓
̅ ±𝒕
𝑰. 𝑪. = 𝑿 = 𝟗. 𝟖𝟓𝟐𝟓 ± (𝟐. 𝟎𝟗𝟑𝟎) = 9,8525 ± 0,045
√𝒏 √𝟐𝟎
L.C.S. = 9,8525 + 0,045 = 9.807

L.C.I. = 9,8525 - 0,045 = 9.897
La media se estima en 9,8525 más menos un margen de error de 4,5%
Intervalo de confianza para una relación proporcional de población
El intervalo de confianza para una relación proporcional de una población se estima como:

Donde es el error estándar de la proporción:
Ejemplo: Matt Williams, planificador financiero, estudia los planes de retiro para jóvenes
ejecutivos. Una muestra de 500 ejecutivos que son dueños de sus casas reveló que 175 planean
venderlas y retirarse en Arizona. Desarrolle un intervalo de confianza de 98% para la proporción
de ejecutivos que planean vender e irse a Arizona.
Aquí, n=500, p=175/500=0.35 y z=2.33
el IC de 98% es:
𝟎. 𝟑𝟓(𝟏 − 𝟎. 𝟑𝟓)
𝑰. 𝑪. = 𝒑 ± 𝒁 𝝈𝒑̅ = 𝟎. 𝟑𝟓 ± (𝟐. 𝟑𝟑)√ = 𝟎. 𝟑𝟓 ± 𝟎. 𝟎𝟒𝟗𝟕
𝟓𝟎𝟎
L.C.S. = 0.35 + 0,0497 = 0.3997
L.C.I. = 0.35 - 0,0497 = 0.3003
0.3003 ≤ π ≤ 0.3997
30.03% ≤ π ≤ 39.97%
Control de calidad.
Uno de los casos más habituales en los que podemos aplicar el teorema del límite central es a la
hora de hacer un proceso de control de calidad. Entenderemos por control de calidad el
seguimiento de cierta variable aleatoria en un proceso de producción a partir de la media de
muestras sucesivas.
Estableceremos un intervalo, de manera que las medias que caigan fuera de este intervalo nos
indicarán que existe alguna anomalía en el proceso de producción en aquel instante. Los límites
de este intervalo se denominan límites de control.
Si μ es la esperanza de la variable de interés, σ la desviación típica y consideramos una muestra
de esta variable de tamaño n, los límites de control vendrán dados por μ + 3σ √n y μ - 3σ √n. Es
decir, calculamos tres veces el error estándar a lado y lado de la media. Por tanto, la longitud
del intervalo es dos veces el triple del error estándar.
¿Por qué tomamos este intervalo? Si aplicamos el teorema del límite central sobre la variable de
interés, sabemos que la media de n datos se distribuye como una normal con media μ y varianza
σ √n. Se demuestra fácilmente que la probabilidad de que una media esté fuera del intervalo μ +
3σ √n y μ - 3σ √n es de 0,001 (esto significa que un valor fuera de este intervalo, si el proceso
funcionase correctamente, se puede dar sólo con una probabilidad de 0,001). Por tanto, cuando
se dé un valor fuera del intervalo, pensaremos que no es casualidad y que en el problema la
variable no se comporta como suponíamos.
Ejemplo de realización de un control de calidad
Consideremos una máquina que llena tarros de pegamento. Supongamos que, de media, cada
tarro contiene 125 gramos de pegamento con una desviación típica de 1,5 gramos. Todas las
semanas hacemos un control de la máquina: analizamos una muestra de 30 tarros y calculamos
la media de cada uno.
En este ejemplo el error estándar es:

Por tanto, los límites de control serán:

125 + 3 · 0,274 = 125,82
125 - 3 · 0,274 = 124,18
Así pues, si la media de las muestras semanales de tamaño 30 está entre estos dos valores,
consideraremos que todo está correcto, mientras que si es inferior a 124,18 o superior a 125,82
supondremos que hay alguna anomalía en el proceso de producción, y habrá que revisarlo.
Por tanto, en este control de calidad sólo se desperdicia treinta tarros a la semana por que
contienen un error en el llenado.
Selección del tamaño de muestra
Existen 3 factores que determinan el tamaño de una muestra, ninguno de ellos tiene una relación
directa con el tamaño de la población. Los factores son:
 El grado de confianza elegido.
 El error máximo permitido.
 La variación en la población.
Tamaño de la muestra para la media.
El tamaño de la muestra es la siguiente:
Cuando N > 100,000 Cuando N ≤ 1,500 Cuando N > 1,500
𝑍. 𝜎 2 𝑍2𝜎 2𝑁 𝑍2𝜎 2𝑁
𝑛=( ) 𝑛= 𝑛=
𝐸 𝐸 2 (𝑁 − 1) + 𝜎 2 𝑍 2 𝐸2𝑁 + 𝜎 2𝑍2
Donde: E es el error permitido, Z es el valor normal estándar asociado con el grado de confianza
seleccionado y σ es la desviación estándar estimada del estudio piloto.
Ejemplo: Un grupo de consumidores desea estimar la media mensual en los recibos de luz para
una casa unifamiliar. Según estudios similares la desviación estándar se estima en $20.00. Se
desea un nivel de confianza de 99%, con una precisión de ±$5.00. ¿Qué tamaño de muestra se
requiere?
Tamaño de la muestra para proporciones.

La fórmula para determinar el tamaño de la muestra en el caso de una proporción es:
Cuando N > 100,000 Cuando N ≤ 1,500 Cuando N > 1,500
𝑍 2 𝑍 2 𝑁𝑝(1 − 𝑝) 𝑍 2 𝑁𝑝(1 − 𝑝)
𝑛 = 𝑝(1 − 𝑝) ( ) 𝑛= 𝑛=
𝐸 𝐸 2 (𝑁 − 1) + 𝑍 2 𝑝(1 − 𝑝) 𝐸 2 𝑁 + 𝑍 2 𝑝(1 − 𝑝)
Donde p es la proporción estimada, basada en la experiencia o en un estudio piloto; Z es el valor

asociado con el nivel de confianza deseado; E es el error máximo que tolerará el investigador.
Ejemplo: El American Kennel Club desea estimar la proporción de niños que tienen un perro como
mascota. Si el club quiere la estimación dentro de 3% de la relación proporcional, ¿cuántos niños
deberán contactar? Suponga 95% de nivel de confianza y que el club estimó que 30% de los niños
tienen un perro como mascota.
N = (0.30)(0.70)(1.96/0.03)2 = 896.3733 ≈ 896
MÓDULO 9: PRUEBAS DE HIPÓTESIS

¿Qué es una hipótesis?
En una investigación no solo se requiere estimar un parámetro, sino que el investigador puede
proponer hipotéticamente un valor o valores para el parámetro; valor basado en su propia
experiencia profesional o según oriente el marco teórico, de la investigación. Por tanto, es
necesario decidir si se considera ese supuesto o se rechaza, obviamente se efectúa en base a
datos obtenidos de una muestra aleatoria, y empleando la prueba de hipótesis estadísticas o
llamado también contraste de hipótesis estadística, o simplemente prueba de hipótesis.
¿Qué es una prueba de hipótesis? Una prueba de hipótesis es el proceso mediante el cual, a
partir de los valores de una muestra aleatoria extraída de una población bajo estudio, se decide
si mantiene el supuesto que plantea el investigador para el parámetro, o se rechaza; con cierta
probabilidad de error (riesgo) por tomar una decisión.
Procedimiento de la Prueba de hipótesis
1. Plantear adecuadamente la hipótesis nula y la

alternativa.
2. Elegir el nivel de significancia (
3. Elegir el estadístico para la prueba, de acuerdo

a los requisitos que exige la teoría estadística
inferencial.
4. Definir la región de rechazo, según la hipótesis

alternativa propuesta.
5. Calcular el estadístico seleccionado para

realizar la prueba de hipótesis.
6. Compara el valor de la estadística de prueba

con el valor crítico.
No rechazar la Hipótesis Rechazar la Hipótesis

Nula Nula y aceptar la Alterna

Definiciones
Ho es la hipótesis nula, y es la que se somete a contraste.
H1 es la hipótesis alternativa a H0, y es la negación de Ho. Mientras que Ho es exacta, H1 suele
ser inexacta.
Nivel de significancia de la prueba: La probabilidad es el nivel de significación de la prueba,
es el riesgo o la probabilidad que el investigador asume de manera voluntaria para equivocarse
al rechazar la hipótesis nula, cuando en realidad es verdadera. Es también la confiabilidad de
decidir si se rechaza o no la hipótesis nula.
La decisión (¿H0 sí o H0 no?).
La decisión requiere, en primer lugar, trazar un punto de corte (o dos, en el contraste bilateral),
que definirá dos zonas, una de rechazo (o crítica) y otra de aceptación.
Ese punto de corte vendrá dada por el nivel de confianza y el nivel de riesgo, α La decisión
consiste en rechazar la Ho si el estadístico de contraste cae en la región de rechazo, y
mantenerla si cae en la región de aceptación.
Mantener la Ho significa que la hipótesis es compatible con los datos. Rechazarla implica que
ambos son incompatibles, luego consideramos la Ho falsa.
Estado real
decisión
H0 es verdadera H0 es falsa
Rechazar H0 Error de tipo I OK.
No rechazar H0 OK. Error de tipo II
Error Tipo I: rechazar la hipótesis nula cuando en realidad es verdadera.
Error Tipo II: aceptar la hipótesis nula cuando en realidad es falsa.
Estadístico de prueba: Para rechazar o no la hipótesis nula se toma una muestra aleatoria de la
población bajo estudio y los resultados contenida en ella se usa en expresiones llamadas
estadísticos o estadísticas de prueba e indican el grado de discrepancia entre la hipótesis nula y
los datos muestrales que están resumidos en las estadísticas.
Valor crítico: el punto que divide la región de aceptación y la región de rechazo de la hipótesis
nula.
Región de Aceptación
Región de Rechazo
Pruebas unilaterales y bilaterales.
a). Contraste Unilateral b). Contraste Unilateral c). Contraste Bilateral:

Derecho: H0 :μ ≤ μ0 Izquierdo: H0 :μ ≥ μ0 H0 :μ = μ0
H1 :μ > μ0 H1 :μ < μ0 H1 :μ ≠ μ0
Rechazar H 0 si el valor de la Rechazar H 0 si el valor de la Rechazar H 0 si el valor de la

estadística Z z, en caso estadística Z z, en caso estadística Z z/ 2 ó Z z /
contrario no se rechaza H 0. contrario no se rechaza H 0. 2 , en caso contrario no se
rechaza H 0 .
Pruebas de significancia
Prueba de significancia de una cola. Prueba de significancia de dos colas.

Una prueba es de una cola cuando la hipótesis Una prueba es de dos colas cuando no se
alterna, H1, establece una dirección, como: establece una dirección específica de la
hipótesis alterna H1, como:
H0: el ingreso medio de las mujeres es menor o
igual al ingreso medio de los hombres. H0: el ingreso medio de las mujeres es igual al
ingreso medio de los hombres.
H1: el ingreso medio de las mujeres es mayor
que el de los hombres. H1: el ingreso medio de las mujeres no es igual
al ingreso medio de los hombres.
Distribución de muestreo para el valor
estadístico z, prueba de una cola, nivel de Distribución de muestreo para el valor
significancia de 0.05 estadístico z, prueba de dos colas, nivel de
significancia de 0.05
MÓDULO 9: PRUEBAS DE HIPÓTESIS PARA MUESTRAS GRANDES

PRUEBA PARA LA MEDIA POBLACIONAL:
Desviación
estándar El estadístico de prueba está dado por: 𝑋̅ − 𝜇
𝑍=
poblacional 𝜎/√𝑛
conocida - σ
Desviación
Se estimará con la desviación estándar
estándar 𝑋̅ − 𝜇
de la muestra S, z puede aproximarse 𝑍=
poblacional 𝑆/√𝑛
con:
desconocida - σ
Parte fraccional o porcentaje que indica
Pruebas la parte de la población o muestra que
𝑝−𝑃
respecto a tiene un atributo particular de interés. 𝑍=
relaciones 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 √𝑃𝑞
𝑝= 𝑛
proporcionales 𝑛ú𝑚𝑒𝑟𝑜 𝑛𝑢𝑒𝑠𝑡𝑟𝑒𝑎𝑑𝑜
P = Relación proporcional poblacional

p = Relación proporcional muestral

Suponga que los parámetros para dos
poblaciones son: ̅̅̅̅̅
(𝑋1 − ̅̅̅
𝑋2 )(𝜇1 − 𝜇2 )
Prueba de dos 𝑍=
medias 𝑆2 𝑆2
poblacionales Cuando σ1 y σ2 no se conocen pero el √ 1+ 2
𝑛1 𝑛2
tamaño de muestra n1 y n2 ≥ 30, el
estadístico de prueba es:
Prueba de la 𝑥1 + 𝑥2
diferencia entre 𝑃= (𝑝1 − 𝑝2 )
𝑛1 + 𝑛2 𝑍=
dos relaciones P = La media ponderada de la Relación 1 1
√𝑃𝑞 ( + )
proporcionales proporcional poblacional 𝑛1 𝑛2
de población p = Relación proporcional muestral
Ejemplo: Los fabricantes de Fries’ Catsup indican en su etiqueta que el contenido de la botella es
de 16 onzas. Cada hora se toma una muestra de 36 botellas y se pesa el contenido, el cual tiene
una distribución normal de probabilidad. La muestra de la última hora tiene un peso medio de
16.12 onzas con una desviación estándar de 0.5 onzas. ¿Está el proceso fuera de control para un
nivel de significancia de 0.05?
Caso general Ejemplo especifico
1. Hipótesis ¿Está el proceso fuera de control para un nivel de
Contr. Bilateral: H0 :μ = μ0 significancia de 0.05?
H1 :μ ≠ μ0 Media de la población μ = 16
Contr. Unil. Der.: H0 :μ ≤ μ0 Media de la muestra X = 16.12
H1 :μ > μ0 Nivel de Confianza = 0.95; n = 36, σ = 0.5
Contr. Unil. Izq.: H0 :μ ≥ μ0 H0 : μ = 16
H1 :μ < μ0 H1 : μ ≠ 16
2. Supuestos Tenemos n suficientemente grande para
a). Población con distribución normal garantizar una Distribución Media de la Muestra
b). Muestra aleatoria de tamaño n. normal.
3. Estadístico de contraste
𝑋̅−𝜇 𝑋̅−𝜇 𝑝−𝑃 𝑋̅ − 𝜇
𝑍 = 𝜎/ 𝑍 = 𝑆/ 𝑍= 𝑍=
√𝑛 √𝑛 √
𝑃𝑞 𝜎/√𝑛
𝑛
4. Definir la región
Primero, la zona de rechazo según α • α = 1 – NC = 1 – 0.95 = 0.05;
• Contraste Bilateral: α/2 = 0.05/2 = 0.025
p = 0.95/2 = 0.475
Tabla de D.N.  Z0.475 = 1.96
• Contraste bilateral, luego
Z z/ 2 ó Z z/ 2 = ± 1.96
• Contraste Unilateral Derecho:
α/2 = 0.025 α/2 = 0.025
-1.96 +1.96
H0 se rechaza si z < - 1.96 ó z > 1.96

• Contraste Unilateral Izquierdo:
5. Calcular el estadístico 𝑋̅ − 𝜇 16.12 − 16 0.12

Del estadístico seleccionado para realizar 𝑍= = = = 1.44
la prueba de hipótesis. 𝜎/√𝑛 0.5/√36 3
• El estadístico de contraste cae en la región de
aceptación:
Región de
Región de rechazo Región de rechazo
aceptación
•-1.96 •1.44 •+1.96
•1.44 < 1.96
6. La regla de decisión
Se rechaza H0 si Zemp cae en la zona de
rechazo determinada por Zteor. Z emp < Z teor
1.44 < 1.96
• Luego mantenemos la H0: los resultados son
compatibles con una media igual a 16, es decir,
son compatibles con los aciertos esperados por
azar.
MÓDULO 10: PRUEBAS DE HIPÓTESIS, MUESTRAS PEQUEÑAS
Características de la distribución t de Student
La distribución t tiene las siguientes propiedades:
 es continua, tiene forma de campana y es simétrica respecto al cero como la distribución z.
 existe una familia de distribuciones t que comparten una media de cero pero con
desviaciones estándar diferentes.
 la distribución t está más dispersa y es más plana en el centro que la distribución z, pero
se acerca a ella cuando el tamaño de la muestra crece.
PRUEBA PARA LA MEDIA POBLACIONAL:

desviación El estadístico de prueba para el caso de una
estándar muestra está dado por la t de student tiene 𝑋̅ − 𝜇
𝑡=
poblacional una distribución t, con = n-1 grados 𝑆/√𝑛
desconocida de libertad.

se requieren tres suposiciones:

 las poblaciones deben tener una
distribución normal o normal aproximada
 las poblaciones deben ser (𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
Comparación
independientes 𝑡=
de dos medias 1 1
poblacionales  las variancias de las poblaciones 𝑆𝑚 √𝑛 + 𝑛
desconocidas pero deben ser iguales 1 2
Variancia muestral combinada:
2
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑚 =
𝑛1 + 𝑛2 − 2
se requieren tres suposiciones:
 las poblaciones deben tener una (𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
Comparación distribución normal o normal aproximada 𝑡=
de dos medias  las poblaciones deben ser 𝑆2 𝑆2
poblacionales independientes √ 1+ 2
𝑛1 𝑛2
 las variancias de las poblaciones
desconocidas y diferentes
 Las muestras independientes que no
están relacionadas.
 Las muestras dependientes están
Prueba con pareadas o relacionadas de alguna 𝑑̅
observaciones manera. 𝑡=
por pares  Por ejemplo, cotización de precios. 𝑆𝑑 /√𝑛
Donde: d¯ = promedio de las diferencias
Sd = desviación estándar de las diferencias
n = es el número de pares (diferencias)
Ejemplo: La tasa actual para producir fusibles de 5 amp en Neary Electric Co. es 250 por hora. Se
compró e instaló una máquina nueva que, según el proveedor, aumentará la tasa de producción.
Una muestra de 10 horas seleccionadas al azar el mes pasado indica que la producción media por
hora en la nueva máquina es 256, con desviación estándar muestral de 6 por hora. Con 0.05 de
nivel de significancia, ¿puede Neary concluir que la nueva máquina es más rápida?
Caso general Ejemplo especifico
1. Hipótesis ¿puede Neary concluir que la nueva máquina es
Contr. Bilateral: H0 :μ = μ0 más rápida?
H1 :μ ≠ μ0 Media de la población μ = 250
Contr. Unil. Der.: H0 :μ ≤ μ0 Media de la muestra X = 256
H1 :μ > μ0 Nivel de Confianza = 0.95; n = 10, σ = 6
Contr. Unil. Izq.: H0 :μ ≥ μ0 H0 : μ ≤ 250
H1 :μ < μ0 H1 : μ > 250
2. Supuestos Tenemos n suficientemente pequeña para
a). Población con distribución normal garantizar una Distribución Media de la Muestra
b). Muestra aleatoria de tamaño n. normal.
3. Estadístico de contraste 𝑋̅ − 𝜇
𝑋̅−𝜇 𝑑̅ 𝑡=
𝑡= 𝑡= 𝑆/√𝑛
𝑆/√𝑛 𝑆𝑑 /√𝑛
• α = 1 – NC = 1 – 0.95 = 0.05;
Para una cola es:
4. Definir la región
1/α = 1/0.05 = 20
Primero, la zona de rechazo según α
α/2 = 20/2 = 10
• Contraste Bilateral:
g.l. = n-1 = 10 – 1 = 9
Tabla de t de una cola  t(g.l.),NC = t9,0.05

t9,0.05 = 1.8331
• Contraste Unilateral Derecho, luego
Contraste unilateral derecho, luego
tteor = tn−1,α−1 = t 9,0.95 =1.8331
• Contraste Unilateral Derecho:

α/2 = 10
+1.8331
H0 se rechaza si temp > 1.8331
• Contraste Unilateral Izquierdo:
5. Calcular el estadístico 𝑋̅ − 𝜇 256 − 250 6

Del estadístico seleccionado para realizar 𝑡= = = = 3.1623
la prueba de hipótesis. 𝑆/√𝑛 6/√10 1.8974
• El estadístico de contraste cae en la región de
rechazo:
Región de aceptación Región de rechazo
•1.8331 •3.1623
6. La regla de decisión •3.1623 > 1.8331
Se rechaza H0 si temp cae en la zona de
rechazo determinada por tteor.
t emp > t teor
3.1623 > 1.8331
• Luego rechazamos H0: La nueva máquina es más
rápida.
MÓDULO 11: JI CUADRADO Y ANÁLISIS DE VARIANCIA - ANOVA

Hasta ahora hemos trabajado con una o dos muestras. De una muestra, para determinar si una
media o proporción era significativamente diferente del valor hipotetizado y de dos muestras,
para determinar si la diferencia de medias o proporciones es significativa.
La prueba de Ji cuadrado nos permite trabajar con más de dos proporciones y ANOVA (análisis
de varianzas) nos permitirá probar si más de dos medias de poblaciones pueden considerarse
iguales.
PRUEBA JI CUADRADO
Gran parte de la información recolectada en investigaciones estadística es nominal o
categórica. Cuando tenemos más de dos poblaciones, utilizaremos la prueba Ji cuadrado, es la
distribución de una variable aleatoria siempre positiva, con una posición oblicua hacia la
derecha y unimodal.
En realidad la distribución Ji-cuadrada es la distribución muestral de S2. O sea que si se extraen
todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza,
se obtendrá la distribución muestral de varianzas.

La siguiente figura ilustra tres distribuciones X2
La tabla que se utilizará esta en el anexo de probabilidad para valores críticos Ji cuadrado X2 a
grados de libertad para valores especiales de . Para denotar el valor crítico de una distribución
X2 con g.l. grados de libertad se usa el símbolo “X2  (gl)”; por ejemplo para encontrar X2 0.05(6)
en la tabla se localiza 6 g.l. en el lado izquierdo y =0.05 a o largo del lado superior de la misma
tabla.
Se utiliza para demostrar:

 Prueba de bondad de ajunte.
 Prueba de independencia.
 Prueba de homogeneidad.
Deseamos saber si dos caracteres de una población son dependientes o independientes, también
se trabaja con tablas de contingencias como por ejemplo:
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber como
se va a comportar la varianza o desviación estándar en una muestra que proviene de una
distribución normal. El cálculo de la prueba Ji cuadrado, se realiza con la siguiente formula:

𝑆2
𝑋 2 = (𝑛 − 1)
𝜎02
Donde X2 se distribuye con (n-1) g.l.
S2 = Varianza poblacional
σ2 = Varianza muestral
Las hipótesis a plantearse son:
• Contraste Unilateral Izquierdo: • Contraste Bilateral: • Contraste Unilateral Derecho:

𝐻0 : 𝜎 2 = 𝜎02 𝐻0 : 𝜎 2 = 𝜎02 𝐻0 : 𝜎 2 = 𝜎02
𝐻1 : 𝜎 2 < 𝜎02 𝐻1 : 𝜎 2 = 𝜎02 𝐻1 : 𝜎 2 > 𝜎02
Si aceptamos la H0, podemos considerar que no tenemos evidencia que nos hagan suponer una
dependencia entre las dos variables a un nivel de confianza = 1-α
Ejemplo: Una compañía que produce una parte maquinada para un motor, afirma que tiene una
varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes
dio una varianza de muestra S2=0.0003. Si se supone que las medidas del diámetro se distribuyen
en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor? Use = 0.05
Solución:
Como en todos los ensayos de hipótesis que se han realizado anteriormente el procedimiento es
el mismo. Después de que se identifican los datos, se plantea la hipótesis para determinar el
tipo de ensayo.
Datos:
σ2= 0.0002
n = 10
S2 = 0.0003
 = 0.05
Ensayo de hipótesis:
𝐻0 : 𝜎 2 = 0.0002
𝐻1 : 𝜎 2 > 0.0002
Regla de decisión:
Si X2 ≤ 16.919 no se rechaza Ho.
Si X2 > 16.919 se rechaza Ho.

Cálculos:
0.0003
𝑋 2 = (10 − 1) = 13.5
0.0002
Justificación y decisión:
Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un nivel de
significancia de 0.05 que no se puede refutar la afirmación del proveedor.
ANOVA (Analysis Of Variance)
Es un método de cálculo para probar la hipótesis de que las medias de dos o más poblaciones son
iguales.
En un estudio ANOVA, se aplican tratamientos (programas de capacitación, métodos de
enseñanza, ingreso per cápita, etc.) a entidades denominados unidades experimentales
(estudiantes, clientes, consumidores, trabajadores). El atributo de las entidades, que se desea
medir recibe el nombre de factor.
En un estudio ANOVA se pueden aplicar modelos de efectos fijos o aleatorios. En un modelo de
efectos fijos, se seleccionan tratamientos específicos o se fijan antes del estudio determinístico.
En un modelo de efectos aleatorios, los tratamientos utilizados en el estudio se seleccionan
aleatoriamente. Como por ejemplos:1). Comparación de kilometraje logrado por cinco clases de
gasolina. 2). Cual de los cuatro métodos de capacitación produce el rápido aprendizaje. 3). La
dosificación de drogas en un paciente.
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos
poblaciones es evidente a partir del análisis de una sola población y para la solución de este tipo
de estudios se aplica la distribución “F” de FISHER. Frecuentemente se desea comparar la
precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de
manufactura con la de otro.
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La
distribución F tiene una apariencia muy similar a la distribución Ji cuadrada; sin embargo, se
encuentra centrada respecto a 1, y los dos parámetros v1 y v2 proporcionan una flexibilidad
adicional con respecto a la forma de la distribución.
Si S12 y s22 son las varianzas muestrales independientes de tamaño n1 y n2 tomadas de
poblaciones normales con varianzas σ12 y σ22, respectivamente, entonces se tiene la prueba
estadística de F con ((n1 – 1), (n2 – 1)) grados de libertad:
𝑆12
𝐹= >1
𝑆22
Las tablas tienen la siguiente estructura:
Para manejar las tablas de Fisher se tendrá que buscar los grados de libertad n1 y n2, para
calcular el valor de F.
n2 5% (normal) y 1% (negritas) puntos para la distribución F
n1 grados de libertad (para el mayor cuadrado medio)
1 1 2 3 4 5 6 7 8 …… 24 …… …… 500 ∞
2
…
2.11
19 63.621 49.782 44.412 41.531 39.727 38.475 37.558 36.86 36.307 33.804 32.363 32.058 31.621
2.92
20 46.071 34.794 30.457 28.114 26.645 25.633 24.891 24.324 23.88 21.828 20.649 20.409 20.045
Ejemplos: Encontrar el valor de F, en cada uno de los siguientes casos:
a). El área a la derecha de F, es de α = 5% con b). El área a la derecha de F, es de α = 1% con

n1 = 24 y n2 = 19. n1 = 24 y n2 = 19.
Las hipótesis se plantean de la siguiente manera:

Contraste Unilateral Derecho:
𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 > 𝜎22
Se debe cumplir las siguientes condiciones:
 Las poblaciones están distribuidas normalmente.
 Las poblaciones tienen varianzas iguales
 Las muestras se seleccionan de modo independiente.
Ejemplo: La variabilidad en la cantidad de impurezas presentes en un lote de productos
químicos, utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un
fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso 2, con
la esperanza de reducir la variabilidad, así como la cantidad media de impurezas en los
productos químicos. Muestras de n1=25 y n2=20 mediciones de dos lotes produjeron
las siguientes medias y varianzas:
¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso son
menores para el 2? Realice una prueba con un a = 0.05.
Solución:
Datos:
Ensayo de hipótesis:
𝐻0 : 𝜎12 = 1
𝐻1 : 𝜎12 > 1
Estadístico de prueba:
𝑆12
𝐹= >1
𝑆22

La sugerencia que se hace es que el numerador sea el de valor mayor. Entonces los grados de
libertad uno será el tamaño de la muestra de la población uno menos uno. v1= 25 - 1 = 24 y v2 =
20 – 1 = 19.
Regla de decisión:
Si F ≤ 2.11 No se rechaza Ho,
Si F > 2.11 se rechaza Ho.
Cálculo:
𝑆12 1.04
𝐹= 2 = 0.51 = 2.04
𝑆2
Decisión y Justificación:
Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un a = 0.05 que no existe
suficiente evidencia para decir que la varianza del proceso 2 es menor que la del proceso 1.
MÓDULO 12: REGRESIÓN LINEAL Y CORRELACIÓN
Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la
relación (correlación) entre dos variables. Al analizar un conjunto de datos bivariados es
conveniente obtener algún conocimiento acerca de la relación que puede existir entre estas
variables cuantitativas, por ejemplo, analizar la relación entre:
X Y UNIDAD ESTADÍSTICA
Municipio de Lima
Ingresos Egresos
Metropolitana
Personal obrero de una
Peso Edad
constructora
Ingresos generados
Gastos Centro hospitalario
Puntaje en prueba de Puntaje en prueba de Alumno de nivel secundaria en
habilidad matemática habilidad verbal Ate
La naturaleza e intensidad de las relaciones entre variables pueden ser examinadas por medio
del análisis de regresión y correlación, dos técnicas estadísticas relacionadas pero que sirven
para propósitos diferentes.
El análisis se realiza conjuntamente dos variables cuantitativas, una de ellas llamada variable
dependiente o de respuesta (y) cuyo comportamiento se debe o se explica por otra variable
llamada independiente (x), a ésta última se le denomina también variable explicativa o variable
regresora.
Diagrama de dispersión:

Gráfica que describe la relación entre las dos variables de interés. Es de gran utilidad porque los
puntos graficados nos mostrarán la naturaleza y la fuerza de la relación entre dichas variables:
Correlación negativa perfecta Correlación positiva perfecta
Correlación cero Correlación positiva fuerte
5.4. Modelo de regresión lineal simple poblacional

Para las variables bajo estudio, el modelo se escribe:
y 0 1x 
Es la ecuación que describe como se relaciona “y” con “x” y el término error aleatorio.
Donde:
y : variable dependiente o de respuesta. Es la variable por modelar o predecir.
x : variable independiente o regresora. Es la variable que se utiliza para modelar o predecir.
βo: parámetro del modelo; es la ordenada en el origen,
β1: parámetro del modelo, pendiente de la recta, indica la magnitud del incremento o
decremento de y por cada unidad de incremento en x.
e: error o perturbación aleatoria, explica la variabilidad en y, que no puede ser explicada en el
modelo.
Supuestos:
1. Los valores de la variable independiente “x” son "fijos".
2. La variable “x” se mide sin error (se desprecia el error de medición en x)
3. Los errores son aleatorios, se distribuyen normalmente con media cero y variancia uno.
Suposiciones fundamentales de regresión lineal
 Para cada valor de X, existe un grupo de valores de Y que tienen una distribución normal.
 Las medias de estas distribuciones normales de valores de Y deben estar sobre la recta de
regresión.

 Las desviaciones estándar de estas distribuciones normales son iguales.

 Los valores de Y son estadísticamente independientes. Es decir, que en la selección de una
muestra, los valores elegidos de Y para un valor particular de X no depende de los valores de
Y para otro valor de X.
Estimación de los Parámetros del Modelo de regresión lineal simple.
El modelo de regresión lineal simple ajustado, se obtiene en base a los datos de una muestra:
𝑌̂ = 𝛽̂0 + 𝛽̂1 𝑋
Donde:
ˆy: Es el valor estimado de y para un determinado valor de x.
ˆ0: Es el estimador de la ordenada en el origen.
ˆ1: Es el estimador de la pendiente de la recta.
Para estimar los parámetros del modelo se utiliza el Método de los mínimos cuadrados, que es
un procedimiento que permite encontrar los estimadores de los parámetros del modelo, que
minimiza la suma de los cuadrados de las desviaciones entre los valores de la variable de
respuesta (valores de la muestra) y los valores estimados de la variable de respuesta (obtenidos
en la ecuación estimada de regresión):
Análisis de regresión
Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable
dependiente (Y) basado en la variable independiente (X).
Procedimiento: seleccionar una muestra de la población y enumerar los datos por pares para
cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la
ecuación de regresión.
La ecuación de regresión: 𝑌̂ = 𝛽̂0 + 𝛽̂1 𝑋 ó 𝑌̂ = 𝑎 + 𝑏𝑋

Donde:
Ŷ = Valor promedio pronosticado de Y para cualquier valor de X.
a = Intercepción en Y, o el valor estimado de Y cuando X = 0
b = Pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X se usa el
principio de mínimos cuadrados para obtener a y b:
Coeficiente de covarianza.
Llamada también varianza simultanea o compartida, es el estadígrafa que mide la varianza
conjunta de las variables, se le representa por:
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖
𝑆𝑋𝑌 = − 𝑥𝑦
̅̅̅ = 𝑥𝑦
̅̅̅ − 𝑥̅ 𝑦̅
𝑛
Varianza residual.

Es el estadígrafo que mide el grado de dispersión de los datos respecto a la recta de ajuste,
𝑆𝑋𝑌
𝑆𝑋𝑌 2 = 𝑆𝑦2 −
𝑆𝑥2
Por tanto la varianza residual de la regresión del Y en función de X es:
𝑆𝐸2 = (1 − 𝑟 2 )𝑆𝑌2
Y la varianza residual de la regresión del X en función de Y es:
𝑆𝐸2 = (1 − 𝑟 2 )𝑆𝑋2
Ejemplo: Ejemplo: Dan Ireland, presidente de la sociedad Libro Páginas X Costo ($) Y
editora de libros, está preocupado por el costo de los libros. 1 500 28
Para tener un panorama del problema elige una muestra de 8 2 700 25
libros de venta en la librería. Desarrollar una ecuación de 3 800 33
regresión para la información dada para estimar el precio de 4 600 24
venta basado en el número de páginas. 5 400 23
Por el principio de mínimos cuadrados, 6 500 27
7 600 21
b = 0.01714 y a = 16.0 8 800 31
Ŷ = 16.0 + 0.01714X
Error estándar de la estimación
El error estándar de la estimación mide la dispersión de los valores observados alrededor de la
recta de regresión. La fórmula usada para calcular el error estándar es la raíz cuadrada positiva
de la varianza Residual.
Ejemplo: del ejercicio anterior calcule el error estándar de la estimación:
Coeficiente de correlación, “r”

El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos
variables. Esta correlación permite tomar decisiones o calificar a la relación existente entre X i
Y, se le representa por “r”
Puede tomar valores entre -1.00 y 1.00. (-1 < r < 1) Valores que indican correlación fuerte y
perfecta. Valores cercanos a 0.0 indican correlación débil.
Valores negativos indican una relación inversa y valores positivos indican una relación directa.
En la práctica se trabaja con el valor absoluto de r, entonces, a medida que r se aproxime a 1,
más grande es el grado de correlación entre los datos, de acuerdo con esto el coeficiente de
correlación se puede clasificar de varias formas, como se observa en la Tabla.
Clasificación del grado de correlación.
CORRELACIÓN VALOR O RANGO
Perfecta |r| = 1
Excelente 0.9 <= |r| < 1
Buena 0.8 <= |r| < 0.9
Regular 0.5 <= |r| <0.8
Mala |r|< 0.5
Fórmula para “r”.

El ángulo entre el vector formado por las desviaciones del X con respecto a su valor medio y el
de la Y con respecto a su valor medio, , esta definido por:
El ángulo muestra el grado de paralelismo entre los vectores (a > θ > desviación y a < θ <
desviación).
La varianza que no es explicada por las rectas de regresión esta dada por: 100 - r2
Coeficiente de determinación.
El coeficiente de determinación, r2 es la proporción de la variación total en la variable
dependiente Y que está explicada por o se debe a la variación en la variable independiente X.
El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma valores de
0 a 1.
Ejemplo: Calcule el coeficiente de correlación del estudio de la relación entre el número de
páginas del libro y el costo.
r = 0.614 (verificar)
Pruebe la hipótesis.
La prueba de hipótesis se desarrolla con la t de student.
Ejemplo: Del ejercicio anterior se formula la hipótesis de que no existe correlación en la
población. Use 0.02 de nivel de significancia.
Paso 1: Ho: la correlación en la población = cero.
H1 : la correlación en la población ≠ cero.
Paso 2:
Determinar la t con α = 0.02 y (n – 2) gl  (8 – 2) = 6 g.l.
t en tabla  t = 3.143 para dos colas
Ho se rechaza si t > 3.143 o si t < -3.143,
Calcular es estadístico de prueba con:
𝑟√𝑛 − 2
𝑡=
√1 − 𝑟 2
0.614√8 − 2
𝑡= = 1.9055
√1 − 0.6142
El estadístico de prueba es t = 1.9055,
Paso 4:
Ho no se rechaza.

ANEXOS
DISTRIBUCIÓN DE FRECUENCIAS ACUMULATIVA NORMAL
(Área bajo la curva normal estándar de 0 a Z)
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0,1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0723
0,2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0,3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0,4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0,5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2090 0.2224
0,6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0,7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2813 0.2852
0,8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0,9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1,0 0.3416 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1,1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1,2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1,3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1,4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1,5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1,6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1,7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1,8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1,9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2,0 0.4773 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2,1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2,2 0.4861 0.4865 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2,3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2,4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2,5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2,6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2,7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2,8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4980 0.4980 0.4981
2,9 0.4981 0.4982 0.4983 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000

TABLAS DE DISTRIBUCIÓN “t”

Tablas de distribución t de student, los grados de libertad se encuentran en la primera
fila, los valores de alfa es para un tratamiento de dos colas.
gl -->
  1 2 3 4 5 6 7 8 9 10
10 0.1 6.3137 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125
20 0.05 12.7062 4.3027 3.1824 2.7765 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281
40 0.025 25.4519 6.2054 4.1765 3.4954 3.1634 2.9687 2.8412 2.7515 2.6850 2.6338
50 0.02 31.8210 6.9645 4.5407 3.7469 3.3649 3.1427 2.9979 2.8965 2.8214 2.7638
100 0.01 63.6559 9.9250 5.8408 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693
200 0.005 127.3211 14.0892 7.4532 5.5975 4.7733 4.3168 4.0294 3.8325 3.6896 3.5814
1000 0.001 636.5776 31.5998 12.9244 8.6101 6.8685 5.9587 5.4081 5.0414 4.7809 4.5868
2000 0.0005 1273.1552 44.7035 16.3261 10.3051 7.9756 6.7882 6.0815 5.6170 5.2911 5.0489
10000 0.0001 6370.5444 100.1358 28.0142 15.5345 11.1759 9.0804 7.8883 7.1200 6.5938 6.2119
20000 0.00005 12664.7949 141.2630 35.3158 18.5147 12.8895 10.2632 8.7824 7.8510 7.2177 6.7614
100000 0.00001 63476.5625 314.7125 60.7967 27.7162 17.8814 13.5601 11.1759 9.7603 8.8289 8.1584
200000 0.000005 126953.125 457.7637 76.2939 33.3786 20.5636 15.1992 12.5170 10.7288 9.6112 8.7917
1000000 0.000001 625000.0 915.5273 133.514 47.6837 28.6102 20.2656 15.4972 13.1130 11.9209 10.7288
2000000 0.0000005 2500000.0 1220.7031 152.588 57.2205 38.1470 23.8419 19.0735 14.3051 13.1130 11.9209
gl -->
  11 12 13 14 15 16 17 18 19 20
10 0.1 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247
20 0.05 2.2010 2.1788 2.1604 2.1448 2.1315 2.1199 2.1098 2.1009 2.0930 2.0860
40 0.025 2.5931 2.5600 2.5326 2.5096 2.4899 2.4729 2.4581 2.4450 2.4334 2.4231
50 0.02 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280
100 0.01 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453
200 0.005 3.4966 3.4284 3.3725 3.3257 3.2860 3.2520 3.2224 3.1966 3.1737 3.1534
1000 0.001 4.4369 4.3178 4.2209 4.1403 4.0728 4.0149 3.9651 3.9217 3.8833 3.8496
2000 0.0005 4.8633 4.7166 4.5972 4.4995 4.4168 4.3464 4.2858 4.2332 4.1869 4.1461
10000 0.0001 5.9232 5.6950 5.5134 5.3644 5.2387 5.1339 5.0431 4.9663 4.8988 4.8382
20000 0.00005 6.4075 6.1467 5.9279 5.7556 5.6066 5.4855 5.3784 5.2899 5.2061 5.1409
100000 0.00001 7.6368 7.2643 6.9663 6.7055 6.5193 6.3330 6.1840 6.0722 5.9605 5.8487
200000 0.000005 8.1956 7.7486 7.4506 7.1526 6.9290 6.7055 6.5565 6.4075 6.2585 6.1840
1000000 0.000001 9.5367 8.9407 8.6427 8.3447 7.7486 7.7486 7.4506 7.1526 7.1526 6.8545
2000000 0.0000005 10.7288 9.5367 9.5367 8.9407 8.3447 8.3447 8.3447 7.7486 7.7486 7.1526
gl -->
  21 22 23 24 25 26 27 28 29 30
10 0.1 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973
20 0.05 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423
40 0.025 2.4138 2.4055 2.3979 2.3910 2.3846 2.3788 2.3734 2.3685 2.3638 2.3596
50 0.02 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573
100 0.01 2.8314 2.8188 2.8073 2.7970 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500
200 0.005 3.1352 3.1188 3.1040 3.0905 3.0782 3.0669 3.0565 3.0470 3.0380 3.0298
1000 0.001 3.8193 3.7922 3.7676 3.7454 3.7251 3.7067 3.6895 3.6739 3.6595 3.6460
2000 0.0005 4.1095 4.0769 4.0475 4.0207 3.9965 3.9744 3.9540 3.9348 3.9177 3.9017
10000 0.0001 4.7847 4.7358 4.6939 4.6543 4.6194 4.5868 4.5565 4.5309 4.5053 4.4820
20000 0.00005 5.0757 5.0198 4.9733 4.9267 4.8848 4.8475 4.8149 4.7823 4.7544 4.7311
100000 0.00001 5.7742 5.6997 5.6252 5.5693 5.5134 5.4576 5.4203 5.3644 5.3272 5.2899
200000 0.000005 6.0722 5.9977 5.9232 5.8487 5.7742 5.7369 5.6624 5.6252 5.5879 5.5507
1000000 0.000001 6.8545 6.7055 6.5565 6.5565 6.5565 6.2585 6.2585 6.2585 6.2585 6.1095

2000000 0.0000005 7.1526 7.1526 7.1526 7.1526 6.5565 6.5565 6.5565 6.5565 6.5565 6.5565
gl -->
  40 50 60 70 80 90 100 125 150 175
10 0.1 1.6839 1.6759 1.6706 1.6669 1.6641 1.6620 1.6602 1.6571 1.6551 1.6536
20 0.05 2.0211 2.0086 2.0003 1.9944 1.9901 1.9867 1.9840 1.9791 1.9759 1.9736
40 0.025 2.3289 2.3109 2.2990 2.2906 2.2844 2.2795 2.2757 2.2687 2.2641 2.2608
50 0.02 2.4233 2.4033 2.3901 2.3808 2.3739 2.3685 2.3642 2.3566 2.3515 2.3478
100 0.01 2.7045 2.6778 2.6603 2.6479 2.6387 2.6316 2.6259 2.6157 2.6090 2.6042
200 0.005 2.9712 2.9370 2.9146 2.8987 2.8870 2.8779 2.8707 2.8577 2.8492 2.8431
1000 0.001 3.5510 3.4960 3.4602 3.4350 3.4164 3.4019 3.3905 3.3701 3.3565 3.3469
2000 0.0005 3.7884 3.7230 3.6808 3.6508 3.6287 3.6118 3.5984 3.5742 3.5582 3.5472
10000 0.0001 4.3213 4.2282 4.1688 4.1269 4.0955 4.0722 4.0536 4.0198 3.9977 3.9814
20000 0.00005 4.5449 4.4378 4.3702 4.3213 4.2887 4.2608 4.2398 4.2003 4.1770 4.1584
100000 0.00001 5.0478 4.9174 4.8243 4.7684 4.7125 4.6752 4.6566 4.6007 4.5728 4.5449
200000 0.000005 5.2527 5.1036 5.0291 4.9546 4.8988 4.8429 4.8243 4.7684 4.7311 4.7125
1000000 0.000001 5.8115 5.6624 5.5134 5.3644 5.3644 5.2154 5.2154 5.2154 5.0664 5.0664
2000000 0.0000005 5.9605 5.9605 5.6624 5.6624 5.3644 5.3644 5.3644 5.3644 5.3644 5.3644
gl -->
  200 225 250 275 300 325 350 375 400 450
10 0.1 1.6525 1.6517 1.6510 1.6504 1.6499 1.6496 1.6492 1.6489 1.6487 1.6482
20 0.05 1.9719 1.9706 1.9695 1.9686 1.9679 1.9673 1.9668 1.9663 1.9659 1.9652
40 0.025 2.2584 2.2565 2.2550 2.2537 2.2527 2.2518 2.2511 2.2504 2.2499 2.2489
50 0.02 2.3451 2.3430 2.3414 2.3400 2.3388 2.3379 2.3370 2.3363 2.3357 2.3347
100 0.01 2.6006 2.5979 2.5956 2.5938 2.5923 2.5910 2.5899 2.5890 2.5882 2.5868
200 0.005 2.8385 2.8350 2.8322 2.8299 2.8279 2.8263 2.8249 2.8237 2.8227 2.8210
1000 0.001 3.3398 3.3343 3.3299 3.3263 3.3232 3.3207 3.3186 3.3167 3.3151 3.3123
2000 0.0005 3.5387 3.5320 3.5268 3.5227 3.5192 3.5163 3.5137 3.5114 3.5093 3.5064
10000 0.0001 3.9698 3.9616 3.9546 3.9488 3.9442 3.9395 3.9360 3.9325 3.9302 3.9255
20000 0.00005 4.1444 4.1351 4.1281 4.1211 4.1164 4.1118 4.1071 4.1025 4.1001 4.0955
100000 0.00001 4.5262 4.5262 4.5076 4.5076 4.4890 4.4890 4.4890 4.4797 4.4703 4.4703
200000 0.000005 4.6939 4.6752 4.6566 4.6566 4.6566 4.6380 4.6380 4.6194 4.6194 4.6194
1000000 0.000001 5.0664 5.0664 5.0664 5.0664 5.0664 4.9919 4.9919 4.9919 4.9174 4.9174
2000000 0.0000005 5.3644 5.3644 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664
gl -->
  500 550 600 650 700 750 800 1000 2000 3000
10 0.1 1.6479 1.6476 1.6474 1.6472 1.6470 1.6469 1.6468 1.6464 1.6456 1.6454
20 0.05 1.9647 1.9643 1.9639 1.9636 1.9634 1.9631 1.9629 1.9623 1.9612 1.9608
40 0.025 2.2482 2.2476 2.2470 2.2466 2.2462 2.2459 2.2456 2.2448 2.2431 2.2425
50 0.02 2.3338 2.3331 2.3326 2.3321 2.3317 2.3313 2.3310 2.3301 2.3282 2.3276
100 0.01 2.5857 2.5848 2.5841 2.5834 2.5829 2.5824 2.5820 2.5807 2.5783 2.5775
200 0.005 2.8195 2.8184 2.8175 2.8167 2.8160 2.8154 2.8148 2.8133 2.8102 2.8091
1000 0.001 3.3101 3.3082 3.3068 3.3056 3.3044 3.3036 3.3027 3.3002 3.2954 3.2938
2000 0.0005 3.5038 3.5018 3.5000 3.4983 3.4971 3.4960 3.4951 3.4922 3.4863 3.4846
10000 0.0001 3.9220 3.9197 3.9162 3.9150 3.9127 3.9116 3.9104 3.9069 3.8987 3.8953
20000 0.00005 4.0908 4.0885 4.0862 4.0838 4.0815 4.0792 4.0792 4.0745 4.0652 4.0606
100000 0.00001 4.4610 4.4610 4.4517 4.4517 4.4517 4.4517 4.4517 4.4424 4.4331 4.4238
200000 0.000005 4.6194 4.6194 4.6194 4.6007 4.6007 4.6007 4.6007 4.5821 4.5821 4.5821
1000000 0.000001 4.9174 4.9174 4.9174 4.9174 4.9174 4.9174 4.9174 4.9174 4.9174 4.9174
2000000 0.0000005 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664 5.0664

TABLAS DE DISTRIBUCIÓN JI CUADRADA

Tablas de distribución "Ji Cuadrada" o X2, los grados de libertad se encuentran en la primera fila.
g.l. NIVEL DE SIGNIFICANCIA

0.1/0.90 0.05/0.95 0.025/0.975 0.01/0.99 0.005/0.995
1 2.7055 3.8415 5.0239 6.6349 7.8794
2 4.6052 5.9915 7.3778 9.2104 10.5965
3 6.2514 7.8147 9.3484 11.3449 12.8381
4 7.7794 9.4877 11.1433 13.2767 14.8602
5 9.2363 11.0705 12.8325 15.0863 16.7496
6 10.6446 12.5916 14.4494 16.8119 18.5475
7 12.017 14.0671 16.0128 18.4753 20.2777
8 13.3616 15.5073 17.5345 20.0902 21.9549
9 14.6837 16.919 19.0228 21.666 23.5893
10 15.9872 18.307 20.4832 23.2093 25.1881
11 17.275 19.6752 21.92 24.725 26.7569
12 18.5493 21.0261 23.3367 26.217 28.2997
13 19.8119 22.362 24.7356 27.6882 29.8193
14 21.0641 23.6848 26.1189 29.1412 31.3194
15 22.3071 24.9958 27.4884 30.578 32.8015
16 23.5418 26.2962 28.8453 31.9999 34.2671
17 24.769 27.5871 30.191 33.4087 35.7184
18 25.9894 28.8693 31.5264 34.8052 37.1564
19 27.2036 30.1435 32.8523 36.1908 38.5821
20 28.412 31.4104 34.1696 37.5663 39.9969
21 29.6151 32.6706 35.4789 38.9322 41.4009
22 30.8133 33.9245 36.7807 40.2894 42.7957
23 32.0069 35.1725 38.0756 41.6383 44.1814
24 33.1962 36.415 39.3641 42.9798 45.5584
25 34.3816 37.6525 40.6465 44.314 46.928
26 35.5632 38.8851 41.9231 45.6416 48.2898
27 36.7412 40.1133 43.1945 46.9628 49.645
28 37.9159 41.3372 44.4608 48.2782 50.9936
29 39.0875 42.5569 45.7223 49.5878 52.3355
30 40.256 43.773 46.9792 50.8922 53.6719
31 41.4217 44.9853 48.2319 52.1914 55.0025
32 42.5847 46.1942 49.4804 53.4857 56.328
33 43.7452 47.3999 50.7251 54.7754 57.6483
34 44.9032 48.6024 51.966 56.0609 58.9637
35 46.0588 49.8018 53.2033 57.342 60.2746
36 47.2122 50.9985 54.4373 58.6192 61.5811
37 48.3634 52.1923 55.668 59.8926 62.8832
38 49.5126 53.3835 56.8955 61.162 64.1812
39 50.6598 54.5722 58.1201 62.4281 65.4753
40 51.805 55.7585 59.3417 63.6908 66.766

41 52.9485 56.9424 60.5606 64.95 68.0526

42 54.0902 58.124 61.7767 66.2063 69.336
43 55.2302 59.3035 62.9903 67.4593 70.6157
44 56.3685 60.4809 64.2014 68.7096 71.8923
45 57.5053 61.6562 65.4101 69.9569 73.166
46 58.6405 62.8296 66.6165 71.2015 74.4367
47 59.7743 64.0011 67.8206 72.4432 75.7039
48 60.9066 65.1708 69.0226 73.6826 76.9689
49 62.0375 66.3387 70.2224 74.9194 78.2306
50 63.1671 67.5048 71.4202 76.1538 79.4898
51 64.2954 68.6693 72.616 77.386 80.7465
52 65.4224 69.8322 73.8099 78.6156 82.0006
53 66.5482 70.9934 75.0019 79.8434 83.2525
54 67.6728 72.1532 76.1921 81.0688 84.5018
55 68.7962 73.3115 77.3804 82.292 85.7491
56 69.9185 74.4683 78.5671 83.5136 86.994
57 71.0397 75.6237 79.7522 84.7327 88.2366
58 72.1598 76.7778 80.9356 85.9501 89.477
59 73.2789 77.9305 82.1174 87.1658 90.7153
60 74.397 79.082 83.2977 88.3794 91.9518
61 75.5141 80.2321 84.4764 89.5912 93.1862
62 76.6302 81.381 85.6537 90.8015 94.4185
63 77.7454 82.5287 86.8296 92.0099 95.6492
64 78.8597 83.6752 88.004 93.2167 96.8779
65 79.973 84.8206 89.1772 94.422 98.1049
66 81.0855 85.9649 90.3488 95.6256 99.3303
67 82.1971 87.108 91.5193 96.8277 100.5538
68 83.3079 88.2502 92.6885 98.0283 101.7757
69 84.4179 89.3912 93.8565 99.2274 102.9961
70 85.527 90.5313 95.0231 100.4251 104.2148
71 86.6354 91.6703 96.1887 101.6214 105.4323
72 87.7431 92.8083 97.353 102.8163 106.6473
73 88.8499 93.9453 98.5162 104.0098 107.8619
74 89.9561 95.0815 99.6784 105.2019 109.0742
75 91.0615 96.2167 100.8393 106.3929 110.2854
76 92.1662 97.351 101.9992 107.5824 111.4954
77 93.2702 98.4844 103.1581 108.7709 112.7037
78 94.3735 99.617 104.3159 109.9582 113.9107
79 95.4762 100.7486 105.4727 111.144 115.1163
80 96.5782 101.8795 106.6285 112.3288 116.3209
81 97.6796 103.0095 107.7834 113.5123 117.524
82 98.7803 104.1387 108.9373 114.6948 118.7261
83 99.8805 105.2672 110.0902 115.8762 119.927
84 100.98 106.3949 111.2422 117.0566 121.1262

85 102.0789 107.5217 112.3933 118.2356 122.3244

86 103.1773 108.6479 113.5436 119.4137 123.5218
87 104.275 109.7733 114.6929 120.5909 124.7176
88 105.3723 110.898 115.8415 121.7672 125.9123
89 106.4689 112.022 116.989 122.9422 127.106
90 107.565 113.1452 118.1359 124.1162 128.2987
91 108.6606 114.2679 119.282 125.2893 129.4902
92 109.7556 115.3898 120.427 126.4616 130.6812
93 110.8501 116.511 121.5714 127.633 131.8705
94 111.9442 117.6317 122.7152 128.8032 133.0589
95 113.0377 118.7516 123.858 129.9725 134.2466
96 114.1307 119.8709 125.0001 131.1411 135.4327
97 115.2232 120.9897 126.1414 132.3089 136.6188
98 116.3153 122.1077 127.2821 133.4756 137.803
99 117.4069 123.2252 128.4219 134.6415 138.9869
100 118.498 124.3421 129.5613 135.8069 140.1697





Distribucion de Probabilidades

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Distribucion de Probabilidades

Hochgeladen von

Copyright:

Verfügbare Formate

Control de calidad Aplicado a la Ingeniería [ESTADISTICA INFERENCIAL]

MÓDULO 5: CONCEPTOS PROBABILÍSTICOS

ESPACIO MUESTRAL Y PROBABILIDAD.

< Ing. Edmundo Alarcón Cáceres > 1

S = : { a1, a2, a3, ..., an }

Ejemplo: A lo largo de su carrera, el profesor de física ha otorgado 186 calificaciones de A entre

< Ing. Edmundo Alarcón Cáceres > 2

Reglas de adición: Si dos eventos A y B son mutuamente excluyentes, la regla especial de

Regla general de adición

< Ing. Edmundo Alarcón Cáceres > 3

La regla general de multiplicación se utiliza para determina la probabilidad conjunta de que

< Ing. Edmundo Alarcón Cáceres > 5

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el día del accidente (probabilidad a

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

< Ing. Edmundo Alarcón Cáceres > 6

La probabilidad de que hubiera niebla es del 7,1%

El resultado “una cara” ocurrió tres veces.

Donde μ representa la media y P(x) es la probabilidad de los diferentes resultados X.

σ2 = 0.4225 + 0.0270 + 0.1715 + 0.2890

NOTA: éstos también son ejemplos de distribuciones probabilísticas acumulativas:

La varianza está dada por:

Del ejemplo anterior, recuerde que = 0.2 y n = 14

Donde N es el tamaño de la población, S es el número de éxitos en la población, x es el número

< Ing. Edmundo Alarcón Cáceres > 10

MÓDULO 7: DISTRIBUCIÓN PROBABILÍSTICA NORMAL

Distribución normal estándar

< Ing. Edmundo Alarcón Cáceres > 11

< Ing. Edmundo Alarcón Cáceres > 12

c). ¿Qué porcentaje de la población utiliza entre 18 y 26 galones?

Curva típica de la evolución de la tasa de fallos “Curva de la bañera”

< Ing. Edmundo Alarcón Cáceres > 14

Variable independiente: el tiempo

Donde  - media de los logaritmos de x

< Ing. Edmundo Alarcón Cáceres > 15

Variable independiente: la tasa de fallos

con λ > 0; σ > 0; - α < m* < α

Siendo N el número total de valores de la tasa de fallos de un componente.

< Ing. Edmundo Alarcón Cáceres > 16

La ecuación de la distribución exponencial es: Distribución acumulada:

Figura: Función de densidad, f, de una Exp (λ).

< Ing. Edmundo Alarcón Cáceres > 17

Para calcular el valor esperado y la varianza de la distribución exponencial, obtenemos en primer

MÓDULO 8: EL TEOREMA DEL LÍMITE CENTRAL

< Ing. Edmundo Alarcón Cáceres > 18

= 0.5 – 0.15542 = 0.3446

Donde  es la desviación estándar de la población de donde se toman las muestras, n es el

Este factor se denomina factor de corrección para una población finita.

< Ing. Edmundo Alarcón Cáceres > 19

(-Z) ó (-t) (Z) ó (t)

Intervalos de Confianza para la media (µ) conocida la deviación típica de la población.

< Ing. Edmundo Alarcón Cáceres > 20

Intervalos de Confianza para la media (µ) desconocida la deviación típica de la población.

L.C.S. = 9,8525 + 0,045 = 9.807

< Ing. Edmundo Alarcón Cáceres > 21

Donde es el error estándar de la proporción:

< Ing. Edmundo Alarcón Cáceres > 22

Por tanto, los límites de control serán:

Cuando N > 100,000 Cuando N ≤ 1,500 Cuando N > 1,500

Tamaño de la muestra para proporciones.

Cuando N > 100,000 Cuando N ≤ 1,500 Cuando N > 1,500

Donde p es la proporción estimada, basada en la experiencia o en un estudio piloto; Z es el valor

MÓDULO 9: PRUEBAS DE HIPÓTESIS