Beruflich Dokumente
Kultur Dokumente
Grupo: 211622_12
LORENA ZULUAGA AGUILAR
CRISTIAN CAMILO LPEZ VLEZ
YEISON HERNANDO GUZMAN
EVELIO CARDONA
Docente
HECTOR ABELARDO CHAPARRO
Curso
ESTADISTICA Y PROBABILIDAD
Grupo: 211622_12
LORENA ZULUAGA AGUILAR
Cdigo: 43.222.539, Correo: lorenazuluagaag@hotmail.com, CEAD: Medelln
CRISTIAN CAMILO LPEZ VLEZ
Cdigo: 1.113.036.529, Correo: crilin36@hotmail.com, CEAD: Palmira.
YEISON HERNANDO GUZMAN
Cdigo: 1.118.285.072, Correo: yeison.guzman@sodexo.com, CEAD: Palmira
EVELIO CARDONA
Cdigo: 1114878928, Correo: Evcardo1988@gmail.com, CEAD: Palmira
Docente
HECTOR ABELARDO CHAPARRO
Curso
ESTADISTICA Y PROBABILIDAD
El presente se aplicaran todos los conocimiento adquiridos en el curso de estadstica y probabilidad, tambin
analizaremos la problemtica propuesta en la etapa 1, donde seleccionado la propuesta del compaero Yeison Guzmn
con una muestra de 51 variables para ser desarrolladas en este trabajo.
A continuacin, llegaremos a diferentes conclusiones respecto a cada una de las variables, de la muestra, con el fin de
llegar a una conclusin final respecto al anlisis de la muestra total realizada. Esperamos que los resultados de nuestra
investigacin sirvan como referencia para posteriores investigaciones y contribuir con la mejora para beneficio del bien
comn.
OBJETIVOS
Realizar con las variables asignadas al ejercicio un anlisis descriptivo usando tablas de frecuencia, grficos,
medidas de tendencia central, de posicin y de dispersin.
Encontrar en las variables presentadas cul de ellas tiene mejor tendencia lineal con respecto a la variable
respuesta.
Identificar cul(es) de las variables tiende a un tipo de distribucin de probabilidad especfica: binomial, normal.
Plantear dos pruebas de hiptesis y demostrar o concluir una relacin entre al menos dos variables y la variable
respuesta.
PRUEBA NACIONAL
ESTADSTICA Y PROBABILIDAD
1. Realizar con las variables tanto cualitativas como cuantitativas un anlisis descriptivo. Se recomienda usar tablas de
frecuencia, grficos, medidas de tendencia central, de posicin y de dispersin. Realizar anlisis en mnimo dos
prrafo.
2. Encontrar en las variables presentadas cul de ellas tiene mejor tendencia lineal con respecto a la variable respuesta
(justificar y graficar), realizar una regresin lineal entre ellas (hacer el diagrama de dispersin junto con su recta de
regresin). Interpretar los estadsticos obtenidos, esto es: La pendiente, el intercepto y Correlacin de Pearson y de
determinacin.
X Y
No de rdenes (X1-
de trabajo X1- Y1- PROMEDIO)
Edad (X)(Y) X^2 Y^2
realizadas al PROMEDIO PROMEDIO (Y1-
mes PROMEDIO)
20 52 1040 400 2704 -10 -14 141,2568243
20 51 1020 400 2601 -46 51 -2351
39 83 3237 1521 6889 39 83 3237
19 73 1387 361 5329 19 73 1387
37 78 2886 1369 6084 37 78 2886
29 76 2204 841 5776 29 76 2204
27 85 2295 729 7225 27 85 2295
39 63 2457 1521 3969 39 63 2457
36 49 1764 1296 2401 36 49 1764
38 65 2470 1444 4225 38 65 2470
29 83 2407 841 6889 29 83 2407
19 48 912 361 2304 19 48 912
20 75 1500 400 5625 20 75 1500
39 52 2028 1521 2704 39 52 2028
35 66 2310 1225 4356 35 66 2310
20 51 1020 400 2601 20 51 1020
20 79 1580 400 6241 20 79 1580
26 60 1560 676 3600 26 60 1560
21 71 1491 441 5041 21 71 1491
22 52 1144 484 2704 22 52 1144
24 65 1560 576 4225 24 65 1560
39 84 3276 1521 7056 39 84 3276
35 77 2695 1225 5929 35 77 2695
27 72 1944 729 5184 27 72 1944
39 53 2067 1521 2809 39 53 2067
33 77 2541 1089 5929 33 77 2541
24 66 1584 576 4356 24 66 1584
24 78 1872 576 6084 24 78 1872
37 50 1850 1369 2500 37 50 1850
35 49 1715 1225 2401 35 49 1715
28 66 1848 784 4356 28 66 1848
32 65 2080 1024 4225 32 65 2080
40 54 2160 1600 2916 40 54 2160
32 72 2304 1024 5184 32 72 2304
29 71 2059 841 5041 29 71 2059
24 72 1728 576 5184 24 72 1728
22 49 1078 484 2401 22 49 1078
50 65 3250 2500 4225 50 65 3250
24 83 1992 576 6889 24 83 1992
39 48 1872 1521 2304 39 48 1872
27 52 1404 729 2704 27 52 1404
39 66 2574 1521 4356 39 66 2574
33 51 1683 1089 2601 33 51 1683
24 79 1896 576 6241 24 79 1896
36 60 2160 1296 3600 36 60 2160
38 71 2698 1444 5041 38 71 2698
29 52 1508 841 2704 29 52 1508
19 73 1387 361 5329 19 73 1387
20 78 1560 400 6084 20 78 1560
39 76 2964 1521 5776 39 76 2964
35 85 2975 1225 7225 35 85 2975
23012 1434,88235 3304,90196
1.531 3.371
100996 48971 7 3 1 96726,25682
Potencia 2
(X1-
PROMEDI
Coeficiente de Correlacin y 9355968759
O)(Y1-
Determinacin edad contra n de
Promedio SumaX2- PROMEDI
rdenes de trabajo realizadas
X 30 PromX
Correlacin48.941 O)
-0,042649607
Promedi SumaY2-
Determinacin 0,830946915
oY Porcentaje230061
66,09803922 PromY 83,09469152
porcentaje1,1E+1 16,90530848
Producto 0
CONCLUSION: La grfica nos indica que la edad no tiene que ver con la cantidad de rdenes realizadas. No hay
correlacin de la edad con las rdenes realizadas al mes, solo el 16,90 % por ciento de las rdenes realizadas, pueden
ser explicados por la edad. El 83.09 % de las ordenes realizadas al mes, no pueden ser explicadas por la edad.
3. Identificar cul(es) de las variables tiende a un tipo de distribucin de probabilidad especfica: binomial, normal. Con la
distribucin que tienda a una binomial calcular la proporcin de xito y la de fracaso. Plantear almenos un clculo de
probabilidad con dicha variable. Con la distribucin que tienda a la normal calcular la media y su desviacin estndar.
Plantear almenos un clculo de probabilidad con dicha variable y sus estadsticos, se deben realizar clculos con la
tabla de distribucin de probabilidad normal.
VARIABLE BINOMIAL
PUEDE SER
CONTRATADO
DIRECTAMENTE POR LA
EMPRESA
Variable Binominal
Edad
Con la distribucin que tienda a una binomial calcular la proporcin de xito y la de fracaso. Plantear almenos un clculo de
probabilidad con dicha variable.
Variable Binomial
La probabilidad de que la edad sea 63 aos. Si consideramos un grupo de 51 datos, calcula la probabilidad de que la edad al menos 3
veces
n k (nk )
p( X k ) . p .q
k
La probabilidad de obtener k xito viene dada por
N 51
K 3
P 63
Q 62
51 ( 513)
p ( X 3) 3
.(63) .(62)
3
n n!
k k!(n k )!
51 51! 51 61 62 63
x x 32147
3 3!(51 3)! 3 2 1 63
51x63 3.21
Desviacin tpica
n. p.q
51x63x62 446.32
Variable Normal
Estatura
Nmero de hijos
Estatura(cm)
Columna
Columna1 2
173,33333
Media 33
1,2951392
Error tpico 28
Mediana 175
Moda 182
Desviacin 9,2491441
estndar 05
Varianza de la 85,546666
muestra 67
-
0,9153369
Curtosis 1
-
Coeficiente de 0,4330471
asimetra 13
Rango 31
Mnimo 157
Mximo 188
Suma 8.840
Cuenta 51
Promedio: 173,3333333
Qu porcentaje de los trabajadores de la empresa tengan estatura entre 173 cm y 180 cm de estatura?
Formula
173c 180c
X
Z = S
180173,3333333
Z = 9,249144105
6.6666667
Z = 9,249144105
Z = 0,720787418 = 0,7642 = 76,42 % de los trabajadores de la empresa tiene entre 173cm a 180cm de estatura.
Nmero de hijos: Variable Normal
Columna1 Columna2
1,4901960
Media 78
0,1665628
Error tpico 28
Mediana 1
Moda 1
1,1894965
Desviacin estndar 16
Varianza de la 1,4149019
muestra 61
-
0,1448329
Curtosis 54
Coeficiente de 0,6549799
asimetra 25
Rango 4
Mnimo 0
Mximo 4
Suma 76
Cuenta 51
Promedio: 1,490196078
X 1 hijo 2
Z = S
21,490196078
Z = 1,189496516
0,509803922
Z = 1,189496516
n = muestra
X = Promedio
S = Desviacin Estndar
1 - = 0,95 = 1,96
ZS
= X
n
Variable de Edad
n = 50
X = 30,24
Z = 1 - = 0,95 = 1,96
S = 7,676
ZS
= X
n
1,967,676
=30,24
50
=30,24 2,128
32,368 28,112
Despus de realizar este anlisis podemos decir que estamos 95% seguros que el promedio de los datos de Edad es de
28.112 a 32.368.
Variable de Estatura
n = 50
X = 173,50
Z = 1 - = 0,95 = 1,96
S = 9,265
ZS
= X
n
1,969,265
=173,5
50
=173,5 2,568
176,068 170,932
Despus de realizar este anlisis podemos decir que estamos 95% seguros que el promedio de los datos de Estatura es
de 170.93 a 176.07.
5. Plantear dos pruebas de hiptesis, que me permitan demostrar o concluir una relacin entre almenos dos variables y
la variable respuesta, se debe mostrar el procedimiento.
A. Se hace un estudio del nmero de ordenes realizadas en el mes de los trabajadores hombres y mujeres, donde se
toma una muestra de 27 hombres con un promedio de rdenes de 68 con desviacin tpica de 11,05716372, en
las mujeres con un promedio de rdenes de 64,40740741 y una desviacin tpica de 12,91170983 cree que el
promedio de ordenes es mas a diferencia del de los hombres? Use un alfa del 5%
N de N de
ordenes ordenes
hombres mujeres
52 83
51 73
76 78
85 63
49 65
75 83
52 48
66 51
60 79
65 71
84 52
72 77
53 77
66 66
78 65
50 71
49 72
54 65
72 83
49 48
52 66
51 71
79 52
60 73
78
76
85
Paso 1 planteamiento
Hiptesis nula
Ho = 1 = 2
Ho = el sueldo de las mujeres es igual que el sueldo de los hombres.
Hiptesis alternativa
Ha = 1 = 2
Ha = el sueldo de las mujeres es mayor que el de los hombres.
N1=27 N2=24
Media1= 68 Media2= 64,407400741
S1= 11,05716372 S2= 12,91170983
166,7122507 122,2608696
2 2
Zo = S1 S2 Zo = 166,7122507 122,2608696 166,7122507 122,2608696
S X 1 X 2 + + +
N1 N2 27 24 24 27
694968,375620060,3704 X 1 X 2
2
60542468004 3524122958 S2
+ Zo= 1,177457621 S 12 +
24 27 N2
N1
rea de
rea de
rechazo
no
rechazo
Z0.05=1,645
1,177457
621
rea de no Rechazo Ho Si Zo Z0, 05 = 1,645
N de hijos N de hijos
hombres mujeres
0 1
0 1
2 2
1 1
4 1
0 1
2 0
3 2
0 1
1 1
1 1
2 2
0 1
2 2
3 4
2 0
4 0
1 2
0 1
2 1
4 1
1 2
0 3
0 2
2
4
2
Paso 1 planteamiento
Hiptesis nula
Ho = 1 = 2
Ho = el promedio de hijos de las mujeres es igual al de los hombres.
Hiptesis alternativa
Ha = 1 = 2
Ha = El promedio de los hijos es mayor en los hombres a diferencia de las mujeres
Datos
N1=27 N2=24
Media1=
Media2= 1,375
1,592592593
S1= 1,393922503 S2= 0,923721208
=1,943019943 =0,85326087
Paso 4 calculamos Zo con varianza diferentes
X 1 X 2 1,5925925931,375 6864,407400741
X 1 X 2
2 2
Zo = S1 S2 Zo = 1,943019943 0.85326087 166,7122507 122,2608696
S X 1 X 2 + + +
N1 N2 27 24 24 27
694968,375620060,3704 X 1 X 2
60542468004 3524122958
24
+
27
Zo= 0,663601074
S 12 S 22
+
N1 N2
X 1 X 2
X 1 X 2
S X 1 X 2
S 12 S 22
+
N1 N2
Z0.05=1,645
0,663601
074
rea de no Rechazo Ho Si Zo Z0, 05 = 1,645
El trabajo de investigacin que se desarroll, tuvo como meta resolver los 5 planteamientos que se generaron a partir de
la problemtica escogida en la etapa 1.
Finalmente podemos llegar a una conclusin de los procesos que se efectan en la empresa, con la solucin de cada uno
de los problemas se puede llegar a una familiarizacin con cada uno de ellos y se ve un panorama ms claro de los
mismos, en el trascurso de la solucin pudimos analizar cada una de estas variables y gracias a este proceso se hicieron
comparaciones con cada uno de los intervalos de confianza al 95%, como se puede ver en la solucin de los problemas
hay claridad en los tiempos promedios de cada uno de los procesos y variables.
REFERENCIAS BIBLIOGRAFICAS
Martn, J. y Ruiz, L. (2006). Fundamentos de probabilidad. 2nd ed. Madrid: Paraninfo. V-VI. Disponible en biblioteca
virtual de la unad: base de datos Gale Gale Virtual Reference Library (Biblioteca Unad).
Martn, J. y Ruiz, L. (2004). Estadstica I: Probabilidad. 2nd ed. Madrid: Paraninfo. vii-viii. Disponible en biblioteca
virtual de la unad: base de datos Gale Virtual Reference Library (Biblioteca Unad.
Martn, J. (2005). Fundamentos de inferencia estadstica. 3rd ed. Madrid: Paraninfo. v-vi. Gale Virtual Reference
Library (Biblioteca UNAD).
Martinez, C. (2011). Estadstica Bsica aplicada. Ecoe Editores. Disponible en biblioteca virtual de la unad: base de
datos Gale. Recuperado de http://bibliotecavirtual.unad.edu.co:2068/lib/unadsp/reader.action?
docID=10624529&ppg=227
Moreno, Y. (2015). Estadstica y probabilidad [Blog]. Recuperado de:
https://sites.google.com/site/matematicasyeimymoreno/estadistica-y-probabilidad Paraninfo, (2006). Estadstica II:
Inferencia. 2nd ed. Madrid:. vii-viii. Gale Virtual Reference Library (Biblioteca UNAD).