Sie sind auf Seite 1von 38

Desarrollo del paso 2.

Construcción de distribucio

xi (variable) ni hi

Futbolista 3 12%

Ingenieria 3 12%

Medicina 5 20%

chef 1 4%

Tenis 2 8%

Periodismo 4 16%

Veterinaria 2 8%

Arquitectura 2 8%
Profesor 1 4%
Piloto 2 8%
25 100%

30

25

20

15

14

12
10 11

5 6
5
4
3 3 3
12
10 11

5 6
5
4
3 3 3
2
0 1
24% 20% 44% 48% 56% 16%
12% 12% 12% 4%chef 8%
Futbolista Ingenieria Medicina Tenis Perio

Column B Column C Column D


o 2. Construcción de distribuciones de frecuencia.

Ni Hi

3 12%

6 24%

11 44%

12 48%

14 56%

18 72%

20 80%

22 88%
23 92%
25 100%

25

23
22

20

18

14

4
4

2 2 2 2
72% 80% 88% 1 92% 100%
8% 56% 16%
8% 8% 8% 4% 8%
Tenis Periodismo Veterinaria Arquitectura Profesor Piloto

Column B Column C Column D Column E


25

23
2
92% 100%
% 8%
ofesor Piloto
Xmax 821
Xmin 599
Rango =Xmax-Xmin 222
# intervalos =K(sturges 8.9132020286 9
Amplitud = C = R/K 24.6666666667 25
Nuevo Rango = R*=k*C 225
Diferencia de rango= 3
DR-1= 2
Nuevo X min 598 Nuevo Xmax=

Cost
LIMITE INFERIOR LIMITE SUPERIOR VARIABLE
o
697 Yi-1 Yi (Yi-1,Yi)
661 622.0 598 623 [598;623)
701 647.0 623 648 [623;648)
733 672.0 648 673 [648;673)
708 697.0 673 698 [673;698)
759 722.0 698 723 [698;723)
667 747.0 723 748 [723;748)
775 772.0 748 773 [748;773)
629 797.0 773 798 [773;798)
701 822.0 798 823 [798;823)
648
662
714
histograma
MARCA DE CLASE x FRECUENCIA ABSOLUTA f FRECUENCIA RELATIVA
FRECUENCIA ABS.ACUMULADA Fi FRECUENCIA REL ACUMULADA Fri

785.5
760.5
735.5
710.5

691
685.5
660.5
635.5
610.5

704
656

696
758
229
202
164
118
59

59

46

38
32
27

27
81%
47%

66%

92%
11%

13%
24%

24%

15%
18%

11%
22

16
2%
2%

9%

6%
5
5
229
202
164
674

118
599
712

59

59

46

38
32
27

27
81%
47%

66%

92%
11%

13%
24%

24%

15%
18%

11%
22

16
776

2%
2%

9%

6%
5
5
760 [598;623) [623;648) [648;673) [673;698) [698;723) [723;748) [748;773) [773;7
623 648 673 698 723 748 773 798
680 598 623 648 673 698 723 748 773
670
733
680

Encuentre las
la frecuencia mas
medidas de
repetido se encuentra
tendencia central:
en el rango [673;698)
Media aritmética,
con 59 datos, la
¿Qué conclusiones mediana y moda
menor frecuencia se
puede obtener? usando sus
da en el rango
fórmulas e
[798;823) con 4 datos
interprete los
equivalente al 2% de
parámetros
los datos
encontrados.
670

683

697
668
736
663
650
762
636
651
689
696
675
753
729
692
661
785
675
690
687
711
707
634
771
622
696
634
627
631
735
797
750
617
695
701
717
751
731
728
656
797
640
685
677
697
663
629
662
820
668
789
684
691
675
651
714
642
772
709
643
636
672
700
778
667
724
815
684
634
722
678
782
696
712
706
686
768
688
731
694
673
742
753
730
644
735
714
723
745
695
631
725
719
672
718
770
732
719
745
609
712
721
707
795
696
637
724
728
764
766
725
707
796
684
715
663
654
759
667
679
669
685
674
634
697
624
777
720
697
686
619
736
705
719
782
821
737
692
705
708
668
734
715
711
695
714
731
660
676
725
663
768
757
754
744
680
691
639
702
685
733
705
725
706
679
725
716
674
647
637
731
752
746
743
736
779
692
667
755
640
705
676
680
714
689
759
713
693
731
756
725
717
811
707
770
656
708
629
787
684
729
674
656
723
670
679
797
714
717
684
729
675
668
765
751
709
751
754
676
680
791
Desarrollo del paso 4. Análisis estadístico.

Recorrido: Xma-Xmin
Nuevo recorrido

822

MARCA DE CLASE FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA


x f fr
610.5 5 2%
635.5 22 9%
660.5 32 13%
685.5 59 24%
710.5 46 18%
735.5 38 15%
760.5 27 11%
785.5 16 6%
810.5 4 2%
249 100%

FRECUENCIA RELATIVA fr
Fri
810.5

poligono de frecuencia
785.5
760.5

FRECUENCIA ABSOLUTA f FRECUENCIA REL


FRECUENCIA ABS.ACUMULADA Fi FRECUENCIA REL
300

250

200

150
249
245
229

100
100%

50
27
81%

98%
92%
11%

16
6%

2%
4
200

150

249
245
229

100

100%
50
27

98%
81%

92%
11%

16
6%

2%
4
8) [748;773) [773;798) [798;823)
773 798 823 0
748 773 798 550 600 650 700 750

Moda: el valor con


mayor frecuencia en
esta distribución de
datos fue,
Mo=673,03.El
Encuentre e interprete el Q3=[723;748)=746,10
promedio de este
cuartil 3, el decil 4 y el D4=[673;698)=690,20
conjunto de valores
percentil 20. P20=[648;673)=665,81
es de = 705,18. El
número central de
este grupo de
números ordenados
es Me=701,53

Q3=(TotDat*3)/4
Q3=(249*3)/4 =182,25
Q3=723+25((182,25-164)/(202-182,25)

243
3
4
182.25
[698;723) 164
[723;748) 202
0.9240506329
25
723
Q3=[723;748) 746.1012658228
D4=(TotDat*4)/10 =99,6
99.6
[648;673) 59
[673;698) 118
17.2033898305
690.2033898305
D4=[673;698) 690.2
P20=TotDat*20/100=49,8 49.8
[623;648) 27
[648;673) 59
17.8125
665.8125
P20=[648;673) 665.81
222
224

FRECUENCIA ABS.ACUMULADA FRECUENCIA REL ACUMULADA


Fi Fri
5 2%
27 11%
59 24%
118 47%
164 66%
202 81%
229 92%
245 98%
249 100%

de frecuencia
FRECUENCIA RELATIVA fr
Fi FRECUENCIA REL ACUMULADA Fri
700 750 800 850

Encuentre el grado de dispersión:


Encuentre las medidas de varianza, desviación típica y
tendencia central: Media coeficiente de variación (usando
aritmética, mediana y moda las fórmulas). ¿La distribución
usando sus fórmulas e interprete es homogénea o heterogénea?
los parámetros encontrados. Interprete la asimetría y curtosis
de la distribución.

Moda: el valor con mayor frecuencia


Varianza² = 3388,08
en esta distribución de datos fue,
Desv.Est. = 58,21
Mo=673,03.El promedio de este
C.V. = 8,25%
conjunto de valores es de =
Datos Homogeneos
705,18. El número central de este
Cutosis=0,28
grupo de números ordenados es
Asimetria =0,72
Me=701,53
Apuntamiento de distribucion
mesocurtica
Asimetria positiva =0,72
MEDIDAS DE CENTRALIZACION
x*f MEDIANA MODA
3052.5
13981
21136
40444.5 Mo=673,03
32683 Me=701,53
27949
20533.5
12568
3242
175589.5

Moda
Mediana impar Total Mo =LimInf. [[fre.Abs
de datos+1/2 Me -Frec.Abs.Anterior)/
Media Aritmetica
= [ Limite inferior + (fre.Abs
 = ∑ Yi*f /Total de
[((Total datos/2)- Frec.Abs.Anterior)+
datos
FrecuenciaAComuladan (fre.Abs
terior)/ Frec.Abs]]*C Frec.Abs.posterior) ]
*C

Mediana impar :(Total


Media Aritmetica Moda:
de datos+1)/2=125
 = ∑ Yi*f /Total de Mo = 673+[[(59-32)/
Me = [698+[((249/2)-
datos (59-32)+(59-46)]*25]
118/ 46]]*25
705.1787148594 249 673
Media Aritmetica
=
175589,5/249=705,18 2 59
698 32
118 46
46 25
25 27
701.5326086957 13
Me=701,53 1000
673.027
Mo=673,03
MEDIDAS DE DISPERCION
(x-) (x-)² (x-)² *f
-94.6787148594 8964.0590474347 44820.2952371736
-69.6787148594 4855.1233044628 106812.712698182
-44.6787148594 1996.1875614909 63878.0019677101
-19.6787148594 387.2518185191 22847.8572926242
5.3212851406 28.3160755472 1302.5394751698
30.3212851406 919.3803325753 34936.4526378608
55.3212851406 3060.4445896034 82632.0039192917
80.3212851406 6451.5088466315 103224.141546104
105.3212851406 11092.5731036596 44370.2924146385
504824.297188755

Varianza²
= ∑(x- )² *f /Total de
datos

Varianza²
Desviacion Coeficiente de variacion
=
Estandar =
504824,30/149=3388,0
=
√varianza (Dev.Est0/Promedio)*100
8
504824.3 √varianza= √3388,08

149 58.21 0.0825464507


3388.0825503356 8.254645067
Varianza² =
Desv.Est. = 58,21 C.V. = 8,25%
3388,08
Datos Homogeneos
(x-) ((x-)^4)*f
-94.6787148594 80354354.6058961
-69.6787148594 23572222.301538
-44.6787148594 3984764.78065115
-19.6787148594 149963.970946315
5.3212851406 801.800134393
30.3212851406 845260.195926238
55.3212851406 9366321.08603271
80.3212851406 41621966.3981647
105.3212851406 123045178.060033
47.8915662651 282940833.199323

CURTOSIS = ASIMETRIA
1/n(∑(x- )² *f) / =( - Mo )/ {√ (∑(x- )² *f) /
[1/n(∑((x- )^4)*f ]² ∑f )}

1136308.56706555 2027.4068160191
2027.4068160191 45.0267344588

4110378.39764069 0.714058331
0.276448652
Cutosis=0,28 Asimetria positiva =0,72
% Proteína Costo
2.9 697
2.48 661
2.95 701
3.33 733 Costovs%deproteina
3.04 708
3.64 759 900
800
2.55 667 f(x) = 84.9921178151x + 450.0738505234
700
3.82 775
600
2.1 629
500
2.95 701

costo
400
2.33 648
300
2.49 662
200
3.11 714 100
2.83 691 0
2.99 704 1.5 2 2.5 3 3.5
2.42 656 %Proteina
2.89 696
3.62 758
2.63 674
1.75 599
3.08 712
3.84 776
3.65 760
2.7 680
2.59 670
3.33 733
2.71 680
2.59 670
2.74 683
2.91 697
2.56 668
3.36 736
2.51 663
2.35 650
3.67 762
2.19 636
2.37 651
2.81 689
2.89 696
2.65 675
3.57 753
3.28 729
2.85 692
2.48 661
3.94 785
2.65 675
2.82 690
2.79 687
3.07 711
3.02 707
2.17 634
3.78 771
2.02 622
2.89 696
2.17 634
2.08 627
2.13 631
3.35 735
4.08 797
3.53 750
1.97 617
2.88 695
2.95 701
3.14 717
3.54 751
3.3 731
3.27 728
2.42 656
4.08 797
2.23 640
2.76 685
2.67 677
2.9 697
2.51 663
2.1 629
2.49 662
4.35 820
2.57 668
3.99 789
2.75 684
2.84 691
2.65 675
2.37 651
3.11 714
2.26 642
3.79 772
3.05 709
2.27 643
2.19 636
2.61 672
2.94 700
3.86 778
2.55 667
3.22 724
4.29 815
2.75 684
2.16 634
3.2 722
2.68 678
3.9 782
2.89 696
3.08 712
3.01 706
2.78 686
3.74 768
2.8 688
3.31 731
2.87 694
2.62 673
3.43 742
3.56 753
3.29 730
2.28 644
3.35 735
3.1 714
3.21 723
3.47 745
2.88 695
2.13 631
3.23 725
3.16 719
2.61 672
3.15 718
3.77 770
3.32 732
3.16 719
3.47 745
1.87 609
3.08 712
3.19 721
3.02 707
4.06 795
2.89 696
2.2 637
3.22 724
3.27 728
3.69 764
3.72 766
3.23 725
3.02 707
4.07 796
2.75 684
3.12 715
2.51 663
2.4 654
3.64 759
2.55 667
2.69 679
2.58 669
2.77 685
2.63 674
2.17 634
2.9 697
2.05 624
3.85 777
3.18 720
2.91 697
2.78 686
1.99 619
3.36 736
3 705
3.17 719
3.9 782
4.37 821
3.38 737
2.85 692
3 705
3.04 708
2.56 668
3.34 734
3.12 715
3.07 711
2.88 695
3.1 714
3.3 731
2.47 660
2.66 676
3.23 725
2.5 663
3.74 768
3.61 757
3.58 754
3.46 744
2.71 680
2.84 691
2.22 639
2.96 702
2.76 685
3.33 733
3 705
3.24 725
3.01 706
2.69 679
3.24 725
3.13 716
2.63 674
2.32 647
2.2 637
3.31 731
3.55 752
3.48 746
3.45 743
3.37 736
3.87 779
2.85 692
2.55 667
3.59 755
2.24 640
3 705
2.66 676
2.71 680
3.1 714
2.81 689
3.63 759
3.09 713
2.86 693
3.3 731
3.6 756
3.24 725
3.14 717
4.25 811
3.02 707
3.76 770
2.42 656
3.03 708
2.11 629
3.97 787
2.75 684
3.28 729
2.64 674
2.42 656
3.21 723
2.59 670
2.69 679
4.08 797
3.11 714
3.14 717
2.75 684
3.28 729
2.65 675
2.56 668
3.71 765
3.54 751
3.05 709
3.54 751
3.58 754
2.66 676
2.71 680
4.01 791
Desarrollo del paso 5. Correlación y regresión

Costovs%deproteina
900
800
f(x) = 84.9921178151x + 450.0738505234
700
600
500
costo

400
300
200
100
0
1.5 2 2.5 3 3.5 4 4.5 5
%Proteina

Con la variable costo vs % proteína, encuentre el coeficiente de correlación de Pearson, luego responda:
¿La relación entre las dos variables es positiva o negativa? Interprétela.
¿Qué tan fuerte es la relación entre las dos variables, según el coeficiente de correlación de Pearson?
0.9999785451
Correlacion Positiva =1
La relacion es fuerte entre las dos variables y es en sentido directo

Dé una conclusión usando el coeficiente de determinación.


A mayor consumo de proteina mayor costo
0.9999570907
Correlacion determinacion =1

Haga predicciones con el modelo de recta de regresión encontrado:


Si el costo de la leche es 700.000 pesos, ¿Cuál es el % de proteína?
Si el costo de la leche es de 700.000 pesos el % de proteina es de 2,94
y=84,992x + 450,07
2.9406297063

Si el % de proteína medido es 3, ¿Cuál es el costo de la leche?


Si el % de proteina medido es 3 el costo de la leche es de $705.046
y=84,992x + 450,07
705.046
Desarrollo del paso 6. Estrategias de solución

EL consumo de proteina genera altos costos ya que hay una relacion directa entre estas dos variables. El productor
o naturales que no afecten la calidad del producto pero que baje costos
. Estrategias de solución

stas dos variables. El productor y empresario debe buscar la manera de obtener materias primas mas economicas .
s mas economicas .
REFERENCIAS BIBLIOGRAFICAS

Martínez, C. (2011). Capítulo 1. Generalidades. En: Estadística Básica Aplicada, 4a ed. [Online] Bogotá: Ecoe Edic
Recuperado de: http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=67&docID=10560355&tm=1
Martínez, C. (2011). Capítulo 2.Distribuciones de frecuencia. En: Estadística y muestreo, 13a ed. [Online] Bogotá: E
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=20&docID=10624529&tm=1498605892138
GRAFICAS

ne] Bogotá: Ecoe Ediciones, pp. 2 – 5.


ocID=10560355&tm=1498531579762
ed. [Online] Bogotá: Ecoe Ediciones, pp. 45 – 47. Recuperado de:
tm=1498605892138

Das könnte Ihnen auch gefallen