Beruflich Dokumente
Kultur Dokumente
1.1.2- A matemtica a base para qualquer clculo dentro da minerao de dados, ela est
presente em muitas reas como na estatstica e na inteligncia artificial, como por exemplo no
clculo dos parmetros de uma regresso ou no ajuste dos pesos de uma rede neural. A
estatstica fornece ferramentas que possibilita fazer estimaes, classificaes, anlise
descritiva entre outras. J a visualizao propicia uma maneira mais fcil de interpretar os
dados facilitando assim a tomada de deciso.
Sistemas de informao
Banco de dados
Inteligncia artificial
Engenharia
Captulo 2
2.1.1- a) Tabela com os dados de cadastro dos funcionrios de uma empresa. Estruturado
b) Arquivos de Som. No estruturado
? c) Apresentaes em PowerPoint. Semiestruturado
d) Textos com palavras-chave identificadas. Semiestruturado
? e) Imagens com tags. Semiestruturado
2.1.2-
2.1.3-
2.2.1- Para a resoluo desse exerccio foi usado algoritmo (Python). Arquivo: ex_2.2.1.py
2.2.2
Idade = [67, 43, 58, 28, 74, 65, 70, 42, 57, 60]
Idade ordenado = [28, 42, 43, 57, 58, 60, 65, 67, 70, 74]
2.2.3-
2.3 -
Captulo 3
3.1.1 - Fornecer uma maneira mais simples de interpretar um conjunto de dados,
descrevendo, analisando ou resumindo-os.
3.1.3 - Todos correspondem a ndices que so usados para descrever um conjunto de dados.
*Medidas de tendncia central referem-se a um valor central, ou tpico, em uma distribuio
de valores. uma medida que se preocupa em resumir todo um conjunto de dados atravs de
um nico valor mdio ou central em uma distribuio.
*Medidas de disperso atenta verificar o quanto os dados esto dispersos em torno de um
valor mdio.
*Medidas de formas fornecem informaes quanto ao formato de uma distribuio. A
assimetria (skewness) quantifica quo simtrico a distribuio em relao a sua mdia. J a
curtose (kurtosis) caracteriza o pico ou achatamento da curva da funo de distribuio de
probabilidade.
==================================================================
3.2.1
L = {6, 7, 1, 9, 8, 2, 6, 4, 6, 4, 5, 2, 3, 1, 10, 7, 10, 2, 10, 8, 6, 5, 3, 8, 3, 1, 8, 7, 8, 7}
Nmeros de classes = 5
Amplitude de classes = ceil[(10-1)/5] = 2
Limite inferior inicial = 1
Limites inferiores das classes = 1, 3, 5, 7, 9
Limites superiores das classes = 2, 4, 6, 8, 10
Rtulos para os valores:
3, 4, 1, 5, 4, 1, 3, 2, 3, 2, 3, 1, 2, 1, 5, 4, 5, 1, 5, 4, 3, 3, 2, 4, 2, 1, 4, 4, 4, 4
3.2.2-
a) Atributo A = [0,4190 0,3908 0,8161 0,3174 0,8145 0,7891 0,8523 0,5056 0,6357
0,9509 0,4440 0,0600 0,8667 0,6312 0,3551 0,9970 0,2242 0,6525 0,6050 0,3872]
= = = 0,585715
Atributo A ordenado = [0,06 0,2242 0,3174 0,3551 0,3872 0,3908 0,419 0,444 0,5056
0,605 0,6312 0,6357 0,6525 0,7891 0,8145 0,8161 0,8523 0,8667 0,9509 0,997]
= = = 0,6181
Atributo B = [0,1422 0,0251 0,4211 0,1841 0,7258 0,3704 0,8416 0,7342 0,5710 0,1769
0,9574 0,2653 0,9246 0,2238 0,3736 0,0875 0,6401 0,1806 0,0451 0,7232 ]
= = = 0,43068
Atributo B ordenado = [0.0251, 0.0451, 0.0875, 0.1422, 0.1769, 0.1806, 0.1841, 0.2238,
0.2653, 0.3704, 0.3736, 0.4211, 0.571, 0.6401, 0.7232, 0.7258, 0.7342, 0.8416, 0.9246,
0.9574]
= = = 0,372
Atributo C = [0,3474 0,6606 0,3839 0,6273 0,0216 0,9106 0,8006 0,7458 0,8131
0,3833 0,6173 0,5755 0,5301 0,2751 0,2486 0,4516 0,2277 0,8044 0,9861 0,0300]
= = = 0,52203
Atributo C ordenado = [0.0216, 0.03, 0.2277, 0.2486, 0.2751, 0.3474, 0.3833, 0.3839,
0.4516, 0.5301, 0.5755, 0.6173, 0.6273, 0.6606, 0.7458, 0.8006, 0.8044, 0.8131,
0.9106, 0.9861]
= = = 0,5528
Atributo D =[0,5357 0,0871 0,8021 0,9891 0,0669 0,9394 0,0182 0,6838 0,7837 0,5341
0,8854 0,8990 0,6259 0,1379 0,2178 0,1821 0,0418 0,1069 0,6164 0,9397]
= = = 0.50465
Atributo D ordenado = [0.0182, 0.0418, 0.0669, 0.0871, 0.1069, 0.1379, 0.1821, 0.2178,
0.5341, 0.5357, 0.6164, 0.6259, 0.6838, 0.7837, 0.8021, 0.8854, 0.899, 0.9394, 0.9397,
0.9891]
= = = 0,57605
b)
Atributo A Atributo B Atributo C Atributo D
Primeiro quartil 0,389 0,17875 0,31125 0,1224
Segundo quartil 0,6181 0,372 0,5528 0,57605
Terceiro quartil 0,8153 0,7245 0,7732 0,84375
c)
Atributo X: {1: 48, 2: 73, 3: 55, 4: 91, 5: 30, 6: 86, 7: 60, 8: 61, 9: 13}
Classes Frequncia absoluta Frequncia relativa Frequncia acumulada
1 48 9,284 % 48 9,284 %
2 73 14,12 % 121 23,404 %
3 55 10,638 % 176 34,042 %
4 91 17,602 % 267 51,644 %
5 30 5,803 % 297 57,447 %
6 86 16,634 % 383 74,081 %
7 60 11,605 % 443 85,686 %
8 61 11,799 % 504 97,485 %
9 13 2,515 % 517 100 %
Atributo Temp:
Nmeros de classes = 7
Amplitude de classes = ceil[(33,3 - 2,2)/7] = 5
Limites inferiores das classes = 2,2 7,2 12,2 17,2 22,2 27,2 32,2
Rtulos para os valores:
classe 1: [ 5.5, 6.7, 5.3, 5.3, 5.8, 5.8, 5.1, 4.8, 5.1, 5.1, 4.6, 4.6, 4.6, 4.6, 2.2, 5.1,
4.2, 5.2, 5.3, 4.6, 5.1, 4.6]
classe 2: [ 8.2, 8.3, 11.4, 8. , 9.3, 11.2, 11.3, 11.8, 11. , 11.5, 8.3, 11.6, 11.6, 10.6,
10.3, 9. , 10.6, 11.5, 11.5, 11.7, 8.8, 11. , 11. , 11.2, 8.8, 7.5, 10.6, 11.3, 9.8, 10.1,
10.1, 10.4, 10.3, 8.7, 11.6, 7.5, 10.1, 8.2, 10.9, 8.9, 10.5, 11.8, 10.2, 11.2, 11.8]
classe 3: [ 14.6, 13.1, 17. , 15.1, 16.7, 15.9, 16.3, 14.1, 16.6, 12.9, 14.7, 13.8, 13.9,
12.3, 15.8, 15.6, 15.7, 14.7, 16.6, 14.7, 12.7, 14.4, 12.7, 13.7, 15.8, 15.5, 15.2, 17.1,
15.9, 15.4, 15.4, 14. , 14.9, 15.6, 16.6, 13.2, 16.4, 16.1, 15.2, 16.6, 14.6, 14.2,
14.4, 12.4, 16.8, 13.3, 13.9, 12.4, 15.1, 17. , 17. , 16.9, 12.4, 15.2, 16.2, 13.4, 15.4,
16.1, 16.4, 13.4, 15.2, 16.7, 15.4, 12.6, 17.1, 14.3, 15.4, 17.1, 16. , 12.2, 16.8, 16.8,
12.9, 13.7, 17.1, 15.7, 15.9, 12.2, 16.8, 12.8, 15.4, 15.9, 15.2, 15.9, 15.9, 16.4, 16.8,
13.8, 13.8, 14.2, 15.4, 16.2, 15.2, 17. , 14.2, 14.7, 13.8, 14.2, 16.2, 14.8, 16.2, 16.8,
16.6, 15.5, 14.5, 13.3, 13.7, 14.3]
classe 4: [ 18. , 17.8, 19.3, 21.3, 18.3, 19.1, 21. , 19.5, 19. ,
19.4, 20.6, 17.7, 21.2, 18.2, 21.7, 17.8, 18.4, 19.6,
20.8, 21.5, 20.4, 20.4, 17.6, 17.8, 18.8, 20.8, 18.6,
19.6, 19.6, 17.2, 17.7, 17.3, 21.6, 19.5, 17.9, 18.6,
20.2, 21.5, 17.4, 17.4, 20.8, 18.2, 17.8, 17.4, 19.8,
19.8, 20.1, 18.2, 21.4, 20.3, 17.4, 18.8, 18.9, 19.6,
17.9, 19.8, 20.6, 17.2, 17.6, 17.6, 17.2, 18. , 21.7,
21.9, 21.2, 17.4, 20.1, 18.4, 20.5, 19. , 20.3, 17.8,
17.8, 20.7, 21.9, 17.4, 20.1, 17.7, 20.3, 19.2, 18.3,
19.1, 20.8, 17.6, 21. , 21.5, 21.6, 20.2, 22.1, 20.7,
19.6, 18.4, 20.1, 19.4, 18.6, 20.1, 18.7, 17.7, 19.6,
18.2, 18.8, 21.9, 20.7, 21.7, 22.1, 21.4, 18.9, 21.4,
20.6, 21.4, 19.3, 21.8, 22.1, 19.4, 21. , 19.1, 21.8,
20.1, 20.2, 22.1, 18.7, 19.6, 20.7, 19.1, 19.2, 19.2,
19. , 19.7, 18.5, 18.6, 19.2, 21.6, 21.6, 18.9, 21.2,
19.7, 21.5, 18.1, 18. , 19.3, 20.4, 19.3, 20.6, 21.3,
17.4, 20.6, 19.8, 18.7, 20.8, 20.8, 19.7, 21.1, 18.4,
17.3, 21.1, 19.6, 20.3, 21.1, 21.9, 19.3, 20.5, 21.3,
20.9, 20.6, 20.7, 21.9, 20.4, 21.3, 21.8, 19.9, 20.4,
20.4, 19.4, 20.9, 19.1, 17.3, 19.1, 19.3, 17.7, 17.4,
17.9, 19.9, 18.9, 18.9, 18.9, 17.6, 18. , 18.2, 19.4,
20.6, 21.6, 21.6, 20.7, 18.5, 21.1, 18.2, 21.9, 21.2]
Classe 5: [ 22.2, 24.1, 22.8, 26.4, 22.9, 23.7, 22.8, 25.4, 23.3,
25.9, 23. , 23.1, 23. , 25.4, 22.4, 25.3, 23.4, 24.1,
22.8, 22.5, 23.3, 23.8, 24.2, 23.7, 23.2, 24.8, 24.6,
23.4, 23.9, 24.2, 24.6, 24.3, 24.6, 23.5, 22.6, 22.9,
23.2, 22.9, 26.4, 24.3, 25.1, 22.4, 26.8, 25.7, 26.8,
24. , 22.3, 23.9, 23.7, 23.7, 23.4, 24.2, 24.3, 25.3,
22.9, 26.9, 22.2, 23.8, 24.9, 25.3, 24.8, 24.3, 24.2,
24.1, 23.5, 24.2, 23. , 22.7, 23.3, 23.3, 24.3, 25.9,
22.8, 25. , 23.4, 22.8, 26.4, 24.1, 26.3, 24.9, 24.8,
26.2, 22.3, 26.9, 26.2, 24.6, 23.3, 23.9, 22.2, 23.8,
26.8, 23.6, 25.5, 23.4, 24.5, 26.4, 22.7, 26.1, 22.6,
23.4, 24.1, 26.4, 23.9, 26.7, 25.9, 25.9, 25.6]
Classe 6: [ 30.2, 27.7, 27.6, 27.4, 29.6, 28.6, 28.3, 27.8, 28.7,
28.3, 28.2, 28. , 28. , 27.9, 27.5, 30.8, 29.3, 27.9,
27.2, 30.2, 30.2, 31. , 30.6, 28.7, 27.5, 30.8, 27.3,
29.2, 28.9, 27.8, 27.8]
Atributo UR:
Nmeros de classes = 7
Amplitude de classes = ceil[(100 - 15)/7] = 13
Limite inferior inicial = 15
Limites inferiores das classes = 15 28 41 54 67 80 93
Limites superiores das classes = 27 40 53 66 79 92 105
Rtulos para os valores:
Classe 1: [27, 21, 27, 24, 24, 24, 27, 24, 17, 24, 26, 27, 25, 19, 15, 27, 25,
24, 22, 24, 18, 27, 27, 27, 24, 22, 25, 27, 27, 26, 22, 25, 22, 15,
26, 25, 27, 27, 19, 27, 26, 21, 27, 25, 27, 20, 25, 24, 21, 21, 21,
21, 24, 25, 27, 27, 27, 24, 24, 27, 27, 27, 27, 27, 27, 19, 27, 27,
27, 24, 19, 27, 27, 27, 25, 22, 27, 25, 21, 27, 26, 27, 26]
Classe 2: [33, 33, 29, 40, 38, 35, 40, 38, 32, 34, 39, 37, 39, 32, 37, 36, 35,
34, 40, 39, 35, 33, 31, 37, 33, 33, 37, 30, 39, 34, 36, 32, 39, 39,
40, 29, 29, 33, 39, 35, 30, 30, 36, 35, 40, 39, 38, 38, 39, 31, 32,
40, 28, 39, 29, 35, 34, 29, 31, 33, 35, 39, 39, 39, 32, 32, 34, 39,
33, 28, 36, 38, 33, 37, 34, 31, 37, 33, 39, 34, 36, 40, 38, 39, 28,
40, 36, 37, 38, 40, 32, 39, 32, 35, 40, 32, 30, 39, 40, 28, 39, 38,
38, 35, 28, 30, 28, 34, 28, 28, 39, 32, 35, 28, 34, 35, 37, 35, 35,
35, 39, 39, 35, 38, 39, 29, 34, 34, 33, 32, 34, 34, 36, 34, 31, 33,
39, 36, 36, 31, 33, 34, 40, 38, 35, 29, 35, 33, 40, 35, 40, 28, 40,
28, 34, 33, 29, 30, 30, 29, 35, 35, 32, 31]
Classe 3: [51, 51, 42, 44, 47, 44, 44, 43, 48, 43, 42, 48, 46, 42, 42, 45, 50,
51, 44, 43, 43, 44, 51, 47, 45, 43, 48, 52, 45, 43, 43, 42, 45, 50,
49, 43, 46, 46, 42, 52, 42, 51, 53, 43, 43, 47, 47, 45, 41, 47, 45,
50, 53, 44, 45, 53, 45, 46, 42, 42, 47, 46, 49, 46, 44, 43, 43, 41,
46, 51, 41, 46, 41, 44, 42, 53, 53, 47, 51, 46, 49, 53, 48, 46, 45,
43, 52, 53, 45, 41, 41, 51, 44, 41, 44, 51, 51, 43, 53, 43, 47, 50,
42, 45, 53, 45, 47, 42, 42, 51, 44, 50, 48, 46, 43, 46, 41, 46, 44,
42, 53, 50, 42, 48, 44, 45, 45, 51, 53, 46, 49, 48, 50, 45, 41, 50,
45, 43, 42, 41, 41, 42]
Classe 4: [63, 60, 62, 60, 54, 63, 59, 66, 59, 64, 66, 56, 58, 66, 56, 54, 66,
60, 54, 59, 54, 64, 60, 59, 57, 66, 54, 59, 54, 55, 56, 58, 57, 61,
61, 59, 56, 54, 66, 57, 64, 55, 64, 58, 57, 54, 63, 58, 55, 62, 55,
56, 56, 66, 58, 64, 58, 61, 65, 54, 56, 59, 64, 64, 64, 59, 57, 58,
63, 65, 65, 62]
Classe 5: [72, 78, 74, 70, 79, 72, 78, 74, 67, 70, 68, 73, 79, 75, 73, 70, 67,
78, 75, 75, 77, 77, 75, 78, 71, 68, 67, 73, 78, 70, 77, 72, 76, 77,
79, 71, 69, 73, 71, 71, 70]
Classe 6: [86, 87, 84, 90, 90, 86, 80, 88, 82, 82]
Classe 7: [ 97, 99, 96, 94, 100]
==================================================================
Visualizao dos dados
Histogramas
==================================================================
medidas de resumo
tendncia central
disperso X Y Temp UR
amplitude 8 7 31,1 85
Desvio padro 2,31 1,23 5,8 16,30
varincia 5,34 1,51 33,65 265,74
Coeficiente de var 49,51 % 26,31 % 124,24 % 349,13 %
Forma X Y Temp UR
Assimetria 0,036 0,416 -0,33 0,86
Curtose -1,173 1,395 0,123 0,422