Sie sind auf Seite 1von 9

Captulo 1

1 Base de dados um conjunto de dados referente a um assunto especfico, j o


banco de dados uma coleo de bases de dados. Exemplo: numa empresa tem-se
bases de dados referentes a vrios departamentos, RH, financeiro, compras etc,

1.1.2- A matemtica a base para qualquer clculo dentro da minerao de dados, ela est
presente em muitas reas como na estatstica e na inteligncia artificial, como por exemplo no
clculo dos parmetros de uma regresso ou no ajuste dos pesos de uma rede neural. A
estatstica fornece ferramentas que possibilita fazer estimaes, classificaes, anlise
descritiva entre outras. J a visualizao propicia uma maneira mais fcil de interpretar os
dados facilitando assim a tomada de deciso.
Sistemas de informao
Banco de dados
Inteligncia artificial
Engenharia

Captulo 2
2.1.1- a) Tabela com os dados de cadastro dos funcionrios de uma empresa. Estruturado
b) Arquivos de Som. No estruturado
? c) Apresentaes em PowerPoint. Semiestruturado
d) Textos com palavras-chave identificadas. Semiestruturado
? e) Imagens com tags. Semiestruturado

2.1.2-

2.1.3-

2.2.1- Para a resoluo desse exerccio foi usado algoritmo (Python). Arquivo: ex_2.2.1.py

a Forma = [ Lobular, Redonda, Irregular, Redonda, Redonda, Redonda, ?,


Redonda, Redonda, ? ]

Severidade: { Maligno: Lobular, Redonda, Irregular, Redonda, Redonda, ?; Benigno:


Redonda, Redonda, ?, Redonda}

Maligno: {Lobular: 1 ; Redonda: 3 ; Irregular: 1} => Moda: Redonda


Benigno: {Redonda:3} => Moda: Redonda

Substituindo os valores encontrados:


Forma = [Lobular, Redonda, Irregular, Redonda, Redonda, Redonda, Redonda,
Redonda, Redonda, Redonda ]

b Para a resoluo desse exerccio foi usado o cdigo ex_2.2.1b.py


Depois da leitura dos dados foi feita a substituio do smbolo ? por -1.
Utilizou-se a distncia euclidiana a fim de mapear cada indivduo com seu par mais
prximo.
Em seguida recuperou-se o valor desejado (contorno) do indivduo mais prximo de
cada ID (6, 7, 8) e foi realizada a substituio dos valores.
Os valores encontrados foram:

ID_ ID_ Valor


alv pro
o x
6 1 Especul
ada
7 1 Especul
ada
8 2 Circuns
crita

c) Densidade = [Baixa, ? , Baixa, Baixa, ? , Baixa, Baixa, Baixa, Baixa, Alta ]


Foi escolhida a densidade Baixa para a substituio dos valores ausentes
Densidade = [Baixa, Baixa , Baixa, Baixa, Baixa , Baixa, Baixa, Baixa, Baixa, Alta ]

2.2.2
Idade = [67, 43, 58, 28, 74, 65, 70, 42, 57, 60]
Idade ordenado = [28, 42, 43, 57, 58, 60, 65, 67, 70, 74]

Partio para duas caixas de mesma frequncia:


Caixa1 = [28, 42, 43, 57, 58]
Caixa2 = [60, 65, 67, 70, 74]

Caixa Obejtos Mdia* Extremos Suavizao


Mdia Extremos
1 [28, 42, 43, 57, 58] 46 Min = 28 Max = 58 [46,46,46,46,46] [28,28,28,58,58]
2 [60, 65, 67, 70, 74] 62 Min = 60 Max = 74 [62,62,62,62,62] [60,60,60,74,74]

*valores da mdia arredondados.

2.2.3-

2.3 -

Captulo 3
3.1.1 - Fornecer uma maneira mais simples de interpretar um conjunto de dados,
descrevendo, analisando ou resumindo-os.

3.1.2 - Facilitar a interpretao de dados brutos, organizando-os em uma tabela com


frequncias e classes, possibilitando assim a visualizao dos dados atravs da construo de
grficos, como os histogramas, polgonos de frequncia, grfico de setores entre outros.

3.1.3 - Todos correspondem a ndices que so usados para descrever um conjunto de dados.
*Medidas de tendncia central referem-se a um valor central, ou tpico, em uma distribuio
de valores. uma medida que se preocupa em resumir todo um conjunto de dados atravs de
um nico valor mdio ou central em uma distribuio.
*Medidas de disperso atenta verificar o quanto os dados esto dispersos em torno de um
valor mdio.
*Medidas de formas fornecem informaes quanto ao formato de uma distribuio. A
assimetria (skewness) quantifica quo simtrico a distribuio em relao a sua mdia. J a
curtose (kurtosis) caracteriza o pico ou achatamento da curva da funo de distribuio de
probabilidade.

==================================================================

3.2.1
L = {6, 7, 1, 9, 8, 2, 6, 4, 6, 4, 5, 2, 3, 1, 10, 7, 10, 2, 10, 8, 6, 5, 3, 8, 3, 1, 8, 7, 8, 7}
Nmeros de classes = 5
Amplitude de classes = ceil[(10-1)/5] = 2
Limite inferior inicial = 1
Limites inferiores das classes = 1, 3, 5, 7, 9
Limites superiores das classes = 2, 4, 6, 8, 10
Rtulos para os valores:
3, 4, 1, 5, 4, 1, 3, 2, 3, 2, 3, 1, 2, 1, 5, 4, 5, 1, 5, 4, 3, 3, 2, 4, 2, 1, 4, 4, 4, 4

Classe Limite Pto. Limite Fronteira Freq. Freq. Frequncia


inferior mdio superior absoluta relativa acumulada
1 1 1,5 2 2,5 6 20% 6 20%
2 3 3,5 4 5 16,67% 11 36,67%
4,5
3 5 5,5 6 6 20% 17 56,67%
6,5
4 7 7,5 8 9 30% 26 86,67%
8,5
5 9 9,5 10 4 13,33% 30 100%

Histograma - exerccio 3.2.1

3.2.2-
a) Atributo A = [0,4190 0,3908 0,8161 0,3174 0,8145 0,7891 0,8523 0,5056 0,6357
0,9509 0,4440 0,0600 0,8667 0,6312 0,3551 0,9970 0,2242 0,6525 0,6050 0,3872]
= = = 0,585715

Atributo A ordenado = [0,06 0,2242 0,3174 0,3551 0,3872 0,3908 0,419 0,444 0,5056
0,605 0,6312 0,6357 0,6525 0,7891 0,8145 0,8161 0,8523 0,8667 0,9509 0,997]
= = = 0,6181

Atributo B = [0,1422 0,0251 0,4211 0,1841 0,7258 0,3704 0,8416 0,7342 0,5710 0,1769
0,9574 0,2653 0,9246 0,2238 0,3736 0,0875 0,6401 0,1806 0,0451 0,7232 ]
= = = 0,43068

Atributo B ordenado = [0.0251, 0.0451, 0.0875, 0.1422, 0.1769, 0.1806, 0.1841, 0.2238,
0.2653, 0.3704, 0.3736, 0.4211, 0.571, 0.6401, 0.7232, 0.7258, 0.7342, 0.8416, 0.9246,
0.9574]
= = = 0,372

Atributo C = [0,3474 0,6606 0,3839 0,6273 0,0216 0,9106 0,8006 0,7458 0,8131
0,3833 0,6173 0,5755 0,5301 0,2751 0,2486 0,4516 0,2277 0,8044 0,9861 0,0300]
= = = 0,52203

Atributo C ordenado = [0.0216, 0.03, 0.2277, 0.2486, 0.2751, 0.3474, 0.3833, 0.3839,
0.4516, 0.5301, 0.5755, 0.6173, 0.6273, 0.6606, 0.7458, 0.8006, 0.8044, 0.8131,
0.9106, 0.9861]
= = = 0,5528

Atributo D =[0,5357 0,0871 0,8021 0,9891 0,0669 0,9394 0,0182 0,6838 0,7837 0,5341
0,8854 0,8990 0,6259 0,1379 0,2178 0,1821 0,0418 0,1069 0,6164 0,9397]

= = = 0.50465

Atributo D ordenado = [0.0182, 0.0418, 0.0669, 0.0871, 0.1069, 0.1379, 0.1821, 0.2178,
0.5341, 0.5357, 0.6164, 0.6259, 0.6838, 0.7837, 0.8021, 0.8854, 0.899, 0.9394, 0.9397,
0.9891]
= = = 0,57605

b)
Atributo A Atributo B Atributo C Atributo D
Primeiro quartil 0,389 0,17875 0,31125 0,1224
Segundo quartil 0,6181 0,372 0,5528 0,57605
Terceiro quartil 0,8153 0,7245 0,7732 0,84375

c)

3.3.1- Distribuio de frequncias

Atributo X: {1: 48, 2: 73, 3: 55, 4: 91, 5: 30, 6: 86, 7: 60, 8: 61, 9: 13}
Classes Frequncia absoluta Frequncia relativa Frequncia acumulada
1 48 9,284 % 48 9,284 %
2 73 14,12 % 121 23,404 %
3 55 10,638 % 176 34,042 %
4 91 17,602 % 267 51,644 %
5 30 5,803 % 297 57,447 %
6 86 16,634 % 383 74,081 %
7 60 11,605 % 443 85,686 %
8 61 11,799 % 504 97,485 %
9 13 2,515 % 517 100 %

Atributo Y: {2: 44, 3: 64, 4: 203, 5: 125, 6: 74, 8: 1, 9: 6}

Classes Frequncia absoluta Frequncia relativa Frequncia acumulada


2 44 8,511 % 44 8,511 %
3 64 12,379 % 108 20,89 %
4 203 39,265 % 311 60,155 %
5 125 24,178 % 436 84,333 %
6 74 14,313 % 510 98,646 %
8 1 0,193 % 511 98,839 %
9 6 1,161 % 517 100 %

Atributo Temp:
Nmeros de classes = 7
Amplitude de classes = ceil[(33,3 - 2,2)/7] = 5
Limites inferiores das classes = 2,2 7,2 12,2 17,2 22,2 27,2 32,2
Rtulos para os valores:
classe 1: [ 5.5, 6.7, 5.3, 5.3, 5.8, 5.8, 5.1, 4.8, 5.1, 5.1, 4.6, 4.6, 4.6, 4.6, 2.2, 5.1,
4.2, 5.2, 5.3, 4.6, 5.1, 4.6]

classe 2: [ 8.2, 8.3, 11.4, 8. , 9.3, 11.2, 11.3, 11.8, 11. , 11.5, 8.3, 11.6, 11.6, 10.6,
10.3, 9. , 10.6, 11.5, 11.5, 11.7, 8.8, 11. , 11. , 11.2, 8.8, 7.5, 10.6, 11.3, 9.8, 10.1,
10.1, 10.4, 10.3, 8.7, 11.6, 7.5, 10.1, 8.2, 10.9, 8.9, 10.5, 11.8, 10.2, 11.2, 11.8]

classe 3: [ 14.6, 13.1, 17. , 15.1, 16.7, 15.9, 16.3, 14.1, 16.6, 12.9, 14.7, 13.8, 13.9,
12.3, 15.8, 15.6, 15.7, 14.7, 16.6, 14.7, 12.7, 14.4, 12.7, 13.7, 15.8, 15.5, 15.2, 17.1,
15.9, 15.4, 15.4, 14. , 14.9, 15.6, 16.6, 13.2, 16.4, 16.1, 15.2, 16.6, 14.6, 14.2,
14.4, 12.4, 16.8, 13.3, 13.9, 12.4, 15.1, 17. , 17. , 16.9, 12.4, 15.2, 16.2, 13.4, 15.4,
16.1, 16.4, 13.4, 15.2, 16.7, 15.4, 12.6, 17.1, 14.3, 15.4, 17.1, 16. , 12.2, 16.8, 16.8,
12.9, 13.7, 17.1, 15.7, 15.9, 12.2, 16.8, 12.8, 15.4, 15.9, 15.2, 15.9, 15.9, 16.4, 16.8,
13.8, 13.8, 14.2, 15.4, 16.2, 15.2, 17. , 14.2, 14.7, 13.8, 14.2, 16.2, 14.8, 16.2, 16.8,
16.6, 15.5, 14.5, 13.3, 13.7, 14.3]

classe 4: [ 18. , 17.8, 19.3, 21.3, 18.3, 19.1, 21. , 19.5, 19. ,
19.4, 20.6, 17.7, 21.2, 18.2, 21.7, 17.8, 18.4, 19.6,
20.8, 21.5, 20.4, 20.4, 17.6, 17.8, 18.8, 20.8, 18.6,
19.6, 19.6, 17.2, 17.7, 17.3, 21.6, 19.5, 17.9, 18.6,
20.2, 21.5, 17.4, 17.4, 20.8, 18.2, 17.8, 17.4, 19.8,
19.8, 20.1, 18.2, 21.4, 20.3, 17.4, 18.8, 18.9, 19.6,
17.9, 19.8, 20.6, 17.2, 17.6, 17.6, 17.2, 18. , 21.7,
21.9, 21.2, 17.4, 20.1, 18.4, 20.5, 19. , 20.3, 17.8,
17.8, 20.7, 21.9, 17.4, 20.1, 17.7, 20.3, 19.2, 18.3,
19.1, 20.8, 17.6, 21. , 21.5, 21.6, 20.2, 22.1, 20.7,
19.6, 18.4, 20.1, 19.4, 18.6, 20.1, 18.7, 17.7, 19.6,
18.2, 18.8, 21.9, 20.7, 21.7, 22.1, 21.4, 18.9, 21.4,
20.6, 21.4, 19.3, 21.8, 22.1, 19.4, 21. , 19.1, 21.8,
20.1, 20.2, 22.1, 18.7, 19.6, 20.7, 19.1, 19.2, 19.2,
19. , 19.7, 18.5, 18.6, 19.2, 21.6, 21.6, 18.9, 21.2,
19.7, 21.5, 18.1, 18. , 19.3, 20.4, 19.3, 20.6, 21.3,
17.4, 20.6, 19.8, 18.7, 20.8, 20.8, 19.7, 21.1, 18.4,
17.3, 21.1, 19.6, 20.3, 21.1, 21.9, 19.3, 20.5, 21.3,
20.9, 20.6, 20.7, 21.9, 20.4, 21.3, 21.8, 19.9, 20.4,
20.4, 19.4, 20.9, 19.1, 17.3, 19.1, 19.3, 17.7, 17.4,
17.9, 19.9, 18.9, 18.9, 18.9, 17.6, 18. , 18.2, 19.4,
20.6, 21.6, 21.6, 20.7, 18.5, 21.1, 18.2, 21.9, 21.2]

Classe 5: [ 22.2, 24.1, 22.8, 26.4, 22.9, 23.7, 22.8, 25.4, 23.3,
25.9, 23. , 23.1, 23. , 25.4, 22.4, 25.3, 23.4, 24.1,
22.8, 22.5, 23.3, 23.8, 24.2, 23.7, 23.2, 24.8, 24.6,
23.4, 23.9, 24.2, 24.6, 24.3, 24.6, 23.5, 22.6, 22.9,
23.2, 22.9, 26.4, 24.3, 25.1, 22.4, 26.8, 25.7, 26.8,
24. , 22.3, 23.9, 23.7, 23.7, 23.4, 24.2, 24.3, 25.3,
22.9, 26.9, 22.2, 23.8, 24.9, 25.3, 24.8, 24.3, 24.2,
24.1, 23.5, 24.2, 23. , 22.7, 23.3, 23.3, 24.3, 25.9,
22.8, 25. , 23.4, 22.8, 26.4, 24.1, 26.3, 24.9, 24.8,
26.2, 22.3, 26.9, 26.2, 24.6, 23.3, 23.9, 22.2, 23.8,
26.8, 23.6, 25.5, 23.4, 24.5, 26.4, 22.7, 26.1, 22.6,
23.4, 24.1, 26.4, 23.9, 26.7, 25.9, 25.9, 25.6]

Classe 6: [ 30.2, 27.7, 27.6, 27.4, 29.6, 28.6, 28.3, 27.8, 28.7,
28.3, 28.2, 28. , 28. , 27.9, 27.5, 30.8, 29.3, 27.9,
27.2, 30.2, 30.2, 31. , 30.6, 28.7, 27.5, 30.8, 27.3,
29.2, 28.9, 27.8, 27.8]

Classe 7: [ 33.1, 32.4, 32.4, 32.6, 32.3, 33.3]


Classe Temp Freq. Freq. Frequncia acumulada
(C) absoluta relativa
1 2,2| - 7,2 22 4,255 % 22 4,255 %
2 7,2| - 12,2 45 8,704 % 67 12,959 %

3 12,2| - 17,2 108 20,890 % 175 33,849 %

4 17,2| - 22,2 198 38,298 % 373 72,147 %

5 22,2| - 27,2 107 20,696 % 480 92,843 %

6 27,2| - 32,2 31 5,996 % 511 98,839 %

7 32,2| - 37,2 6 1,161 % 517 100 %

Atributo UR:
Nmeros de classes = 7
Amplitude de classes = ceil[(100 - 15)/7] = 13
Limite inferior inicial = 15
Limites inferiores das classes = 15 28 41 54 67 80 93
Limites superiores das classes = 27 40 53 66 79 92 105
Rtulos para os valores:
Classe 1: [27, 21, 27, 24, 24, 24, 27, 24, 17, 24, 26, 27, 25, 19, 15, 27, 25,
24, 22, 24, 18, 27, 27, 27, 24, 22, 25, 27, 27, 26, 22, 25, 22, 15,
26, 25, 27, 27, 19, 27, 26, 21, 27, 25, 27, 20, 25, 24, 21, 21, 21,
21, 24, 25, 27, 27, 27, 24, 24, 27, 27, 27, 27, 27, 27, 19, 27, 27,
27, 24, 19, 27, 27, 27, 25, 22, 27, 25, 21, 27, 26, 27, 26]
Classe 2: [33, 33, 29, 40, 38, 35, 40, 38, 32, 34, 39, 37, 39, 32, 37, 36, 35,
34, 40, 39, 35, 33, 31, 37, 33, 33, 37, 30, 39, 34, 36, 32, 39, 39,
40, 29, 29, 33, 39, 35, 30, 30, 36, 35, 40, 39, 38, 38, 39, 31, 32,
40, 28, 39, 29, 35, 34, 29, 31, 33, 35, 39, 39, 39, 32, 32, 34, 39,
33, 28, 36, 38, 33, 37, 34, 31, 37, 33, 39, 34, 36, 40, 38, 39, 28,
40, 36, 37, 38, 40, 32, 39, 32, 35, 40, 32, 30, 39, 40, 28, 39, 38,
38, 35, 28, 30, 28, 34, 28, 28, 39, 32, 35, 28, 34, 35, 37, 35, 35,
35, 39, 39, 35, 38, 39, 29, 34, 34, 33, 32, 34, 34, 36, 34, 31, 33,
39, 36, 36, 31, 33, 34, 40, 38, 35, 29, 35, 33, 40, 35, 40, 28, 40,
28, 34, 33, 29, 30, 30, 29, 35, 35, 32, 31]
Classe 3: [51, 51, 42, 44, 47, 44, 44, 43, 48, 43, 42, 48, 46, 42, 42, 45, 50,
51, 44, 43, 43, 44, 51, 47, 45, 43, 48, 52, 45, 43, 43, 42, 45, 50,
49, 43, 46, 46, 42, 52, 42, 51, 53, 43, 43, 47, 47, 45, 41, 47, 45,
50, 53, 44, 45, 53, 45, 46, 42, 42, 47, 46, 49, 46, 44, 43, 43, 41,
46, 51, 41, 46, 41, 44, 42, 53, 53, 47, 51, 46, 49, 53, 48, 46, 45,
43, 52, 53, 45, 41, 41, 51, 44, 41, 44, 51, 51, 43, 53, 43, 47, 50,
42, 45, 53, 45, 47, 42, 42, 51, 44, 50, 48, 46, 43, 46, 41, 46, 44,
42, 53, 50, 42, 48, 44, 45, 45, 51, 53, 46, 49, 48, 50, 45, 41, 50,
45, 43, 42, 41, 41, 42]
Classe 4: [63, 60, 62, 60, 54, 63, 59, 66, 59, 64, 66, 56, 58, 66, 56, 54, 66,
60, 54, 59, 54, 64, 60, 59, 57, 66, 54, 59, 54, 55, 56, 58, 57, 61,
61, 59, 56, 54, 66, 57, 64, 55, 64, 58, 57, 54, 63, 58, 55, 62, 55,
56, 56, 66, 58, 64, 58, 61, 65, 54, 56, 59, 64, 64, 64, 59, 57, 58,
63, 65, 65, 62]
Classe 5: [72, 78, 74, 70, 79, 72, 78, 74, 67, 70, 68, 73, 79, 75, 73, 70, 67,
78, 75, 75, 77, 77, 75, 78, 71, 68, 67, 73, 78, 70, 77, 72, 76, 77,
79, 71, 69, 73, 71, 71, 70]
Classe 6: [86, 87, 84, 90, 90, 86, 80, 88, 82, 82]
Classe 7: [ 97, 99, 96, 94, 100]

Classe Limite Pto. Limite Fronteira Freq. Freq. Frequncia acumulada


inferior mdio superior absoluta relativa
1 15 21 27 27,5 83 16,054 % 83 16,054 %
2 28 34 40 164 31,722 % 247 47,776 %
40,5
3 41 47 53 142 27,466 % 389 75,242 %
53,5
4 54 60 66 72 13,927 % 461 89,169 %
66,5
5 67 73 79 41 7,930 % 502 97,099 %
79,5
6 80 86 92 10 1,934 % 512 99,033 %
92,5
7 93 99 105 5 0,967 % 517 100 %

==================================================================
Visualizao dos dados

Histogramas

==================================================================
medidas de resumo
tendncia central

tendencia central X Y Temp UR


media 4,67 4,3 18,89 44,29
moda 4 4 17,4 ; 19,6 27
pto medio 4 3,5 15,55 42,5
mediana 4 4 19,3 42

disperso X Y Temp UR
amplitude 8 7 31,1 85
Desvio padro 2,31 1,23 5,8 16,30
varincia 5,34 1,51 33,65 265,74
Coeficiente de var 49,51 % 26,31 % 124,24 % 349,13 %

Forma X Y Temp UR
Assimetria 0,036 0,416 -0,33 0,86
Curtose -1,173 1,395 0,123 0,422

Das könnte Ihnen auch gefallen