Sie sind auf Seite 1von 47

Normalização de Dados

Profa. Dra. Marilde Santos


Departamento de Computação – UFSCar

marilde@dc.ufscar.br
SGBD + Banco de Dados

• Independência de dados

• Consistência de dados

Novembro de 2003 Profa. Marilde Santos 2


Consistência de Dados
SGBDRegras de Integridade

• Validade

• Completeza

• Consistência

Novembro de 2003 Profa. Marilde Santos 3


Consistência de Dados
O controle de consistência pode ser exercido:

• Pelo gerenciador;

• Pelos aplicativos;

• Pela própria construção do sistema.

Novembro de 2003 Profa. Marilde Santos 4


Consistência de Dados
Pela própria construção do sistema.

• Controlar a construção do sistema através da


criação de tabelas segundo regras que garantam a
manutenção de certas propriedades.

• As tabelas que atendem a um determinado


conjunto de regras, diz-se estarem em uma
determinada forma normal.

Novembro de 2003 Profa. Marilde Santos 5


Formas Normais
Primeira Forma Normal
Uma relação está na 1a. forma normal quando todos
os seus atributos são atômicos e monovalorados.

?
Nome Idade DataNasc DataMatrícula

São atômicos?

Novembro de 2003 Profa. Marilde Santos 6


Formas Normais
Primeira Forma Normal
Uma relação está na 1a. forma normal quando todos
os seus atributos são atômicos e monovalorados.

Nome Idade DataNasc


! DataMatrícula

DataNasc e DataMatrícula serão atributos


atômicos se não forem utilizadas “partes” das
São atômicos?
datas em outras relações do Banco de Dados.

Novembro de 2003 Profa. Marilde Santos 7


Formas Normais
Primeira Forma Normal
Atributos multivalorados
1) Quando a quantidade de valores é pequena e
conhecida a priori;

Substitui-se o atributo multivalorado por um conjunto de


atributos de mesmo domínio, cada um representando a
ocorrência de um valor.

Novembro de 2003 Profa. Marilde Santos 8


Formas Normais
Primeira Forma Normal
Atributos multivalorados.
2) Quando a quantidade de valores é muito grande,
variável ou desconhecida.

Retira-se da relação o atributo multivalorado, e cria- se


uma nova relação que tem o mesmo conjunto de
atributos chave, mais o atributo multivalorado como
chave, porém tomado como monovalorado.

Novembro de 2003 Profa. Marilde Santos 9


Formas Normais
Primeira Forma Normal
Atributos multivalorados

Nome Idade DataNasc Telefone

Quantos números de telefone?

Novembro de 2003 Profa. Marilde Santos 10


Formas Normais
Primeira Forma Normal
Atributos multivalorados
Se forem 3 números

Nome Idade DataNasc Telefone

Nome Idade DataNasc fone1 fone2 fone3

Novembro de 2003 Profa. Marilde Santos 11


Formas Normais
Primeira Forma Normal
Atributos multivalorados
Se forem muitos números

Nome Idade DataNasc Telefone

Nome Idade DataNasc


Nome Telefone

Novembro de 2003 Profa. Marilde Santos 12


Formas Normais
Dependências Funcionais
Se o valor de um conjunto de atributos A
permite descobrir o valor de um outro
conjunto B, dizemos que A determina
funcionalmente B, ou que B depende de A, e
denotamos:

AB

Novembro de 2003 Profa. Marilde Santos 13


Formas Normais
Dependência Funcional Parcial
Se A for chave da relação e o valor de um
subconjunto de atributos de A permite
descobrir o valor de um outro conjunto B,
dizemos que B possui dependência
funcional parcial em relação a A.

Novembro de 2003 Profa. Marilde Santos 14


Formas Normais
Atributo Primo
Todo atributo que pertence a uma chave
candidata é denominado primo.

O que é mesmo chave candidata?

Novembro de 2003 Profa. Marilde Santos 15


Formas Normais
Segunda Forma Normal
Uma relação está na 2a. forma normal
quando:
 está na 1a. F.N. e;
 todos os seus atributos que não são primos,
não dependem parcialmente de qualquer
chave candidata da relação.

Novembro de 2003 Profa. Marilde Santos 16


Formas Normais
Segunda Forma Normal
Número Sigla Sala Número -
Horas

Número,Sigla  Sala, Número-Horas

Sigla  Número-Horas

Novembro de 2003 Profa. Marilde Santos 17


Formas Normais
Segunda Forma Normal
Número Sigla Sala Número -
Horas

Número Sigla Sala Sigla Número-Horas

Novembro de 2003 Profa. Marilde Santos 18


Formas Normais
Segunda Forma Normal
Evita:

• Inconsistências devido a duplicidade de


informações

• Perda de dados em operações de remoções /


alteração na relação

Novembro de 2003 Profa. Marilde Santos 19


Formas Normais
Segunda Forma Normal
Número Sigla Horário Número-Horas

1 DC122 10:00 2
2 DC122 14:00 2
1 DC189 8:00 3
2 DC189 15:00 4

1 DC134 16:00 2
Valores Número,Sigla  Sala, Número-Horas
Inconsistentes
Sigla  Número-Horas
Novembro de 2003 Profa. Marilde Santos 20
Formas Normais
Segunda Forma Normal
Número Sigla Horário Número-Horas

1 DC122 10:00 2
2 DC122 14:00 2
1 DC189 8:00 3
2 DC189 15:00 4

1 SeDC134 16:00
não houver 2
turmas de uma
determinada disciplina em um semestre,
perde-se a informação sobre o
Número de Horas!!!
Novembro de 2003 Profa. Marilde Santos 21
Formas Normais
Terceira Forma Normal
Uma relação está na 3a. Forma normal
quando:
 Está na 2a. F.N. E;
 Todos os seus atributos não primos são
dependentes não transitivos de uma chave
candidata.
Mas o que é
Dependência Funcional Transitiva?

Novembro de 2003 Profa. Marilde Santos 22


Formas Normais
Terceira Forma Normal
Mas o que é
Dependência Funcional Transitiva?

Seja a relação R(X, Y, A),


A é transitivamente dependente de X,
se existe Y tal que: X Y,
Y não determina X
YA
A XY

Novembro de 2003 Profa. Marilde Santos 23


Formas Normais
Terceira Forma Normal
Número Sigla Sala Prédio

Número, Sigla  Sala, Prédio

Sala  Prédio

Novembro de 2003 Profa. Marilde Santos 24


Formas Normais
Terceira Forma Normal
Número Sigla Sala Prédio

Número, Sigla  Sala Sala  Prédio

Número Sigla Sala Sala Prédio

Novembro de 2003 Profa. Marilde Santos 25


Formas Normais
Terceira Forma Normal
Evita:

• inconsistências devido a duplicidade de


informações

• perda de dados em operações de remoções /


alteração na relação

Novembro de 2003 Profa. Marilde Santos 26


Formas Normais
Terceira Forma Normal
Número Sigla Sala Prédio

1 DC102 3 E1
2 DC102 4 E1
1 DC104 12 C2
1 DC155 4 C2
2 DC155 12 C2

Número, Sigla  Sala, Prédio

Sala  Prédio Valores Inconsistentes!!!!!


Novembro de 2003 Profa. Marilde Santos 27
Formas Normais
Terceira Forma Normal
Número Sigla Sala Prédio

1 DC102 3 E1
2 DC102 4 E1
1 DC104 12 C2
1 DC155 4 C2
2 DC155 12 C2

Número,
Se Sigla 
não houver Sala,
aula emPrédio
uma determinada sala nesse
semestre perde-se a informação sobre qual prédio
Sala  Prédio contém a tal sala.
Novembro de 2003 Profa. Marilde Santos 28
Formas Normais
Terceira Forma Normal
Uma relação está na 3a. Forma normal quando:
 Está na 2a. F.N. e;
 Todos os seus atributos não primos são dependentes não
transitivos de uma chave candidata.

Em outras palavras, uma relação está na 3FN se:


 para toda dependência funcional X  A de R,
 X for superchave ou
 A for atributo primo

Novembro de 2003 Profa. Marilde Santos 29


Formas Normais
Forma Normal de Boyce-Codd
• Uma relação está na FNBC, se:

• Para toda dependência funcional X A de


R,
• X for superchave Não adianta A
ser primo!!!

Novembro de 2003 Profa. Marilde Santos 30


Formas Normais
Forma Normal de Boyce-Codd
Apostila
Id_Propried Disciplina
Nome_Região Lote Área

SO1
Pr1 SO
Central L23l 500
BD1 BD
Pr2 Central L14 500
BD1 BD
Pr3
ED1 Sul
ED L2 1000

Pr4
BD2 Sul
BD L54 1000

Pr5 Leste L400 800

Pr6 Norte L43l 1500

Pr7 Central L414 1500

Id_propried  Nome_região, Lote, Área


Nome_região, Lote  Id_propried, Área
Novembro de 2003 Área  Nome_região
Profa. Marilde Santos 31
Formas Normais
Forma Normal de Boyce-Codd
Apostila
Id_Propried Disciplina
Nome_Região Lote Área

SO1
Pr1 SO
Central L23l 500
BD1 BD
Pr2 Central L14 500
BD1 BD
Pr3
ED1 Sul
ED L2 1000

Pr4
BD2 Sul
BD L54 1000

Apostila
Id_Propried Lote
Disciplina Área
Área Nome_Região
SO1
Pr1 L23l SO 500
BD1 500 Central
BD
Pr2 L14 500
BD1 BD 1000 Sul
Pr3
ED1 L2 ED 1000
Novembro de 2003 Profa. Marilde Santos 32
Pr4
BD2 L54 BD 1000
Formas Normais
Dependências Funcionais Multivaloradas

O conceito baseia-se no fato de que, embora


não seja possível um conjunto de valores
determinar o valor de outro atributo, esse
conjunto consegue restringir os valores
possíveis para aquele atributo.

Novembro de 2003 Profa. Marilde Santos 33


Formas Normais
Dependências Funcionais Multivaloradas
Se um conjunto de atributos A restringe os
valores possíveis para os atributos de um
outro conjunto B, diz-se que A multi-
determina funcionalmente B, ou que B é
multi-dependendente de A, e denota-se:

AB

Novembro de 2003 Profa. Marilde Santos 34


Formas Normais
Dependências Funcionais Multivaloradas
Uma dependência multivalorada X  Y
especificada sobre a relação esquema R, onde X e
Y são subconjuntos de R, especifica a seguinte
restrição sobre qualquer r de R: se duas tuplas t1 e
t2 existem em r tal que t1[x] = t2[x], então duas
tuplas t3 e t4 deverão também existir em r com as
seguintes propriedades, onde Z=(R-(X  Z)):
• T3[X] = T4[X] = T1[X] = T2[X]
• T3[Y] = T1[Y] e T4[Y] = T2[Y]
• T3[Z] = T2[Z] e T4[Z] = T1[Z]

Novembro de 2003 Profa. Marilde Santos 35


Formas Normais
Dependências Funcionais Multivaloradas
Nome Matéria Orientando

Alzira BD Paulo
Alzira ES Sonia
Alzira BD Sonia

Alzira ES Paulo
Alzira BD Pedro
Alzira ES Pedro

Nome A Matéria t3[X] = t4[X] = t1[X] = t2[X];


t3[Y] = t1[Y] e t4[Y] = t2[Y];36
Nome A Orientando
Novembro de 2003 Profa. Marilde Santos
t3[Z] = t2[Z] e t4[Z] = t1[Z].
Formas Normais
Quarta Forma Normal
Uma relação está na quarta forma normal quando:
dado um conjunto completo de dependências
funcionais multivaloradas não triviais para essa
relação:
 Para todas as A  B,
DFM Trivial?!
 A é uma superchave da relação. O que é isso????

Novembro de 2003 Profa. Marilde Santos 37


Formas Normais
Quarta Forma Normal

A  B é uma DFM Trivial se:


B A ou AB=R

Novembro de 2003 Profa. Marilde Santos 38


Formas Normais
Quarta Forma Normal
Nome Matéria Orientando

Carlo SO Mario
s
Carlo SO Ana
s
Alzira BD Paulo

Alzira ES Paulo
Alzira BD Sonia
Alzira ES Sonia

Nome não é
Nome A Matéria
superchave.
Nome A
Novembro de 2003 Profa. Marilde Santos 39
Orientando
Formas Normais
Quarta Forma Normal
Nome Matéria Orientando

Carlos SO Mário
Carlos SO Ana
Alzira BD Paulo
Alzira BD Sonia

Alzira ES Paulo
Alzira ES Sonia
Sempre que dois conjuntos de atributos multivalorados
independentes ocorrerem na mesma relação, será necessário
repetir-se todos os valores de
Novembro de 2003
cada conjunto de atributos para
Profa. Marilde Santos 40
cada valor possível do outro conjunto.
Formas Normais
Quarta Forma Normal
Nome Matéria Orientando
Carlos SO Mário
Carlos SO Ana
Alzira BD Paulo
Alzira BD Sonia

Alzira ES Paulo
Alzira ES Sonia

Alzira BD Pedro
Novembro de 2003
Alzira ES Profa. Marilde Santos Pedro 41
Formas Normais
Quarta Forma Normal
Evita:
• Inconsistências devido à inclusão de uma nova
tupla que tem valores diferentes das diversas
ocorrências de um outro atributo multivalorado.
• Inconsistências em operações de remoção de
tuplas, sendo que o produto cartesiano dos
atributos multivalorados da relação possuem
diferentes valores de um dos atributos em
comparação com os valores de outro atributo.

Novembro de 2003 Profa. Marilde Santos 42


Formas Normais
Nome
Quarta Forma Normal
Matéria Orientando

Carlos SO Mário
Carlos SO Ana
Alzira BD Paulo
Alzira BD Sonia

Alzira ES Paulo

Alzira ES Sonia

Alzira BD Pedro

Alzira ES Pedro

Nome Orientando Nome Matéria

Novembro de 2003 Profa. Marilde Santos 43


Nome A Orientando Nome A Matéria
Formas Normais
Considerações Finais
Normalizar evita introduzir inconsistências quando

se alteram relações; porém obriga a execução de

custosas operações de junção para a consulta de

informações.

Novembro de 2003 Profa. Marilde Santos 44


Formas Normais
Considerações Finais
Mas, e aí?!
Normalizar ou não Normalizar?
Eis a questão!

A decisão deve ser tomada considerando-se o


compromisso entre se garantir a eliminação de
inconsistências na base, e eficiência de acesso.

Novembro de 2003 Profa. Marilde Santos 45


Formas Normais
Regras de Inferência para DFs
1.Reflexiva. Se X  Y, então X  Y
2.Aumentativa. Se X  Y, então XZ  YZ
3.Transitiva. Se X  Y e Y  Z, então X  Z
4.Decomposição/projeção. Se X  YZ, então
XYeXZ
5.União/aditiva. Se X  Y e X  Z, então
X  YZ
6.Pseudotransitiva. Se X  Y e WY  Z, então
WX  Z
Novembro de 2003 Profa. Marilde Santos 46
Formas Normais
Regras de Inferência (DFMs)
1.Reflexiva. Se X  Y, então X  Y
2.Aumentativa. Se X  Y, então XZ  YZ
3.Transitiva. Se X  Y e Y  Z, então X  Z
4.Complementação. Se X  Y, então X  ( R - (X 
Y) )
5.Aumentativa (DFM). Se X  Y e W  Z, então WX 
YZ
6.Transitiva (DFM). Se X  Y e Y  Z, então X  (Z -
Y)
7.Replicação. Se X  Y, então X  Y
8.Coalescência. Se X  Y, e  W com as seguintes
propriedades: a) WY
Novembro de 2003 Profa. é vazio;
Marilde Santos b)w  Z e c) Y  Z, 47

Das könnte Ihnen auch gefallen