Sie sind auf Seite 1von 18

1 ]

01sTR1eu1çAo oe
PROBABILIDADE
r rt rtr cn e 1,s a t
,,--
trtft
-.,
sr

1.1 INTRODUÇÃO

Na genética e no melhoramento de plantas , que são ciências que trabalham


efetivamente com predições, os conhecimentos sobre probabilidades são fundamentais.
Seja por exemplo, uma população F2 constituída por uma amostra de 20 plantas, semeada
em uma área experimental , sendo que destas 15 eram resistentes ao fungo causador da
antracnose do feijoeiro . Desse modo, a probabilidade (P) de se tomar uma planta ao acaso
e ela ser resistente será de:

P(R) = l.5 = 0.7 5


20

Assim , a probabilidade pode ser definida como o número de vezes que um determinado
evento ocorre, no exemplo o número plantas resistentes ao fungo, sobre o número total de
possibilidades, isto é , uma coleção ou grupo de possibilidades dos resultados desejados
dentro do espaço amostral .
Sabe-se que a resi stência a esse fungo é controlada por um gene (Co ), sendo o alelo
dominante (Co) re sponsável pela resistência e o recessivo (co) pela suscetibilidade. Baseado
na primeira Lei de Mendel , é esperado que na geração F2 ocorram 25% de plantas de
genótipo Co Co, 50% Coco e 25% de coco . Assim , entre as plantas resistentes observadas
é esperado que 5 sejam homozigóticas de constituição Co Co e 1O heterozigóticas de
constituição Coco. Observe também , que quando a planta tem o genótipo Co Co ela não
pode ser ao mesmo tempo Coco e vice-versa . Dizendo de outro modo, essas possibilidades
são mutuamente exclusivas. Do exposto, pode-se inferir que a probabilidade de se obter
uma planta resistente na população pode ser expressa do seguinte modo:
P (R) : P (Co Co) + P (Coco)

Depreende-se então que a probabilidade de ocorrência do evento é a soma das


probabilidades de suas formas mutuamente exclusivas, que é conhecida como "Lei da Soma

das Probabil idades" (Chase & Brown, 1992)


L'!D 1

Experimentação em Genética e Melhoramento de Plantas

Seja um outro exemplo envolvendo o cruzamento de duas cultivares de feijão: Carioca


{Flor branca e suscetível à antracnose) x Cornell 49-242 (Flor violeta e resistente à
antracnose) . A resistência à antracnose, como já dito, é devido a um gene. Da mesma
forma , a cor da flor é controlada por um gene, sendo o alelo V dominante responsável pela
cor violeta e o v pela cor branca. Desse modo, a cultivar Carioca tem o genótipo coco v v
e a Cornell 49-242 Co Co V V. Se fosse realizada a seguinte indagação: qual a probabilidade
de se obter uma planta em F que seja homozigótica resistente e com flores brancas?
2
Da genética sabe-se que a probabilidade de se obter o genótipo Co Co é de 1/4 e, do
mesmo modo, vv é também de 1/4. Assim , se o gene Co não é ligado com v, isto é, são
independentes, a probabilidade do genótipo Co Co v v será fornecida por: P {Co Co v v)
= P (Co Co) x P {v v) =1/4 x 1/4 =1/16. Neste caso, houve uma aplicação da lei do produto
de probabilidade , que pode ser enunciada do seguinte modo : se dois eventos são
independentes a probabilidade de que eles ocorram simultaneamente é igual ao produto
de probabilidade de cada um deles em separado.
Normalmente há inúmeras possibilidades de ocorrência dos eventos. Para facilitar 0
est udo dessas ocorrências são utilizadas as distribuições de probabilidades. Dependendo
do caráter a distribuição pode ser discreta ou contín ua. Neste cap ítulo serão discutidas
algumas dessas distribuições:

1.2 DISTRIBUIÇÃO BINOMIAL

. Essa distribuição
- discreta, como o próprio nome ind·ica, ocorre quando apenas dois
tipos de resultados
, sao possíveis , tais como·. flor b ranca ou am arela, Alelo B ou b; resistente
ou suscet1vel. Para exemplificar a aplicação , suponhamos o resultado do seguinte
retrocruzamento no feijoeiro:

F1 X
P1 (Carioca)
Genótipo: Co co
coco
Fenótipo: Resistente t Suscetível
Descendência
Genótipo 1/2 Coco
1/2 coco
Fenótipo Resistente
Suscetível
Imaginemos que do material obtido seJ·a
. m semeadas 1O se .
Algum as indagações poderiam ser feit U m entes em um a bandeJa
as. ma delas seria, por e . ..
d8 que na bandeja todas as 1o plant . . xemplo . qual a probab11ldade
as seJam resistentes?
Par<J respondGr a essa indagação, devemos usar a distribuição b1nom,aL E binomial
por4ue, corn o já mencionado, são apenas dois eventos . resiste nte ou suscetível No exemplo
tem -se todas as possíbilidades apresentadas na Tabela 1. Para encontrar a frequência de
cada uma dessas possíbilidade s, deve-se utilizar a expansão do binômio que é fornecida
n
pela expressão: (P + q )" = .L C~ p' qr, em que c
~=O
1

n
é combinatória de x plantas resiste ntes
numa amostra de tamanho n, p é a probabilidade de ocorréncia de planta res istente. e q a
1
de planta suscetível ; logo q = 1 - peno exemplo, p = q = 1/2, n é o número de eventos, n =
10; nesse caso, x é o número de vezes em que o evento favorável ocorre e y o número de
vezes de ocorréncia do evento desfavorável, sendo x + y = n . Ass im . na indagação feita , x =
10, Y = O, e então a frequência será C~~(½)1º (½)º =(½f º =}{0 24 (1 caso em 1024) As
demais frequências de cada um dos eventos são apresentadas na Tabela 1

Tabela 1. Frequência de distribui ção das 10 plantas provenien tes do retrocruzamento


(Coco x coco) , considerando os fe nólípos resistentes ou suscet ív eis ao fung o.
Fenótipos Freq. Esperada
Resistentes Suscetíveis P { x = x) = e~p· qv
X y
- -----
10 o 1/102~ = 0,000976
9 1 10/ 1024 = 0,009765
8 2 45/ 1024 = 0,043940
7 3 120/1024 = 0,1171 88
6 4 210/ 1024 = 0,205078
5 5 252/ 1024 = 0,246094
4 6 210/1024 = 0,205078
3 7 120/1024 = 0,117188
2 8 45/1024 = 0,043945
1 9 10/ 1024 = 0,009765
o 10 1/ 1024 = 0,000976

Total 1,0

Uma outra indagação que pode ser feita, por exemplo, é qual a probabilidade de termos

1 t
1 menos 4 panas
peo resl·stentes · Nesse caso , interessam as seguintes opções: 1 0R:0S;
gR: 1S; BR:2s; ?R:3 s; 6R:4S; 5R:5S; 4R:6S. A probabilidade é, então, estimada, considerando-
se P(X 2'. 4 ,0) = P (X =10)+P(X =9)+ P(X =8)+P(X =7)+P(X = 6)+P (X = 5}+P (X = 4 ) .
Escrevend o de ou t ro m ºdo , tem-se : 1- P(X <4)=1 -[P(X=3)+P(X=2)+P(X=1)+P(X=o)] .
. , de cálculo a segunda opção é a preferida , então , utilizando-se
Devido ao menor numero ,

os dados da Tabela 1, tem-se:

13
p l X ::: 3) = O.11 7188

p (X= 2 )= 0,043945

p (X= 1)::: 0,009765

p ( X = O)= O,000976

Assim, P (X 2'. 4,0)= 1-0 ,171 871872=0,8281 ou82,81% .

Resta comentar que em uma distribuição binomial a média (m) é fornecida por n.p e a
2
variância (a 2) por np(1- p) . No exemplo , m = 10 · ½ = 5,0ecr = 10 }~· (½)= 2,5 . Pa ra

comprovar, vamos estimar a média e a variância dos dados da distribuição de


11
5120
• n
frequência apresentados na Tabela 1. VeJaque m=I x,P(X = xJ =I(x)
" /
If, = - - =5,0
1024
e a'=[t,r,x~-(t,r.x,)'/t,1 ]/t,1=2,5 'ªº 'ªº 'ªº

1.3 DISTRIBUIÇÃO MULTINOMIAL

Nesta situação, são considerados todos aqueles casos em que estão envolvidas mais
de duas opções. Seja, por exemplo o cruzamento-teste representado a seguir:
Coco V v COCO V V

Resistente à Antracnose Suscetível à Antracnose


flor violeta flor branca

Se as sementes obtidas forem semeadas em linhas, com 1O sementes por linha,


poderia se indagar, por exemplo, qual a probabilidade de se obter em uma linha, a seguinte
combinação: 2 plantas resistentes violeta (x), 4 plantas resistentes brancas (y), 3 plantas
suscetíveis violeta (z) e 1 planta suscetível branca (w) . Da genética , sabemos que no
cruzamento-teste, não estando os genes ligados, a freqüência esperada de cada um desses
4 fenótipos é a mesma e igual a 1/4. Tem-se, então, p = q = r = s = 1/4. E como são 4 casos,

tem-se:
n!
P(X = x; Z = z; Y = y ; W = w) = -- -- pxqzr ysw
x! z! y! w!

No exemplo com p = q = r = s= ¼ e x=2; z=3; y=4 e w=1 , tem-se :

,01
P (2RV + 4RB + 3SV + 1SB)= . (¼)1°=00120ou 1,2%
1
4! 3! 2! 1!
se forem 8 plantas, em vez de 1O, a probabilidade de dar exatamente a freqüência
esperada de 1/4, isto é, dois de cada tipo: x = y = z =w =2, é:

14
'
81 8

1 P(2RV+2RB+2SV + 2SB)= . (¼) ou 3,85%


2! 2! 2! 2!
1
1 Como se observa, a probabilidade de ocorrer exatamente o esperado é baixa, mesmo
considerando uma população tão pequena, com apenas 8 indivíduos.

1.4 DISTRIBUIÇÃO NORMAL

A distribuição normal é a mais importante distribuição de uma variável aleatória


contínua, tendo grande aplicação em pesquisa científica e tecnológica. Muitas inferências
são realizadas, pressupondo que o caráter ou caracteres considerados possuam distribuição
normal.

1.4.1 Propriedades da Distribuição Normal

a) é simétrica em relação ao ponto médio (m);


b) tem forma campanular - sino;
c) fica perfeitamente definida se conhecermos a média (m) e o desvio padrão (cr) dos
dados, isto é, com esses dois parâmetros, podemos estimar a altura da curva em
qualquer ponto do eixo horizontal;
d) tem dois pontos de inflexão correspondentes às abcissas m ±cr;
e) a área compreendida pela curva e o eixo x é igual a 1 ou 100% . Isto é ,
I ~: f ( x) dx = 1,O.
Para facilitar a utilização das propriedades da distribuição normal e torná-la comparável
em qualquer situação, independente do caracter, é empregada a distribuição normal reduzida
ou padronizada, que é uma distribuição com média zero (m = O) e variância igual à unidade
(cr2 =to). A padronização é realizada promovendo-se a transformação de variável Z pela
expressão z = x - m. Em se tratando de populações naturais, não é possível ter o parâmetro
cr
populacional e sim a estimativa dos mesmos. Desse modo , o "cr" é substituído por "s".
Utilizando essa distribui ção norm al padronizada, pode-se estimar facilmente a
probabilidade de ocorrência de determinados eventos. Seja, por exemplo, uma plantação
de feijão, cujos dados da produção de grãos se aj ustam a um a curva norm al com média de
10,2 g/planta e s = 1,2 g . Nessa situação, a seguinte indagação poderia ser feita: qual a
probabilidade de se obter uma planta com mais de 12 g/planta? Essa indagação pode ser
esquematicamente representada em uma distribuição normal (Fig ura 1). O que se deseja é
obter a área correspondente à parte hachurada no esquema apresentado. Essa área

corresponderá à probabilidade (P) de ocorrer o evento desejado. Como comentado nas

15
f.:- X per1lllef1(;-1ç 1.:10 orn Gt , IC, l CJ M\ l li l< ~~
., lf 1ót· r•:·1 ~,1~~
• 1~
l o~d~c'.!l
• -"2'/1
}~-11~1t~a
·· ~:..
------- ---------
- ualquer valor 1gua1 Ou
~ p,o d
proprn~c.fades d~i clisl11b111çc10 11orrnal.
IJ ' bfaJ
1 cJclú de ~e obter q
, nálogo, qualquer valor
.
superior ô rnúoin , 1slo e-,, P (x · 10, 2), e de O,S ou J º ·
r::o°lr De ,nodo ª
a indagação é de P (x l
. . . . . , - O r.. Contudo. no exemp1o,
igual ou inferior n modr8 ti-11111Jcm e de P - ,;J ai ent re 10,2 e 12,0g e
. dida na curva norm .-
12,0g). Portanto, cstin18nrlo ..-1 orea conipreen se valor, deve-se utrl1zar a

subtraindo de 0.5, obtém-se P (x ~ 12,0 g ·


. ) Para se obter es
. orno já visto, obtendo-se a
. ,d ·zação é obtrda, e
distribuição normal padronizada . A pa roni 12.0 - 10,2 = 1,5 . A tabela lA
- . z- _
X - m Entao, - - 12
, z-
variável transformada Z pela expressao. - s · que corresponde à
.. de Z estar entre O e , , 1 5
do apêndice fornece o valor da probabrl, d ade tado No exemplo , essa

probabilidade de x estar entre 10,2 e 12 g ,


como
·º já comen .
superior a 12,0 g sera P
.

probabilidade é de P = 0,4332. Portanto, a Probabilidade de x ser

(z > 1,5) = 0,50 - 0,4332 = 0,0668 ou 6,68 %.

m=10,2 g x = 12,0g

. . .
i ão normal representando uma população de plantas de feijã~,- cuja
:•i~:ª(~)-d~;:~iiç1o de grãos por planta é de 10,2 g e deseja-se estimar a probab1l1dade
de se obter plantas com mais de 12,0 g .

1.4.2 Avaliação da Normalidade dos Dados

A normalidade dos dados experimentais é fundamental nas inferências a serem

rea lizadas , como já mencionado. Por essa razão, é muito importante verificar se os dados

obtidos em um determinado experimento se ajustam ou não à distribuição norm al . Há alguns

procedimentos para se verificar esse ajustamento, e o mais simples deles é a análise gráfica.

Para mostrar a sua aplicação, serão utilizados dados de produtividade m édia de espigas de
milho (tlha) de 28 cultivares obtidas por Ferreira et ai. (1995), (Tabela 2).
Tabela 2. Produt,vicJade média de espiga (t/ha) de 28 cultivares de milho
- ·-::. : .;: - --::....;: --. ____ _ _::::::-- -
Variedades t/ha Variedades t/ha
----
CMS - 01 5,58 CMS - 126 5 80
CMS - 02 5,66 CMS - 28 5.79
CMS - 03 6,53 CMS - 29 8 05
CMS - 04 N 7,84 CMS - 30 7, 19
CMS - 04 C 7,85 BR - 136 6 08
SR - 105 8,18 CMS - 39 8,36
BR - 106 7,44 CMS - 50 6,96
BR - 107 5,70 Sint. - Elite 7,44
BR - 111 7,18 PH - 4 4,95
BR - 112 6,11 Cunha 7,61
CMS - 14 C 5,27 BA Ili - Tuson 3,37
CMS - 15 7,04 Saracura 8,61
CMS - 22 6, 15 NitroFlint 6,08
CMS -23 6, 18 Nitrodent 7,55
Fonte: Ferreira et ai. (1995 ).

Para real izar essa análise gráfica, deve-se construir um histograma de distribuição
de frequência , que envolve os seguintes passos:

1) Determinar o número de classes. A escolha do número de classes nem sempre é


uma tarefa muito fácil. A vivência do pesquisador com o caráter em estudo vale

muito. Existem alguns critérios que podem ser usados, entre eles : i) Critério baseado

no tamanho da amostra (n). Se n é até 100, o número de classes (k) é igual a ✓n ;

quando n é maior que 100, usa-se k = 510910 11 . Em ambos os casos , como k pode

ser um número com decimais, adota-se o inteiro mais próximo ; ii) Critério baseado

em normalidade dos dados amostrais (Scott, 1979). Partindo da suposição que os

dados possuem distribuição normal , o número de classes será determinado

Aefn
pela expressão: k =1 + ,4 s , em que A é a amplitude total e s o desvio padrão.
3 9

Com os dado s da Tabela 2 , e usando esse segundo c ritério , tem - se

A = 8,61-3,37 = 5,24, n = 28 e s - 1,2047 , então k =4,8~5,0 ;

2) EstimEtr a amplitude de classe (c). Esse valor corresponde à diferença entre os


limites superior e inferior de uma determinada classe, e é estimado pela expressão :

e -- -P, Lo go e = ~ 24 = 1. 31
v- 1 5 1

17
~ xperimentação em Genética e Melhoramento de Plantas
,~
i

O limite inferior (LI) da primeira classe será obtido por.

LI , = menor valor - ½ ª 3.37 - 1·3½ ª 2,72 ; vai

. . , . _ ,) s ornar a0
seguinte. or dCJ ·1
3) Determinação das classes. O procedimento e O m plitude de classe 1
. . xernplo), a a ,
l1m1te inferior da primeira classe (2,72 no nosso e _ . ii) Repete-se
1 31 - 4 ' 03 ' 0
obtendo-se o limite superior. Neste caso, 2 ,72 + ' . r será o limite inferior
1 sse anteno
processo, lembrando que o limite superior da eª . _ e tem-se os dois
. ude de vanaçao, .
da seguinte. Soma-se a esse valor, a ampl,t + 31 = 5,34) , e ass,rn
. como valor: ( 4 ,03 1'
limites . A segunda classe, no exemplo, teria observado. A Tabela 3
I
O '!timo va or
por diante, até que uma das e1asses envolva u de espiga de m,·1ho , e a
• . dos dªdos do peso
mostra a distribuição de frequenc,a

Figura 2, o histograma obtido. .

. . da produt,vi .
. 'dade média de espigas das cultivares de milho
Tabela 3. Distribuição de frequencia
avaliadas em Sete Lagoas, M.G. , 1993 -

N.Q. da classe Limite da classe Frequência

1 [2 ,72 - 4,03) 1
2 [4,03- 5,34) 2
3 [5,34 - 6,65) 11
4 [6,65 - 7,96) 10
5 [7,96 9,27) 4

45 -
. 11
40
10

-~
u 30 -
e
~ 25
cr
(1)
U:: 20

15 4
10 .
2
5 1

o 1
2 72 4 03 5 34 6,65
.
7 ,96 9 ,2 7
1
1/ha
Frg,,re 2 Jrstr,grama dos dados da produtividade média de es a (t/h · - ·
~•1,õ.l.;:cJa·,prAF8rre1raf::f al ( 1995) - · P9
I a)dascult1va1esde m 1lho
J

------
Distrrbuiçáo de Probahd 1Jade

Nesse e xem plo , apesar do tamanho reduzido da amostra (n = 28) o histograma

apresenta-se razoavelmente simétrico. Esse fato é indicativo ua priori" de que as observações

se ajuSl am à distribuição norm al. Contudo , essa anál is e é muito su bj etiva , e para

comprovação é importante utilizar- se de procedimentos q ue poss1b1litem maior segurança

na decisão do ajustamento ou não. Há, na literat ura , alguns procedimentos, sendo que

alguns deles serão comentados a seguir:

2
a) EMPREGO DO TESTE DE X . Dispondo de uma distri buição de frequência dos
2
dados , como a apresentada na Tabela 3, para a aplicação do teste de X , são

necessárias as seguintes etapas:

i. Utilizar as propriedades de uma distribuição norm al esta ndard izada ou


pad ron izada e esti mar a frequência esperada de c ada c lass e . Deve-se

esti ma r dois valores de Z es tandardizado , um para o lim ite inferio r (Z,) e o


outro p ara o lim ite s u perior (Z 5 ) , pela e x pre ssão j á com en ta d a

anteriormente , isto é , z = x - m . Com o no exemplo a m édia dos dados é m =


s
6,66 e o desvio padrão é s = 1,20, tem -se então p ara a p rimeira classe:
2, 72 - 6,66 . 4,03 - 6,66 , .
Z, = , =- 3,28,Z2 = , =- 2,19 . De modo analogo, obtem-se: Z 3 =
1 20 120

- 1,11 ; z~ = -0,01 ; z5= 1,08 e z6= 2,18.


ii. Estimar a probabilidade associada a cada limite dos intervalos de classe. Para

isso, é utilizada a Tabela 1A (Apêndice). Na distribuição estandardizada, pelo

que foi visto no item anterior para a primeira classe, isto é, P(2,72 ::; x < 4,03),isso

corresponde à área ocupada entre -3,28 e -2, '19, ou seJa, o mesmo que a área

ocupada entre -3,28 e -2, 19 desvios padrões abaixo da média e simbolizada

por p / - 3,28 ~ Z < 2, 19) . Na Tabela 1A de Z, -3,28 corresponde a 0,4995 e -

2,19 a 0,4857. Desse modo, P ( - 3,28 ::; Z <- 2,19) = 0,4995 - 0,4857 = 0,0138.

Isso indica que se os dados apresentarem um ajuste períeito na distribuição

normal , 1.38% dos dados de produ ti vidade devem assumir os valores va riando

de 2 72 a 4 ,03 Uha De modo idêntico, obtém -se:

p / 4 03 ::' x ---5,34) - P ( 2J 9 < Z < - 1,11) O, 4857 - O,3665 -- O, 1192

P(5,34 ,,,;< 665) - P/ - 1,11 < Z ,,, -0,01) 0,3665 0,004 - 0,3625

P (6G5 1 -- 796 ) P( 0 01 ' Z / 1.08) 0004 + 0,3599 0,3639

19
'\ 1.l
Veia quP ness,) ull1ma s1tuaç~1J 1 ;-:1íf.a c::::1'•.:.•c::1,::1..1,1 ~- ._, ·,., . '_,,;.
r.
·t - a· nEü1J -\d't . ._
! • ) ' 1 J •'
.i •. _ , , 1 '-' 1
esquerda (negativo) e à direita \P:J~ I ,vL' ·d '

O004 + 0,3599 = 0,3639

de 1 .,- · d~ t':-,l 111Jl·v,,


Como em uma distribuição normal os valores vanan' -' '
referentes aos extremos da curva devem ser obtidas . isto e. para o extr~mo 111ft fH•
enar P I X ' 9 271 PI Z ~ 1G1
P (X < 2,72 ) = P( Z < - 3,28 )= 0,5- 0.4995 == 0,0005 e para o su P
alizados na Figura 3.
0,5 - 0,4854 = 0,0146. Esses valores podem ser me Ih or visu

O,OY%1

'--~
2,7 ..\ ,O 5J b '1 7q q 27
Figu ra 3. Frequência média esperada, em porcentagem do numero de 1nd1v1duos da amostra,
considerando que os dados da produtividade média de espiga de milho tem perfeito a1ustamento
à distribuição normal.

iii. Estimar a frequência esperada a partir do produto de probabilidade associado


com cada classe , isto é, obtido multiplicando-se a área ocupada por classe
pelo número de individuo da amostra no exemplo n = 28 (Tabela 4 ).

Tabela 4. Frequência observada e esperada da produtividade méd12 de espigas das cultivares de milho.

Limites de classe Frequência Probabilidade Frequência esperada=


obsservada (FeO)

J
esperada(P) FeE = n P
[-w; 2.72) o O0005
O 014
= 0.4004
[2,72; 4,03) 1 0,0138 0,3+864
[4.03; 5,34) 2 0,1192 3 3376
[5,34 ; 6,65) 11 0,3625 10,1500
[6 ,65 , 7,96) 10 0,3639 10,1892
l7.96 : 9,27) 4 O 1255
3 5140]
+ = 3,9228
[9 27 : + () o 0,01 46 0,4088

j - •
iv. Esti rnar o valor da estatística de qu1-qu2dra,jo cat,:,Liiadc 1:

, ~ (FeO, FeE t
Zc - L. FeE -

No exemplo em pauta, tem-se:

1
x~ =- ( - o,4oo 4 )2 +( 2 - 3,3376 )2 (11 - 10,1si
2
111 - 101892)2 14 3 514 )'
º• ºº
4 4
3,3376 + 10,15 + 10,1892 T 3 514
1 985
= '

O valor de q ui-quadrado tabelado (X~ ) é obtido com o nível de s1gnif1cânc1a deseJado


(e,.) e k - 1 graus de liberdade , em que k refere-se ao número de cl asses. Na Tabela 4A do
nd
apê ice , obtém-se : X.~u=o.os: 4GL) = 9,488 . Como esse valor é superior ao do X. , . infere-se

que os dados se aj ustam à distribuição normal com 5% de significância

É oportuno salientar que uma desvantagem desse procedi mento é que o valor de
2
X calculado é muito influenciado pelo número de classes empregadas. Com o aumento ou

diminuição do número de classes , os valores de x: e, conseq uentemente, a significância,

alteram consideravelmente , inclusive , em algumas situações. pode-se 1nfenr erroneamente

sobre a normalidade dos dados . Normalmente, quando a frequência esperada de um a

dada classe é inferior a 5, esse valor pode inflacionar o valor do X~ calculado, alterando a

interpretação dos resultados . Para atenuar esse problema , sugere-se adicionar essas

classes às subsequentes .

b) PROCEDI M ENTO DE Johnson & W ichern (1988) - Um segundo procedim ento para

testar a normalidade dos dados foi apresentado por Johnson & Wichern ( 1988), e

fun dam e nta-se no seguinte : sabe-se que 68 ,3% das observações dentro de um a

di stribuição normal se encontram no intervalo de [m - s,rn + s] ,e 95.4% no intervalo

[ m - 2s, m + 2s] .

Defi nindo f\ como a proporção estimada na amostra de tamanho n de elementos

pertencentes ao intervalo [ 111 ± s] , e p2 ao intervalo [m ± 2s] , os seguintes critérios podem

ser utilizados para se avaliar os desvios da normalidade dos dados.

, 1 (0,683)(0,317) - 1,396
(l) p 1 - 0,683 > 3 n - ✓ n
1

(0,954)( 0,046) 0,628


(2) \ F\ 0,954\ >3 n .fn

11
~ ., li r·a-~fi~lC'.!_ll~lu:>._
\· ,;pt,1 11ll l'íll:1ç,r\() CrTI f.:,enétlc.d e IV(; 101 e
~P~la~n~t.:a:.::i .---- - -- - - - - -- -----
· d~P.~,
---- - - ··
,
f ') 4E 7 86, e O
- -"u""',-:v lm ·
No exemplo o prnneiro líl
ter volo !m- 5 ] 8 L .,_
~1r - ? e cc · ,:.nu,
,
~i:;~ .., , .:. : ,

de elementos do pnmtIro intervci, J e - , v v::J ... ,_


\ 12G, qut5) . Sendo assim, o numero den:ro dos -ritE:né.,··
. d ocor rência dos valores li,
·n Desse modo, ;:is probabilidades e
r.nns1dcrtldos serão·

21 . 27

P O75 e P2 = - = O964
. - --
1 ' 28
28

Tem -se para O primeiro critério.

395 = 0,067 > 0,264 (falso)


lo'750 o'683\ > 1.✓28
e para o segundo:

0,964 0,954\ ,, 628 º· ~ 0,01 > 0,119 (falso)


1
fiã
critérios foram falsos , isto é, o desvio da
Como se observa em am b os os c ª SOS , Os
. d m que esses dados se ajustam a
norm alidade foi menor que o esperado, confirman o, ass I ,

uma distribuição normal.

c) MÉTODO DO "Q _o plols". Esta metodologia também foi apres entada por Johnson

& Wichern (1988). Os passos para sua apl1caçao sao os seguintes :

1. Ordenar os dados em ord em crescente x . x,_ x . x, x r.,


ii . Estabelecer o nível de probab11tdad e de ocorrência de cada observação U)

pela expressão: U- ½)I n , em que ,: 2 representa uma correção de con tinuidade,


por conveniência analítica.
iii. Estimar o valor de Z, num a d1stnbu1ção normal padronizada , cuJa área sob a

curva abaixo do mesmo corresponde a [.rf.. Z) Esse valor pode ser obtido da

Tabela 1A (apêndice ). do segu inte modo . seJa , por exemplo, o décimo

val or,(j = 10) numa amostra de tamanho 100. Assim (10 - Yz)l 100 = 0,095
representa a área sob a curva normal entre - -.r.. e o valor de Z 10
. Para determinar

o valor de ZP0 ,, é preciso lembrar que a distribuição normal é simétrica em relação

à média e a probabilidade de ocorrência de qualquer valor abaixo ou acima da


média é de 50% . Desse modo, a probabilidade abaixo de Z(10\ é de 9 ' 5°/1(0 ' portanto '

até a média a área sob a curva será de 40.5%. O valor de z correspondente


0.405 é igual a 1,31 , e deve ser tornado neaatIvo
~ '
pois Z ( 101 está situado abaixo
da média corno ilustra a Figura 4
1( 11;~)'11;1/)111 ) ·,r, r:1'1•J'j',( ,(: '1(11) !~' ,1( , ' •' / •/ / ',Jit l 1

; ;, , ;:,iJJ' ,'1 ,,,!',,r 1{1J( .1r, ,; , ,11·; p·,,1 1)11r,1111;r .r,k:

'; :; JJ!J: , 1 1r~;1(!j' 1/J ' / 1 r: r:r,r:fl JJj',: , :; 1:tJ J(; l' J'1J' l <,r: : 1 Jr:1Jr1J' 1rq'I', í : Jí: , 1 ' 1fJí~IJ(11j' h(l~J

/' , ' , ' 1f 1' 1 /J ! 1( t, ',/ t(1 f1,r1', 1, JJ !; jtJ', 1/)( 1 1: 1 11 111 , 1 )'11Jíí lf1 ,,,1 l' ! l) JJ(1 I J (1f/ 1111q111·:,r1
,, ,.
,; ' .l,f,r:r, ,,,,,, ,,,l!'J IJJl:j' ,f1 íi: 1,r, '1j1 H,1 nr:f,1r t1 (j '; :1 '; ' l) jl ) C1 1ir;-'-1 rq:,1Jr1' 1 ,: ) f; l}Jl l', ºJ /1

.i1;I JH1f, ' .';f1 1:1•,1J111,1r,1 r:1111 ,r , IJJ 1: r1111 f,r,·, , ,r:11 1,q1J1i t l JJJ ' J' ;fJfJ r1r,:. <J :,nh
,,,; 1 i ; I l ;' .' ,! 1 1,, , j =1 ' ,p1:,1JJ f' 1/ 1: 1 'Jl, 1 ' ,11)1:t 1J1t1·1 ·,r:r, 1,r:11r: 111: 1, r: t ; r:r11 1r1plJl)'J /()j r1fllJI) 'r) V~ ' ' Jl·/C)Pr ! 1

' 1j'1' 1 · , ,, ·: ,rl ,tf,111 ,'1 ',I; 1:r ,1:1d1 •r,r· 'í l'· ·I 1,r :11 , , 1:1111 11(11,q, 11 11,1 J1:1i1 11r1' J 11•:·.r, 'l!IJd ' r,111: ,J()()') 11 1u q

'1 1,, ,r:~111'.' // , ,·:, f J ,·.t1 /


1 1 Ili /\j 1,:1 111r1·1 1:111 ,1' 1 1111r•111,rf1 11,,·, IJjíJd r,11r :1·11H 1f1IA" :) up1j íl' :'; -J

f J'1lflt l' 1 / '.' 111JwJ: ,J' , ',lf 1 •,1,r ,1:rI l''1I JJ/IJl 1f1J /1/ l',Jlj'1I II (1p1 r,11l 1 I) 11rir,11,,111 1,·,•,1 ,p 1111di1i1W !I\ V

P'IIIJcJII

,,,/,rr,,11 11 •,1r, ,: 1:1',,,r,. ,,., ,,q 11111 11, ·' " ''/ 1111,· , •., ., , ,, 111r1•,1 , , 11, 11 11 ,,/ 111 , 11,,· 111 11 11 , 11 ,11111 , :

, ,r1t, 'hf ,' 1111111 ·,111111 1 , •,1 ,11,tl 1,r,11 Jf',1,111 1; 111111, ,· , '1111111 :·, q,111 ·,,111q1,,d 11•,1111!1 '''l 1q11 1
i: 11u , 1: , ,,,,:', 1 1' : ,, ,11 1 ,,1 1i,111t •1' ,11/1 : 11 f,1 1•111/,1 1J 1,·11p; d l ,,11 11 ,11 1111 ,11,, 1,p,1rl 11:1 ,1111, ,· )
,1,
1:11,1 1:111111 1:11111 11• 11 1J 1 ,1 ,. , ,1; 11 ,1,1u ,1 , , •,11111 1111,1•1111111 °,1111,11111 1111111 u u 111·, 1 , , / 1111

' ;L 1J11 /l :f 1
;/ 1 1111 /IJ 1 ,11 1,r ; ,,fr,l jl /j'l/f, I' 11 11/j'HI1, , 11'1 ('11/) •11 1i,1111 :,r, 11• ; l ljtl lllf 1111111111 Ili X li

1;';}~r 1l fl ' ,,,, ''•; , ,, , 1 ,J7J/Jjl // ,., ,,, 1,r 111 1,d~111,1 ,·1 1, ',,,,11d 1) ' '" í,,, 11111111p11,111, 1p ',' 111111
,, H/L1't'1J •1,, .,,,1,rr1, t,,,1, ,,·1, 1i; 11; ,, ,,1,,,ri11,t11.J1d11 ') ll'' ' •, 1 1111,11 11 , 111 '"x ,,11 111 ,1111, 111
,,,
' .1 , ,r,,l•,1t,1,,, , , .,, ,, 1 ,,1, •-111 11 ,11 11 ·,,, 11i-11,1· ,q11111111p11t1 1 1111 11 •,,,,11 1,11n 1111 1 11,,·,~,11 "I

111111111 Lljl 1111f11th111111 111 ti ! Jltd

f1lf ':l 1jlll 1JHJ111 ( t 1l 1/l/ l ,li 7jlf1 t, 1 1 11 11 11/ / lljl t11 rJl/fll/\ 411 !lf1IJPll) tH-H1li!H 1/\/il ' I ''l•llflll ''N

t•pli/ 11 li Ili 1( 1,I fl Ili 11111t lllJ ''illql 'lt111 11,p li 1


, i, , 1 '/ 11 1, ' 1/Jlt l jif ,1 11 ,111/
1 1
' 'I' l '/' tlllj)lti 11r 1/fl 1
llj 1llj11jllll,.llj 11d ll P lft1111 l1 r1lil1 I II IIHlll1, 1 I Jd-!III III I
Ili

t. 11II 11 11 f , ll
' 11I li

I l I ·' J :, •I 'JI 1 1 t, f
Experimentação
~)"'
ern Genét1c M
a e elhoramento de Plantas
Tabela 5. Valores de. (" , )
J' J - ½ / n , zUl e xIJ) para os dados do peso da espiga em Uha. ------

--- 1
j

2
(j -½)!n
0,0179
Zm
-2,1002
Xol

3,370~
-:::,..._
~ ·-,

0,0536 -1,6112 4,9500


3
0,0893 -1,3452 5,2700
4
0,1250 -1,1503 5,5800
5
O, 1607 -0,9915 5,6600
6
0,1964 -0,8544 5,7000
7 5,7900
0,2321 -0,7318
8 0,2679 5,8000
-0,6193
9
0,3036 -0,5142 6,0800
10 0,3393 -0,4144 6,0800
11 0,3750 -0,3186 6,1100
12 0,4107 -0,2257 6,1500
13 0,4464 -0,1347 6, 1800
14 0.4821 -0,0448 6,5300
15 0,5179 0,0448 6,9600
16 0,5536 O,1347 7,0400
17 0,5893 0,2257 7,1800
18 0,6250 0.3 186 7,1900
19 0,6607 0,4144 7,4400
20 0,6964 0,5142 7,4400
21 0,7321 O6193 7,5500
22 0,7679 0,7318 7,6100
23 0,8036 0,8544
24 7,8400
0,8393 0,9915
25 7,8500
0,8750
1,1503
26 8,0500
0,9107
1,3452
27 0,9464 8,1800
1,611 2
28 0,9821 8,3600
- 2, 1002
8,6100
9


8 • •
• •
••
••
7 ••••

• ••••
-2,4 -1 ,8 00 0,6 1,2 1,8 2,4

• 5


3
Figura 5. "Q - O plot" para os dados da produtividade média de espigas das cultivares de milho
avaliadas em Sete Lagoas, MG, em 1993.

Para a estimação deste coeficiente de correlação, a seguinte expressão é empregada:

Jt (x(JJ - x) (z(Jl-z)
10 = --;:::============
Jt(x(J) -xr. JJz(J) -zr
O valor derO deve ser testado utilizando os dados da Tabela 6, no nível de significância
desejado. No exemplo, obteve-se rO = 0,9772. Consultando a Tabe la 6 , com tamanho da
amostra igual a 28, encontra-se após a devida interpolação, o valor de 0,9616. Como r 0

estimado foi maior que o tabelado , aceita-se a hipótese de que os dados do peso das
espigas de milho com 5% de probabilidade sigam a distribuição normal .
-------
-Expenmentacão
. em Genética e Melhoramento de Plantas ---------... 1

Tabela 6. Valores cnttcos


.. para o teste de normalidade do coef ,c,ente de corre=-==
lação
. ~-~---..,.
o---O-plot
-

=---
Tamanho da amostra
0,01
Nível a de signíficáncla
o.os o,10
0.935
~
.._____
\

10
0,880 0,91 8
15 O 95 1
0,91 1 0,938
20 O 960
0,929 0,950
25 0 ,966
0,941 0,958
30 0 ,97 1
0,949 0,964
0 ,977
40 0,960 0,972
0 ,981
50 0,966 0,976
0 ,984
60 0,971 0,980
0 ,987
75 0,976 0,984
0 ,989
100 0,981 0,986
0,991 0 ,992
150 0,987
0,993 0 ,994
200 0,990
F o n te.. Johnson & Wichem (1988 ).
Distribuiçao de Probabilidade

EXERCÍCIOS PROPOSTOS

1. No milho, o alelo dominante Su é responsável por semente lisa e o su, por enrugada.
Uma planta de genótipo Su su foi autofecundada e produziu 40 sementes. Qual a
probabilidade de que nessa espiga ocorra a segregação fenotípica exatamente como
esperado pela Primeira Lei de Mendel?

2. Em alface, o alelo C condiciona folha crespa, e o recessivo , c, folha lisa. A planta de


genótipo Cc foi cruzada com uma de genótipo cc, obtendo-se 20 sementes.
a) Qual a probabilidade de ocorrer exatamente o esperado nesse cruzamento-teste?
b) Qual a probabilidade de todos os indivíduos apresentarem folha crespa ou lisa?
c) Se forem obtidos 200 indivíduos, em vez de 20, a probabilidade do item a seria
maior ou menor? Qual a implicação desse fato?

3. No tomateiro, o hipocótilo pode ser roxo devido ao alelo dominante R , ou verde devido
ao alelo recessivo r. A folha pode ser recortada devido ao alelo C , ou lisa (tipo batata)
devido ao alelo c. Uma planta heterozigótica foi autofecundada sendo tomada uma
amostra de 16 sementes. Pergunta-se:

a) Qual a probabilidade de que todas as plantas sejam novamente de hipocótilo roxo

e folha recortada?
b) Qual a probabilidade que ocorra a segregação 9 roxa recorta da: 3 roxa lisa: 3

verde recortad a: 1 verd e lisa?

4. Utilizando os procedimentos que foram apresentados neste capítu lo, verifique se os

dados da altura das plantas obtidos por Castro 1992, de 100 progênies de Eucaliptus

camaldulensís, aos 17 meses de idade, (Tabela 7) se ajustam à distribuição normal.

Q ual a importância de se conhecer esse fato?


-- , -- , · •· - , : ·, .. -• '.•,- ·., _, ,·ente de Planlas )
- - . ~ I
, ~ -~ • .. ,
),.~ .,..\.' ' _ . -., -,.. -- -• - ·-'~ - ~ 1·::irnit
- -.: ...... "'· . 1,,--:., de meros-irmãos de Euca/fptus carna/Ou/ . 1·

>,· -~ ,- • • ·,
"''
, - •
'- ' '
• \ ......,
., "' '\. .,.
'>, _::: ._, ..."-•~J li..'
.. ' '-C 11
\linac: G0v ra,s-
-1.:, 1
..J
Eri¾,'l

--====== ======:=====::.: ,. ._ /
1
~ s AJtura Progênies Altura Progênies
1
5 80 51 5,73 76 1
6 11 52 6.47 77 5,82
_:) 5 58 53 6.70 78 5,69
'.J
6 06 54 6,24 6,30
79
--
3A
6 14 55 6.26 80
6,06
6,57
6 80 56 6,66 81
-32 S 74 6,57
--.
57 5,96
--
82
~ .J 5.95 58 5,75 6,38
...,....
~'
83
5,68 59 6,11 6,48
.j.:
84
5 92 60 6,52 4,70
85
_;'.)
5.81 61 6,55 4,80
37 86
5.09 62 6,07 4,75
33 87
5 90 63 5,84 4,76
·~
...,_
5 75 64
88
4,74
-,~
•r 6,05 89
-- -' 6.19 65 4,80
_, 5,96 90
5 91 66 5,99
t.2 5,82 91
5,35 67 6,08
..:~ 6 13 92
- 6 28 68 5,92
~ 5 84 93
5,81 69 5,72
/ ~
.., .J 6,40 94
,.,. 6,38 70 4,77
- ': 5,76 95
617 71 4,97
q 6,08
6,22 96
.,.
~--; 72 6 14 4,75
-- -- --
73 ,, 6 íO · 97
6,51 98 6,08
'- J

6 07 .J

~: - _ : ;":
~ r 74 5 82 99 5,63
ó,57 ~ ~

~====~==a.!~===7~s~=,;,s~.8~6~=,,21~oo~=J5j·6t5
5,86
-

Das könnte Ihnen auch gefallen