Beruflich Dokumente
Kultur Dokumente
01sTR1eu1çAo oe
PROBABILIDADE
r rt rtr cn e 1,s a t
,,--
trtft
-.,
sr
1.1 INTRODUÇÃO
Assim , a probabilidade pode ser definida como o número de vezes que um determinado
evento ocorre, no exemplo o número plantas resistentes ao fungo, sobre o número total de
possibilidades, isto é , uma coleção ou grupo de possibilidades dos resultados desejados
dentro do espaço amostral .
Sabe-se que a resi stência a esse fungo é controlada por um gene (Co ), sendo o alelo
dominante (Co) re sponsável pela resistência e o recessivo (co) pela suscetibilidade. Baseado
na primeira Lei de Mendel , é esperado que na geração F2 ocorram 25% de plantas de
genótipo Co Co, 50% Coco e 25% de coco . Assim , entre as plantas resistentes observadas
é esperado que 5 sejam homozigóticas de constituição Co Co e 1O heterozigóticas de
constituição Coco. Observe também , que quando a planta tem o genótipo Co Co ela não
pode ser ao mesmo tempo Coco e vice-versa . Dizendo de outro modo, essas possibilidades
são mutuamente exclusivas. Do exposto, pode-se inferir que a probabilidade de se obter
uma planta resistente na população pode ser expressa do seguinte modo:
P (R) : P (Co Co) + P (Coco)
. Essa distribuição
- discreta, como o próprio nome ind·ica, ocorre quando apenas dois
tipos de resultados
, sao possíveis , tais como·. flor b ranca ou am arela, Alelo B ou b; resistente
ou suscet1vel. Para exemplificar a aplicação , suponhamos o resultado do seguinte
retrocruzamento no feijoeiro:
F1 X
P1 (Carioca)
Genótipo: Co co
coco
Fenótipo: Resistente t Suscetível
Descendência
Genótipo 1/2 Coco
1/2 coco
Fenótipo Resistente
Suscetível
Imaginemos que do material obtido seJ·a
. m semeadas 1O se .
Algum as indagações poderiam ser feit U m entes em um a bandeJa
as. ma delas seria, por e . ..
d8 que na bandeja todas as 1o plant . . xemplo . qual a probab11ldade
as seJam resistentes?
Par<J respondGr a essa indagação, devemos usar a distribuição b1nom,aL E binomial
por4ue, corn o já mencionado, são apenas dois eventos . resiste nte ou suscetível No exemplo
tem -se todas as possíbilidades apresentadas na Tabela 1. Para encontrar a frequência de
cada uma dessas possíbilidade s, deve-se utilizar a expansão do binômio que é fornecida
n
pela expressão: (P + q )" = .L C~ p' qr, em que c
~=O
1
n
é combinatória de x plantas resiste ntes
numa amostra de tamanho n, p é a probabilidade de ocorréncia de planta res istente. e q a
1
de planta suscetível ; logo q = 1 - peno exemplo, p = q = 1/2, n é o número de eventos, n =
10; nesse caso, x é o número de vezes em que o evento favorável ocorre e y o número de
vezes de ocorréncia do evento desfavorável, sendo x + y = n . Ass im . na indagação feita , x =
10, Y = O, e então a frequência será C~~(½)1º (½)º =(½f º =}{0 24 (1 caso em 1024) As
demais frequências de cada um dos eventos são apresentadas na Tabela 1
Total 1,0
Uma outra indagação que pode ser feita, por exemplo, é qual a probabilidade de termos
1 t
1 menos 4 panas
peo resl·stentes · Nesse caso , interessam as seguintes opções: 1 0R:0S;
gR: 1S; BR:2s; ?R:3 s; 6R:4S; 5R:5S; 4R:6S. A probabilidade é, então, estimada, considerando-
se P(X 2'. 4 ,0) = P (X =10)+P(X =9)+ P(X =8)+P(X =7)+P(X = 6)+P (X = 5}+P (X = 4 ) .
Escrevend o de ou t ro m ºdo , tem-se : 1- P(X <4)=1 -[P(X=3)+P(X=2)+P(X=1)+P(X=o)] .
. , de cálculo a segunda opção é a preferida , então , utilizando-se
Devido ao menor numero ,
13
p l X ::: 3) = O.11 7188
p (X= 2 )= 0,043945
p ( X = O)= O,000976
Resta comentar que em uma distribuição binomial a média (m) é fornecida por n.p e a
2
variância (a 2) por np(1- p) . No exemplo , m = 10 · ½ = 5,0ecr = 10 }~· (½)= 2,5 . Pa ra
Nesta situação, são considerados todos aqueles casos em que estão envolvidas mais
de duas opções. Seja, por exemplo o cruzamento-teste representado a seguir:
Coco V v COCO V V
tem-se:
n!
P(X = x; Z = z; Y = y ; W = w) = -- -- pxqzr ysw
x! z! y! w!
,01
P (2RV + 4RB + 3SV + 1SB)= . (¼)1°=00120ou 1,2%
1
4! 3! 2! 1!
se forem 8 plantas, em vez de 1O, a probabilidade de dar exatamente a freqüência
esperada de 1/4, isto é, dois de cada tipo: x = y = z =w =2, é:
14
'
81 8
15
f.:- X per1lllef1(;-1ç 1.:10 orn Gt , IC, l CJ M\ l li l< ~~
., lf 1ót· r•:·1 ~,1~~
• 1~
l o~d~c'.!l
• -"2'/1
}~-11~1t~a
·· ~:..
------- ---------
- ualquer valor 1gua1 Ou
~ p,o d
proprn~c.fades d~i clisl11b111çc10 11orrnal.
IJ ' bfaJ
1 cJclú de ~e obter q
, nálogo, qualquer valor
.
superior ô rnúoin , 1slo e-,, P (x · 10, 2), e de O,S ou J º ·
r::o°lr De ,nodo ª
a indagação é de P (x l
. . . . . , - O r.. Contudo. no exemp1o,
igual ou inferior n modr8 ti-11111Jcm e de P - ,;J ai ent re 10,2 e 12,0g e
. dida na curva norm .-
12,0g). Portanto, cstin18nrlo ..-1 orea conipreen se valor, deve-se utrl1zar a
m=10,2 g x = 12,0g
. . .
i ão normal representando uma população de plantas de feijã~,- cuja
:•i~:ª(~)-d~;:~iiç1o de grãos por planta é de 10,2 g e deseja-se estimar a probab1l1dade
de se obter plantas com mais de 12,0 g .
rea lizadas , como já mencionado. Por essa razão, é muito importante verificar se os dados
procedimentos para se verificar esse ajustamento, e o mais simples deles é a análise gráfica.
Para mostrar a sua aplicação, serão utilizados dados de produtividade m édia de espigas de
milho (tlha) de 28 cultivares obtidas por Ferreira et ai. (1995), (Tabela 2).
Tabela 2. Produt,vicJade média de espiga (t/ha) de 28 cultivares de milho
- ·-::. : .;: - --::....;: --. ____ _ _::::::-- -
Variedades t/ha Variedades t/ha
----
CMS - 01 5,58 CMS - 126 5 80
CMS - 02 5,66 CMS - 28 5.79
CMS - 03 6,53 CMS - 29 8 05
CMS - 04 N 7,84 CMS - 30 7, 19
CMS - 04 C 7,85 BR - 136 6 08
SR - 105 8,18 CMS - 39 8,36
BR - 106 7,44 CMS - 50 6,96
BR - 107 5,70 Sint. - Elite 7,44
BR - 111 7,18 PH - 4 4,95
BR - 112 6,11 Cunha 7,61
CMS - 14 C 5,27 BA Ili - Tuson 3,37
CMS - 15 7,04 Saracura 8,61
CMS - 22 6, 15 NitroFlint 6,08
CMS -23 6, 18 Nitrodent 7,55
Fonte: Ferreira et ai. (1995 ).
Para real izar essa análise gráfica, deve-se construir um histograma de distribuição
de frequência , que envolve os seguintes passos:
muito. Existem alguns critérios que podem ser usados, entre eles : i) Critério baseado
quando n é maior que 100, usa-se k = 510910 11 . Em ambos os casos , como k pode
ser um número com decimais, adota-se o inteiro mais próximo ; ii) Critério baseado
Aefn
pela expressão: k =1 + ,4 s , em que A é a amplitude total e s o desvio padrão.
3 9
e -- -P, Lo go e = ~ 24 = 1. 31
v- 1 5 1
17
~ xperimentação em Genética e Melhoramento de Plantas
,~
i
. . , . _ ,) s ornar a0
seguinte. or dCJ ·1
3) Determinação das classes. O procedimento e O m plitude de classe 1
. . xernplo), a a ,
l1m1te inferior da primeira classe (2,72 no nosso e _ . ii) Repete-se
1 31 - 4 ' 03 ' 0
obtendo-se o limite superior. Neste caso, 2 ,72 + ' . r será o limite inferior
1 sse anteno
processo, lembrando que o limite superior da eª . _ e tem-se os dois
. ude de vanaçao, .
da seguinte. Soma-se a esse valor, a ampl,t + 31 = 5,34) , e ass,rn
. como valor: ( 4 ,03 1'
limites . A segunda classe, no exemplo, teria observado. A Tabela 3
I
O '!timo va or
por diante, até que uma das e1asses envolva u de espiga de m,·1ho , e a
• . dos dªdos do peso
mostra a distribuição de frequenc,a
. . da produt,vi .
. 'dade média de espigas das cultivares de milho
Tabela 3. Distribuição de frequencia
avaliadas em Sete Lagoas, M.G. , 1993 -
1 [2 ,72 - 4,03) 1
2 [4,03- 5,34) 2
3 [5,34 - 6,65) 11
4 [6,65 - 7,96) 10
5 [7,96 9,27) 4
45 -
. 11
40
10
-~
u 30 -
e
~ 25
cr
(1)
U:: 20
15 4
10 .
2
5 1
o 1
2 72 4 03 5 34 6,65
.
7 ,96 9 ,2 7
1
1/ha
Frg,,re 2 Jrstr,grama dos dados da produtividade média de es a (t/h · - ·
~•1,õ.l.;:cJa·,prAF8rre1raf::f al ( 1995) - · P9
I a)dascult1va1esde m 1lho
J
------
Distrrbuiçáo de Probahd 1Jade
se ajuSl am à distribuição norm al. Contudo , essa anál is e é muito su bj etiva , e para
na decisão do ajustamento ou não. Há, na literat ura , alguns procedimentos, sendo que
2
a) EMPREGO DO TESTE DE X . Dispondo de uma distri buição de frequência dos
2
dados , como a apresentada na Tabela 3, para a aplicação do teste de X , são
que foi visto no item anterior para a primeira classe, isto é, P(2,72 ::; x < 4,03),isso
corresponde à área ocupada entre -3,28 e -2, '19, ou seJa, o mesmo que a área
2,19 a 0,4857. Desse modo, P ( - 3,28 ::; Z <- 2,19) = 0,4995 - 0,4857 = 0,0138.
normal , 1.38% dos dados de produ ti vidade devem assumir os valores va riando
P(5,34 ,,,;< 665) - P/ - 1,11 < Z ,,, -0,01) 0,3665 0,004 - 0,3625
19
'\ 1.l
Veia quP ness,) ull1ma s1tuaç~1J 1 ;-:1íf.a c::::1'•.:.•c::1,::1..1,1 ~- ._, ·,., . '_,,;.
r.
·t - a· nEü1J -\d't . ._
! • ) ' 1 J •'
.i •. _ , , 1 '-' 1
esquerda (negativo) e à direita \P:J~ I ,vL' ·d '
O,OY%1
'--~
2,7 ..\ ,O 5J b '1 7q q 27
Figu ra 3. Frequência média esperada, em porcentagem do numero de 1nd1v1duos da amostra,
considerando que os dados da produtividade média de espiga de milho tem perfeito a1ustamento
à distribuição normal.
Tabela 4. Frequência observada e esperada da produtividade méd12 de espigas das cultivares de milho.
J
esperada(P) FeE = n P
[-w; 2.72) o O0005
O 014
= 0.4004
[2,72; 4,03) 1 0,0138 0,3+864
[4.03; 5,34) 2 0,1192 3 3376
[5,34 ; 6,65) 11 0,3625 10,1500
[6 ,65 , 7,96) 10 0,3639 10,1892
l7.96 : 9,27) 4 O 1255
3 5140]
+ = 3,9228
[9 27 : + () o 0,01 46 0,4088
j - •
iv. Esti rnar o valor da estatística de qu1-qu2dra,jo cat,:,Liiadc 1:
, ~ (FeO, FeE t
Zc - L. FeE -
1
x~ =- ( - o,4oo 4 )2 +( 2 - 3,3376 )2 (11 - 10,1si
2
111 - 101892)2 14 3 514 )'
º• ºº
4 4
3,3376 + 10,15 + 10,1892 T 3 514
1 985
= '
É oportuno salientar que uma desvantagem desse procedi mento é que o valor de
2
X calculado é muito influenciado pelo número de classes empregadas. Com o aumento ou
dada classe é inferior a 5, esse valor pode inflacionar o valor do X~ calculado, alterando a
interpretação dos resultados . Para atenuar esse problema , sugere-se adicionar essas
classes às subsequentes .
b) PROCEDI M ENTO DE Johnson & W ichern (1988) - Um segundo procedim ento para
testar a normalidade dos dados foi apresentado por Johnson & Wichern ( 1988), e
fun dam e nta-se no seguinte : sabe-se que 68 ,3% das observações dentro de um a
[ m - 2s, m + 2s] .
, 1 (0,683)(0,317) - 1,396
(l) p 1 - 0,683 > 3 n - ✓ n
1
11
~ ., li r·a-~fi~lC'.!_ll~lu:>._
\· ,;pt,1 11ll l'íll:1ç,r\() CrTI f.:,enétlc.d e IV(; 101 e
~P~la~n~t.:a:.::i .---- - -- - - - - -- -----
· d~P.~,
---- - - ··
,
f ') 4E 7 86, e O
- -"u""',-:v lm ·
No exemplo o prnneiro líl
ter volo !m- 5 ] 8 L .,_
~1r - ? e cc · ,:.nu,
,
~i:;~ .., , .:. : ,
21 . 27
•
P O75 e P2 = - = O964
. - --
1 ' 28
28
c) MÉTODO DO "Q _o plols". Esta metodologia também foi apres entada por Johnson
curva abaixo do mesmo corresponde a [.rf.. Z) Esse valor pode ser obtido da
val or,(j = 10) numa amostra de tamanho 100. Assim (10 - Yz)l 100 = 0,095
representa a área sob a curva normal entre - -.r.. e o valor de Z 10
. Para determinar
'; :; JJ!J: , 1 1r~;1(!j' 1/J ' / 1 r: r:r,r:fl JJj',: , :; 1:tJ J(; l' J'1J' l <,r: : 1 Jr:1Jr1J' 1rq'I', í : Jí: , 1 ' 1fJí~IJ(11j' h(l~J
/' , ' , ' 1f 1' 1 /J ! 1( t, ',/ t(1 f1,r1', 1, JJ !; jtJ', 1/)( 1 1: 1 11 111 , 1 )'11Jíí lf1 ,,,1 l' ! l) JJ(1 I J (1f/ 1111q111·:,r1
,, ,.
,; ' .l,f,r:r, ,,,,,, ,,,l!'J IJJl:j' ,f1 íi: 1,r, '1j1 H,1 nr:f,1r t1 (j '; :1 '; ' l) jl ) C1 1ir;-'-1 rq:,1Jr1' 1 ,: ) f; l}Jl l', ºJ /1
.i1;I JH1f, ' .';f1 1:1•,1J111,1r,1 r:1111 ,r , IJJ 1: r1111 f,r,·, , ,r:11 1,q1J1i t l JJJ ' J' ;fJfJ r1r,:. <J :,nh
,,,; 1 i ; I l ;' .' ,! 1 1,, , j =1 ' ,p1:,1JJ f' 1/ 1: 1 'Jl, 1 ' ,11)1:t 1J1t1·1 ·,r:r, 1,r:11r: 111: 1, r: t ; r:r11 1r1plJl)'J /()j r1fllJI) 'r) V~ ' ' Jl·/C)Pr ! 1
' 1j'1' 1 · , ,, ·: ,rl ,tf,111 ,'1 ',I; 1:r ,1:1d1 •r,r· 'í l'· ·I 1,r :11 , , 1:1111 11(11,q, 11 11,1 J1:1i1 11r1' J 11•:·.r, 'l!IJd ' r,111: ,J()()') 11 1u q
f J'1lflt l' 1 / '.' 111JwJ: ,J' , ',lf 1 •,1,r ,1:rI l''1I JJ/IJl 1f1J /1/ l',Jlj'1I II (1p1 r,11l 1 I) 11rir,11,,111 1,·,•,1 ,p 1111di1i1W !I\ V
P'IIIJcJII
,,,/,rr,,11 11 •,1r, ,: 1:1',,,r,. ,,., ,,q 11111 11, ·' " ''/ 1111,· , •., ., , ,, 111r1•,1 , , 11, 11 11 ,,/ 111 , 11,,· 111 11 11 , 11 ,11111 , :
, ,r1t, 'hf ,' 1111111 ·,111111 1 , •,1 ,11,tl 1,r,11 Jf',1,111 1; 111111, ,· , '1111111 :·, q,111 ·,,111q1,,d 11•,1111!1 '''l 1q11 1
i: 11u , 1: , ,,,,:', 1 1' : ,, ,11 1 ,,1 1i,111t •1' ,11/1 : 11 f,1 1•111/,1 1J 1,·11p; d l ,,11 11 ,11 1111 ,11,, 1,p,1rl 11:1 ,1111, ,· )
,1,
1:11,1 1:111111 1:11111 11• 11 1J 1 ,1 ,. , ,1; 11 ,1,1u ,1 , , •,11111 1111,1•1111111 °,1111,11111 1111111 u u 111·, 1 , , / 1111
' ;L 1J11 /l :f 1
;/ 1 1111 /IJ 1 ,11 1,r ; ,,fr,l jl /j'l/f, I' 11 11/j'HI1, , 11'1 ('11/) •11 1i,1111 :,r, 11• ; l ljtl lllf 1111111111 Ili X li
1;';}~r 1l fl ' ,,,, ''•; , ,, , 1 ,J7J/Jjl // ,., ,,, 1,r 111 1,d~111,1 ,·1 1, ',,,,11d 1) ' '" í,,, 11111111p11,111, 1p ',' 111111
,, H/L1't'1J •1,, .,,,1,rr1, t,,,1, ,,·1, 1i; 11; ,, ,,1,,,ri11,t11.J1d11 ') ll'' ' •, 1 1111,11 11 , 111 '"x ,,11 111 ,1111, 111
,,,
' .1 , ,r,,l•,1t,1,,, , , .,, ,, 1 ,,1, •-111 11 ,11 11 ·,,, 11i-11,1· ,q11111111p11t1 1 1111 11 •,,,,11 1,11n 1111 1 11,,·,~,11 "I
f1lf ':l 1jlll 1JHJ111 ( t 1l 1/l/ l ,li 7jlf1 t, 1 1 11 11 11/ / lljl t11 rJl/fll/\ 411 !lf1IJPll) tH-H1li!H 1/\/il ' I ''l•llflll ''N
t. 11II 11 11 f , ll
' 11I li
I l I ·' J :, •I 'JI 1 1 t, f
Experimentação
~)"'
ern Genét1c M
a e elhoramento de Plantas
Tabela 5. Valores de. (" , )
J' J - ½ / n , zUl e xIJ) para os dados do peso da espiga em Uha. ------
--- 1
j
2
(j -½)!n
0,0179
Zm
-2,1002
Xol
3,370~
-:::,..._
~ ·-,
•
3
Figura 5. "Q - O plot" para os dados da produtividade média de espigas das cultivares de milho
avaliadas em Sete Lagoas, MG, em 1993.
Jt (x(JJ - x) (z(Jl-z)
10 = --;:::============
Jt(x(J) -xr. JJz(J) -zr
O valor derO deve ser testado utilizando os dados da Tabela 6, no nível de significância
desejado. No exemplo, obteve-se rO = 0,9772. Consultando a Tabe la 6 , com tamanho da
amostra igual a 28, encontra-se após a devida interpolação, o valor de 0,9616. Como r 0
estimado foi maior que o tabelado , aceita-se a hipótese de que os dados do peso das
espigas de milho com 5% de probabilidade sigam a distribuição normal .
-------
-Expenmentacão
. em Genética e Melhoramento de Plantas ---------... 1
=---
Tamanho da amostra
0,01
Nível a de signíficáncla
o.os o,10
0.935
~
.._____
\
10
0,880 0,91 8
15 O 95 1
0,91 1 0,938
20 O 960
0,929 0,950
25 0 ,966
0,941 0,958
30 0 ,97 1
0,949 0,964
0 ,977
40 0,960 0,972
0 ,981
50 0,966 0,976
0 ,984
60 0,971 0,980
0 ,987
75 0,976 0,984
0 ,989
100 0,981 0,986
0,991 0 ,992
150 0,987
0,993 0 ,994
200 0,990
F o n te.. Johnson & Wichem (1988 ).
Distribuiçao de Probabilidade
EXERCÍCIOS PROPOSTOS
1. No milho, o alelo dominante Su é responsável por semente lisa e o su, por enrugada.
Uma planta de genótipo Su su foi autofecundada e produziu 40 sementes. Qual a
probabilidade de que nessa espiga ocorra a segregação fenotípica exatamente como
esperado pela Primeira Lei de Mendel?
3. No tomateiro, o hipocótilo pode ser roxo devido ao alelo dominante R , ou verde devido
ao alelo recessivo r. A folha pode ser recortada devido ao alelo C , ou lisa (tipo batata)
devido ao alelo c. Uma planta heterozigótica foi autofecundada sendo tomada uma
amostra de 16 sementes. Pergunta-se:
e folha recortada?
b) Qual a probabilidade que ocorra a segregação 9 roxa recorta da: 3 roxa lisa: 3
dados da altura das plantas obtidos por Castro 1992, de 100 progênies de Eucaliptus
>,· -~ ,- • • ·,
"''
, - •
'- ' '
• \ ......,
., "' '\. .,.
'>, _::: ._, ..."-•~J li..'
.. ' '-C 11
\linac: G0v ra,s-
-1.:, 1
..J
Eri¾,'l
--====== ======:=====::.: ,. ._ /
1
~ s AJtura Progênies Altura Progênies
1
5 80 51 5,73 76 1
6 11 52 6.47 77 5,82
_:) 5 58 53 6.70 78 5,69
'.J
6 06 54 6,24 6,30
79
--
3A
6 14 55 6.26 80
6,06
6,57
6 80 56 6,66 81
-32 S 74 6,57
--.
57 5,96
--
82
~ .J 5.95 58 5,75 6,38
...,....
~'
83
5,68 59 6,11 6,48
.j.:
84
5 92 60 6,52 4,70
85
_;'.)
5.81 61 6,55 4,80
37 86
5.09 62 6,07 4,75
33 87
5 90 63 5,84 4,76
·~
...,_
5 75 64
88
4,74
-,~
•r 6,05 89
-- -' 6.19 65 4,80
_, 5,96 90
5 91 66 5,99
t.2 5,82 91
5,35 67 6,08
..:~ 6 13 92
- 6 28 68 5,92
~ 5 84 93
5,81 69 5,72
/ ~
.., .J 6,40 94
,.,. 6,38 70 4,77
- ': 5,76 95
617 71 4,97
q 6,08
6,22 96
.,.
~--; 72 6 14 4,75
-- -- --
73 ,, 6 íO · 97
6,51 98 6,08
'- J
6 07 .J
~: - _ : ;":
~ r 74 5 82 99 5,63
ó,57 ~ ~
~====~==a.!~===7~s~=,;,s~.8~6~=,,21~oo~=J5j·6t5
5,86
-