Beruflich Dokumente
Kultur Dokumente
Donald
T. Campbell * *
* * Professor do Departamento de
Psicologia da Northwestern University,
em Evanston, Illinois, EUA.
R. Adm. Emp.,
Rio de Janeiro,
jan./fev.1975
30
conseguir melhorias significativas com os meios usualmente fornecidos e dada a discrepncia entre promessas
e possibilidades, a maior parte dos administradores
prefere, sensatamente, restringir as avaliaes queles
resultados que conseguem controlar, especialmente no
que se refere a resultados a serem anunciados ou divulgados pela imprensa. A ambigidade, a falta de bases
verdadeiras de comparao e de evidncia concreta conspiram para aumentar o controle do administrador
sobre o que dito, ou, pelo menos, para reduzir o impacto da crtica no caso de fracasso real. H segurana
sob o manto da ignorncia. Alm dessa conjuno de
promessa e gesto, h outra fonte de vulnerabilidade na
circunstncia de que os fatos relevantes para a avaliao
de um programa podem tambm ser utilizados para se
questionar a eficincia geral e at a honestidade dos administradores. A acessibilidade de tais fatos ao pblico
red uz a intimidade e a segurana de alguns administradores.
Mesmo quando existe um compromisso ideolgico para uma avaliao sria da eficincia organizacional ou
para uma organizao cientfica da sociedade, esses dois
perigos levam impossibilidade de avaliao realstica
de experimentos organizacionais. Se o sistema poltico e
administrativo comprometeu-se antecipadamente
correo e eficcia de suas reformas, ele no pode tolerar o reconhecimento do fracasso. Para sermos realmente cientficos preciso que sejamos capazes de experimentar e que possamos preconizar sem aquele excesso de compromisso que nos torna cegos ao teste da
realidade.
Esse transe, favorecido pela apatia pblica e pela
corrupo deliberada, pode vir, a longo prazo, a impedir
uma abordagem verdadeiramente experimental para a
melhoria social. Mas nossas necessidades e esperanas
de uma sociedade melhor exigem que faamos o esforo.
H alguns sinais de esperana. Nos Estados Unidos conseguimos obter ndices de custo de vida e desemprego
que, embora imperfeitos, tm embaraado os governos
que os publicam. Temos conseguido efetuar recenseamentos que reduzem o nmero de deputados que um
estado tem no Congresso. Esses so motivos de otimismo, embora a morosidade corrupta dos governos estaduais em seguir suas prprias constituies para a
reviso de distritos legislativos ilustra o problema.
Uma mudana simples de postura poltica que reduziria o problema seria a de passar de uma preconizao de uma reforma especfica para a preconizao da
seriedade do problema e da para a preconizao de
uma persistncia em esforos alternativos de reforma,
caso o primeiro falhasse. A posio poltica seria: "Este
problema srio. Propomo-nos a adotar a 'Poltica A'
numa base experimental. Se ap6s cinco anos no houver
ocorrido uma melhora significativa, mudaremos para a
'Poltica B'." Por tornar explcito que a soluo dada ao
problema foi somente uma dentre as que o administrador ou partido poderia preconizar em s conscincia
e por ter j pronta uma alternativa plausvel, o administrador teria condies para uma avaliao honesta de
resultados. Resultados negativos como o do fracasso do
primeiro programa no poriam seu trabalho em perigo,
pois sua funo seria a de lutar com o problema at
achar algo que desse certo.
Revista de Administrao
de Empresas
Simultaneamente, deveria ser instituda uma morat6ria para pesquisas de avaliao ad hominem, isto ,
para pesquisas objetivando mais a avaliao de administradores especficos do que polticas administrativas. Se nos preocupamos com o problema do devassamento da intimidade nos bancos de dados e indicadores sociais do futuro (e.g., Sawyer e Schechter, 1968),
o ponto mais inflamvel seria o da intimidade dos administradores. Se o ameaarmos, o sistema de medio
ser certamente sabotado por inmeras formas possveis. Embora isto possa parecer indevidamente pessimista, os casos freqentes de administradores que tentaram arrasar achados de pesquisas indesejveis convencem-me de que estou certo. Mas deveramos poder
avaliar as polticas alternativas que um dado administrador tem a opo de implementar.
2. EXPERIMENTOS DE CAMPO E ESQUEMAS
QUASE-EXPERIMENTAIS
No esforo de estender a lgica da experimentao de
laboratrio para os trabalhos de "campo" e situaes
no-perfeitamente experimentais, organizamos uma lista de ameaas validade experimental, em cujos termos
cerca de 15 ou 20 esquemas experimentais e quase-experimentais foram avaliados (Campbell, 1957, 1963;
Campbell e Stanley, 1963). Neste artigo, somente trs ou
quatro esquemas sero examinados e, portanto, nem
todas as ameaas validade sero relevantes, mas teremos um cenrio til para examin-las sumariamente a
todas. Seguem-se nove ameaas validade interna.!
a) Histria: acontecimentos, que no o tratamento experimental, que ocorrem entre o teste prvio e o teste
posterior, fornecendo assim uma explicao alternativa
para os efeitos.
b) Maturao: processos internos dos respondedores ou
das unidades sociais observadas, os quais produzem
mudanas como resultado da passagem do tempo em si,
tais como crescimento, fadiga, tendncias seculares, etc.
c) Instabilidade: falta deconfiabilidade das medidas,
flutuaes nas pessoas ou componentes que compem a
amostra, instabilidade autnoma de medidas repetidas
ou "equivalentes". (Esta a nica ameaa para a qual
os testes estatsticos de significncia so relevantes.)
d) Teste: efeito da aplicao de um teste sobre o resultado de um segundo teste. Efeito da publicao de um
indicador social sobre os valores subseqentes daquele
indicador.
e) Instrumentao: mudanas na calibrao de um instrumento de medida ou mudanas nos observadores ou
no sistema de medio, os quais podem ocasionar
mudanas nas medidas obtidas.
t) Iluses criadas por regresso: alteraes falsas que
ocorrem quando as pessoas ou unidades de tratamento
Se uma mudana ou diferena ocorre, estas so explicaes rivais que poderiam ser usadas para explicar
um efeito e assim negar que num experimento especifico, qualquer efeito genuno do tratamento experimental tenha sido demonstrado. So estas as falhas que
os experimentos verdadeiros evitam, principalmente
atravs do uso da escolha aleatria e dos grupos de controle. Na abordagem aqui preconizada, esta lista de
verificao usada para avaliar esquemas quase-experimentais especficos. Trata-se de uma avaliao, no
de uma rejeio, pois acontece freqentemente que,
para um esquema especifico, numa situao especifica,
a ameaa no plausvel, ou existem dados suplementares que possam ajudar a descart-la mesmo quando a
escolha aleatria impossvel. A tica geral, preconizada aqui tanto para administradores pblicos como
para cientistas sociais, a de usar o melhor mtodo possivel, visando a experimentos verdadeiros com grupos de
controle aleatrios. Mas quando o tratamento aleatrio
no possvel, preconiza-se o uso autocritico de esquemas quase-experimentais. Precisamos fazer o
melhor possvel com o que nos disponvel,
Nossa posio face aos crticos perfeccionistas afeitos
~ experi~e.ntao de laboratrio mais militante do que
ISSO: as umcas ameaas validade que permitiremos invalidar um experimento so aquelas que reconhecem o
status de leis empricas que sejam mais confiveis e mais
plausveis do que a lei que envolve o tratamento. A mera
possibilidade de alguma explicao alternativa no o
bastante - somente as hipteses rivais plausveis as que
so capazes de invalidar. Face aos estudos de correlao
e estudos descritivos de bom-senso, por outro lado, nossa
posio a de uma maior cautela. Por exemplo, devido
armadilha metodolgica especifica da iluso criada por
regresso, a tradio sociolgica dos esquemas ex post
facto (Chapin, 1947; Greenwood, 1945) totalmente
rejeitada (Campbell e Stanley, 1963, p. 240-1' 1966 p.
70-1).
'
,
As ameaas validade externa, focalizadas adiante,
abrangem os problemas de validade enfrentados na interpretao dos resultados experimentais, as ameaas
generalizao vlida dos resultados para outras situaes, para outras verses do tratamento, ou para
outras medidas do efeito. Z
a) Efeitos de interaiJo do teste: o efeito de um teste
prvio em aumentar ou diminuir a sensibilidade ou
receptividade varivel experimental, fazendo, assim,
tal: sensibilidade
tratada.
no representativa
da populao
c)
31
325
300
275
320
250
~
~
.l:?
~
"'t
200
340
51
52
53
54
55
56
57
58
59
300
290
280
Anltsdo~
(19551
32
Depoisdo llldutecimlnlo
119561
No que se segue, embora reconheamos que as medidas adotadas tiveram alguns efeitos benficos, criticaremos a interpretao que Ribicoff deu aos seus
resultados, do ponto de vista dos padres estritos de
evidncia do cientista social. No fosse o agora Senador
Ribicoff homem da estatura que , a critica seria mpoltica, porque estaramos indispondo-nos com um dos
mais fortes proponentes da experimentao social nos
Estados Unidos. Devido sua ndole, no entanto, podemos sentir-nos seguros de que ele compartilha dos
nossos interesses, tanto num programa progressivo de
melhoria social experimental como na realizao de
avaliaes mais srias possveis desses experimentos. Na
verdade, foi sua integridade em usar todos os meios
sua disposio como governador para garantir que o impopular rigor contra o excesso de velocidade fosse de
fato cumprido que toma esses dados dignos de qualRevista de Administrao de Emprescu
metodolgica e descarta essa ameaa validade. A tendncia geral inconsistentemente a de aumento antes do
endurecimento e de uma diminuio estvel depois.
c) Instabilidade: estava aparentemente implicito no
pronunciamento oficial o pressuposto de que toda a alterao de 1955 e 1956 fora devida ao endurecimento.
No foi reconhecido o fato de que todas as sries temporais so instveis mesmo quando nenhum tratamento
aplicado. O grau dessa instabilidade normal a questo crucial, e uma das principais vantagens da srie
temporal prolongada que ela apresenta uma amostra
dessa instabilidade. A grande instabilidade anterior ao
tratamento faz agora o efeito do tratamento parecer
trivial. O salto de 1955-56 menor do que os aumentos
tanto de 1954-55 como de 1952-53. l:: verdade que o
maior decrscimo da srie, mas supera os de 1951-52,
1953-54 e 1957-58 por valores triviais. Dessa forma, as
instabilidades inexplicadas da srie so tais que fazem
com que o decrscimo de 1955-56 seja interpretvel
como uma variao como as demais. Por outro lado,
deve ser notado que depois do endurecimento no houve
mais aumentos, e, nesse sentido, a feio da srie temporal parece indubitavelmente ter mudado.
A ameaa da instabilidade a nica para a qual os
testes estatsticos de significncia so relevantes. Box e
Tiao (1965) tm um elegante modelo bayesiano para srie temporal interrompida. Aplicado por Glass (1968) a
dados mensais do nosso caso em foco - removidas as
tendncias sazonais - demonstra uma reduo estatisticamente significante na srie temporal aps o endurecimento. Mas, como veremos, existe uma explicao alternativa para pelo menos parte desse efeito significante.
d) Regresso: nos experimentos verdadeiros o tratamento aplicado independentemente do estado prvio
das unidades. Em experimentos naturais o fato de um
grupo ter sido submetido a tratamento muitas vezes
um dos sintomas de condio do grupo tratado. O
tratamento pode ento ser perfeitamente um efeito em
vez de, ou alm de, uma causa. A psicoterapia um desses casos onde o tratamento um dos sintomas, como o
qualquer caso em que o grupo tratado auto-seleconado :ou autodesignado por motivo de necessidade.
Todos eles apresentam problemas especiais de interpretao, dos quais o exemplo presente um tipo.
A hiptese rival plausvel da seleo-regresso parte
do seguinte argumento: dado que a taxa de mortalidade
tem certo grau de variabilidade, ento uma subamostra
selecionada por causa do seu valor extremo em 1955
seria, em mdia, menos extrema em 1956, como mero
reflexo dessa variabilidade. Houve seleo baseada em
valor extremo na aplicao deste tratamento? Provavelmente sim. De todos os registros anuais de mortes
cusadas pelo trnsito em Connecticut, a ocasio mais
provvel para um endurecimento com o excesso de
velocidade seria aps um ano de taxa excepcionalmente
alta. Se a srie temporal mostrava instabilidade, a taxa
do ano seguinte seria em mdia menor, unicamente em
funo dessa instabilidade. Efeitos de regresso so
provavelmente a forma que mais reaparece de iluso de
33
34
40000
30000
20000
!O000
I I I I I I I I I
350
300
250
200
150
I
ro
33
30
~~
27
2 I
I
~ I
I
24
I
I
I
51
52
53
54
55
56
57
58
59
35
19
18
17
16
I5
14
13
I 2
II
10
51
52
53
54
55
56
57
58
59
Reformas
24
20
I 6
I 2
I!
I I I I I I!
81
87
I I I I I I I I I I ! I ! ! I ! I I ! ! I I I I I
90
93
96
99
02
05
08
11
14
51
84
52
53
54
55
56
57
58
59
Figura 8-~ntagem
das mul~ por-excessode velocidadeque
foram depois canceladaspor-ter sido o acusado julgado inooente
1!
i!
i!
con~
36
14
9R
9R
!IR sries
IOR
itR sries
/~
I 2
10
IQR
8
o
.2
6
4
~b
:Si
i!
~ ~
~
~
9R
Lotim
IOR
!IR sries
9g
IOR
112 sries
Figura I l-Esquema
da srie de =ntrole,=mparondo
de mortes em Connecticut corn os de outros quatro
Toxodel1lOl'toli_
o nmero
estados
de de~-,ernpote e anlise de
na rerecso
------~----------Prmio---
15
14
40
13
1 2
II
10
9
8
Comecficuf..........Esfodosde
ctKIfrole... -+-- ..
10
60
70
80
90
tOO
uo
120
130
140
150
37
fundamental, um controle central uniforme pode reduzir as possibilidades atuais de teste da realidade, ou
seja, de uma experimentao social verdadeira. Dentro
do mesmo esprito, a descentralizao das tomadas de
deciso, tanto dentro do Governo como dentro de
monoplios privados, pode proporcionar uma concorrncia til eficincia e inovao manifestada numa
multiplicidade de indicadores.
S. ESQUEMA DA DESCONTINUIDADE
NA REGRESSO
38
de Empresas
3or---------------------~~--------------Com tralamenlo
Sem tratomeoto
xx
Elei/onulo
li:
Efei/o oomeatodo:
10
Efeilo dimin/Jidor
=:
-.
Chth
tf.tE
~[L
30,-----------------------------------------Sem tralamenlo
Com Iralamenlo,
xx
IX
xx
10
-10L-10
o
-L-
10
---'-
_
20
39
Este esquema poderia ser utilizado em vrias situaes. Consideremos os inscritos para o Corpo de
Treinamento para Empregos (Job Training Corps), em
maior nmero do que o programa pode atender, com a
qualificao determinada pela necessidade. A situao
seria a das figuras 13d e 13e. A dimenso bsica para a
deciso poderia ser a renda familiar per capita, sendo
que aqueles que tivessem menos que um certo valor
receberiam o treinamento. A dimenso para se mediro
resultado do programa poderia ser o imposto de renda
Reformas
40
30r----------------------------------------
10
-I O L-
-10
10
20
30r---------------------------------------x
-Trolodo
NtJoIrolodo
0-
10
-I O L-
-10
10
Valores do leste prvio
20
41
42
de Empresas
programa de treinamento com o dos que foram convidados mas nunca apareceram e, tambm o dos que
vieram algumas vezes e abandonaram o programa. Considerando como "treinados" somente os que terminam o
programa e usando os outros como controles, est-se
fazendo uma seleo com base no grau de conscincia
individual, numa base familiar estvel e amparadora, no
gosto pela atividade de treinamento, na aptido, na
resoluo de vencer na vida - fatores todos que prometem sucesso futuro mesmo que o programa corretivo
no tenha valor algum. Para aplicar eficazmente esta
ttica no Corpo de Treinamento para Empregos seria
necessrio, talvez, eliminar do pretenso grupo de controle todos os que abandonaram o programa de treinamento porque encontraram um emprego - mas isto
pareceria ser um procedimento razovel e no macularia
o recebimento de um jubiloso relatrio de andamento.
Essas so s mais duas amostras de modos de anlise
infalveis para o administrador que no pode fazer face
a uma avaliao honesta da reforma social que ele
dirige. Esses exemplos nos fazem lembrar novamente
que temos que ajudar a criar um clima poltico que exija
testes da realidade mais rigorosos e menos enganosos.
Devemos criar posturas polticas que permitam experimentos verdadeiros ou bons quase-experimentos.
Das vrias sugestes visando a esse objetivo dadas neste
artigo, a mais importante provavelmente o tema
inicial: os administradores e os partidos polticos devem
preconizar a importncia do problema e no a importncia de uma soluo. Eles devem preconizar seqncias experimentais de reformas em vez de uma panacia
infalvel, propondo uma Reforma A e tendo uma Alternativa B disponvel para ser experimentada em seguida,
no caso em que uma avaliao honesta de A mostrasse
que ela fora intil ou prejudicial.
8. REPETIO MLTIPLA DA AVALIAO
Nmero excessivo de cientistas sociais espera que um
nico experimento resolva uma questo definitivamente.
Isto pode ser uma generalizao errnea da histria dos
grandes experimentos cruciais da fsica e da qumica.
Na realidade, os experimentos significativos das cincias
fsicas so repetidos milhares de vezes, no somente em
esforos deliberados de repetio, mas tambm como
eventualidades inevitveis na experimentao sucessiva
e na utilizao dos muitos dispositivos de medio (como
o galvanmetro), que na sua operao incorporam os
princpios dos experimentos clssicos. Devido ao fato de
que ns, cientistas sociais, possuimos menos poder para
conseguir "isolamento experimental", j que temos boas
razes para esperar que os efeitos do tratamento interajam significativamente com uma grande variedade
de fatores sociais, muitos dos quais no levamos ainda
em considerao, nossa necessidade de experimentos de
repetio muito maior do que a do cientista fsico.
As implicaes so claras. Devemos ser obstinados no
teste da realidade no s na avaliao do programapiloto e escolha da reforma a ser implementada na forma de lei. Devemos tambm, desde o momento em que
tenha sido decidido que a reforma ser adotada como
padro em todas as unidades administrativas, avaliar
Reformas
43
Campbell, D.T. ar Fiske, D.W. Convergent and discriminant validation by the multitrait-multimethod
matrix. Psychological Bulletin, V. 56, p. 81-105, 1959.
Campbell, D.T. & Ross, H.L. The Connecticut crackdown on spending: time-series data in quasi-expermental analysis. Law and Society Review, V. 3, n. 1, p. 33-53
1968.
'
BIBLIOGRAFIA
Aubert, V. Chance in social affairs. Inquiry, n. 2, p. 1-
44
24, 1959.
'"
Campbell, D.T. Factors relevant in the validity of experiments in social settings. Boletim Psicol6gico, v. 54,
p. 297-312, 1957.
Revista de Administrao de Empresas
1967.
Psychological Bulletin,
Stieber, J.W. Ten years of the Minnesota Labor Relations Act. Minneapolis. Industrial Relations Center,
Vniversity
V.
This~let~waite, ~.L. & Campbell, D.T. Regression-discontll~ulty analyss: an altemative to the ex post-facto
experiment, Journal ofEducational Psychology V. 51 p.
309-17, 1960.
'
,
Schwartz,
R.D.
&
Orleans,
in sociological
13, p. 401-10
S. On Legal
'
sanctions.
Webb, E.J.: Campbell, D.T.; Schwartz, R.D. &. Sechrest, L.B. Unobstrusive measures: nonreactive research
in the social sciences. Chicago. Rand McNally, 1966.
Wolf, E.; Lke, G. &: Max, H. Scheidung und Scheidun-
V.
1949.'
Polanyi, M. A society of explorers. In: The tacit dimension. New York. Doubleday, 1966. Capo 3.
of Minnesota,
34, p. 247-300,
Guttman, L. An approach for quantifying paired comparisons and rank order. Annals of Mathematical
Statistics, v. 17, p. 144-63, 1946.
V.
in Deuts-
45
dade. Por outro. concordo com os que defendem seu uso em situaes
onde no foi usada a aleatorizao. Mesmo nesses casos, faz sentido
dizer-se ou negar-se: "Esta diferena trivial. t;:. da ordem que teria
ocorrido com freqncia se essas medidas tivessem sido designadas
por pura chance." Os testes de significincia que utilizam uma redesignao aleat6ria das medidas realmente obtidas so especialmente
teis para se transmitir este argumento.
2 Esta lista tambm foi ampliada em relao s verses anteriores
deste trabalho para tornar mais evidentes as ameaas 5 e 6, as quais
so especialmente relevantes na experimentao social. A discusso
nas verses anteriores (Campbell, 1957, p. 309-310; Campbell e
Stanley. 1963, p. 203-4) tinha abrangido essas questes mas no
haviam sido includas na lista de verificao.
3 No h dvida de que tanto o pblico como a imprensa participaram do susto do governador com o nmero de mortes em 1955. Essa
reao discriminat6ria poderia ser encarada como um sistema de
realimentao negativa no qual o efeito amortecedor proporcional ao
aumento em relao tendncia prvia. Na medida em que tal susto
causa uma reduo nas mortes causadas pelo trnsito, ele acrescenta
uma componente negativa autocorrelao, aumentando o efeito de
regresso. Esta componente deveria provavelmente ser encarada como
uma causa rival ou um tratamento rival em vez de como um efeito
ilus6rio. (O efeito de regresso menor quanto maior for a autocorrelao positiva e estar presente na medida em que essa correlao
menor do que a unidade positiva. Uma correlao negativa numa srie
temporal representaria uma regresso alm da mdia, numa forma
no exatamente anloga correlao negativa entre pessoas. Para
autocorrelao com retardamento I, uma alta correlao negativa
seria representada por uma srie que oscilasse com mxima amplitude
de um extremo a outro.)
4 A inconsistncia de Wilson na utilizao dos registros e o problema
politico de registros relevantes esto competentemente documentados
em Kamisar(1964). Etzioni (1968) relata que em 1965, em Nova York,
foi proclamada uma onda de crimes que se revelou depois ser devida a
uma melhora no divulgada no sistema de registro.
5 Sween, J. e Campbell, D. T. Computer programs for simulating
and analyzing sharp and fuzzy regression-discontinuity experiments.
Em preparao.
6 Embora disponhamos de pelo menos um teste de significncia
exeqlvel, pode ser bem diftcil conseguir um teste que preserve a
imagem de se extrapolar para um hipottico teste de desempate com
aleatorizao. Inicialmente, seguindo a orientao de Walker e Lev
(1953. p. 400; Sween e Campbell, 1965, p. 7), testamos a significncia
da diferena das duas linhas de regresso no ponto de separao, uma
ajustada s observaes abaixo do ponto de separao e a outra ajustada s observaes acima dele. Na simulao 'por computador de
casos de efeito nulo, foram encontrados repetidamente pseudo-efeitos
"significativos". Acontece que esta uma daquelas situaes em que a
soluo pelo mtodo dos mlnimos quadrados viciada. Uma forma de
46
compreender a natureza desse vicio talvez considerar o que aconteceria se tanto a reta de regresso do teste prvio sobre o teste posterior como a do teste posterior sobre o teste prvio fossem traadas
para toda a distribuio. Essas duas retas de regresso cruzariam no
centro da distribuio (isto , no ponto de separao, em exemplos
simtricos como os das figuras 14 e 15) e se afastariam nas extremidadesi Quando, em vez disso, as duas retas de regresso so ajustadas
para cada metade da distribuio, elas cruzaro no centro de cada
metade e se afastaro nas imediaes do-ponto de separao. Num
exemplo como o da figura 14, a regresso do teste posterior sobre o
teste prvio ser a mais baixa no ponto de separao para a metade
no tratada e a mais alta para a metade tratada. Este pseudo-efeito
no aparece quando se traam os pontos representando as mdias de
cada coluna, o que pode ser verificado visualmente, e as figuras 14, 15,
16 e 17 deveriam ter sido desenhadas com as mdias de cada coluna
representadas em vez das retas ajustadas. O tamanho desse vicio
uma funo- da correlao entre o teste prvio e o teste posterior e se
esta puder ser adequadamente estimada, poder-se-ia calcular uma estimativa corrigida da diferena no ponto de separao. No entanto,
no se pode usar a distribuio inteira para se estimar essa correlao,
pois um efeito real ir causar parte da correlao. Poder-se-ia basear
uma estimativa nas correlaes calculadas em separado para as partes
acima e abaixo do ponto de separao, corrigindo-a pelo fato de
abrangerem uma faixa restrita. Poder-se-ia tambm encontrar procedimentos de estimao de mxima verossimilhana.
No momento, a melhor sugesto parece ser a que foi fornecida por
Robert P. Abelson. A reta de regresso.do teste posterior sobre o teste
prvio ajustada para um grupo de dados que se estendem para cima
e para baixo do ponto de separao em pores iguais. As mdias das
colunas so expressas como desvios daquela regresso. Um teste t
ento usado para se comparar as colunas junto ao ponto de separao,
acima e abaixo dele. Para aumentar a base estatstica, pode-se explorar uma classificao em colunas mais largas. Este teste infelizmente perde a analogia com o experimento verdadeiro de desempate,
analogia da qual o presente autor lanou mo para um esclarecimento
conceitual.
7 H alguns indlcios estatsticos sutis que poderiam distinguir estes
dois casos se tivssemos observaes suficientes. Deveria haver um
aumento da varincia dos valores combinados das colunas nas colunas
mistas no caso de um efeito real. Se os dados fossem tratados arbitrariamente como se tivesse havido um ponto de separao.nltido no
meio da regio em que as observaes se misturam, ento no deveria
haver descontinuidade no caso de efeito nulo e sim alguma descontinuidade no caso de efeito real, embora neste segundo caso a descontinuidade fosse subestimada, j que existem casos no tratados acima
do ponto de separao e casos tratados abaixo desse ponto, diminuindo o efeito vislvel. A intensidade desta diminuio deveria ser estimvel e corrigvel, talvez atravs de procedimentos iterativos. Mas estas so esperanas' para o futuro.
NO IMPORTA
ONDE vOC ESTEJA
NOSSAS PUBliCAES
CHEGAM AT vOC.