Beruflich Dokumente
Kultur Dokumente
Escola de Cincias
UMinho|2011
Outubro de 2011
Universidade do Minho
Escola de Cincias
Relatrio de Mestrado
Mestrado em Estatstica de Sistemas
- Especializao em Engenharia e Estatstica
Outubro de 2011
AUTORIZADA A REPRODUO PARCIAL DESTA DISSERTAO APENAS PARA EFEITOS
DE INVESTIGAO, MEDIANTE DECLARAO ESCRITA DO INTERESSADO, QUE A TAL SE
COMPROMETE;
Assinatura: ________________________________________________
Quando recebemos um ensinamento devemos receber como um valioso
presente e no como uma dura tarefa. Eis aqui a diferena que transcende
Alberto Einstein
ii
AGRADECIMENTOS
Durante a realizao deste trabalho deparei-me com momentos bons e momentos menos
bons, e foi nesses momentos onde as coisas no corriam como esperava que contei com o
apoio das pessoas fantsticas que me rodeiam no quotidiano.
Em primeiro lugar cabe-me agradecer a professora Doutora Ana Cristina Braga, pela sua
compreenso, disponibilidade, ateno, pacincia e fora transmitida, assim como todas as
dvidas esclarecidas, e as sugestes dadas. A qualidade deste trabalho deve-se muito a
forma como fui orientada.
Agradeo aos meus pais por todo o esforo, sacrifcios e apoio dado ao longo de todo o
meu percurso acadmico.
De uma forma geral agradeo a todos os meus familiares que estiveram ao meu lado e
acreditaram nas minhas capacidades, e todos os meus amigos que me apoiaram,
agradecendo em especial ao meu namorado Bruno pela pacincia, compreenso e amizade
que disponibilizou sempre e incondicionalmente.
iii
iv
LISTA DE ABREVIATURAS
v
vi
RESUMO
vii
viii
ABSTRACT
ix
x
CONTEDOS
ABSTRACT ...................................................................................................................... ix
1.1.1 Definio 1
1.1.2. Leses Msculo Esquelticas ligadas ao trabalho 1
1.1.3. Factores de risco 3
2.3.1. Enquadramento 10
2.3.2. Modelo de regresso logstica univariado 11
2.3.2.1. Funo de verosimilhana 14
2.3.2.2. Teste de Wald 15
2.3.3. Modelo de regresso logstica multivariado 16
2.3.3.1. Testes de significncia estatstica 17
2.3.3.2. Mtodos de seleco de variveis 18
2.3.3.2.1. Seleco automtica 21
xi
2.3.4. Razo de possibilidades (odds ratio) 22
2.3.5. Avaliar o ajuste do modelo 24
4.1. CONCLUSES......................................................................................................... 49
ANEXOS ......................................................................................................................... 53
BIBLIOGRAFIA ............................................................................................................. 55
xii
NDICE DOS GRFICOS:
Grfico 1- Curva ROC, para uma dada capacidade de discriminao, com a variao do
critrio de deciso 28
Grfico 2- Distribuio da percentagem de enfermeiros que prestam apoio ao domiclio
segmentado por sexo 34
Grfico 3- Queixas nas regies corporais por parte dos enfermeiros que prestam apoio ao
domiclio (em %) 34
Grfico 4- Queixas nas regies corporais por parte dos enfermeiros que no prestam apoio
ao domiclio (em %) 35
Grfico 5- Curva ROC para os quatro modelos 43
Grfico 6- Curvas ROC dos modelos dois a dois 45
xiii
NDICE DE TABELAS:
xiv
CAPTULO 1- INTRODUO
1.1.1 Definio
H provas evidentes que em certos factores relacionados com o trabalho esto associados
ao elevado risco dos trabalhadores apresentarem leses no seu sistema msculo-esqueltico
(Carneiro, 2005).
Podem evidenciar-se algumas causas de LME de natureza biomecnica, tais como a fora e
a postura em que os movimentos so realizados, e factores psicossociais associados
representao individual das condies de trabalho e que se traduzem por insatisfao,
fadiga e stress (Direco Geral de Sade, 2008).
As Leses Msculo Esquelticas ligadas ao trabalho (LMELT) foram, ao longo das ltimas
dcadas, referidas como as alteraes de sade mais frequentes relacionadas com diversos
contextos de trabalho (Direco Geral de Sade, 2008).
1
Em Inglaterra segundo Health & Safety Commission em 1990, as LMELT so mesmo
consideradas as mais frequentes doenas relacionadas como o trabalho, nos Estados Unidos,
so consideradas por alguns autores Maland (1993) e Muggleton (1999) como uma
possvel epidemia do sculo XXI (http://www.ensp.unl.pt).
Com base nas publicaes da Direco Geral de Sade (2008) so indicados como factores
para o desenvolvimento das LMELT seguintes aspectos:
(1) Uma actividade realizada fundamentalmente por gestos repetitivos que implicam a
necessidade de adopo de posies angulares extremas dos membros;
(2) Esforos excessivos;
2
1.1.3. Factores de risco
Como factores de risco associados ao trabalho considera-se algo que possa provocar um
efeito adverso, como por exemplo as tendinites. A exposio ao factor de risco pode causar
doena ou leso, dependendo de um conjunto de factores adicionais.
3
Modelo organizacional de produo (Direco Geral de Sade, 2008).
1.2. A EMPRESA
A TecMinho uma associao de direito privado sem fins lucrativos, criada em 1990.
Tendo como promotores a Universidade do Minho e a Associao dos Municpios do Vale
do Ave e como misso fundamental fazer uma ligao da universidade com a sociedade,
contribuindo assim, para o desenvolvimento regional atravs da melhoria de
competitividade das organizaes e aumento das competncias dos indivduos
(www.tecminho.uminho.pt).
O termo spin-off deriva do ingls e utiliza-se para descrever uma nova empresa que nasceu
a partir de um grupo de pesquisa, universidade ou centro de pesquisa (pblico ou privado),
tendo normalmente como objectivo explorar um novo produto ou servio de alta tecnologia.
comum que as spin-offs se estabeleam em incubadoras de empresas ou reas de
concentrao de empresas de alta tecnologia
(www.empreendedorismo.uac.pt/spinofss/spinoffs_academicos).
4
O estatuto de spin-off concebido a projectos com vnculo a departamentos ou centros de
investigao que visem criar empresas aptas para valorizarem resultados de investigao
gerados no decurso de actividades cientficas conduzidas pela sociedade acadmica, tais
como os investigadores, os bolseiros de investigao ou alunos de ps-graduao
(www.empreendedorismo.uac.pt/spinofss/spinoffs_academicos).
Assim, este trabalho focou-se na anlise estatstica, descritiva e inferencial, das variveis
de forma a encontrar um modelo estatstico mais pertinente e que se melhor se ajustasse a
5
compreender quais as queixas e factores que poderiam estar relacionadas com as LME nos
enfermeiros que prestam apoio ao domiclio.
1.4. OBJECTIVOS
6
CAPTULO 2- ENQUADRAMENTO TERICO
Deparados com um conjunto de dados e com o objectivo de efectuar uma anlise estatstica
deve-se fazer uma escolha racional acerca do mtodo mais apropriado a esta.
Neste sentido tem-se que ter em ateno algumas consideraes importantes, como o caso
dos objectivos definidos, no contexto de um problema especfico, as caractersticas
matemticas envolvidas, as hipteses estatsticas a serem feitas sobre as variveis em
anlise e ainda a forma de recolha dos dados (Braga, 1994).
Numa primeira fase, que compreendeu a anlise dos dados, procurou entender-se os
comportamentos das variveis em anlise, recorrendo-se geralmente a uma anlise
exploratria. Esta, englobou o clculo das principais caractersticas amostrais, assim como
grficos adequados, de forma a estudar-se os comportamentos das variveis, e ainda,
qual/quais as variveis de interesse para o estudo.
A estatstica indutiva permite tirar concluses para um domnio mais vasto do que os
elementos observados ou experimentados. Essas inferncias so realizadas por aplicao
em amostras aleatrias de intervalos de confiana e testes paramtricos ou no
paramtricos (Pestana e Gageiro, 2005).
7
2.1.1. Escalas de atitudes e opinies:
Os dados podem ser de diferentes tipos e, portanto, necessitam ser tratados com mtodos
estatsticos diferentes. Podendo assim dividir-se os dados em quantitativos e qualitativos
(Pestana e Gageiro, 2005).
8
outro e que os valores diferem em intervalos iguais. A escala de razo ou rcio uma
escala de intervalo, porm possui um zero absoluto (Bessa, 2007).
Os dados quantitativos podem ainda ser descritos pela distino entre os tipos discretos e
contnuos.
Os dados discretos so aqueles que provem de uma varivel discreta, isto , que apenas
tomam valores finitos ou numervel de valores distintos. Os dados que no so discretos
podem ser provenientes de variveis contnuas, isto , tomam valores num conjunto de
nmeros reais, possivelmente ilimitado (Athayde, 2005).
Na anlise estatstica dos dados optou-se pela utilizao do software SPSS (Statistical
Package for the Social Sciences) teve origem em 1968, na Chicago University, sendo
divulgado e com utilizao global desde ento. Sendo desde 1994, representado em
Portugal pela PSE- Produtos e Servios de Estatstica, Lda (www.pse.pt).
O software SPSS um sistema que permite organizar dados e executar anlises estatsticas.
Tem um ambiente grfico muito apelativo com o qual, para a maioria das anlises a
efectuar, basta a seleco das respectivas opes em menus e caixas de dilogos (Laureano
e Botelho, 2010).
9
2.3. REGRESSO LOGSTICA
2.3.1. Enquadramento
Atravs dos recursos matemticos e estatsticos cedidos pela anlise de regresso pode
encontrar-se funes que estimem o comportamento de um conjunto de dados que no se
dispem, a partir de dados recolhidos.
O termo de regresso apareceu pela primeira vez na literatura em Galton (1885), citado por
Braga (1994).
Tal como referido por Hosmer e Lemeshow (1989), nos modelos de regresso linear
simples ou mltipla a varivel dependente Y uma varivel aleatria de natureza contnua,
sendo esta em alguns casos qualitativa e expressa em funo de duas ou mais variveis de
natureza categrica, isto , admite dois ou mais valores.
10
e serve para descrever a relao entre a varivel dependente nominal e o conjunto de
variveis independentes atravs da funo logit (Braga, 1994).
Quando a regresso logstica usada deve-se primeiramente achar o modelo que melhor se
ajuste aos dados em anlise, com o intuito de se obter um modelo moderado e
biologicamente razovel, que permita descrever a relao entre a varivel resultado e um
conjunto de variveis independentes (Braga, 1994).
Qualquer problema de regresso passa por estimar o valor esperado da varivel resposta, Y,
dado o valor das variveis independentes, x.
Na regresso linear assume-se que este valor esperado pode ser expresso como uma
equao linear em funo de x,
Considerando o modelo de regresso linear simples tem-se
E Y | x 0 1 x (1)
Tendo em conta a expresso anterior, verifica-se, que E Y | x pode tomar qualquer valor
compreendido no intervalo ; .
11
Na regresso linear a observao da varivel resultado pode ser expressa como
y E Y | x , (2)
Contudo, isto, no se verifica quando se tem uma varivel resultado dicotmica. Assim,
nesta situao deve-se expressar o valor da varivel como
y ( x ) , (3)
considerando-se x E Y | x .
De acordo com Hosmer e Lemeshow (1989), quando se trabalha com dados dicotmicos, a
mdia dever assumir valores entre 0 e 1. A variao de E Y | x em funo de x, menor
Foram propostas muitas funes para anlise de variveis dicotmicas, Cox, em 1970,
(citado por Hosmer e Lemeshow, 1989) apresentou vrias razes para a escolha da
distribuio logstica para a anlise de dados, destacando-se:
(1) O ponto de vista matemtico, como sendo uma funo extremamente flexvel e
muito usada;
(2) Por si mesma, conduz a uma fcil interpretao dos resultados em termos
biolgicos.
12
sendo Y uma varivel aleatria que segue uma distribuio de Bernoulli, com a seguinte lei
de probabilidade:
Y 1 P( Y 1 ) ( x ) sucesso
, (5)
Y 0 P( Y 0 ) 1 ( x ) insucesso
x
g x ln , (9)
1 x
obtendo-se
g x 0 1 x , (10)
onde g ( x ) ; x .
13
Esta transformao chamada de transformao logit de probabilidade x . A razo
x 1- x , (11)
modelos de regresso linear. A funo logit, g x , linear nos seus parmetros, podendo
14
O princpio de mxima verosimilhana usa para estimativa de os valores que
maximizam a expresso obtida em (12). Contudo, mais fcil trabalhar com a expresso
dos logaritmos da verosimilhana, sendo
L ln l yi ln x 1 yi ln 1 x
i 1
(13)
O teste de Wald, descrito por Polit (1996) e Agresti (1990) ( citado por Crichton (2001)),
uma das possveis formas de testar se os parmetros associados com um grupo de variveis
explicativas tomam o valor zero.
W (14)
Var
15
Todavia, o teste de Wald, falha quando se rejeita coeficientes que so estatisticamente
significativos (Hauck e Donner, 1977, citado por Crichton (2001). Assim, aconselha-se que
os coeficientes, identificados por este teste como sendo estatisticamente no significativos,
sejam testados novamente pelo teste da razo de verosimilhana.
A regresso logstica pode ser utilizada, fazendo as necessrias adaptaes, para modelar
situaes com mais do que uma varivel independente.
variveis independentes e yi uma varivel dicotmica. A funo logstica que se usa para
modelar esta situao semelhante usada para o modelo univariado apresentado
anteriormente, envolvendo as m variveis independentes:
e 0 1x1 ... m xm
xi (15)
1 e 0 1x1 ... m xm
L n
yi xi 0
0
0 i 1
n , j 1,...,m (16)
L x y x 0
0
j
i 1
ij i i
16
Salienta-se que neste estudo, importante reduzir o nmero de variveis a serem includas
no modelo. Esta reduo constitui uma mais-valia em termos estatsticos pois o aumento do
nmero de variveis includas tende a aumentar o risco de sobreajuste do modelo,
principalmente em amostras de pequena dimenso (Hosmer e Lemeshow, 1989).
Assim, regra geral, esta situao traduz-se em valores extremamente elevados das
estimativas dos coeficientes e/ou dos erros padro.
17
onde o modelo ajustado corresponde ao modelo que inclui apenas as variveis desejadas e
o modelo saturado corresponde ao modelo com todas as variveis e interaces. Por outras
palavras, o modelo saturado contm tantos parmetros quanto observaes.
Indo ao encontro de Hosmer e Lemeshow (1989), segue-se alguns passos que podem ajudar
quando se tem que seleccionar as variveis a serem includas no modelo de regresso
18
logstica. Este processo semelhante ao utilizado na construo do modelo de regresso
linear.
Deste modo o processo pode ser descrito tendo em conta os seguintes passos:
(A) Deve-se iniciar o processo por uma anlise univariada e individual de cada uma das
variveis. Hosmer e Lemeshow (1989) sugeriram que variveis nominais, ordinais e
contnuas com alguns valores inteiros podero ser tratadas recorrendo-se a tabelas de
contingncia dos p nveis da varivel dependente versus os k nveis da varivel
independente.
Quando se trata de variveis independentes e contnuas desejvel que a anlise univariada
envolva o ajuste de um modelo de regresso logstica como o objectivo de se obter
estimativas dos coeficientes, estimativas de erro padro, o teste de razo de verosimilhana
para a significncia dos coeficientes e estatsticas de Wald univariada.
Pode-se ainda usar como alternativa o teste-t para duas amostras.
O teste-t para duas amostras independentes usa-se quando se pretende comparar as mdias
de uma varivel quantitativa em dois grupos diferentes de indivduos e se desconhecem as
respectivas varincias populacionais (Pestana e Gageiro, 2005).
A anlise baseada neste teste poder ser til na determinao da incluso ou excluso da
varivel no modelo.
(B) Quando a anlise univariada estiver concluda passa-se para uma anlise multivariada.
Aps sujeitas a um teste univariado selecciona-se as variveis que apresentarem um valor
prova inferior a 0.25, sendo essas variveis tomadas como candidatas ao modelo
multivariado (pode-se ainda incluir no mesmo modelo variveis consideradas importantes
no contexto do estudo ou anlise).
A escolha do valor 0.25 como critrio de seleco foi feita tendo em conta os trabalhos
realizados em regresso linear e regresso logstica de Bendel e Afifi, e, Mickey e
Greenland, citado por Braga (1994).
19
Segundo estes autores, o valor de 0.05 por vezes falha para algumas das variveis em
anlise, por outro lado, quando se consideram nveis elevados podem-se incluir no modelo
variveis com interesse questionvel.
Geralmente a deciso comea por ter em conta um modelo multivariado com todas as
variveis possveis dependente da dimenso e nmero de elementos que constituem cada
grupo de variveis candidatas ao modelo.
Assim, quando se tem dados adequados para suportar a anlise ser conveniente comear o
modelo multivariado nesse ponto. Caso contrrio, esta aproximao pode conduzir a um
modelo numericamente instvel. Neste ultimo caso, a estatstica de Wald no dever ser
usada para a seleco das variveis. Dever-se- recorrer a uma aproximao para seleco
de variveis baseada no mtodo passo a passo, no qual as variveis seleccionadas quer por
incluso, quer por excluso segundo uma ordem sequencial baseada unicamente num
critrio estatstico (Braga, 1994; Hosmer e Lemeshow, 1989).
(C) Com o modelo multivariado construdo, tem-se que verificar a importncia de cada
varivel a ser includa neste. Para isso, deve-se aplicar o teste de Wald para cada varivel e
comparar o valor de cada coeficiente estimado com o seu valor no modelo univariado
contendo somente essa varivel.
As variveis que no contribuam para explicar correctamente o modelo devero ser
eliminadas e ajustar-se um novo modelo. Este novo modelo dever ser comparado com o
antigo aplicando-se o teste da razo de verosimilhana.
O processo de retirar, reajustar, e verificar deve continuar at parecer que as variveis
explicativas do modelo estejam todas includas e em oposio s pouco importantes
excludas do modelo.
Se no fim do processo da anlise univariada se tiver um nmero elevado de variveis
candidatas a explicativas ao modelo, ser aconselhvel utilizar-se a tcnica passo a passo
(Braga, 1994; Hosmer e Lemeshow, 1989).
(D) Por fim, e aps se ter obtido um modelo que parea conter as variveis importantes,
deve-se fazer uma reanlise de forma a se considerar a necessidade da incluso de
interaco entre variveis (Braga, 1994; Hosmer e Lemeshow, 1989).
20
2.3.3.2.1. Seleco automtica
Qualquer procedimento para adio ou remoo de variveis num modelo baseado num
algoritmo que verifica a importncia das variveis, incluindo ou excluindo-as do modelo,
baseando-se na regra de deciso.
O critrio para adio ou remoo de variveis, em regresso linear, geralmente baseado
na estatstica F, comparando os modelos com e sem as variveis em anlise. Em regresso
logstica, os erros seguem uma distribuio binomial sendo baseado do teste de razo de
verosimilhana.
Existem mtodos automticos que podem ser utilizados na deciso de inserir e remover
variveis.
Seguidamente, descrevem-se os mtodos implementados no SPSS.
21
Forward (Wald): Mtodo de seleco Stepwise baseado na significncia da
estatstica de pontuao e testes de remoo com base na probabilidade da estatstica
de Wald; (SPSS Inc., 2007).
Stepwise um dos mtodos mais utilizados e consiste na combinao dos dois mtodos
anteriores (Forward e Backward). Este, inicia com uma varivel (a que apresentar maior
correlao com a varivel resposta), e a cada passo do Forward, depois de incluir uma
varivel, aplica o Backward para ver se ser descartada alguma varivel. Continua-se o
processo at este no incluir ou excluir nenhuma varivel (http://portalaction.com.br).
Actualmente muitos investigadores optam por analisar a relao entre duas variveis de
escala nominal atravs do rcio de produtos cruzados razo de possibilidade, pois tem
uma interpretao mais fcil do que o teste de Qui Quadrado (Bessa, 2007).
22
De acordo com Bessa (2007), a razo de possibilidade uma medida antiga tendo sido
usada por Snow no seu trabalho clssico de identificao do factor risco da propagao da
clera em Londres (1853). Sendo utilizado como medida de associao em estudos de
caso- controle e em estudos transversais controlados.
A razo de possibilidade a razo entre duas odds, onde as odds so calculadas da seguinte
forma:
X X
Y a b a+b
Y c d c+d
23
razo de possibilidades 1 implica que o evento igualmente provvel em ambos
os grupos;
razo de possibilidades 1 significa que o evento mais provvel no 1 grupo;
razo de possibilidades 1 implica que o evento menos provvel no 1 grupo.
Assim, segundo o que foi referido em Pestana e Gageiro (2005) ,uma medida mais directa
comparando as probabilidades em dois grupos o risco relativo, que tambm conhecida
como a relao de risco. O risco relativo simplesmente a razo de duas probabilidades
condicionais.
Quando se fala na qualidade do ajuste de um modelo de regresso logstica tem que se ter
em ateno a anlise de medidas das diferenas entre os seus valores observados da
varivel resposta, y, e os resduos.
24
Relativamente s medidas das diferenas dos valores observados e preditos, usados em
regresso logstica, destacam-se os resduos de Pearson e os Deviance residuals, denotados
por r e d, respectivamente.
Ou seja:
y j m j j
rj r y j , j (22)
m j j 1 j
yj m j y j
e d j d y j ,x j 2 y j ln m j y j ln (23)
m m j 1 j
j j
Devendo-se rejeitar a hiptese nula para valores elevados da estatstica de teste, essa
aproximao s valida se os valores de m j forem tambm elevados (Kuss (2002), citado
Denote-se:
ng : o nmero de indivduos;
cg
m j j
g : mdia das probabilidades estimadas para o grupo k , com g = .
j=1 ng
25
Assim, a estatstica de Hosmer-Lemeshow, segue uma distribuio aproximadamente de
um Qui-quadrado com g-2 graus de liberdade, segundo uma hiptese de o modelo ser o
adequado.
Rejeitando-se a hiptese nula para valores elevados da estatstica de teste, C, e podendo
expressar-se da seguinte forma:
g
og ng g
C (24)
k 1 ng g 1 g
Note-se que este resultado depende dos grupos que so escolhidos (Martins, 2008).
Uma pratica comum, na rea relacionada com a medicina, a forma de se descrever como
e quanto uma varivel contnua ou categrica ordinal capaz de classificar materiais ou
indivduos em grupos definidos.
A anlise ROC (Receiver Operating Characteristc) uma ferramenta que permite medir e
especificar problemas no desempenho do diagnstico em medicina.
A curva ROC foi usada pela primeira vez durante a segunda Guerra Mundial aplicada
anlise de radar antes de ter sido empregue na teoria de deteco de sinais (Green e Sweets,
citado Braga (2000)). Depois do ataque a Pearl Harbor, em 1941, o exrcito dos Estados
Unidos focou-se na investigao vocacionada a aumentar a previso de detectar
correctamente avies Japoneses atravs dos sinais de radar.
Nas dcadas de 60 e 70, as curvas ROC foram utilizadas na psicologia experimental e em
ramos da biomdica, respectivamente. Nesta ultima, o objectivo principal passou
basicamente por classificar os indivduos em doentes ou no doentes. (Braga, 2000 ).
26
2.4.2. Conceitos bsicos
A anlise da curva ROC pode ser feita por meio de um grfico simples e robusto, que nos
permite estudar a variao da sensibilidade e especificidade, para diferentes valores de
corte.
A sensibilidade (Sens.) definida como a probabilidade do teste fornecer um resultado
positivo, dado que o indivduo realmente portador da doena, enquanto, a
especificidade (Esp.) definida como a probabilidade do teste fornecer um resultado
negativo quando o indivduo no portador da doena (Margotto).
De outra forma, pode-se dizer que as curvas ROC foram desenvolvidas no ramo das
comunicaes como uma forma de demonstrar as relaes entre sinal-rudo. Neste sentido,
podemos interpretar o sinal como os verdadeiros positivos (sensibilidade) e o rudo, como
os falsos positivos (1- especificidade) (Braga, 2000).
Negativo (-) FN VN
Falsos negativos Verdadeiros negativos
27
2.4.3. Grfico da curva ROC
Tendo em conta o que foi citado em Braga (2000), a curva ROC um grfico de
Sensibilidade (ou taxa de verdadeiros positivos) versus taxa de falsos positivos, ou seja,
representa-nos a Sensibilidade (ordenadas) e 1 Especificidade (abcissas), resultantes da
variao de um valor de corte ao longo do eixo de deciso x.
Assim, a representao da curva ROC, permite evidenciar os valores para os quais existe
optimizao da Sensibilidade em funo da e Especificidade correspondente ao ponto que
se encontra mais prximo do canto superior esquerdo do diagrama, uma vez que o indcio
de verdadeiro positivo 1 e o de falso positivo 0.
Graficamente tem-se:
Sensibilidade (FVP)
1-Especificidade (FFP)
Grfico 1- Curva ROC, para uma dada capacidade de discriminao, com a variao do critrio de deciso
Fonte: Braga (2000)
A curva ROC discrimina entre dois estados, onde cada ponto da curva representa um
compromisso diferente entre a Sensibilidade e o falso positivo que pode ser definido pela
adopo de um valor diferente do ponto de corte de anormalidade. Um critrio restrito
28
aquele que traduz uma pequena fraco de falsos positivos assim como uma pequena
fraco de verdadeiros positivos (Braga, 2000).
O valor do ponto de corte definido com um valor que pode ser seleccionado
arbitrariamente pelo pesquisador entre os valores possveis para a varivel de deciso,
acima da qual o paciente classificado positivo e abaixo do qual classificado como
negativo.
De acordo com Braga (2000), para cada ponto de corte so calculados valores de
Sensibilidade e Especificidade, estes valores podem assim ser dispostos no grfico. Um
classificador perfeito corresponderia a uma linha horizontal no topo do grfico, o que
bastante difcil de se obter. Na prtica, curvas consideradas boas estaro entre a linha
diagonal e a linha perfeita, onde quanto maior a distncia da linha diagonal, melhor o
sistema. A linha diagonal indica uma classificao aleatria, ou seja, um sistema que
aleatoriamente selecciona sadas como positivas ou negativas. Finalmente, a partir de uma
curva ROC, devemos poder seleccionar o melhor limiar de corte para obtermos o melhor
desempenho possvel.
Se o objectivo for verificar diferenas entre duas ou mais Curvas ROC, a avaliao feita
atravs da determinao da rea abaixo da curva, usando uma modificao do teste da
soma de ordens de Wilcoxon para esta comparao. Assim possvel quantificar a
exactido de um teste diagnstico (proporcional rea abaixo da curva), alm da
possibilidade de comparar testes diagnsticos.
A rea abaixo da curva ROC est associada ao poder discriminante de um teste diagnstico.
Dado um individuo doente e outro no doente, ambos escolhidos ao acaso, esta medida
interpretada como a probabilidade do individuo portador de doena ter um resultado ao
teste diagnstico de maior magnitude que aquele no doente (Begg, 1991 citado em
Martinez, Neto-Louzada, e Pereira ( 2003)).
29
discriminar os indivduos segundo estes dois grupos, mais a curva se aproxima do canto
superior esquerdo do grfico, e a rea abaixo da curva ROC prxima de 1. Para Pepe
(2000), citado por Martinez, Neto-Louzada, e Pereira (2003), a rea abaixo da curva ROC
uma medida no paramtrica da distncia entre as distribuies dos resultados dos testes,
para indivduos classificados como doentes e no doentes.
Quando apresentam a curva ROC, alguns autores optam por apresentar para o eixo das
abcissas a Especificidade em alternativa a 1-Especificidade, isto no altera a estimativa da
rea abaixo da curva. Se a curva ajustada utilizando-se a teoria pertinente distribuio
normal, a rea e o seu desvio padro podem ser obtidos por recurso aos estimadores de
mxima verosimilhana (Begg, 1987 citado em Martinez, Neto-Louzada, & Pereira,
(2003)).
Analiticamente, a rea abaixo da curva ROC pode ser determinada atravs de:
Mtodos de resoluo numrica, como por exemplo, a regra do trapzio;
Mtodos estatsticos: Relao com a estatstica de Wilcoxon-Mann-Witney (Hanley,
1988, citado por Braga (2000)); e estimativa de Mxima Verosimilhana (Hanley e
McNeil, 1982, citado por Braga (2000)).
2.4.5. Comparao de modelos com recurso ao teste da rea abaixo da curva ROC
Numa escala comum, os grficos que representam duas ou mais curvas ROC associadas a
diferentes testes diagnsticos contnuos permitem uma imediata comparao de
desempenhos (Martinez, Neto-Louzada, e Pereira, 2003).
Salienta-se que quando se est a comprar duas curvas ROC pode-se encontrar duas
situaes distintas:
(a) As curvas ROC empricas so diferentes e no se cruzam, sendo o teste diagnstico
com maior rea abaixo da curva aquele que apresenta melhor desempenho;
(b) As curvas ROC cruzam-se, as reas abaixo da curva so prximas, mas os testes
diagnsticos apresentam desempenhos diferentes.
30
Um mtodo para testar se as diferenas entre duas reas abaixo das curvas ROC
provenientes de amostras independentes so significativas, consiste na utilizao da razo
crtica z, definida por Hanley e McNeil (1983):
A1 A2
z N 0,1 (25)
SE12 SE22
onde A1 e A2 correspondem as reas e SE1 e SE2 correspondem aos erros estimados para a
curva ROC, respectivamente para os testes diagnsticos 1 e 2. As reas e os respectivos
erros padro so obtidos atravs da aproximao estatstica de Wilcoxon-Mann-Whitney
(Braga, 2000).
Quando os valores da rea abaixo da curva ROC so superiores a 0.5, os erros padro
associados s reas, podem ser obtidos atravs da seguinte expresso:
A 1 A nA 1 Q1 A2 nN 1 Q2 A2
SE A (26)
n A nN
31
32
CAPTULO 3- ANLISE DE DADOS
Para iniciar o estudo do questionrio online comeou-se por uma anlise inicial de dados,
considerando como objectivo principal do trabalho compreender quais as queixas que
melhor explicam as leses msculo esquelticas (quando prestado apoio ao domiclio).
Uma vez que a varivel Presta cuidados de enfermagem ao domiclio ser considerada
como varivel independente para a anlise, elaborou-se uma anlise para esta varivel.
Verificou-se que das 147 respostas obtidas 125 enfermeiros prestam cuidados ao domiclio,
correspondendo a uma percentagem de 85%.
33
Efectuando-se uma anlise da questo em funo do sexo, verificou-se que a percentagem
de mulheres superior a percentagem de homens, quando estes prestam apoio ao domiclio.
74% 26%
Homens
87% 13%
Mulheres
sim no
Grfico 2- Distribuio da percentagem de enfermeiros que prestam apoio ao domiclio segmentado por
sexo
Grfico 3- Queixas nas regies corporais por parte dos enfermeiros que prestam apoio ao domiclio (em %)
34
Sem Domiclio Sim No
Grfico 4- Queixas nas regies corporais por parte dos enfermeiros que no prestam apoio ao domiclio
(em %)
Aps anlise grfica verifica-se que as percentagens de respostas para os dois casos so
semelhantes. Contudo, a regio lombar apresenta uma percentagem mais elevada quando
os enfermeiros prestam apoio ao domiclio (69%) comparando com a percentagem de
respostas por parte dos enfermeiros que no prestam apoio ao domiclio (41%). Daqui,
pode-se prever que a regio lombar est associada como sendo uma causas das LME dos
enfermeiros.
3.2.RAZO DE POSSIBILIDADES
35
A intensidade da relao entre as variveis qualitativas faz-se usando medidas de
associao. A razo de probabilidade mede a ocorrncia de um acontecimento em relao a
outro. Ou de forma anloga, mede a associao entre duas variveis nominais, em que uma
das variveis pode ser designada por factor, e a outra por acontecimento.
vs
H1 :" Existe uma relao de dependncia entre as var iveis, isto , razo de possibilidade
diferente de 1"
A zona que parece mais pertinente para anlise, devido ao seu valor da razo de
possibilidades, a zona lombar.
Com 95% de confiana, e com um valor de razo de possibilidade de 3.185 e um respectivo
intervalo de confiana de [1.256; 8.0759] pode-se concluir que os enfermeiros que prestam
36
apoio ao domiclio tm uma possibilidade trs vezes maior no que diz respeito a virem a ter
queixas de LME na regio lombar, comparativamente com os que no prestam apoio ao
domiclio.
Aps se verificar que a zona lombar apresenta maior evidncia que relacione este tipo de
queixas com alguns factores associados a estes profissionais, pretende-se construir um
modelo usando regresso logstica.
Neste sentido, e filtrando apenas os enfermeiros que prestam apoio ao domiclio,
considerou-se como varivel dependente Dor na Lombar, e como variveis
independentes V1 a V54 (Codificadas em anexo- Tabela A1).
37
Varivel S.E Wald Sig. Exp( )
38
V35 0.189 0.172 1.206 0.272 1.208
V36 0.178 0.123 2.097 0.148 1.195
V37 0.699 0.572 1.495 0.221 2.012
V38 1.211 0.561 4.657 0.031 3.357
V39 0.325 0.505 0.416 0.519 1.385
V40 -2.254 0.863 6.831 0.009 0.105
V41 0.616 0.701 0.773 0.379 1.851
V42 0.061 0.159 0.145 0.704 1.062
V43 -0.322 0.19 2.874 0.09 0.725
V44 -0.222 0.389 0.327 0.569 0.801
V45 -0.152 1.24 1.511 0.291 0.218
V46 0.335 0.273 1.501 0.221 1.348
V47 0.271 0.296 0,841 0.359 1.311
V48 0.352 0.325 1.178 0.278 1.423
V49 1.227 0.452 7.380 0.007 3.41
V50 0.347 0.465 0.556 0.456 1.415
V51 0.191 0.494 0.149 0.7 1.21
V52 1.387 0.577 5.788 0.016 4.004
V53 -1.161 0.581 3.992 0.046 0.313
V54 -0.283 0.493 0.33 0.565 0.753
Tabela 4- Valores relevantes da aplicao de regresso logstica univariada.
39
Dor Dorsal;
Dor Coxas;
Dor Tornozelo;
Pulsos: toro lateral;
Pulsos: postura;
Pulsos: movimentos repetitivos;
Pulsos: fora;
Tronco: Toro lateral;
Pescoo: toro lateral;
Figura braos;
Braos: Abduo;
Braos: rotao;
Apoio brao;
Tempo da actividade;
Auxiliares de movimentao;
Espao caracterizao;
Altura cama/sof;
Stress;
Satisfao com o trabalho.
Tendo em conta esta lista de variveis, o prximo passo consiste em construir um modelo
aplicando-se o princpio de regresso logstica multivariada, para isso recorreu-se aos
mtodos implementados no SPSS (e descritos na seco 2.3.3.2.1).
40
(1) Modelo 1 1.763 V 26 0.843 V 36 2.877 V 40 2.464 V 53 0.504 Forward Stepwise
(3) Modelo 3 2.235 V12 1.899 V 26 1.751 V 33 2.781 V 40 2.089 Forward Stepwise
(4) Modelo 4 2.226 V 3 0.006 V 5 0.608 V 43 0.116 V 45 0.983 V 53 3.470 Forward Stepwise
Para os dois ltimos modelos apresentados foram retiradas algumas das variveis
candidatas, aplicando-se o mtodo Forward Stepwise.
Isto, segundo um critrio pessoal, uma vez que se achou interessante verificar o que
acontecia se se retirasse da anlise algumas variveis e se considera-se apenas as que
parecessem ter relao, como exemplo do modelo 4, em que foram retiradas da anlise as
variveis referentes a dores e zonas corporais.
Para o modelo 3 entraram como variveis candidatas: Idade; Postura dos pulsos;
Movimentos repetitivos dos pulsos; Fora dos pulsos; Toro lateral do tronco; Toro
lateral do pescoo; Figura dos braos; Abduo dos braos; Rotao dos Braos; Apoio dos
Braos; Tempo de Actividade; Dor na cervical; Dor nos ombros, Dor nos punhos; Dor na
dorsal; Dor nas coxas e Dor nos tornozelos. No final, destas variveis, apenas se obteve
41
como explicativas para este modelo 4 das variveis. (Movimentos repetitivos dos pulsos;
Toro lateral do pescoo; Braos encontram-se em apoio, havendo suporto do seu peso e
Dor nos punhos).
Por ltimo, para construo do modelo 4, as variveis candidatas utilizadas foram: LME
antiga; Outra actividade; Idade; Antiguidade na profisso; Tempo de actividade, Altura da
cama/ sof; Auxiliares de movimentao; Stress e Satisfao. Destas, a tcnica Forward
Stepwise seleccionou as LME antigas; Idade; Tempo de actividade; Auxiliares de
movimentao e Satisfao do trabalho.
42
Grfico 5- Curva ROC para os quatro modelos
Para cada uma das curvas apresentadas obteve-se o valor da rea e os respectivos intervalos
de confiana a 95%.
Atravs da anlise da curva ROC verificou-se que para todos os modelos que o valor da
rea est acima de 0.7, e com um erro padro associado no superior a 0.053, o que
significa que tm um bom poder discriminante no que concerne avaliao das queixas
referentes regio lombar por parte dos enfermeiros que prestam apoio ao domiclio.
3.4.2. Comparao de modelos com recurso ao teste da rea abaixo da curva ROC
43
Ou seja, queremos verificar a igualdade das reas entre os dois modelos. Isto , vai-se
comparar
A1 versus A2
A1 versus A3
A1 versus A4
A2 versus A3
A2 versus A4
A3 versus A4
44
Grfico 6- Curvas ROC dos modelos dois a dois
Indo ao encontro do que foi dito em 2.4.5., e aplicando a frmula (25), tem-se para a
comparao entre os quatro modelos a tabela resumo:
45
M2 M3 M4
A1 A2 A1 A3 A1 A4
z1 0.55 z2 0.14 z3 1.581
2 2 2 2 2 2
M1 SE A1 SE A2 SE A1 SE A3 SE A1 SE A4
M2 z4
A2 A3
0.65 z5
A2 A4
2.164
2 2 2 2
SE A2 SE A3 SE A2 SE A4
M3 z6
A3 A4
1.31
2 2
SE A3 SE A4
Como z segue uma distribuio normal padro recorreu-se ao R, para se obter o valor prova
associado a cada z.
z1=1-pnorm(-0.55,lower.tail=T)
z2=pnorm(0.14,lower.tail=F)
z3=pnorm(1.581,lower.tail=F)
z4=pnorm(0.65,lower.tail=F)
z5=pnorm(2.164,lower.tail=F)
z6=pnorm(1.31,lower.tail=F)
z1 z2 z3 z4 z5 z6
Valor prova 0.582 0.89 0.114 0.516 0.032 0.19
Por anlise dos valores provas associados aos vrios valores de z, e tomando como base de
comparao para regra de deciso 0.05, rejeita-se a hiptese de igualdade de reas apenas
para o valor de z5.
46
Como p value z5 0.032 0.05 , rejeita a hiptese de igualdades de reas para z5, o que
Modelo1 Modelo 2
Modelo1 Modelo3
Modelo1 Modelo 4
Modelo2 Modelo3
Modelo3 Modelo 4
Tendo em conta estes resultados e o valor das reas apresentadas para cada modelo, tomou-
se o modelo 2 como o sendo explicativo das LME dos enfermeiros que prestam apoio ao
domiclio, associado dor na lombar.
Variveis Codificao
V6-Antiguidade na profisso Expressa em anos
Respondia apenas pelos profissionais
V12-Dor punho que prestam apoio ao domiclio.
0-No; 1-Sim
Respondia apenas pelos profissionais
V14- Dor nas Coxas que prestam apoio ao domiclio.
0-No; 1-Sim
V26-Pulsos:movimentos repetitivos Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0-No; 1-Sim
47
V33-Pescoo: toro lateral Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0-No; 1-Sim
V36- Figura braos Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
1-20 extenso a 20flexao; 2- >20
extenso;3- 20 a 45 flexo; 4-45 a
90 flexo;5- > 90 flexo
V40-Apoio do brao Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0-No; 1-Sim
V43- Tempo de actividade Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0- Nunca; Raramente;
1- Com alguma frequncia;
Frequentemente; Sempre
Tabela 8: Codificao das variveis explicativas do modelo
48
CAPTULO 4- CONCLUSO & TRABALHOS FUTUROS
4. Concluses
4.1. CONCLUSES
enfermeiros que prestam apoio ao domiclio tm cerca de trs vezes mais possibilidade de
ter queixas msculo-esquelcticas na regio lombar do que os outros enfermeiros.
Aps se verificar que a zona lombar a zona que apresenta maior evidncia para relacionar
este tipo de queixas com alguns factores associados com estes profissionais, construiu-se
modelos de regresso logstica. Estes modelos foram construdos utilizando os mtodos
implementados em SPSS, obtendo-se quatro modelos distintos:
- O modelo 1 com quatro variveis explivativas (Movimentos repetitivos dos pulsos;
Caracterizao da figura relativa aos braos; Braos encontram-se em apoio,
havendo suporto do seu peso e Satisfao do trabalho);
- O modelo 2 com oito variveis explicativas (Antiguidade na profisso; Dor nos
punhos; Dor nas Coxas; Movimentos repetitivos dos pulsos; Toro lateral do
pescoo; Caracterizao da figura relativa aos braos; Braos encontram-se em
apoio, havendo suporto do seu peso e Tempo de desempenho da actividade);
- O modelo 3 com quatro variveis explicativas (Movimentos repetitivos dos pulsos;
Toro lateral do pescoo; Braos encontram-se em apoio, havendo suporto do seu
peso e Dor nos punhos);
- O modelo 4 com quatro variveis explicativas (LME antigas; Idade; Tempo de
actividade; Auxiliares de movimentao e Satisfao do trabalho).
49
Atravs da anlise da curva ROC obteve-se as curvas referentes a cada modelo, assim
como as respectivas reas, erros padro e intervalos de confiana a 95%.
Uma vez construdos quatro possveis modelos, atravs da comparao de reas abaixo da
curva ROC, seleccionou-se o modelo 2.
Verificou-se que o valor abaixo da curva ROC de 0.844 com um erro padro associado de
0.042 e com um intervalo de confiana a 95% de [0.796; 0.961] o que indica um bom poder
discriminante, no que concerne avaliao das queixas referentes regio lombar
relativamente aos enfermeiros que prestam apoio ao domiclio. O valor 0.844 significa
ainda que 84.4% dos casos do modelo logit apresentado acerta na predio das queixas de
dor na regio lombar para esses enfermeiros.
Neste sentido, as variveis explicativas para as LME dos enfermeiros que prestam apoio ao
domiclio so: Antiguidade na profisso; Dor nos punhos; Dor nas Coxas; Movimentos
repetitivos dos pulsos; Toro lateral do pescoo; Caracterizao da figura relativa aos
braos; Braos encontram-se em apoio, havendo suporto do seu peso e Tempo de
desempenho da actividade.
Com o decorrer da anlise dos resultados teve-se a percepo que se poderia ter realizado
uma anlise mais detalhada, assim como comparao dos resultados utilizando softwares
diferentes.
Uma vez que em regresso logstica a obteno dos modelos no nica, poderia
ter-se obtido uma lista mais elevada de modelos, incluindo ou excluindo novas
variveis;
Comparao dos resultados utilizando o SPSS e o R, com objectivo de verificar se
se obteria resultados semelhantes, e consequentemente, as mesma concluses;
50
Uma anlise dos resduos, para identificar possveis elementos para os quais se
verifique um maior afastamento entre o valor predito e o valor da varivel resposta;
Realizar um estudo das interaces entre as variveis em anlise;
51
52
ANEXOS
Variveis Cdigo
Outra actividade profissional V1
Praticou desporto V2
LME antiga V3
Sexo V4
Idade V5
Antiguidade profisso V6
Peso V7
Altura V8
Dor cervical V9
Dor ombros V10
Dor cotovelos V11
Dor punhos V12
Dor dorsal V13
Dor coxas V14
Dor joelhos V15
Dor tornozelo V16
Horas semanais de apoio ao V17
domiclio
Distribuio semanal do apoio V18
ao domiclio
Trabalho domicilirio V19
efectuado
Actividades ao domiclio V20
Figura antebrao V21
Figura pulsos V22
Pulsos: toro lateral V23
Pulsos: pega V24
Pulsos: postura V25
Pulsos: movimentos repetitivos V26
53
Pulsos: aces rpidas V27
Pulsos: fora V28
Pulsos: choque V29
Figura tronco V30
Tronco: toro lateral V31
Figura pescoo V32
Pescoo: toro lateral V33
Figura pernas V34
Flexo joelhos V35
Figura braos V36
Braos: abduo V37
Braos: rotao V38
Elevao ombro V39
Apoio brao V40
Movimentao paciente V41
Colaborao de um colega V42
Tempo da actividade V43
Pausas V44
Auxiliares de movimentao V45
Caracterizao do espao V46
Espao disponvel V47
Arrumao V48
Altura cama/sof V49
Dependncia do paciente V50
Trato paciente V51
Stress V52
Satisfao com o trabalho V53
Ansioso/ irritavel V54
Tabela A1- Codificao das variveis.
54
BIBLIOGRAFIA
Crichton N. (2001). Wald test; 2001 Blackwell Science Ltd. Jornal of Clinical Nursin,
www.blackwellpublishing.com/specialarticles/jcn_10_774.pdf.
Hosmer, D. J., & Lemeshow, S. (1989). Applied Logistic Regression. Copyright by John
Wiley & Sons, Inc.
Laureano, M., & Botelho, M. (2010). SPSS o meu manual de consulta rpida. Lisboa:
Edies Slabo, Lda, 1 Edio.
Margotto, P. (s.d.). Curva ROC: Como fazer e Interpretar no SPSS. Professor do Curso de
Medicina da Escola Superior de Cincias da Sade (ESCS/CES/DF).
Martinez, E., Neto-Louzada, F., & Pereira, B. (2003). A Curva ROC para testes
diagnsticos. Rio de Janeiro, 11 (1):7-31.
55
Misso, F., & Jacobi, L. F. (2007). Variveis dummy:especificaes de modelos com
parmetros variveis. Brasil: Cincias e Natura, UFSM.
Pestana, M., & Gageiro, J. (2005). Anlise de dados para Cincias Sociais- A
Complementaridade do SPSS. Lisboa: Editora Slibo, 4 Edio.
Rumel, D. (1986). Odds ratio-algumas consideraes. Revista de Sade Publica V.20 n3.
Brasil: Departamento de Epidemiologia da Faculdade de Sade Publica da
Universidade de So Paulo.
www.tecminho.uminho.pt
www.empreendedorismo.uac.pt/spinofss/spinoffs_academicos
www.pse.pt
http://portalaction.com.br
http://www.ensp.unl.pt
56