Sie sind auf Seite 1von 73

Universidade do Minho

Escola de Cincias

Anabela Costa da Silva

Anabela Costa da Silva Anlise Estatstica de Inquritos online


Anlise Estatstica de Inquritos online

UMinho|2011

Outubro de 2011
Universidade do Minho
Escola de Cincias

Anabela Costa da Silva

Anlise Estatstica de Inquritos online

Relatrio de Mestrado
Mestrado em Estatstica de Sistemas
- Especializao em Engenharia e Estatstica

Trabalho efetuado sob a orientao da


Professora Doutora Ana Cristina Braga

Outubro de 2011
AUTORIZADA A REPRODUO PARCIAL DESTA DISSERTAO APENAS PARA EFEITOS
DE INVESTIGAO, MEDIANTE DECLARAO ESCRITA DO INTERESSADO, QUE A TAL SE
COMPROMETE;

Universidade do Minho, ___/___/______

Assinatura: ________________________________________________
Quando recebemos um ensinamento devemos receber como um valioso
presente e no como uma dura tarefa. Eis aqui a diferena que transcende
Alberto Einstein
ii
AGRADECIMENTOS

Durante a realizao deste trabalho deparei-me com momentos bons e momentos menos
bons, e foi nesses momentos onde as coisas no corriam como esperava que contei com o
apoio das pessoas fantsticas que me rodeiam no quotidiano.

Em primeiro lugar cabe-me agradecer a professora Doutora Ana Cristina Braga, pela sua
compreenso, disponibilidade, ateno, pacincia e fora transmitida, assim como todas as
dvidas esclarecidas, e as sugestes dadas. A qualidade deste trabalho deve-se muito a
forma como fui orientada.

Agradeo aos meus pais por todo o esforo, sacrifcios e apoio dado ao longo de todo o
meu percurso acadmico.

Um obrigado especial Empresa GESTA pela oportunidade do estgio, que me


possibilitou demonstrar conhecimentos e capacidades adquiridas ao longo deste Mestrado.
Agradecendo a compreenso e disponibilidade do orientador externo professor Doutor
Paulo Sampaio.

De uma forma geral agradeo a todos os meus familiares que estiveram ao meu lado e
acreditaram nas minhas capacidades, e todos os meus amigos que me apoiaram,
agradecendo em especial ao meu namorado Bruno pela pacincia, compreenso e amizade
que disponibilizou sempre e incondicionalmente.

iii
iv
LISTA DE ABREVIATURAS

LME: Leses Msculo Esquelticas;


LMELT: Leses Msculo Esquelticas Ligadas ao Trabalho;
GESTA: Grupo de Estatstica Aplicada;
QWEB: Certificao de Processos de Negcio Electrnico;
JOCALD 2011: XVIII Jornadas de Classificao e Anlise de Dados;
ENBIS-11: 11th Annual Conference of European Network for Business and Industrial
Statistics;
SNS: Servio Nacional de Sade;
SPSS: Statistical Package for the Social Sciences;
M.M.V: Mtodo de Mxima Verosimilhana;
ROC: Receiver Operating Characteristic;

v
vi
RESUMO

As Leses Msculo Esquelticas (LME) associadas ao trabalho repetitivo constituem


actualmente grande preocupao na generalidade dos pases industrializados (Carneiro,
2005).
Com o objectivo de avaliar o risco de Leses Msculo Esquelticas Ligadas ao Trabalho
(LMELT) nos enfermeiros, elaborou-se um questionrio de forma a recolher a opinio de
profissionais de enfermagem, que exercem a sua profisso em centros de sade da regio
Norte, no que concerne sintomatologia de Leses Msculo Esquelticas associadas ao
desempenho das respectivas funes.
A taxa de resposta ao questionrio foi de aproximadamente 4,87%, ou seja, entre os 3017
profissionais da rea obteve-se 147 respostas completas. Desses 125 prestam apoio ao
domiclio.
Aps uma anlise exploratria das variveis, verificou-se que a regio lombar seria uma
regio que podia estar relacionada com as LME dos enfermeiros, quando estes prestam
apoio ao domiclio. Neste sentido foram calculados os valores de razo de possibilidades
para um conjunto de nove regies (regio cervical, ombros, cotovelos, punho/ mo, dorsal,
lombar coxas, joelhos e tornozelos).
Apontada a zona lombar como a regio com maior evidncia para relacionar este tipo de
queixas com alguns factores associados com estes profissionais, construiu-se modelos de
regresso logstica. Neste sentido, filtrando os enfermeiros que prestam apoio ao domiclio,
considerou-se como varivel dependente dor lombar e como variveis independentes um
conjunto de 54 variveis relacionadas com queixas ou mtodos de desempenho do trabalho.
(variveis apresentadas na tabela A1- anexos).
Este processo realizou-se recorrendo a tcnicas de seleco de variveis implementadas no
SPSS, seleco passo a passo progressiva ou regressiva (Forward e Backward).
Construdos os modelos apresentaram-se as curvas ROC com o objectivo de avaliar em
termos de desempenho qual dos modelos exibia um melhor ajuste no que diz respeito
explicao da dor na regio lombar nos enfermeiros que prestam apoio ao domiclio.
Comparando-se ainda as reas abaixo da curva ROC para os modelos obtidos (comparao
dois a dois), recorrendo-se a regio crtica z, defendida por Hanley e McNeil (1983).

vii
viii
ABSTRACT

Musculoskeletal disorders (MSDs) associated with repetitive work is currently great


concern in most industrialized countries (Carneiro, 2005).
In order to assess the risk of work related musculoskeletal disorders (WRMSDs) on nurses,
who provide home care are prepared a questionnaire to gather the opinion of nurses, who
exercise their profession in health centers in the North, regarding the symptoms of
musculoskeletal injuries associated with the performance of their duties.
The questionnaire response rate was approximately 4.87%, ie between 3017 professionals
we obtained 147 complete responses, of these 125 provide support at home.
After an exploratory analysis of the variables, it was found that the lumbar region would be
one of the regions that could be related to MSDs of the nurses, when they provide support
at home. In this sense we calculated the odds ratio to a set of nine regions (neck, shoulders,
elbows, wrist/ hand, dorsal, lumbar, thighs, knees and ankles).
Considered as the lumbar region with the highest evidence for these complaints relate to
some factors associated with these professionals, we constructed logistic regression models.
In this sense, by filtering nurses who provide home care, it was considered as the dependent
variable complaints in lumbar and a set of 54 variables as independent variables related to
complaints or methods of work performance. (variables shown in table A1- Annexes).
This process was carried out using variable selection techniques implemented in SPSS-
Forward and Backward stepwise methods.
Built the models, the ROC curves are presented in order to evaluate performance in terms
of which of the models showed a better fit with respect to the explanation of lumbar
complaints in nurses who provide home support. Finally the areas under the ROC curve
obtained for the models are compared (pairwise), using the critical region of z statistic ,
proposed by Hanley and McNeil (1983).

ix
x
CONTEDOS

AGRADECIMENTOS ..................................................................................................... iii

LISTA DE ABREVIATURAS ........................................................................................... v

RESUMO ........................................................................................................................ vii

ABSTRACT ...................................................................................................................... ix

CAPTULO 1- INTRODUO ......................................................................................... 1

1.1. LESES MSCULO ESQUELTICAS ............................................................... 1

1.1.1 Definio 1
1.1.2. Leses Msculo Esquelticas ligadas ao trabalho 1
1.1.3. Factores de risco 3

1.2. A EMPRESA ......................................................................................................... 4

1.3. ENQUADRAMENTO E MOTIVAO ............................................................... 5

1.4. OBJECTIVOS ....................................................................................................... 6

1.5. ESTRUTURA DA TESE ....................................................................................... 6

CAPTULO 2- ENQUADRAMENTO TERICO ............................................................. 7

2.1. ANLISE EXPLORATRIA DOS DADOS......................................................... 7

2.1.1. Escalas de atitudes e opinies: 8


2.1.2. Tipo de dados 8

2.2. SOFTWARE UTILIZADO .................................................................................... 9

2.3. REGRESSO LOGSTICA................................................................................. 10

2.3.1. Enquadramento 10
2.3.2. Modelo de regresso logstica univariado 11
2.3.2.1. Funo de verosimilhana 14
2.3.2.2. Teste de Wald 15
2.3.3. Modelo de regresso logstica multivariado 16
2.3.3.1. Testes de significncia estatstica 17
2.3.3.2. Mtodos de seleco de variveis 18
2.3.3.2.1. Seleco automtica 21

xi
2.3.4. Razo de possibilidades (odds ratio) 22
2.3.5. Avaliar o ajuste do modelo 24

2.4. CURVA ROC ........................................................................................................... 26

2.4.1. Perspectiva Histrica 26


2.4.2. Conceitos bsicos 27
2.4.3. Grfico da curva ROC 28
2.4.4. rea abaixo da curva ROC 29
2.4.5. Comparao de modelos com recurso ao teste da rea abaixo da curva ROC 30

CAPTULO 3- ANLISE DE DADOS ........................................................................... 33

3.1. ANLISE PRELIMINAR DOS DADOS .................................................................. 33

3.2.RAZO DE POSSIBILIDADES ................................................................................ 35

3.3. MODELOS DE REGRESSO LOGSTICA PARA A REGIO LOMBAR............. 37

3.4. ANLISE DOS RESIDUOS ATRAVS DA CURVA ROC .................................... 42

3.4.1. Representao da Curva ROC 42


3.4.2. Comparao de modelos com recurso ao teste da rea abaixo da curva ROC 43

CAPTULO 4- CONCLUSO & TRABALHOS FUTUROS .......................................... 49

4.1. CONCLUSES......................................................................................................... 49

4.2. SUGESTES PARA TRABALHOS FUTUROS ................................................. 50

ANEXOS ......................................................................................................................... 53

BIBLIOGRAFIA ............................................................................................................. 55

Pginas da Internet (consultadas no perodo de Janeiro a Outubro de 2011)...................... 56

xii
NDICE DOS GRFICOS:

Grfico 1- Curva ROC, para uma dada capacidade de discriminao, com a variao do
critrio de deciso 28
Grfico 2- Distribuio da percentagem de enfermeiros que prestam apoio ao domiclio
segmentado por sexo 34
Grfico 3- Queixas nas regies corporais por parte dos enfermeiros que prestam apoio ao
domiclio (em %) 34
Grfico 4- Queixas nas regies corporais por parte dos enfermeiros que no prestam apoio
ao domiclio (em %) 35
Grfico 5- Curva ROC para os quatro modelos 43
Grfico 6- Curvas ROC dos modelos dois a dois 45

xiii
NDICE DE TABELAS:

Tabela 1-Razo de possibilidade 23


Tabela 2- Representao geral de um teste diagnstico 27
Tabela 3- Valores das estimativas das razes de possibilidade e respectivos I.C.(95%) 36
Tabela 4- Valores relevantes da aplicao de regresso logstica univariada. 39
Tabela 5- Resultados curva ROC 43
Tabela 6- Valores de z relativos a comparaes de reas 46
Tabela 7- Valores prova associados regio crtica z 46
Tabela 8: Codificao das variveis explicativas do modelo 48

xiv
CAPTULO 1- INTRODUO

1.1. LESES MSCULO ESQUELTICAS

1.1.1 Definio

Leses Msculo Esquelticas (LME) so um conjunto amplo e diversificado de patologias,


que se sobrepem, na sua maioria, s doenas reumticas, mas que diferem destas por
inclurem algumas situaes de leses osteoarticulares e de bolsas sinoviais e por
apresentarem, na sua origem, factores de risco de natureza ocupacional (Carneiro, 2005).

H provas evidentes que em certos factores relacionados com o trabalho esto associados
ao elevado risco dos trabalhadores apresentarem leses no seu sistema msculo-esqueltico
(Carneiro, 2005).

As Leses Msculo Esquelticas associadas ao trabalho repetitivo constituem actualmente


grande preocupao na generalidade dos pases industrializados. Trata-se efectivamente da
expresso de uma hiper-solicitao das articulaes, decorrentes de dois tipos de factores,
que, associados sensibilidade individual, condicionam a probabilidade de aparecimento
destas patologias (Carneiro, 2005).

Podem evidenciar-se algumas causas de LME de natureza biomecnica, tais como a fora e
a postura em que os movimentos so realizados, e factores psicossociais associados
representao individual das condies de trabalho e que se traduzem por insatisfao,
fadiga e stress (Direco Geral de Sade, 2008).

1.1.2. Leses Msculo Esquelticas ligadas ao trabalho

As Leses Msculo Esquelticas ligadas ao trabalho (LMELT) foram, ao longo das ltimas
dcadas, referidas como as alteraes de sade mais frequentes relacionadas com diversos
contextos de trabalho (Direco Geral de Sade, 2008).

1
Em Inglaterra segundo Health & Safety Commission em 1990, as LMELT so mesmo
consideradas as mais frequentes doenas relacionadas como o trabalho, nos Estados Unidos,
so consideradas por alguns autores Maland (1993) e Muggleton (1999) como uma
possvel epidemia do sculo XXI (http://www.ensp.unl.pt).

As actividades profissionais com postos de trabalho envolvendo diversos factores de risco


de LMELT so muito numerosas, abrangendo designadamente actividades com tarefas
repetitivas, aplicaes de fora e posturas articulares extremas (ou desconfortveis). Tais
caractersticas, associadas a outros factores de risco de natureza individual, constituem
elementos da matriz etiolgica das LMELT, ainda que no sejam bem conhecidas as
respectivas relaes exposio efeito defendido por Who em 1995 referido pela Direco
Geral de Sade (2008).

Com base nas publicaes da Direco Geral de Sade (2008) so indicados como factores
para o desenvolvimento das LMELT seguintes aspectos:
(1) Uma actividade realizada fundamentalmente por gestos repetitivos que implicam a
necessidade de adopo de posies angulares extremas dos membros;
(2) Esforos excessivos;

(3) Elevada receptividade.

Estas leses afectam principalmente a regio dorso-lombar, a zona cervical, os ombros e os


membros superiores, mas podem afectar tambm os membros inferiores. Algumas leses
msculo-esquelticas, tais como a sndrome do canal crpico, que afecta o pulso, so leses
especficas que se caracterizam por sinais e sintomas bem definidos. Outras manifestam-se
unicamente por dor ou desconforto, sem que existam sinais de uma leso clara e especfica.

A identificao e avaliao dos factores de risco existentes nos postos de trabalho,


responsveis pelo desenvolvimento deste tipo de leses, e a sua reduo atravs da
implementao de medidas de preveno, deve constituir uma das preocupaes dos
empregadores, tendo em conta a preservao da sade e segurana dos seus trabalhadores
(Direco Geral de Sade, 2008).

2
1.1.3. Factores de risco

Apoiado no Programa Nacional Contra as doenas reumticas da Direco de Sade (2008),


sabe-se que as causas das LMELT so vrias, ainda que a sobrecarga a nvel dos tendes,
dos msculos das articulaes e dos nervos constitua um importante factor de risco. Essa
sobrecarga composta por vrios elementos:
(1) Relacionados com a actividade de trabalho;

(2) Individuais, tambm chamados co- factores de risco;

(3) Organizacionais/psicossociais, que, embora sejam igualmente factores de risco

profissional, so frequentemente abordados separadamente.

Como factores de risco associados ao trabalho considera-se algo que possa provocar um
efeito adverso, como por exemplo as tendinites. A exposio ao factor de risco pode causar
doena ou leso, dependendo de um conjunto de factores adicionais.

Neste sentido, tem-se:


(A) Factores de risco relacionados com a actividade de trabalho:
Posturas ou posies corporais extremas;
Aplicao de fora;
Repetitividade;
Exposies a elementos mecnicos.

(B) Factores de risco individuais:


Idade;
Sexo;
Altura, peso e outras caractersticas antropomtricas;
Situao de sade.

(C) Factores de risco organizacionais/ psicossociais:


Riscos intensos de trabalho;
Monotonia das tarefas;
Insuficiente suporte social;

3
Modelo organizacional de produo (Direco Geral de Sade, 2008).

1.2. A EMPRESA

No mbito do Mestrado de Estatstica de Sistemas, o estgio decorreu num perodo de 7


meses no Grupo de Estatstica Aplicada (GESTA).
O GESTA pertence ao Departamento de Produo e Sistemas da Universidade do Minho,
estando inserido nos spin-offs da TecMinho.

A TecMinho uma associao de direito privado sem fins lucrativos, criada em 1990.
Tendo como promotores a Universidade do Minho e a Associao dos Municpios do Vale
do Ave e como misso fundamental fazer uma ligao da universidade com a sociedade,
contribuindo assim, para o desenvolvimento regional atravs da melhoria de
competitividade das organizaes e aumento das competncias dos indivduos
(www.tecminho.uminho.pt).

Tendo em conta a poltica de valorizao do conhecimento, a Universidade do Minho


incentiva a criao de empresas que visem valorizar o conhecimento resultante das suas
actividades de investigao cientfica e tecnolgica (www.tecminho.uminho.pt).

O termo spin-off deriva do ingls e utiliza-se para descrever uma nova empresa que nasceu
a partir de um grupo de pesquisa, universidade ou centro de pesquisa (pblico ou privado),
tendo normalmente como objectivo explorar um novo produto ou servio de alta tecnologia.
comum que as spin-offs se estabeleam em incubadoras de empresas ou reas de
concentrao de empresas de alta tecnologia
(www.empreendedorismo.uac.pt/spinofss/spinoffs_academicos).

4
O estatuto de spin-off concebido a projectos com vnculo a departamentos ou centros de
investigao que visem criar empresas aptas para valorizarem resultados de investigao
gerados no decurso de actividades cientficas conduzidas pela sociedade acadmica, tais
como os investigadores, os bolseiros de investigao ou alunos de ps-graduao
(www.empreendedorismo.uac.pt/spinofss/spinoffs_academicos).

Integrado no projecto GESTA, foi realizado um trabalho referente QWEB (Certificao


de Processos de Negcios Electrnicos), que teve como objectivo a anlise estatstica de
variveis provenientes de um inqurito online. Esta anlise englobou principalmente a parte
exploratria e descritiva. Resultou deste trabalho a elaborao de um poster para a
JOCALD 2011 (XVIII Jornadas de Classificao e Anlise de Dados).

Com o decorrer do trabalho realizou-se um resumo e um poster para apresentao na


ENBIS-11 (11th Annual Conference of the European Network for Business and Industrial
Statistics), onde se focou as LME e um modelo de regresso logstica que explicasse a dor
na lombar nos profissionais de enfermagem que prestam apoio ao domiclio, assim como a
respectiva curva ROC.

1.3. ENQUADRAMENTO E MOTIVAO

Conhecendo os problemas associados as LME e tendo como base um questionrio online


(desenvolvido por uma aluna de doutoramento do Departamento de Produo e Sistemas),
construdo com vista a avaliar o risco de LMELT nos profissionais de enfermagem que
exercem a sua profisso em centros de sade da regio Norte, no que concerne
sintomatologia de LME associadas ao desempenho das respectivas funes, fez-se uma
anlise das variveis do questionrio.

Assim, este trabalho focou-se na anlise estatstica, descritiva e inferencial, das variveis
de forma a encontrar um modelo estatstico mais pertinente e que se melhor se ajustasse a

5
compreender quais as queixas e factores que poderiam estar relacionadas com as LME nos
enfermeiros que prestam apoio ao domiclio.

1.4. OBJECTIVOS

Para desenvolvimento deste trabalho delinearam-se os seguintes objectivos gerais:

1. Anlise inicial dos dados;


2. Elaborao de grficos relevantes ao estudo;
3. Calculo dos valores de razo de possibilidades para as vrias sintomatologias;
4. Aplicao de regresso logstica:
(a) Seleco de variveis candidatas ao modelo;
(b) Obteno de modelos explicativos;
5. Analisar os resduos atravs da Curva ROC;
6. Comparao dos modelos obtidos.

1.5. ESTRUTURA DA TESE

Este trabalho desenvolveu-se ao longo de 4 captulos. Os objectivos apresentados na seco


anterior traduzem, de uma forma parcial, a forma como o trabalho foi estruturado.

Seguido da introduo, apresenta-se uma parte terica dividida em 4 subcaptulos incluindo


a anlise exploratria dos dados, uma breve apresentao do software utilizado, a
fundamentao da regresso logstica, finalizando com a parte da anlise dos resduos com
recurso curva ROC.

No captulo 3, apresentam-se os resultados obtidos aps anlise de dados com recurso ao


SPSS.

Seguindo-se o captulo 4, referente anlise e discusso de resultados, onde so


apresentadas algumas consideraes sobre o trabalho realizado, assim como uma
orientao para possveis trabalhos futuros.

6
CAPTULO 2- ENQUADRAMENTO TERICO

Deparados com um conjunto de dados e com o objectivo de efectuar uma anlise estatstica
deve-se fazer uma escolha racional acerca do mtodo mais apropriado a esta.

Neste sentido tem-se que ter em ateno algumas consideraes importantes, como o caso
dos objectivos definidos, no contexto de um problema especfico, as caractersticas
matemticas envolvidas, as hipteses estatsticas a serem feitas sobre as variveis em
anlise e ainda a forma de recolha dos dados (Braga, 1994).

2.1. ANLISE EXPLORATRIA DOS DADOS

Numa primeira fase, que compreendeu a anlise dos dados, procurou entender-se os
comportamentos das variveis em anlise, recorrendo-se geralmente a uma anlise
exploratria. Esta, englobou o clculo das principais caractersticas amostrais, assim como
grficos adequados, de forma a estudar-se os comportamentos das variveis, e ainda,
qual/quais as variveis de interesse para o estudo.

A estatstica descritiva representa as caractersticas das unidades observadas ou


experimentadas e utiliza-se para descrever esses dados atravs de estatsticas, como por
exemplo a mdia, a mediana ou desvio padro.

A estatstica indutiva permite tirar concluses para um domnio mais vasto do que os
elementos observados ou experimentados. Essas inferncias so realizadas por aplicao
em amostras aleatrias de intervalos de confiana e testes paramtricos ou no
paramtricos (Pestana e Gageiro, 2005).

7
2.1.1. Escalas de atitudes e opinies:

As escalas de opinies so mecanismos concebidos para medir o grau de intensidade das


atitudes e das opinies de um sujeito a respeito de um fenmeno determinado, visando
captao de informao e permitindo ao sujeito diversas opes entre uma srie graduada
que lhe proposta. Distinguindo-se a escala unidimensional de Guttman, a escala de
distncia social de Bogardus, a escala de intervalo de Thurstone e a escala cumutativa de
Likert (Bessa, 2007).

2.1.2. Tipo de dados

Dados so algoritmos, letras e sinais ou mesmo combinaes destes segundo determinadas


regras que descrevem uma determinada situao. A descrio e interpretao de dados
uma parte essencial da estatstica.

Os dados podem ser de diferentes tipos e, portanto, necessitam ser tratados com mtodos
estatsticos diferentes. Podendo assim dividir-se os dados em quantitativos e qualitativos
(Pestana e Gageiro, 2005).

Os dados quantitativos consistem em nmeros que representem contagens ou medidas,


enquanto os dados qualitativos podem ser separados em diferentes categorias que se
distinguem por alguma caracterstica no numrica.
Dependendo do tipo de variveis que constituem os dados estes podem ser expressos em
quatro escalas distintas: nominal, ordinal, por intervalos e por rcios.
Os dados qualitativos exprimem-se nas duas primeiras e os dados quantitativos nas duas
ltimas (Pestana e Gageiro, 2005).

A escala nominal classifica os sujeitos conforme pertenam ou no a uma categoria ou


caracterstica. So variveis categricas, no podendo avaliar se uma maior do que a
outra. A escala ordinal ordena os sujeitos segundo a ordem que ocupam. Sabe-se que um
valor maior do que outro, mas no h avaliao do intervalo entre dois valores. A escala
intervalar atribui valores numricos a indivduos, sabendo-se que um valor maior do que

8
outro e que os valores diferem em intervalos iguais. A escala de razo ou rcio uma
escala de intervalo, porm possui um zero absoluto (Bessa, 2007).

Os dados quantitativos podem ainda ser descritos pela distino entre os tipos discretos e
contnuos.

Os dados discretos so aqueles que provem de uma varivel discreta, isto , que apenas
tomam valores finitos ou numervel de valores distintos. Os dados que no so discretos
podem ser provenientes de variveis contnuas, isto , tomam valores num conjunto de
nmeros reais, possivelmente ilimitado (Athayde, 2005).

2.2. SOFTWARE UTILIZADO

Na anlise estatstica dos dados optou-se pela utilizao do software SPSS (Statistical
Package for the Social Sciences) teve origem em 1968, na Chicago University, sendo
divulgado e com utilizao global desde ento. Sendo desde 1994, representado em
Portugal pela PSE- Produtos e Servios de Estatstica, Lda (www.pse.pt).

O software SPSS um sistema que permite organizar dados e executar anlises estatsticas.
Tem um ambiente grfico muito apelativo com o qual, para a maioria das anlises a
efectuar, basta a seleco das respectivas opes em menus e caixas de dilogos (Laureano
e Botelho, 2010).

A utilizao do SPSS apresenta vrias vantagens:


Flexibilidade para diferentes naturezas de variveis;
Facilidade de utilizao, sendo um programa muito amigvel, com diversos nveis de
complexidade, de acordo com as necessidades dos seus utilizadores;
Participao em todo o processo analtico, desde o planeamento at recolha de dados
para a anlise, possibilitando a elaborao de relatrios, quer pelo prprio programa,
quer por uma articulao com um processador de texto (Laureano e Botelho, 2010).

9
2.3. REGRESSO LOGSTICA

2.3.1. Enquadramento

Atravs dos recursos matemticos e estatsticos cedidos pela anlise de regresso pode
encontrar-se funes que estimem o comportamento de um conjunto de dados que no se
dispem, a partir de dados recolhidos.
O termo de regresso apareceu pela primeira vez na literatura em Galton (1885), citado por
Braga (1994).

A regresso um modelo estatstico usado para prever o comportamento de uma varivel


dependente (Y) a partir de uma ou mais variveis relevantes de natureza essencialmente
intervalar ou rcio, as variveis independentes (X), dando informao sobre a margem de
erro dessas previses.

Tal como referido por Hosmer e Lemeshow (1989), nos modelos de regresso linear
simples ou mltipla a varivel dependente Y uma varivel aleatria de natureza contnua,
sendo esta em alguns casos qualitativa e expressa em funo de duas ou mais variveis de
natureza categrica, isto , admite dois ou mais valores.

Assim, o que distingue o modelo de regresso logstica do da regresso linear que a


varivel resultado na regresso logstica usualmente binria (dicotmica). Esta diferena
entre regresso logstica e linear reflectida quer na escolha de um modelo paramtrico,
quer nas hipteses a serem consideradas. Desde que esta diferena seja tida em conta, os
mtodos empregues na anlise usando a regresso logstica seguem os mesmos princpios
usados na regresso linear. Ento, as tcnicas usadas na anlise de regresso linear devero
motivar uma aproximao regresso logstica.

A regresso logstica permite o uso de um mtodo de regresso para calcular ou prever a


probabilidade de um evento especfico. Desta forma, esta usa-se quando se tem uma
varivel dependente em escala nominal e uma varivel independente nominal e/ou contnua,

10
e serve para descrever a relao entre a varivel dependente nominal e o conjunto de
variveis independentes atravs da funo logit (Braga, 1994).

Quando a regresso logstica usada deve-se primeiramente achar o modelo que melhor se
ajuste aos dados em anlise, com o intuito de se obter um modelo moderado e
biologicamente razovel, que permita descrever a relao entre a varivel resultado e um
conjunto de variveis independentes (Braga, 1994).

2.3.2. Modelo de regresso logstica univariado

Os modelos de regresso so utilizados na anlise de dados com o intuito de descrever a


relao entre uma ou mais variveis independentes e uma varivel resposta (Martins, 2008).

A anlise apresentada neste captulo baseia-se essencialmente no trabalho de Hosmer e


Lemeshow (1989).

Qualquer problema de regresso passa por estimar o valor esperado da varivel resposta, Y,
dado o valor das variveis independentes, x.
Na regresso linear assume-se que este valor esperado pode ser expresso como uma
equao linear em funo de x,
Considerando o modelo de regresso linear simples tem-se

E Y | x 0 1 x (1)

Tendo em conta a expresso anterior, verifica-se, que E Y | x pode tomar qualquer valor

compreendido no intervalo ; .

Uma diferena importante entre os modelos de regresso linear e o de regresso logstica


vai de encontro distribuio condicional da varivel resultado.

11
Na regresso linear a observao da varivel resultado pode ser expressa como
y E Y | x , (2)

sendo o erro associado.

De acordo com (2), d o desvio de uma observao em relao mdia condicional. A


hiptese mais comum que este segue uma distribuio Normal com mdia zero e
varincia constante, ao longo dos nveis da varivel independente. Daqui, resulta que esta
distribuio condicional da varivel resultado dado o valor da varivel x, segue uma
distribuio normal, com mdia E Y | x e varincia constante.

Contudo, isto, no se verifica quando se tem uma varivel resultado dicotmica. Assim,
nesta situao deve-se expressar o valor da varivel como
y ( x ) , (3)

considerando-se x E Y | x .

De acordo com Hosmer e Lemeshow (1989), quando se trabalha com dados dicotmicos, a
mdia dever assumir valores entre 0 e 1. A variao de E Y | x em funo de x, menor

consoante a aproximao da mdia condicional de 0 ou 1. Assim, a curva resultante tem


uma forma em S, sendo semelhante ao grfico de uma distribuio cumulativa de uma
varivel aleatria. Neste caso, usa-se o modelo de regresso logstica.

Foram propostas muitas funes para anlise de variveis dicotmicas, Cox, em 1970,
(citado por Hosmer e Lemeshow, 1989) apresentou vrias razes para a escolha da
distribuio logstica para a anlise de dados, destacando-se:
(1) O ponto de vista matemtico, como sendo uma funo extremamente flexvel e
muito usada;
(2) Por si mesma, conduz a uma fcil interpretao dos resultados em termos
biolgicos.

A resposta esperada dada pela expresso


E Y | x 0 1 x, (4)

12
sendo Y uma varivel aleatria que segue uma distribuio de Bernoulli, com a seguinte lei
de probabilidade:

Y 1 P( Y 1 ) ( x ) sucesso
, (5)
Y 0 P( Y 0 ) 1 ( x ) insucesso

Aplicando a definio de valor esperado, obtm-se:


E Y | x ( x ) (6)

Igualando a expresso obtida em (4) e (6) tem-se


E Y | x 0 1 x ( x ) (7)

Considere-se uma amostra de n observaes independentes com o par xi , yi , onde xi e

yi representam o valor da varivel independente e o valor da varivel resposta,

respectivamente, sendo i o isimo elemento.

A funo de regresso logstica univariada dada pela esperana de Y dado x, ou seja,


e 0 1x
x E Y | x , (8)
1 e 0 1x

Os parmetros considerados so estimados pelo mtodo de mxima verosimilhana, que


consiste em determinar os valores dos parmetros que maximizem a probabilidade de obter
o conjunto de valores observados.
Uma propriedade interessante que a funo logstica possui que pode ser linearizada.
Assim, fazendo essa transformao vem

x
g x ln , (9)
1 x
obtendo-se
g x 0 1 x , (10)

onde g ( x ) ; x .

13
Esta transformao chamada de transformao logit de probabilidade x . A razo

x 1- x , (11)

na transformao logit a chamada odds ou chance.

A importncia desta transformao que g x tem muitas propriedades desejveis dos

modelos de regresso linear. A funo logit, g x , linear nos seus parmetros, podendo

ser contnua, e variar entre valores de ; , dependendo do domnio de variao de x


(Martins, 2008).

2.3.2.1. Funo de verosimilhana

O mtodo geral de estimao alternativo ao da funo dos mnimos quadrados, para o


modelo de regresso linear, o mtodo de mxima verosimilhana (M.M.V). Este mtodo
d a base para a aproximao de estimao com o modelo de regresso logstica
(Braga,1994).

Atendendo a Hosmer e Lemeshow 1989, o M.M.V. permite obter valores para os


parmetros desconhecidos, que maximizam a probabilidade de obter o conjunto de
observaes.
A funo de verosimilhana expressa a probabilidade dos dados observados como uma
funo dos parmetros desconhecidos. Os estimadores de mxima verosimilhana destes
parmetros, so escolhidos de modo a ser aqueles que maximizam a funo de
verosimilhana.
Neste caso, em que se tem apenas dois resultados possveis (sucesso Y 1 e o insucesso
Y 0 ), e desde que as observaes sejam independentes, a funo de verosimilhana
dada por:
n
y 1 yi
l xi i 1 xi , (12)
i 1

em que xi representa a P Y 1| x , ou seja, a probabilidade de sucesso.

14
O princpio de mxima verosimilhana usa para estimativa de os valores que
maximizam a expresso obtida em (12). Contudo, mais fcil trabalhar com a expresso
dos logaritmos da verosimilhana, sendo


L ln l yi ln x 1 yi ln 1 x
i 1
(13)

e para se obter o valor de , que maximiza L ( ) , deriva-se esta em ordem a cada


parmetro e iguala-se as equaes de verosimilhana a zero.
Para regresso logstica envolvendo duas variveis, as equaes de verosimilhana so no
lineares em , o que vai requerer mtodos especiais para a sua resoluo, sendo o mtodo
de resoluo de equaes no lineares usualmente aplicado o mtodo de Newton-Raphson
(Martins, 2008).

2.3.2.2. Teste de Wald

Em regresso logstica tem-se variveis resultado e uma ou mais variveis explicativas.


Para cada varivel explicativa do modelo, haver um parmetro associado.

O teste de Wald, descrito por Polit (1996) e Agresti (1990) ( citado por Crichton (2001)),
uma das possveis formas de testar se os parmetros associados com um grupo de variveis
explicativas tomam o valor zero.

Segundo Crichton (2001), este teste utilizado para avaliar se o parmetro


estatisticamente significativo. A estatstica teste que se utilizada obtida atravs da razo
do coeficiente pelo seu respectivo erro padro, esta estatstica de teste segue uma
distribuio Normal. A estatstica de teste, para avaliar se o parmetro igual a zero e
pode-se especificar como sendo:


W (14)
Var

15
Todavia, o teste de Wald, falha quando se rejeita coeficientes que so estatisticamente
significativos (Hauck e Donner, 1977, citado por Crichton (2001). Assim, aconselha-se que
os coeficientes, identificados por este teste como sendo estatisticamente no significativos,
sejam testados novamente pelo teste da razo de verosimilhana.

2.3.3. Modelo de regresso logstica multivariado

A regresso logstica pode ser utilizada, fazendo as necessrias adaptaes, para modelar
situaes com mais do que uma varivel independente.

Considere-se n observaes independentes do par xi , yi , em que xi um vector de m

variveis independentes e yi uma varivel dicotmica. A funo logstica que se usa para
modelar esta situao semelhante usada para o modelo univariado apresentado
anteriormente, envolvendo as m variveis independentes:

e 0 1x1 ... m xm
xi (15)
1 e 0 1x1 ... m xm

Os m+1 parmetros desconhecidos so estimados pelo mtodo da mxima verosimilhana,


aplicando processos iterativos, onde as equaes de verosimilhana so dadas por:

L n
yi xi 0
0
0 i 1
n , j 1,...,m (16)
L x y x 0
0
j
i 1
ij i i

Independentemente do nmero de variveis usadas para definir o modelo de regresso


logstica, pretende-se distinguir dois grupos distintos de indivduos, consoante apresentem
ou no determinada caracterstica.

16
Salienta-se que neste estudo, importante reduzir o nmero de variveis a serem includas
no modelo. Esta reduo constitui uma mais-valia em termos estatsticos pois o aumento do
nmero de variveis includas tende a aumentar o risco de sobreajuste do modelo,
principalmente em amostras de pequena dimenso (Hosmer e Lemeshow, 1989).
Assim, regra geral, esta situao traduz-se em valores extremamente elevados das
estimativas dos coeficientes e/ou dos erros padro.

Com o objectivo de verificar se as variveis independentes possibilitam identificar


correctamente os elementos que pertencem a cada grupo, constri-se o modelo de regresso
logstica que inclui todas as variveis e posteriormente, avalia-se a qualidade do seu ajuste.
Assim, os valores preditos so ento comparados com os valores da varivel resposta, que
toma dois valores possveis, 0 ou 1. Os indivduos so bem classificados se o valor
absoluto da diferena entre o valor predito e o da varivel resposta for menor que 0.5. Se a
maior percentagem de indivduos for bem classificada, conveniente que se tente encontrar
um novo modelo com menos variveis que nos permita separar os elementos de dois
grupos (Martins, 2008).

2.3.3.1. Testes de significncia estatstica

Aquando o modelo ajustado, segue-se a realizao de um teste de significncia das


variveis que foram includas no modelo.
Dado o interesse em se utilizar um teste estatstico de forma a avaliar a razo de
verosimilhana, ser usado o seu logaritmo, o qual multiplicado por menos dois, resulta
numa distribuio conhecida. Este valor designado por D, sendo o teste utilizado o da
razo de verosimilhana.
Assim, a estatstica D tem como objectivo comparar o modelo em anlise e o modelo
saturado ou seja,

verosimilhana do modelo ajustado


D 2 ln , (17)
verosimilhana do modelo saturado

17
onde o modelo ajustado corresponde ao modelo que inclui apenas as variveis desejadas e
o modelo saturado corresponde ao modelo com todas as variveis e interaces. Por outras
palavras, o modelo saturado contm tantos parmetros quanto observaes.

Tem-se assim o seguinte teste para testar a significncia em que as m variveis so


independentes. Para este teste temos as seguintes hipteses:

H 0 : 1 2 ... m 0 vs H1 : j 0 j 0 ,...,m e m 1,...,k (18)

sendo o Teste da Razo de Verosimilhana, o qual se pode definir do seguinte modo:

G D verosimilhana sem as m variveis D verosimilhana com as m variveis


verosimilhana modelo sem as m variveis (19)
2 ln
verosimilhana modelo com as m variveis

O teste G, segue a distribuio de Qui-Quadrado com m graus de liberdade, sob a validade


da hiptese nula.
Assim, ao rejeitar H0, pode-se concluir que pelo menos um, ou at os m coeficientes
podero ser diferentes de zero (Braga, 1994).

2.3.3.2. Mtodos de seleco de variveis

A incluso ou a excluso de uma varivel no modelo, pode variar conforme o problema a


considerar ou at mesmo a rea cientfica em anlise (Braga, 1994).

Quando se minimiza o nmero de variveis a incluir no modelo, obtm-se um modelo


numericamente mais estvel e mais generalizado. As variveis que no esto correctamente
includas no modelo podem provocar o aumento dos erros padro estimados, assim como,
uma maior dependncia do modelo que se traduz nos dados observados (Braga,1994).

Indo ao encontro de Hosmer e Lemeshow (1989), segue-se alguns passos que podem ajudar
quando se tem que seleccionar as variveis a serem includas no modelo de regresso

18
logstica. Este processo semelhante ao utilizado na construo do modelo de regresso
linear.

Deste modo o processo pode ser descrito tendo em conta os seguintes passos:

(A) Deve-se iniciar o processo por uma anlise univariada e individual de cada uma das
variveis. Hosmer e Lemeshow (1989) sugeriram que variveis nominais, ordinais e
contnuas com alguns valores inteiros podero ser tratadas recorrendo-se a tabelas de
contingncia dos p nveis da varivel dependente versus os k nveis da varivel
independente.
Quando se trata de variveis independentes e contnuas desejvel que a anlise univariada
envolva o ajuste de um modelo de regresso logstica como o objectivo de se obter
estimativas dos coeficientes, estimativas de erro padro, o teste de razo de verosimilhana
para a significncia dos coeficientes e estatsticas de Wald univariada.
Pode-se ainda usar como alternativa o teste-t para duas amostras.

O teste-t para duas amostras independentes usa-se quando se pretende comparar as mdias
de uma varivel quantitativa em dois grupos diferentes de indivduos e se desconhecem as
respectivas varincias populacionais (Pestana e Gageiro, 2005).

A anlise baseada neste teste poder ser til na determinao da incluso ou excluso da
varivel no modelo.

(B) Quando a anlise univariada estiver concluda passa-se para uma anlise multivariada.
Aps sujeitas a um teste univariado selecciona-se as variveis que apresentarem um valor
prova inferior a 0.25, sendo essas variveis tomadas como candidatas ao modelo
multivariado (pode-se ainda incluir no mesmo modelo variveis consideradas importantes
no contexto do estudo ou anlise).

A escolha do valor 0.25 como critrio de seleco foi feita tendo em conta os trabalhos
realizados em regresso linear e regresso logstica de Bendel e Afifi, e, Mickey e
Greenland, citado por Braga (1994).

19
Segundo estes autores, o valor de 0.05 por vezes falha para algumas das variveis em
anlise, por outro lado, quando se consideram nveis elevados podem-se incluir no modelo
variveis com interesse questionvel.

Geralmente a deciso comea por ter em conta um modelo multivariado com todas as
variveis possveis dependente da dimenso e nmero de elementos que constituem cada
grupo de variveis candidatas ao modelo.
Assim, quando se tem dados adequados para suportar a anlise ser conveniente comear o
modelo multivariado nesse ponto. Caso contrrio, esta aproximao pode conduzir a um
modelo numericamente instvel. Neste ultimo caso, a estatstica de Wald no dever ser
usada para a seleco das variveis. Dever-se- recorrer a uma aproximao para seleco
de variveis baseada no mtodo passo a passo, no qual as variveis seleccionadas quer por
incluso, quer por excluso segundo uma ordem sequencial baseada unicamente num
critrio estatstico (Braga, 1994; Hosmer e Lemeshow, 1989).

(C) Com o modelo multivariado construdo, tem-se que verificar a importncia de cada
varivel a ser includa neste. Para isso, deve-se aplicar o teste de Wald para cada varivel e
comparar o valor de cada coeficiente estimado com o seu valor no modelo univariado
contendo somente essa varivel.
As variveis que no contribuam para explicar correctamente o modelo devero ser
eliminadas e ajustar-se um novo modelo. Este novo modelo dever ser comparado com o
antigo aplicando-se o teste da razo de verosimilhana.
O processo de retirar, reajustar, e verificar deve continuar at parecer que as variveis
explicativas do modelo estejam todas includas e em oposio s pouco importantes
excludas do modelo.
Se no fim do processo da anlise univariada se tiver um nmero elevado de variveis
candidatas a explicativas ao modelo, ser aconselhvel utilizar-se a tcnica passo a passo
(Braga, 1994; Hosmer e Lemeshow, 1989).

(D) Por fim, e aps se ter obtido um modelo que parea conter as variveis importantes,
deve-se fazer uma reanlise de forma a se considerar a necessidade da incluso de
interaco entre variveis (Braga, 1994; Hosmer e Lemeshow, 1989).

20
2.3.3.2.1. Seleco automtica

Qualquer procedimento para adio ou remoo de variveis num modelo baseado num
algoritmo que verifica a importncia das variveis, incluindo ou excluindo-as do modelo,
baseando-se na regra de deciso.
O critrio para adio ou remoo de variveis, em regresso linear, geralmente baseado
na estatstica F, comparando os modelos com e sem as variveis em anlise. Em regresso
logstica, os erros seguem uma distribuio binomial sendo baseado do teste de razo de
verosimilhana.

Existem mtodos automticos que podem ser utilizados na deciso de inserir e remover
variveis.
Seguidamente, descrevem-se os mtodos implementados no SPSS.

- Enter: um procedimento para a seleco de variveis em que todas elas em bloco


entram no processo uma nica vez; (SPSS Inc, 2007).

- Forward: Mtodo de seleco Stepwise, este procedimento inicia-se com um modelo


que no contenha variveis explicativas. A ideia do mtodo adicionar uma varivel de
cada vez, seleccionando em primeiro lugar aquela que apresentar um valor de correlao
mais elevado, em mdulo, com a varivel resposta, e assim consequentemente, at que o
processo pra quando o aumento do coeficiente de determinao, devido incluso de uma
nova varivel explicativa no modelo no mais importante (http://portalaction.com.br).

Forward (condicional): baseado na significncia da estatstica de pontuao e testes


de remoo com base na probabilidade de uma estatstica de razo de verosimilhana,
com base em estimativas de parmetros condicionais; (SPSS Inc., 2007).

Forward (Likelihood Ratio): baseado na significncia da estatstica de pontuao e


testes de remoo com base na probabilidade de uma estatstica de razo de
verosimilhana baseada na mxima verosimilhana parcial das estimativas; (SPSS
Inc., 2007).

21
Forward (Wald): Mtodo de seleco Stepwise baseado na significncia da
estatstica de pontuao e testes de remoo com base na probabilidade da estatstica
de Wald; (SPSS Inc., 2007).

- Backward: Enquanto o mtodo Forward comea sem nenhuma varivel no modelo e


adiciona variveis a cada passo, o mtodo Backward faz o oposto. Este incorpora
inicialmente todas as variveis, e ao longo do processo cada uma pode ou no ser eliminada.
A primeira varivel a ser removida aquela que apresenta um menor coeficiente de
correlao parcial com a varivel resposta (http://portalaction.com.br).

Eliminao Blackward (Condicional): baseada na estatstica de razo de


verosimilhana de probabilidade das estimativas condicionais dos parmetros (SPSS
Inc., 2007).

Backward Elimination (Likelihood Ratio): baseado na probabilidade da estatstica


de razo de verosimilhana apoiado nas estimativas de probabilidades parciais (SPSS
Inc., 2007).

Backward Elimination (Wald): baseado nas probabilidades da estatstica de Wald


(SPSS Inc., 2007).

Stepwise um dos mtodos mais utilizados e consiste na combinao dos dois mtodos
anteriores (Forward e Backward). Este, inicia com uma varivel (a que apresentar maior
correlao com a varivel resposta), e a cada passo do Forward, depois de incluir uma
varivel, aplica o Backward para ver se ser descartada alguma varivel. Continua-se o
processo at este no incluir ou excluir nenhuma varivel (http://portalaction.com.br).

2.3.4. Razo de possibilidades (odds ratio)

Actualmente muitos investigadores optam por analisar a relao entre duas variveis de
escala nominal atravs do rcio de produtos cruzados razo de possibilidade, pois tem
uma interpretao mais fcil do que o teste de Qui Quadrado (Bessa, 2007).

22
De acordo com Bessa (2007), a razo de possibilidade uma medida antiga tendo sido
usada por Snow no seu trabalho clssico de identificao do factor risco da propagao da
clera em Londres (1853). Sendo utilizado como medida de associao em estudos de
caso- controle e em estudos transversais controlados.

A razo de possibilidade a razo entre duas odds, onde as odds so calculadas da seguinte
forma:

" Probabilidade de um acontecimento ocorrer"


odds (20)
" Probabilidade de um acontecimento no ocorrer"

Assim, a razo de possibilidade uma forma de se comparar se a probabilidade de um


determinado evento a mesma para dois grupos (Wagner e Callegari-Jacques, 1998;
Rumel in Revista Sade Publica, 1986).

Considerando-se a seguinte tabela 2 por 2:

X X
Y a b a+b

Y c d c+d

a+c b+d n=a+b+c+d


Tabela 1-Razo de possibilidade
Fonte: Adaptado de Pestana & Gageiro, 2005

Daqui tira-se que


ad
razo de possibilidades , (21)
bc
e ainda que:

23
razo de possibilidades 1 implica que o evento igualmente provvel em ambos
os grupos;
razo de possibilidades 1 significa que o evento mais provvel no 1 grupo;
razo de possibilidades 1 implica que o evento menos provvel no 1 grupo.

Conclui-se que o significado da razo de probabilidade semelhante ao risco relativo


obtido em estudos de coorte, e expressa a fora de associao o evento e o grupo (Pestana e
Gageiro, 2005).

Assim, segundo o que foi referido em Pestana e Gageiro (2005) ,uma medida mais directa
comparando as probabilidades em dois grupos o risco relativo, que tambm conhecida
como a relao de risco. O risco relativo simplesmente a razo de duas probabilidades
condicionais.

2.3.5. Avaliar o ajuste do modelo

Quando se fala na qualidade do ajuste de um modelo de regresso logstica tem que se ter
em ateno a anlise de medidas das diferenas entre os seus valores observados da
varivel resposta, y, e os resduos.

Sendo o objectivo avaliar o bom ajuste do modelo construdo atravs da regresso


logstica, pode-se faz-lo usando representaes grficas dos valores dos resduos. Este
caso permite comparar os resduos dos vrios elementos. Pode-se ainda aplicar testes
baseados em estatsticas desses valores, fundamentados no valor da estatstica de teste e
avaliando a qualidade do ajuste do modelo de uma forma global (Martins, 2008).

Aps aplicao de um teste de anlise de resduos e quando a qualidade do modelo no


validada por todos esses elementos, o ideal ser verificar a existncia de elementos com
valores de resduos elevados (em mdulo), comparando-os com os resduos dos restantes
elementos (Martins, 2008).

24
Relativamente s medidas das diferenas dos valores observados e preditos, usados em
regresso logstica, destacam-se os resduos de Pearson e os Deviance residuals, denotados
por r e d, respectivamente.
Ou seja:
y j m j j
rj r y j , j (22)
m j j 1 j

yj m j y j
e d j d y j ,x j 2 y j ln m j y j ln (23)
m m j 1 j
j j

onde j 1,2 ,...,J sendo J o nmero de valores diferentes de x , x x1 ,x2 ,...,xm , e m j o

nmero de indivduos com x x j .

Sob a validade do modelo ser o adequado, as estatsticas acima tm aproximadamente uma


distribuio J2 ( m1 ) .

Devendo-se rejeitar a hiptese nula para valores elevados da estatstica de teste, essa
aproximao s valida se os valores de m j forem tambm elevados (Kuss (2002), citado

por Martins, (2008)).

Em 1989, Hosmer e Lemeshow, propuseram uma estatstica de qualidade de ajuste para um


modelo de Regresso Logstica, em que os dados devem ser agrupados em g grupos com as
respectivas probabilidades estimadas.

Denote-se:
ng : o nmero de indivduos;

cg : o nmero de valores diferentes do conjunto das p variveis independentes;


cg

og : soma dos valores da varivel resposta, com og = y j ;


j=1

cg
m j j
g : mdia das probabilidades estimadas para o grupo k , com g = .
j=1 ng

25
Assim, a estatstica de Hosmer-Lemeshow, segue uma distribuio aproximadamente de
um Qui-quadrado com g-2 graus de liberdade, segundo uma hiptese de o modelo ser o
adequado.
Rejeitando-se a hiptese nula para valores elevados da estatstica de teste, C, e podendo
expressar-se da seguinte forma:

g
og ng g
C (24)
k 1 ng g 1 g

Note-se que este resultado depende dos grupos que so escolhidos (Martins, 2008).

2.4. CURVA ROC

2.4.1. Perspectiva Histrica

Uma pratica comum, na rea relacionada com a medicina, a forma de se descrever como
e quanto uma varivel contnua ou categrica ordinal capaz de classificar materiais ou
indivduos em grupos definidos.
A anlise ROC (Receiver Operating Characteristc) uma ferramenta que permite medir e
especificar problemas no desempenho do diagnstico em medicina.
A curva ROC foi usada pela primeira vez durante a segunda Guerra Mundial aplicada
anlise de radar antes de ter sido empregue na teoria de deteco de sinais (Green e Sweets,
citado Braga (2000)). Depois do ataque a Pearl Harbor, em 1941, o exrcito dos Estados
Unidos focou-se na investigao vocacionada a aumentar a previso de detectar
correctamente avies Japoneses atravs dos sinais de radar.
Nas dcadas de 60 e 70, as curvas ROC foram utilizadas na psicologia experimental e em
ramos da biomdica, respectivamente. Nesta ultima, o objectivo principal passou
basicamente por classificar os indivduos em doentes ou no doentes. (Braga, 2000 ).

26
2.4.2. Conceitos bsicos

A anlise da curva ROC pode ser feita por meio de um grfico simples e robusto, que nos
permite estudar a variao da sensibilidade e especificidade, para diferentes valores de
corte.
A sensibilidade (Sens.) definida como a probabilidade do teste fornecer um resultado
positivo, dado que o indivduo realmente portador da doena, enquanto, a
especificidade (Esp.) definida como a probabilidade do teste fornecer um resultado
negativo quando o indivduo no portador da doena (Margotto).
De outra forma, pode-se dizer que as curvas ROC foram desenvolvidas no ramo das
comunicaes como uma forma de demonstrar as relaes entre sinal-rudo. Neste sentido,
podemos interpretar o sinal como os verdadeiros positivos (sensibilidade) e o rudo, como
os falsos positivos (1- especificidade) (Braga, 2000).

A tabela seguinte resume o que foi dito acima:

Positivos (+) Negativos (-)


Positivo (+) VP FP
Verdadeiros positivos Falsos positivos

Negativo (-) FN VN
Falsos negativos Verdadeiros negativos

Total: VP+FN FP+VN


Sensibilidade Especificidade
Desempenho VP VN
Sens. Esp.
VP FN FP VN
Tabela 2- Representao geral de um teste diagnstico
Fonte: Adoptado de Braga, 2000

Note-se que a Sensibilidade e a Especificidade no so calculadas usando os mesmos


indivduos, ou seja, enquanto Sensibilidade usa apenas os doentes, Especificidade utiliza
os no doentes, assim, Sensibilidade e Especificidade so medidas independentes entre si
(Braga, 2000).

27
2.4.3. Grfico da curva ROC

Tendo em conta o que foi citado em Braga (2000), a curva ROC um grfico de
Sensibilidade (ou taxa de verdadeiros positivos) versus taxa de falsos positivos, ou seja,
representa-nos a Sensibilidade (ordenadas) e 1 Especificidade (abcissas), resultantes da
variao de um valor de corte ao longo do eixo de deciso x.
Assim, a representao da curva ROC, permite evidenciar os valores para os quais existe
optimizao da Sensibilidade em funo da e Especificidade correspondente ao ponto que
se encontra mais prximo do canto superior esquerdo do diagrama, uma vez que o indcio
de verdadeiro positivo 1 e o de falso positivo 0.

Graficamente tem-se:
Sensibilidade (FVP)

1-Especificidade (FFP)

Grfico 1- Curva ROC, para uma dada capacidade de discriminao, com a variao do critrio de deciso
Fonte: Braga (2000)

A curva ROC discrimina entre dois estados, onde cada ponto da curva representa um
compromisso diferente entre a Sensibilidade e o falso positivo que pode ser definido pela
adopo de um valor diferente do ponto de corte de anormalidade. Um critrio restrito

28
aquele que traduz uma pequena fraco de falsos positivos assim como uma pequena
fraco de verdadeiros positivos (Braga, 2000).

O valor do ponto de corte definido com um valor que pode ser seleccionado
arbitrariamente pelo pesquisador entre os valores possveis para a varivel de deciso,
acima da qual o paciente classificado positivo e abaixo do qual classificado como
negativo.
De acordo com Braga (2000), para cada ponto de corte so calculados valores de
Sensibilidade e Especificidade, estes valores podem assim ser dispostos no grfico. Um
classificador perfeito corresponderia a uma linha horizontal no topo do grfico, o que
bastante difcil de se obter. Na prtica, curvas consideradas boas estaro entre a linha
diagonal e a linha perfeita, onde quanto maior a distncia da linha diagonal, melhor o
sistema. A linha diagonal indica uma classificao aleatria, ou seja, um sistema que
aleatoriamente selecciona sadas como positivas ou negativas. Finalmente, a partir de uma
curva ROC, devemos poder seleccionar o melhor limiar de corte para obtermos o melhor
desempenho possvel.
Se o objectivo for verificar diferenas entre duas ou mais Curvas ROC, a avaliao feita
atravs da determinao da rea abaixo da curva, usando uma modificao do teste da
soma de ordens de Wilcoxon para esta comparao. Assim possvel quantificar a
exactido de um teste diagnstico (proporcional rea abaixo da curva), alm da
possibilidade de comparar testes diagnsticos.

2.4.4. rea abaixo da curva ROC

A rea abaixo da curva ROC est associada ao poder discriminante de um teste diagnstico.
Dado um individuo doente e outro no doente, ambos escolhidos ao acaso, esta medida
interpretada como a probabilidade do individuo portador de doena ter um resultado ao
teste diagnstico de maior magnitude que aquele no doente (Begg, 1991 citado em
Martinez, Neto-Louzada, e Pereira ( 2003)).

Um teste totalmente incapaz de discriminar indivduos doentes e no doentes teria uma


rea abaixo da curva ROC de cerca de 0.5. Quanto maior a capacidade do teste em

29
discriminar os indivduos segundo estes dois grupos, mais a curva se aproxima do canto
superior esquerdo do grfico, e a rea abaixo da curva ROC prxima de 1. Para Pepe
(2000), citado por Martinez, Neto-Louzada, e Pereira (2003), a rea abaixo da curva ROC
uma medida no paramtrica da distncia entre as distribuies dos resultados dos testes,
para indivduos classificados como doentes e no doentes.

Quando apresentam a curva ROC, alguns autores optam por apresentar para o eixo das
abcissas a Especificidade em alternativa a 1-Especificidade, isto no altera a estimativa da
rea abaixo da curva. Se a curva ajustada utilizando-se a teoria pertinente distribuio
normal, a rea e o seu desvio padro podem ser obtidos por recurso aos estimadores de
mxima verosimilhana (Begg, 1987 citado em Martinez, Neto-Louzada, & Pereira,
(2003)).

Analiticamente, a rea abaixo da curva ROC pode ser determinada atravs de:
Mtodos de resoluo numrica, como por exemplo, a regra do trapzio;
Mtodos estatsticos: Relao com a estatstica de Wilcoxon-Mann-Witney (Hanley,
1988, citado por Braga (2000)); e estimativa de Mxima Verosimilhana (Hanley e
McNeil, 1982, citado por Braga (2000)).

2.4.5. Comparao de modelos com recurso ao teste da rea abaixo da curva ROC

Numa escala comum, os grficos que representam duas ou mais curvas ROC associadas a
diferentes testes diagnsticos contnuos permitem uma imediata comparao de
desempenhos (Martinez, Neto-Louzada, e Pereira, 2003).

Salienta-se que quando se est a comprar duas curvas ROC pode-se encontrar duas
situaes distintas:
(a) As curvas ROC empricas so diferentes e no se cruzam, sendo o teste diagnstico
com maior rea abaixo da curva aquele que apresenta melhor desempenho;
(b) As curvas ROC cruzam-se, as reas abaixo da curva so prximas, mas os testes
diagnsticos apresentam desempenhos diferentes.

30
Um mtodo para testar se as diferenas entre duas reas abaixo das curvas ROC
provenientes de amostras independentes so significativas, consiste na utilizao da razo
crtica z, definida por Hanley e McNeil (1983):

A1 A2
z N 0,1 (25)
SE12 SE22

onde A1 e A2 correspondem as reas e SE1 e SE2 correspondem aos erros estimados para a
curva ROC, respectivamente para os testes diagnsticos 1 e 2. As reas e os respectivos
erros padro so obtidos atravs da aproximao estatstica de Wilcoxon-Mann-Whitney
(Braga, 2000).

Quando os valores da rea abaixo da curva ROC so superiores a 0.5, os erros padro
associados s reas, podem ser obtidos atravs da seguinte expresso:

A 1 A nA 1 Q1 A2 nN 1 Q2 A2
SE A (26)
n A nN

onde Q1 referente probabilidade de duas observaes anormais, aleatoriamente


escolhidas serem classificadas com maior desconfiana do que uma observao normal
aleatoriamente escolhida, e Q2 corresponde probabilidade de uma observao anormal,
aleatoriamente escolhida ser classificada com maior desconfiana do que duas observaes
normais aleatoriamente escolhidas. E nA e nN corresponde, respectivamente a dimenso dos
pacientes anormais e normais (Braga, 2000).

31
32
CAPTULO 3- ANLISE DE DADOS

3.1. ANLISE PRELIMINAR DOS DADOS

Para iniciar o estudo do questionrio online comeou-se por uma anlise inicial de dados,
considerando como objectivo principal do trabalho compreender quais as queixas que
melhor explicam as leses msculo esquelticas (quando prestado apoio ao domiclio).

O questionrio criado estava dividido em quatro partes: A, B, C e D. Aps uma anlise


(principais caractersticas amostrais, anlise grficas) destacam-se de seguida alguns
resultados obtidos englobando as variveis que constituem a parte A.

Os enfermeiros inquiridos dividem-se em quatro categorias profissionais, responderam a


este inqurito 46% de enfermeiros graduados, 32% de enfermeiros, 16% de enfermeiros
especialistas e 6% de enfermeiros chefes.
A idade dos inquiridos varia entre os 24 e os 65 anos, sendo a idade mais comum de 26
anos. Relativamente antiguidade na profisso a mdia de 12.83 anos, sendo o mnimo
de anos de trabalho 2 anos e o mximo 42 anos. Na maioria estes trabalham 35 horas
semanais, efectuando no mximo 60 horas semanais de trabalho. No que diz respeito ao
peso, este varia entre os 45 kg e os 120 kg, sendo o peso mdio de 65.63 kg, e a respectiva
altura mdia de 161.85 cm para as mulheres e 174.68 cm para os homens. Tem-se que 15%
dos enfermeiros exercem outra actividade em regime de acumulao, sendo
maioritariamente ao nvel da formao e enfermagem em clnicas privadas. Enquanto 31%
j praticou alguma actividade de desporto ou lazer com regularidade, 34% j sofreu uma
leso do foro msculo esqueltico.

Uma vez que a varivel Presta cuidados de enfermagem ao domiclio ser considerada
como varivel independente para a anlise, elaborou-se uma anlise para esta varivel.

Verificou-se que das 147 respostas obtidas 125 enfermeiros prestam cuidados ao domiclio,
correspondendo a uma percentagem de 85%.

33
Efectuando-se uma anlise da questo em funo do sexo, verificou-se que a percentagem
de mulheres superior a percentagem de homens, quando estes prestam apoio ao domiclio.

74% 26%
Homens

87% 13%
Mulheres

sim no

Grfico 2- Distribuio da percentagem de enfermeiros que prestam apoio ao domiclio segmentado por
sexo

Apresenta-se, ainda, a anlise relativa as regies do corpo, relativamente ao apoio ao


domiclio.
Desta forma, poder-se- ter uma ideia do comportamento da varivel de interesse presta
cuidados de enfermagem ao domiclio relativamente s sintomatologias nas regies em
causa.
O primeiro grfico referente aos enfermeiros que prestam apoio ao domiclio (n=125) e o
segundo aos enfermeiros que no prestam apoio ao domiclio (n=25).

Grfico 3- Queixas nas regies corporais por parte dos enfermeiros que prestam apoio ao domiclio (em %)

34
Sem Domiclio Sim No

Tornozelos/Ps 77% 23%


Joelhos 18% 82%
Coxas 14% 86%
Lombar 41% 59%
Dorsal 41% 59%
Punho/mo 43% 57%
Cotovelos 9% 91%
Ombros 54% 46%
Cervical 73% 27%

Grfico 4- Queixas nas regies corporais por parte dos enfermeiros que no prestam apoio ao domiclio
(em %)

Aps anlise grfica verifica-se que as percentagens de respostas para os dois casos so
semelhantes. Contudo, a regio lombar apresenta uma percentagem mais elevada quando
os enfermeiros prestam apoio ao domiclio (69%) comparando com a percentagem de
respostas por parte dos enfermeiros que no prestam apoio ao domiclio (41%). Daqui,
pode-se prever que a regio lombar est associada como sendo uma causas das LME dos
enfermeiros.

3.2.RAZO DE POSSIBILIDADES

Nesta seco vai considerar-se como varivel independente presta cuidados de


enfermagem ao domiclio e nove variveis dependentes.

As variveis dependentes so referentes sintomatologia, ou seja, as queixas apontadas


pelos 147 enfermeiros, nas vrias regies do corpo. Deste modo tem-se: Regio cervical;
Ombros; Cotovelos; Punho/ mo; Coluna vertebral zona dorsal; Coluna vertebral zona
lombar; Coxas; Joelhos; Tornozelos/ ps.

Com o objectivo de compreender qual/quais as variveis que apresentam um valor


significativo para a presena de dor, condicionada com a varivel independente, apresenta-
se os valores das razes de possibilidade.

35
A intensidade da relao entre as variveis qualitativas faz-se usando medidas de
associao. A razo de probabilidade mede a ocorrncia de um acontecimento em relao a
outro. Ou de forma anloga, mede a associao entre duas variveis nominais, em que uma
das variveis pode ser designada por factor, e a outra por acontecimento.

Est-se assim interessado a testar as seguintes hipteses:

H 0 :" as var iveis so independentes, isto , razo de possibilidade igual a 1"

vs
H1 :" Existe uma relao de dependncia entre as var iveis, isto , razo de possibilidade
diferente de 1"

Apresentam-se de seguida uma tabela para as referidas variveis, assim como os


respectivos intervalos de confiana, a 95%, e os valores de razo de possibilidades.

Regio da Queixa Razo de possibilidades I.C. 95%


Regio cervical 1.045 [0.377; 2.897]
Ombros 0.769 [0.310; 1.910]
Cotovelos 0.611 [0.156; 2.395]
Punho /mo 0.972 [0.376; 2.573]
Coluna vertebral: zona dorsal 1.468 [0.585; 3.681]
Coluna vertebral: zona lombar 3.185 [1.256; 8.0759]
Coxas 0.782 [0.212; 2.883]
Joelhos 0.601 [0.165; 2.188]
Tornozelos 1.412 [0.426; 4.678]
Tabela 3- Valores das estimativas das razes de possibilidade e respectivos I.C.(95%)

A zona que parece mais pertinente para anlise, devido ao seu valor da razo de
possibilidades, a zona lombar.
Com 95% de confiana, e com um valor de razo de possibilidade de 3.185 e um respectivo
intervalo de confiana de [1.256; 8.0759] pode-se concluir que os enfermeiros que prestam
36
apoio ao domiclio tm uma possibilidade trs vezes maior no que diz respeito a virem a ter
queixas de LME na regio lombar, comparativamente com os que no prestam apoio ao
domiclio.

3.3. MODELOS DE REGRESSO LOGSTICA PARA A REGIO


LOMBAR

Na anlise de regresso a varivel dependente pode ser influenciada pela presena de


variveis quantitativas e qualitativas. As primeiras, podem facilmente ser transformada
noutra escala o que no acontece com as variveis qualitativas.
Um mtodo para se qualificar os atributos construir variveis artificiais que assumam
valores compreendidos entre 0 e 1, sendo estas variveis conhecidas como variveis
dummy.

Aps se verificar que a zona lombar apresenta maior evidncia que relacione este tipo de
queixas com alguns factores associados a estes profissionais, pretende-se construir um
modelo usando regresso logstica.
Neste sentido, e filtrando apenas os enfermeiros que prestam apoio ao domiclio,
considerou-se como varivel dependente Dor na Lombar, e como variveis
independentes V1 a V54 (Codificadas em anexo- Tabela A1).

Com objectivo de verificar se as variveis acima descritas permitem construir um modelo


de regresso logstica, comeou-se pela construo de modelos univariados, como foi
referido em 2.3.2.

Encontram-se de seguida registados os resultados, aps aplicao de regresso logstica


univariada, considerando um intervalo para base [0.20; 0.25], tendo em conta o que foi dito
em 2.3.3.2. (B).

37
Varivel S.E Wald Sig. Exp( )

V1 0.930 0.665 1.959 0.162 2.535


V2 -0.476 0.444 1.147 0.284 0.621
V3 1.046 0.473 4.901 0.027 2.846
V4 0.565 0.682 0.697 0.407 1.760
V5 0.047 0.027 3.124 0.077 1.048
V6 0.051 0.028 3.258 0.071 1.053
V7 0.016 0.015 1.081 0.299 1.016
V8 0.081 0.027 0.002 0.969 1.001
V9 1.4 0.429 10.664 0.001 4.057
V10 1.045 0.409 6.513 0.011 2.842
V11 0.208 0.706 0.086 0.769 1.231
V12 0.997 0.473 4.436 0.035 2.709
V13 0.704 0.394 3.184 0.074 2.021
V14 1.156 0.657 3.097 0.078 3.176
V15 0.787 0.541 2.118 0.146 2.197
V16 1.363 0.78 3.057 0.08 3.908
V17 0 0.028 0 0.99 1
V18 0.139 0.167 0.694 0.405 1.150
V19 0.187 0.208 0.806 0.369 1.206
V20 -0.149 0.138 1.157 0.282 0.862
V21 -0.04 0.144 0.076 0.783 0.961
V22 0.015 0.188 0.007 0.935 1.015
V23 0,919 0.515 3.180 0.075 2.506
V24 0.277 0.388 0.511 0.475 1.315
V25 1.079 0.642 2.824 0.093 2.941
V26 1.119 0.607 3.398 0.065 3.062
V27 -0.125 0.559 0.05 0.823 0.882
V28 0.249 0.185 1.802 0.179 1.282
V29 0.539 0.528 1.044 0.307 1.714
V30 0.077 0.08 0.930 0.335 1.080
V31 1.281 0.667 3.686 0.055 3.6
V32 0.105 0.211 0.25 0.617 1.111
V33 0.965 0.593 2.652 0.103 2.625
V34 0.163 0.29 0.315 0.575 1.177

38
V35 0.189 0.172 1.206 0.272 1.208
V36 0.178 0.123 2.097 0.148 1.195
V37 0.699 0.572 1.495 0.221 2.012
V38 1.211 0.561 4.657 0.031 3.357
V39 0.325 0.505 0.416 0.519 1.385
V40 -2.254 0.863 6.831 0.009 0.105
V41 0.616 0.701 0.773 0.379 1.851
V42 0.061 0.159 0.145 0.704 1.062
V43 -0.322 0.19 2.874 0.09 0.725
V44 -0.222 0.389 0.327 0.569 0.801
V45 -0.152 1.24 1.511 0.291 0.218
V46 0.335 0.273 1.501 0.221 1.348
V47 0.271 0.296 0,841 0.359 1.311
V48 0.352 0.325 1.178 0.278 1.423
V49 1.227 0.452 7.380 0.007 3.41
V50 0.347 0.465 0.556 0.456 1.415
V51 0.191 0.494 0.149 0.7 1.21
V52 1.387 0.577 5.788 0.016 4.004
V53 -1.161 0.581 3.992 0.046 0.313
V54 -0.283 0.493 0.33 0.565 0.753
Tabela 4- Valores relevantes da aplicao de regresso logstica univariada.

Na tabela 4 encontram-se destacados os valores prova que permitiu seleccionar as variveis


candidatas e explicativas para o modelo.

Resumindo, tem-se as seguintes variveis candidatas:


Outra actividade profissional;
LME antiga;
Idade;
Antiguidade profisso;
Dor Cervical;
Dor Ombros;
Dor Punhos;

39
Dor Dorsal;
Dor Coxas;
Dor Tornozelo;
Pulsos: toro lateral;
Pulsos: postura;
Pulsos: movimentos repetitivos;
Pulsos: fora;
Tronco: Toro lateral;
Pescoo: toro lateral;
Figura braos;
Braos: Abduo;
Braos: rotao;
Apoio brao;
Tempo da actividade;
Auxiliares de movimentao;
Espao caracterizao;
Altura cama/sof;
Stress;
Satisfao com o trabalho.

Tendo em conta esta lista de variveis, o prximo passo consiste em construir um modelo
aplicando-se o princpio de regresso logstica multivariada, para isso recorreu-se aos
mtodos implementados no SPSS (e descritos na seco 2.3.3.2.1).

Em regresso logstica no existe um modelo nico, neste sentido, e com o objectivo de se


encontrar o modelo que mais se ajuste foram construdos quatro modelos possveis:

40
(1) Modelo 1 1.763 V 26 0.843 V 36 2.877 V 40 2.464 V 53 0.504 Forward Stepwise

(2) Modelo 2 0.336 V 6 1.851 V 12 2.02 V 14 1.702 V 26 0.414 V 33


0.74 V 36 0.618 V 43 4.05 V 40 0.89 Backward Condicional

(3) Modelo 3 2.235 V12 1.899 V 26 1.751 V 33 2.781 V 40 2.089 Forward Stepwise

(4) Modelo 4 2.226 V 3 0.006 V 5 0.608 V 43 0.116 V 45 0.983 V 53 3.470 Forward Stepwise

No modelo 1 entraram todas a variveis que foram seleccionadas aps aplicao de


regresso logstica univariada e aplicando-se o mtodo Forward Stepwise. Para este
modelo obtiveram-se quatro variveis explicativas: Movimentos repetitivos dos pulsos;
Caracterizao da figura relativa aos braos; Braos encontram-se em apoio, havendo
suporto do seu peso e Satisfao do trabalho.

No modelo 2 usou-se a tcnica Backward Condicional, que incluiu no modelo 8 variveis


explicativas: Antiguidade na profisso; Dor nos punhos; Dor nas Coxas; Movimentos
repetitivos dos pulsos; Toro lateral do pescoo; Caracterizao da figura relativa aos
braos; Braos encontram-se em apoio, havendo suporto do seu peso e Tempo de
desempenho da actividade.

Para os dois ltimos modelos apresentados foram retiradas algumas das variveis
candidatas, aplicando-se o mtodo Forward Stepwise.
Isto, segundo um critrio pessoal, uma vez que se achou interessante verificar o que
acontecia se se retirasse da anlise algumas variveis e se considera-se apenas as que
parecessem ter relao, como exemplo do modelo 4, em que foram retiradas da anlise as
variveis referentes a dores e zonas corporais.

Para o modelo 3 entraram como variveis candidatas: Idade; Postura dos pulsos;
Movimentos repetitivos dos pulsos; Fora dos pulsos; Toro lateral do tronco; Toro
lateral do pescoo; Figura dos braos; Abduo dos braos; Rotao dos Braos; Apoio dos
Braos; Tempo de Actividade; Dor na cervical; Dor nos ombros, Dor nos punhos; Dor na
dorsal; Dor nas coxas e Dor nos tornozelos. No final, destas variveis, apenas se obteve

41
como explicativas para este modelo 4 das variveis. (Movimentos repetitivos dos pulsos;
Toro lateral do pescoo; Braos encontram-se em apoio, havendo suporto do seu peso e
Dor nos punhos).

Por ltimo, para construo do modelo 4, as variveis candidatas utilizadas foram: LME
antiga; Outra actividade; Idade; Antiguidade na profisso; Tempo de actividade, Altura da
cama/ sof; Auxiliares de movimentao; Stress e Satisfao. Destas, a tcnica Forward
Stepwise seleccionou as LME antigas; Idade; Tempo de actividade; Auxiliares de
movimentao e Satisfao do trabalho.

3.4. ANLISE DOS RESIDUOS ATRAVS DA CURVA ROC

3.4.1. Representao da Curva ROC

Com os modelos de regresso construdos, apresenta-se as respectivas curvas ROC, com o


objectivo de avaliar em termos de desempenho, qual dos modelos melhor se ajusta para
explicar a Dor lombar nos enfermeiros que prestam apoio ao domiclio.
De referir que a curva ROC ser usada como alternativa para avaliar o diagnstico dos
modelos gerados i vs yi .

42
Grfico 5- Curva ROC para os quatro modelos

Para cada uma das curvas apresentadas obteve-se o valor da rea e os respectivos intervalos
de confiana a 95%.

rea Std. Error I.C.


Modelo1 0.844 0.045 [0.756; 0.932]
Modelo 2 0.878 0.042 [0.796; 0.961]
Modelo 3 0.834 0.053 [0.731; 0.937]
Modelo 4 0.74 0.048 [0.647; 0.834]
Tabela 5- Resultados curva ROC

Atravs da anlise da curva ROC verificou-se que para todos os modelos que o valor da
rea est acima de 0.7, e com um erro padro associado no superior a 0.053, o que
significa que tm um bom poder discriminante no que concerne avaliao das queixas
referentes regio lombar por parte dos enfermeiros que prestam apoio ao domiclio.

3.4.2. Comparao de modelos com recurso ao teste da rea abaixo da curva ROC

Neste ponto, vai-se proceder a comparaes dos modelos dois a dois.


Est-se interessado a testar as seguintes hipteses:
H 0 : A1 A2 0 vs H1 : A1 A2 0 .

43
Ou seja, queremos verificar a igualdade das reas entre os dois modelos. Isto , vai-se
comparar
A1 versus A2
A1 versus A3
A1 versus A4
A2 versus A3
A2 versus A4
A3 versus A4

Os resduos gerados so independentes, assim a correlao entre as reas nula.


Apresenta-se de seguida as representaes das curvas ROC dos modelos que sero
comprados dois a dois.

44
Grfico 6- Curvas ROC dos modelos dois a dois

Indo ao encontro do que foi dito em 2.4.5., e aplicando a frmula (25), tem-se para a
comparao entre os quatro modelos a tabela resumo:

45
M2 M3 M4
A1 A2 A1 A3 A1 A4
z1 0.55 z2 0.14 z3 1.581
2 2 2 2 2 2
M1 SE A1 SE A2 SE A1 SE A3 SE A1 SE A4

M2 z4
A2 A3
0.65 z5
A2 A4
2.164
2 2 2 2
SE A2 SE A3 SE A2 SE A4

M3 z6
A3 A4
1.31
2 2
SE A3 SE A4

Tabela 6- Valores de z relativos a comparaes de reas

Como z segue uma distribuio normal padro recorreu-se ao R, para se obter o valor prova
associado a cada z.

z1=1-pnorm(-0.55,lower.tail=T)
z2=pnorm(0.14,lower.tail=F)
z3=pnorm(1.581,lower.tail=F)
z4=pnorm(0.65,lower.tail=F)
z5=pnorm(2.164,lower.tail=F)
z6=pnorm(1.31,lower.tail=F)

Obtendo-se os seguintes valores prova, respectivos a cada um dos z. Salienta-se os valores


obtidos no R tm de ser multiplicados por 2, uma vez que temos um teste bilateral.

z1 z2 z3 z4 z5 z6
Valor prova 0.582 0.89 0.114 0.516 0.032 0.19

Tabela 7- Valores prova associados regio crtica z

Por anlise dos valores provas associados aos vrios valores de z, e tomando como base de
comparao para regra de deciso 0.05, rejeita-se a hiptese de igualdade de reas apenas
para o valor de z5.

46
Como p value z5 0.032 0.05 , rejeita a hiptese de igualdades de reas para z5, o que

significa que se detectaram diferenas significativas entre as reas do modelo 2 e modelo 4.

Neste sentido, no se detectaram diferenas significativas entre os modelos:

Modelo1 Modelo 2
Modelo1 Modelo3
Modelo1 Modelo 4
Modelo2 Modelo3
Modelo3 Modelo 4

Tendo em conta estes resultados e o valor das reas apresentadas para cada modelo, tomou-
se o modelo 2 como o sendo explicativo das LME dos enfermeiros que prestam apoio ao
domiclio, associado dor na lombar.

Modelo 2 0.336 V 6 1.851 V 12 2.02 V 14 1.702 V 26 0.414 V 33


0.74 V 36 0.618 V 43 4.05 V 40 0.89 Backward Condicional

Codificao das variveis explicativas do modelo:

Variveis Codificao
V6-Antiguidade na profisso Expressa em anos
Respondia apenas pelos profissionais
V12-Dor punho que prestam apoio ao domiclio.
0-No; 1-Sim
Respondia apenas pelos profissionais
V14- Dor nas Coxas que prestam apoio ao domiclio.
0-No; 1-Sim
V26-Pulsos:movimentos repetitivos Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0-No; 1-Sim

47
V33-Pescoo: toro lateral Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0-No; 1-Sim
V36- Figura braos Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
1-20 extenso a 20flexao; 2- >20
extenso;3- 20 a 45 flexo; 4-45 a
90 flexo;5- > 90 flexo
V40-Apoio do brao Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0-No; 1-Sim
V43- Tempo de actividade Respondia apenas pelos profissionais
que prestam apoio ao domiclio.
0- Nunca; Raramente;
1- Com alguma frequncia;
Frequentemente; Sempre
Tabela 8: Codificao das variveis explicativas do modelo

48
CAPTULO 4- CONCLUSO & TRABALHOS FUTUROS

4. Concluses
4.1. CONCLUSES

O tamanho da amostra no permite uma inferncia sobre a populao, no entanto podemos


caracteriz-la em diversos aspectos.

H uma associao estatisticamente significativa mais elevada entre queixas msculo


esquelticas na regio lombar e prestao de cuidados ao domiclio(com 95% de
confiana 1.256; 8.076 , razo de possibilidade 3.185 p value 0.05 ). Ou seja, os

enfermeiros que prestam apoio ao domiclio tm cerca de trs vezes mais possibilidade de
ter queixas msculo-esquelcticas na regio lombar do que os outros enfermeiros.

Aps se verificar que a zona lombar a zona que apresenta maior evidncia para relacionar
este tipo de queixas com alguns factores associados com estes profissionais, construiu-se
modelos de regresso logstica. Estes modelos foram construdos utilizando os mtodos
implementados em SPSS, obtendo-se quatro modelos distintos:
- O modelo 1 com quatro variveis explivativas (Movimentos repetitivos dos pulsos;
Caracterizao da figura relativa aos braos; Braos encontram-se em apoio,
havendo suporto do seu peso e Satisfao do trabalho);
- O modelo 2 com oito variveis explicativas (Antiguidade na profisso; Dor nos
punhos; Dor nas Coxas; Movimentos repetitivos dos pulsos; Toro lateral do
pescoo; Caracterizao da figura relativa aos braos; Braos encontram-se em
apoio, havendo suporto do seu peso e Tempo de desempenho da actividade);
- O modelo 3 com quatro variveis explicativas (Movimentos repetitivos dos pulsos;
Toro lateral do pescoo; Braos encontram-se em apoio, havendo suporto do seu
peso e Dor nos punhos);
- O modelo 4 com quatro variveis explicativas (LME antigas; Idade; Tempo de
actividade; Auxiliares de movimentao e Satisfao do trabalho).

49
Atravs da anlise da curva ROC obteve-se as curvas referentes a cada modelo, assim
como as respectivas reas, erros padro e intervalos de confiana a 95%.
Uma vez construdos quatro possveis modelos, atravs da comparao de reas abaixo da
curva ROC, seleccionou-se o modelo 2.

Verificou-se que o valor abaixo da curva ROC de 0.844 com um erro padro associado de
0.042 e com um intervalo de confiana a 95% de [0.796; 0.961] o que indica um bom poder
discriminante, no que concerne avaliao das queixas referentes regio lombar
relativamente aos enfermeiros que prestam apoio ao domiclio. O valor 0.844 significa
ainda que 84.4% dos casos do modelo logit apresentado acerta na predio das queixas de
dor na regio lombar para esses enfermeiros.
Neste sentido, as variveis explicativas para as LME dos enfermeiros que prestam apoio ao
domiclio so: Antiguidade na profisso; Dor nos punhos; Dor nas Coxas; Movimentos
repetitivos dos pulsos; Toro lateral do pescoo; Caracterizao da figura relativa aos
braos; Braos encontram-se em apoio, havendo suporto do seu peso e Tempo de
desempenho da actividade.

4.2. SUGESTES PARA TRABALHOS FUTUROS

Nesta seco deixa-se algumas sugestes para possveis trabalhos futuros.

Com o decorrer da anlise dos resultados teve-se a percepo que se poderia ter realizado
uma anlise mais detalhada, assim como comparao dos resultados utilizando softwares
diferentes.

Neste sentido deixa-se uma lista de possveis sugestes:

Uma vez que em regresso logstica a obteno dos modelos no nica, poderia
ter-se obtido uma lista mais elevada de modelos, incluindo ou excluindo novas
variveis;
Comparao dos resultados utilizando o SPSS e o R, com objectivo de verificar se
se obteria resultados semelhantes, e consequentemente, as mesma concluses;

50
Uma anlise dos resduos, para identificar possveis elementos para os quais se
verifique um maior afastamento entre o valor predito e o valor da varivel resposta;
Realizar um estudo das interaces entre as variveis em anlise;

51
52
ANEXOS

1. Tabela de codificao das variveis:

Variveis Cdigo
Outra actividade profissional V1
Praticou desporto V2
LME antiga V3
Sexo V4
Idade V5
Antiguidade profisso V6
Peso V7
Altura V8
Dor cervical V9
Dor ombros V10
Dor cotovelos V11
Dor punhos V12
Dor dorsal V13
Dor coxas V14
Dor joelhos V15
Dor tornozelo V16
Horas semanais de apoio ao V17
domiclio
Distribuio semanal do apoio V18
ao domiclio
Trabalho domicilirio V19
efectuado
Actividades ao domiclio V20
Figura antebrao V21
Figura pulsos V22
Pulsos: toro lateral V23
Pulsos: pega V24
Pulsos: postura V25
Pulsos: movimentos repetitivos V26

53
Pulsos: aces rpidas V27
Pulsos: fora V28
Pulsos: choque V29
Figura tronco V30
Tronco: toro lateral V31
Figura pescoo V32
Pescoo: toro lateral V33
Figura pernas V34
Flexo joelhos V35
Figura braos V36
Braos: abduo V37
Braos: rotao V38
Elevao ombro V39
Apoio brao V40
Movimentao paciente V41
Colaborao de um colega V42
Tempo da actividade V43
Pausas V44
Auxiliares de movimentao V45
Caracterizao do espao V46
Espao disponvel V47
Arrumao V48
Altura cama/sof V49
Dependncia do paciente V50
Trato paciente V51
Stress V52
Satisfao com o trabalho V53
Ansioso/ irritavel V54
Tabela A1- Codificao das variveis.

54
BIBLIOGRAFIA

Athayde, M. (2005). Estatstica. R. Braga: Publicado pelo Departamento de Matemtica da


Universidade do Minho.

Bandeira, M. (s.d.). Texto 10: Anlise de Dados, cronograma, oramentos, pertinncia,


consideraes ticas. Departamento de Psicologia- UFSJ.

Bessa, J. (2007). Seleco das Fontes de Dados e Participantes, elaboao do protocolo


para colheitas, processamento e anlise de dados.

Braga, A. (1994). Acidente Vascular Cerebral e seus Factores de Risco. Estudo de


ocorrncia de quatro tipos de AVC. Tese de Mestrado, Universidade do Minho.

Braga, A. (2000). Curva ROC: Aspectos fundamentais e Analiao. Braga: Tese de


Doutoramento, Universidade do Minho.

Braga, A. (s.d.). Mini- curso: Curvas ROC. Tardes de Estatstica e Investigao


Operacional.

Carneiro, P. (2005). Anlise ergonmica da postura e dos movimentos na profisso de


mdicos dentistas. Universidade do Minho, Tese de Mestrado.

Crichton N. (2001). Wald test; 2001 Blackwell Science Ltd. Jornal of Clinical Nursin,
www.blackwellpublishing.com/specialarticles/jcn_10_774.pdf.

Direo Geral de Sade. (2008). Leses Musculoesquelcticas Relaciondas com o Trabalho.


Programa Nacional contra as doenas reumticas, Guia de Orientao para a
preveno.

Hosmer, D. J., & Lemeshow, S. (1989). Applied Logistic Regression. Copyright by John
Wiley & Sons, Inc.

Laureano, M., & Botelho, M. (2010). SPSS o meu manual de consulta rpida. Lisboa:
Edies Slabo, Lda, 1 Edio.

Margotto, P. (s.d.). Curva ROC: Como fazer e Interpretar no SPSS. Professor do Curso de
Medicina da Escola Superior de Cincias da Sade (ESCS/CES/DF).

Martinez, E., Neto-Louzada, F., & Pereira, B. (2003). A Curva ROC para testes
diagnsticos. Rio de Janeiro, 11 (1):7-31.

Martins, P. S. (2008). Anlise estatstica de performance de um conjunto de testes


auditivos. Tese de Mestrado, Universidade de Aveiro.

55
Misso, F., & Jacobi, L. F. (2007). Variveis dummy:especificaes de modelos com
parmetros variveis. Brasil: Cincias e Natura, UFSM.

Pestana, M., & Gageiro, J. (2005). Anlise de dados para Cincias Sociais- A
Complementaridade do SPSS. Lisboa: Editora Slibo, 4 Edio.

Rumel, D. (1986). Odds ratio-algumas consideraes. Revista de Sade Publica V.20 n3.
Brasil: Departamento de Epidemiologia da Faculdade de Sade Publica da
Universidade de So Paulo.

SPSS Inc. (2007). SPSS Regression 17.0. Obtido em Setembro de 2011, de


http://www.helsinki.fi/~komulain/Tilastokirjat/IBM-SPSS-Spec-Regression.pdf

Pginas da Internet (consultadas no perodo de Janeiro a Outubro de 2011)

www.tecminho.uminho.pt

www.empreendedorismo.uac.pt/spinofss/spinoffs_academicos

www.pse.pt

http://portalaction.com.br

http://www.ensp.unl.pt

56

Das könnte Ihnen auch gefallen