Sie sind auf Seite 1von 40

MODELO DE REGRESSO DE COX

Os modelos de regresso paramtricos vistos


anteriormente exigem que se suponha uma
distribuio estatstica para o tempo de
sobrevivncia.


Contudo

esta suposio, caso no seja adequada,


pode fazer com que as estimativas sejam pouco
confiveis.
Com o objetivo de encontrar um modelo mais
flexvel Cox props em 1972 um modelo,
denominado modelo de risco proporcional de Cox.


Esse modelo passou a ser o mais utilizado na


anlise de dados de sobrevivncia por sua
versatilidade.


Como em anlise de sobrevivncia o interesse tambm pode


estar no risco de falha o modelo proposto por Cox modela
diretamente a funo de risco.

O princpio bsico deste modelo para estimar o efeito das


covariveis a proporcionalidade dos riscos ao longo de todo o
tempo de observao.

Suponha o caso simples em que uma nica covarivel, que


um indicador de grupo, considerada.

Considere, por exemplo, que pacientes so aleatorizados para


receber um tratamento padro ou um novo tratamento.

Seja h1(t) e h0(t) as funes de risco no tempo t para pacientes


no
tratamento
novo
e
no
tratamento
padro,
respectivamente.

De acordo com o princpio da proporcionalidade o risco no


tempo t para pacientes no novo tratamento proporcional ao
risco, no mesmo tempo, para pacientes sobre o tratamento
padro.

O modelo de riscos proporcionais pode ser expresso na forma


h1 (t ) = h 0 (t )

Uma implicao da suposio de riscos proporcionais que as


correspondentes funes de sobrevivncia para indivduos no
novo e no tratamento padro so razoavelmente paralelas ao
longo de todo tempo.

Um cruzamento das curvas ou uma variao nas distncias


entre as curvas de diferentes categorias podem indicar
ausncia de proporcionalidade.

O valor de uma taxa de risco ou risco relativo.

Se < 1, o risco de falha em t menor para um indivduo


sobre o novo tratamento, relativo ao indivduo no tratamento
padro.

Por outro lado, se > 1, o risco de falha em t maior para um


indivduo no novo tratamento, ou seja o tratamento padro
indica uma melhor alternativa.

Considere agora um estudo com n indivduos e denote a


funo de risco para o i-simo indivduo por hi(t), i = 1,2,...,n.

Seja h0(t) a funo de risco para um tratamento padro. A


funo de risco para o novo tratamento ento h0(t).

Como o risco relativo, , no pode ser negativo conveniente


considerar = exp().

O parmetro ento o logaritmo do risco relativo e


qualquer valor de definido em (-, +) leva a um valor
positivo de .

Note que valores positivos de so obtidos quando o risco


relativo maior do que 1, que quando o novo tratamento
inferior ao padro.

Seja X uma varivel indicadora de grupo que assume o valor


0 para indivduos no tratamento padro e 1 para indivduos
no tratamento novo.

Se xi o valor de X para o i-simo indivduo no estudo, a


funo de risco para este indivduo pode ser escrita por

hi (t) = h0 (t) exp{xi }




Este modelo o modelo de risco proporcional de Cox para a


comparao de dois tratamentos.

De forma genrica, considere p covariveis, de forma que x


seja um vetor da forma x = (x1,x2,...,xp). A funo de risco
para o i-simo indivduo ento escrita por
hi (t ) = h0 (t ) exp{1 x1i + 2 x2i + ... + p x pi } = h0 (t ) exp{x}

Este modelo composto pelo produto de dois componentes,


um no-paramtrico e o outro paramtrico.

O componente no-paramtrico, h0(t), no especificado e


uma funo no-negativa do tempo.

Este componente geralmente chamado de funo de base ou


funo bsica pois h(t) = h0(t) quando x = 0.

O componente paramtrico, ou componente linear


freqentemente usado na forma multiplicativa garantindo
que h(t) seja sempre no-negativa.

importante citar que o componente no-paramtrico


absorve o termo constante, 0, presente nos modelos
paramtricos.

Este modelo semiparamtrico torna-se mais flexvel que o


modelo paramtrico devido a presena da funo de base.

Existe outras formas possveis para (xi), mas essa a mais


comumente usada para modelos de dados de sobrevivncia.

Este modelo tambm denominado modelo de riscos


proporcionais pois a razo das taxas de falha de dois
indivduos diferentes constante no tempo.

Isto , a razo das funes de risco para os indivduos i e j


hi (t ) h0 (t ) exp( xi )
=
= exp{xi x j }
h j (t ) h0 (t ) exp( x j )

Esta razo de riscos no depende do tempo.

Se um indivduo no incio do estudo tem um risco de falha


igual a duas vezes o risco de um outro indivduo, esta razo
de riscos ser a mesma para todo o perodo de
acompanhamento.

O modelo de riscos proporcionais tambm pode ser escrito em


termos da funo de risco acumulada ou da funo de
sobrevivncia.
exp{x}
H(t / x) = H0 (t) exp{x}
S(t / x) = S0 (t)

H0 (t) = h0 (s)ds
0

S0(t) = exp{
H 0(t)}

ESTIMAO DOS PARMETROS




O modelo de Cox caracterizado pelos coeficientes s, que


mendem os efeitos das covariveis sobre a funo de risco.

Para que o modelo fique determinado, estas quantidades


devem ser estimadas a partir dos dados amostrais.

Partindo do pressuposto de proporcionalidade, possvel


estimar os efeitos das covariveis sem ter que fazer qualquer
suposio a respeito da distribuio do tempo de vida.

A funo de risco bsica e os coeficientes s podem ser


estimados separadamente.

Os s so estimados primeiro e estas estimativas so ento


usadas para construir uma estimativa da funo de risco
bsica.

Este um resultado importante pois assim possvel fazer


inferncias sobre os efeitos das p variveis explicativas no
risco relativo sem precisar estimar a funo de risco bsica.

Os coeficientes s podem ser estimados usando o mtodo de


mxima verossimilhana.

Contudo, a presena do componente no-paramtrico na


funo de verossimilhana torna esse mtodo inapropriado.

Funo de verossimilhana:

Esta expresso funo do componente no-paramtrico,


h0(t), o que torna inapropriado esse mtodo.

A soluo proposta por Cox consiste em condicionar a


construo da funo de verossimilhana ao conhecimento da
histria passada de falhas e censuras para eliminar a funo
de risco bsica.

Este mtodo chamado de mtodo de mxima


verossimilhana parcial.

Considere que em uma amostra de n indivduos existam k n


falhas distintas nos tempos t1 t2 ... tk.

A idia bsica deste mtodo considerar a probabilidade


condicional da i-sima observao vir a falhar no tempo ti
conhecendo quais observaes esto sob risco em ti.

Esta probabilidade condicional, que a razo entre o risco do


indivduo falhar em ti e a soma dos riscos de falha de todos os
indivduos em risco, a contribuio de cada indivduo no
tempo de falha ti.

Ento a verossimilhana individual Li ser,


hi (t i )
Li =
=
h j (t j )
jR (ti )

h0 (t ) exp{xi }
=
h0 (t) exp{xj }
jR ( ti )

exp{xi }
exp{xj }
jR (ti )

R(ti) o conjunto dos ndices das observaes sob risco no


tempo ti.

Assim, condicional a histria de falhas e censuras at o


tempo ti, o componente no paramtrico desaparece da
expresso de verossimilhana.

A funo de verossimilhana dada por


k

L( ) =
i =1

n
exp{ x i }
=

exp{
x

}
i =1

j
jR ( t i )

exp{ x i }

exp{
x

j
jR ( t i )

Os valores de que maximizam a funo de verossimilhana


parcial, L(), so obtidos resolvendo-se o sistema de equaes
definido por U() = 0.

U() o vetor escore de derivadas de primeira ordem da


funo l() = log(L()).

l( ) = log(L( )) = i xi log exp(xj )


i =1
jR(ti )

U ( ) = i xi
i =1

exp( x j )

jR ( t i )
=0

exp( x j )

jR ( ti )

O modelo de risco proporcional para dados de sobrevivncia e


sua funo de verossimilhana parcial assumem que os
tempos de sobrevivncia so contnuos.

Sob esta suposio, no permitem empates nos valores


observados.

Como o tempo de sobrevivncia pode ser registrado em horas,


dias, meses ou at anos podem ocorrer empates nos tempos
de falha ou de censura.

Quando ocorrem empates entre falhas e censuras, usa-se a


conveno de que a censura ocorreu aps a falha, definindo
assim as observaes a serem includas no conjunto de risco
em cada tempo de falha.

Para considerar empates entre tempos de falhas, a funo de


verossimilhana parcial pode ser modificada.

Uma aproximao para a funo de verossimilhana foi


proposta por Breslow e Peto em 1972 e freqentemente
usada em pacotes etsatsticos pela sua forma simples.

Considere si o vetor formado pela soma das correspondentes p


covariveis para observaes que falham no mesmo tempo ti e
di o nmero de falhas neste mesmo tempo.

A funo de verossimilhana, considerando observaes


empatadas dada por

L( ) =

i =1

exp{ s i }

exp{ x j }
j R ( t i )

di

Esta aproximao adequada quando o nmero de empates


em qualquer tempo no grande.

Alguns autores provaram que os estimadores de mxima


verossimilhana para o modelo de Cox so consistentes e
assintoticamente normais sob certas condies de
regularidade.

INTERPRETAO DOS COEFICIENTES




O efeito das covariveis no modelo de riscos proporcionais de


Cox e de acelerar ou desacelerar a funo de risco.

Para interpretar os coeficientes estimados a propriedade de


riscos proporcionais do modelo deve ser usada.

Considere a razo das taxas de falha de dois indivduos i e j,


que tm os mesmos valores para as covariveis com exceo
da l-sima.
hi (t )
= exp { l (x il x
h j (t )

jl

)}

Considere que xl seja uma varivel dicotmica indicando


pacientes hipertensos.

O risco de morte entre os hipertensos exp{l} vezes o risco


de pacientes com presso normal, com as outras covariveis
mantida fixas.

Uma estimativa pontual para exp{} pode ser obtida atravs


do princpio de invarincia do estimador de mxima
verossimilhana parcial.

Seja = exp{}, que a taxa de falha relativa no tempo t,


assim:

{}

= exp

Para obter o desvio padro desse estimador e construir um


intervalo de confiana necessrio utilizar o mtodo delta.

[ ( )] ( )

Var( ) = exp Var

Para verificar a existncia de diferenas significativas entre


os grupos, basta observar se o valor 1 pertence ao intervalo
estimado.

Caso isto ocorra no h evidncias de que os riscos dos


pacientes nos dois grupos apresentam diferenas
significativas.

EXEMPLO: Considere uma covarivel grupo com trs nveis,


representada por x1: grupo 1 e x2: grupo 2. As estimativas de
mxima verossimilhana parcial so:

{}

{ }

exp1 = 2,0(1,5;4,1)

exp 2 = 1,2(0,7;1,8)

Existe diferena significativa entre o grupo controle e grupo


1, mas no existe diferena entre o grupo controle e grupo 2.

O risco de falha para pacientes do grupo 1 duas vezes o


risco dos pacientes do grupo controle.

Considere agora a covarivel idade com efeito significativo e


estimativa pontual dada por exp =1,05 .

Temos ento que se aumentarmos em um ano a idade, o risco


de falha fica aumentado em 5%.

{}

AVALIAO DA PROPORCIONALIDADE DOS RISCOS




Uma avaliao inicial da proporcionalidade do efeito das


covariveis no tempo pode ser feita atravs da construo das
curvas de Kaplan-Meier.

A suposio de proporcionalidade ao longo do tempo, ser


aceita se no houver cruzamento entre as curvas de
sobrevivncia por categorias das variveis.

Uma outra forma de avaliar a suposio de proporcionalidade


atravs da anlise de resduos de Schoenfeld.

Considere que se o i-simo indivduo com vetor de covariveis


xi=(x1i,...,xpi)` observado falhar.

Tem-se para este indivduo um vetor de resduos de


Schoenfeld ri = (ri1,...rip) dado por

{ }
}

{
exp
x

riq = x iq

x jq exp x j

j R ( t i )

j R ( t i )

Estes resduos so interpretados como a diferena entre os


valores observados de covariveis de um indivduo com tempo
de ocorrncia do evento ti e os valores esperados em ti dado o
grupo de risco R(ti).

Estes resduos so definidos apenas nos tempos de falha.

O nmero de vetores de resduos igual ao nmero de


covariveis ajustadas no modelo.

Considere uma situao em que o coeficiente k varia com o


tempo.

Esse coeficiente pode ser dividido em duas partes: uma mdia


constante e uma funo U(t) que apresenta valores que
variam no tempo.

O resduo padronizado de Schoenfeld em ti pode ser obtido


por:
r ( )
ri* ( k ) =

V ( k )

O valor esperado desse resduo padronizado para cada grupo


em risco R(ti) aproximadamente igual parte de k que
varia no tempo.

Dessa forma, atravs do grfico dos resduos padronizados de


Schoenfeld contra o tempo possvel verificar a existncia ou
no de proporcionalidade.

Isto , se a suposio de riscos proporcionais for satisfeita


no dever existir nenhuma tendncia sistemtica no grfico.

possvel realizar um teste para verificar a hiptese de que


no existe correlao entre o tempo de sobrevivncia
transformado e os resduos padronizados.

Isto equivale a testar a hiptese nula de que no existe


tendncia no tempo (H0: =0).

AVALIAO DO AJUSTE DO MODELO




Os mesmos testes aplicados aos modelos paramtricos, tambm


podem ser utilizados no modelo de Cox.

A estatstica de Wald pode ser utilizada tanto para testar a


significncia do parmetro do modelo, como verificar o ajuste
global do mesmo.

O teste da razo de verossimilhana (anlise da funo desvio)


compara modelos encaixados.

Avalia se a incluso de uma ou mais variveis no modelo aumenta


de modo significativo a verossimilhana de um modelo em relao
ao modelo com menos parmetros.

A funo desvio assintoticamente semelhante a estatstica de


Wald quando o nmero de observaes grande. Caso esse nmero
seja pequeno, a anlise da funo desvio mais robusta.

AVALIAO DO AJUSTE DO MODELO




AVALIAO DO AJUSTE DO MODELO




PERGUNTA: Qual o poder explicativo de um modelo


escolhido para avaliar os dados?

Uma medida de qualidade de ajuste para modelos lineares


o R2.

Poucas so as medidas estatsticas disponveis para avaliar


globalmente a qualidade de ajustev de um modelo de
sobrevivncia.

A mais simples delas uma medida baseada na razo de


verossimilhanas e est disponvel no R.

EXEMPLO: Aleitamento materno




EXEMPLO: Aleitamento materno




EXEMPLO: Aleitamento materno




EXEMPLO: TMO


EXEMPLO: TMO


EXEMPLO: TMO


EXEMPLO: TMO


EXEMPLO: TMO


EXEMPLO: Leucemia Peditrica




Das könnte Ihnen auch gefallen