Sie sind auf Seite 1von 45

UNIVERSIDADE FEDERAL DO CEAR

FACULDADE DE ECONOMIA, ADMINISTRAO, ATURIA,


CONTABILIDADE E SECRETARIADO EXECUTIVO - FEAAC
CENTRO DE APERFEIOAMENTO DE ECONOMISTAS DO NORDESTE CAEN

UMA INVESTIGAO SOBRE A OCORRNCIA DE VIS DE SELEO


AMOSTRAL EM CONCURSOS PBLICOS NO BRASL

ANDERSON PASSOS BEZERRA

FORTALEZA CEAR
2012

ANDERSON PASSOS BEZERRA

UMA INVESTIGAO SOBRE A OCORRNCIA DE VIS DE SELEO


AMOSTRAL EM CONCURSOS PBLICOS NO BRASL

Dissertao de Mestrado apresentada ao Curso de


Ps Graduao em Economia da Universidade
Federal do Cear, CAEN / UFC, como requisito
parcial para obteno do ttulo de Mestre.

rea de Concentrao: Teoria Econmica

Orientador: Prof Dr. Luiz Ivan de Melo Castelar

FORTALEZA CEAR
2012

FICHA CATALOGRFICA

UMA INVESTIGAO SOBRE A OCORRNCIA DE VIS DE SELEO


AMOSTRAL EM CONCURSOS PBLICOS NO BRASL

Esta dissertao foi submetida, como parte dos requisitos necessrios obteno
do ttulo de Mestre em Economia, outorgado pela Universidade Federal do Cear
UFC e encontra-se disposio dos interessados na Biblioteca do Curso de
Mestrado em Economia da referida Universidade .
A citao de qualquer trecho desta dissertao permitida, desde que feita de
acordo com as normas de tica cientfica.

_______________________________________

Anderson Passos Bezerra

Data da aprovao _____/_____/_____

BANCA EXAMINADORA

________________________________________

Prof Dr. Luiz Ivan de Melo Castelar


Orientador

________________________________________

Prof Dr. Ricardo Brito Soares


Membro da Banca Examinadora

________________________________________

Prof Dr. Roberto Tatiwa Ferreira


Membro da Banca Examinadora

AGRADECIMENTOS

Aos meus pais Bolivard e Elizabeth pelo estmulo e amparo necessrios e


fundamentais que me proporcionaram para obteno deste ttulo.
minha esposa Jamille, com quem sou muito feliz.
Ao professor Ivan Castelar por me orientar neste trabalho, durante o mestrado e
por ser verdadeiro mestre docente.
Aos professores Ricardo Brito Soares e Roberto Tatiwa Ferreira por terem
aceitado participar da banca examinadora deste trabalho.
As amizades construdas no mestrado em especial, Jos Wellington Coronel,
Cristiano dos Santos, Guilherme Padilha, Pedro de Oliveira, Rodolfo Herald e aos
companheiros do doutorado, Etevaldo Almeida e Rodolfo Costa, amigos estes com
quem compartilhei agonias e alegrias que valeram cada momento.
Aos amigos Fabricio Machado, Joo Paulo Martins e Thibrio Mota, que h
muito so grandes amigos.
Aos companheiros do Conselho Regional de Economia do Cear, Mirian
Pinheiro, Elaine Cristina, Ricardo Macedo, Natlia Pinho, Erick Gabriel, Thiago Costa
e Janara Silveira que alm de leais, foram bastante compreensivos quando da redao
deste trabalho.
A Capes pelo apoio financeiro que me proporcionou para a realizao deste
curso

"Ento voc acha que o dinheiro a raiz de todo o mal. Mas


voc j se perguntou qual a raiz de todo o dinheiro?"
Ayn Rand em A Revoluo de Atlas

SUMRIO

Sumrio

Lista de Tabelas

Lista de Grficos

Resumo

Abstract

Introduo

Reviso de Literatura

Metodologia

10

Descrio dos Dados

16

Resultados Alcanados

21

Interpretao dos Resultados

29

Efeitos Marginais Mdios

29

Determinantes Ligados a Educao

29

Determinantes Ligados a Renda

30

Determinantes ligados situao empregatcia

32

Determinantes ligados faixa etria e a regio de moradia

32

Significncia e ocorrncia de vis de seleo amostral

33

Concluso

35

Referncias

37

LISTA DE TABELAS

Tabela 1 - Variveis utilizadas......................................................................................18


Tabela 2: Resultados da Estimao por MV.................................................................21
Tabela 3: Resultados da Estimao por 2 estgios........................................................24
Tabela 4: Resultados da Estimao do Probit (assumindo que no h vis).................26
Tabela 5: Resultados dos trs mtodos de estimao (2S, MV e probit simples)..........31
Tabela 6: Efeitos Marginais Mdios (2S, MV e probit simples)....................................32

LISTA DE GRFICOS
Grfico 1: Evoluo do emprego pblico 2002-2009....................................................6

RESUMO
O objetivo do presente trabalho volta-se para a avaliao de fatores que possam
influenciar as chances de aprovao em um concurso pblico para o provimento de
cargos pblicos. Com a utilizao de uma base de dados obtida a partir de um concurso
realizado pelo Banco do Nordeste do Brasil, ocorrido em 2003 para cargos de nvel
mdio e da Pesquisa Nacional por Amostra de Domiclio (PNAD) tambm de 2003,
buscou-se traar um mapa dos fatores que influenciam a aprovao no concurso,
contudo levantou-se a hiptese da ocorrncia de vis de seleo amostral, posto que o
simples processo de inscrio no concurso estaria atrelado a certas caractersticas scio
econmicas devendo portanto ser levado em considerao quando da anlise dos fatores
para aprovao, pois de outra forma obteramos resultados enviesados caso tal problema
(vis de seleo) ocorra. Para lograr xito em nossa demanda utilizamos uma adaptao
da metodologia proposta por Heckman, com a diferena que empregamos modelos de
escolha binria, pois nossas variveis dependentes tratavam-se de variveis dummies,
sendo para o processo de inscrio se o indivduo inscreveu-se ou no e para o processo
de seleo se o candidato foi aprovado ou no. Foram realizadas trs estimaes sendo
duas que levam em considerao a problemtica do vis de seletividade e uma terceira
em que ignora-se tal possibilidade. Os resultados encontrados apontam para a
inexistncia do vis corroborando estudos realizados anteriormente relativos ao mesmo
tema.
Palavras-chave: Concurso pblico; Seleo amostral; Desempenho educacional;
Heckman.

ABSTRACT
The objective of this paper turns to evaluation of the factors that may influence the
chances of approval in an aptitude test for admission in public jobs. Using a database
obtained from a aptitude test realized by the Banco do Nordeste do Brasil, occurred in
2003 to mid-level positions, and from Pesquisa Nacional por Amostra de Domiclio
(PNAD) database, also 2003, sought to draw a map of the determinants to approval in
the aptitude test, however the hypothesis of sample selection occurrence was raised,
since the enrollment process in the aptitude test was coupled with certain
socioeconomic characteristics needing so, be considered in the analysis of the approval
factors, or in other way, we could obtain biased results, if the problem (sample
selection) occurs. To obtain success in our demand, we use an adaptation of the
methodology proposed by Heckman, with an addition that was employed in a discrete
choice model, because ours dependent variables are dummies, being to the enrollment
process, if he enrolls or not and for the aptitude process, if he has succeeded or not. We
estimated three models, being two models, considering the sample selection problem,
and another without the selectivity. The results found pointed to nonexistence of the
selectivity problem, confirming other papers on the same theme.
Keywords: Aptitude test; Sample selection; Educational performance; Heckman

1. Introduo
O emprego pblico no Brasil vem se tornando o objetivo profissional de boa
parte da populao em idade ativa, a preparao para um concurso pblico algo
custoso exigindo do participante grande disciplina e aplicao. Entretanto se a
aprovao no gerar benefcios, percebidos pelo indivduo, como superiores queles
custos relacionados preparao, ou mesmo se o indivduo acreditar que possui chances
nfimas de ser aprovado haver grande possibilidade da pessoa no efetivar a inscrio
no concurso. Portanto o problema de escolha do indivduo pela participao no
concurso pode ser visto como uma avaliao de custo/benefcio.
Existem certos benefcios queles que ingressam no setor pblico, um deles a
estabilidade no emprego outra a remunerao que superior praticada no setor
privado para categorias semelhantes, alm de benefcios como plano de sade e
aposentadoria com benefcio equivalente ao salrio da categoria ativa.
Contudo a dificuldade relacionada ao ingresso na carreira pblica tambm uma
grande barreira a ser considerada por aquele que almeja tais vantagens, segundo dados
do IBGE, para cinco grandes Regies Metropolitanas do Brasil entre 2002 e 2009, o
nmero de pessoas empregadas no setor privado foi de aproximadamente 11.135.000
pessoas contra 2.107.000 no setor pblico, alm disso, a taxa de crescimento da
populao ocupada no setor privado para o perodo foi de 0,275%, j para o setor
pblico, em contraste, foi de apenas 0,237%. O grfico abaixo mostra a evoluo do
emprego pblico no Brasil.
Grfico 1: Evoluo do emprego pblico 2002-2009

PESSOAS

(MIL)

Populao Ocupada por Setor


Cinco Grandes Regies Metropolitanas Brasil (2002-2009)
15.000
10.000
5.000
0
2002

2003

2004

2005

Setor Privado

2006

2007

2008

2009

Setor Pblico

Fonte: IBGE

A grande dificuldade em ingressar no servio pblico relaciona-se as matrias


abordadas no concurso, que em geral no foram contempladas no processo educacional
do candidato, bem como com a menor oferta de vagas. Seguindo este raciocnio emerge
a possibilidade da ocorrncia de vis de seleo, ou seja, o processo que determina a
inscrio do candidato influencia a chance de ingresso no setor pblico, pois candidatos
aptos a passar se inscreveriam normalmente, porm existiriam indivduos, na populao,
com caractersticas semelhantes que no se inscrevem no concurso, influenciados por
fatores no observveis e que certamente tambm teriam boas chances de aprovao
(por exemplo, a tal medida intangvel de custo/benefcio, percebido pelo mesmo),
gerando, portanto, impreciso dos efeitos estimados pelo pesquisador que deseje
investigar os mesmos. Trataremos com mais detalhes deste fenmeno, visto que
objetivo deste estudo verificar se ocorre ou no o vis de seletividade amostral.
Poderamos modelar, portanto, que a avaliao da magnitude da relao de
custo/benefcio est condicionada a um conjunto de caractersticas socioeconmicas
relacionadas ao prprio indivduo, resultando na inscrio ou no no concurso pblico
para o provimento de cargo pblico. Uma vez determinados os indivduos na populao
que se inscreveram, podemos modelar, novamente, o processo que leva ao sucesso em
um concurso pblico, como estando condicionado a um grupo de fatores
socioeconmicos relacionados ao candidato que pleiteia a vaga no servio pblico.
Desta maneira se encontrarmos uma correlao vlida entre os dois processos h forte
indcio da existncia do vis, do contrrio, pode-se dizer que o processo de inscrio
ocorre aleatoriamente.
O problema de seleo amostral um problema comum em cincias sociais, e
ocorre quando o pesquisador toma um estrato da populao que no selecionado de
maneira aleatria provocando assim estimativas enviesadas baseadas nesta amostra.
Algum mais desavisado poderia se perguntar se h alguma justificativa para
desconfiar do vis de seleo amostral neste caso, a resposta (talvez no to clara
quanto parece) sim, primeiramente por ser o vis resultante naturalmente do
comportamento humano (WINSHIP & MARE, 1992), que certamente o que estamos
avaliando e encontrando em ampla variedade de estudos tais como insero feminina
no mercado de trabalho, criminologia, sociologia familiar, sociologia educacional, etc.
Segundo (que decorre da primeira), mesmo que no exista o vis e como no est
7

explicito a sua inexistncia, ento no devemos descartar a hiptese a priori. No


ocorrendo seletividade, haveremos ao menos mostrado que no, caso ocorra, teremos
insumos fundamentados para efetuar o ajuste de nossas concluses.
O trabalho est dividido da seguinte maneira, na seo dois apresentamos uma
breve reviso de literatura sobre desempenho acadmico/estudantil, na seo trs
desenvolvemos a metodologia com qual se buscar a possvel existncia do vis
amostral, na seo quatro faremos algumas consideraes sobre as bases de dados que
sero utilizadas e variveis escolhidas destas, nas sees cinco e seis, mostraremos os
resultados alcanados, bem como a interpretao dos mesmos e por fim na seo sete
ser exposta a concluso.
2. Reviso de literatura
Muitos

so

os

trabalhos

versando

sobre

tema

de

desempenho

acadmico/estudantil, e muitas so as abordagens empregadas, porm boa parte segue o


emprego de modelos de escolha qualitativa, onde a varivel dependente o
conceito/nota/ndice de desempenho (compreendido entre certas categorias), e as
variveis explicativas so caractersticas socioeconmicas e/ou caractersticas
individuais, por exemplo, a personalidade do avaliado (Borg & Stranahan, 2002), a
seguir apresentamos alguns destes trabalhos.
Park e Keer (1990) estimaram um modelo logit multinomial para avaliar os
determinantes da performance acadmica de estudantes, com uma amostra de 97
estudantes, onde a varivel dependente correspondia ao resultado final em um curso de
conhecimento bancrio e monetrio (uma escala de valores inteiros de 0 at 4) e as
variveis explicativas representavam inteligncia, preparo, esforo, atitude e
caractersticas demogrficas. Os pesquisadores concluem que as variveis relacionadas
inteligncia, (como o resultado no American College Test (ACT) um teste que serve
como critrio para ingresso em universidade nos Estados Unidos) e as relacionadas a
esforo so preponderantes para o bom desempenho. As demais variveis no se
mostraram significantes. Interessante notar que variveis de contra-esforo, como
possuir um emprego, ou horas gastas no estudo de matrias no relacionadas no se
mostraram significantes.

Yang e Raehsler (2005) utilizando um probit ordenado para avaliar o


desempenho de alunos de um curso intermedirio em microeconomia chegam a
concluses parecidas, tomando uma amostra de 169 estudantes de duas turmas, uma em
2003 e a outra em 2004, ambas com professores diferentes, da Clarion University na
Pensilvnia, tambm utilizando como varivel dependente o conceito final no curso
(novamente uma escala de valores inteiros de 0 at 4) e as variveis explicativas sendo o
nmeros de crditos cursados anteriormente na graduao, a mdia global das
disciplinas cursadas1, o Major2 do curso e uma dummy para a metodologia empregada
pelo professor3. Chegaram concluso que a varivel de maior impacto positivo para o
desempenho foi mdia global das disciplinas anteriormente cursadas.
Mare e Winship (1984) investigaram tendncias de emprego da dcada de 60
dcada de 80 para homens jovens, brancos e negros que esto fora da escola, alm dos
muitos fatores que influenciam estas tendncias a seletividade influencia a populao
que no est na escola. Pessoas que ficam mais tempo na escola tm, em mdia,
melhores perspectivas de trabalho do que aqueles que saem da escola, mostraram,
contudo, que estimativas de tendncias de emprego eram enviesadas pois a
probabilidade de se empregar e deixar a escola eram dependentes. Verificaram que
quando aumentam as matrculas, as taxas de emprego para pessoas jovens fora da escola
caem.
Manski e Wise (1983) pesquisaram os determinantes para graduao na
faculdade, entre vrios, um foi o SAT (Scholastic Aptitude Test, algo como o ENEM no
Brasil), e verificaram que a pontuao no mesmo um fraco preditor da probabilidade
de graduao. Whinship e Mare (1992) apontam que certos problemas relacionados a
seletividade entre fazer o teste e a graduao influenciam este resultado pois, alguns
estudantes que fazem o SAT, no tentam ir para a faculdade, alguns tentam mas no so
admitidos, alguns so admitidos mas no se matriculam e aquele que se matriculam so
selecionados para a amostra entre as instituies em que foram admitidos. Portanto cada
estgio no aleatrio do processo, afeta a avaliao sobre a probabilidade do estudante
se graduar na faculdade.

Mais especificamente o GPA (Grade Points Average) acumulado


O Major a rea acadmica de principal interesse na graduao.
3
Refere-se ao livro empregado pelo professor na disciplina
2

Um trabalho tambm interessante o de Emilio et al. (2004), que faz uma


avaliao dos determinantes do acesso a educao superior e utiliza a correo para o
problema de vis de seleo amostral. Neste trabalho os autores avaliam o desempenho
de candidatos ao vestibular da FUVEST para o ingresso em 2000, constataram que a
educao dos pais (sobretudo a da me) o tipo de escola frequentada pelos candidatos e
ter cursado um curso pr-vestibular, foram os fatores de maior importncia para garantir
o sucesso no vestibular, alm disso, a correo do vis mostrou-se robusta, pois a
mudana ocorrida no erro-padro dos parmetros estimados foi pequena, e houve uma
sensvel diminuio da magnitude desses valores.
Dois trabalhos que versam sobre o mesmo assunto (RAMOS, 2007 e VELOSO,
2004), chegam s mesmas concluses a respeito dos determinantes para o sucesso em
um concurso pblico, ambos comungam da mesma base de dados (de um concurso do
BNB ocorrido em 2003, baseado no questionrio socioeconmico aplicado aos
candidatos) esta mesma base uma das que ser utilizada neste trabalho. Ambos
concluem que tais caractersticas socioeconmicas influenciam sim, a aprovao em um
concurso pblico, precisamente ser de baixa idade, possuir renda familiar elevada,
dispor de tempo livre e ter elevada formao so os fatores que contribuem para o
sucesso no certame. interessante, tambm notar, que as metodologias por estes
utilizadas foram baseadas em variveis dependentes dicotmicas, apesar de cada um
usar metodologia distinta.
3. Metodologia
Como mencionado anteriormente o objetivo deste trabalho avaliar os
determinantes (scio-econmicos) para o sucesso em um concurso pblico para
provimento de cargos, considerando um possvel vis de seleo, causado pelo processo
de inscrio no concurso pblico, ou seja, dentre a populao, os indivduos que
participam do concurso comungam de certas caractersticas que determinam sua
inscrio no certame (ou seja, as observaes retiradas da populao que entram na
amostra no so retiradas de maneira aleatria). Devemos, portanto avaliar tanto o
processo de inscrio no concurso, como o que leva a aprovao do candidato.
Tratemos do primeiro.

10

Assumiremos a hiptese de que o indivduo na populao em condies de


ingressar no servio pblico, aquele que satisfaz as condies previstas em edital
regulatrio do concurso opta por inscrever-se ou no, e condicionaremos esta escolha a
um conjunto de caractersticas deste mesmo indivduo, a varivel que representa a
inscrio binria (o candidato est ou no inscrito), e esta depender de caractersticas
da pessoa, portanto, teremos;
= +

(1)

A varivel I* representa a condio do candidato em relao a sua inscrio no


concurso. O vetor Z apresenta o conjunto de caractersticas do candidato que considerase relevante para sua inscrio, o vetor de parmetros associados ao vetor Z e um
componente estocstico representando fatores no refletidos em Z, sua distribuio

~ N(0 , A participao no certame ento ocorrer do seguinte modo;

= {

(2)

Onde I a varivel que representa se ocorreu ou no a inscrio, sendo 1 em


caso afirmativo e 0 em caso negativo, a varivel c caracteriza-se por um ndice
individual que levado em considerao pela pessoa, sendo a partir de ci o valor crtico
para que ocorra a inscrio, deve-se notar que os valores da mesma no so observveis.
Uma vez que o candidato esteja inscrito, h ainda a dura tarefa de passar nas
provas do mesmo, modelaremos, novamente, utilizando variveis binrias. Por hiptese

tomemos a equao abaixo.


= +

(3)

A varivel Y* relaciona-se linearmente com um conjunto de caractersticas dos


candidatos, representado aqui por X, a letra grega um vetor de parmetros
associados a tais caractersticas, h tambm o componente aleatrio anlogo ao da
equao (1), cuja distribuio dada por ~ N(0 , ). A aprovao no concurso se
dar ento da seguinte forma;

= {

(4)

11

Onde a varivel que representa se o candidato foi ou no aprovado,


analogamente ao processo de inscrio, sendo 1 quando o candidato aprovado e 0
quando no, a varivel a representa a dificuldade associada a prova do concurso, note
que esta tambm no observvel.
Aqui devemos esclarecer alguns pontos, primeiramente s existem dados
relativos posio atingida no concurso, para os candidatos que efetivamente
inscreveram-se no concurso, portanto existe aqui um problema de dados censurados,
segundo acredita-se que o processo de aprovao est relacionado ao processo de
inscrio, se este ltimo no for aleatrio, algumas correes podem ser implementadas,
no caso devemos aplicar a correo de Heckman (1979) que trata do problema de
seletividade amostral (quando os elementos selecionados da populao para compor a
amostra no so selecionados de maneira aleatria), a aplicao direta desta correo,
entretanto para este caso especfico no deve ser implementada s cegas, ou seja, tal
qual a proposta por Heckman, visto que a varivel dependente de nossa equao
principal (1), no quantitativa, entretanto a adaptao bem simples, j foi inclusive
empregada por Van de Ven e Van Praag (1981), e tambm por Emilio et. al. (2004), no
entanto, como se trata de uma adaptao simples da proposta de Heckman, convm
expor a sua metodologia, para facilidade de compreenso.
Tomemos

equao

(3),

aplicando

mnimos

quadrados

diretamente

(considerando a regra de seleo amostral - r.s.a.), obteramos o seguinte resultado


[ |, . . . ] = + [|, . . . ]

(5)

Aqui emerge o motivo pelo qual nos preocuparmos com o vis de seletividade,
se o erro da equao principal (3), for ortogonal a regra de seleo amostral, ento no
haveria problema na estimativa direta da mesma, pois o segundo termo do lado direito
da equao seria [ | , . . . ] = 0, contudo, se no o for, claramente termos
estimativas viesadas (da o nome vis de seleo amostral). Consideremos a existncia
do problema, a regra de seletividade est na equao (2), teramos, portanto (por
convenincia faremos c = 0)
[ |, ] = + [|, ]

(6)

12

Teremos ento uma correlao entre o erro da equao principal (3) e da


equao de seleo (1), onde e distribuem-se conjuntamente como uma normal
padro bivariada (HECKMAN, 1979), ou seja;
[|, ] = ( / ) ( ) = ( )

(7)

Onde o coeficiente de correlao entre os erros das equaes principal (3) e


de seleo (1), o erro padro do componente estocstico da equao principal (3),

o erro padro do componente estocstico da equao de seleo (1) veja que


podemos escrever a equao (7) desta maneira, pois multiplicamos e dividimos por

poise o termo ( ) a chamada razo de Mills invertida (GREENE, 2002). A


razo de Mills invertida dada por,

( )

( )

= (
=
)
( )

(8)

Os termos e representam respectivamente o funo densidade e acumulada


de uma distribuio normal, e o termo = ( )/ . Note que devido simetria da
distribuio normal podemos fazer ( ) = ( ).

Portanto se existe a

correlao entre os erros das duas equaes a aplicao de mnimos quadrados


diretamente, no deve ser realizada, na verdade o modelo correto a ser estimado seria;
= + ( ) +

(9)

Onde = ( ), como dissemos anteriormente e distribuem-se


conjuntamente como uma normal padro bivariada, costuma-se nesses casos normalizar

= = 1 (EMILIO ET AL, 2004), aqui tambm o faremos, apenas a ttulo de


simplificao, portanto teremos;
= + ( ) +

(10)

Desta maneira temos segundo a equao acima, dois vetores de parmetros a


serem estimados, e , este ltimo indicativo de vis de seleo amostral, portanto
um teste timo para detect-la testar o prprio parmetro atreves de um teste t comum,
se este se mostrar no significante, no h indcios de vis de seleo amostral, do
contrrio h forte indcio da existncia de seletividade.
13

Feito isto h ainda um problema na estimao da equao (10), o vetor X


formado de elementos conhecidos, contudo a razo de Mills invertida no, pois depende
do componente i que depende do parmetro populacional que desconhecido,
devemos, todavia, estimar o parmetro pertencente equao de seleo, tambm o
que tambm, por se tratar de um parmetro populacional, deve ser estimado. Deste
modo utilizaremos;

)
(

= ( ) =

/
(
)
(
/
)

(11)

E a equao que realmente ser estimada, assumir a seguinte forma;


) +
= + (

(12)

Podemos de fato ver que o erro da equao acima no tendencioso, veja que a
equao (10), pode ser escrita como,
= [ |, ] +

(13)

Aplicando [. |, , ] e passando o primeiro termo do lado direito da


equao acima, para a esquerda, termos ento que
[|, , ] = [ |, , ] - [[ |, ]|, , ]
[|, , ] = 0

(14)

Entretanto esta correo, apesar de anular a tendenciosidade, gera um novo


problema, cria heteroscedasticidade no modelo, pois,
[ |, , ] = + ( ) =

(15)

Utilizaremos a equao acima para corrigir a heteroscedasticidade do novo


modelo. Uma vez realizada a correo na equao (12), estima-se o modelo atravs de
uma regresso linear simples.
A estimao do modelo, pode ser realizada de duas maneiras, por mxima
verossimilhana (MV) ou por 2 estgios (2S), o caso por 2 estgios foi mostrado acima,
para a situao em que a varivel dependente quantitativa. No caso da estimao por
14

MV, trata-se apenas de maximizar a funo de log-verossimilhana mdia (VELLA,


1998), essencial lembrar que supomos que erros se distribuam normalmente, portanto
maximizamos

= { . [( ) ( , )] + (

) [ ( ) (, )]}

(16)

Pode-se ver que se o coeficiente de correlao entre os erros for nulo ( = 0), a

expresso acima ser bastante simplificada, pois a segunda integral tornar-se- o


logaritmo do produto de duas integrais, entretanto se isto ocorre, no h motivo pelo
qual se preocupar com vis de seleo amostral, posto que os erros da equao principal
(3) e da equao de seleo (1) sero independentes. Neste trabalho utilizaremos tanto o
mecanismo de estimao por mxima verossimilhana, como a estimao por 2 estgios
(2S), cabe ressaltar que a estimao por MV gera estimativas mais eficientes do ponto
de vista estatstico.
Para o caso da estimao por 2S, h pouca alterao na metodologia original
proposta por Heckman, Van de Ven e Van Praag (1981) e Emilio et al. (2004),
descrevem um pequeno roteiro para o caso com varivel dependente dicotmica, abaixo
reproduzido
1) Estimar um probit comum para a equao de seleo (1), obtendo assim
estimativas para , com este resultado, obter estimativas para .
2) Estimar um modelo de probabilidade linear (MPL), onde a equao a ser
regredida = + + , obtendo assim estimativa para ,
, substituir em (15) e obter uma estimativa para e
3) Tendo agora e
corrigir o problema da heteroscedasticidade em (12)
4) Por fim, estimar e , utilizando um probit no modelo corrigido (equao
12 aps correo do passo 3).
Por esse roteiro obteremos boas aproximaes dos valores dos parmetros
(EMLIO ET AL., 2004), apesar de que a estimao por MV obtm as melhores
estimativas, o processo por 2S uma boa alternativa que resulta em aproximaes
muito boas das obtidas por MV.
15

4. Descrio dos dados


Devido natureza do problema estudado neste trabalho, utilizamos duas bases
de dados, a saber, uma oriunda do concurso realizado em 2003 para o provimento de
cargos do Banco do Nordeste do Brasil (BNB) e a outra a prpria Pesquisa Nacional por
Amostra de Domiclios (PNAD) tambm de 2003. A primeira contava com 232.308
observaes, enquanto que a segunda possua 384.834 observaes. A razo de se
utilizar duas bases de dados est exatamente na suspeita da ocorrncia do vis amostral,
o ideal seria que existisse uma base de dados nica que englobasse todos os candidatos
e no inscritos no concurso, como essa base no existe a alternativa tomada foi o uso da
PNAD 2003, tal escolha tambm no se deu de maneira leviana, existem pelo menos 2
bons motivos para a utilizao desta, primeiramente nos dados do BNB, no h
informaes sobre o estado de origem do candidato, apesar do emprego ser para um
instituio que est no nordeste do pas, possvel que muitos candidatos tenham
residncia fixa em estados que no compe tal regio, segundo como a PNAD rene um
grande nmero de informaes e realizada em todo o pais, tais candidatos tem grande
probabilidade de estarem representados na amostra, isso fundamental para que
realizemos um cruzamento entre as duas bases de dados.
Os dados da PNAD de 2003 contemplam indivduos das mais variadas
caractersticas, entretanto para participao no concurso era necessrio que o candidato
estivesse enquadrado em um grupo especfico destas, a saber, ter no mnimo 18 anos e
no mximo 69, pois no Brasil 70 anos a idade para aposentadoria compulsria e
possuir escolaridade mdia (antigo segundo grau), aplicado estes filtros a base da
PNAD 2003, reduziu-se de 384.834 observaes para 76.011 indivduos representados
aptos a pleitear vaga no referido concurso pblico. Alm disso, precisvamos encontrar
aqueles candidatos que efetivamente se inscreveram e estavam representados nas duas
amostras, ou seja, realizar um cruzamento entre observaes comuns as duas bases de
dados, para tanto se tomou com referncias as informaes dos dados contidos na
amostra oriunda do BNB, que eram renda individual, renda familiar, grau de estudo,
regio de moradia (metropolitana ou rural), estado civil, situao no mercado de
trabalho, idade e tipo de ensino mdio do candidato (pblico ou privado). Entretanto em
relao a ltimo quesito infelizmente tivemos que ignor-lo como critrio para
16

cruzamento de informaes, pois no h na PNAD de 2003 informaes que reflitam o


tipo de escolaridade que a pessoa teve durante seu ensino mdio4. Feito este cruzamento
sobraram 46.407 observaes das 232.308 originais. Feitas estas retificaes, ficamos
com um conjunto de variveis para a equao de seleo que contm as informaes do
conjunto de variveis da equao principal e mais algumas informaes adicionais, em
nosso caso especfico, utilizamos uma medida de contra-esforo, a saber, se o candidato
trabalha e a durao de sua jornada semanal, tal informao, dividimos em trs
variveis, uma correspondendo a uma jornada curta, at 30 horas semanais, a segunda
correspondente a uma jornada mdia, entre 40 e 44 horas semanais de trabalho e a
terceira relativa a uma jornada longa, acima de 44 horas semanais de trabalho, todas
representadas por dummies, onde a categoria base no estar empregado. Os motivo
para utilizar variveis de contra-esforo, so pelo menos dois, o primeiro est na
prpria natureza do problema, algum que deseje enfrentar um processo de seleo,
deve tambm considerar o custo de oportunidade associado a sua escolha, de se
esperar que aqueles candidatos com maior jornada enfrentem um maior custo para se
prepararem para a prova, o segundo motivo est relacionado a outros estudos relativos a
desempenho acadmico, como mencionado anteriormente, tais tipos de variveis
geralmente so utilizadas. Tambm utilizamos uma dummy para o sexo dos
concorrentes, onde a categoria base ser do sexo feminino, no temos expectativa a
priori do efeito desta varivel, no por desconhecimento de efeitos relacionados ao sexo
e mercado de trabalho no Brasil, mas sim por fatos que parecem se chocar, segundo
dados do IBGE no ano de 2002 as mulheres engajadas no mercado de trabalho recebiam
em mdia 70% dos rendimentos auferidos por homens, e em mdia possuam 1 (hum)
ano a mais de estudo que os homens, se levarmos em considerao que em um emprego
pblico cujos rendimentos so fixados para categorias trabalhistas e em geral com efeito
legal e de acordo com os princpios que regem a administrao pblica, bem como
existncia de planos de cargos e salrios, com regras objetivas definindo as promoes e
ajustes salariais de se esperar ento que as mulheres estejam mais propensas a
dedicarem-se ao ingresso na carreira pblica, por outro lado a mesma fonte que nos traz
a luz desta verdade parcial, tambm aponta que a relao entre empregos e anos de
estudo tende a diminuir a medida que crescem os anos de estudo, para se ter idia,
4

Existe a varivel V6002 (Rede de ensino) que tem como possveis resultados 2 = Pblica, 4 = Particular
e 9 = Sem declarao, entretanto esta informao s referente queles pesquisados que so
estudantes ou freqentam creche na data de referncia, por isso optou-se por no utilizar tal varivel

17

segundo dados de 2002, para pessoas entre analfabetas e at 3 anos de estudo a taxa de
desocupao era de 5,6%, para aqueles que estavam entre 4 e 7 anos de estudo
apresentavam taxa de desocupao em 9,6% e aqueles com 8 anos ou mais de estudo a
taxa de desocupao crescia para 10,6%, diante do exposto no se pode formular um
efeito esperado para a varivel relacionada ao sexo, alm disso utilizamos mais duas
variveis dummies para captar a possvel existncia de algum efeito oriundo da
tonalidade da pele, sobre a deciso de se inscrever no certame. Dito isto ficamos com 13
variveis para a equao de seleo e 8 (oito) variveis para a equao principal, na
tabela a seguir apresentamos a variveis e os sinais esperados destas, na equao de
seleo e na equao principal.

Tabela 1: Variveis utilizadas

VARIVEL

NOTAO

CATEGORIA BASE
1

SINAL ESPER.

EQUAO DE SELEO
Ens. Mdio

ENSMED

Possui apenas o

Caso contrrio

Caso contrrio

Solteiro

ensino mdio
Ens, Superior

ENSSUP

Possui ensino
superior completo

Estado Civil

SOLT

Casado

Renda Familiar Mensal

RFMA

Maior ou igual a 10 Caso contrrio

salrios mnimos*
Renda Pessoal Mensal

RPMB

Menor ou igual a 2

Caso contrrio

Caso contrrio

salrios mnimos*
Regio Metropolitana

RMETR

Mora em regio
metropolitana

18

Jornada Curta

JCURT

Entre 15 e 39 horas

Caso contrrio

Caso contrrio

Caso contrrio

semanais
Jornada Mdia

JMED

Entre 40 e 44 horas
semanais

Jornada Longa

JLONG

Mais de 44 horas
semanais

Sexo

SEXO

Masculino

Feminino

Idade Baixa

IDADB

Entre 18 e 22 anos

Maior de 22

anos
Cor da pele branca

BRANCA

Branco

Caso contrrio

Cor da pele, negra, parda

NPIND

Negro, Pardo ou

Caso contrrio

Caso contrrio

Caso contrrio

Solteiro

ou indgena

Indgena
EQUAO PRINCIPAL

Ens. Mdio

ENSMED

Se possui apenas o
ensino mdio

Ens, Superior

ENSSUP

Se possui ensino
superior completo

Estado Civil

SOLT

Casado

Renda Familiar Mensal

RFMA

Maior ou igual a 10 Caso contrrio

salrios mnimos*
Renda Pessoal Mensal

RPMB

Menor ou igual a 2

Caso contrrio

Caso contrrio

salrios mnimos*
Sit. no Merc. de Trabalho DEST

Desempregado ou
estagirio

19

Regio Metropolitana

RMETR

Se mora em regio

Caso contrrio

Maior de 22

metropolitana
Idade Baixa

IDADB

Entre 18 e 22 anos

anos
*O salrio mnimo no ano de 2003 era de R$ 200,00 at o dia 1 de Abril daquele ano, passando a ser a
partir daquela data R$ 240,00 at 1 de Maio de 2004. Portanto tomaremos como salrio mnimo o
valor de R$ 240,00.

Cabe aqui alguns esclarecimentos a respeito dos efeitos esperados de tais


variveis, j mencionamos acima o motivo daquelas relacionas a contra-esforo, sexo e
cor da pele. No caso das variveis relativas ao ensino mdio e ao ensino superior
completo (categoria base ensino superior incompleto), para a equao de seleo temos
efeito esperado negativo, isto est relacionado ao nvel exigido para o concurso, o nvel
daqueles que realmente se inscrevem no mesmo, que o prprio ensino mdio, visto
que aps a censura de dados, a proporo de observaes relativas ao ensino mdio, se
altera, pois antes da inscrio tnhamos uma proporo de 65,14% das observaes
possuidoras de apenas ensino mdio contra 34,86% detentoras do ensino mdio, e aps
a inscrio ficamos com 46,66% detentores do ensino mdio contra 53,34% possuidoras
de ensino superior completo, temos aqui um indcio de que possuir apenas o ensino
mdio contribui negativamente para participar do concurso, no caso desta varivel para
a equao principal, existem conhecimentos requeridos para este concurso que no so
contemplados no ensino mdio regular e que compe o concurso, enquanto que aqueles
candidatos que j concluram o ensino superior j esto acostumados (acredita-se) a
prtica autodidtica, bem como rotinas de estudo mais intensas.
No que tange as variveis relacionadas renda, em ambas as equaes o efeito
esperado o mesmo, no caso da renda familiar mensal alta positivo e para a renda
pessoal mensal baixa negativo, pois rendas mais elevadas garantem acesso a certas
condies de qualidade de estudo e, portanto, preparao adequada, de se esperar que
o candidato nestas condies esteja mais propenso a se inscrever e passar na prova
requerida para o ingresso no servio pblico.
Quando acreditamos que residir em regio metropolitana e possuir idade baixa
(entre 18 e 22), contribuem positivamente, tanto para inscrio no concurso como para
20

aprovao, estamos supondo que na primeira situao as dificuldades relativas a


adquirir boas condies de ensino so minoradas, enquanto que na segunda situao, o
indivduo est mais prximo de conhecimentos mais recentes, alm de estar tambm
de sua poca estudantil, seno ainda nesta, o que o tornaria mais propenso a dedicao
acadmica.
Por fim no que diz respeito ao estado civil do candidato e situao empregatcia
dos indivduos, no que tange a primeira varivel, no temos expectativas a priori, pois o
candidato solteiro por no ter tantas obrigaes familiares, goza de mais tempo livre
para debruar-se em seus estudos, o que o faria mais propenso inscrio e aprovao
no processo seletivo, por outro lado o candidato casado tem mais incentivo melhoria
de sua situao financeira, j que deve garantir recursos para atender necessidades
prprias e da famlia, e, portanto visando os benefcios que o servio pblico brasileiro
oferece, se dedicaria mais a conquista desta vaga. A situao empregatcia do agente,
tambm apresenta a priori efeito ambguo, pois aqueles que no trabalham ou so
apenas estagirios gozam de maior tempo livre, vantagem para quem deseja se preparar
para um concurso pblico, entretanto aqueles que trabalham no intuito de conquistarem
benefcios que no se apresentam no setor privado, estariam mais dispostos a realizarem
sacrifcios (entenda-se reduzir tempo destinado a atividades de lazer) para
conquistarem a sonhada vaga no setor pblico.
5. Resultados Alcanados
O software utilizado para estimarmos o modelo foi o STATA verso 11.0, pelo
mtodo da mxima verossimilhana, anteriormente apresentado. Os resultados da
estimao so apresentados abaixo
Tabela 2: Resultados da Estimao por MV

Probit com seleo amostral

N de Observaes

= 46407

Observ. Censuradas

= 14158

Log Verossimilhana = - 20793,39

Observ. No Censuradas = 32249

Prob > chi2 = 0,0000

Wald chi2(8) = 49,97


Equao Principal
21

Varivel

Coeficiente

Erro Padro

P > |Z|

ENSMED

-0.4732588

0.120425

-3.93

0.000

ENSSUP

0.0928397

0.1037557

0.89

0.371

SOLT

-0.2099085

0.1084117

-1.94

0.053

RFMA

0.1952131

0.09983

1.96

0.051

RPMB

0.0062186

0.0862049

0.07

0.942

DEST

0.2003213

0.0927374

2.16

0.031

RMETR

0.2768601

0.0948476

2.92

0.004

IDADB

0.1801416

0.1134317

1.59

0.112

Constante

-3.007952

0 .1389316

-21.65

0.000

Equao de Seleo
ENSMED

0.4706823

0.0216092

21.78

0.000

ENSSUP

-0.0865741

0.0241964

-3.58

0.000

SOLT

0.1506231

0.0187824

8.02

0.000

RFMA

0.1010285

0.017481

5.78

0.000

RPMB

0.6185016

0.0179085

34.54

0.000

RMETR

0.3964034

0.014671

27.02

0.000

JCURT

-2.194237

0.0367443

-59.72

0.000

JMED

-1.982935

0.0359596

-55.14

0.000

JLONG

-1.443836

0.03714

-38.88

0.000

SEXO

0.182367

0.0169986

10.73

0.000

IDADB

0.2523003

0.025155

10.03

0.000

BRANCA

-0.1252488

0.1169461

-1.07

0.284

NPIND

-0.0791051

0.1171555

-0.68

0.500

22

Constante

1.257976

0.1237322

10.17

Teste da Razo de Verossim. para as equaes independentes (


Chi2(1) = 2.82

0.000

= 0)

Prob > chi2 = 0.0929

Fonte: Elaborao Prpria

Mostraram serem significantes para a equao de seleo todas as variveis, com


exceo daquelas relacionadas cor da pele (mesmo para nveis de significncia de
10%), portanto o processo de inscrio parece ser influenciado sim por caractersticas
scio-econmicas que atuam sobre o indivduo, sugerindo, portanto que tal processo
no se d de maneira aleatria como se poderia imaginar. No que tange a equao
principal o processo j foi mais penoso, ao nvel de significncia de 5%, apenas trs
variveis mostraram-se robustas, a saber, aquela relacionada ao ensino mdio
(ENSMED), a relacionada situao empregatcia do candidato (DEST) e a que se
relaciona ao local de residncia (RMETR), se folgarmos um pouco mais este nvel de
significncia (de 5% para 10%), mais duas variveis se mostram significativas, o estado
civil do candidato (SOLT) e a renda familiar do mesmo (RFMA). O coeficiente de
correlao entre a equao de seleo e a equao principal, mostrou-se significante e
apresenta uma correlao negativa entre estas (-0.174), sugerindo existncia de vis de
seleo amostral, cabe aqui uma ressalva, como o nvel de significncia est
visivelmente elevado, estamos em um limiar entre a existncia do vis e a no
ocorrncia do mesmo, se tomarmos o nvel de 5% certamente a existncia de vis
descartada.
O teste de Wald para rejeitar a significncia global dos coeficientes, para a
equao principal (Wald chi2(8) = 49,97), apresentou uma estatstica bastante alta,
levando assim a rejeio da hiptese nula, onde todos os coeficientes conjuntamente so
no representativos, portanto acredita-se que esta situao (no significncia global dos
coeficientes) no esteja ocorrendo. Por outro lado temos um ponto nada pacfico aqui, o
teste realizado para verificar se as duas equaes so no correlacionadas, (Teste da
razo de verossimilhana ao fim da tabela 2), apresenta um valor relativamente pequeno
da estatstica de teste Chi2(1) = 2.82 (leia-se Chi2 = 2 ), para um nvel de significncia
de 10% a hiptese nula quase no rejeitada (Prob > chi2 = 0.0929), o que j um nvel
de significncia considerado elevado, nos levando a duvidar da suspeita que recai sobre
23

a existncia do vis de seleo amostral. Antes de prosseguirmos com a discusso sobre


os efeitos encontrados apresentaremos mais duas estimativas, uma apreciando a
possibilidade da existncia de vis de seletividade, porm pela metodologia de 2
estgios e um probit onde no se considera a o vis.
Tabela 3: Resultados da Estimao por 2 estgios

Probit com seleo amostral 2 Estgios

N de Observaes

Log Verossimilhana = -496.21048

Pseudo R2

0.0710

Prob > chi2

LR chi2(9)

75.83

0.0000

= 46407

Equao Principal
Varivel

Coeficiente

Erro Padro

P > |Z|

ENSMED

-0.4405693

0.1086683

-4.05

0.000

ENSSUP

0.1023619

0.0935426

1.09

0.274

SOLT

-0.2553279

0.0967773

-2.64

0.003

RFMA

0.2621137

0.0892438

2.94

0.003

RPMB

-0.0138088

0.078696

-0.18

0.861

DEST

0.1521766

0. 083577

1.82

0.069

RMETR

0.2850672

0.0866989

3.29

0.001

IDADB

0.1502435

0.1009812

1.49

0.137

Constante

-3.012311

0.1187829

-25.36

0.000

RMI*

-0.0039395

0.0050175

-0.79

0.432

N de Observaes =

76011

Log Verossimilhana = -28147.663

Pseudo R2 =

0.2297

Prob > chi2 =

LR chi2(13) =

16790.46

0.0000

Equao de Seleo
ENSMED

0.3799397

0.0177886

21.36

0.000
24

ENSSUP

-0.1656499

0.0195873

-8.46

0.000

SOLT

0.1240214

0.0158344

7.83

0.000

RFMA

0.1221708

0.0144323

8.47

0.000

RPMB

0.4555022

0.0154502

29.48

0.000

RMETR

0.3020626

0.0123256

24.51

0.000

JCURT

-1.304543

0.0367443

-59.72

0.000

JMED

-1.781007

0.0327255

-54.42

0.000

JLONG

-1.304543

0.0337182

-38.69

0.000

SEXO

0.1995233

0.0143866

13.87

0.000

IDADB

0.3453483

0.0213075

16.21

0.000

BRANCA

-0.4424091

0.0837448

-5.28

0.000

NPIND

-7.7355529

0.0841583

-8.74

0.000

Constante

2.158794

0.0912957

23.65

0.000

Fonte: Elaborao Prpria


* RMI = Razo de Mills Invertida

Quando comparamos os resultados obtidos com a estimao por MV e a


estimao por 2 estgios (2S), a varivel referente a escolaridade de nvel mdio
(ENSMED) do candidato mostrou ter efeito negativo sobre a probabilidade de obter
sucesso no concurso e mostrou pequeno aumento (do modelo de MV para 2S, sempre
que fizermos comparaes, o faremos nesse sentido), passando de -0.473 para -0,44, a
que trata do estado civil (SOLT), tambm apresentou efeito negativo sobre as chances
que candidato tem de aprovao, porm diferente do que ocorreu com o ensino mdio
quando se muda o mtodo de estimao as chances do candidato diminuem (-0,209 para
-0,255), das variveis que dizem respeito a renda, aquela referente a renda familiar
mensal apresenta relativo crescimento quando o mudamos de MV para 2S (0,195 para
0,262)

25

No que tange a significncia dos resultados encontrados pela estimao por 2S


apresentam pequenas divergncias em relao aos encontrados por MV, por exemplo,
que no modelo que se leva em considerao a estimativa por MV rejeita-se a varivel
concernente ao estado civil do candidato (SOLT) ao nvel de significncia de 5%,
enquanto que no processo por 2S mesmo ao nvel de significncia de 1% ela se torna
significativa, acontece parecido para a renda familiar mensal do candidato (RFMA), no
modelo por MV demonstra-se no significativa para a aprovao no concurso, ao passo
que quando estamos trabalhando com o 2S esta se torna significativa ao nvel de 5%,
por outro lado aquela referente situao dos candidatos no mercado de trabalho
(DEST), ao nvel de 5%, rejeitada para a estimativa por MV, e no rejeitada para o
caso da estimativa por 2S. Tambm no se verificou, como mostra o teste da raiz de
verossimilhana, que o modelo globalmente significante (na equao principal temos
LR chi2(9) = 75.83 e equao de seleo LR chi2(13) = 16790.46). Entretanto o
coeficiente relacionado razo de Mills invertida, na estimativa por 2S, ou seja, o
coeficiente de correlao entre os componentes estocsticos da equao de seleo e da
equao principal, tal como na estimativa por MV, apresentou correlao negativa entre
as equaes, porm mostrou-se insignificante, mesmo ao nvel de 10%, refutando a
hiptese de ocorrncia de vis de seleo amostral.
Para comparao com um modelo em que no se acredita na ocorrncia do vis
de seleo amostral, lanaremos mo de um modelo probit simples, para tal, utilizamos
a base original do concurso realizado pelo BNB, ou seja, com todas as observaes.

Tabela 4: Resultados da Estimao do Probit (assumindo que no h vis)

Probit simples

N de Observaes = 232308

Log Verossimilhana = -4059.7054

Pseudo R2

0.0518

Prob > chi2

LR chi2(8)

443.60

0.0000

Equao Principal
Varivel

Coeficiente

Erro Padro

P > |Z|

ENSMED

-0.4324884

0.0355538

-12.16

0.000
26

ENSSUP

0.0976548

0.0344606

2.83

0.005

SOLT

-0.0025269

0.0361154

-0.07

0.944

RFMA

0.2108126

0.0338719

6.22

0.000

RPMB

-0.0648996

0.0276512

-2.35

0.019

DEST

0.1093347

0.0287675

3.80

0.000

RMETR

0.1789449

0.0284228

6.30

0.000

IDADB

0.1224489

0.0356619

3.43

0.001

Constante

-2.902276

0.042619

-68.10

0.000

Fonte: Elaborao Prpria

Utilizando o probit simples encontramos mais algumas diferenas em relao


aos modelos anteriores, com relao ao sentido do efeito das variveis sobre a chance de
sucesso no concurso, apenas a varivel condizente com a renda pessoal mensal
(RPMB), apresentou divergncias entre os trs modelos na estimao por MV tivemos
efeito negativo, na estimao por 2S apresentou efeito positivo e novamente no probit
simples voltou a apresentar efeito negativo, as demais mantiveram o mesmo sinal para o
coeficiente em todos os modelos, em contrapartida houve muita mudana no que diz
respeito significncia das variveis, por exemplo, a varivel relacionada educao
superior do candidato (ENSSUP), nos modelos com hiptese de seleo amostral (MV e
2S), no eram significativas mesmo ao nvel de 10%, contudo quando trabalhamos no
modelo simples (probit) esta significativa mesmo ao nvel de 1%.
Quanto a varivel condizente com o estado civil (SOLT), na estimao por MV
se mostra significativa ao nvel de 1%, na estimativa por 2S apenas aos 10% e no
modelo probit no significativo em nenhum nvel (10%, 5% ou 1%), quanto a renda
familiar do candidato (RFMA) nos modelos MV e probit mostra-se significante ao nvel
de 1%, ao passo que no modelo por 2S, s significante ao nvel de 10%, j a renda
pessoal mensal do candidato (RPMB) s no rejeitada no probit simples (5%), as
variveis relacionadas situao no mercado de trabalho (DEST) e local de residncia
(RMETR) e possuir apenas ensino mdio (ENSMED) so significativas em todos os
27

trs modelos sendo as ltimas duas em qualquer nvel de significncia e a primeira,


respectivamente, aos nveis 10 % no modelo por 2S, 5% no modelo por MV e 1% no
modelo probit simples.
A varivel relacionada idade baixa do candidato (IDADB), s mostrou-se
significante no probit simples (1%). Verificamos significncia global no probit simples,
utilizando o teste da razo de verossimilhana (LR chi2(8) = 443.60). Na tabela a seguir
apresentamos um quadro que sumariza os resultados encontrados pelos trs mtodos de
estimao. Deve-se ressaltar tambm que os valores calculados dos coeficientes no so
verdadeiramente os efeitos marginais que as variveis exercem sobre a probabilidade de
sucesso na varivel dependente, na verdade devido a natureza no-linear destes tipos de
modelos, tal interpretao induz ao erro, apesar destes coeficientes retratarem a direo
do efeito (o que se apresenta negativo, tem efeito negativo sobre a varivel dependente,
interpretao anloga no caso de sinais positivos), na realidade os efeitos marginais
variam conforme variar o vetor de variveis independentes pois o clculo deste efeito
dado pelo produto da densidade de probabilidade (normal para um probit) pelos
coeficientes estimados;
)

= Vetor de efeitos marginais

(17)

Facilmente se pode notar que os efeitos marginais mudam conforme se alteram


os valores das variveis independentes, contudo para contornar este problema,
utilizaremos os valores mdios (amostrais) dessas variveis de modo que trabalharemos
com a seguinte expresso
)

= Vetor de efeitos marginais mdios

(17)

Os efeitos marginais encontrados nos trs mtodos utilizados so apresentados


na tabela a seguir, mantivemos na tabela apenas as variveis que se mostraram
estatisticamente significantes.

28

6. Interpretao dos resultados


I)

Efeitos Marginais Mdios


a) Determinantes ligados educao

Encontramos nos trs mtodos abordados, que possuir apenas o ensino mdio
influencia negativamente as chances do candidato ser aprovado em um concurso
pblico observamos pequenas mudanas nos coeficientes encontrados para esta
varivel, contudo em ambos as verses em que considervamos a existncia de
seletividade na inscrio a influncia negativa fora maior, em todos os modelos
mostrou-se significante, tal resultado era esperado (conforme tabela 1), isto pode ser
visto como decorrente da baixa preparao que o sistema educacional brasileiro, em
nveis bsicos, proporciona aos seus alunos, pois para um concurso em que exigia-se
apenas o ensino mdio surpreendente que possu-lo, apenas, diminui a probabilidade
de aprovao no mesmo.
Em contraste possuir nvel superior completo ou ps-graduao, apresentou
efeito positivo, entretanto no se mostrou varivel significativa quando supomos
existncia de seletividade, antes de comentarmos esse ocorrido (no significncia
estatstica), examinemos as razes socioeconmicas que estariam por trs dos resultados
encontrados (coeficientes estimados), decerto, isto, reflete uma melhor preparao de
tais candidatos, visto que se ingressaram no ensino superior de se esperar que j
tenham certo ritmo e mtodo de estudo bem mais desenvolvido, porm tal efeito foi um
dos de menor magnitude, (vale lembrar que tais valores no so em si os efeitos
marginais que a varivel exerce sobre a aprovao, pois em se tratando de modelos nolineares, no representam o efeito marginal direto, porm expressam a direo do efeito)
o que pode indicar tambm que apesar de estarem no nvel superior, sua educao
efetiva no corresponde ao nvel em que se encontram, no se pode desprezar, contudo
que a concorrncia destes (de nvel superior) com aqueles (de nvel mdio) pode ter
dado certa contribuio ao efeito negativo sobre possuir apenas o ensino mdio.

29

b) Determinantes ligados renda

Tratando da renda dos candidatos encontramos que a renda familiar mensal alta
(acima de 10 salrios mnimos do ano de 2003) fator de grande influncia (positiva)
no sucesso para obteno de emprego pblico, fato j previsvel. de se esperar que os
de maior renda apresentem chance maior de aprovao, j que os mesmos podem
adquirir melhores formas de preparao, bem como materiais especializados, aulas
particulares e cursos preparatrios. Um indcio nefasto emerge, o da concentrao de
renda inter-geracional, pois aqueles candidatos oriundos de lares mais abastados
ingressam no servio pblico (que em relao ao setor privado, geralmente, apresenta
maiores rendimentos) com maior chance do que os que possuem origem mais modesta.
Isto pode ser visto pelo seu contraposto a renda pessoal mensal baixa (menos que 2
salrios mnimos do ano de 2003), em todas as estimativas o efeito visto fora negativo,
embora tenham sido rejeitadas (ao nvel de 10%), quando se sups seletividade, apesar
disto refora-se a tese do efeito concentrador que aqui atua, onde aqueles que auferem
menores rendimentos tem suas chances reduzidas de ingressarem no setor pblico,
perpetuando o ciclo nocivo da pobreza e da concentrao de renda. Para uma regio
como o nordeste brasileiro, que historicamente palco de extremos da desigualdade
social isso ainda mais preocupante, e em parte explica o tal processo histrico
concentrador, onde o filho de coronel estudava e tornava-se o doutorzinho, que em
quase sempre vinha ser um funcionrio da administrao pblica, adensando cada vez
mais essa espiral da desigualdade social.

30

Tabela 5: Resultados dos trs mtodos de estimao (2S, MV e probit simples)


Equao Principal 2S

Equao Principal MV

Equao Principal Probit

Varivel

Coeficiente

Erro Padro

P > |Z|

Coeficiente

Erro Padro

P > |Z|

Coeficiente

Erro Padro

P > |Z|

ENSMED

-0,4406

0,1087

0,000

-0,4733

0,1204

0,000

-0,4325

0,0356

0,00

ENSSUP

0,1024

0,0935

0,274

0,0928

0,1038

0,371

0,0977

0,0345

0,01

SOLT

-0,2553

0,0968

0,003

-0,2099

0,1084

0,053

-0,0025

0,0361

0,94

RFMA

0,2621

0,0892

0,003

0,1952

0,0998

0,051

0,2108

0,0339

0,00

RPMB

-0,0138

0,0787

0,861

0,0062

0,0862

0,942

-0,0649

0,0277

0,02

DEST

0,1522

0,0836

0,069

0,2003

0,0927

0,031

0,1093

0,0288

0,00

RMETR

0,2851

0,0867

0,001

0,2769

0,0948

0,004

0,1789

0,0284

0,00

IDADB

0,1502

0,1010

0,137

0,1801

0,1134

0,112

0,1224

0,0357

0,00

Constante

-3,012

0,1188

0,000

-3,008

0,1389

0,000

-2,902

0,0426

0,00

RMI*

-0,0039

0,0050

0,432

Fonte: Elaborao Prpria


* Razo de Mills invertida

31

Tabela 6: Efeitos Marginais Mdios (2S, MV e probit simples)


2S
Varivel

MV
Efeito Marginal

Varivel

Probit Simples

Efeito Marginal

Varivel

Efeito Marginal

ENSMED

-0,0024127

ENSMED

-0,0032389

ENSMED

-0,0034162

ENSSUP

ENSSUP

ENSSUP

0,0007714

SOLT

-0,0013982

SOLT

-0,001436

SOLT

RFMA

0,0014354

RFMA

0,.0013377

RFMA

0,0016652

RPMB

RPMB

RPMB

-0,0005126

DEST

0,0008334

DEST

0,0013717

DEST

0,0008636

RMETR

0,0015611

RMETR

0,0018976

RMETR

0,0014135

IDADB

IDADB

IDADB

0,0009672

Fonte: Elaborao Prpria

c) Determinantes ligados situao empregatcia


Observamos um efeito positivo sobre no estar no mercado de trabalho ou ser
estagirio, implicando que a disponibilidade de tempo que estes candidatos possuem
para se dedicarem a estudar para o concurso reflete em melhor desempenho, alm de
haver grande incentivo (sobretudo queles desempregados) em sair da situao em que
se encontram. Tambm h aqueles que optam por ficar sem emprego durante
determinado perodo que antecede o concurso para dedicao integral a sua jornada de
estudo, em muitos casos so candidatos que juntaram dinheiro durante certo perodo
para custearem sua preparao e suas despesas em suas demandas pelo servio pblico.

d) Determinantes ligados a faixa etria e a regio de moradia


Em todos os trs mtodos de estimao abordados nesse estudo, as estatsticas
encontradas para a regio de moradia (RMETR), mostraram-se significantes, j as
relacionadas faixa etria entre 18 e 22 anos (IDADB), no foram quando se supe
seletividade amostral (nvel de 10%), ambos apresentaram influncia positiva para o
sucesso no referido concurso. Os candidatos oriundos de regio metropolitana tm suas
32

chances aumentadas, possivelmente pela maior facilidade na aquisio de servios


educacionais do que aqueles provenientes de regies rurais, como escolas bem
estruturadas e professores capacitados, que em regies rurais costumam ser muito mais
escassas, sobretudo nas regies norte e nordeste do pas. No que tange a faixa etria, os
mais jovens tambm apresentam maiores chances, isto pode ser conseqncia de um
ritmo de estudo ainda bastante presente, j que no se encontram to distantes
(temporalmente) de sua vida escolar e de conhecimentos mais atualizados.
At o momento parece que se desprezou o fato de algumas variveis se
mostrarem significantes em certa modelagem, mas no ocorrer em outra, optou-se por
tratar deste assunto a parte, pois merece certa ateno, trataremos disso na seo
seguinte.

II)

Significncia e ocorrncia de vis de seleo amostral

Como mencionado anteriormente, percebe-se que algumas variveis se mostram


significantes e uma modelagem, mas no em outras caso da varivel relacionada a
possuir nvel superior (ENSSUP) que significante apenas no probit simples, caso da
varivel relacionada ao estado civil do candidato (SOLT), que contrariamente s no
tem significncia no probit simples, o mesmo ocorre com a varivel renda familiar
mensal alta (RPMA) e idade entre 18 e 22 anos (IDADB).
No que tange a ocorrncia de vis de seleo amostral, no h ponto pacfico,
pois na modelagem por dois estgios (2S), o coeficiente de correlao entre o
componente estocstico da equao principal e aquele da equao principal, no
estatisticamente significante, caracterizando a inexistncia de vis, por outro lado no
modelo estimado por mxima verossimilhana (MV) o coeficiente referido por muito
pouco tambm no se mostra insignificante, isso se considerarmos o nvel de
significncia de 10%, pois o p-valor da estatstica de teste foi 0,092 o que muito
prximo do ponto crtico de rejeio, ao nvel de 5% o vis j descartado. Certamente
o nvel de 10% para significncia uma margem bastante generosa, quase que um apelo
s foras etreas que governam a aleatoriedade das distribuies utilizadas para
realizao dos testes, comumente se utiliza a margem de 5% o que bastante razovel,
o que nos leva a rejeitar a hiptese de seletividade amostral.

33

Alm disso, temos bons motivos para acreditar que no ocorre o vis,
primeiramente ao contrastarmos os resultados dos modelos com e sem vis, variveis
que a priori acreditvamos importantes apresentam comportamentos estranhos, de se
esperar que candidatos cuja renda da famlia seja alta tenham suas chances aumentadas
em relao aos de famlia mais humilde, por motivos anteriormente expostos, contudo
quando se passeia em um mundo com o vis amostral, no faz a menor diferena ser
mais rico ou mais pobre, apesar de isso ser muito pouco provvel, caso anlogo de
possuir ensino superior completo, mais uma vez, nas modelagens em que se considera o
vis, tal varivel rejeitada, apesar de quando no consideramos a seleo amostral, o
efeito, apesar de positivo, bem pequeno, mas ainda assim melhora as chances do
candidato, se confrontarmos essa situao, com possuir ensino mdio apenas (onde o
efeito reduzido sobre a probabilidade de aprovao), vemos que faz bastante sentido
se imaginar que possuir o ensino superior um plus para a aprovao. Ainda mais, o
mesmo ocorre com o fato de possuir idade entre 18 e 22 anos, novamente s tem
significado quando rejeitamos a existncia de seletividade amostral, mas menos
provvel que um candidato que h muito tenha deixado sua vida escolar, e que
geralmente est empenhado em muito mais atividades do que aqueles mais jovens,
tenham disposio e tempo para uma preparao mais adequada, o que certamente no
exatamente um determinante rgido, porm uma dificuldade a ser levada em
considerao. Por fim temos o estado civil do candidato que, quando ocorre o vis
mostra-se vlido, apontando que os casados tm maiores chances de aprovao,
confrontando isto com o que aponta a varivel de idade, um contra-senso, pois
candidatos mais velhos tm suas chances reduzidas ao passo que aqueles mais velhos
geralmente so casados, e por isso tem suas chances aumentadas, este efeito um tanto
ambguo, aponta no suportar que estas duas no convivam pacificamente, e assim se v
nas trs modelagens, sempre que uma significativa a outra no , e h poucos motivos
para se imaginar que ser solteiro ou no tenha alguma influncia significativa.
Diante do exposto acreditamos que o mais correto desconsiderar qualquer
efeito proveniente de vis de seletividade amostral, bem com a sua prpria existncia,
na situao de demanda por empregos pblicos no Brasil. Os resultados encontrados no
modelo simples (sem vis de seleo) parecem bastante razoveis, condizem com o
esperado e so estatisticamente slidos.

34

7. Concluso
O foco deste estudo era levar a prova, se o fenmeno conhecido com vis de
seleo amostral afetava a deciso e, em ltima instncia, a aprovao em um concurso
para provimento de cargos pblicos. Atravs do uso de trs metodologias prximas,
duas em que se sups a ocorrncia e outra em que se fez o contrrio. Encontramos que
no h indcios fortes da ocorrncia do fenmeno.
Corrobora esta sentena o fato de variveis que em outros estudos sobre o
mesmo tema mostraram-se significativas, quando aplicamos a correo do vis j no
eram, contudo em tais estudos (que utilizaram inclusive uma das bases de dados aqui
utilizadas) os pesquisadores no levaram em conta o vis de seletividade, conjugando
isto com o resultado encontrado nos modelos estimados com correo para o vis, que
ao nvel de significncia de 5%, rejeita a hiptese de seleo amostral, viu-se que no
existe correlao entre o processo de inscrio e o processo de aprovao do concurso.
Portanto mais provvel que os resultados encontrados com a terceira
modelagem (probit simples sem vis de seleo), sejam os mais condizentes com a
natureza do problema, reforando estudos anteriores que mostram que a instituio do
concurso pblico no Brasil contribui nocivamente para a manuteno do perverso ciclo
da concentrao de renda, pois, muito pelo seu sistema educacional deficitrio, que
diploma alunos do ensino mdio, mas quando em um concurso que exige apenas esse
tipo de formao, possuir apenas o referido ensino mdio tem o maior impacto negativo
(magnitude) sobre as chances do candidato ser aprovado. Em contrapartida o candidato
com ensino superior, renda familiar alta, jovem e com tempo disponvel tem em muito a
as suas chances acrescidas, caracteristicamente a varivel relativa renda familiar
refora outro problema, o da pobreza intergeracional, ou seja, a riqueza alm de ser
concentrada, castra o desenvolvimento de geraes futuras, e um problema leva a outro,
pois aqueles com pouca formao e de famlias menos favorecidas, tem de ingressar
mais cedo no mercado de trabalho, reduzindo ainda mais suas possibilidades de tornarse empregado pblico ao passo que essa situao vai se perpetuando enquanto o
indivduo envelhece e cada vez mais se intensifica o abismo entre este ente e o emprego
pblico.
Podemos visualizar dois cenrios extremos baseados nas estimativas obtidas
com a modelagem que ignora o vis de seleo amostral. Imaginemos um indivduo que
35

apresenta todas as caractersticas que influenciam negativamente a aprovao no


certame, ou seja, que possui apenas ensino mdio, a famlia no de situao abastada,
sua renda pessoal baixa, trabalha, mora em localizao distante e no jovem, a
probabilidade de aprovao deste candidato figura entre menos do que 0,1%
(aproximadamente 0,033%) ao passo que o candidato em situao extremamente oposta,
ou seja, com educao superior completa, oriundo de famlia rica, com ganhos mensais
elevados, que no trabalha, morador de regio metropolitana e jovem, tem suas chances
aumentadas para 1,45%, o que pode parecer muito pouco, se visto em absoluto,
entretanto se tomarmos tais probabilidades e compar-las veremos que (atravs de uma
simples razo), o candidato que apresenta caractersticas favorveis tem 43,03 vezes
mais chances de ser aprovado do que aquele outro, o que os separa no nem um
abismo praticamente uma galxia.

36

8. Referncias

BORG, M.; STRANAHAN, H. (2002), Personality type and student performance in


upper-level economics courses: the importance of race and gender, Journal of
Economic Education pp. 314.
CASTELAR, I.; VELOSO, A.; FERREIRA, R.; SOARES, I. (2010), Uma Anlise dos
Determinantes de Desempenho em Concurso Pblico. Brazilian Journal of Applied
Economics, v. 14, n. 1, p. 81-98, jan-mar.

CHEVALIER, A.; LINDLEY, J.; Overeducation and the Skills of UK Graduates,


Centre for the Economics Education, London School of Economics, London. 2007

DUARTE, G.B., SILVEIRA, R.M., (2009), Avaliando o impacto do programa bolsa


famlia sobre a frequncia escolar: o caso da agricultura familiar no nordeste do Brasil,
in: ANPEC, ed., Anais do XIII Encontro Regional de Economia, Fortaleza. CE.

EMILIO, D. R., BELUZZO, W. , ALVES, D.C.(2004), Uma Anlise Economtrica dos


Determinantes do Acesso Universidade de So Paulo, Economia Aplicada 34(2), 275305.

GOLDBERGER, A.S. (1991), A course in econometrics, Harvard University Press,


Cambridge, Massachusetts.

GREENE, W. H. (2012), Econometric Analysis, Pearson, Saddle River, New Jersey

GUJARATI, D. N. (2000), Econometria Bsica. 3ed. So Paulo: MAKRON Books,


2000

HECKMAN, J. J.; (1979), Sample Selection Bias as Specification Error.


Econometrica, v. 47, n. 1

MATOS, V.D.; FREITAS, S.H.A.(2005), Uma Estimativa Dos Fatores


Condicionantes Do Nvel Tecnolgico Dos Apicultores De Limoeiro Do Norte: Uma
Aplicao Do Modelo Probit In: CONGRESSO DA SOCIEDADE BRASILEIRA DE
ECONOMIA, ADMINISTRAO E SOCIOLOGIA RURAL, XLIII, Ribeiro Preto.
So Paulo
37

MANSKI, C. F.; WISE, D. A.;(1983). College Choice in America. Cambridge, Mass:


Harvard University Press

OLIVEIRA, M. de M. (2004), Modelos de Regresso com Varivel Dependente


Truncada ou Censurada, Excertos de notas Pessoais.

MARE, R. D.; WINSHIP, C.;(1984) The Paradox of Lessening Racial Inequality and
Joblessness Among Black Youth: Enrollment, Enlistment, and Employment, 19641981, American Sociological Review, v. 49, pp.39-55

MENDONA, T. G. de; LIMA, J. R.; LRIO V. S.; Determinantes da Insero de


Mulheres Jovens no Mercado de Trabalho Nordestino, Universidade Federal de
Viosa. Disponvel em < http://www.sober.org.br/palestra/13/656.pdf> Acesso em: 05
mar 2012
PARK, K.H.; KERR, P.M. (1990), Determinants of Academic Performance: A
Multinomial Logit Approach The Journal for Economic Education, v. 21, n. 2
VELLA, F.(1996), Estimating Models with Sample Selection Bias: A Survey. The
Journal of Human Resources, v. 33 n. 1

PARK, KANG H.; KERR, PETER M.;(1990) Determinants of Academic Performance:


A Multinomial Logit Approach. Journal of Economic Education, v.21 n. 2 pp.101111

RAMOS, A. C. P.; Influncia dos Fatores Socioeconmicos no Desempenho dos


Candidatos de um Concurso Pblico: Uma Anlise Utilizando Modelos de Escolha
Ordenada, 2007. 115fls. Dissertao (Mestrado em Economia) CAEN, Universidade
Federal do Cear, Fortaleza 2007

WINSHIP, C.; MARE, R. D.;(1992) Models for Sample Selection Bias. Annual
Review of Sociology, v. 18, pp.327-350

WOOLDRIDGE, J.M. (2006), Introduo Econometria: Uma Abordagem


Moderna. So Paulo: Thomson Learning LTDA,

38

YANG, C.; RAEHSLER, R.D. (2005), An Economic Analysis On Intermediate


Microeconomics: An Ordered Probit Model. JOURNAL FOR ECONOMIC
EDUCATORS, v. 5, n. 3

39

Das könnte Ihnen auch gefallen