Sie sind auf Seite 1von 15

PROBABILIDAD DE OBTENCIN DE EMPLEO PAS BOLIVIA

1 INTRODUCCIN:
El fin de este trabajo es presentar la cuanta de los determinantes en la
variable empleo, cunto es el impacto que tienen las variables aos de
educacin y edad sobre el empleo.
-

Sera importante la edad para obtener empleo?


Los aos de educacin determinaran la obtencin de empleo?
La variable empleo estar determinada por la edad y aos de
educacin?

La hiptesis bsica para este anlisis es que ambas variables aos de


educacin y edad son altamente determinantes a la hora de obtener empleo.

1.1 Anlisis de los datos


Para dicho anlisis se tom como base de datos la encuesta de hogares 2014,
previa transformacin de la variable educacin y empleo.
Previo a cualquier codificacin se seleccion solo los casos donde el informante
es mayor a 10 aos por la ley boliviana que menciona la edad legal para
trabajar.
La variable educacin al estar codificada en nivel o ciclo y curso o grado, se
tuvo que codificar para obtener la totalidad de aos de estudio, sin diferenciar
entre nivel, ciclos o grados.
Nivel
ciclo
21
22
23

Curso
4
3
4

Cuadro 1.
Max
curso
5
3
4

Aos
educacin
4
8
12

de

Como se observa en el cuadro 1. Para la transformacin solo se recodifico la


variable con un aumento del mximo de aos en el curso para el siguiente
nivel o ciclo. Es decir si el nivel que se quiere encontrar es 22 y se tiene como
dato 3, solo se debe sumar el mximo de aos curso al curso del nivel 22, que
sera 5.
Nivel
ciclo
22

o Curso

Operaci
n
3+5=8
(Max.
Cursos en
nivel 21)

Aos
educacin

de

La mencionada transformacin se realiz a todos los niveles o ciclos en la


variable educacin.
La variable empleo al estar codificada en:

TRABAJ
A
SI
NO

VALOR
1
2

Nuevo
valor
1
0

La codificacin de esta variable no presento mayor problema.

2 OBJETIVOS
El objetivo del siguiente trabajo es ver la relevancia e impacto que pueda tener
el incremento en alguna de las variables independientes, como ser educacin y
edad para con variable empleo, responder a las preguntas planteadas todo lo
mencionada a travs de los siguientes mtodos:
-

MLP (Modelo lineal de probabilidad)


Modelo Probit
Modelo logit

3 MARCO TERICO
Empleo.- Es la situacin laboral en la que se encontraba la persona una
semana antes de la encuesta, divida en si trabaja o no.
Aos de educacin.- Son los aos que la persona se tom en concluir
los estudios hasta el momento de la entrevista, los aos de educacin
que fueron tomados en cuenta son desde el primer curso escolar
(Obviando knder y pre knder) hasta el ltimo grado o curso mayor
conocido, doctorado.
La relacin que se espera de esta variable para con la dependiente
(empleo) es directa con signo positivo, ya que se tiene la premisa que a
mayor educacin mayor ser la probabilidad de obtener empleo.
Edad.- Es la edad de la personas, cumplida hasta el momento de la
encuesta, no se tomaron en cuenta menores de 10 aos, por lo
mencionado en la introduccin.
La relacin esperada de esta variable con la dependiente (edad) es
inversa, ya que a mayor edad, es menor la probabilidad de obtener
empleo.

EM = 0 + 1 E + 2 AE + i
T: Variable empleo medido (0 = No trabaja; 1 = Si trabaja)
E: Edad o Aos cumplidos de la persona, unidad de medida, aos.

AE: Aos de educacin, tomando en cuenta escolar hasta posgrado, unidad de


medida, aos.

4 Estimacin del modelo


4.1. Modelo lineal de probabilidad MLP.
T = 0 + 1 A E + 2 E + i
T =0 . 416324+ 0.008412AE+ 0.004055E Sig.

0.00
R-squared

0.00

0.00
= 0.031

El principal problema que tiene este modelo es que existen valores


estimados que se encuentran fuera de la teora elemental de
probabilidades, como se observa en el grafico 1. (Ver anexo 1) que
existen algunos valores estimados para la variable T que pasan de 1,
aun sabiendo esta limitante se puede observar algunas caractersticas
importantes en el modelo.
Ambas variables dependientes son altamente significativas con un 0.00
de significancia estadstica, lamentablemente los signos esperados y las
relaciones solo se cumple para la variable Aos de escolaridad (AE),
mientras que la relacin negativa esperada para con la variable edad (E)
no se dio.
0=0.416324=42

; Independientemente de los aos de educacin y la

edad que tenga una persona, la probabilidad de obtener empleo es de


un 42%.
1=0.008412=0.4 ; manteniendo las dems variables constantes y ante
un incremento de 1 ao en los aos de educacin, la probabilidad de
obtener empleo incrementa en 0.4%.
2=0.008412=0.8 ; manteniendo las dems variables constantes y ante
un incremento de 1 ao en la edad, la probabilidad de obtener empleo
incrementa en 0.8%.
El R-squared no es de gran relevancia para el modelo, porque
bsicamente se aplica cuando la variable dependiente es cuantitativa,
pero llegara a ser un pseudo R-squared lo cual nos indica que la variable
trabajo esta explicada en un 3% por las variables aos de educacin y
edad.

4.2. Modelo Logit


T = 0 + 1 AE + 2 E + i
T =0. 414350+0. 038409AE+0.0 18228E Sig.

0.00

0.00
0.00
Mc Fadden R-squared = 0.024
Donde:
Pi =

ez
z
1+ e El modelo ser el siguiente:

L=ln

Pi
=z=0. 414350+ 0.038409AE+ 0.018228E
1Pi

( )

Interceptaciones:
Al igual que en el modelo lineal de probabildiad MLP, Nos indica que
todas las variables independientes son significativas.
0= Si no se tienen aos de educacin y la edad es cero, la
probabilidad de obtener empleo es negativa, al no existir probabilidades
negativas se concluye que es cero, imposible conseguir trabajo sin esas
variables.
1=

Manteniendo las dems variables constantes y ante un

incremento en los aos de educacin, la probabilidad de obtener empleo


incrementa.
2=

Manteniendo las dems variables constantes y ante un

incremento en la edad, la probabilidad de obtener empleo incrementa.


Para poder interpretar los coeficientes haremos uso de un ejemplo:
Cunto es la probabilidad de obtener empleo para un egresado de
universidad que tenga 30 aos?
Los aos de escolaridad en total daran 17, 12 de escolaridad y 5 de pre
grado.
Z = -0,41435 + 0,038409 * 17 + 0,018228 * 30 = 0.785

e 0.785
Pi =
1+ e 0.785
Concluimos que la probabilidad de obtener empleo al salir de la
universidad y teniendo 30 aos es de 79%.
El Mc fadden R-squared nos indica que el comportamiento o variaciones
que tiene la variable dependientes Trabajo (T) es explicada en apenas un
2.4% por las variables Aos de educacin (AE) y Edad (E).
Pero para ver la bondad del modelo podemos usar el cuadro 2.2. (Ver
anexo 2).
Segn ese cuadro podemos concluir que los ceros (No trabaja) o fracaso,
fue capturado en un 18.18 % mientras que los 1 (Trabaja) o xito, fue
capturado en un 97.83 %, pero el modelo en si tiene una probabilidad
de acertar o captar la respuesta correcta de un 69.09 % y de fracasar en
la captura, deja escapar o no acierta en un 30.91 %, es decir la variable
trabajo puede estar explicada por otras variables en un 30.91%.
O en resumidas cuentas decimos que de todas las predicciones el
69.09% son correctas.

4.3. Modelo PROBIT

la probabilidad de obtener empleo incrmenta en 0.8 %la edad variable E

ANEXOS.
1. MLP.
Cuadro 1. Salida de resultados - MLP
Dependent Variable: T
Method: Least Squares
Date: 02/24/16 Time: 08:15
Sample: 1 23979
Included observations: 23979
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
AE
E

0.416324
0.008412
0.004055

0.008615
0.000463
0.000173

48.32411
18.15872
23.47699

0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.031130
0.031049
0.472745
5358.336
-16058.16
385.1786
0.000000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

Grafico 1.
TF
1.2
1.0

0.8
0.6
0.4
0.2

0.0
5000

10000

15000

20000

0.639143
0.480259
1.339602
1.340614
1.339930
1.904165

2. LOGIT
3. Cuadro 2.1. Salida de resultados - LOGIT
4.
7.
8.
11.
14.
17.
19.

Dependent Variable: T
5.
Method: ML - Binary Logit (Quadratic hill climbing)
Date: 02/24/16 Time: 08:16
9.
Sample: 1 23979
12.
Included observations: 23979
15.
Convergence achieved after 4 iterations
Covariance matrix computed using second derivatives
20.
21.
22.
23.
25.
26.31.
27.
28.
33.
Coe
32.
zfficie
Std.
Statis
30. Variable
nt
Error
tic
35.
36.
37.
38.
40.
41.46.
42.
43.
48.
0.41
47.
435
0.038
10.76
45. C
0
480
786
51.
0.03
52.
53.
840
0.002
17.76
50. AE
9
162
424
56.
0.01
57.
58.
822
0.000
22.93
55. E
8
795
304
60.
61.
62.
63.
65.
66.
67.
68.

70. McFadden Rsquared

71.
0.02
435
0

72.
Mean
dependent var

74. S.D. dependent


var

75.
0.48
025
9

76.
S.E. of
regression

78. Akaike info


criterion

79.
1.27
622
4

80.
Sum
squared resid

82. Schwarz
criterion

83.
1.27
723
6

84.
Log
likelihood

86. Hannan-Quinn
criter.

87.
1.27
655
2

88.

90. Restr. deviance


94. LR statistic

91.
313
60.2
1
95.
763.
626

Deviance

92.
Restr. log
likelihood
96.
Avg. log
likelihood

6.
10.
13.
16.
18.
24.
29.34.
Pr
ob.
39.
44.
49.
0.0
00
0
54.
0.0
00
0
59.
0.0
00
0
64.
69.73.
0.6
39
14
3
77.
0.4
71
10
5
81.
53
21.
22
5
85.
15
29
8.2
9
89.
30
59
6.5
9
93.
15
68
0.1
1
97.
0.6

98. Prob(LR
statistic)
103.
108.

113. Obs with Dep=0


117. Obs with Dep=1
122.
127.

2
99.
0.00
000
0
104.
109.
114.
865
3
118.
153
26
123.
128.

37
98
7
100.
105.
110.

115.
119.
124.
129.

101.
106.
111.

Total obs
120.
125.
130.

132.
Cuadro 2.2. Prediccin Logit

102.
107.
112.
116.
23
97
9
121.
126.
131.

133.
134.Expectation-Prediction Evaluation for Binary Specification
135.Equation: UNTITLED
136.
137.
138.
140.Date: 02/24/16 Time: 08:32
141.
142.
144.Success cutoff: C = 0.5
145.
146.
148.
149.
150.
151.
152.
153.
155.
156.
157.
158.
159.
160.
163.
Estimated
164.
Constant
162.
Equation
Probability
166.
167.
169.
170.
D
D
D
D
e
e
168.
e
e
p
p
T
p
p
=
=
ot
=
=
165.
0
1
al
0
1
172.
173.
174.
175.
176.
177.
179.
180.187. 181.
182.189. 183.
184.
1
188.
1
186.P(Dep
5
3
9
=1)<=
7
3
0
190.
191.
C
3
3
6
0
0
195.
196.
198.
194.
1
2
197.
1
7
4
2
8
5
0
9
0
6
3
193.P(Dep
8
9
7
5
2
=1)>C
0
3
3
3
6
202.
203.
205.
201.
1
2
204.
1
8
5
3
8
5
6
3
9
6
3
5
2
7
5
2
200.Total
3
6
9
3
6
209.
210.
212.
208.
1
1
1
1
4
6
5
5
9
5
3
207.Correc
7
9
6
211.
2
t
3
3
6
0
6
219.
215.
216.
217.
1
1
9
6
218.
0
214.%
8.
7.
9.
0.
0.
Correc
1
8
0
0
0
t
8
3
9
0
0
221.%
222.
223.
224.
225.
226.
Incorre
8
2.
3
1
0.

139.
143.
147.
154.
161.

171.
T
ot
al
178.
185.

192.
0
199.
2
3
9
7
9
206.
2
3
9
7
9
213.
1
5
3
2
6
220.
6
3.
9
1
227.
3

ct
228.
235.

1.
8
2
229.
236.

1
7
230.
237.

242.

0.
9
1
231.
238.

0
0.
0
0
232.
239.

0
0
233.
240.

6.
0
9
234.
241.

243.

3. PROBIT
244. Cuadro 3.1. Salida de resultados PROBIT
245.Dependent Variable: T
246.
248.Method: ML - Binary Probit (Quadratic hill climbing)
249.Date: 02/24/16 Time: 08:26
250.
252.Sample: 1 23979
253.
255.Included observations: 23979
256.
258.Convergence achieved after 3 iterations
260.Covariance matrix computed using second derivatives
261.
262.
263.
264.
266.
267.
268.
269.
272.
274.
Coe
273.
zfficie
Std.
Statis
271.Variable
nt
Error
tic
276.
277.
278.
279.
281.
282.
283.
284.
287.
289.
0.22
288.
150
0.023
9.562
286.C
5
164
542
292.
0.02
293.
294.
307
0.001
17.80
291.AE
3
296
349
297.
0.01
298.
299.
041
0.000
22.53
296.E
5
462
643
301.
302.
303.
304.
306.
307.
308.
309.

311. McFadden Rsquared

312.
0.02
325
1

313.
Mean
dependent var

315.S.D. dependent
var

316.
0.48
025
9

317.
S.E. of
regression

319.Akaike info
criterion

320.
1.27
766
1

321.
Sum
squared resid

323.Schwarz
criterion

324.
1.27
867
3

325.
Log
likelihood

327.Hannan-Quinn
criter.

328.
1.27
799
0

329.

332.
313
60.2
1
336.
729.

333.
Restr. log
likelihood
337.
Avg. log
likelihood

331.Restr. deviance
335.LR statistic

Deviance

247.
251.
254.
257.
259.
265.
270.
275.
Pr
ob.
280.
285.
290.
0.0
00
0
295.
0.0
00
0
300.
0.0
00
0
305.
310.
314.
0.6
39
14
3
318.
0.4
71
60
1
322.
53
32.
44
2
326.
15
31
5.5
2
330.
30
63
1.0
4
334.
15
68
0.1
1
338.
-

339.Prob(LR
statistic)
344.
349.

354.Obs with Dep=0

373.

358.Obs with Dep=1


363.
368.

167
4
340.
0.00
000
0
345.
350.
355.
865
3
359.
153
26
364.
369.

0.6
38
70
6
341.
346.
351.

356.
360.
365.
370.

342.
347.
352.

Total obs
361.
366.
371.

343.
348.
353.
357.
23
97
9
362.
367.
372.

Cuadro 3.2
374.Expectation-Prediction Evaluation for Binary Specification
375.Equation: UNTITLED
376.
377.
378.
380.Date: 02/24/16 Time: 09:48
381.
382.
384.Success cutoff: C = 0.5
385.
386.
388.
389.
390.
391.
392.
393.
395.
396.
397.
398.
399.
400.
403.
Estimated
404.
Constant
402.
Equation
Probability
406.
407.
409.
410.
D
D
D
D
e
e
408.
e
e
p
p
T
p
p
=
=
ot
=
=
405.
0
1
al
0
1
412.
413.
414.
415.
416.
417.
419.
420.427. 421.
422.429. 423.
424.
1
428.
1
426.P(Dep
0
1
2
=1)<=
7
9
6
430.
431.
C
1
8
9
0
0
435.
436.
438.
434.
1
2
437.
1
7
5
2
8
5
5
1
7
6
3
433.P(Dep
8
2
1
5
2
=1)>C
2
8
0
3
6
442.
443.
445.
441.
1
2
444.
1
8
5
3
8
5
6
3
9
6
3
5
2
7
5
2
440.Total
3
6
9
3
6
449.
450.
452.
448.
1
1
1
1
5
6
5
0
1
1
3
447.Correc
7
2
9
451.
2
t
1
8
9
0
6
459.
455.
456.
457.
1
1
9
6
458.
0
454.%
2.
8.
7.
0.
0.
Correc
3
7
5
0
0
t
8
1
5
0
0
461.%
462.
463.
464.
465.
466.

379.
383.
387.
394.
401.

411.
T
ot
al
418.
425.

432.
0
439.
2
3
9
7
9
446.
2
3
9
7
9
453.
1
5
3
2
6
460.
6
3.
9
1
467.

Incorre
ct

489.

468.
475.
482.

8
7.
6
2
469.
476.
483.

1.
2
9
470.
477.
484.

3
2.
4
5
471.
478.
485.

1
0
0.
0
0
472.
479.
486.

0.
0
0
473.
480.
487.

3
6.
0
9
474.
481.
488.

Das könnte Ihnen auch gefallen