Sie sind auf Seite 1von 52

Una estrategia de arbitraje estadstico.

Tesis

Premio Nacional BMV

Presenta:
El Quant
Mexico D.F. 2012.

ndice
1. Introduccin.. 4
2. El modelo 6
6
2.1. Introduccin al modelo.
2.2. Un anlisis cuantitativo de los factores de riesgo y neutralidad al mercado 7
2.3. Un poco de teora de componentes principales.. 9
2.4. Uso de componentes principales como factores de riesgo. 10
12
2.5. Introduccin a la teora del clculo estocstico.
15
2.6. El modelo para el residual.
3. La estrategia. 18
18
3.1. Reversin a la media pura.
3.2. Reversin a la media con la desviacin

19
.

4. Los parmetros. .. 20
5. El portafolio. . 23
6. Los datos. . 25
26
6.1. Un anlisis exploratorio a los datos.
30
6.2. El primer eigenportafolio.
7. Los resultados 31
7.1. Sin considerar la desviacin

31
.

7.2. Considerando la desviacin

34
.

37
7.3. Los parmetros en el tiempo.
39
8. Algunos comentarios sobre la implementacin.
9. Conclusiones. .. 40
10. Los algoritmos. 41
10.1 Los principales. 41
10.2 Los auxiliares. . 47
Referencias. 53

1 Introduccin.
La finalidad del arbitraje es aprovechar errores de los mercados para generar ganancias. En el
arbitraje puro no existe riesgo. Un ejemplo tpico es si existieran dos bancos donde la tasa de
inters de prstamo de uno sea menor a la tasa de inters de rendimientos que da el otro.
Como uno podra aprovechar esto es pidiendo un prstamo en el primer banco y depositndolo
en el otro. Al final del periodo paga el prstamo y an tendr un excedente de dinero generado
por los intereses del otro banco. Es obvio que en la realidad este tipo de casos no suceden.
El arbitraje estadstico ocurre cuando se pretende aprovechar lo que se creen errores de
valuacin en los mercados y se espera que se generen ganancias. Es claro que en el arbitraje
estadstico existe el riesgo ya que est basado en especulaciones. En este trabajo se explorar
una estrategia de arbitraje estadstico desarrollada por Avellaneda, M. y Lee, J-H. (2010), se
simular su desempeo en el mercado de capitales de Mxico y se analizarn los resultados.
La aportacin de este tipo de estrategias a los mercados es que por su naturaleza agilizan la
correcta valuacin de las acciones, ya que aprovechan los errores de valuacin, e incentivan a
que el mercado sea ms completo (ms acciones y ms instrumentos) y ms lquido.
Este trabajo est estructurado de la siguiente forma. Consta de 10 captulos:

El primer captulo es esta introduccin.

En el segundo captulo se desarrolla el modelo que se usar para modelar los


mercados. Primeramente se muestra el modelo en el cual una accin es explicada por
factores de riesgo. Luego se da una propiedad de independencia con el mercado de los
factores de riesgo. En la tercera parte se introduce teora de componentes principales
ya que stas se usarn como factores de riesgo. En la cuarta parte se explica cmo se
usan las componentes principales como factores de riesgo. En la quinta parte se
muestra un resultado de clculo estocstico que se usar en del desarrollo del modelo
del residual en la sexta parte.

En el tercer captulo se explica cmo se aplicar la estrategia basada en este modelo.


Consta de dos partes, uno en el que considera una componente idiosincrtica de cada
3

accin y otro en el que no.

El cuarto captulo explica cmo se estiman los parmetros necesarios para aplicar el
modelo.

El quinto captulo explica como se manejar el portafolio de inversin en el que se usa


esta estrategia de arbitraje estadstico.

En el sexto captulo se muestran los datos que se usarn para experimentar la


estrategia y tambin se incluyen un anlisis exploratorio de los datos y un anlisis al
primer eigenportafolio.

El sptimo captulo se muestran los resultados de aplicar la estrategia. Consta de dos


partes, los resultados cuando se considera la componente idiosincrtica de las acciones
y los resultados cuando no se considera.

En el octavo captulo se dan algunas observaciones de la implementacin real de este


portafolio de inversin.

El noveno captulo incluye las conclusiones.

En el dcimo captulo se muestran los algoritmos que se usaron para simular la


estrategia con los datos.

En este trabajo se renen conocimientos de programacin, economa, estadstica y


matemticas para crear una estrategia de inversin en la BMV que d rendimientos atractivos y
bajo riesgo. Los conceptos que se usan de estadstica y matemticas

no son de fcil

comprensin y se requiere conocimientos avanzados en ambas reas. Por este punto este tipo
de estrategias no estn muy exploradas en Mxico ya que el capital humano que se requiere es
muy especializado. Como las estrategias de arbitraje estadstico agilizan la correcta valuacin
de los instrumentos financieros es importante fomentar su uso en Mxico.

2 El modelo.
2.1 Introduccin al modelo.
Pairs trading se considera el predecesor de las estrategias de arbitraje estadstico. La idea
bsica es que si

son los precios de dos acciones de emisoras pertenecientes a la misma

industria, o que tienen caractersticas similares (un buen ejemplo seran acciones de la misma
empresa que emiten en diferentes pases), uno espera que los rendimientos de las dos
acciones se comporten de manera similar. Esta situacin se podra modelar a partir de la
siguiente ecuacin que relaciona los precios a los tiempos

ln

= (

)+

ln

, ,

(1)

o en su forma diferencial respecto a t

=
donde

(2)

es un proceso de reversin a la media al que se le llamar el residual. En muchos

casos de inters

es muy pequeo comparado con los cambios en el residual

por lo que

puede ser ignorado. Esto significa que un portafolio corto-largo sobre estas acciones tender a
un equilibrio estadstico. La estrategia que se sigue de esta ecuacin es ir un peso largo en la
accin

pesos corto en la accin

accin

pesos largo en la accin

si
si

es negativo, y viceversa, ir un peso corto en la


es positivo.

Existe la posibilidad que se espere que una accin d mejores rendimientos que la otra durante
un periodo de tiempo largo. En esta estrategia no se considerarn esos escenarios.
Pairs trading generalizado es analizar las acciones por grupos en vez de por parejas. La idea
es esperar que una accin se comportar de manera similar a un grupo de acciones con

caractersticas similares.
La estrategia consistir en un portafolio corto-largo en acciones dependiendo del tamao y el
signo del residual respecto a las acciones que la estn explicando. Es decir, si para una accin
con comportamiento similar a un grupo de acciones

, ocurre que el residual es positivo

entonces se tiene que ir corto, e irse largo en caso que el residual sea negativo.
Por lo tanto, el anlisis de residuales ser de gran importancia en la estrategia. Las seales de
entrada y salida de posiciones de las acciones sern dadas por los residuales del valor de
equilibrio de la accin dado por el grupo de acciones que la explican. La descomposicin de la
accin se ve de la siguiente forma:

()

(3)

=1

donde los trminos

( )

,= 1

representan factores de riesgo asociados con el mercado en

consideracin. La pregunta que surge de esta ecuacin es la siguiente: Qu constituye un


buen conjunto de factores de riesgo? En esta tesis se explora el uso de componentes
principales para construir el conjunto de factores de riesgo.
En la siguiente seccin se presenta una definicin de portafolio neutral al mercado

2.2 Un anlisis cuantitativo de los factores de riesgo y neutralidad al


mercado.
Sean {

los rendimientos de las acciones en periodos de un da (de cierre a cierre). Sea

el rendimiento de un portafolio de mercado (por ejemplo el IPC). Entonces para cada accin se
puede escribir:

(4)

Esta ecuacin define un modelo de regresin lineal simple sobre los rendimientos de la accin
que contiene un componente sin correlacin con el mercado llamado

al que le designamos

como rendimiento idiosincrtico. De la misma forma podemos considerar una generalizacin de


este modelo usando varios factores de riesgo ( ), resultando el modelo de regresin lineal
mltiple definido por la siguiente ecuacin:

(5)

Un portafolio se dice ser neutral al mercado si la cantidad de pesos {

que se invierten en

cada accin cumplen la siguiente propiedad:

= 0 = 1,2, ,

(6)

.
Los coeficientes

corresponden a las betas de los portafolios, o a las proyecciones de los

rendimientos de los portafolios en los diferentes factores. De estas dos ltimas ecuaciones se
sigue lo siguiente:

+
=1

(7)

=1

Por lo tanto un portafolio neutral al mercado slo es afectado por los rendimientos
idiosincrticos.

2.3 Un poco de teora de componentes principales.


Como se usarn componentes principales como factores de riesgo, en este captulo se explica
un poco de teora de componentes principales.
Sea

la matriz de datos centrados con n variables se desea encontrar un conjunto ms

pequeo de vectores ortogonales {

que resuma en mayor porcentaje los datos

(es decir, explique la mayor varianza posible en los datos). Es decir, para el primer vector se
quiere que:

max

(8)

y
= max

Ya teniendo
matriz

] .

(9)

, para encontrar los siguientes vectores se extrae la varianza explicada de la

, en general para encontrar el vector k-simo se extraen los k-1 vectores anteriores

definiendo

(10)

Entonces para encontrar el vector

max

(11)

y
= max

(12)
8

Si se desea explicar un porcentaje de varianza fijo p entonces se busca un conjunto {


que

pero

tal

< .

2.4 Uso de componentes principales como factores de riesgo.


Para obtener las componentes principales como factores de riesgo inicialmente se usa la matriz
de precios diarios S de las N acciones a lo largo de M das. Por simplicidad del modelo se
ignorar la existencia de ciclos, es decir, se ignora la posibilidad de un comportamiento
intrnseco distinto de una temporada del ao (como podra ser Diciembre) al resto del ao. Se
obtiene la matriz de rendimientos de la siguiente forma:

donde

es el precio de la accin

(13)

al tiempo

es el rendimiento de la accin

al

tiempo . Como hay acciones ms voltiles que otras se estandariza la matriz de rendimientos.

(14)

donde

(15)

y
=

1

1

(16)

Entonces los elementos de la matriz de correlacin se definen como

donde

1

1

(17)

estn en la posicin( , ) de la matriz.

Se hace el anlisis de componentes principales sobre la matriz de correlacin y ordenamos los


eigenvectores por el orden de sus eigenvalores de manera decreciente:

0 ,

(18)

y denotamos sus correspondientes eigenvectores por

( )

( )

( )

,,

( )

= 1, , .

(19)

La cantidad de varianza explicada por cada eigenvalor ir decreciendo, por lo que slo hay
inters en considerar los eigenvalores que sean significativos. Interesa usar los primeros m
eigenvalores (con sus respectivos eigenvectores) hasta el punto que el resto se puedan
considerar como solamente ruido. Se pueden hacer dos enfoques en este tema, usar un
nmero fijo de eigenvalores, o, usar la cantidad necesaria de eigenvalores para explicar al
menos un porcentaje fijo de varianza.
Sean

, ,

<

los eigenvalores significativos en el sentido previamente explicado.

A cada uno de estos eigenvalores le corresponde un eigenportafolio en el cual la cantidad de


pesos invertida en cada accin se le asigna de la siguiente manera:

( )
( )

= 1, , ,

(20)

por lo que los rendimientos de los eigenportafolios se obtienen como:

( )
,

= 1, ,

(21)

10

Es fcil ver que los eigenportafolios no estn correlacionados entre s, ya que los
eigenvectores, resultantes del anlisis de componentes principales, son ortogonales.
El primer eigenvector est asociado al portafolio del mercado (IPC) en el sentido que los
coeficientes

( )

= 1, ,

conservan el mismo signo que los rendimientos promedio del IPC

en el periodo y, a largo plazo, son positivos. Como la cantidad de pesos invertida en cada
accin es de

( )

( )

se observa que es inversamente proporcional a la volatilidad de las

acciones. Esto implica que empresas ms grandes tienen mayor peso ya que por lo general las
grandes empresas tienen menor volatilidad en sus acciones. Por lo tanto, este primer
eigenportafolio se comporta similar a un portafolio de mercado (IPC).

2.5 Introduccin a la teora de clculo estocstico.


En esta seccin se resume el captulo 3.2 de Financial Calculus. An introduction to Derivative
Pricing con el fin de mostrar un resultado que ser de ulitidad para la seccin siguiente.

=(

Un proceso

| 0) es un movimiento Browniano si y slo si:

es continuo y

= 0.

~ (0, ).
El incremento

~ (0, ) y si [ , ] [ , ] = entonces

son variables aleatorias independientes.

Un proceso de difusin que es de inters en esta tesis es un proceso

= ( | 0) tal que

puede ser escrito de la siguiente forma:

(22)

11

donde

son funciones continuas tales que

+ | |)

< .

(23)

La forma diferencial de este proceso de difusin es

Si se deseara evaluar la integral (

(24)

) no es suficiente la integral de Riemman-Stieltjes ya

que si se asume que

) = 2

Ahora la pregunta es cmo integrar

= 2

. Considerando la particin

(25)

para alguna

n entonces podramos aproximar la integral por la siguiente suma:

( + 1)

(26)

Ntese que las diferencias dentro del parntesis son incrementos de un movimiento Browniano,
que por definicin tienen media 0 y tambin se sabe que hay independencia en los incrementos
con el valor en ese punto. Esto implica que todo el trmino dentro de la sumatoria es de media
0. Aqu hay una contradiccin ya que se sabe que la media de

es

porque esa es la

varianza del movimiento Browniano. Por lo tanto,

12

) 2

(27)

Es claro ahora que para evaluar la integral (

) se deben usar otros medios. Ahora se

intenta aproximar mediante la siguiente suma:

Usando la misma particin

( 1)

(28)

Sea

( 1)

Ntese que

(29)

es una muestra de variables aleatorias independientes idnticamente

distribuidas donde

~ (0,1) por lo que la aproximacin ahora es

Por la ley de los grandes nmeros

(30)

1 . Por lo tanto,

) =

(31)

o en su forma diferencial:

) =

(32)

Este ltimo resultado servir para hacer un clculo en el siguiente captulo ya que se
presentar la necesitad de integrar una funcin como sta.
13

2.6 El modelo para el residual.


Se usar un modelo de tiempo continuo para los precios de las acciones

( ), ,

( ) donde

es el tiempo medido en aos desde un punto arbitrario de la base de datos. Basado en el


modelo de varios factores de riesgo, se asume que los rendimientos de las acciones cumplen
con las ecuaciones diferenciales estocsticas siguientes:

( )
=
( )

( ) +

( )

(33)

Una forma de estimar los parmetros de esta ecuacin es usando el mtodo de mnimos
cuadrados en una discretizacin de (33). Los estimadores de las son:

( , )
,
( )

(34)

por lo que la componente idiosincrtica de los rendimientos est dada por:


Aqu

( ) .

(35)

representa la desviacin de la componente idiosincrtica, i.e.,

es la diferencia de

los rendimientos en relacin a los factores de riesgo en el periodo de observacin. El trmino

( ) se asume que es un proceso estacionario. Usando pruebas estadsticas se puede


probar la hiptesis de que las acciones de inters satisfacen este supuesto.
La idea fundamental de este trabajo es aprovechar este comportamiento para construir una
estrategia de inversin y un portafolio que produzca rendimientos atractivos.
Ahora, es necesario considerar un modelo para el residual

( ), el cual en este trabajo se

considera como un proceso de difusin Ornstein Uhlembeck definido por la siguiente


ecuacin:

( ) =

( )

( ),

> 0 .

(36)
14

Este proceso es estacionario y autorregresivo. En particular, este proceso cumple con lo


siguiente:

( ) ] = 0

(37)

( ) | ( ) , ] =

( )

(38)

La esperanza condicional que se utiliza como el pronstico de los rendimientos diarios es

( ), que adems determina su signo ya que

proporcional al trmino

Los parmetros de la ecuacin diferencial estocstica

> 0.

son especficos para

cada accin. Se supone que varan lentamente en el tiempo de inters y que los parmetros
son constantes en una ventana de 60 das, por lo que los parmetros se estiman utilizando
periodos de esa longitud.
Si se asume que los parmetros del modelo son constantes, entonces se puede obtener la
ecuacin integral del proceso del residual como:

( ) =
( )+

( )+

( )

( ).

( ) =

( ).

( )

( ( )

( )

) =

( )

+ ) =

( ) + (1

( ) (39)

Ahora dejando tender a infinito se observa que

lim

[ (

+ )]

=
=

lim

[ ( )] +

lim

+ lim

( )

15

[ ( ) + ] =

( )

=
=

Por lo tanto,

(1

1
2

( ) tiene una distribucin de probabilidad a largo plazo Normal con

[ ( ) ] =
[ ( ) ] =
Al parmetro

(40)
(41)

se le llama la velocidad de reversin a la media. Si

1 significa que la

accin tiene una reversin a la media rpida lo que hace que el efecto de desvo

sea

despreciable. En nuestra estrategia, para ser consistentes con el mtodo de estimacin, nos
interesarn las acciones tales que:

(42)

Ya que slo se desea considerar acciones cuyo tiempo esperado de reversin a la media sea
menor al tiempo de estimacin.

16

3 La estrategia.
Se considera un periodo de estimacin de 60 das, i.e.

= 60260. Esta ventana de

estimacin se incorpora al ciclo de ganancias de una empresa (es decir, es menor a un


trimestre), por lo que se espera que se refleje el modelo en ventanas de ese periodo. Por eso
se elige acciones de reversin rpida a la media (

) .

3.1 Reversin a la media pura.


( ) ignorando el desvo

En esta seccin se enfoca nicamente en el proceso

. Sabemos

que la desviacin estndar de equilibro es

(43)

Con esto se define la variable s-score como:

( )

(44)

Esta es una variable de posicin, nos indica hacia dnde y en qu proporcin est alejada la
accin de su punto de equilibrio terico. Por esto mismo, sta es la variable seal.
Las reglas bsicas de la estrategia son las siguientes:

Abrir largo si

<

Abrir corto si

>+

Cerrar largo si

<+

Cerrar corto si

>

17

donde abrir largo significa comprar un peso de la accin i y vender (o irse corto) en los factores
de riesgo con

pesos en cada factor de riesgo

3.2 Reversin a la media con desviacin

En la estrategia anterior se ignora la desviacin, es decir, se asume que la desviacin es


despreciable en comparacin a la reversin a la media. Ahora incorporando la desviacin

al

valor esperado condicional se obtiene que:

( ) | ( ) , ] =

( )

( )

(45)

Esto sugiere que la nueva variable seal a la cual se denominar como s-score modificada sea:
,

=
,

.
,

(46)

Las reglas de la estrategia son las mismas, es decir:

Abrir largo si

<

Abrir corto si

>+

Cerrar largo si

<+

Cerrar corto si

>

Se observa que si la desviacin es positiva implica que la s-score modificada es menor al


s-score. Es decir, si la desviacin es positiva se espera que la accin este desviada
positivamente en esa proporcin del punto de equilibrio inicial. Y de forma anloga cuando la
desviacin es negativa. Tambin se puede ver que si la s-score es cero entonces la estrategia
se reduce a observar las desviaciones de cada accin, es decir, se reduce a una estrategia de
momentum.

18

4 Los parmetros.
Ya se mencion que

por lo que las

( , )
,
( )

(47)

se calculan con la covarianza y la varianza muestrales. Para calcular las

desviaciones se utiliza el estimador de la constante de un modelo de regresin lineal mltiple


por mnimos cuadrados ordinarios:

= 260

( )

( )

( )
.
( )

(48)

La forma de estimar estos parmetros es bastante intuitiva. El problema es calcular los


parmetros del proceso de difusin de Ornstein Uhlembeck

ya que ste es un

modelo en tiempo continuo y solamente tenemos observaciones en tiempo discreto.


Para poder estimar los parmetros

se discretiza el proceso, donde

+ ) =

( ) + (1

( )

(49)

cambia a

=
donde

se distribuye

(0,

= 1, ,60 ,

(50)

[ ]).

Es decir, para estimar estos parmetros se usarn nicamente los ltimos 60 das de
observaciones. Entonces tenemos que

19

= (1

(51)

(52)

[ ] =
Para estimar ,

(1

) .

(53)

[ ] se usa la funcin de mxima verosimilitud, que es equivalente en

este caso a estimar por regresin lineal con mnimos cuadrados ordinarios sobre las
observaciones. Se eliminan las acciones que tengan una

que contenga al 1 en su intervalo

de confianza para asegurar que la accin se modele como se desea. Entonces despejando de
las ecuaciones (51), (52) y (53) se obtiene:

= 260 log( ) ,

(54)

(55)

[ ]2
,
1

(56)

[ ]
1

(57)

Para calcular el s-score que se defini como

( )

(58)

Se usa

20

(59)

Es decir, mide qu tan desviado est de su prediccin. Se usa esta versin de s-score ya que
se encontr que funciona mejor que la original.

21

5 El portafolio.
Hasta ahora solamente se han discutido los tiempos de entrada y de salida de cada posicin,
pero no se ha dicho nada de los montos. Se entra con el mismo monto a cada posicin?
Mientras se est en una posicin, se mantiene el monto de entrada fijo? Se mantiene todo el
capital invertido en las acciones o se tiene una porcin bajo una tasa libre de riesgo? Ya dada
una estrategia, encontrar cul es la forma ptima de manejar un portafolio es un tema ms
extenso que el presente trabajo.
Con el fin de ilustrar el funcionamiento de la estrategia a lo largo del periodo y de no
profundizar en el manejo del portafolio se maneja de la siguiente forma:

Se mantiene todo el capital invertido a menos que no haya posicin activa, de ser ese el
caso, no hay capital invertido.

Se invierte en cada posicin 1

proporcin del capital, siendo

el nmero de

posiciones que se mantiene.

Se actualizan diariamente los montos invertidos en cada una de las acciones segn lo
que la estrategia establece como monto ptimo.

Expresando esto en forma matemtica. Sea ,

siendo el nmero total de acciones en

consideracin, tal que

1
, <
0 <
=
+
, <
1
, > +

Es decir,

(60)

es un indicador de posicin en cada accin.

Sea el vector de los rendimientos de cada accin al tiempo ,

22

(61)

.
,

Sea la matriz de las betas al tiempo

, =
y sea donde

(62)

es el nmero de eigenportafolios en uso,

Entonces el rendimiento diario del portafolio al tiempo se puede calcular como

=
ya que

( )
.

(63)

representa el rendimiento promedio diario de las posiciones que se mantienen al

tiempo .

23

6 Los datos.
Se usarn 40 acciones que cotizan en la BMV que cumplen cierto criterio de liquidez para
asegurar que pueda funcionar la estrategia. Las acciones que se utilizaron son los siguientes:

Tabla 1 Acciones en consideracin

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

Nombre de accion
AC
ALFA 'A'
ALSEA
AMX 'L'
ARA
ASUR 'B'
AUTLAN 'B'
AZTECA CPO
BACHOCO 'B'
BIMBO 'A'
CEMEX 'CPO'
CICSA 'B1'
CIE 'B'
COMERCI 'UBC'
ELEKTRA
FEMSA 'UBD'
GCARSO 'A1'
GEO 'B'
GFINBUR 'O'
GFNORTE 'O'
GMEXICO 'B'
GMODELO 'C'
GRUMA 'B'
HOGAR 'B'
HOMEX
ICA
IDEAL 'B-1'
COCA-COLA FEMSA 'L'
MEXCHEM
PAPPEL
PE&OLES
PINFRA
SARE 'B'
SIMEC 'B'
SORIANA 'B'
TELMEX 'L'
TLEVISA CPO
URBI
VITRO 'A'
WALMEX 'V'

Emisora
Arca Continal, S.A.B. de C.V.
Alfa, S.A.B. de C.V.
Alsea, S.A.B. de C.V.
America Movil, S.A.B. de C.V.
Consorcio Ara, S.A.B. de C.V.
Grupo Aeroportuario del Sureste
Compaa Minera Autlan, S.A.B. de C.V.
T.V. Azteca, S.A.B. de C.V.
Industrias Bachoco, S.A.B. de C.V.
Grupo Bimbo, S.A. de C.V.
Cemex S.A.B. de C.V.
Carso Infraestructura y Construccin, S.A.B. de C.V.
Corporacion Internacional de entretenimiento, S.A.B. de C.V.
Controladora Comercial Mexicana, S.A.B. de C.V.
Grupo El ektra, S.A. de C.V.
Fomento Economico Mexicano, S.A.B. de C.V.
Grupo Carso, S.A.B. de C.V.
Corporacion GEO, S.A.B. de C.V.
Grupo Fi nanciero Inbursa, S.A.B. de C.V.
Grupo Fi nanciero Banorte, S.A.B. de C.V.
Grupo Mexi co, S.A.B. de C.V.
Grupo Modelo, S.A.B. de C.V.
Gruma, S.A.B. de C.V.
Consorcio Hogar, S.A.B. de C.V.
Desarrolladora Homex, S.A.B. de C.V.
Empresas ICA, S.A.B. de C.V.
Impulsora del Desarrollo y el Empleo en America Latina, S.A.B. de C.V.
Coca - Cola FEMSA, S.A.B. de C.V.
Mexichem, S.A.B. de C.V.
Bio Pappel, S.A.B. de C.V.
Industrias Peoles, S.A.B. de C.V.
Promotora y operadora de Infraestructura, S.A.B. de C.V.
SARE Holdings, S.A.B. de C.V.
Grupo Si mec, S.A.B. de C.V.
Organizacin Soriana, S.A.B. de C.V.
Telefonos de Mexico, S.A.B. de C.V.
Grupo Televisa, S.A.B.
URBI Desarrol los Urbanos, S.A.B. de C.V.
Vitro, S.A.B. de C.V.
Wal - Mart de Mexico, S.A.B. de C.V.

Industria
Consumo Frecuente
Industrial
Consumo No Basico
Telecomunicaciones
Industrial
Industrial
Materiales
Telecomunicaciones
Consumo Frecuente
Consumo Frecuente
Materiales
Industrial
Consumo No Basico
Consumo Frecuente
Consumo No Basico
Consumo Frecuente
Industrial
Industrial
Servicios Financi eros
Servicios Financi eros
Materiales
Consumo Frecuente
Consumo Frecuente
Industrial
Industrial
Industrial
Industrial
Consumo Frecuente
Materiales
Materiales
Materiales
Industrial
Industrial
Materiales
Consumo Frecuente
Telecomunicaciones
Telecomunicaciones
Industrial
Materiales
Consumo Frecuente

Escriba aqu la ecuacin.


24

El criterio de liquidez que se usa es que el precio de la accin tenga variacin diaria (o casi
diaria), lo que asegura que hubo compra-venta diaria. Una consecuencia de buscar las
acciones de mayor liquidez es que la mayora de ellas forma parte del IPC, aunque hay
acciones del IPC que no estn en la base y hay acciones fuera del IPC que entraron en la
base.
Los datos que se utilizaron en esta tesis son datos diarios de cierre de cada accin del 19 de
diciembre del 2005 al 13 de marzo del 2012.

6.1 Un anlisis exploratorio de los datos.


Antes de empezar a aplicar esta estrategia de arbitraje estadstico se har un breve anlisis
exploratorio de los datos con el fin de familiarizarse ms con ellos.
Uno de los temas de inters para poder aplicar la estrategia es saber el nmero de
componentes principales que se deben usar. Como se mencion previamente hay dos formas
de acercarse a esta cuestin:

Usar un nmero fijo de componentes principales que se consideren suficientemente


explicativas.

Usar el nmero mnimo necesario de componentes principales para explicar cierto


porcentaje fijo de varianza.

A continuacin se presenta una grfica del nmero de componentes principales necesarias


para explicar 55% de varianza a travs del tiempo.

25

Grfica (1)

Nmero de componentes necesarias para explicar 55% de la varianza

nme
ro de
comp
onent
es

Tiempo en das

Es claro que la moda de la mnima cantidad de componentes necesarias para explicar el 55%
de la varianza es de 10 componentes, y tambin se podra esperar que la mediana est
cercana a este nmero por lo que se puede observar de la grfica(1). Por esto mismo se
utilizaron 10 componentes principales de manera fija a lo largo de la aplicacin de la estrategia
de inversin.

26

En la siguiente grfica se observa cmo se comporta el porcentaje de varianza que explica


cada una de las componentes principales a travs del tiempo.
Grfica (2)

Varianza explicada por cada componente principal a travs del tiempo

Var.
explic
ada
de
cada
C.P.

Tiempo en das

Se puede ver que la primera componente principal tiene un dominio sobre las dems, tan solo
la primera componente explica alrededor del 30% en la mayor parte del tiempo, es decir, para
explicar el 25% faltante se necesitan en promedio 9 componentes ms. Tambin se puede ver
que la segunda componente resalta sobre las dems en ciertos periodos. Por esto mismo el
inters de saber qu acciones son las principales participantes en estas dos componentes.
La grfica(3) es una grfica de dispersin sobre las primeras dos componentes principales de
las acciones con mayor participacin en ellas en cada tiempo del periodo.

27

Grfica (3)

Principales acciones graficadas sobre las primeras componentes

principales en diferentes tiempos

Segu
nda
comp
onent
e
princi
pal

Primera componente principal


-Negro es ICA

-Cian es CIE

-Verde es AMX

-Magenta es COMERCI

-Amarillo es GEO

-Azul es PAPPEL

-Rojo es CEMEX

Se observa que hay cierta simetra en la primera componente, el lado derecho son periodos en
los que hubo crecimiento en el IPC y el lado izquierdo cuando decreci (causado por la crisis
econmica del 2008 en las que hubo fuertes cadas del IPC). Las acciones con mayor fuerza
en la primera componente (ICA, AMX, GEO Y CEMEX) se mantienen con una fuerza
relativamente constante respecto a sta a lo largo del tiempo, su nivel en valor absoluto
siempre es mayor a .15 y menor a .25 . En cambio, las acciones con mayor fuerza respecto a la
segunda componente (CIE, COMERCI y PAPPEL) tienen una fuerza con mucha variacin, por
ejemplo, en el caso de CIE llega a tener una fuerza de 0 a una fuerza superior a 0.4 .

28

6.2 El primer eigenportafolio.


Como se vio previamente la primera componente principal explica alrededor del 30% de la
varianza, por eso mismo interesa observar cmo se comporta el primer eigenportafolio.
Grfica (4)

IPC y el Primer Eigenportafolio

Dese
mpe
o de
los
portaf
olios

Tiempo en das
Rojo - IPC

Azul - 1er Eigenportafolio

En la grfica se puede observar claramente que existe una correlacin positiva alta entre el IPC
y el primer eigenportafolio. La interpretacin de esto es que el mejor ndice para resumir el
mercado de Mxico es el IPC. Tambin hay una clara separacin despus de la crisis, esta
separacin probablemente es causada por que en esta tesis no se consideraron las acciones
que entraron al IPC despus de la fecha inicial.

29

7 Los resultados.
Algo que no se desarrolla en el artculo de Avellaneda, M. y Lee, J-H. (2010). es la eleccin de
las parmetros de sealamiento de decisin

, ,

. De la eleccin de estos

parmetros depender el funcionamiento de la estrategia.


En esta tesis no se intentar encontrar un conjunto ptimo para estos parmetros pero se
ilustrar como se comporta la estrategia con diferentes conjuntos.

7.1 Sin considerar la desviacin

En la prxima tabla se presentan los rendimientos promedio diarios y anuales del portafolio con
diferentes conjuntos de parmetros sin considerar las desviaciones
Tabla 2.1 Cojunto de Estrategias
al
cl
ac
cc
rd
ra
1 0.5
1 0.5 0.00000 0.00
1 0.75
1 0.75 0.00000 0.00
1
1
1
1 0.00010 0.03
1 1.25
1 1.25 0.00010 0.03
1 1.5
1 1.5 0.00010 0.03
1.25 0.5 1.25 0.5 0.00020 0.05
1.25 0.75 1.25 0.75 0.00010 0.03
1.25
1 1.25
1 0.00010 0.03
1.25 1.25 1.25 1.25 0.00010 0.03
1.25 1.5 1.25 1.5 0.00010 0.03
1.5 0.5 1.5 0.5 0.00030 0.08
1.5 0.75 1.5 0.75 0.00010 0.03
1.5
1 1.5
1 0.00020 0.05
1.5 1.25 1.5 1.25 0.00000 0.00
1.5 1.5 1.5 1.5 0.00010 0.03
1.75 0.5 1.75 0.5 0.00020 0.05
1.75 0.75 1.75 0.75 0.00010 0.03
1.75
1 1.75
1 0.00000 0.00
1.75 1.25 1.75 1.25 -0.00010 -0.02
1.75 1.5 1.75 1.5 0.00000 0.00
2 0.5
2 0.5 0.00070 0.19
2 0.75
2 0.75 0.00040 0.11
2
1
2
1 0.00030 0.08
2 1.25
2 1.25 0.00000 0.00
2 1.5
2 1.5 0.00000 0.00
2.25 0.5 2.25 0.5 0.00090 0.25
2.25 0.75 2.25 0.75 0.00080 0.22
2.25
1 2.25
1 0.00050 0.13
2.25 1.25 2.25 1.25 0.00010 0.03
2.25 1.5 2.25 1.5 0.00000 0.00

Tabla 2.2
al
cl
2 0.5
2 0.5
2 0.5
2 0.75
2 0.75
2 0.75
2
1
2
1
2
1
2.25 0.5
2.25 0.5
2.25 0.5
2.25 0.75
2.25 0.75
2.25 0.75
2.25
1
2.25
1
2.25
1
2.5 0.5
2.5 0.5
2.5 0.5
2.5 0.75
2.5 0.75
2.5 0.75
2.5
1
2.5
1
2.5
1
0
0

Cojunto de Estrategias
ac
cc
rd
ra
2 0.5 0.0007 0.19
2 0.75 0.0007 0.19
2
1 0.0004 0.11
2 0.5 0.0005 0.13
2 0.75 0.0004 0.11
2
1 0.0003 0.08
2 0.5 0.0004 0.11
2 0.75 0.0004 0.11
2
1 0.0003 0.08
2.25 0.5 0.0009 0.25
2.25 0.75 0.0011 0.32
2.25
1 0.0008 0.22
2.25 0.5 0.0007 0.19
2.25 0.75 0.0008 0.22
2.25
1 0.0005 0.13
2.25 0.5 0.0008 0.22
2.25 0.75 0.0009 0.25
2.25
1 0.0005 0.13
2.5 0.5 0.0003 0.08
2.5 0.75 0.0007 0.19
2.5
1 0.0001 0.03
2.5 0.5 -0.0003 -0.07
2.5 0.75
0 0.00
2.5
1
0 0.00
2.5 0.5 -0.0003 -0.07
2.5 0.75 -0.0002 -0.05
2.5
1 -0.0001 -0.02
0
0
0 0.00

30

En estas tablas se presentan los parmetros de entrada al, cl, ac y cc que abrevian abrir largo,
cerrar largo, abrir corto y cerrar corto respectivamente. Y se presentan tambin rd y ra que son
los rendimientos diarios promedio y los rendimientos anuales promedio que gener la
simulacin de la estrategia con esos parmetros. En la tabla 2.1 se presenta un grupo de
estrategias donde al es igual a ac y cl es igual a cc. En la tabla 2.2 es un conjunto de
estrategias donde solamente al es igual a ac.
Observaciones:

Lo primero que se observa, y que alegra ver, es que en la gran mayora de los casos los
rendimientos son positivos.

Se observa tambin que los parmetros de abrir posicin,

, tienen un efecto

positivo mientras ms alejados de 0 se elijan, aunque si se eligen demasiado lejos (2.5)


el efecto es negativo.

Por el otro lado, los parmetros y

funcionan mejor para valores cercanos a 0.

La forma en la que se interpreta el segundo y el tercer punto es que la forma en que mejor
funciona la estrategia es ser ambicioso con las variables de entrada y esperar a que la accin
se desve mucho de su punto de equilibrio, y ser seguro con las variables de salida y dejar la
posicin en el momento que se haya acumulado un ingreso suficiente.
Con el fin de analizar ms de cerca el comportamiento de distintos conjuntos de parmetros se
ilustra cmo se comporta el portafolio a lo largo del tiempo con distintos conjuntos de
parmetros de entrada al, cl, ac y cc.

31

Grfica (5)

Rendimientos de estrategias

Dese
mpe
o de
las
estrat
egias

Tiempo en aos
Azul [2.25, .5, 2.5, .75]

[1.75, 1.5, 1.75, 1.5]

Cian [2.25, .75, 2.5, .5]

Magenta - [1.75, 1.5, 1.75, 1.5]

Verde - [2, .75, 2, .5]

Rojo - [1.75, 1.25, 1.75, 1.25]

Observaciones:

Pre-crisis: Se puede ver que inicialmente tienen un comportamiento similar aunque las
estrategias ms agresivas empiezan mejor.

Crisis: Todas las estrategias tienen una cada al momento de iniciar la crisis, pero en el
momento que ya existe suficiente informacin de cmo se estn comportando las
acciones a lo largo de la crisis se empieza un mar de oportunidades que dependiendo
de la agresividad de la estrategia, depende qu tanto logra aprovechar estas
oportunidades de arbitraje.

Post-crisis: Las estrategias vuelven a tener un comportamiento similar, pero se observa


que las estrategias ms agresivas empiezan a tener mayores prdidas, y las ms
conservadores llegan a tener ganancias. Probablemente ya hay desequilibrios tan

32

grandes en estos periodos por lo que ya no hay tantas oportunidades de entrada para
las estrategias ms agresivas.
De esto se puede deducir que si se deseara elegir los parmetros de una forma terica ptima
uno de los principales factores que se deben considerar es la volatilidad del mercado.

7.2 Considerando la desviacin

Es natural esperar que la estrategia considerando la desviacin

tenga un mejor desempeo

ya que sta se considera cul es la tendencia de la accin. El problema que se podra


presentar es que ms que encontrar tendencias, lo nico que genere es ruido que perjudique
a las predicciones.
A continuacin se presenta el mismo conjunto de estrategias que se us previamente pero
ahora considerando la desviacin

33

Tabla 3.1 Cojunto de Estrategias

al
1
1
1
1
1
1.25
1.25
1.25
1.25
1.25
1.5
1.5
1.5
1.5
1.5
1.75
1.75
1.75
1.75
1.75
2
2
2
2
2
2.25
2.25
2.25
2.25
2.25

cl
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5

ac
1
1
1
1
1
1.25
1.25
1.25
1.25
1.25
1.5
1.5
1.5
1.5
1.5
1.75
1.75
1.75
1.75
1.75
2
2
2
2
2
2.25
2.25
2.25
2.25
2.25

cc
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5
0.5
0.75
1
1.25
1.5

rd
-0.0001
0.0000
0.0001
0.0001
0.0001
0.0002
0.0001
0.0001
0.0001
0.0001
0.0003
0.0001
0.0001
0.0000
0.0001
0.0002
0.0001
0.0001
-0.0001
0.0000
0.0008
0.0005
0.0001
0.0001
0.0001
0.0012
0.0010
0.0006
0.0002
0.0000

ra
-0.02
0.00
0.03
0.03
0.03
0.05
0.03
0.03
0.03
0.03
0.08
0.03
0.03
0.00
0.03
0.05
0.03
0.03
-0.02
0.00
0.22
0.13
0.03
0.03
0.03
0.35
0.29
0.16
0.05
0.00

Tabla 3.2 Cojunto de Estrategias

al
2
2
2
2
2
2
2
2
2
2.25
2.25
2.25
2.25
2.25
2.25
2.25
2.25
2.25
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5

cl
0.5
0.5
0.5
0.75
0.75
0.75
1
1
1
0.5
0.5
0.5
0.75
0.75
0.75
1
1
1
0.5
0.5
0.5
0.75
0.75
0.75
1
1
1

ac
2
2
2
2
2
2
2
2
2
2.25
2.25
2.25
2.25
2.25
2.25
2.25
2.25
2.25
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5

cc
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1
0.5
0.75
1

rd
0.0008
0.0007
0.0004
0.0005
0.0005
0.0003
0.0000
0.0002
0.0001
0.0012
0.0014
0.0008
0.0009
0.0010
0.0005
0.0009
0.0010
0.0006
0.0007
0.0007
0.0007
-0.0001
0.0000
0.0004
-0.0001
0.0000
0.0004

ra
0.22
0.19
0.11
0.13
0.13
0.08
0.00
0.05
0.03
0.35
0.42
0.22
0.25
0.29
0.13
0.25
0.29
0.16
0.19
0.19
0.19
-0.02
0.00
0.11
-0.02
0.00
0.11

Al comparar estas tablas con las tablas 2.1 y 2.2, se observa que en la primera columna en la
mayora de los casos conviene ignorar la desviacin ya que en tan solo 8 de las 30 estrategias
conviene considerar

. Por el otro lado, en la segunda columna en las que pertenece las

mejores estrategias en tan solo 3 de los 28 casos no conviene ignorar

El comportamiento general de las estrategias es similar en ambos casos como se muestra en la


grfica 6 en la que se compara el uso de la desviacin usando tres estrategias diferentes.

34

Grfica (6)

Desviacin v.s. No desviacin

Dese
mpe
o de
las
estrat
egias

Tiempo en das
Rojo - sin desviacin

Azul - con desviacin

En ambos casos, el comportamiento antes de la crisis es casi idntico. A lo largo de la crisis,


que es el momento de toma de oportunidades, las estrategias que consideran la tendencia de
las acciones generan mejores resultados.

35

7.3 Los parmetros en el tiempo.


Dado que la estrategia parece tener buen funcionamiento, es de inters saber si efectivamente
el modelo se est cumpliendo. Por eso mismo se grafican los parmetros de Amrica Movil (la
accin ms importante) a travs del tiempo.

Grfica (7)

Kappa de Amrica Mvil vs Tiempo

Kapp
a

Tiempo en das

Se desea que 1

= 60260 por lo que se desea que kappa sea mayor a 8.6

para que tenga una rpida reversin a la media. Es claro que para esta accin, efectivamente
se cumple esto.

36

Grfica (8)

Mu y sigmaEq de Amrica Mvil vs Tiempo

Par
metro

Tiempo en das
Rojo - Mu

Verde - SigmaEq

En esta grfica se observa que efectivamente, la media del residual es cercana a 0 a lo largo
de todo el periodo. Tambin se observa que la sigmaEq (sigma de equilibrio) es mayor en los
tiempo de crisis y se reduce en los tiempos siguientes (post-crisis).

37

8 Algunos comentarios sobre la implementacin.


Si se deseara implementar esta estrategia de arbitraje en la vida real se deben considerar los
siguientes puntos:

La estrategia necesita entrar en posiciones sobre ndices que no existen. Como no sera
costeable crear ndices para implementar la estrategia, entonces se debe usar otro
mtodo. Para poder replicar artificialmente los ndices es necesario entrar en posicin
en cada una de las acciones en consideracin, en apalancamientos precisos que seran
el monto de la accin por el peso en la componente principal.

El modelo pide un apalancamiento preciso en cada componente, pero esto tal vez no
sea posible de implementar. Estos errores de precisin afectaran el portafolio de
manera negativa.

La estrategia tambin pide entrar en posicin en cada uno de los eigenportafolios con
un monto igual a su respectiva

para cada accin en la que hay posicin activa. No es

posible invertir el monto que uno quiera en una emisora ya que cada accin tiene un
precio, entonces para poder aproximar las proporciones de estas

de la mejor

manera posible, se debe invertir grandes cantidades de dinero.

Por ltimo, se debe considerar que hay un retraso de tiempo del momento en el que se
sabe que se debe entrar en alguna posicin al momento que efectivamente se entr. En
ese diferencial de tiempo tambin se gener un diferencial de precio. Esto podra
afectar de manera negativa al desempeo del portafolio.

38

9 Conclusiones.
Esta estrategia de arbitraje estadstico parece funcionar en Mxico en este periodo ya que en la
gran mayora de las diferentes selecciones de parmetros los rendimientos fueron positivos y,
en los casos que fueron negativos los rendimientos eran muy cercanos a cero.
Las acciones que se consideraron son las mismas durante todo el periodo, si en la
implementacin se consideran las acciones nuevas que forman parte del IPC se conseguira
mayor informacin del mercado, por lo que se esperara que la estrategia funcione mejor.
La seleccin de parmetros de sealamiento parece que puede valer un trabajo entero. La
estrategia parece funcionar bien en tiempos de crisis y no tan bien en tiempos estables por lo
que sera natural pensar que la estrategia es dependiente de la volatilidad del mercado. Lo que
se intuye de los datos es que esta seleccin de parmetros debe de estar relacionada
directamente con la volatilidad del mercado. Sera posible implementar una estrategia donde
los parmetros de sealamiento sean dinmicos dependientes de la volatilidad y tal vez otros
factores. Se esperara que esta implementacin afecte positivamente a la estrategia.
En general se concluye que esta es una estrategia que vale la pena explorar ms a detalle para
considerar que se use con dinero real.

39

10 Los algorimtos.
10.1 Los principales.
function[g]=EstrategiaAE(al,cl,ac,cc,X,mod)
%Este algoritmo simula como se comportara la estrategia en el periodo.
%Los parmetros de entrada es la matriz X de precios de acciones a lo largo
% del tiempo siendo cada columna una accin.
% al, cl , ac, cc son los parmetros de abrir(o cerrar) largo(o corto)
% mod es uno si se considera la desviacin y 0 si no se considera.

%Matriz de rendimientos
[a,b] = size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j) = log(X(i+1,j)/X(i,j));
end
end
%La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo
%el mismo indice de tiempo que la matriz de rendimientos R.
%Notese que las primeras 260 observaciones seran igual a cero.
F=zeros(a-1,10);
rendF=zeros(a-1,10);
%DXt es la matriz de todos los residuales
DXt = zeros(a-1,b);
%Posicion es el vector que indica que posicin se tiene sobre cada accion,
%1 es "abierto largo", -1 es "abierto corto", 0 es sin posicion
posicion = zeros(1,b);

rend = 0;
rendv = zeros(a-1-260,1);
ing=1;
for t=261:a-1
%Se calculan los residuales y se actualizan las matricez F y rendF y se
%extrae la matriz de betas y el vector de alfas
[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b);
%rend = rend*(1+(posicion*((R(t,:)')-betas*(rendF(t,:)'))));
%Contador de en cuantas posiciones hay posicion
cont = 0;
for k = 1:b
if posicion(1,k)==0
cont = cont + 1;

40

end
end
cont = b-cont;
if cont > 0
rend = posicion*((R(t,:)')-betas*(rendF(t,:)'));
if abs(rend) > 1
rend = abs(rend)/rend;
end
rend = rend/cont;
rendv(t-260,1) = rend;
end
%Esta funcin regresa un vector de seales de cada accin que indica
%que se debe hacer.
posicion = senal(posicion,DXt,t,b,al,cl,ac,cc,alfas,mod);
ing=ing*(1+rend);
if rend < 0
plot(t,ing,'red')
hold on
else
plot(t,ing,'red')
hold on
end
t
end
g=mean(rendv);

41

function[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b)
%Esta funcin regresa el vector de residuales del proceso de difusin de O-U
%sumados con el "dift" alfa
%Actualiza los retornos de F
%Actualiza los rendimientos de F
%Regresa la matriz de betas al tiempo t
%Regresa el vector de algas al tiempo t

%F es un vector con los factores de riesgo. Cada uno formado por cada
%componente principal
Ft = zeros(1,10);
%F es un vector con los factores de riesgo. Cada uno formado por cada
%componente principal
rendFt = zeros(1,10);
%Sigmas es el vector de las desviaciones estandar del forex en el periodo
sigmas = zeros(b,1);
%betas es la matriz de las betas, el renglon es la accion y la columna el
%factor de riesgo
betas = zeros(b,10);
%alfas es un vector vectical
alfas = zeros(b,1);
[coeff,score,vars] = PCA(R,t);
%A es la seccin de R de inters
A = zeros(260,b);
for i=1:260
for j=1:b
A(i,j) = R(i+t-260,j);
end
end
%Se calculas las sigmas
for i=1:b
sigmas(i,1) = sqrt(var(A(:,i)));
end
%Se calcula el rendimiento y el retorno de F
for j=1:10
inversion = 0;
for i=1:b
Ft(1,j)=Ft(1,j) + coeff(i,j)*(1/sigmas(i,1))*R(t,i);
inversion = inversion + coeff(i,j)*(1/sigmas(i,1));
end
rendFt(1,j) = (Ft(1,j))/inversion;
end
%Se actualiza la matriz F
F(t,:) = Ft;
rendF(t,:) = rendFt;

42

%Se toma la parte de F de inters "B"


B = zeros(260,10);
for i = 1:260
for j = 1:10
B(i,j) = F(t-260+i,j);
end
end
%Se calculan las betas con las covarianzas
for i=1:b
for j=1:10
c = cov(A(:,i),B(:,j));
betas(i,j) = c(1,2)/(var(B(:,j)));
end
end
%Se crea el vector de residuales
dXt = zeros(1,b);
for i=1:b
dXt(1,i) = R(t,i)-betas(i,:)*Ft';
end
DXt(t,:) = dXt;
%Se calcula cada alfa para cada accion
for i=1:b
alfas(i,1) = 260*(mean(A(:,i))-betas(i,:)*(mean(B))');
end

43

function[posicion] = senal(posicion,DXt,t,b,al,cl,ac,cc,alfas,mod)
%Esta funcin indica que accin se debe hacer sobre la accin al tiempo t
siv = zeros(1,b);
for i = 1:b
%v es la serie de tiempo de los residuales de la accion i
v = zeros(60,1);
%v1 es el vector retrazado un tiempo
v1 = zeros(60,1);
for j = 1:60
v(j) = DXt(t-60+j-1,i);
v1(j) = DXt(t-60+j-2,i);
end
%Se calculan los parmetros del proceso autoregresivo
c = cov([v v1]);
p2 = c(2,1)/var(v1);
p1 = mean(v)-p2*mean(v1);
%rar son los residuales del proceso autoregresivo
rx = zeros(60,1);
for j = 1:60
rx(j) = v(j) - p1 - p2*v1(j);
end
%vx es la varianza de los residuales
vx = var(rx);
%Se calculan los parmetros de el O-U
kappa = -log(p2)*260;
m = p1/(1 - p2);
sigmaEq = sqrt(vx/(1-p2*p2));
%si = (DXt(t,i)-m)/sigmaEq;
si = (DXt(t,i)-p1-p2*DXt(t-1,i))/sigmaEq;
%Se calcula s-mod si asi se indica
if mod == 1
si = si - alfas(i,1)/(kappa*sigmaEq);
end
siv(1,b) = si;
%Se analiza que hacer con la posicin
%Para las acciones en las que hay posicion no aplican filtros
if posicion(1,i) == 1
if si > cl
posicion(1,i) = 0;
end
end
if posicion(1,i) == -1
if si < -cc
posicion(1,i) = 0;

44

end
end

%fil es una variable que indica cuantos filtros pas la accin


fil = 0;
%Primer filtro, que el intervalo de confianza de p2 no incluya el 1
sp2 = sqrt(vx/(var(v)*59));
low = p2 - sp2*tinv(.97,58);
high = p2 + sp2*tinv(.97,58);
if low > 1 || high < 1
fil = fil + 1;
end
%Segundo filtro, que el tiempo de reversin a la media sea
%suficientemente rpido
if kappa > 8.66666
fil = fil + 1;
end
if low < 0 && high > 0
fil = fil + 1;
end
%Se analiza entrar a algn tipo de posicin
if posicion(1,i) == 0 && fil ==3
if si < -al
posicion(1,i) = 1;
end
if si > ac
posicion(1,i) = -1;
end
end
end

function[coeff,score,vars] = PCA(X,t)

45

%esta funcion regresa las componentes principales que corresponden a las


%observaciones de hace un ao a la fecha.
[a,b]=size(X);
A=zeros(260,b);
for i=1:260
for j=1:b
A(i,j) = X(i+t-261,j);
end
end
%Se estandariza la matriz
Z = zscore(A);
[coeff,score,latent] = princomp(Z);
vars = latent./sum(latent);
end

10.2 Los auxiliaries.


%Analisis exploratorio
[a,b]=size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j)=log(X(i+1,j)/X(i,j));
end
end
suma=0;
suma2=0;
%suma3 es para ver cuantas componentes se necesitan para acumular 55% de
%variaza explicada
suma3=0;
%vec es el vector promedio de los coeffs
% vec = zeros(b,10);
% Z = zscore(R);
% [coeffs,score,latent] = princomp(Z);
for t=261:a-1
[coeff,score,vars] =PCA(R,t);
suma=suma + vars(1);
suma2=suma2 + vars(2);
s=0;
q=1;
while s < .55
s = s + vars(q);
q = q + 1;
end
suma3 = suma3 + q;

%Grafica de dispersion sobre las 2 primeras componentes principales


plot(coeff(26,1),coeff(26,2),'black');

46

hold on
plot(coeff(4,1),coeff(4,2),'green');
plot(coeff(18,1),coeff(18,2),'yellow');
plot(coeff(11,1),coeff(11,2),'red');
plot(coeff(13,1),coeff(13,2),'cyan');
plot(coeff(14,1),coeff(14,2),'magenta');
plot(coeff(30,1),coeff(30,2),'blue');

%grafica a lo largo del tiempo de cuantas componentes se necesitan para


%explicar 55%
plot(t,q);
hold on

%grafica de varianza explicada de las primeras 6 componentes


%principales
plot(t,vars(1),'black');
hold on
plot(t,vars(2),'blue');
plot(t,vars(3),'cyan');
plot(t,vars(4),'magenta');
plot(t,vars(5),'red');
plot(t,vars(6),'yellow');

t
end
suma/(a-1)
suma2/(a-1)
suma3/(a-1)

%Esta rutina genera la grfica del primer eigenportafolio contra el IPC


%Matriz de rendimientos
[a,b]=size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j)=log(X(i+1,j)/X(i,j));
end
end
%La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo
%el mismo indice de tiempo que la matriz de rendimientos R.
%Notese que las primeras 260 observaciones seran igual a cero.
F=zeros(a-1,10);

47

rendF=zeros(a-1,10);
rend=1;
DXt = zeros(a-1,b);
for t=261:a-1
[DXt,F,rendF,betas] = CalculaResiduales(DXt,R,F,rendF,t,b);
rend=rend*(1+rendF(t,1));
%Grafica del Primer Eigenportafolio
plot(t,rend,'blue');
hold on
%Grafica del IPC
plot(t,IPC(t,1)/IPC(261,1),'red');
t
end

%Este algoritmo trata de buscar un buen conjunto de parametros de entrada y


%salida del algoritmo Estrategia
Est = zeros(30,5);
cont = 0
%a es abrir posicion
%c es cerrar posicion
a=1;
for i = 1:6
c=.5;
for j=1:5
pars =[a c a c];
r = EstrategiaAE(pars(1,1),pars(1,2),pars(1,3),pars(1,4),X,1);
cont = cont + 1
Est(cont,:)=[pars r];
c = c + .25;
end
a = a + .25;
end
Est

%Segundo algoritmo de bsqueda de parmetros de entrada y salida del


%algoritmo Estrategia

48

Est = zeros(28,5);
%a es abrir posicion
%c es cerrar posicion
cont = 0
a=2;
for i = 1:3
cl=.5;
for j=1:3
cc=.5;
for k=1:3
pars =[a cl a cc];
r = EstrategiaAE(pars(1,1),pars(1,2),pars(1,3),pars(1,4),X,1);
cont = cont + 1
Est(cont,:)=[pars r];
cc=cc+.25;
end
cl = cl + .25;
end
a = a + .25;
end
Est

%Esta rutina grafica los parametros kappa, simga y mu de America Movil


[a,b] = size(X);
R = zeros(a-1,b);
for i=1:a-1
for j=1:b
R(i,j) = log(X(i+1,j)/X(i,j));
end
end
%La matriz F es la matriz de rendimientos de los eigenportafolios siguiendo
%el mismo indice de tiempo que la matriz de rendimientos R.
%Notese que las primeras 260 observaciones seran igual a cero.
F=zeros(a-1,10);
rendF=zeros(a-1,10);
%DXt es la matriz de todos los residuales
DXt = zeros(a-1,b);
%Posicion es el vector que indica que posicin se tiene sobre cada accion,

rend = 0;
rendv = zeros(a-1-260,1);
ing=1;
for t=261:a-1
%Se calculan los residuales y se actualizan las matricez F y rendF y se
%extrae la matriz de betas y el vector de alfas

49

[DXt,F,rendF,betas,alfas] = CalculaResiduales(DXt,R,F,rendF,t,b);

%Esta funcin regresa un vector de seales de cada accin que indica


%que se debe hacer.
[kappa,m,sigmaEq]=grafica(DXt,t,b,alfas);
plot(t,kappa,'blue')
hold on
plot(t,m,'red')
hold on
plot(t,sigmaEq,'green')
t
end

function [kappaa,mm,sigmaa]=grafica(DXt,t,b,alfas)
siv = zeros(1,b);
for i = 1:b
%v es la serie de tiempo de los residuales de la accion i
v = zeros(60,1);
%v1 es el vector retrazado un tiempo
v1 = zeros(60,1);
for j = 1:60
v(j) = DXt(t-60+j-1,i);
v1(j) = DXt(t-60+j-2,i);
end
%Se calculan los parmetros del proceso autoregresivo
c = cov([v v1]);
p2 = c(2,1)/var(v1);
p1 = mean(v)-p2*mean(v1);
%rar son los residuales del proceso autoregresivo
rx = zeros(60,1);
for j = 1:60
rx(j) = v(j) - p1 - p2*v1(j);
end
%vx es la varianza de los residuales

50

vx = var(rx);
%Se calculan los parmetros de el O-U
kappa = -log(p2)*260;
m = p1/(1 - p2);
sigmaEq = sqrt(vx/(1-p2*p2));
sigma = sigmaEq*sqrt(2*kappa);
if i == 4
kappaa=kappa;
mm=m;
sigmaa=sigmaEq;
end
%si = (DXt(t,i)-m)/sigmaEq;
si = (DXt(t,i)-p1-p2*DXt(t-1,i))/sigmaEq;
%Se calcula s-mod si asi se indica
siv(1,b) = si;

end

51

Referencias
Avellaneda, M. y Lee, J-H. (2010). Statistical Arbitrage in the U.S. Equity Markets. Quantitative
Finance, vol. 10, no. 7, pp 761 782.
Baxter, M. y Rennie, A. (1998) Financial Calculus. An introduction to Derivative Pricing.
Cambridge: Cambridge University Press.
Montgomery, Peck and Vining. (2006). Introduction to linear regression analysis.

52

Das könnte Ihnen auch gefallen