1
Table des matières
1 Introduction 3
2
1 Introduction
L’objectif de ce projet est de déterminer une technique d’estimation de la
covariance entre deux processus A et B dans le cadre d’une micro-structure des
marchés et d’observations asynchrones. Ce genre d’estimateur est souvent utilisé
dans l’optimisation de transaction de portfolio, où il s’agit généralement d’effec-
tuer un grand nombre d’opérations sur un actif dans une même journée. C’est
dans ce cadre que des estimateurs classiques peuvent se montrer inadéquat, en
raison du fait que plusieurs sources de bruit, comme par exemple les effets de mi-
crostructure, se font plus sentir à cette échelle temporelle. On remarque à l’aide
des trois graphiques ci-dessous que les courbes réelles d’actifs s’apparentent da-
vantage à celles de mouvements browniens bruités.
Dans un premier temps, nous allons oublier les effets de microstructure et
nous focaliser sur l’asynchronicité. Le résultat principal sera la démonstration
du biais de l’estimateur empirique fréquemment utilisé en pratique, et l’analyse
de celui-ci quand le pas de temps diminue. Ensuite, nous présenterons un autre
estimateur, plus sophistiqué, qui s’affranchit entièrement du pas de temps et qui
ainsi évite le problème d’asynchronicité des données.
Dans un deuxième temps, nous essayerons d’étudier plus précisément l’in-
fluence de la microstructure sur ces estimateurs.
Finalement, nous proposerons un cas concret d’utilisation de ces estimateurs
dans la mise en place d’une stratégie d’achat d’actifs, achat dont on essaye de
minimiser le coût.
3
Fig. 2 – Les mêmes actifs, avec bruit.
4
2 Premier problème : Asynchronicité
On suppose dans cette partie que le bruit est absent.
X X
V˜h = Ãti − Ãti−1 B̃ti − B̃ti−1 = AT A − AT A BT B − BT B
n(i) n(i−1) m(i) m(i−1)
i i
où l’on définit donc n(i) := maxj j : TjA ≤ ih et m(i) := maxj j : TjB ≤ ih .
On remarque deux choses. D’abord, les intervalles
i de temps
i réguliers
i ]i−1, i]i
A A B B
sont “transformés” en les intervalles de temps Tn(i−1) , Tn(i) et Tm(i−1) , Tm(i)
par la synchronisation. Ensuite, seuls contribuent à la somme les termes tels
que n(i) 6= n(i − 1) et m(i) 6= m(i − 1), c’est à dire ceux pour lesquels Ã
et B̃ ont tous les deux au moins un saut sur l’intervalle ]i − 1, i]. Ceci est
assez intuitif, car on ne peut mesurer la covariance entre deux processus uni-
quement lorsque les deux changent à peu près simultanément (ce qui tradui-
rait une relation entre les prix des actifs). On voit néanmoins déjà apparaitre
le caractère arbitraire du découpage, vu que deux moments éventuellement
liés peuvent artificiellement être séparé par un “i”. Pour C une v.a., notons
GC (i) := {C change de valeur sur ]i-1,i]}
On a supposé que tous les procédés sont indépendants entre eux, mis à part
A B
A et B. On suppose que min(Tn( T ,T
m( T
) = T , ce qui veut juste dire qu’on
h) h)
fait une mesure de A et de B au dernier moment de la journée, ou inversement,
qu’on ne s’intéresse à la covariance que jusqu’au moment où l’on arrête de la
mesurer. Sous ces hypothèses, on a le résultat qualitatif suivant, tiré de [2] :
5
Proposition 2.1.1
" #
h i X
E Ṽh = E hA, Bimin(T A B
,Tm(i) ) − hA, Bimax(T A B
,Tm(i−1) ) 1GÃ ∩GB̃
n(i) n(i−1) i i
i
" #
h i X
A B
E Ṽh = E ∆A I (i) ∆B I (i)
i
" #
X h i
A B
=E E ∆A I (i) ∆B I (i) 1GÃ ∩GB̃ |Π
i i
i
i i i i
en notant I A := Tn(i−1)
A A
, Tn(i) et I B := Tm(i−1)
B A
, Tm(i) et en utilisant la
remarque faite auparavant sur le fait que seuls les intervalles où Ã et B̃ ont tous
les deux un saut interviennent dans la somme.
On décompose ensuite I A (i) de la façon suivante :
avec
i i
I1A (i) := Tn(i−1)
A A
, max Tn(i−1) B
, Tm(i−1)
i i
A B A B
I2 (i) := max Tn(i−1) , Tm(i−1) , min Tn(i) , Tm(i)
i i
I3A (i) := min Tn(i)
A B
, Tm(i) A
, Tn(i)
6
h i
On effectue ensuite un développement dans la formule de E Ṽh pour obte-
nir :
" #
h i X h i
A B
E Ṽh = E E ∆A I (i) ∆B I (i) 1GÃ ∩GB̃ |Π
i i
i
"
X h
E ∆A I1A (i) + ∆A (I2 (i)) + ∆A I3A (i)
=E
i
#
i
I1B (i) I3B (i)
∆B + ∆B (I2 (i)) + ∆B 1GÃ ∩GB̃ |Π
i i
" #
X h i
=E E ∆A (I2 (i)) ∆B (I2 (i)) 1GÃ ∩GB̃ |Π (1)
i i
i
" #
X
=E ∆ hA, Bi (I2 (i))1GÃ ∩GB̃
i i
i
7
Fig. 4 – L’effet Epps, graphe de la corrélation en fonction de h.
Dans cette partie, nous allons donc présenter un estimateur qui s’affranchit
de la synchronisation et du pas de temps h associé.
APourAcela,
découpons
B l’intervalle
]0, T ] des deux façons suivantes : Ii :=
Ti−1 , Ti et Ji := Ti−1 , TiB . Il s’agit de deux partitions de ]0, T ].
L’estimateur considéré est le suivant :
X
U := ∆A(Ii )∆B(Jj )1Ii ∩Jj
i,j
Proposition 2.2.1
E[U ] = hA, BiT
L’estimateur U est donc sans biais. √
De plus, il converge dans L2 en O( h) quand h = maxi (|Ii |) + maxi (|Ji |)
tend vers 0 (c.à.d si on mesure de plus en plus finement).
8
X X
E[U ] = E E [∆A(Ii )∆B(Jj )|Π] Kij = E hA, Bi (Ii ∩ Jj ) Kij = hA, Bi T
i,j i,j
i,j,i0 ,j 0
9
Fig. 6 – 6000 mesures
10
nb de mesures variance
3000 0.3
6000 0.15
10000 0.12
X
Vˆh := ∆Â(]i − 1, i])∆B̂(]i − 1, i])
i
X
∆A (]i − 1, i]) + ∆A (]i − 1, i]) ∆B (]i − 1, i]) + ∆B (]i − 1, i])
=
i
X X
= Vh + ∆A(]i − 1, i])∆B (]i − 1, i]) + ∆B(]i − 1, i])∆A (]i − 1, i])
i i
X
A B
+ ∆ (]i − 1, i])∆ (]i − 1, i])
i
un effet de quantification des valeurs des actifs, et qui corrige l’estimateur consistant dans ce
cadre de travail en tentant de reconstruire les courbes des actifs à partir des courbes quantifiées
11
– D’abord, dans le cas particulier de l’estimation de la volatilité, donc le cas
où A = B, les deux bruits sont corrélés (puisque égaux), et on remarque
qu’on obtient donc un terme d’erreur qui converge vers la volatilité du
bruit. Selon [6], ce terme serait dominant sur le terme qu’on cherche à
estimer, à savoir la volatilité de l’actif. En pratique donc, l’estimateur
empirique de volatilité ne ferait donc que mesurer la volatilité du bruit au
lieu de celle de l’actif. 2
– Ensuite, si on s’affranchit de l’hypothèse simplificatrice d’indépendance,
on voit d’où peut provenir l’erreur principal de l’estimateur. L’estimateur
estime dans ce cas des corrélations avec le bruit plutôt que entre les deux
actifs.
Procédons maintenant à des encadrements des variances de ces deux termes,
ce qui nous fournira leur convergence dans le cas indépendant :
X X X
∆A(]i − 1, i])∆B (]i − 1, i]) = ∆A (]i − 1, i]) B
i − ∆A (]i − 1, i]) B
i−1
i i i
d’où :
!2 " #
X X h 2 i h 2 i
B 2
E ∆A(]i − 1, i])∆ (]i − 1, i]) = 2E (∆A (]i − 1, i])) E B +O E B h
i i
Le premier terme venant des termes “au carré” et le second des termes
croisés.
X X X X
∆A (]i − 1, i])∆B (]i − 1, i]) = 2 A B
ti ti − A B
ti ti−1 − A B
ti−1 ti
i i i i
Une fois de plus, les termes croisés sont négligeables et le terme dominant
de cette expression est donc :
!2
= 6T E 1 h
X h 2 i h 2 i 2 i h B 2 i
E ∆A (]i − 1, i])∆B (]i − 1, i]) A E B +o( E A E )
i
h h
2
L’ordre de l’erreur est donc O + √
h
. D’abord, on remarque la présence
classique d’un trade-off
entre
la variance dûe au bruit, en O (), et celle dûe à la
2
discrétisation, en O √ h . Ceci nous donne théoriquement le meilleur h à choisir
(à savoir en O 2 ). Néanmoins, comme nous avons montré que l’asynchronicité
résulte en un biais non-négligeable, cet estimateur reste inutilisable.
2 [6] propose un estimateur, dit “à deux temps”, pour corriger ce défaut.
12
3.2 Estimateur consistant
On étudie maintenant l’estimateur consistant de la partie 2.2 en supposant
cette fois-ci la présence de bruit.
On écrit que :
X
∆A (Ii ) + ∆A (Ii ) ∆B (Jj ) + ∆B (Jj ) Kij
Û =
i,j
X X X
=U+ ∆A (Ii ) ∆B (Jj ) Kij + ∆B (Jj ) ∆A (Ii ) Kij + ∆A (Ii ) ∆B (Jj ) Kij
i,j i,j i,j
| {z } | {z } | {z }
:=a :=b :=c
2 X
E ∆A (Ii ) ∆B (Jj ) ∆A (Ii0 ) ∆B (Jj 0 ) |Π Kij Ki0 j 0
E a = E
i,j,i0 ,j 0
X
B B
= E E ∆A (Ii ) ∆ (Jj ) ∆A (Ii0 ) ∆ (Jj 0 ) |Π Kij Ki0 j 0
i=i0 ,|j 0 −j|≤1
(2)
X h 2
i
E (∆A (Ii )) ∆B (Jj ) ∆B (Jj−1 ) Ki(j−1) + ∆B (Jj ) Kij + ∆B (Jj+1 ) Ki(j+1) |Π Kij
= E
i,j
X
hAi (Ii ) Kij (Ki(j−1) + 1 + Ki(j+1) )O 2
= E (3)
i,j
= O m2
(4)
13
On obtient (2) en utilisant le fait que ∆A (Ii ) et ∆A (Ii0 ) sont indépendants
pour i 6= i0 puisque c’est un processus d’Itô, la propriété que ∆B (Jj ) =
Tj − Tj−1 est indépendant de ∆ (Jj 0 ) pour |j − j 0 | > 1 et enfin
B B B B B
2 X
E ∆ (Ii ) ∆B (Jj ) ∆A (Ii0 ) ∆B (Jj 0 ) |Π Kij Ki0 j 0
A
E c = E
i,j,i0 ,j 0
X
E ∆A (Ii ) ∆B (Jj ) ∆A (Ii0 ) ∆B (Jj 0 ) |Π Kij Ki0 j 0
= E
|i−i0 |≤1,|j 0 −j|≤1
= O nm4
14
Voici des histogrammes d’erreurs relatives de l’estimateur avec et sans présence
de bruit. Les cinq histogrammes ont été construits à partir de la même trajec-
toire d’actifs.
Fig. 8 – = 10
Fig. 9 – = 1
15
Fig. 10 – = 0.1
Fig. 11 – = 0.01
16
Fig. 12 – Sans bruit.
17
espérance variance
10 - 1.32 387
1 0.0392 0.196
0.1 0.02332 0.0992
0.01 0.02365 0.09794
0 0.02375 0.09785
3.3 Conclusion
Nous récapitulons ici les deux estimateurs proposés ainsi que leurs propriétés
statistiques.
18
4 Application au market impact
L’objectif de cette partie est d’illustrer un exemple d’utilisation des estima-
teurs haute-fréquence. La problématique est la suivante : un trader doit acheter
un certains nombre d’actifs d’ici la fin de la journée. Ce nombre d’actifs est
supposé assez grand pour que l’effet de microstructure se fasse sentir, c.à.d. tel
que le trader ait à payer plusieurs fois le bid-ask spread s’il voulait acheter tous
ses actifs immédiatement. Il est aussi supposé assez petit devant le nombre total
d’actifs en circulation pour ne pas influer sur la variation du vrai prix. On parle
de market impact temporaire (par opposition au market impact permanent, où
l’action du trader envoie un signal sur le marché qui entraı̂ne une variation si-
gnificative du cours de l’actif). Nous avons choisit de transposer les modèles
discrets de [1] et [3] en modèle continu.3
19
On intègre ensuite le second terme par partie pour obtenir :
Z T Z T
W = −[At (VT − Vt )]T0 + (VT − Vt )dAt + Vt0 · ηt (Vt0 )dt
t=0 t=0
Z T Z T
= A0 V + (V − Vt )dAt + Vt0 · ηt (Vt0 )dt
t=0 t=0
λσ 2
Vt00 = (Vt − V )
η
20
q
On a donc que Vt = V + V α sinh (ωt) + V β cosh (ωt) (avec ω = σ λη ) pour
certains coefficients α et β. Les conditions aux bords nous fournissent ensuite
α = cosh(ωT )
sinh(ωT ) et β = −1.
En fait, plus que la stratégie d’achat Vt , ce qui nous intéresse vraiment sont
les E(∆W ) et Var(∆W ) correspondants. Un rapide calcul intégral nous fournit
les égalités :
2
α2 − 1 α
2 2 α +1 2α
E(∆W ) = ηV ω sinh(2ωT ) − cosh(2ωT ) + T
4ω 4ω 4 2ω
2 2
2 2 α +1 2α 1−α α
Var(∆W ) = V σ sinh(2ωT ) − cosh(2ωT ) + T+
4ω 4ω 4 2ω
21
Fig. 14 – Graphe du nombre d’actifs qu’il nous reste à vendre avec λ faible.
Fig. 15 – Graphe du nombre d’actifs qu’il nous reste à vendre avec λ élevé.
22
4.2 Cas de la dimension 2
En dimension 2, on suppose qu’on possède deux actifs A et B. On utilisera
le vecteur Xt = (At , Bt ) de matrice de covariance Σ. On suppose que X vérifie :
dX = Σ · dWt
On suppose encore une fois les drifts négligeables. Chaque actif possède son
propre market-impact, qui ne dépend donc que de la liquidité de son marché, et
du nombre d’actifs que l’on souhaiterait acheter dans ce marché.
Ãt = At + η A Vt0A
B̃t = Bt + η B Vt0B
X̃t = X + η × Vt0
On se place tout de suite dans le cas linéaire pour éviter de trop alourdir les cal-
culs (qui restent néanmoins faisables !). Ce que nous cherchons est une stratégie
Vt qui minimise
J = E(∆W ) + λVar(∆W )
Z T
2 2
= η A Vt0A + η B Vt0B dt
t=0
Z T
2 2 2 2
V A − VtA σA + V B − VtB σB + 2 V A − VtA V B − VtB ρσ A σ B dt
+λ
t=0
23
“direction” δVt :
1
∂δVt J(Vt ) = lim J Ṽt − J (Vt )
h→0 h
Z T
2 η A Vt0A ft0 + η B Vt0B gt0 dt
=
t=0
Z T 2 2
V A − VtA ft σ A + V B − VtB gt σ B
+λ (−2) dt
t=0
Z T
V A − VtA gt ρσ A σ B + V B − VtB ft ρσ A σ B dt
+λ (−2)
t=0
=0
On effectue ensuite une intégration par partie pour obtenir, après regroupement
des termes en ft et en gt :
Z T 2
−η A Vt00A − 2λ σ A V A − VtA − λρσ A σ B V B − VtB ft dt+
0=
t=0
Z T 2
−η B Vt00B − 2λ σ B V B − VtB − λρσ A σ B V A − VtA gt dt
t=0
Ceci devant être vrai pour toutes les fonctions tests de H02 , on a donc que V
vérifie le système différentiel suivant :
2
η A Vt00A = −λ σ A V A − VtA − λρσ A σ B V B − VtB
2
η B Vt00B = −λ σ B V B − VtB − λρσ A σ B V A − VtA
Si on pose Yt = V − Vt , on a :
Yt00 = M · Y
24
Fig. 16 – Graphe du nombre d’actifs A et B qu’il nous reste à vendre avec des
volatilités et des liquidités semblables.
25
Fig. 18 – Graphe de stratégie de vente pour les mêmes actifs, avec et sans
corrélation. La corrélation augmentant la volatilité, la stratégie avec corrélation
à tendance à vouloir acheter plus vite.
26
4.3 Influence de ρ
Il nous reste à estimer l’erreur qu’on introduit dans notre stratégie en rem-
plaçant le ρ théorique dans la formule de la stratégie d’achat optimale par un des
deux estimateurs vus précédemment. Nous nous contentons d’étudier le surcoût
induit par le choix d’une mauvaise stratégie (lui-même causé par une mauvaise
mesure de ρ).
27
Fig. 21 – Graphe précédent au voisinage du minimum.
28
Références
[1] Almgren(R.), Chriss(N.), Optimal Execution of Portfolio Transactions, 2000
[2] Hayashi(T.), Yoshida(N.), On covariance estimation of non-synchronously
observed diffusion processes, 2005
[3] Lehalle(C.A.), Rigorous Optimisation of Intraday Trading, 2008
[4] Lunde(A.), Voev(V.), Integrated Covariance Estimation using High-
Frequency Data in the Presence of Noise, 2007
[5] Robert(C.), Rosenbaum(M.),Ultra high frequency volatility and co-volatility
estimation in a microstructure model with uncertainty zones, 2008
[6] Zhang(L.), A Tale of Two Time Scales : Determining Integrated Volatility
With Noisy High-Frequency Data, 2005
[7] Zhang(L.), Estimating Covariation : Epps Effect, Microstructure Noise, 2006
29