Sie sind auf Seite 1von 55

Pontificia Universidad Católica de Valparaı́so

Facultad de Ciencias Básicas y Matemáticas


Instituto de Matemáticas

Presión Topológica

Seminario para optar al grado de Licenciado en Matemáticas.

Enzo Abraham Fuentes Manrı́quez.

Profesor Guı́a: Carlos Vásquez.

Enero 2012.

(*) Parcialmente financiado por proyecto Fondecyt 1110040.


Introducción

En este seminario, el objeto de estudio será lo que se conoce como Presión Topológica,
estudiado principalmente del texto de P.Walters [?], lo cual estará dividido en 3 capı́tulos.
En el primer capı́tulo, veremos lo que conocemos como Entropı́a, término introducido en la
teorı́a ergódica por Kolmogorov en el año 1958 [?, ?], y éste ha sido, por lejos, el invariante
más exitoso hasta ahora. La noción de entropı́a que ahora se usa es ligeramente diferente
de la utilizada por Kolmogoorov, en donde la mejora fue hecha por Sinai en 1959 [?, ?]. La
definición de entropı́a de una transformación que preserva medida T de (X, A, µ) la daremos
en 3 etapas: la entropı́a de una sub-σ-álgebra finita de A, la entropı́a de la transformación T
relativa a una sub-σ-álgebra finita, y finalmente, la entropı́a de T .
En el segundo capı́tulo, se estudiará la entropı́a topológica, término introducido por Adler,
Konheim y McAndrew en 1965 [?] como un invariante de conjugación topológica. Más tarde,
Dinaburg [?] y Bowen [?] dan una nueva, pero equivalente definición, y esta definición llevó a
demostraciones de resultados que conectan entropı́a topológica y entropı́a de medida. Bowen
definió la entropı́a de una función uniformemente continua en un espacio métrico y esto lleva
a una demostración geométrica de la fórmula para la entropı́a topológica de un automorfismo
de un toro n-dimensional. En un primer lugar, daremos la definición de entropı́a topológica,
y en la segunda sección daremos la otra definición. Y finalmente, calcularemos la entropı́a
topológica de algunos ejemplos.
Por último, en el tercer capı́tulo estudiaremos la motivación de este seminario, lo que
se conoce como presión topológica. El concepto de presión fue introducida por Ruelle en
1973 [?] y estudiada en caso general por Walters en el año 1976 [?]. En esta teorı́a, ideas
provenientes de mecánica estadı́stica son usadas, además de tener aplicaciones importantes
en otros campos. Finalmente se puede ver el famoso Principio Variacional, el cual fue probado
para algunas transformaciones por Ruelle y después demostrado por Walters para todas las
transformaciones. La demostración dada en el seminario fue obra de M.Misiurewicz [?], y
otras demostraciones pueden estudiarse de los trabajos de M.Denker [?] y R.Bowen.
Índice
1. Entropı́a 4
1.1. Particiones y sub-álgebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Entropı́a de una partición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Entropı́a Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4. Entropı́a de una transformación que preserva medida . . . . . . . . . . . . . . 15
1.5. Propiedades de h(T, B) y h(T ) . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6. Algunos métodos para calcular h(T ) . . . . . . . . . . . . . . . . . . . . . . . 23
1.7. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2. Entropı́a Topológica 27
2.1. Definición a través de cubrimientos abiertos . . . . . . . . . . . . . . . . . . . 27
2.2. Definición de Bowen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3. Cálculo de entropı́a topológica . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3. Presión Topológica y su relación con Medidas Invariantes 39


3.1. Presión topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2. Propiedades de la presión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3. El Principio Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4. Presión determina M (X, T ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
1. Entropı́a

Sea X un conjunto. Una σ-álgebra de subconjuntos de X es una colección A de subcon-


juntos de X que satisface:
i) X ∈ A.
ii) Si A ∈ A, entonces X \ A ∈ A.
S∞
iii) Si An ∈ A, para n ≥ 1, entones n=1 An ∈ A.
Ası́, llamaremos al par (X, A) un espacio medible. P∞ finita en (X, A) es una
Una medida función
µ : A → R+ que satisface µ(∅) = 0 yµ( ∞ ∞ es una
S
A
n=1 n ) = n=1 µ(A n ), donde {A }
n 1
sucesión disjunta en A. Un espacio de medida finita es el trı́o (X, A, µ) donde (X, A) es un
espacio medible y µ es una medida finita en (X, A). Diremos que (X, A, µ) es un espacio
de probabilidad si µ(X) = 1. Supongamos que (X1 , A1 , µ1 ) y (X2 , A2 , µ2 ) son espacios de
probabilidad, diremos que la transformación T : X1 → X2 es medible si T −1 (A2 ) ⊂ A1 , y
diremos que la transformación T : X1 → X2 preserva medida si T es medible y µ1 (T −1 (A2 )) =
µ2 (A2 ), para todo A2 ∈ A2 . Además, diremos que la transformación T : X → X es ergódica
si los únicos elementos tal que T −1 A = A, satisfacen µ(A) = 0 o µ(A) = 1. Durante este
capı́tulo (X, A, µ) denotará un espacio de probabilidad.

1.1. Particiones y sub-álgebras


Definición 1.1. Una partición de (X, A, µ) es una familia de la forma:
( )
[
ξ = Ai ∈ A : Ai = X, Ai ∩ Aj = ∅ .
i∈I

Observación 1.1. 1. Nuestro interés va a estar puesto en particiones finitas, es decir,


familias de la forma:
n
( )
[
ξ = Ai ∈ A : Ai = X, Ai ∩ Aj = ∅ .
i=1

2. Si ξ es una partición finita de (X, A, µ), entonces


k
( )
[
A(ξ) = C ∈ A : C = Ai , Ai ∈ ξ, 1 ≤ k ≤ n
i=1
es un sub-σ-álgebra de A.
3. Recı́procamente, si C es una sub-σ-álgebra finita de A, digamos C = {Ci , i = 1 . . . n},
entonces
ξ(C) = {B1 ∩ . . . ∩ Bn : Bi = Ci ó Bi = Cic }
es una partición finita de (X, A, µ).
Definición 1.2. Sean ξ y η dos particiones finitas de (X, A, µ). Diremos que ξ ≤ η si todo
elemento de ξ es unión de elementos de η (i.e., η es un refinamiento de ξ). Ası́,
a) ξ ≤ η si y solamente si A(ξ) ⊆ A(η).
b) B ⊆ C si y solamente si ξ(B) ≤ ξ(C).
Definición 1.3. Sean ξ = {B1 , . . . , Bn }, η = {C1 , . . . , Ck } particiones finitas de (X, A, µ).
Definimos la partición ξ ∨ η por
ξ ∨ η = {Bi ∩ Cj , 1 ≤ i ≤ n, 1 ≤ j ≤ k} .
Si B y C son sub-σ-álgebras finitas de A, entonces B ∨ C = {Bi ∩ Cj : Bi ∈ B, Cj ∈ C} denota
la sub-σ-álgebra más pequeña de A que contiene a B y C. Por lo que tenemos
a) A(ξ ∨ η) = A(ξ) ∨ A(η)
b) ξ(B ∨ C) = ξ(B) ∨ ξ(C)
Definición 1.4. Sea T : X → X una transformación que preserva medida. Si ξ = {A1 , . . . , Ak }
es una partición finita de (X, A, µ), entonces
T −n ξ = T −n A1 , . . . , T −n Ak .


Si C es una sub-σ-álgebra de A, entonces


T −n C = T −n C : C ∈ C .


Si n ≥ 0, tenemos las siguientes propiedades:


a) ξ(T −n C) = T −n ξ(C).
b) A(T −n ξ) = T −n A(ξ).
c) T −n (B ∨ C) = T −n B ∨ T −n C.
d) T −n (ξ ∨ η) = T −n ξ ∨ T −n η.
e) Si ξ ≤ η, entonces T −n ξ ≤ T −n η.
f ) Si B ⊆ C, entonces T −n B ⊆ T −n C.
Definición 1.5. Si C, D son sub-σ-álgebras de A, decimos que C ⊂ D mod (0) si para todo
C ∈ C, existe D ∈ D tal que µ(D4C) = 0.
Observación 1.2. 1. Anotamos por C $ D cuando C ⊂ D mod (0) y D ⊂ C mod (0).
2. Si ξ, η son particiones finitas, entonces ξ $ η significa A(ξ) $ A(η).
3. Si C, D son sub-σ-álgebras finitas de A, C $ D y ξ(C) = {C1 , . . . , Cp , Cp+1 , . . . , Cq },
donde µ(Ci ) > 0, i = 1, . . . , p, µ(Ci ) = 0, i = p + 1, . . . , q, entonces
ξ(D) = {D1 , . . . , Dp , Dp+1 , . . . , Ds }
donde µ(Ci 4Di ) = 0, i = 1, . . . , p, µ(Di ) = 0, i = p + 1, . . . , s.
1.2. Entropı́a de una partición
A partir de ahora, la expresión 0 log(0) la consideraremos igual a 0. Sea ξ = {A1 , . . . , Ak }
partición de (X, A, µ), donde la probabilidad de que salga Ai , es µ(Ai ). Queremos describir el
número H(ξ) que nos dice la cantidad de incertidumbre sobre el resultado del experimento. Su-
pongamos que H(ξ) sólo depende de los números {µ(A1 ), . . . , µ(Ak )}. Sean ξ = {A1 , . . . , Ak }
y η = {B1 , . . . , Bl } dos particiones de (X, A, µ) y supongamos que queremos obtener H(ξ)
sabiendo H(η).
H(ξ) = H(µ(A1 ), . . . , µ(Ak )).
Si sabemos el resultado de que ocurra Bj , entonces

µ(Ai ∩ Bj )
µ(Ai /Bj ) = .
µ(Bj )

Ası́, la incertidumbre sobre el resultado de ξ dado Bj es


 
µ(A1 ∩ Bj ) µ(Ak ∩ Bj )
H ,..., .
µ(Bj ) µ(Bj )

Por lo tanto, la incertidumbre sobre el resultado de ξ dado η es


l  
X µ(A1 ∩ Bj ) µ(Ak ∩ Bj )
H(ξ/η) = µ(Bj )H ,..., .
µ(Bj ) µ(Bj )
j=1
n o
(p1 , . . . , pk ) ∈ Rk : pi ≥ 0, ki=1 pi = 1 .
P
Teorema 1.1. Sea 4k = Supongamos
H: ∞
S
k=1 4k → R tiene las siguientes propiedades:

a) H(p1 , . . . , pk ) ≥ 0, y H(p1 , . . . , pk ) = 0 si existe i tal que pi = 1.

b) Para cada k ≥ 1, H|4k es continua.

c) Para cada k ≥ 1, H|4k es simétrica.


1 1

d) Para cada k ≥ 1, H|4k tiene su mayor valor en k,..., k .

e) H(ξ ∨ η) = H(ξ) − H(η/ξ)

f ) H((p1 , . . . , pk , 0)) = H((p1 , . . . , pk )).


Pk
Entonces existe λ > 0 talque H(p1 , . . . , pk ) = −λ i=1 pi log(pi ).

Demostración. Consideremos la función U : N → R definida por U (k) = H(1/k, . . . , 1/k).


Comenzaremos probando que existe una constante λ > 0 tal que U (k) = λ log(k), para todo
k ∈ N. Ahora, por las hipótesis, tenemos

U (k) = H(1/k, . . . , 1/k, 0) ≤ H(1/(k + 1), . . . , 1/(k + 1)) = U (k + 1)


es decir, U es una función no decreciente. Afirmamos que para todo n, k ∈ N se cumple
U (k n ) = nU (k). Consideremos k experimentos independientes entre sı́ que tengan resulta-
dos equidistribuidos (1/k, . . . , 1/k). La distribución del experimento conjunto es entonces
(1/k n , . . . , 1/k n ), y ası́ tenemos

U (k n ) = H(1/k n , . . . , 1/k n )
Xn
= H(1/k, . . . 1/k)
i=1
= nH(1/k, . . . , 1/k)
= nU (k).

Tomemos en cuenta ahora dos enteros positivos arbitrarios m y k. Para cada n ∈ N, existe
0 0
un único k 0 = k 0 n ∈ N tal que mk < k n ≤ mk +1 . Observe que estas desigualdades implican

k0 log(k) k0 1
≤ ≤ +
n log(m) n n

y por lo tanto
k0 log(k)
lı́m = .
n→∞ n log(m)
Por otra parte, como U es monótona y tenemos que U (k n ) = nU (k), entonces

k 0 U (m) ≤ nU (k) ≤ (k 0 + 1)U (m)

por lo que tenemos


U (k) log(k) 1
U (m) − log(m) ≤ n .

U (k) U (m)
Tomando el lı́mite cuando n → ∞, tenemos que log(k) = log(m) . Como m y k son enteros positi-
vos arbitrarios, la expresión anterior es constante (y positiva), es decir, que existe λ > 0 tal que
P k ∈ N, como querı́amos probar. Fijemos ahora k P
U (k) = λ log(k), para todo números raciona-
les pi = qi /q tales que pi = 1. Queremos probar que H(p1 , . . . , pk ) = −λ ki=1 pi log(1/pi ).
Para ello, consideremos un experimento a k resultados Ai de probabilidad pi . Imaginemos
ahora otro experimento dependiente del primero consistente de q eventos B1 , . . . , Bq tales que
dichos eventos pueden ser distribuidos en k grupos conteniendo respectivamente q1 , . . . , qk ele-
mentos, y si el evento Ai tuvo lugar en el primer experimento, entonces en el segundo sólo
pueden ocurrir los eventos del i-ésimo grupo, cada uno con la misma probabilidad 1/qi . Las
condiciones impuestas determinan únicamente la entropı́a condicional:
k
X k
X k
X
H(P2 /P1 ) = pi H(1/qi , . . . , 1/qi )λ pi log(qi ) = λ pi log(pi ) + λ log(q).
i=1 i=1 i=1
Por otra parte, para i ∈ {1, . . . , k}, cada evento de la forma Ai ∩ Bj se produce con
probabilidad nula o igual a pi /qi = 1/q, y ésta última situación se produce exactamente en
qi ocasiones. Esto implica que H(P1 ∨ P2 ) = λ log(q), por lo que nos da
k
X
H(P1 ) + λ pi log(pi ) + λ log(q) = λ log(q)
i=1

y ası́
k
X
H(p1 , . . . , pk ) = −λ pi log(pi ).
i=1

Definición 1.6. Sea B sub-σ-álgebra finita


Pk de A tal que ξ(B) = {B1 , . . . , Bk }. La entropı́a
de B (o de ξ(B)) es H(B) = H(ξ) = − i=1 µ(Bi ) log(µ(Bi )).

Observación 1.3. 1. Si B = {X, ∅}, entonces H(B) = 0. En efecto,


2
X
H(B) = − µ(Bi ) log(µ(Bi ))
i=1
= −µ(X) log(µ(X)) − µ(∅) log(µ(∅))
= −1 log(1) − 0 log(0)
= 0.

1
2. Si ξ(B) = {B1 , . . . , Bk }, donde µ(Bi ) = k, para todo i = 1, . . . , k, entonces H(B) =
log(k). En efecto,
k k    
X X 1 1 k 1
H(B) = − µ(Bi ) log(µ(Bi )) = − log = − log = log(k).
k k k k
i=1 i=1

3. H(B) ≥ 0. En efecto, como (X, A, µ) es espacio de probabilidad,


P entonces 0 ≤ µ(Bi ) ≤ 1,
ası́ log(µ(Bi )) ≤ 0, entonces µ(Bi ) log(µ(Bi )) ≤ 0, luego − ki=1 µ(Bi ) log(µ(Bi )) ≥ 0.
Por lo tanto, H(B) ≥ 0.

4. Si B $ C, entonces H(B) = H(C).

5. Si T : X → X preserva medida, entonces H(T −1 B) = H(B). En efecto,


k
X k
X
−1 −1 −1
H(T B) = − µ(T Bi ) log(µ(T Bi )) = − µ(Bi ) log(µ(Bi )) = H(B).
i=1 i=1
Teorema 1.2. La función φ : [0, ∞) → R definida por

0 si x = 0
φ(x) =
x log(x) 6 0
si x =

es estrictamente convexa, i.e., si x, y ∈ [0, ∞) y α, β ≥ 0 tal que α + β = 1, entonces


φ(αx + βy) ≤ αφ(x) + βφ(y), y la igualdad P se da si x = y o, si α = 0 o bien β = 0.
Inductivamente, si xi ∈ [0, ∞), αi ≥ 0 tal que ki=1 αi = 1, entonces
k k
!
X X
φ αi xi ≤ αi φ(xi )
i=1 i=1

y la igualdad se da cuando xi = xj .

Demostración. Sea α, β > 0 fijos tal que α+β = 1. Sin pérdida de generalidad, supongamos
que y > x. Por el teorema de valor medio,

i) Existe z ∈ (αx + βy, y) tal que

φ(y) − φ(αx + βy) φ(y) − φ(αx + βy) φ(y) − φ(αx + βy)


φ0 (z) = = = .
y − αx − βy y − αx − (1 − α)y α(y − x)

Por lo tanto, φ(y) − φ(αx + βy) = αφ0 (z)(y − x).

ii) Existe w ∈ (x, αx + βy) tal que

φ(αx + βy) − φ(x) φ(αx + βy) − φ(x) φ(αx + βy) − φ(x)


φ0 (w) = = = .
αx + βy − x (1 − β)x + βy − x β(y − x)

Por lo tanto, φ(αx + βy) − φ(x) = βφ0 (w)(y − x).

Ahora, φ(x) = x log(x), φ0 (x) = log(x)+1, φ00 (x) = x1 . Como φ00 (x) > 0, para todo x ∈ (0, ∞),
entonces φ0 es creciente, ası́, si x < w < αx + βy < z < y, entonces φ0 (w) < φ0 (z). Luego,

β(φ(y) − φ(αxβy)) = φ0 (z)αβ(x − y) = φ0 (w)αβ(x − y) = α(φ(αxβy) − φ(x)).

Finalmente, se tiene

αφ(αx + βy) − αφ(x) < βφ(y) − β(αx + βy)


(α + β)φ(αx + βy) < αφ(x) + βφ(y)
φ(αx + βy) < αφ(x) + βφ(y).
Corolario 1.1. Si ξ = {A1 , . . . , Ak }, entonces H(ξ) ≤ log(k) y H(ξ) = log(k) si µ(Ai ) = k1 ,
para todo i = 1, . . . , k.
1
Demostración. Sea αi = k y xi = µ(Ai ) como en el teorema anterior, ası́

k k
!
X X 1
φ µ(Ai ) ≤ φ(µ(Ai )).
k
i=1 i=1

Aplicando la definición de φ tenemos


k k k
!
1X 1X 1X
µ(Ai ) log µ(Ai ) ≤ µ(Ai ) log(µ(Ai ))
k k k
i=1 i=1 i=1

k  
X 1
− µ(Ai ) log(µ(Ai )) ≤ − log
k
i=1

H(ξ) ≤ log(k).

1.3. Entropı́a Condicional


Definición 1.7. Sean B, C sub-σ-álgebras finitos de A y ξ(B) = {B1 , . . . , Bk }, ξ(C) =
{C1 , . . . , Cp }. La entropı́a de B dado C es el número
p k  
X X µ(Bi ∩ Cj )
µ(Bi ∩ Cj )
H(ξ(B)/ξ(C)) = H(B/C) = − µ(Cj ) log
µ(Cj ) µ(Cj )
j=1 j=1
 
X µ(Bi ∩ Cj )
=− µ(Bi ∩ Cj ) log
µ(Cj )
i,j

omitiendo los j-elementos donde µ(Cj ) = 0.

Observación 1.4. 1. Si N = {∅, X}, entonces H(B/N ) = H(B), ya que


  k
X µ(Bi ∩ Cj ) X
H(B/N ) = − µ(Bi ∩ Cj ) log =− µ(Bi ) log(µ(Bi )) = H(B).
µ(Cj )
i,j i=1

2. H(B, C) ≥ 0.

3. Si B $ D, entonces H(B/C) = H(D/C).

4. Si C $ D, entonces H(B/C) = H(B/D).


Teorema 1.3. Sea (X, A, µ) un espacio de probabilidad. Si B, C y D son sub-σ-álgebras finitas
de A, entonces
a) H(B ∨ C/D) = H(B/D) + H(C/B ∨ D).

b) H(B ∨ C) = H(B) + H(C/B).

c) Si B ⊆ C, entonces H(B/D) ≤ H(C/D).

d) Si B ⊆ C, entonces H(B) ≤ H(C).

e) Si C ⊆ D, entonces H(B/C) ≥ H(B/D).

f ) H(B) ≥ H(B/D).

g) H(B ∨ C/D) ≤ H(B/D) + H(C/D).

h) H(B ∨ C) ≤ H(B) + H(C).

i) Si T preserva medida, entonces H(T −1 B/T −1 C) = H(B/C).

j) H(T −1 B) = H(B).
Demostración. Sean ξ(B) = {Bi }, ξ(C) = {Cj }, ξ(D) = {Dk }.
 
P µ(Bi ∩Cj ∩Dk )
a) H(B ∨ C/D) = − i,j,k µ(Bi ∩ Cj ∩ Dk ) log µ(Dk ) , pero

µ(Bi ∩ Cj ∩ Dk ) µ(Bi ∩ Cj ∩ Dk ) µ(Bi ∩ Dk )


=
µ(Dk ) µ(Bi ∩ Dk ) µ(Dk )
a menos que µ(Bi ∩ Dk ) = 0, entonces

 
X µ(Ai ∩ Dk )
H(B ∨ C/D) = − µ(Ai ∩ Cj ∩ Dk ) log
µ(Dk )
i,j,k
 
X µ(Ai ∩ Cj ∩ Dk )
=− µ(Ai ∩ Cj ∩ Dk ) log
µ(Ai ∩ Dk )
i,j,k
 
X µ(Ai ∩ Dk )
=− µ(Ai ∩ Dk ) log + H(C/B ∨ D)
µ(Dk )
i,k

= H(B/D) + H(C/B ∨ D).

b) Sea D = {X, ∅}, entonces

H(B ∨ C) = H(B ∨ C/D) = H(B/D) + H(C/B ∨ D) = H(B) + H(C/B).

c) Por a) tenemos que

H(C ∨ D) = H(B ∨ C/D) = H(B/D) + H(C/B ∨ D) ≥ H(B/D).


d) Sea D = {X, ∅}, entonces

H(C) = H(C/D) ≥ H(B/D) = H(B).

µ(Dk ∩Cj ) µ(Bi ∩Dk )


e) Fijemos i, j y sea αk = µ(Cj ) , xk = µ(Dk ) . Por teorema anterior, tenemos
!
X X
φ αk xk ≤ αk φ(xk ),
k k
!
X µ(Dk ∩ Cj ) µ(Bi ∩ Dk ) X µ(Dk ∩ Cj )  µ(Bi ∩ Dk ) 
φ ≤ φ .
µ(Cj ) µ(Dk ) µ(Cj ) µ(Dk )
k k

Pero C ⊆ D, luego
!  
X µ(Dk ) µ(Bi ∩ Dk ) X µ(Dk ) µ(Bi ∩ Dk ) µ(Bi ∩ Dk )
φ ≤ log ,
µ(Cj ) µ(Dk ) µ(Cj ) µ(Dk ) µ(Dk )
k k
!  
1 X X µ(Bi ∩ Dk ) µ(Bi ∩ Dk )
φ µ(Bi ∩ Dk ) ≤ log .
µ(Cj ) µ(Cj ) µ(Dk )
k k
P
Pero k µ(Bi ∩ Dk ) = µ(Bi ∩ Dj ), por lo tanto
   
µ(Ai ∩ Cj ) 1 X µ(Bi ∩ Dk )
φ ≤ µ(Bi ∩ Dk ) log ,
µ(Cj ) µ(Cj ) µ(Dk )
k
   
µ(Bi ∩ Cj ) µ(Bi ∩ Cj ) 1 X µ(Bi ∩ Dk )
log ≤ µ(Bi ∩ Dk ) log .
µ(Cj ) µ(Cj ) µ(Cj ) µ(Dk )
k

Multiplicando por µ(Cj ) y haciendo la suma sobre i y j, finalmente tenemos


  X  
X µ(Bi ∩ Cj ) µ(Bi ∩ Dk )
µ(Bi ∩ Cj ) log ≤ µ(Bi ∩ Dk ) log ,
µ(Cj ) µ(Dk )
i,j i,k

−H(B/C) ≤ −H(B/D),
H(B/D) ≤ H(B/C).

f) Sea C = {X, ∅}, ası́, C ⊆ D, y por e) tenemos H(B/D) ≤ H(B/C) = H(B).

g) Por a), sabemos que H(B ∨ C/D) = H(B/D) + H(C/B ∨ D), pero D ⊆ B ∨ D, entonces
H(C/B ∨ D) ≤ H(C/D), por lo tanto H(B ∨ C/D) ≤ H(B/D) + H(C/D).

h) Sea D = {X, ∅}, luego

H(B ∨ C) = H(B ∨ C/D) ≤ H(B/D) + H(C/D) = H(B) + H(C).


i) Si T preserva medida, entonces

µ(T −1 Bi ∩ T −1 Cj )
X  
−1 −1 −1 −1
H(T B/T C) = − µ(T Bi ∩ T Cj ) log
µ(T −1 Cj )
i,j
µ(T −1 (Bi ∩ Cj ))
X  
−1
=− µ(T (Bi ∩ Cj )) log
µ(T −1 Cj )
i,j
 
X µ(Bi ∩ Cj )
=− µ(Bi ∩ Cj ) log
µ(Cj )
i,j

= H(B/C).

j) Como T preserva medida


k
X k
X
H(T −1 B) = − µ(T −1 Bi ) log(µ(T −1 Bi )) = − µ(Bi ) log(µ(Bi )) = H(B).
i=1 i=1

Teorema 1.4. Sean B, C sub-σ-álgebras finitas de A, entonces

a) H(B/C) = 0 (i.e., H(B ∨ C) = H(C)) si y solamente si B ⊂ C mod (0).

b) H(B/C) = H(B) (i.e., H(B∨C) = H(B)+H(C)) si y solamente si B y C son independientes


(i.e., µ(B ∩ C) = µ(B)µ(C), B ∈ B, C ∈ C).

Demostración. Sean ξ(B) = {B1 , . . . , Bk ) y ξ(C) = {C1 , . . . , Cp }. Supongamos que µ(Bi ) 6=


0 y µ(Cj ) 6= 0.

a) Supongamos que B ⊂ C mod (0), entonces µ(Bi ∩ Cj ) = µ(Cj ), o bien, µ(Bi ∩ Cj ) = 0.


Ası́,

• Si µ(Bi ∩ Cj ) = µ(Cj ), entonces


   
X µ(Bi ∩ Cj ) X µ(Cj )
H(B/C) = − µ(Bi ∩ Cj ) log =− µ(Cj ) log = 0.
µ(Cj ) µ(Cj )
i,j i,j

• Si µ(Bi ∩ Cj ) = 0, entonces
 
X µ(Bi ∩ Cj ) X
H(B/C) = − µ(Bi ∩ Cj ) log =− 0 log(0) = 0.
µ(Cj )
i,j i,j

Ahora supongamos que H(B/C) = 0, entonces


 
X µ(Bi ∩ Cj )
− µ(Bi ∩ Cj ) log = 0.
µ(Cj )
i,j
Pero como  
µ(Bi ∩ Cj )
−µ(Bi ∩ Cj ) log ≥0
µ(Cj )
para todo i, j, entonces
 
µ(Bi ∩ Cj )
µ(Bi ∩ Cj ) log = 0,
µ(Cj )
 
µ(Bi ∩Cj )
para todo i, j. Luego, µ(Bi ∩ Cj ) = 0 o log µ(Cj ) = 0, y ası́ µ(Bi ∩ Cj ) = 0 o
µ(Bi ∩ Cj ) = µ(Cj ). Por lo tanto, B ⊂ C mod (0).

b) Supongamos que B y C son independientes, entonces


 
X µ(Bi ∩ Cj )
H(B/C) = − µ(Bi ∩ Cj ) log
µ(Cj )
i,j
 
X µ(Bi )µ(Cj )
=− µ(Bi )µ(Cj ) log
µ(Cj )
i,j
X
=− µ(Bi )µ(Cj ) log(µ(Bi ))
i,j
k
X p
X
=− µ(Bi ) log(µ(Bi )) µ(Cj )
i=1 j=1

= H(B).

Ahora supongamos que H(B/C) = H(B), entonces


p
k X   k
X µ(Bi ∩ Cj ) X
− µ(Bi ∩ Cj ) log =− µ(Bi ) log(µ(Bi )).
µ(Cj )
i=1 j=1 i=1

µ(Bi ∩ Cj )
Fijando i y aplicando el Teorema 1.2, con αj = µ(Cj ) y xj = , entonces
µ(Cj )
 
p p  
X µ(Bi ∩ C j ) ≤
X µ(B i ∩ C j )
φ µ(Cj ) µ(Cj )φ .
µ(Cj ) µ(Cj )
j=1 j=1

Aplicando la definición de φ tenemos


 
p p p  
X X X µ(B i ∩ C j ) µ(B i ∩ C j )
µ(Bi ∩ Cj ) log  µ(Bi ∩ Cj ) ≤ µ(Cj ) log
µ(Cj ) µ(Cj )
j=1 j=1 j=1

p  
X µ(Bi ∩ Cj )
− µ(Bi ∩ Cj ) log ≤ −µ(Bi ) log(µ(Bi ))
µ(Cj )
j=1
µ(Bi ∩ Cj ) µ(Bi ∩ Cj )
y se tiene la igualdad cuando no depende de j. Dado esto, sea ai = ,
µ(Cj ) µ(Cj )
entonces ai µ(Cj ) = µ(Bi ∩ Cj ). Ası́,
p  
X µ(Bi ∩ Cj )
− µ(Bi ∩ Cj ) log = −µ(Bi ) log(µ(Bi ))
µ(Cj )
j=1

p  
X ai µ(Cj )
ai µ(Cj ) log = µ(Bi ) log(µ(Bi ))
µ(Cj )
j=1
p
X
ai log(ai ) µ(Cj ) = µ(Bi ) log(µ(Bi ))
j=1

ai log(ai ) = µ(Bi ) log(µ(Bi )).


Por lo tanto, ai = µ(Bi ), finalmente, µ(Bi ∩ Cj ) = µ(Bi )µ(Cj ), pero es para todo i, j,
luego, µ(A ∩ C) = µ(A)µ(C).

1.4. Entropı́a de una transformación que preserva medida


Recordemos que si ξ(B) = {B1 , . . . , Bk }, entonces
k
X
H(ξ(B)) = H(B) = − µ(Bi ) log(µ(Bi )).
i=1

La segunda etapa de la definición de la entropı́a de una transformación que preserva me-


dida
W T es dadaporWla siguiente definición. Recordemos que los elementos de la partición
n−1 −i n−1 −i Tn−1 −i
ξ i=0 T (B) = i=0 T ξ(B) son todos los conjuntos de la forma i=0 T (Bji ).

Definición 1.8. Supongamos T : X → X es una transformación que preserva medida del


espacio de probabilidad (X, A, µ). Si B es una sub-σ-álgebra de A, entonces
n−1
!
1 _
h(T, ξ(B)) = h(T, B) = lı́m H T −i (B)
n→∞ n
i=0

es llamada la entropı́a de T con respecto a B.

Esto significa
Wn−1 −ique si pensamos en una aplicación de T como un pasaje de un dı́a de tiempo,
entonces i=0 T (B) representa la experiencia combinada de realizar el experimento original,
representado por B, en n dı́as consecutivos. Entonces h(T, B) es la media de información por
dı́a que uno obtiene de realizar el experimento original para siempre.
Observación 1.5. h(T, B) ≥ 0.

Ahora podemos dar la última etapa de la definición de la entropı́a de una transformación


que preserva medida.

Definición 1.9. Sea T : X → X una transformación que preserva medida del espacio de
probabilidad (X, A, µ), entonces h(T ) = sup h(T, B), donde el supremo se toma sobre todas
las sub-σ-álgebras finitas B de A, es llamada la entropı́a de T . Equivalentemente, h(T ) =
sup h(T, ξ), donde el supremo se toma sobre todas las particiones finitas de (X, A, µ).

Si pensamos, como lo hicimos anteriormente, en una aplicación de T como un pasaje de


un dı́a de tiempo, entonces h(T ) es la media de información máxima por dia que se obtiene
realizando el mismo experimento diariamente.

Observación 1.6. 1. 0 ≤ h(T ) ≤ +∞.

2. h(Id = 0. Si h(T ) = 0, entonces h(T, B) = 0, para todo B, lo que implica que


Wn−1X ) −i
i=0 T (B) no cambia mucho si n → ∞.

3. Si el logaritmo es usado en otra base, entonces la entropia de una transformación


se multiplica por una constante dependiendo solamente de la base empleada. Algunos
autores usan logaritmo en base 2.

Ahora, vamos a demostrar la existencia del lı́mite de la Definición 1.9. Lo haremos de 2


formas, la primera, usa un resultado simple de sucesiones de números reales y también puede
ser aplicado para probar el resultado correspondiente para entropı́a topológica, mientras que
la segunda forma usa propiedades de entropı́a condicional pero da un resultado más fuerte.

Teorema 1.5. Si {an }n≥1 es una sucesión de números reales tal que an+p ≤ an + ap , para
todo n, p ∈ N, entonces lı́mn→∞ ann existe y es igual a ı́nf ann . (El lı́mite puede ser −∞ pero
si {an } es acotada inferiormente entonces el lı́mite será no-negativo.)

Demostración. Fijemos p > 0. Cada n > 0 puede ser escrito n = kp + i, con 0 ≤ i < p.
Entonces
an akp+i ai akp ai kap ai ap
= ≤ + ≤ + = + .
n kp + i kp kp kp kp kp p
ap ap ap
Si n → ∞, entonces k → ∞, ası́ lı́m ann ≤ p , y por lo tanto lı́m ann ≤ ı́nf p , pero ı́nf p ≤
lı́m ann , luego
an an
lı́m = ı́nf .
n→∞ n n

Corolario 1.2. Sea T : X → X es una transformación


! que preserva medida y B una sub-σ-
n−1
1 _
álgebra finita de A, entonces lı́m H T −i (B) existe.
n→∞ n
i=0
n−1
!
_
Demostración. Sea an = H T −i (B) ≥ 0. Entonces
i=0
n+p−1
!
_
−i
an+p = H T (B)
i=0
n−1 n+p−1
! !
_ _
≤H T −i (B) +H T −i (B) por Teorema 1.3, parte h
i=0 i=n
p−1
!
_
= an + H T −i (B) por Teorema 1.3, parte j
i=0
= an + ap .
Entonces aplicando el Teorema 1.5, se obtiene el resultado.

Teorema 1.6. Sea T : X → WX es una transformación


 que preserva medida y B un sub-σ-
1 n−1 −i
álgebra de A, entonces n H i=0 T (B) decrece a h(T, B).

Demostración. Primero demostraremos por inducción que


n−1 n−1 j
! !
_ X _
−i −i
H T (B) = H(B) + H B/ T B .
i=0 j=1 i=1

Para n = 1 es claro. Ahora, si asumimos verdadero para n = p, también se da para n = p + 1,


ya que
p p
! !
_ _
H T −i (B) = H T −i (B) ∨ B
i=0 i=1
p p
! !
_ _
=H T −i (B) +H B/ T −i (B)
i=1 i=1
p−1 p
! !
_ _
=H T −i (B) +H B/ T −i (B)
i=0 i=1
p j
!
X _
−i
= H(B) + H B/ T (B) .
j=1 i=1

Por lo tanto,
Wn−1 la−i
fórmula se da para n ∈ N. A partir de esto y por el Teorema 1.3, tenemos
Wntodo−i
que H( i=0 T (B)) ≥ nH(A/ i=1 T (B)), ası́
n n−1 n
! ! !!
_ _ _
−i −i −i
nH T B =n H T B + H B/ T B
i=0 i=0 i=1
n−1
!
_
≤ (n + 1)H T −i B .
i=0
Luego
n n−1
! !
1 _
−i 1 _
−i
H T (B) ≤ H T B .
n+1 n
i=0 i=0

Definición 1.10. Sean (X1 , A1 , µ1 ), (X2 , A2 , µ2 ) espacios de probabilidad, y T1 : X1 → X1 ,


T2 : X2 → X2 transformaciones que preservan medida. Decimos que T1 es isomorfa a T2
si existen M1 ∈ A1 , M2 ∈ A2 con µ1 (M1 ) = µ2 (M2 ) = 1 y existe φ : M1 → M2
transformación que preserva medida invariante tal que T1 ◦ φ = φ ◦ T2 .

Definición 1.11. T1 se dice conjugada a T2 si existe Φ : (Ã2 , µ˜2 ) → (Ã1 , µ˜1 ) isomorfismo
de álgebras de medida tal que Φ ◦ T2˜−1 = T1˜−1 ◦ Φ.

Teorema 1.7. Entropı́a es un invariante por conjugación, esto es, si T1 es conjugada a T2 ,


entonces h(T1 ) = h(T2 ).

Demostración. Sean T1 : X1 → X1 , T2 : X2 → X2 transformaciones que preservan medida, y


sea φ : (Ã2 , µ˜2 ) → (Ã1 , µ˜1 ) un isomorfismo de álgebras medibles tal que φ◦T2−1 = T1−1 ◦φ. Sea
B2 finito, B2 ⊂ A2 , y ξ(B2 ) = {B1 , . . . , Br }. Escojamos Ai ∈ A1 talque ÃiT= φ(Ãi ), ası́ η =
n−1 −i
{A1 , . . . , Ar } forma una partición de (X , A1 , µ1 ). Sea B1 = B(η). Ahora, i=0
T1n−1 T1 Aqi , qi ∈
{1, . . . , r}, tiene la misma medida que i=0 T2−i Bqi , ya que

n−1 n−1
! !
\ \
φ (T2−i Aqi )˜ =φ T̃2−i Ãqi
i=0 i=0
n−1
\
= T̃1−i φ(Ãqi )
i=0
n−1
\
= T̃1−i B̃qi
i=0
\
= (T1−i Bqi )˜.

Entonces, H( n−1 −i
W Wn−1 −i
i=0 T1 B1 ) = H( i=0 T2 B2 ), lo cual implica que h(T1 , B1 ) = h(T2 , B2 ),
y ası́ h(T1 ) ≥ h(T2 ). Por simetrı́a, tenemos que h(T1 ) = h(T2 ).

La demostración del Teorema 1.7 también muestra que si T2 es un factor de T1 (o una


imagen semi-conjugada ) entonces h(T2 ) ≤ h(T1 ). Después de desarrollar algunas propiedades
de h(T, B) y h(T ), consideraremos el problema de cómo calcular h(T ). Estos cálculos y el
Teorema 1.7 nos permitirá dar ejemplos de transformaciones que preservan medida no-
conjugadas.
1.5. Propiedades de h(T, B) y h(T )
Recordemos que
n−1
!
_
−i
h(T, B) = lı́m H T B .
n→∞
i=0

Teorema 1.8. Sean B, C son sub-álgebras de A y T una transformación del espacio de


probabilidad (X, A, µ). Entonces

a) h(T, B) ≤ H(B).

b) h(T, B ∨ C) ≤ h(T, B) + h(T, C).

c) B ⊆ C ⇒ h(T, B) ≤ h(T, C).

d) h(T, B) ≤ h(T, C) + H(B/C).

e) h(T, T −1 B) = h(T, B).

f ) Si k ≥ 1, entonces
k−1
!
_
−i
h(T, B) = h T, T B .
i=0

g) Si k ≥ 1 y T es invertible, entonces
k
!
_
h(T, B) = h T, T iB .
i=−k

Demostración. a)
n−1
!
1 _
−i
h(T, B) = lı́m H T B
n→∞ n
i=0
n−1
1 X
≤ lı́m H(T −i B) (por Teorema 1.3)
n→∞ n
i=0
n−1
1 X
= lı́m H(B) (por Teorema 1.3, parte j)
n→∞ n
i=0
= H(B).
b)
n−1
!
1 _
h(T, B ∨ C) = lı́m H T −i (B ∨ C)
n→∞ n
i=0
n−1 n−1
!
1 _ _
= lı́m H T −i B ∨ T −i C
n→∞ n
i=0 i=0
n−1 n−1
! !
1 _
−i 1 _
−i
≤ lı́m H T B + lı́m H T C (por Teorema 1.3, parte h)
n→∞ n n→∞ n
i=0 i=0
= h(T, B) + h(T, C).
Wn−1 Wn−1
c) Si B ⊆ C, entonces i=0 T −i B ⊆ i=0 T −i C, con n ≥ 1. Ahora,
n−1
!
1 _
−i
h(T, B) = lı́m H T B
n→∞ n
i=0
n−1
!
1 _
≤ lı́m H T −i C (por Teorema 1.3, parte d)
n→∞ n
i=0
= h(T, C).
Wn−1 W  W 
n−1 −i n−1 −i
d) Sabemos que i=0 T −i B ⊆ i=0 T B ∨ i=0 T C , entonces
n−1
!
1 _
h(T, B) = lı́m H T −i B
n→∞ n
i=0
n−1 n−1
! !!
1 _
−i
_
−i
≤ lı́m H T B ∨ T C (por Teorema 1.3, parte d)
n→∞ n
i=0 i=0
n−1 n−1 n−1
! ! !!
1 _ 1 _ _
= lı́m H T −i C + lı́m H T −i B / T −i C ,
n→∞ n n→∞ n
i=0 i=0 i=0

donde la última igualdad se obtiene por la parte b del Teorema 1.3. Pero por Teorema
1.3, parte g
n−1
! n−1
!! n−1  
n−1

_ _ X _
H T −i B / T −i C ≤ H T −i B/  T −j C 
i=0 i=0 i=0 j=0
n−1
X
≤ H(T −i B/T −i C) (por Teorema 1.3, parte e)
i=0
n−1
X
= H(B/C) (por Teorema 1.3, parte i)
i=0
= nH(B/C).
Ası́,
n−1 n−1 n−1
! ! !!
1 _ 1 _ _
h(T, B) ≤ lı́m H T −i C + lı́m H T −i B / T −i C
n→∞ n n→∞ n
i=0 i=0 i=0
≤ h(T, C) + H(B/C).

e)
n−1
!
1 _
h(T, T −1 B) = lı́m H T −i T −1 B
n→∞ n
i=0
n
!
1 _
= lı́m H T −i B
n→∞ n
i=1
n−1
!
1 _
−i
= lı́m H T B (por Teorema 1.3, parte j)
n→∞ n
i=0
= h(T, B).

f)
 !
k n−1 k
!
_ 1  _ _
h T, T −i B = lı́m H T −j T −i B 
n→∞ n
i=0 j=0 i=0
k+n−1
!
1 _
−i
= lı́m H T B
n→∞ n
i=0
k+n−1
  !
k+n−1 1 _
= lı́m H T −i B
n→∞ n k+n−1
i=0
= h(T, B).

g) Por la parte (e) y (f) tenemos


k 2k
! !
_ _
h T, T −i B = h T, T −i B = h(T, B).
i=−k i=0

Gracias al Teorema 1.8, podemos deducir simples propiedades de h(T ).

Teorema 1.9. Sea T una transformación que preserva medida del espacio de probabilidad
(X, A, µ).

a) Para k > 0, h(T k ) = k · h(T ).


b) Si T es invertible, entonces h(T k ) = |k| · h(T ), para todo k ∈ Z.
Demostración. a) Primero demostraremos que h(T k , k−1 −i
W
i=0 T B) = kh(T, B) si k > 0.
 !
k−1 k−1 k−1
_ 1 _ _
h(T k , T −i B) = lı́m H  T −kj T −i B 
n→∞ n
i=0 j=0 i=0
nk−1
!
k _
−i
= lı́m H T B
n→∞ nk
i=0
= k · h(T, B).
Ası́,
k−1
!
_
k −i
k · h(T ) = k · sup h(T, B) = sup h T , T B ≤ sup h(T k , C) = h(T k ).
B B i=0 C

Además,
k−1
!
_
h(T k , B) ≤ h T k , T −i B = k · h(T, B),
i=0

y ası́, tomando supremo, tenemos h(T k ) ≤ k · h(T ). Por lo tanto, h(T k ) = k · h(T ).
b) Es suficiente demostrar que h(T −1 ) = h(T ), lo que equivale a mostrar que h(T −1 , B) =
h(T, B), para todo B finito. Pero
n−1 n−1 n−1
! ! !
_ _ _
i −(n−1) i −i
H T B =H T T B =H T B .
i=0 i=0 i=0

Vamos a obtener más información en cómo se comporta h(T ) relativamente a operaciones


naturales en transformaciones, cuando probemos algunos resultados que harán este cálculo
más simple. El siguiente resultado nos permitirá entender cuando h(T, B) es cero, y permi-
tirnos concluir que una transformación que preserva medida no invertible T , la cual no es
mod 0 invertible (i.e., T −1 6= B) obligadamente tiene entropı́a positiva (estricta).
Teorema 1.10. Sea B una sub-σ-álgebra finita de A y T una transformación que preserva
medida del espacio de probabilidad (X, A, µ), entonces
n ∞
! !
_ _
h(T, B) = lı́m H B/ T −i B = H B/ T −i B
n→∞
i=1 i=0

Demostración. El lı́mite existe dado que el lado derecho no es cada vez mayor en n por el
Teorema 1.3, parte e. Ahora, por la demostración del Teorema 1.6 que para n ≥ 1, tenemos
n−1 n−1 j
! !
_ X _
H T −i B = H(B) + H B/ T −i B .
i=0 j=1 i=1
Diviendo por n y tomando lı́mite, obtenemos
n−1 n−1 j
! !
1 _ 1 1X _
lı́m H T −i B = lı́m H(B) + lı́m H B/ T −i B
n→∞ n n→∞ n n→∞ n
i=0 j=1 i=1


!
_
h(T, B) = H B/ T −i B
i=0

donde la parte derecha de la igualdad se da debido al lı́mite de Cesaro.

Corolario 1.3. Sea T una transformación que preserva medida del espacio de probabilidad
W∞A, µ)
(X,
−i
y sea B una sub-álgebra finita de A. Entonces h(T, B) = 0 si y solamente si B ⊂
i=1 T B mod (0).

1.6. Algunos métodos para calcular h(T )


Es difı́cil calcular h(T ) de su definición ya que uno necesitarı́a calcular h(T, B), para toda
sub-álgebra finita B. Vamos a considerar que condiciones en una sub-álgebra B son necesarias
para asegurar h(T ) = h(T, B) (y ası́ simplificar el cálculo de h(T )), y también considerar
condiciones en una sucesión Bn de sub-álgebras implicarán h(T ) = lı́mn→∞ h(T, Bn ). Estos
resultados llevan a los métodos de calcular h(T ) para ejemplos especı́ficos de transformaciones
que preservan medida, y también nos llevan a demostrar algunas propiedades de h(T ).

Lema 1.1. Sea r ≥ 1 un entero fijo. Para todo ε > 0, existe δ > 0, tal que si ξ =
{B1 , . . . , Br }, η = {C1 , . . . , Cr } son dos particiones de (X, A, µ) de r conjuntos, con
r
X
µ(Ai 4C1 ) < δ
i=1

, entonces H(ξ/η) + H(η/ξ) < ε.

Demostración. Sea ε > 0, elijamos δ > 0 tal que δ < 41 y −r(r − 1)δ
Srlog(δ) − (1 − δ) log(1 −
ε
los conjuntos Bi ∩ Cj (i 6= j), y i=1 (Bi ∩ Ci ). Entonces
δ) < 2 . Sea ζ la partición en S
ξ ∨ η = η ∨ ζ y como Bi ∩ Cj ⊂ rn=1 (An 4Cn ) (i 6= j), tenemos que µ(Bi ∩ Cj ) < δ(i 6= j) y
r
!
[
µ (Bi ∩ Cj ) > 1 − δ.
i=1

Luego, H(ζ) < r(r − 1)δ log(δ) − (1 − δ) log(1 − δ) < 2ε . Por lo tanto H(η) + H(ε/η) =
H(ξ ∨ η) = H(η ∨ ζ) ≤ H(η) + H(ζ) < H(η) + 2ε , y ası́, H(ξ/η) < 2ε . Por simetrı́a, también
tenemos que H(η/ξ) < 2ε .

Teorema 1.11. Sea (X, A, µ) un espacio de probabilidad y B una álgebra tal que la σ-álgebra
generada por B (denotada por A(B)) satisface A(B) = A. Sea C una sub-álgebra finita de A.
Entonces para todo ε > 0, existe una álgebra finita D, D ⊆ B tal que H(D/C) + H(C/D) < ε.
Demostración. Sea ξ(C) = {C1 , . . . , Cr }. Sea ε > 0 y elijamos δ igual al del Lema 1.1. Es
suficiente demostrar que para cada σ > 0, podemos encontrar una partición {D1 , . . . , Dr }
con Di ∈ B y µ(Ci 4Di ) < σ, para cada i. Para hacer esto, elijamos λ > 0 tal que
λ(r − 1)[1 + r(r − 1)] < σ, y para cada i elijamos Bi ∈ B tal que µ(Ci 4Bi )S< λ. Si i 6= j,
entonces Bi ∩ Bj ⊂ (Bi 4Ci ) ∪ (Bj 4Cj ), ası́ µ(Bi ∩ Bj ) < 2λ. Sea N = i6=j (Bi ∩ Bj ).
Entonces S tenemos µ(N ) < r(r − 1)λ. Sea Di = Bi \ N , para 1 ≤ i < r y
Dr = X \ r−1 i=1 Di . Con esto, {Di , . . . , Dr } es una partición de X y cada Di ∈ B. Si i < r,
entonces Di 4Ci ⊂ (Bi 4Ci ) ∪ N y ası́,

µ(Di 4Ci ) < λ[1 + r(r − 1)] < σ.


Sr−1
Sin embargo, Dr 4Cr ⊂ i=1 (Di 4Ci ), y por lo tanto

µ(Dr 4Cr ) < (r − 1)λ[1 + r(r − 1)] < σ.

W
Si {Bn } es una sucesión de sub-σ-álgebras
S de A, entonces n Bn denotará la sub-σ-álgebra
de A generada por {Bn }. Vamos a usar n Bn para denotar la colección de conjuntos S que
pertenecen a algún Bn . Si {Bn }∞
n=1 es una sucesión creciente de sub-σ-álgebras entonces n Bn
es una álgebra, pero no necesariamente una σ-álgebra.
Corolario 1.4. Si {Bn } es una W sucesión creciente de sub-álgebras finitos de A y C es un
sub-álgebra finito tal que C ⊂ n Bn , entonces H(C/Bn ) → 0, cuando n → ∞.
Demostración. Sea B0 = ∞
S
j=1 Bj , entonces B0 es un álgebra y C ⊂ A(B0 ) mod (0) por
hipótesis. Sea ε > 0. Por Teorema 1.11, existe un sub-álgebra finito Dε de B0 tal que
H(C/Dε ) < ε. Pero Dε ⊆ Aj0 , para algún j0 , dado que Dε es finito. Si j ≥ j0 , el
Teorema 1.3, parte e, nos dice que H(C/Aj ) ≤ H(C/Aj0 ) ≤ H(C/Dε ) < ε.

Teorema 1.12 (Kolmogorov-Sinai). Sea T una transformación que preserva medida


invertible
W∞ del espacio de probabilidad (X, A, µ) y sea B una sub-álgebra finita de A tal que
T n B $ A. Entonces h(T ) = h(T, B).
n=−∞

Demostración. Sea C ⊆ A finito. Queremos demostrar que h(T, C) ≤ h(T, B). Para n ≥ 1,
n n
! !
_ _
h(T, C) ≤ h T, T i B + H C/ T i B (por Teorema 1.8, parte d)
i=−n i=−n
n
!
_
= h(T, B) + H C/ T −i B (por Teorema 1.8, parte g).
i=−n

Sea Bn = ni=−n T i B. Es suficiente mostrar que H(C/Bn ) → 0 cuando n → ∞. Esto sigue


W
por el Corolario 1.4.

Teorema 1.13. Sea T una transformación que preserva medida (no necesariamente in-
vertible) del espacio de probabilidad (X, A, µ) y si B es un sub-álgebra finito de A tal que
W ∞ −i
i=0 T B $ A, entonces h(T ) = h(T, B).
Wn−1
Demostración.
Wn La demostración es similar a la del Teorema anterior usando i=0 T −i B en
−i
lugar de i=−n T B, y el Teorema 1.8, parte f.

Corolario 1.5. Si T esWuna transformación que preserva medida invertible del espacio de
probabilidad (X, A, µ) y ∞ −i
i=0 T B $ A, para algún sub-álgebra finito B, entonces h(T ) = 0.

Demostración. Por Teorema 1.13,


n
!
_
h(T ) = h(T, B) = lı́m H B/ T −i B
n→∞
i=1

Teorema 1.10. Pero ∞


W −i −1 A $ A. Sea B =
Wn −i
por
W∞ i=1 T B $ T n i=1 T B, entonces B1 ⊂ B2 ⊂ ···
y n=1 Bn $ A. Por Corolario 1.4 tenemos H(B/Bn ) → 0, y ası́ h(T ) = 0.

1.7. Ejemplos
Ahora calcularemos la entropı́a de algunos ejemplos.

1. Si Id : (X, A, µ) → (X, A, µ) es la identidad, entonces h(I) = 0. Esto es ya que


h(I, B) = lı́m n1 H(B) = 0. Además, si T p = I, para algún p 6= 0, entonces h(T ) = 0.
Esto sigue de que 0 = h(I) = h(T p ) = |p|h(T ) por Teorema 1.9. En particular, cualquier
transformación que preserva medida en un espacio finito tiene entropı́a cero.

2.

Teorema 1.14. Toda rotación T (z) = az del cı́rculo unitario S1 , tiene entropı́a cero.

Demostración. Caso 1: Supongamos que {an : n ∈ Z} no es denso, i.e., a es una raı́z


de la unidad. Ası́, ap = 1, para algún p 6= 0, y T p (z) = ap z = z, por lo tanto h(T ) = 0.
Caso 2: Supongamos que {an : n ∈ Z} es denso en S1 . Entonces {an /n < 0} es denso en
S1 . Sea ξ = {A1 , A2 }, donde A1 es el semicı́rculo superior [1, −1) y A2 es el semicı́rculo
inferior [−1, 1). Para n > 0, T −n ξ consiste de semicı́rculos queWcomienzan en a−n y
−a−n . Como {a−n /n >W0} es denso, todo semicı́rculo pertenece a ∞ n=0 T
−n A(ξ). Luego,
∞ ∞
todo arco pertenece a n=0 T −n A(ξ). Ası́, A = n=0 T −n A(ξ), y por el Corolario 1.5,
W
concluı́mos que h(T ) = 0.

3.

Definición 1.12. Sea k ≥ 2 un entero fijo y seaP(p0 , . . . , pk−1 ) un vector de probabilidad


con entradas distintas de cero (i.e., pi > 0 y k−1 Y
i=0 pi = 1). Sea (Y, 2 , µ) el espacio
Q∞medidaYdonde Y = {0, 1, . . . , k − 1} y el punto i tiene medida pi . Sea (X, A, µ) =
de
−∞ (Y, 2 , µ). Definamos T ({xn }) = {yn }, donde yn = xn+1 . Si P denota la semi-
álgebra de todos los rectángulos medibles, entonces µ(T −1 A) = µ(A), para todo A ∈ P.
Llamaremos a T el (p0 , . . . , pk−1 )-shift bidireccional.

Teorema 1.15. El (p0 , . . . , pk−1 )-shift bidireccional tiene entropı́a − k−1


P
i=0 pi log(pi ).
Demostración. Sea Y = {0, . . . , k − 1}, X = ∞
Q
−∞ Y , y sea T : X → X el shift. Sea
Ai = {{xk } : x0 = i}, 0 ≤ i ≤ k − 1. Entonces ξ = {A0 , . . . , Ak−1 } es una partición de
X.
W∞Por notación, B := A(ξ). Por la definición del σ-álgebra producto A, tenemos que
i
i=−∞ T B = A. Por el Teorema de Kolmogorov-Sinai,

1
h(T ) = lı́m H(B ∨ T −1 B ∨ · · · ∨ T −(n−1) B).
n→∞ n
Un elemento de n−1 −i −1 A ∩···∩T −(n−1) A
W
i=0 T ξ es de la forma Ai0 ∩T i1 in−1 = {{xn }/x0 =
i0 , x1 = i1 , . . . , xn−1 = in−1 }, el cual tiene medida pi0 · pi1 · . . . · pin−1 . Luego
X
H(B ∨ T −1 B ∨ · · ·T −(n−1) B) = − (pi0 · . . . · pin−1 ) log(pi0 · . . . · pin−1 )
k−1
X
=− (pi0 · . . . · pin−1 )[log(pi0 ) + · · · + log(pin−1 )]
i0 ,...,in−1 =0
k−1
X
= −n pi log(pi ).
i=0

k−1
X
Por lo tanto, h(T ) = h(T, B) = − pi log(pi ).
i=0
2. Entropı́a Topológica

2.1. Definición a través de cubrimientos abiertos


Sea X un espacio topológico compacto. Estaremos interesados en cubrimientos abiertos
de X los cuales denotaremos por α, β, . . ., etc.

Definición 2.1. Sean α, β cubrimientos abiertos de X, definimos α ∨ β por

α ∨ β := {A ∩ B : A ∈ α, B ∈ β}.

De manera análoga definimos ni=1 αi , donde {αi } son cubrimientos abiertos de X.


W

Definición 2.2. Sean α, β cubrimientos abiertos de X. Diremos que β es un refinamiento de


α si para todo B ∈ β, existe A ∈ α tal que B ⊆ A, y lo notaremos por α < β.

De la definición, claramente tenemos α < α ∨ β, para todo α, β cubrimientos abiertos de


X. Además, si β es un subcubrimiento de α, entonces α < β.

Definición 2.3. Si α es un cubrimiento abierto de X y T : X → X es continua, entonces se


define el cubrimiento abierto
T −1 α = {T −1 A : A ∈ α}.
Además denotaremos n−1 −i −1 α ∨ . . . ∨ T −(n−1) α.
W
i=0 T α = α ∨ T

De la definición, fácilmente podemos ver que:

• T −1 (α ∨ β) = T −1 α ∨ T −1 β .
 

• Si α < β, entonces T −1 α < T −1 β.

Definición 2.4. Si α es un cubrimiento abierto de X, sea N (α) el número de conjuntos


en un subcubrimiento finito de α con cardinalidad mı́nima. Definimos la entropı́a de α por
H(α) = log(N (α)).

Observación 2.1. 1. H(α) ≥ 0.

2. H(α) = 0 si y solamente si N (α) = 1 si y solamente si X ∈ α.

3. Si α < β, entonces H(α) ≤ H(β).

Demostración. Sea {B1 , . . . , BN (β) } un subcubrimiento de β con cardinalidad


mı́nima. Como α < β, para cada i, existe Ai ∈ α tal que Bi ⊆ Ai . Por lo tanto,
{A1 , . . . , AN (β) } cubre a X y es un subcubrimiento de α. Luego N (α) ≤ N (β), y ası́,
H(α) ≤ H(β).
4. H(α ∨ β) ≤ H(α) + H(β).

Demostración. Sea {A1 , . . . , AN (α) } un subcubrimiento de α con cardinalidad mı́ni-


ma,y {B1 , . . . , BN (β) } un subcubrimiento de α con cardinalidad mı́nima, entonces

{Ai ∩ Bj : 1 ≤ i ≤ N (α), 1 ≤ j ≤ N (β)}

es un subcubrimiento de α ∨ β, luego N (α ∨ β) ≤ N (α)N (β), y ası́,


H(α ∨ β) ≤ H(α) + (β).

5. Si T : X → X es una aplicación continua, entonces H(T −1 α) ≤ H(α). Si T es además


sobreyectiva, entonces H(T −1 α) = H(α).

Demostración. Si {A1 , . . . , AN (α) } es un subcubrimiento finito de α con cardina-


lidad mı́nima, entonces {T −1 A1 , . . . , T −1 AN (α) } es un subcubrimiento de T −1 α, ası́
N (T −1 α) ≤ N (α). Si T es sobreyectiva y {T −1 A1 , . . . , T −1 AN (T −1 α) } es un subcubri-
miento de T −1 α con cardinalidad mı́nima, entonces {A1 , . . . , AN (T −1 α) } es un subcu-
brimiento de α, por lo tanto, N (α) ≤ N (T −1 α), y ası́, H(α) = H(T −1 α).

Teorema 2.1. Si α es unWcubrimiento abierto de X y T : X → X es una aplicación continua,


entonces lı́mn→∞ (1/n)H( n−1 −i
i=0 T α) existe.

Demostración. Si definimos
n−1
!
_
an = H T −i α
i=0
entonces por Teorema 1.5 es suficiente demostrar que an+k ≤ an + ak , para todo k, n ≤ 1.
Tenemos
n+k−1
!
_
an+k = H T −i α
i=0
 
n−1 k−1
!
_ _
≤H T −i α + H T −n T −j α , por Observación 2.1, parte 4
i=0 j=0

≤ an + ak

esta última desigualdad por Observación 2.1, parte 5. Entonces, por Teorema 1.5 tenemos
n−1
!
an 1 _
que lı́m = lı́m H T −i α existe.
n→∞ n n→∞ n
i=0

Definición 2.5. Si α es un cubrimiento abierto de X y T : X → X es una aplicación continua,


entonces la entropı́a de T relativa a α se define por
n−1
!
1 _
h(T, α) = lı́m H T −i α .
n→∞ n
i=0
Observación 2.2. 1. Por Observación 2.1, parte 1 se obtiene que h(T, α) ≥ 0.
2. Si α < β, entonces h(T, α) ≤ h(T, β).
Wn−1 −i Wn−1 −i
Demostración.W Si α < β, entonces i=0 T α < i=0 T β, luego por Oservación
1.3 tenemos H( n−1 −i α) ≤ H( i = 0n−1 T −i β). Luego, h(T, α) ≤ h(T, β).
W
i=0 T

Notar que si β es un subcubrimiento finito de α, entonces α < β, ası́, h(T, α) ≤ h(T, β).
3. h(T, α) ≤ H(α).

Demostración. Por Observación 2.1, parte 4 tenemos


n−1
! n−1
_ X
−i
H T α ≤ H(T −i α)
i=0 i=0
≤ nH(α)
debido a Observación 2.1, parte 5 Dividiendo por n y haciendo tender n a ∞, tenemos
h(T, α) ≤ H(α).
Definición 2.6. Si T : X → X es continuo, la entropı́a topológica de T se define por
h(T ) = sup h(T, α)
α
donde el supremo está sobre todos los cubrimientos abiertos de X.
Observación 2.3. 1. h(T ) ≥ 0.
2. h(I) = 0, donde I es la aplicación identidad de X.
3. Si Y es un subconjunto cerrado de X y T (Y) = Y, entonces h(T |Y ) ≤ h(T ).
Teorema 2.2. Si X1 , X2 son espacios compactos y Ti : Xi → Xi son aplicaciones continuas,
para i = 1, 2, y si φ : X1 → X2 es una aplicación continua tal que φX1 = X2 y φT1 = T2 φ,
entonces h(T1 ) ≥ h(T2 ). Si φ es un homeomorfismo, entonces h(T1 ) = h(T2 ).
Demostración. Sea α un cubrimiento abierto de X2 . Entonces
n−1
!
1 _
h(T2 , α) = lı́m H T2−i α
n→∞ n
i=0
n−1
!
1 −1
_
−i
= lı́m H φ T2 α por Observación 2.1, parte 5
n→∞ n
i=0
n−1
!
1 _
= lı́m H φ−1 T2−i α
n→∞ n
i=0
n−1
!
1 _
−i −1
= lı́m H T1 φ α
n→∞ n
i=0
−1
= h(T1 , φ α).
Luego h(T2 ) = supα h(T2 , α) = supα h(T1 , φ−1 α) ≤ h(T1 ). Si φ es un homeomorfismo,
entonces φ−1 T2 = T1 φ−1 , entonces de manera análoga, tenemos h(T1 ) ≤ h(T2 ).

Teorema 2.3. Si T : X → X es un homeomorfismo del espacio compacto X, entonces


h(T ) = h(T −1 ).

Demostración.
n−1
!
1 _
−i
h(T, α) = lı́m H T α
n→∞ n
i=0
n−1
!!
1 _
= lı́m H T n−1 T −i α por Observación 2.1, parte 5
n→∞ n
i=0
n−1
!
1 _
−i
= lı́m H T α
n→∞ n
i=0
= h(T −1 α).

Por lo tanto, h(T ) = h(T −1 ).

2.2. Definición de Bowen


En esta sección, (X, d) denotará un espacio métrico, no necesariamente compacto. La
bola abierta centrada en x de radio r será denotada por B(x, r), y la bola cerrada por
B(x, r). El espacio de todas las aplicaciones uniformemente continuos del espacio métrico
(X, d) será denotado por U C(X, d). En el transcurso de esta sección T será un elemento
de U C(X, d). Si n es un número natural podemos definir una nueva métrica dn en X por
dn (x, y) = máx0≤i≤n−1 d(T i x, T i y). La bola
Tn−1abierta centrada en x de radio r en la métrica dn
es Bdn (x, r) = {y ∈ X : dn (x, y) < r} = i=0 T −i B(T i x, r).

Definición 2.7. Sea n un número natural, ε > 0 y K un subconjunto compacto de X. Un


subconjunto F de X se dice (n, ε)-generador para K con respecto a T si para todo x ∈ K,
existe y ∈ F tal que dn (x, y) ≤ ε, es decir,

[ n−1
\
K⊂ T −i B(T i y, ε).
y∈F i=0

Definición 2.8. Sea n un número natural, ε > 0 y K un subconjunto compacto de X,


denotaremos por rn (ε, K) la cardinalidad mı́nima de cualquier conjunto (n, ε) generador para
K con respecto a T . (Si fuera necesario enfatizar T , anotaremos rn (ε, K, T ).)

Observación 2.4. 1. Claramente rn (ε, K) < ∞, yaTque la compacidad de K implica que


n−1 −i
el cubrimiento de K por los conjuntos abiertos i=0 T B(T i x, ε), x ∈ X tiene un
subcubrimiento finito.

2. Si ε1 < ε2 , entonces rn (ε1 , K) ≥ rn (ε2 , K).


Demostración. Sea F un conjunto (n, ε1 ) generador para K de cardinalidad rn (ε1 , K),
o sea, para todo x ∈ K, existe y ∈ F tal que dn (x, y) ≤ ε1 , pero ε1 < ε2 , entonces
dn (x, y) ≤ ε2 , por lo tanto, rn (ε1 , K) ≥ rn (ε2 , K), ya que eventualmente puedo encon-
trar un conjunto (n, ε2 ) de cardinalidad mı́nima. (Esto razonamiento se aplicará regu-
larmente durante el capı́tulo.)

Definición 2.9. Sea ε > 0 y K es un subconjunto compacto de X. Definimos el número


r(ε, K, T ) = lı́m supn→∞ (1/n) log(rn (ε, K)). Escribiremos r(ε, K, T, d) si queremos enfatizar
la métrica d.

Observación 2.5. 1. Por Observación 2.4, parte 2, si ε1 < ε2 , entonces r(ε1 , K, T ) ≥


r(ε2 , K, T ).

2. r(ε, K, T ) puede ser ∞.

Definición 2.10. Sea K un subconjunto compacto de X, y sea h(T, K) = lı́mε→0 r(ε, K, T ).


La entropı́a topológica de T es h(T ) = supK h(T, K), donde el supremo está tomado sobre
la colección de todos los subconjuntos compactos de X. En algunas ocasiones escribiremos
hd (T ).

Antes de dar alguna interpretación a la definición, daremos la definición para conjuntos


separados, que en algunos casos va a ser más útil para las demostraciones.

Definición 2.11. Sea n un número natural, ε > 0 y K un subconjunto compacto de X.


Un subconjunto E de K es (n, ε)-separado con respecto a T si x, y ∈ E, x 6= y, implica
Tn−1
dn (x, y) < ε, es decir, para x ∈ E, el conjunto i=0 T −i B(T i x, ε) no contiene otro punto de
E.

Definición 2.12. Sea n un número natural, ε > 0 y K un subconjunto compacto de X,


denotaremos por sn (ε, K) la cardinalidad máxima de cualquier conjunto (n, ε) separado para
K con respecto a T . (Si fuera necesario enfatizar T , anotaremos sn (ε, K, T ).)

Observación 2.6. 1. Tenemos que rn (ε, K) ≤ sn (ε, K) ≤ rn (ε/2, K), y ası́, sn (ε, K) <
∞.

Demostración. Si E es un conjunto (n, ε) separado de K de cardinalidad máxima,


entonces E es un conjunto (n, ε) generador de K. En efecto, supongamos que E no es
un conjunto (n, ε) generador para K, es decir, existe x ∈ K tal que para todo y ∈ E,
dn (x, y) > ε, si definimos E 0 = E ∪ {x}, E 0 es un conjunto (n, ε) separado para K de
cardinalidad sn (ε, K) + 1, contradicción. Por lo tanto, rn (ε, K) ≤ sn (ε, K).
Sea E un subconjunto (n, ε) separado de K y F un conjunto (n, ε/2) generador para
K. Definamos φ : E → F eligiendo, para cada x ∈ E, algún punto φ(x) ∈ F con
dn (x, φ(x) ≤ ε/2, esto porque F es un conjunto (n, ε/2) generador para K, y E ⊆ K.
Entonces φ es inyectiva y por lo tanto sn (ε, K) ≤ rn (ε/2, K).

2. Si ε1 < ε2 , entonces sn (ε1 , K) ≥ sn (ε2 , K). La demostración es análoga a la Observa-


ción 2.4, parte 2.
Definición 2.13. Sea ε > 0 y K es un subconjunto compacto de X. Definimos el número
s(ε, K, T ) = lı́m supn→∞ (1/n) log(sn (ε, K)). Escribiremos s(ε, K, T, d) si queremos enfatizar
la métrica d.
Observación 2.7. 1. Por Observación 2.5, parte 1, tenemos que r(ε, K, T ) ≤ s(ε, K, T ) ≤
r(ε/2, K, T ).
2. Si ε1 < ε2 , entonces s(ε1 , K, T ) ≥ s(ε2 , K, T ).
3. Tenemos que h(T, K) = lı́mε→0 s(ε, K, T ), por la parte 1, y ası́, h(T ) = supk lı́mε0 s(ε, K, T ).
Luego, h(T ) puede ser definido con conjuntos generadores o conjuntos separados.
4. Si T es una isometrı́a de (X, d), entonces claramente dn = d para todo n, ası́,
sn (ε, K) = s1 (ε, K) y hd (T ) = 0.
A partir de ahora, veremos que la definición de entropı́a que vimos en la Sección 2.1 y la
que hemos visto en esta sección coinciden en espacios métricos compactos.
Definición 2.14. Dos métricas d y d0 en X son uniformemente equivalentes si

id. : (X, d) → (X, d0 ) y id. : (X, d0 ) → (X, d)

son uniformemente continuas.


En este caso, T ∈ U C(X, d) si y solamente si T ∈ U C(X, d).
Teorema 2.4. Si d y d0 son uniformemente equivalentes y T ∈ U C(X, d), entonces
hd (T ) = hd0 (T ).
Demostración. Sea ε1 > 0. Escojamos ε2 > 0 tal que d0 (x, y) < ε2 implique d(x, y) < ε1 ,
y ε3 > 0 tal que d(x, y) < ε3 implique d0 (x, y) < ε2 . Sea K un conjunto compacto, en-
tonces rn (ε1 , K, d) ≤ rn (ε2 , K, d0 ) y rn (ε2 , K, d0 ) ≤ rn (ε3 , K, d). Luego, r(ε1 , K, T, d) ≤
r(ε2 , K, T, d0 ) ≤ r(ε3 , K, T, d). Si ε1 → 0, entonces ε2 → 0 y ε3 → 0, y ası́, tenemos
hd (T ) = hd0 (T ).

Si X es un espacio compacto, además si d y d0 son métricas equivalentes, entonces son


uniformemente equivalentes, por lo tanto, si X es un espacio compacto metrizable, entonces
h(T ) no depende de la métrica elegida en X.
Teorema 2.5. Sea (X, d) un espacio métrico y T ∈ U C(X, d). Si K ⊂ K1 ∪ . . . ∪ Km , donde
K, K1 , . . . , Km ⊆ X compactos, entonces h(T, K) ≤ máx1≤i≤m h(T, Ki ).
Demostración. Claramente tenemos que sn (ε, K) ≤ sn (ε, K1 ) . . . + sn (ε, Km ). Fijemos
ε > 0, para cada n escojamos Ki(n,ε) tal que sn (ε, Ki(n,ε) ) = máxj sn (ε, K), entonces sn (ε, K) ≤
m · sn (ε, Ki(n,ε) ) y ası́ log(sn (ε, K)) ≤ log(m) + log(sn (ε, Ki(n,ε) )). Escogiendo nj → ∞ tal
que
1 1
log(snj (ε, K)) → lı́m sup log(sn (ε, K))
nj n→∞ n

y tal que Ki(nj ,ε) no depende de j. Por lo tanto, s(ε, K, T ) ≤ s(ε, Ki(ε) , T ). Escojamos εq → 0
tal que Ki(εq ) es constante, digamos Ki0 , entonces h(T, K) ≤ h(T, Ki0 ) ≤ máxj h(T, Kj ).
Corolario 2.1. Sea (X, d) un espacio métrico y T ∈ U C(X, d). Sea δ > 0. Para calcular hd (T )
es suficiente tomar el supremo de h(T, K) sobre conjuntos compacto de diámetro menor que
δ.
Demostración. Si K es compacto, puede S ser cubierto con unaScantidad finita de bolas
B1 , . . . , Bm de diámetro δ/2, o sea, K ⊂ m B
i=1 i , entonces K ⊂ m
B
i=1 i ∩ K. Es claro que
h(T, K ∩ Bi ) ≤ h(T, K), para todo i. Por Teorema 2.5, k(T, K) ≤ máx h(T, K ∩ Bi ), por lo
tanto, h(T, K) = máxi h(T, K ∩ Bi ).
Corolario 2.2. Si X es un espacio compacto metrizable y d es una métrica cualquiera,
entonces h(T ) = hd (T ) = h(T, X).
Ahora definiremos unos previos sobre el número de Lebegue y homeomorfismos expansi-
vos.
Teorema 2.6 (Lema del Cubrimiento de Lebesgue). Sea (X, d) un espacio métrico
compacto y α un cubrimiento abierto de X, entonces existe δ > 0 tal que para cada subconjunto
de X de diámetro menor o igual a δ, está contenido en algún miembro de α. Tal δ es llamado
número de Lebesgue para α.
Definición 2.15. Sea X un espacio compacto metrizable y T : X → X un homeomorfismo. Un
cubrimiento abierto finito α de X
T∞es un generador para T si para toda bisucesión {An }∞
−∞
de miembros de α, el conjunto T −n A contiene a lo más un punto de X. Si esta
T n=−∞−n n
condición es reemplazada por ∞ n=−∞ T An contiene a lo más un punto de X, entonces α
es llamado un generador débil.
Definición 2.16. Un homeomorfismo T de un espacio métrico compacto (X, d) es llamado
expansivo si existe δ > 0 con la propiedad de que si x 6= y, entonces existe n ∈ Z con
d(T n x, T n y) > δ. Llamaremos a δ una constante de expansividad para T .
Teorema 2.7. Sea T un homeomorfismo del espacio métrico compacto (X, d). Entonces son
equivalentes
a) T es un homeomorfismo expansivo.
b) T tiene un generador.
c) T tiene un generador débil.
Teorema 2.8. Sea T : X → X un homeomorfismo del espacio métrico compacto (X, d). Sea
α unW generador para T . Entonces para todo ε > 0, existe N > 0 tal que para cada conjunto
en N −N T −n α tiene diámetro menor que ε. Recı́procamente, para todo N > 0, existe ε > 0

tal que d(x, y) < ε implica


N
_
x, y ∈ T −n An
−N
para algún A−N , . . . , AN ∈ α.
Llamaremos h∗ (T ) y h∗ (T, α) los números definidos en la Sección 2.1 usando cubrimien-
tos abiertos. En un espacio métrico (X, d) definimos el diámetro de un cubrimiento como
diam (α) = supA∈α diam (A).
Teorema 2.9. Sea (X, d) un espacio métrico compacto. Si {αn }∞
1 es una sucesión de cubri-
mientos de X, con diam (α) → 0, entonces

a) Si h∗ (T ) < ∞, lı́mn→∞ h∗ (T, αn ) existe y es igual a h∗ (T ).

b) Si h∗ (T ) = ∞, lı́mn→∞ h∗ (T, αn ) = ∞.

Demostración. a) Sea h∗ (T ) < ∞. Sea ε > 0 y escojamos un cubrimiento abierto γ tal que
h∗ (T, γ) > h∗ (T ) − ε. Sea δ un número de Lebesgue para γ, y escojamos N tal que para
n ≥ N , diam (αn ) < δ. Sea A ∈ αn , entonces diam (A) < δ, por lo tanto, existe B ∈ γ
tal que A ⊆ B, ası́, γ < αn , por lo tanto, h∗ (T, γ) ≤ h∗ (T, αn ). Luego,

h∗ (T ) ≥ h∗ (T, αn ) ≥ h∗ (T, γ) > h∗ (T ) − ε

Ası́, lı́mn→0 (T, αn ) = h∗ (T ).

b) Si h∗ (T ) = ∞, sea a > 0 y escojemos γ cubrimiento abierto tal que h∗ (T, γ) > a, y de


manera análoga a la demostración anterior, lı́mn→0 h∗ (T, αn ) = ∞.

Corolario 2.3. De lo anterior, tenemos h∗ (T ) = lı́mδ→0 {sup h∗ (T, α) : diam (α) < δ}.

Teorema 2.10. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d).

a) Si α es un cubrimiento abierto de X con número de Lebesgue δ, entonces


n−1
!
_
−i
N T α ≤ rn (δ/2, X) ≤ sn (δ/2, X).
i=0

b) Si ε > 0 y γ es un cubrimiento abierto con diam (γ) ≤ ε, entonces


n−1
!
_
−i
rn (ε, X) ≤ sn (ε, X) ≤ N T γ .
i=0

Demostración. Sabemos por Observación 2.6, parte 1 que rn (ε, X) ≤ sn (ε, X), para todo
ε > 0.

a) Sea F un conjunto (n, δ/2) generador para X de cardinalidad rn (δ/2, T ). Entonces

[ n−1
\
X= T −i B(T i x, δ/2)
x∈F i=0

y como para cada i, B(T i x, δ/2) es subconjunto de un miembro de α, tenemos que


n−1
!
_
N T −i α ≤ rn (δ/2, X) ≤ sn (δ/2, X).
i=0
b) Sea E un conjunto (n, ε) separado de cardinalidad sn (ε, X). Ningún miembro del cubri-
Wn−1
miento i=0 T −i γ puede contener dos elementos de E, ası́
n−1
!
_
−i
rn (ε, X) ≤ sn (ε, X) ≤ N T γ .
i=0

Corolario 2.4. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d).
Sea ε > 0. Sea αε el cubrimiento de X de todas las bolas abiertas de radio 2ε y sea γε el
cubrimiento de X de todas las bolas abiertas de radio ε/2. Entonces
n−1 n−1
! !
_ _
N T −i αε ≤ rn (ε, X) ≤ sn (ε, X) ≤ N T −i γε .
i=0 i=0

Teorema 2.11. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d),
entonces h(T ) = h∗ (T ), es decir, las dos definiciones de entropı́a topológica coinciden.

Demostración. Sea ε > 0 y αε , γε son como en el Corolario 2.4, entonces h∗ (T, αε ) ≤


r(ε, X, T ) ≤ s(ε, X, T ) ≤ h∗ (T, γε ). Si ponemos ε = 1/n y n → ∞, los dos términos extremos
convergen a h∗ (T ) y los términos del medio convergen a h(T ).

Teorema 2.12. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d),
entonces
1 1
h(T ) = lı́m lı́m inf log(rn (ε, X)) = lı́m lı́m inf log(sn (ε, K)).
ε→0 n→0 n ε→0 n→∞ n

Demostración. Del Corolario 2.4 se sigue que


1 1
h∗ (T, αε ) ≤ lı́m inf log(rn (ε, K)) ≤ lı́m inf log(sn (ε, K)) ≤ h∗ (T, γε ).
n→∞ n n→∞ n

Poniendo ε = 1/k, haciendo k → ∞ y aplicando Teorema 2.9 se obtiene la fórmula.

Teorema 2.13. a) Sea (X, d) un espacio métrico, T ∈ U C(X, d) y m > 0, entonces hd (T m ) =


m · hd (T ).

b) Sea (Xi , di ), i = 1, 2, un espacio métrico y Ti ∈ U C(Xi , di ). Definamos una métrica d en


X1 × X2 dada por d((x1 , x2 ), (y1 , y2 )) = máx{d1 (x1 , y1 ), d2 (x2 , y2 )}. Entonces T1 × T2 ∈
U C(X1 × X2 , d) y hd (T1 × T2 ) ≤ hd1 (T1 ) + hd2 (T2 ). Si X1 o bien X2 es compacto, entonces
hd (T1 × T2 ) = hd1 (T1 ) + hd2 (T2 ).

Demostración. a) Sea F un conjunto (mn, k)-generador para K de cardinalidad mı́nima.


O sea, para todo x ∈ K, existe y ∈ F tal que dmn (x, y) ≤ ε, entonces

máx {d((T m )i x, (T m )i y)} ≤ dmn (x, y) ≤ ε.


0≤i≤n−1
Por lo tanto, F es un conjunto rn (ε, K, T m ) generador para K, luego, rn (ε, K, T m ) ≤
rmn (ε, K, T ), ası́
1 m
log(rn (ε, K, T m )) ≤ log(rmn (ε, K, T ))
n mn
y por lo tanto hd (T m ) ≤ m · hd (T ). Ahora, sea F un conjunto (n, δ)-generador para K
con respecto a T m de cardinalidad mı́nima, como T es uniformemente continua, para todo
ε > 0, existe δ(ε) > 0 tal que d(x, y) < δ implica máx0≤j≤m−1 {d(T j x, T j y)} < ε, es decir,
B(x, δ) ⊆ BT (x, ε, m). Ası́ tenemos
n−1
\ n−1
\
BT m (x, δ(ε), n) = T −im B(T im , δ(ε)) ⊂ T −im BT (T im x, ε, m) = BT (x, ε, mn).
i=0 i=0

Entonces, rmn (ε, K, T ) ≤ rn (δ, K, T m ) y ası́, m · h(T ) ≤ h(T m ). Para mayor detalle de la
demostración, ver [?].

b) Sea Ki ⊆ Xi compacto. Si Fi es un conjunto (n, ε) generador para Ki de cardinalidad


mı́nima con respecto a Ti , entonces F1 × F2 es un conjunto (n, ε) generador para K1 × K2
con respecto a T1 × T2 . Luego rn (ε, K1 × K2 , T1 × T2 ) ≤ rn (ε, K1 , T1 ) · rn (ε, K2 , T2 ), y ası́,
hd (T1 × T2 , K1 × K2 ) ≤ hd1 (K1 , T1 ) + hd2 (K2 , T2 ). Sea Πi : X1 × X2 → Xi la aplicación
proyección. Si K ⊆ X1 × X2 es compacto, entonces K1 = Π1 (K) y K2 = Π2 (K) son
compactos y K ⊆ K1 × K2 . Luego hd (T1 × T2 , K) ≤ hd (T1 × T2 , K1 × K2 ). Por lo tanto

hd (T1 × T2 ) = sup hd (T1 × T2 , K)


K⊆X1 ×X2
≤ sup hd (T1 × T2 , K1 × K2 )
K1 ⊆X1
K2 ⊆X2
≤ sup hd1 (T1 , K1 ) + sup hd2 (T2 , K2 )
K1 ⊆X1 K2 ⊆X2
= hd1 (T1 ) + hd2 (T2 ).

Ahora supongamos que X1 es compacto (la demostración cuando X2 es compacto es análo-


ga). Como todo subconjunto copacto de X1 ×X2 es un subconjunto de X1 ×K2 , para algún
K2 compacto, entonces hd (T1 × T2 ) = sup{hd (T1 × T2 , X1 × X2 ) : K2 ⊆ X2 compacto}. Sea
K2 ⊆ X2 compacto y δ > 0, si E1 es un conjunto (n, δ)-separado de X1 y E2 es un conjunto
(n, δ)-separado de K2 , entonces E1 × E2 es un conjunto (n, δ)-separado de X1 × K2 , por
lo tanto sn (δ, X1 × K2 , T1 × T2 ) ≥ sn (δ, X1 , T1 ) · sn (δ, K2 , T2 ), y ası́
1
s(δ, X1 × K2 , T1 × T2 ) ≥ lı́m sup [log(sn (δ, X1 , T1 )) + log(sn (δ, K2 , T2 ))]
n→∞ n
1 1
≥ lı́m inf log(sn (δ, X1 , T1 )) + lı́m sup log(sn (δ, K2 , T2 ))
n→∞ n n
Haciendo δ → 0, y tomando supremo, finalmente tenemos hd (T1 ×T2 ) ≥ hd1 (T1 )+hd2 (T2 ).
2.3. Cálculo de entropı́a topológica
Teorema 2.14. Sea T : X → X un homeomorfismo expansivo del espacio métrico compacto
(X, d).
a) Si α es un generador para T , entonces h(T ) = h(T, α).
b) Si δ es una constante expansiva para T , entonces h(T ) = r(δ0 , T ) = s(δ0 , T ), para todo
δ0 < δ/4.
Demostración. a) Sea β un cubrimiento abierto cualquiera. Sea δ un número de Lebesgue
para β. Por Teorema 2.8, escojamos N > 0 tal que cada conjunto de N −n α tenga
W
n=−N T
WN
diámetro menor que δ, entonces β < n=−N T −n α, y ası́,
N
!
_
−n
h(T, β) ≤ h T, T α
−N
k−1 N
!!
1 _
−i
_
−n
= lı́m H T T α
k→∞ k
i=0 n=−N
N +k−1
!
1 _
−n
= lı́m H T α
k→∞ k
n=−N
2N_
+k−1
!
1
= lı́m H T −n α
k→∞ k
n=0
2N_
+k−1
!
2N + k − 1 1
= lı́m · H T −n α
k→∞ k 2N + k − 1
n=0
= h(T, α).
Por lo tanto, h(T, β) ≤ h(T, α), para todo cubrimiento abierto β, luego, h(T ) = h(T, α).
b) Sea δ0 < δ/4. Escojamos x1 , . . . , xk tal que X = ki=1 B(xi , δ/2 − 2δ0 ). El cubrimiento
S
α = {B(xi , δ/2) : 1 ≤ i ≤ k} tiene a 2δ0 como número de Lebesgue, ası́ por Teorema
2.10 h(T, α) ≤ r(δ0 , X) ≤ s(δ0 , X) ≤ h(T ). Como α es un generador para T , entonces
h(T ) = h(T, α) = r(δ0 , T ) = s(δ0 , T ).

Corolario 2.5. Todo homeomorfismo expansivo tiene entropı́a topológica finita.


Teorema 2.15. El shift bidireccional en X = ∞
Q
−∞ Y, donde Y = {0, 1, . . . , k − 1}, tiene
entropı́a topológica log(k).
Demostración. Sea α = {A0 , . . . , Ak−1 } el generador natural, es decir, Aj = {{xn }∞
−∞ :
x0 = j}. Entonces, por Teorema 2.14
n−1
!!
1 _
−i
h(T ) = h(T, α) = lı́m log N T α = lı́m log(k n ) = log(k).
n→∞ n n→∞
i=0
Teorema 2.16. Si T : K → K es un homeomorfismo del cı́rculo unitario, entonces h(T ) = 0.
Demostración. Sabemos que los conjuntos conexos de K son intervalos, entonces T mapea
intervalos en intervalos. Consideremos que K tiene longitud 1, y escojamos ε > 0 tal que
d(x, y) ≤ ε implique d(T −1 , T −1 y) ≤ 1/4. Claramente r1 (ε, K) ≤ [1/ε]+1, donde [1/ε] denota
la parte entera de 1/ε. Vamos a demostrar que rn (ε, K) ≤ n([1/ε] + 1), para todo n ∈ N. Sea
F un conjunto (n − 1, ε)-generador de cardinalidad rn−1 (ε, K). Consideremos los puntos de
T n−1 F y los intervalos que determinan. Agreguemos puntos a este conjunto tal que los nuevos
intervalos tengan longitud menor que ε, entonces agregaremos a lo más [1/ε] + 1 puntos. Sea
E la colección de puntos nuevos y F 0 = F ∪T −(n−1) E. Afirmamos que F 0 es un conjunto (n, ε)
generador para K. Sea x ∈ K, entonces existe y ∈ F tal que máx0≤i≤n−2 d(T i x, T i y) ≤ ε. Si
d(T n−1 x, T n−1 y) ≤ ε, entonces la afirmación está probada. Si no existe y ∈ F con estas dos
propiedades, fijemos y ∈ F tal que máx0≤i≤n−2 d(T i x, T i y) ≤ ε. Hay dos intervalos cerrados
con puntos extremos T n−1 x y T n−1 y, escojamos uno, llamémoslo I tal que T −1 (I) = I 0 ,
donde I 0 = [T n−2 x, T n−2 y] y longitud de I 0 es menor o igual a ε. Escojamos z ∈ F 0 tal
que T n−1 z ∈ I y d(T n−1 x, T n−1 z) ≤ ε, entonces T n−2 z ∈ I 0 y d(T n−2 x, T n−2 z) ≤ ε. Ahora
sea T −1 (I 0 ) = I 00 , con puntos extremos T n−3 x y T n−3 y y longitud menor que 1/4, entonces
l(I 00 ) ≤ ε. Como T n−3 z ∈ I 00 , entonces d(T n−3 x, T n−3 z) ≤ ε. Inductivamente, se deduce que
d(T i x, T i z) ≤ ε, con 0 ≤ i ≤ n − 1, ası́, F 0 es un conjunto (n, ε) generador para K, por lo
tanto rn (ε, K) ≤ rn−1 (ε, K) + [1/ε] + 1, y ası́
1 1
r(ε, K) ≤ lı́m sup log(n) + lı́m sup ([1/ε] + 1).
n→∞ n n→∞ n

Luego, r(ε, K) = 0, y finalmente, h(T ) = 0.

Corolario 2.6. Todo homeomorfismo de [0, 1] tiene entropı́a cero.


Demostración. T : [0, 1] → [0, 1] tiene dos opciones, o T (0) = 0 y T (1) = 1, o T (0) = 1 y
T (1) = 0. En cualquiera de los dos casos, T 2 fija a 0 y a 1. Sea S cualquier homeomorfismo
de [0, 1] que fija a 0 y 1, y sea φ : [0, 1] → K la función continua φ(t) = e2πit . φ es inyectiva
en (0, 1) y φSφ−1 es un homeomorfismo de K que fija a 1 ∈ K. Sean αn = {[0, 1/n), (1 −
1/n, 1], {(k/2n, (k + 2)/2n) : 1 ≤ k ≤ 2n − 3}} cubrimientos abiertos de [0, 1], entonces
φ((k/2n, (k + 2)/2n)), 1 ≤ k ≤ 2n − 3), con φ([0, 1/n) ∪ (1 − 1/n, 1]) forman un cubrimiento
βn de K, entonces    
p−1
_ p−1
_
N S j αn  ≤ 2p N  (φSφ−1 )j βn 
j=0 j=0

y ası́ h(S, αn ) ≤ log(2) + h(φSφ−1 , βn ). Aplicando el Teorema 2.9 y haciendo n → ∞, se tiene

h(S) ≤ log(2) + h(φSφ−1 ) = log(2).

Como esto ocurre para todo S homeomorfismo que fija a 0 y 1, si hacemos S = T 2q ,


2qh(T ) ≤ log(2), luego, h(T ) = 0.
3. Presión Topológica y su relación con Medidas Invariantes

Sea T : X → X una transformación continua del espacio métrico compacto (X, d). Sea
C(X, R) el espacio de Banach de funciones continuas de X con valores reales equipado con
la norma del supremo. La presión topológica de T será una función P (T, ·) : C(X, R) →
R ∪ {∞}, la cual tendrá buenas propiedades relativas a las estructuras en C(X, R). Esto
contiene entropı́a topológica, en el sentido que P (T, 0) = h(T ), donde 0 denota el elemento
de C(X, R) el cual es idénticamente cero.

3.1. Presión topológica


Sea (X, d) un espacio métrico compacto, C(X, R) el espacio de funciones continuas con
valores reales de X y T : X → X una transformación continua. La definición de presión
puede ser dada usando cubrimientos abiertos, conjuntos generadores o conjuntos separados.
Como X es compacto, podemos generalizar
Pn−1 lai definición de h(T ) dada en el Capı́tulo 2. Para
f ∈ C(X, R) y n ≥ 1 denotaremos i=0 f (T (x)) := (Sn )f (x).

Definición 3.1. Para f ∈ C(,R), n ≥ 1 y ε > 0, definamos


( )
X
Qn (T, f, ε) = ı́nf e(Sn f )(x) : F es un (n, ε)-conjunto generador para X .
x∈F

Observación 3.1. 1. 0 < Qn (T, f, ε) ≤ keSn f krn (ε, X) < ∞.

2. Si ε1 < ε2 , entonces Qn (T, f, ε1 ) ≥ Qn (T, f, ε2 ).

3. Qn (T, 0, ε) = rn (ε, X).

Definición 3.2. Para f ∈ C(X, R) y ε > 0, definamos


1
Q(T, f, ε) = lı́m sup log(Qn (T, f, ε)).
n→∞ n
Observación 3.2. 1. Por Teorema 2.10, se obtiene que Q(T, f, ε) ≤ kf k+r(ε, X, T ) < ∞.

2. Si ε1 < ε2 , entonces Q(T, f, ε1 ) ≥ Q(T, f, ε2 ).

Definición 3.3. Si f ∈ C(X, R), definimos P (T, f ) = lı́m Q(T, f, ε).


ε→0

Observación 3.3. 1. Por la observación anterior, P (T, f ) existe pero puede ser ∞.

Definición 3.4. La función P (T, ·) : C(X, R) → R ∪ {∞} es llamada la presión topológica


de T .

Claramente P (T, 0) = h(T ). Encontraremos otras formas equivalentes de dar la definición.


Definición 3.5. Para f ∈ C(X, R), n ≥ 1 y ε > 0, definamos
( )
X
Pn (T, f, ε) = sup e(Sn f )(x) : E es un (n, ε)-conjunto separado de X
x∈E

Observación 3.4. 1. Si ε1 < ε2 , entonces Pn (T, f, ε1 ) ≥ Pn (T, f, ε2 ).

2. Pn (T, 0, ε) = sn (ε, X).

3. Qn (T, f, ε) ≤ Pn (T, f, ε). Esto es ya que un (n, ε) conjunto separado el cual no se puede
ampliar a un (n, ε) conjunto separado tiene que ser un (n, ε) conjunto generador para
X.

4. Si δ > 0 es tal que d(x, y) < ε/2 implica |f (x) − f (y)| < δ, entonces Pn (T, f, ε) ≤
enδ Qn (T, f, ε/2).

Demostración. Sea E un (n, ε) conjunto separado y F un (n, ε/2) conjunto generador.


Definamos φ : E → F tal que para cada x ∈ E, existe φ(x) ∈ F tal que dn (x, φ(x)) ≤ ε/2
(usando la notación dn (x, y) = máx d(T i (x), T i (y)). Entonces φ es inyectiva, ası́
0≤i≤n−1
X X
e(Sn f )(y) ≥ e(Sn f )(y)
y∈F y∈φE
 X
≥ mı́n e(Sn f )(φx)−(Sn f )(x) e(Sn f )(x)
x∈E
x∈E
X
−nδ (Sn f )(x)
≥e e .
x∈E

Por lo tanto, Qn (T, f, ε/2) ≥ e−nδ Pn (T, f, ε).

Definición 3.6. Para f ∈ C(X, R) y ε > 0, definamos


1
P (T, f, ε) = lı́m sup log(Pn (T, f, ε)).
n→∞ n
Observación 3.5. 1. Q(T, f, ε) ≤ P (T, f, ε).

2. Si δ es tal que d(x, y) < ε/2 implica |f (x) − f (y)| < δ, entonces P (T, f, ε) ≤ δ +
Q(T, f, ε).

3. Si ε1 < ε2 , entonces P (T, f, ε1 ) ≥ P (T, f, ε2 ).


Teorema 3.1. Si f ∈ C(X, R), entonces P (T, f ) = lı́m P (T, f, ε).
ε→0

Demostración. El lı́mite existe por la Observación 3.5, parte 3, y por la Observación 3.5,
parte 1 tenemos que P (T, f ) ≤ lı́m P (T, f, ε). Por la Observación 3.5, parte 2, para todo
ε→0
δ > 0, tenemos que lı́m P (T, f, ε) ≤ δ + P (T, f ) ≤ P (T, f ).
ε→0
Definición 3.7. Para f ∈ C(X, R), n ≥ 1 y α un cubrimiento abierto de X, definamos
 
X n−1
_ 
(Sn f )(x) −i
qn (T, f, α) = ı́nf ı́nf e : β es un subcubrimiento finito de T α
 x∈B 
B∈β i=0
 
X n−1
_ 
pn (T, f, α) = ı́nf sup e(Sn f )(x) : β es un subcubrimiento finito de T −i α .
B∈β x∈B
 
i=0

Claramente, qn (T, f, α) ≤ pn (T, f, α).


Teorema 3.2. Sea T : X → X continua y f ∈ C(X, R).
a) Si α es un cubrimiento abierto de X con número de Lebesgue δ, entonces qn (T, f, α) ≤
Qn (T, f, δ/2) ≤ Pn (T, f, δ/2).

b) Si ε > 0 y γ es un cubrimiento abierto con diam (γ) ≤ ε, entonces Qn (T, f, ε) ≤


Pn (T, f, ε) ≤ pn (T, f, γ).
Demostración. Sabemos que Qn (T, f, ε) ≤ Pn (T, f, ε), para todo ε > 0.
Tn−1 −i
T B̄(T i x; δ/2). Como
S
a) Si F es un (n, δ/2) conjunto generador, entonces X = x∈F i=0
cada i x; δ/2) es un subconjunto de algun miembro de α, tenemos que qn (T, f, α) ≤
P B̄(T (S f )(x) , luego q (T, f, α) ≤ Q (T, f, δ/2).
x∈F e
n
n n
Wn−1 −i
b) Sea E un conjunto (n, ε)-separadoPde X. Como ningún miembro de i=0 T γ contiene
dos elementos de E, tenemos que x∈E e(Sn f )(x) ≤ pn (T, f, γ). Por lo tanto, Pn (T, f, ε) ≤
pn (T, f, γ).

Observación 3.6. 1. Si α, γ son cubrimientos abiertos de X y α < γ, entonces qn (T, f, α) ≤


qn (T, f, γ).

2. Si d(x, y) diam (α) implica que |f (x) − f (y)| ≤ δ entonces pn (T, f, α) ≤ enδ qn (T, f, α).
1
Lema 3.1. Si f ∈ C(X, R) y α es un cubrimiento abierto de X, entonces lı́m log(pn (T, f, α))
n→∞ n
existe y es igual a ı́nf n (1/n) log(pn (T, f, α)).
Demostración. Por Teorema 1.5 es suficienteWdemostrar que pn+k (T, f, α) ≤ pn (T, f, α) ·
n−1 −i
pk (T, f, α). Si β es un subcubrimiento finito de i=0 T α y γ es un subcubrimiento finito de
Wn−1 −i −n γ es un subcubrimiento finito de k+n−1 T −i α, y ası́ tenemos
W
i=0 T α, entonces β ∨ T i=0
  
X X X
sup e(Sn+k f )(x) ≤  sup e(Sn f )(x)   sup e(Sk f )(x)  .
x∈D B∈β x∈B C∈γ x∈C
D∈β∨T −n γ

Por lo tanto, pn+k (T, f, α) ≤ pn (T, f, α) · pk (T, f, α).


Teorema 3.3. Si T : X → X es continua y f ∈ C(X, R), entonces las siguientes expresiones
son iguales a P (T, f ).
 n o
a) lı́m sup lı́m (1/n) log(pn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞
h i
b) lı́m lı́m (1/n) log(pn (T, f, αk )) si {αk } es una sucesión de cubrimientos abiertos con
k→∞ n→∞
diam (αk ) → 0.
 n o
c) lı́m sup lı́m inf (1/n) log(qn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞
  
d) lı́m sup lı́m sup(1/n) log(qn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞
h i
e) lı́m lı́m (1/n) log(qn (T, f, αk )) si {αk } es una sucesión de cubrimientos abiertos con
k→∞ n→∞
diam (αk ) → 0.
 
f ) sup lı́m sup(1/n) log(qn (T, f, α))/α es un cubrimiento abierto de X .
α n→∞

g) lı́m lı́m inf (1/n) log(Qn (T, f, ε)).


ε→0 n→∞

h) lı́m lı́m inf (1/n) log(Pn (T, f, ε)).


ε→0 n→∞

Demostración. a) Si δ > 0 y γ es un cubrimiento abierto con diam (γ) ≤ δ, entonces


Pn (T, f, δ) ≤ pn (T, f, γ) por Teorema 3.2, parte b, y ası́, usando Lema 3.1 tenemos
 
1
P (T, f, δ) ≤ sup lı́m log(pn (T, f, γ))/γ es un cubrimiento de X con diam (γ) ≤ δ .
n→∞ n

Por lo tanto, P (T, f ) no es más grande que


 n o
lı́m sup lı́m (1/n) log(pn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞

Si α es un cubrimiento y δ es un número de Lebesgue para α, entonces qn (T, f, α) ≤


Pn (T, f, δ/2) por Teorema 3.2, parte a. Además, si definimos τα = sup{|f (x) − f (y)| :
dist (x, y) ≤ diam (α)}, entonces pn (T, f, α) ≤ enτα qn (T, f, α), por Observación 3.6, parte
2. Luego
pn (T, f, α) ≤ enτα Pn (T, f, δ/2)
ası́
1
lı́mlog(pn (T, f, α)) ≤ τα + P (T, f ),
n→∞ n
y   
1
lı́m sup lı́m log(pn (T, f, α)) / diam (α) ≤ η ≤ P (T, f ).
η→0 α n→∞ n
b) Análogo a (a)

c) Sabemos que qn (T, f, α) ≤ pn (T, f, α), para todo α. Además si τα = sup{|f (x) − f (y)| :
d(x, y) ≤ diam (α)}, entonces pn (T, f, α) ≤ enτα qn (T, f, α). Por lo tanto,

e−nτα pn (T, f, α) ≤ qn (T, f, α) ≤ pn (T, f, α),

ası́
1 1
−τα + lı́m log(pn (T, f, α)) ≤ lı́m inf log(qn (T, f, α))
n→∞ n n→∞ n
1
≤ lı́m sup log(qn (T, f, α))
n→∞ n
1
≤ lı́m log(pn (T, f, α)).
n→∞ n

Por lo tanto, se tiene lo de (c).

d) Análogo a (c)

e) Análogo a (c)

f) Sea α un cubrimiento abierto de X y sea 2ε un número de Lebesgue para α. Por Teorema


3.2, qn (T, f, α) ≤ Qn (T, f, ε), y ası́ lı́m supn→∞ (1/n)qn (T, f, α) ≤ Q(T, f, ε) ≤ P (T, f ).
Por lo tanto, la expresión en (e) está mayorada por P (T, f ). La otra desigualdad se deduce
de (d).

g) Sea αε = {B(x, 2ε)/x ∈ X} y γε = {B(x, ε/2)/x ∈ X}. Entonces, por Teorema 3.2 y
Observación 3.6, parte 2,

e−nτ4ε pn (T, f, αε ) ≤ qn (T, f, αε ) ≤ Qn (T, f, ε) ≤ Pn (T, f, ε) ≤ pn (T, f, γε )

donde τ4ε = sup{|f (x) − f (y)| : d(x, y) ≤ 4ε}. Entonces tomando lı́m inf se obtiene lo
deseado.

h) Análogo a (g).

Observación 3.7. 1. Para algunos ejemplos,


n o
sup lı́m (1/n) log(pn (T, f, α)) : α es un cubrimiento abierto de X
n→∞

es estrictamente mayor que P (T, f ).

2. De la parte (f ) del Teorema 3.3 se observa que P (T, f ) no depende de la métrica de X.

Como uno puede esperar, de lo que sabemos de entropı́a topológica, la definición de


presión puede ser simplificada para homeomorfismos expansivos.
Lema 3.2. Si T : X → X es una transformación continua del espacio compacto metrizable
X y α es un cubrimiento abierto de X, entonces para k > 0 y f ∈ C(X, R),
k
!!
1 1 _
−i
lı́m sup log(qn (T, f, α)) = lı́m sup log qn T, f, T α
n→∞ n n→∞ n
i=0
Wk
ylı́mn→∞ (1/n) log(pn (T, f, α)) = lı́mn→∞ (1/n) log(pn (T, f, i=0 T −i α)). Si T es un homeo-
morfismo y k, m ≥ 0 entonces estas fórmulas se mantienen remplazando ki=0 T −i α por
W
Wk −i
i=−m T α.

Demostración. Fácilmente uno puede ver que


k
!
_
−(k+1)kf k −i
e qn+k (T, f, α) ≤ qn T, f, T α ≤ e(k+1)kf k qn+k (T, f, α)
i=0

y
k
!
_
e−(k+1)kf k pn+k (T, f, α) ≤ pn T, f, T −i α ≤ e(k+1)kf k pn+k (T, f, α).
i=0
Lo primero que uno quiere demostrar sale de lo anterior. Para demostrar lo segundo, es
suficiente mostrar que
1 1
lı́m sup log(qn (T, f, T −1 β)) = lı́m sup log(qn (T, f, β))
n→∞ n n→∞ n
y
1 1
lı́m sup log(pn (T, f, T −1 β)) = lı́m sup log(pn (T, f, β))
n→∞ n n→∞ n
cuando T es un homeomorfismo y β es un cubrimiento abierto de X. Como γ es W un subcu-
brimiento finito de i=0 T β si y solo si T γ es un subcubrimiento finito de ni=1 T −i β
−i −1
W
tenemos
 X 
Sn f (x)

 ı́nf e 

 x∈C n−1 
qn (T, f, β) 
C∈γ _
−i

≥ ı́nf : γ es un subcubrimiento finito de T β
qn (T, f, T −1 β)
X

 ı́nf eSn f (y) i=0


y∈T −1 C

 

C∈γ
 X 
Sn f (x)

 ı́nf e 


 x∈C n−1 

C∈γ _
−i
= ı́nf X −1 : γ es un subcubrimiento finito de T β

 ı́nf eSn f (T x) i=0



 x∈C 

C∈γ

ı́nf eSn f (x)


 
 n−1 
x∈C
_
−i
≥ ı́nf mı́n : γ es un subcubrimiento finito de T β
 C∈γ ı́nf eSn f (T −1 x) 
i=0
x∈C
−2kf k
≥e .
Una demostración similar nos da que

qn (T, f, T −1 β)
≥ e−2kf k
qn (T, f, β)

y ası́ obtenemos el resultado. La demostración para pn es análoga.

El siguiente resultado generaliza al Teorema 2.14.

Teorema 3.4. a) Si α es un generador para T , entonces para todo f ∈ C(X, R),


1 1
P (T, f ) = lı́m log(pn (T, f, α)) = lı́m sup log(qn (T, f, α))
n→∞ n n→∞ n

b) Si δ es una constante de expansividad para T , entonces P (T, f ) = P (T, f, δ0 ) = Q(T, f, δ0 ),


para todo δ0 < δ/4 y todo f ∈ C(X, R).

Demostración. a) Sea α un generador para T . Por Teorema 2.8 tenemos que


k
!
_
−i
diam T α →0
i=−k

y ası́ por Teorema 3.2, parte b


k
!!
1 _
−i
P (T, f ) = lı́m lı́m log pn T, f, T α .
k→∞ n→∞ n
i=−k

Una aplicación del Lema 3.2 nos da el resultado deseado. La fórmula para qn se prueba
de forma similar usando Teorema 3.2, parte e y Lema 3.2.

b) Sea δ0 < δ/4 y escojamos x1 , . . . , xk tal que X = ki=1 B(xi ; (δ/2) − 2δ0 ). El cubrimiento
S
α = {B(xi ; δ/2) : 1 ≤ i ≤ k} tiene a 2δ0 como número de Lebesgue, entonces por Teorema
3.2 tenemos
1 1
lı́m sup log(qn (T, f, α)) ≤ lı́m sup log(Qn (T, f, δ0 ))
n→∞ n n→∞ n
1
≤ lı́m sup log(Pn (T, f, δ0 ))
n→∞ n
≤ P (T, f )

Y ası́ el resultado sigue por (a) dado que α es un generador.

Podemos usar esto para calcular P (T, f ) cuando T es el shift bidireccional en X = ∞


Q
−∞ Y,
Y = {0, 1, . . . , k − 1}, y f depende solo en la 0-ésima coordenada, es decir, f ({xn }) =
ax0 , donde a0 , a1 , . . . , ak−1 ∈ R. Si α denota el generador natural, entonces qn (T, f, α) =
pn (T, f, α) = (ea0 + · · · + eak−1 )n y ası́ P (T, f ) = log(ea0 + · · · + eak−1 ).
3.2. Propiedades de la presión
Ahora estudiaremos las propiedades de P (T, ·) : C(X, R) → R ∪ {∞}. En particular,
veremos que P (T, ·) o nunca toma el valor ∞ o es idénticamente ∞.

Teorema 3.5. Sea T : X → X una transformación continua del espacio compacto metrizable
X. Si f, g ∈ C(X, R), ε > 0 y c ∈ R, entonces

a) P (T, 0) = h(T ).

b) Si f ≤ g, entonces P (T, f ) ≤ P (t, g). En particular, h(T )+ı́nf f ≤ P (T, f ) ≤ h(T )+sup f .

c) P (T, ·) o es finito o es constantemente ∞.

d) |P (T, f, ε) − P (T, g, ε)| ≤ kf − gk. Ası́, si P (T, ·) < ∞, entonces |P (T, f ) − P (T, g)| ≤
|f − gk.

e) P (T, ·, ε) es convexo. En consecuencia, si P (T, ·) < ∞, entonces P (T, ·) es convexo.

f ) P (T, f + c) = P (T, f ) + c.

g) P (T, f + g ◦ T − g) = P (T, f ).

h) P (T, f + g) ≤ P (T, f ) + P (T, g).

i) P (T, cf ) ≤ cP (T, f ) si c ≥ 1 y P (T, cf ) ≥ cP (T, f ) si c ≤ 1.

j) |P (T, f )| ≤ P (T, |f |).

Demostración. En varias ocasiones en las demostraciones usaremos la desigualdad


 
sup aj aj
≤ sup
sup bj bj

donde (aj ), (bj ) son colecciones de números reales positivos.

a) Es claro de la definición de presión.

b) Es claro de la definición de presión.

c) De (a) y (b) tenemos

h(T ) + ı́nf f ≤ P (T, f ) ≤ h(T ) + sup f

y ası́ P (T, f ) = ∞ si, y sólo si, h(T ) = ∞.


d) Por la desigualdad mencionada en el comienzo de la demostración, tenemos
 X (S f )(x) 

 e n 

Pn (T, f, ε) 
x∈E

≤ sup X : es un conjunto (n, ε) generador
Pn (T, g, ε) 
 e(Sn g)(x) 

 
x∈E
( ( ) )
e(Sn f )(x)
≤ sup máx : E es un conjunto (n, ε) generador
x∈E e(Sn g)(x)
≤ enkf −gk .

Esto prueba (d).

e) Por la Desigualdad de Hölder, si p ∈ [0, 1] y E es un conjunto finito de X, tenemos


!p !1−p
X X X
p(Sn f )(x)+(1−p)(Sn g)(x) (Sn f )(x) (Sn g)(x)
e ≤ e e .
x∈E x∈E x∈E

Por lo tanto, Pn (T, pf + (1 − p)g, ε) ≤ Pn (T, f, ε)p · Pn (T, g, ε)1−p y ası́, tenemos (e).

f) Es claro de la definición de presión.

g) Tenemos
( )
f )(x)+g(T n x)−g(x)
X
Pn (T, f +g◦T −g, ε) = sup e(Sn : E es un conjunto (n, ε)-generador
x∈E

y ası́
e−2kgk Pn (T, f, ε) ≤ Pn (T, f + g ◦ T − g, ε) ≤ e2kgk Pn (T, f, ε).
Y con esto, se tiene el resultado.

h) Esto se tiene, dado que Pn (T, f + g, ε) ≤ Pn (T, f, ε) · Pn (T, g, ε).

i) Si a1 , . . . , ak son números positivo tal que ki=1 ai = 1, entonces ki=1 aci ≤ 1 si c ≥ 1 y


P P
Pk c
i=1 ai ≥ 1 si c ≤ 1. Por lo tanto, si E es un conjunto finito de X tenemos
!c
X X
ec(Sn f )(x) ≤ e(Sn f )(x) si c ≥ 1
x∈E x∈E

y !c
X X
c(Sn f )(x) (Sn f )(x)
e ≥ e si c ≤ 1
x∈E x∈E

Por lo tanto, Pn (T, cf, ε) ≤ (Pn (T, f, ε))c si c ≥ 1 y Pn (T, cf, ε) ≥ (Pn (T, f, ε))c si c ≤ 1.

j) Como −|f | ≤ f ≤ |f | tenemos por (b), P (T, −|f |) ≤ P (T, f ) ≤ P (T, |f |). De (i) tenemos
que −P (T, |f |) ≤ P (T, −|f |) y ası́, |P (T, f )| ≤ P (T, |f |).
Ahora estudiaremos como P (T, ·) depende de T . Otras propiedades que pueden ser de-
mostradas ahora, las daremos después de demostrar el Principio Variacional en la sección
3.3.
Teorema 3.6. Sea T : X → X una transformación continua del espacio compacto metrizable
X y f ∈ C(X, R), entonces
a) Si k > 0, entonces P (T k , Sk f ) = kP (T, f ).
b) Si T es un homeomorfismo, P (T −1 , f ) = P (T, f ).
c) Si Y es un subconjunto cerrado de X con T Y ⊂ Y, entonces P (T |Y , f |Y ) ≤ P (T, f ).
d) Si Ti : Xi → Xi con i = 1, 2, es una transformación continua del espacio compacto
metrizable (Xi , di ) y si φ : X1 → X2 es una transformación continua sobreyectiva con
φT1 = T2 φ, entonces P (T2 , f ) ≤ P (T1 , f ◦ φ), para todo f ∈ C(X2 , R). Si φ es un homeo-
morfismo, entonces P (T2 , f ) = P (T1 , f ◦ φ), para todo f ∈ C(X2 , R).
e) Si Ti : Xi → Xi con i = 1, 2, es una transformación continua del espacio compacto
metrizable (Xi , di ) y si fi ∈ C(Xi , R), entonces P (T1 × T2 , f1 × f2 ) = P (T1 , f1 ) + P (T2 , f2 ),
donde f1 × f2 ∈ C(X1 × X2 , R) está definido por (f1 × f2 )(x1 , x2 ) = f1 (x1 ) + f2 (x2 ).
Demostración. a) Si F es un conjunto (nk, ε)-generador para T , entonces F es un
conjunto (n, ε)-generador para T k . Luego Qn (T k , Sk f, ε) ≤ Qnk (T, f, ε), y ası́
P (T k , Sk f ) ≤ kP (T, f ). Para mostrar la otra desigualdad, sea ε > 0 y escojamos δ > 0 tal
que d(x, y) < δ implique máx1≤i≤k−1 d(T i x, T i y) < ε. Si F es un conjunto (n, δ) genera-
dor para T k , entonces F es un conjunto (nk, ε)-generador para T . Luego Qn (T k , Sk f, δ) ≥
Qnk (T, f, ε) y ası́ P (T k , Sk f ) ≥ Q(T k , Sk f, δ) ≥ kQ(T, f, ε). Tomando lı́mite cuando ε
tiende a 0 tenemos que P (T k , Sk f ) ≥ kP (T, f ).
b) Un conjunto E es (n, ε)-separado para T si, y solamente si, T n−1 E es (n, ε) para T −1 .
Además
−1 −(n−1) y)
X X
e(Sn f )(x) = ef (y)+f (T y)+...+f (T .
x∈E y∈T n−1 E

Ası́ Pn (T, f, ε) = Pn (T −1 , f, ε) y P (T, f ) = P (T −1 , f ).


c) Es claro ya que un conjunto (n, ε) separado de Y es un conjunto (n, ε) generador para X.
d) Sea ε > 0 y escojamos δ > 0 tal que d1 (x, y) < δ implique d2 (φ(x), φ(y)) < ε. Si F es un
conjunto (n, ε) generador para T1 , entonces φF es un conjunto (n, ε)-generador para T2 y
X n−1 X n−1
ef (φx)+f (φT1 x)+...+f (φT1 x) ≥ ef (y)+f (T2 y)+...+f (T2 y) ≥ Qn (T2 , f, ε).
x∈F y∈φF

Por lo tanto P (T1 , f ◦ φ) ≥ Q(T1 , f ◦ φ, δ) ≥ Q(T2 , f, ε) y ası́ P (T1 , f ◦ φ) ≥ P (T2 , f ). Si


φ es un homeomorfismo entonces podemos aplicar lo hecho anteriormente reemplazando
T1 , T2 , φ, f por T2 , T1 , φ−1 , f ◦ φ respectivamente, para obtener P (T2 , f ) ≥ P (T1 , f ◦ φ).
e) Consideremos la métrica en X1 ×X2 dada por d((x1 , x2 ), (y1 , y2 )) = máx{d1 (x1 , y1 ), d2 (x2 , y2 )}.
Si Fi es un conjunto (n, ε) generador para X, entonces F1 × F2 es un conjunto (n, ε)-
generador para X1 × X2 con respecto a T1 × T2 . Además
n−1
!
X X
exp (f1 × f2 )(T1 × T2 )(x1 , x2 ) =
(x1 ,x2 )∈F1 ×F2 i=0
 !  !
X n−1
X X n−1
X
 exp f1 (T1i (x1 ))   exp f2 (T2i (x2 )) 
x1 ∈F1 i=0 x2 ∈F2 i=0

y ası́
Qn (T1 × T2 , f1 × f2 , ε) ≤ Qn (T1 , f1 , ε) · Qn (T2 , f2 , ε).
Por lo tanto, P (T1 × T2 , f1 × f2 ) ≤ P (T1 , f1 ) + P (T2 , f2 ). Si Ei es un conjunto (n, ε)
separado para Xi , entonces E1 × E2 es un conjunto (n, ε) separado para X1 × X2 , ası́
Pn (T1 × T2 , f1 × f2 , ε) ≥ Pn (T1 , f1 , ε) · Pn (T2 , f2 , ε).
Ası́,
1 1 1
lı́m sup log(Pn (T1 ×T2 , f1 ×f2 , ε)) ≥ lı́m inf log(Pn (T1 , f1 , ε))+lı́m sup log(Pn (T2 , f2 , ε)),
n→∞ n n→∞ n n→∞ n

y el Teorema 3.3, parte h nos da que P (T1 × T2 , f1 × f2 ) ≥ P (T1 , f1 ) + P (T2 , f2 ).

3.3. El Principio Variacional


Pk
Lema 3.3. Sean a1 , . . . , ak números reales. Si pi ≥ 0 y i=1 = 1, entonces
k k
!
X X
pi (ai log(pi )) ≤ log eai
i=1 i=1

y la igualdad se da si, y solamente si,


eai
pi = Pk
ai
j=1 e
Pk aj .
Demostración. Sea M = j=1 e En el Teorema 1.2, pongamos
eai pi M
αi = y xi = a .
M e i
Entonces
k
eai pi M
 
X pi M
0 = φ(1) ≤ log
M eai eai
i=1
k
X
= pi [log(pi ) + log(M ) − ai ].
i=1
pi (ai − log(pi )) ≤ log(M ), y la igualdad se da si, y solamente si, (pi M/eai ) es
P
Entonces,
independiente de i, es decir, pi = (eai /M ).

Ahora enunciaremos algunos previos sobre medidas invariantes.


Definición 3.8. Denotaremos por M (X) la colección de todas las medidas de probabilidad
definidas en el espacio medible (X, A). Notar que M (X) es un conjunto convexo. Denotaremos
por M (X, T ) a todas las medidas invariantes por T . A partir de T , definimos una nueva
función T̃ : M (X) → M (X) dada por (T̃ µ)(B) = µ(T −1 B).
Teorema 3.7. Sea T : X → X continua. P Si {σn }∞
n=1 es una sucesión en M (X) y formamos la
∞ n−1 −i
nueva sucesión {µn }n=1 por µn = (1/n) i=0 T̃ σn , entonces todo punto lı́mite µ de {µn }
es un miembro de M (X, T ).
Definición 3.9. La función de entropı́a de la transformación continua T : X → X es la
función definida en M (X) y toma valores en [0, ∞], definida por µ → hµ (T ).
Lema 3.4. Sea X un espacio métrico compacto y µ ∈ M (X).
a) Si x ∈ X y δ > 0, existe δ 0 < δ tal que µ(∂B(x, δ 0 )) = 0.

b) Si δ > 0, existe una partición ξ = {A1 , . . . , Ak } de (X, B(X)) tal que diam (Aj ) < δ y
µ(∂Aj ) = 0, para todo j.
1. Si µi ∈ M (X), 1 ≤ i ≤ n, y pi ≥ 0 tal que ni=1 pi = 1, entonces
P
Observación 3.8.
n
X
HPn i=1 pi µi (ξ) ≥ pi Hµi (ξ)
i=1

para toda partición finita ξ de (X, B(X))

2. Si µ ∈ M (X, T ) y si µ(∂Ai ) = 0, 0 ≤ i ≤ n − 1, entonces


n−1
!!
\
−i
µ ∂ T Ai =0
i=0

ya que
n−1 n−1
!
\ [
−i
∂ T Ai ⊂ T −i ∂Ai
i=0 i=0
.
Teorema 3.8. Sea T : X → X un mapeo continuo del espacio métrico compacto X. Entonces
h(T ) = sup{hµ (T ) : µ ∈ M (X, T )}.
Teorema 3.9. Sea T : X → X un mapeo continuo del espacio métrico compacto X y sea
f ∈ C(X, R). Entonces
 Z 
P (T, f ) = sup hµ (T ) + f dµ : µ ∈ M (X, T ) .
R
Demostración. 1. Sea µ ∈ M (X, T ). Mostraremos que hµ (T ) + f dµ ≤ P (T, f ). Sea
ξ = {A1 , . . . , Ak } una partición de (X, B(X)). Sea a > 0 dado. Escojamos ε > 0 tal
que εk log(k) < a. Como µ es regular, existen conjuntos compactos Bj ⊂ Aj con
µ(Aj \ Bj ) < ε, 1 ≤ j ≤ k. Sea η = {B0 , B1 , . . . , Bk } una particion de (X, B(X)) donde
B0 = X \ kj=1 Bj . Entonces como en la demostración del Teorema 3.8, Hµ (ξ/η) <
S
εk log(k) < a. Sea
b = mı́n d(Bi , Bj ) > 0.
1≤i6=j≤k

Escojamos δ > 0 tal que δ < b/2 y d(x, y) < δ implique |f (x) − f (y)| < ε. Fijemos n y
sea E un conjunto (n, ε)-separado con respecto a T , el cual deja de ser (n, ε)-separado es
agregado cuando cualquier punto. Entonces E es también un conjunto (n, δ) generador.
Wn−1
Si C ∈ i=0 T −i η, sea α(C) = sup{(Sn f )(x) : x ∈ C}. Entonces
n−1
! Z
_ X
−i
Hµ T η + Sn f dµ ≤ µ(C)[− log µ(C) + α(C)]
i=0 C∈ n−1 −i η
W
i=0 T
 
X
≤ log  eα(C)  .
Wn−1
C∈ i=0 T −i η

Wn−1 −i
Esta última desigualdad obtenida del Lema 3.3. Para cada C ∈ i=0 T η escojamos
algún x ∈ C tal que (Sn f )(x) = α(C). Como E es un conjunto (n, δ)-generador, es-
cojamos y(C) ∈ E tal que d(T i x, T i y(C)) ≤ δ, 0 ≤ j ≤ n − 1. Entonces α(C) ≤
(Sn f )(y(C)) + nε. Además cada bola de radioWδ intersecta a la clausura de a lo más dos
miembros de η y ası́, si y ∈ E entonces {C ∈ n−1 −i
i=0 T η : y(C) = y} tiene cardinalidad
n
a lo más 2 . Por lo tanto
X X X
eα(C)−nε ≤ e(Sn f )(y(C)) ≤ 2n e(Sn f )(y)
C∈ n−1
Wn−1
−i η T −i η y∈E
W
i=0 T C∈ i=0

y ası́    
X X
log  eα(C)  − nε ≤ n log(2) + log  e(Sn f )(y)  .
Wn−1
C∈ y∈E
i=0

Luego
n−1 n−1
! Z Z !
1 _
−i 1 _ 1 −i
Hµ T η + f dµ = Hµ T η + Sn f dµ
n n n
i=0 i=0
 
1 X
≤ ε + log(2) + log  e(Sn f )(y) 
n
y∈E
1
≤ ε + log(2) + log(Pn (T, f, δ))
n
y por lo tanto
Z
hµ (T, η) + f dµ ≤ ε + log(2) + P (T, f, δ) ≤ ε + log(2) + P (T, f ).
R
Ahora, por Teorema 1.8, parte d, hµ (T,Rξ) ≤ hµ (T, η)+Hµ (ξ/η) y ası́ hµ (T, ξ)+ f dµ ≤
2a + log(2) + P (T, f ), luego hµ (T ) + f dµ ≤ 2a + log(2) + P (T, f ). Esto se da para
n
R toda f ∈ C(X, R) ası́ que podemos aplicarlo para T
toda aplicación continua T y para
y Sn f para obtener n[hµ (T ) + f dµ] ≤ 2a + log(2) + nP (T, f ) (por Teorema 3.6, parte
a). Como esto se da para todo n tenemos
Z
hµ (T ) + f dµ ≤ P (T, f ).

R
2. Sea ε > 0. Vamos a encontrar µ ∈ M (X,R T ) tal que hµ (T ) + f dµ ≥ P (T, f, ε), y
esto claramente implica que sup{hµ (T ) + f dµ : µ ∈ M (X, T )} ≥ P (T, f ). Sea En un
conjunto (n, ε) separado con
X
log e(Sn f )(y) ≥ log(Pn (T, f, ε)) − 1.
y∈En

Sea σn ∈ M (X) la medida atómica concentrada en En dada por la fórmula


(Sn f )(y) δ
P
y∈E e y
σn = P n (S f )(x) .
z∈En e
n

Sea µn ∈ M (X) definida por


n−1
1X
µn = σn ◦ T −i .
n
i=0

Como M (X) es compacto, podemos escoger una subsucesión {nj } de números naturales
tal que
1
lı́m log(Pnj (T, f, ε)) = P (T, f, ε)
j→∞ nj

y {µnj } converge en M (X) a algúnR µ ∈ M (X). Por Teorema 3.7 sabemos que µ ∈
M (X, T ). Por demostrar, hµ (T ) + f dµ ≥ P (T, f, ε). Por Lema 3.4 escojamos una
partición ξ = {A1 , . . . , Ak } de (X, B(X))
Wn−1 tal−jque diam (Ai ) < ε y µ(∂Ai ) = 0, para
i ≤ i ≤ k. Como cada elemento de j=0 T ξ contiene a lo más un elemento de En
tenemos
 
n−1
_ Z X
Hσn  T −i ξ  + Sn f dσn = σn ({y})((Sn f )(y) − log(σn ({y})))
j=0 y∈En
 
X
= log  e(Sn f )(y) 
y∈En
por la definición de σn y Lema 3.3. Fijemos números naturales q, n con 1 ≤ q < n y
definamos, para 0 ≤ j ≤ q − 1, a(j) = [(n − j)/q]. Fijemos 0 ≤ j ≤ q − 1. Por la
Observación 3.8, parte 1 tenemos
 
n−1 a(j)−1 q−1
_ _ _ _
T −i ξ =  T −(rq+j) T −i ξ  ∨ T −l ξ
i=0 r=0 j=0 l∈S

y S tiene cardinalidad a lo más 2q. Por lo tanto


   
X n−1
_ Z
(Sn f )(y)  −j 
log  e = Hσn  T ξ + Sn f dσn
y∈En j=0
a(j)−1 q−1
! ! Z
X _ _
−(rq+j) −i −k
≤ Hσn T T ξ + Hσn T ξ + Sn f dσn
r=0 i=0 k∈S
a(j)−1 q−1
! Z
X _
−i
≤ Hσn ◦T −(rq+j) T ξ + 2q log(k) + Sn f dσn .
r=0 i=0

Sumando esto sobre j y usando Observación 3.8, parte 3 tenemos


 
n−1 q−1
! Z
X X _
(Sn f )(y)  −i 2
q log  e ≤ Hσ◦T −p T ξ + 2q log(k) + q Sn f dσn .
y∈En p=0 i=0

Ahora dividamos por n y usando Observación 3.8, parte 1 tenemos


 
q−1
!
2q 2
Z
q X
(Sn f )(y) 
_
−i
log  e ≤ Hµn T ξ + log(k) + q f dµn . (1)
n n
y∈En i=0

Como µ(∂Ai ) = 0 para todo i, por Observación 3.8, parte 3 tenemos


q−1 q−1
! !
_ _
−i −i
lı́m Hµnj T ξ = Hµ T ξ .
j→∞
i=0 i=0

Ası́ reemplazando n por nj en (1), tenemos


q−1
! Z
_
−i
qP (T, f, ε) ≤ Hµ T ξ +q f dµ.
i=0

Dividiendo por q y haciendo tender q a infinito, nos da


Z Z
P (T, f, ε) ≤ hµ (T, ξ) + f dµ ≤ hµ (T ) + f dµ.
Corolario 3.1. Sea T : X → X una aplicación continua del espacio compacto metrizable X
y sea f ∈ C(X, R). Entonces
 R
a) P (T, f ) = sup hµ (T ) + f dµ : µ ∈ E(X, T ) .

b) P (T, f ) = P (T |Ω(T ) , f |Ω(T ) ).

c) P (T, f ) = P (T |Trn=0 T n X , f |Trn=0 T n X ).

El Principio Variacional ayuda para calcular la presión de algunos ejemplos. Fácilmente


se puede observar del Principio Variacional, que si T es la aplicación identidad de X, entonces
P (T, f ) = sup f . Las medidas ergódicas invariantes para T son las medidas Delta de Dirac
δx , x ∈ X, ası́ la fórmula sigue por Corolario 3.1, parte a.

CorolarioR 3.2. Si T : X → X es únicamente ergódica y M (X, T ) = {m}, entonces P (T, f ) =


hm (T ) + f dm.

3.4. Presión determina M (X, T )


Demostraremos como P (T, ·) determina los miembros de M (X, T ) cuando T : X → X
es una aplicación continua del espacio compacto metrizable X. Recordemos que una medida
finita signada en X es una aplicación µ : B(X) → R el cual es contablemente aditivo.

Teorema 3.10. Sea T : X → X una aplicación continua del espacio compacto metrizable X
con h(T ) < ∞.R Sea µ : B(X) → R una medida finita signada. Entonces µ ∈ M (X, T ) si, y
solamente si, f dµ ≤ P (T, f ), para todo f ∈ C(X, R).
R
Demostración. Si µ ∈ M (X, T ) entonces f dµ ≤ P (T,Rf ) por el Principio Variacional.
Ahora, supongamos que µ es una medida finita signada y f dµ ≤ P (T, f ), para todo f ∈
C(X, R). Primero demostraremos que µ sólo toma valores no negativos. Supongamos ue f ≥ 0.
Si ε > 0 y n > 0 tenemos
Z Z
n(f + ε)dµ = − −n(f + ε)dµ

≥ −P (T, −n(f + ε))


≥ −[h(T ) + sup(−n(f + ε))] por Teorema 3.5, parte b
= −h(T ) + nı́nf(f + ε) > 0
R R
R f dµ ≥ 0. Luego µ es una
para n suficientemente grande. Por lo tanto (f + ε)dµ > 0 y ası́
medida. Ahora mostraremos que µ(X) = 1. Si n ∈ Z, entonces ndµ ≤ P (T, n) = h(T ) + n,
y ası́ µ(X) ≤ 1 + h(T )/n si n > 0, luego µ(X) ≤ 1, y µ(X) ≥ 1 + h(T )/n si n < 0, luego
µ(X) ≥ 1. Por loR tanto, µ(X) = 1. Finalmente, por demostrar, µ ∈ M (X, T ). Si n ∈ Z y
f ∈ C(X, R), n (f ◦ T − f )dµ ≤ P (T, n(f ◦ T − f )) = h(T ) por Teorema
R 3.5, parte g. Si
n ≥ 1, entonces dividiendo por n y haciendo tender n a ∞ tenemos (f R◦ T − f )dµ ≤ 0, y si
n ≤ −1, entonces
R R por n y haciendo tender n a −∞ tenemos (f ◦ T − f )dµ ≥ 0.
dividiendo
Por lo tanto, f ◦ T dµ = f dµ, para todo f ∈ C(X, R), ası́, µ ∈ M (X, T ).