J Paez Calculo III

Calculo diferencial de varias variables
Javier Paez Cardenas
Indice General
Introducci
on
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 El conjunto Rn
1.1 Para empezar, algunos ejemplos . . .
1.2 Estructura algebraica de Rn . . . . .
1.3 Aspectos geometricos de Rn . . . . .
1.4 Otras normas . . . . . . . . . . . . .
1.5 Topologa de Rn . . . . . . . . . . .
1.5.1 Clasificacion de puntos . . . .
1.5.2 Conjuntos abiertos y cerrados
1.5.3 Otra clasificaci
on de puntos .
1.5.4 Conjuntos conexos . . . . . .
1.6 Otros sistemas coordenados . . . . .
1.6.1 Coordenadas polares . . . . .
1.6.2 Coordenadas cilndricas . . .
1.6.3 Coordenadas esfericas . . . .
1.7 Problemas . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Funciones de Rn en Rm
2.1 Algebra
y geometra de las funciones de Rn en Rm
2.2 Lmite y continuidad de funciones de Rn en Rm . .
2.2.1 Sucesiones en Rn . . . . . . . . . . . . . . .
2.2.2 Lmite . . . . . . . . . . . . . . . . . . . . .
2.2.3 Continuidad . . . . . . . . . . . . . . . . . .
2.2.4 Teoremas fuertes de continuidad . . . . .
2.3 Continuidad uniforme . . . . . . . . . . . . . . . .
2.4 Problemas . . . . . . . . . . . . . . . . . . . . . . .
3 La derivada de funciones de R en Rn
3.1 Geometra y movimiento . . . . . . .
3.2 La derivada . . . . . . . . . . . . . .
3.3 Propiedades de la derivada . . . . .
3.4 Derivada y geometra . . . . . . . . .
3.5 Derivada y movimiento . . . . . . . .
3.6 Problemas . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
8
16
19
20
23
27
34
43
43
47
50
53
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
70
70
76
84
90
92
100
.
.
.
.
.
.
109
. 109
. 114
. 120
. 123
. 137
. 141
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Indice General
4 La derivada de funciones de Rn en R
4.1 Un interludio de Algebra

Lineal . . . . . . . . . . .
4.2 La derivada direccional . . . . . . . . . . . . . . . .
4.2.1 Derivadas parciales . . . . . . . . . . . . . .
4.3 La derivada global . . . . . . . . . . . . . . . . . .
4.3.1 El gradiente . . . . . . . . . . . . . . . . . .
4.3.2 Otras propiedades de la derivada . . . . . .
4.3.3 La derivada en otras coordenadas . . . . . .
4.4 Derivadas direccionales de orden superior . . . . .
4.5 Aproximacion polinomial . . . . . . . . . . . . . .
4.6 Maximos y mnimos . . . . . . . . . . . . . . . . .
4.6.1 Breve comentario sobre formas cuadraticas
4.6.2 Maximos y mnimos sobre restricciones . .
4.7 Problemas . . . . . . . . . . . . . . . . . . . . . . .
Indice General
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 La derivada de funciones de Rn en Rm
5.1 La derivada . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Elementos b
asicos acerca de superficies . . . . .
5.2 Propiedades de la derivada . . . . . . . . . . . . . . .
5.2.1 Breve comentario sobre funciones coordenadas
5.3 La regla de la cadena . . . . . . . . . . . . . . . . . . .
5.3.1 Cambio de coordenadas y regla de la cadena .
5.4 El teorema de la funci
on implcita . . . . . . . . . . .
5.4.1 El caso lineal . . . . . . . . . . . . . . . . . . .
5.4.2 El caso no lineal . . . . . . . . . . . . . . . . .
5.5 El teorema de la funci
on inversa . . . . . . . . . . . .
5.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
J. P
aez
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
149
. 149
. 155
. 163
. 166
. 174
. 179
. 199
. 205
. 211
. 219
. 234
. 236
. 246
.
.
.
.
.
.
.
.
.
.
.
255
. 255
. 257
. 261
. 265
. 267
. 268
. 272
. 272
. 276
. 286
. 302
Introducci
on
El tema principal del presente texto es el referente al concepto de derivada para funciones de varias
variables, tema que constituye el n
ucleo central del curso de C
alculo Diferencial e Integral III que
se imparte en la Facultad de Ciencias de la Universidad Nacional Autonoma de Mexico.
En este trabajo partimos del supuesto de que el conjunto de conceptos y herramientas de C
alculo
Diferencial e Integral que son del dominio del lector, es aquel al que coloquialmente se le conoce
como C
alculo de una variable. Y como el lector seguramente tambien lo sabe, este nombre coloquial
se debe a que los problemas y situaciones que dan origen a este conjunto de conocimientos, son
aquellos en los que una cantidad (o variable) se puede poner en terminos de otra cantidad,
en donde cada una de estas cantidades tiene la particularidad de poderse medir, describir
o representar con un s
olo n
umero real. Esto mismo, dicho de una manera un poco m
as tecnica,
significa que el objeto matem
atico sobre el cual se contruyen estos conceptos, es el de funci
on de
una variable real con valores reales o simplemente funci
on de los reales en los reales.
Una vez dicho lo anterior, es entonces un poco m
as sencillo establecer cu
al es el objetivo fundamental de este texto: desarrollar el concepto de derivada de ese tipo de funciones en las que una
cantidad (o variable) se puede poner en terminos de otra cantidad, con la particularidad
de que alguna de estas cantidades (o ambas!) no se puede medir, describir o representar
con un s
olo n
umero real. Este tipo de funciones son conocidas en general como funciones de varias
variables, y el conjunto de conceptos y resultados que desarrollaremos alrededor de estas es parte
de lo que coloquialmente se conoce como C
alculo de varias variables.
Siguiendo este orden de ideas, los conceptos y resultados que se desarrollan en este texto se
motivan principalmente a partir de los correspondientes conceptos y resultados para el caso de
funciones de los reales en los reales, y en virtud de esta caracterstica, a lo largo de todo el texto se
intenta usar un nivel adecuado de rigor y formalismo matem
atico. Por lo anterior, en este trabajo
se parte del supuesto de que el lector conoce todos los temas b
asicos de C
alculo de una variable,
de Geometra Analtica (plana y del espacio) y de Algebra Superior. Por otra parte, dado que el
primer curso de C
alculo de varias variables se suele tomar paralelamente con el primer curso de
Algebra Lineal, en este trabajo se intenta hacer uso de algunos conceptos de esta u
ltima materia
una vez que el lector ya los haya estudiado.
Este trabajo est
a organizado en cinco captulos; a continuaci
on se da una somera y r
apida
descripcion del contenido de cada uno de ellos.
De la misma forma que para realizar un estudio m
as profundo del C
alculo de una variable
es necesario empezar por estudiar con mayor detenimiento al conjunto de los n
umeros reales, en
el caso del C
alculo de varias variables es necesario hacer el mismo tipo de estudio del conjunto
Rn . El primer captulo lo iniciamos con una serie de ejemplos con los cuales se pretende mostrar
que este conjunto resulta ser el mas id
oneo para representar a las variables (independientes
y dependientes) de las funciones para las cuales se definiran la mayora de los conceptos de
este texto. Inmediatamente despues nos damos a la tarea de explorar las diferentes estructuras
matem
aticas que este conjunto posee: su estructura algebraica, su estructura geometrica y su
i

Indice General
Indice General
estructura topol
ogica. Concluimos este captulo con un r
apido repaso sobre los diferentes sistemas
coordenados que se pueden establecer en el plano o en el espacio.
Una vez que en el captulo 1 se estableci
o que las funciones de Rn en Rm ser
an el principal objeto
matem
atico con el cual podremos describir la mayora de los problemas que dan lugar al estudio del
C
alculo de varias variables, en el captulo 2 comenzamos por hacer un r
apido estudio de sus aspectos
algebraicos y geometricos. Posteriormente nos damos a la tarea de introducir los conceptos de lmite
y continuidad de este tipo de funciones, para lo cual previamente desarrollamos la herramienta
de las sucesiones en Rn . A continuaci
on damos paso a los muy importantes teoremas fuertes de
continuidad y concluimos este captulo estudiando el concepto de continuidad uniforme.
El concepto de derivada para las funciones de Rn en Rm es el tema central de este trabajo, y
a este concepto dedicamos los restantes tres captulos. En el captulo 3 empezamos estudiando a
las funciones de R en Rn y su particular importancia en la descripcion de objetos geometricos,
y en la descripci
on del movimiento de un objeto en un plano o en el espacio. Basados en estas
caractersticas, que entre otras ventajas permiten establecer cierta similitud con el caso de funciones
de R en R, introducimos la derivada para este tipo de funciones y estudiamos su uso e interpretacion
justo en estos dos contextos: el geometrico y el cinem
atico.
La derivada para funciones de Rn en R es tal vez el primer concepto de este texto cuya definicion
resultara realmente novedosa para el lector. Esta caracterstica se ve reflejada sobre todo en la
necesidad de revisar previamente algunos conceptos importantes del Algebra

Lineal (bases ortonormales y funciones lineales), y que ser
an necesarios para poder dar dicha definicion. El captulo 4
inicia con una revisi
on del concepto de base ortonormal para despues introducir la derivada direccional, la que aun guarda una estrecha relaci
on con la derivada de funciones de R en R. Despues
de una breve revisi
on de la derivada de una funcion de R en R en terminos de funciones lineales,
se introduce el concepto de derivada (global) de una funcion de Rn en R y se prueban algunos
resultados b
asicos. A
un y cuando la mayora de los conceptos que se definen en este captulo se
tratan de introducir de manera independiente de los sistemas coordenados m
as comunes, en este
captulo se incluye una secci
on en la que se deduce la forma especfica que toman conceptos tales
como el de gradiente, cuando las funciones con las que se esta trabajando se expresan en sistemas
coordenados diferentes a los euclideanos (en los casos de R2 y R3 ). Como sucede en el caso de
las funciones de R en R, muchas de las aplicaciones pr
acticas del concepto de derivada de funciones de Rn en R est
an orientadas a la determinacion de los valores m
aximos y mnimos de este
tipo de funciones. Por esta raz
on, se introducen las derivadas direccionales (y parciales) de orden
superior y los polinomios de Taylor, los cuales son herramientas importantes para abordar estos
problemas. Y justo concluimos este captulo con un an
alisis general del problema de m
aximos y
mnimos, lo que nos conduce a un breve estudio de las formas cuadraticas (a fin de contar con una
herramienta que nos permita clasificar los puntos crticos de una funcion), y a la formulaci
on del
Teorema de los multiplicadores de Lagrange, una de la herramientas m
as importantes que hay para
la determinacion de m
aximos y mnimos de funciones sobre restricciones.
El captulo 5, con el cual concluye este trabajo, aborda el tema de la derivada de funciones
de Rn en Rm . Como es de esperarse, la definicion que se da en este captulo generaliza a las
definiciones dadas en los captulos 3 (para el caso n = 1) y 4 (para el caso m = 1) y una vez hecho
esto, se prueban resultados b
asicos relacionados con este concepto. Los teoremas m
as importantes
de este captulo son: la Regla de la Cadena (en su versi
on m
as general), el Teorema de la Funci
on
Implcita (a partir del cual se prueba el Teorema de los multuplicadores de Lagrange), y el Teorema
de la Funci
on Inversa, (a partir del cual se prueba el Teorema de la Funci
on Implcita) y para cuya
prueba es necesario desarrolar una serie de resultados.
Al final de cada uno de estos captulos, se incluye una lista de problemas con los cuales se
pretende que el lector refuerce, ponga a prueba, y en algunos casos amplie, los conceptos estudiados.
J. P
aez
ii
Captulo 1
El conjunto Rn
As como en el caso del c
alculo diferencial de una variable empezamos por estudiar al conjunto de
los n
umeros reales R, en este captulo empezaremos por analizar m
as a fondo al conjunto Rn , en
virtud de que dicho conjunto ser
a tanto el dominio (y en algunos casos el contradominio) de casi
todas las funciones con las que trabajaremos en este texto. El por que este tipo de conjuntos (para
diferentes valores de n) es la forma m
as adecuada de representar al dominio y/o contradominio de
la mayora de las funciones que se encuentran en la base del calculo de varias variables, es lo que
intentaremos mostrar en la primera secci
on de este captulo.
1.1
Para empezar, algunos ejemplos
Como mencionamos en la introducci

on, una motivacion para el desarrollo del C
alculo de varias
variables se puede encontrar en el planteamiento de ciertas situaciones en las que una cantidad
(o variable, en general) se puede poner en terminos de otra variable, con la particularidad de
que alguna de estas variables (o ambas!) no se puede medir, describir o representar con
un s
olo n
umero real. Lo que haremos en esta secci
on, ser
a presentar algunos ejemplos con estas
caractersticas.
Ejemplo 1.1 Supongamos que tenemos la suerte de contar con un dispositivo que nos permite
saber, en un cierto instante, la temperatura en cada posici
on de la habitaci
on en la que nos
encontramos. Si queremos pensar esta situaci
on en terminos mas tecnicos, lo que estamos planteando es que este dispositivo nos permite establecer una funci
on entre las distintas posiciones de
la habitaci
on y la temperarura en cada una de ellas.
De esta forma, queda claro que una de nuestras variables (la independiente, como suele
decirse) es la posici
on y la otra (la dependiente) es la temperatura.
Como seguramente el lector ya lo sabe, las diferentes posiciones en una habitaci
on no son
suceptibles de describirse con un s
olo n
umero real y con toda certeza tambien sabe que para
representar cada posici
on nos har
an falta tres n
umeros reales (e incluso tambien estar
a conciente
de que para una misma posici
on dentro de la habitaci
on, pueden haber diferentes ternas de
n
umeros que la representan, dependiendo del sistema de referencia que elijamos!).
Finalmente, la variable dependiente (en esta caso la temperatura) s se puede describir con
un s
olo n
umero real, por lo que la situaci
on que planteamos nos conduce a obtener una funci
on que
depende de tres n
umeros reales (los que describen o representan una posici
on) y que asigna otro
n
umero real (el que describe o mide la temperatura).
1
Captulo 1. El conjunto Rn
1.1. Para empezar, algunos ejemplos
El ejemplo anterior permite una variante que nos lleva a obtener una funcion con una variable
independiente diferente. Veamos de que forma.
Ejemplo 1.2 En el ejemplo anterior mencionamos que nuestro dispositivo nos permita conocer
la temperatura en cada posici
on de una habitaci
on, en un cierto instante, situaci
on que de
inmediato nos hace pensar en una nueva variable: el instante en que estamos midiendo la
temperatura.
Como el lector estar
a de acuerdo, esta nueva variable se puede medir con un s
olo n
umero real
(y tambien estar
a de acuerdo que a un mismo instante lo podr
an describir diferentes n
umeros
reales, dependiendo en donde colocamos el instante cero!).
De esta forma, considerando esa nueva variable, la funci
on que obtenemos ser
a una funci
on
cuya variable independiente estar
a dada por una posici
on y un instante, la cual se puede describir
con cuatro n
umeros reales (tres, que sirven para describir o representar la posici
on, y el cuarto para
describir el instante) y que asigna otro n
umero real (el que describe o mide la temperatura, que
es la variable dependiente).
Ejemplo 1.3 Supongamos ahora que nos encontramos a la orilla de un ro y que dentro de este
observamos una peque
na mota de polvo que se mueve como resultado de la corriente del mismo.
Esta sencilla situaci
on nos lleva de manera natural a pensar en una funci
on: aquella que, para
cada cada instante, nos da la posici
on de la mota de polvo.
Como seguramente el lector ya dedujo, en este caso las dos variables importantes son: por un
lado el tiempo (la variable independiente) que, como en el ejemplo anterior, podemos describir
con un n
umero real, y la posici
on (la variable dependiente), que como vimos en los ejemplos
anteriores, se necesitan tres n
umeros reales (o dos, si el movimiento se realizara sobre un plano)
para representarla.
As pues, este ejemplo nos lleva a considerar una funci
on que tiene como variable independiente al tiempo (que se puede medir con un s
olo n
umero real), y como variable dependiente a una
posici
on, para la cual necesitamos tres cantidades (o n
umeros) para describirla.
Ejemplo 1.4 Si todava seguimos parados a la orilla del mismo ro, podemos analizar la siguiente
situaci
on: si imaginamos al torrente del rio como un conjunto de moleculas de agua que se est
an
moviendo, pensemos en la funci
on que, en un instante dado, nos asigna la velocidad con la que
va viajando cada una de las moleculas que forman el torrente. De esta forma, nuestra funci
on
tendr
a que ser tal que, a cada posici
on dentro del ro, le asigna una velocidad.
A estas alturas nos queda claro que cada posici
on dentro del rio (la variable independiente en este caso) la podemos describir con una terna de n
umeros reales, pero la velocidad (la
variable dependiente) tal vez requiera un an
alisis aparte.
Cuando un objeto se mueve en lnea recta es f
acil covencerse que su velocidad en un instante
se puede medir por un s
olo n
umero real, pero este no es el caso si el movimiento se da en un
plano o en el espacio. Intuitivamente, si un objeto se mueve en un plano o en el espacio, su
velocidad en un instante dado se puede representar por medio de una flecha cuyo punto
inicial (u origen) se encuentra en la posici
on en la que se encuentra (en ese instante) el objeto
en cuesti
on; la direcci
on de la flecha indicar
a la direcci
on del movimiento, y su magnitud (o
longitud) indicar
a la rapidez con la que lo est
a haciendo.
Si ahora recordamos de nuestros cursos de Geometra Analtica que las flechas que parten de
un punto fijo se pueden representar (o describir) por una pareja (si estamos en el plano) o una
terna (si estamos en el espacio) de n
umeros reales, tendremos que la variable dependiente de la
funci
on que describimos anteriormente (la velocidad de cada molecula, en un instante dado) se
podr
a describir por medio de una terna de n
umeros reales.
J. P
aez
De esta forma, la funci

on que obtenemos en este ejemplo asignar
a a una terna de n
umeros
reales (la que describe la posici
on de una molecula en un cierto instante) otra terna de n
umeros
reales (la que describe la velocidad de esa molecula en ese instante).
Como en el caso de ejemplo 1.1, el ejemplo anterior permite una variante que nos conduce a
obtener una funci
on con una variable independiente diferente.
Ejemplo 1.5 Si en el ejemplo anterior, adem
as de considerar la posici
on de cada molecula del
agua del ro en un instante dado, tambien consideramos diferentes instantes, entonces obtenemos
una nueva funci
on cuya variable independiente estar
a dada por una posici
on y un instante, la
cual, como en el caso del ejemplo 1.2 se puede describir con cuatro n
umeros reales, y nos asignar
a
una velocidad (su variable dependiente) que se podr
a describir por tres n
umeros reales.
En el u
ltimo de nuestros ejemplos, mostraremos que las funciones (y sus variables) con las que
nos podemos topar, pueden ser de muy diversa ndole, y que estas no siempre est
an relacionadas
con posiciones, velocidades, tiempos o temperaturas.
Ejemplo 1.6 Supongamos que en un laboratorio de investigaci
on se encuentran realizando un
experimento en el cual, para un valor de una cierta variable x, se obtiene un valor de otra variable
y (vamos a suponer que los posibles valores de ambas variables se expresan con n
umeros reales).
El experimento se realiza para k valores diferentes de la variable x, x1 , . . . , xk , ordernados de
menor a mayor (es decir: x1 < < xk ) y se obtienen k valores de la variable y, y1 , . . . , yk . De
esta forma, se cuenta con k parejas de n
umeros reales (x1 , y1 ), . . . , (xk , yk ) las cuales se grafican
como se muestra en la figura 1.1, (a). Si el gr
afico que se obtiene (y el fen
omeno con el que se est
a
experimentando) sugieren que estos datos se deben parecer a (o encajar en) una recta, un
problema importante es encontrar la recta que mejor se ajuste a estos datos.
En este momento no vamos a ver que criterios son mejores para determinar si una recta se
ajusta bien a un conjunto de datos, y s
olo destacaremos que este problema nos conduce a considerar una funci
on cuya variable independiente es una recta y cuya variable dependiente ser
a
(como veremos m
as adelante en el captulo 4) un n
umero real.
Aun y cuando a primera vista parezca un poco ex
otico eso de considerar una funci
on cuya
variable independiente sea una recta, no lo parecer
a tanto si recordamos que toda recta (no
vertical) en un plano tiene una ecuaci
on de la forma y = mx + b, de tal manera que esta queda
totalmente determinada si conocemos m (su pendiente) y b (su ordenada al origen); es decir, toda
recta (no vertical) en el plano se puede representar por medio de la pareja de n
umeros reales
(m, b).
Tomando en consideraci
on lo anterior, podemos concluir que la funci
on a la que nos condujo
este problema terminar
a siendo una que asociar
a a un par de n
umeros reales (m, b) (que en este
caso representan a una recta, la variable independiente de la funci
on) un n
umero real.
Pero el ejemplo no termina aqu. C
omo sera la funci
on que tendramos que considerar si lo
que tenemos es que nuestro conjunto de datos se parece a (o encaja en) una par
abola? (ver
figura 1.1, (b)). Dado que las par
abolas (con eje vertical) tienen en general una ecuaci
on de la
forma y = a0 + a1 x + a2 x2 (es decir, un polinomio de grado a lo m
as 2, que est
an determinados por
sus coeficientes a0 , a1 y a2 ), la funci
on a considerar sera entonces una que asociara a una terna de
n
umeros reales (a0 , a1 , a2 ) (la cual representa a una par
abola si a2 6= 0, la variable independiente
de nuestra funci
on en este caso), un n
umero real.
Como el lector seguramente ya lo est
a imaginando, este problema lo podemos llevar mas lejos y
considerar funciones que asocien a: tetradas (si nuestros datos se parecen a (o encajan en)
3
J. P
aez
la gr
afica de un polinomio de grado a lo m
as 3), o a quntuplas (si nuestros datos se parecen
a (o encajan en) la gr
as 4), o en general, a n-adas (si
nuestros datos se parecen a (o encajan en) la gr
as n 1),
un n
umero real.
Dicho de otra forma, nuestra funci
on podra ser tal que su variable independiente fuera un
polinomio de grado a lo mas n 1 (los cuales se puede representar por medio de n-adas de
n
umeros reales).
(x7 , y7 )
(x7 , y7 )
b
b
(x5 , y5 )
(x5 , y5 )
b
(x3 , y3 )
b
(x6 , y6 )
(x6 , y6 )
(x3 , y3 )
(x4 , y4 )
(x1 , y1 )
b
(x1 , y1 )
(x4 , y4 )
(x2 , y2 )
(x2 , y2 )
(a)
(b)
Figura 1.1: Los datos de un experimento, representados por cada pareja (xi , yi ), sugieren que estos
encajan en una recta (a) o en una par
abola (b).
Como resultado de esta larga lista de ejemplos, y de acuerdo con la intenci
on original de presentarlos, resumiremos algunas de las caractersticas que tienen las variables (y/o valores) de
las funciones que describimos en ellos:
1. las variables (y/o valores) de estas funciones pueden ser de muy diversos tipos,
2. estas variables (y/o valores) siempre son suceptibles de representarse (describirse o
medirse) por una cierta cantidad de n
umeros reales (dos, tres, cuatro o m
as!),
3. esta representaci
on no es u
nica y en general depende del sistema de referencia que se
elija.
Las caractersticas anteriores son muy importantes y algunas de ellas explican algunos de los
terminos que se suelen usar cuando nos referimos a la materia que nos ocupa, como es el caso del
termino: C
alculo de varias variables. Este termino tiene su origen en la segunda caracterstica que
mencionamos, pues las diferentes cantidades que se necesitan para representar a la variable
independiente de una funci
on, tambien se consideran variables, de ah que las funciones con las
que se trabajara dependan de varias variables.
Otra importante observaci
on que se debe hacer a partir de la segunda caracterstica (sin duda
la m
as importante), es que la representacion de las variables (y/o valores) de estas funciones
por medio de parejas, ternas, tetradas, o en general, n-adas de n
umeros reales, es un proceso
que se suele realizar en el contexto de un concepto m
as amplio, el de espacio vectorial, y del
cual el conjunto de posiciones (o flechas que parten de un mismo punto) de un plano (o las
correspondientes en el espacio), o el conjunto de polinomios de grado menor o igual a n 1 (que
mencionamos en el ejemplo 1.6), son ejemplos particulares de este tipo de espacios.
J. P
aez
1.2. Estructura algebraica de Rn
Aunque el lector posiblemente todava no este muy familiarizado con este concepto, pronto
aprendera (en su curso de Algebra

Lineal I) que un espacio vectorial es un conjunto V que est
a
dotado de dos operaciones: una suma y una multiplicaci
on por escalares (que, cuando dichos
escalares son n
umeros reales, decimos que V es un espacio vectorial sobre los n
umeros reales),
operaciones a las cuales se le suelen pedir ciertas propiedades.
Tambien pronto sabra que, si = {v1 , . . . , vn } es un subconjunto de V que tiene la propiedad
de que cualquier otro elemento v V se puede escribir de manera u
nica como combinaci
on lineal
de los elementos de (es decir, que existen 1 , . . . , n R, u
nicos, tales que v = 1 v1 + + n vn )
entonces se dice que es una base para V .
Este concepto de base es muy importante pues apoyandose en el es que se establece la representacion de cada elemento v V por medio de una n-ada de n
umeros reales (1 , . . . , n ), y
hacer esta representaci
on por medio de diferentes bases, es lo que est
a intimamente relacionado con
los diferentes sistemas de referencia que mencionamos en el inciso 3. Cuando V tiene una base
de este tipo decimos que V es un espacio vectorial (sobre los n
umeros reales) de dimension finita,
especficamente de dimension n.
De esta u
ltima observaci
on, se desprende que las variables (independientes o dependientes) de las funciones con las que trabajaremos en este texto, se pueden ver como elementos de
un cierto espacio vectorial (lo que por cierto tambien explica por que a todo este conjunto de
conceptos y resultados relacionados con estas funciones, tambien se les conoce con el nombre de:
C
alculo vectorial).
Por lo anterior, las funciones con las que vamos a trabajar deberan de estar consideradas, en
general, como funciones definidas sobre un subconjunto de un espacio vectorial V y con contradominio sobre otro espacio vectorial W (ambos sobre los n
umeros reales y de dimension finita).
Sin embargo, dado que cualquier espacio vectorial de este tipo se puede representar por medio
del conjunto de n-adas de n
umeros reales (aunque esta representacion no sea u
nica y dependa
de la base (o sistemas de referencia) que se elija, lo que siempre habra que recordar), a lo largo
de este trabajo vamos a suponer que nuestras funciones estar
an definidas sobre alg
un subconjunto
de estas n-adas, y tomar
an sus valores (en general) sobre alg
un conjunto de m-adas (aunque
se oiga un poco feo!).
A pesar de la observaci
on anterior, en algunas ocasiones y para definir ciertos conceptos, no ser
a
necesario hacer referencia a la representacion por medio de n-adas de los elementos de un cierto
espacio vectorial. En estos casos usaremos letras del tipo x
y y para denotar a estos elementos y
escribiremos simplemente (no sin cometer cierto abuso de notaci
on) x
Rn o y Rn .
Y justo por lo dicho en los p
arrafos anteriores, lo siguiente que haremos ser
a estudiar de manera
m
as detallada al conjunto Rn .
1.2
Estructura algebraica de Rn
Pensar al conjunto Rn como una forma de representar a un espacio vectorial (sobre los reales y de
dimension n), tiene la ventaja de que la estructura algebraica de este u
ltimo se puede exportar
n
o trasladar a R . Justo esto es lo que nos proponemos hacer en esta secci
on. Antes de hacerlo,
recordemos que el conjunto Rn est
a formado por las n-adas ordenadas (x1 , . . . , xn ) en donde cada
xi (a quien llamaremos la i-esima coordenada de (x1 , . . . , xn )) es un n
umero real, es decir
Rn := {(x1 , . . . , xn ) | xi R, i = 1, . . . , n}
y que tambien se suele decir que este conjunto es n veces el producto cruz (de conjuntos) de R
consigo mismo.
5
J. P
aez
A fin de motivar las operaciones que vamos a definir en Rn , pensemos en el conjunto de todas las
flechas del plano que comparten un punto inicial fijo, al que denotaremos por 0 y que llamaremos
origen. Es un hecho conocido que en este conjunto podemos definir (geometricamente y sin
necesidad de recurrir a su representaci
on por medio de parejas ordenadas) una operaci
on de suma
de flechas, y una de multiplicaci
on de un escalar real por una flecha, lo que permite comprobar
que dicho conjunto se puede ver como un espacio vectorial.
Para definir la suma de las flechas (o vectores), utilizamos la llamada ley del paralelogramo
que consiste en tomar el vector y y trasladar su punto inicial al punto final del vector x
, de tal
forma que el vector que parte del origen y termina en el punto final del vector y (trasladado), ser
a
la flecha a la que llamaremos x
+ y (ver figura 1.2, (a)).
Para la definicion del producto de un escalar R por una flecha x
, que denotaremos por
x, tomamos cualquier recta real que pase por el origen 0 y que no contenga al vector x
, y
realizamos la construccion de tri
angulos semejantes que se describe en la figura 1.2, (b))
x
+ y
1
b
x
(a)
(b)
Figura 1.2: La suma (a) y el producto por un escalar (b) de vectores en R2

Lo importante de haber hecho la definicion geometrica de estas operaciones es que, si ahora
establecemos un sistema de referencia que nos permita tener una representacion de estas flechas en
terminos de parejas de n
umeros reales, obtenemos una forma de sumar y multiplicar por un escalar
dichas parejas (suma y multiplicaci
on por un escalar de parejas con las que seguramente el lector
coincidira en que es la forma m
as natural de definirlas).
Para obtener una base (o un sistema de referencia, que es como les vamos a llamar de aqu
en adelante) que nos permita representar a cualquier flecha por medio de una pareja de n
umeros
reales, es suficiente con elegir dos de estas flechas (que denotaremos por v1 y v2 ) y que simplemente
no se encuentren sobre la misma recta (sin importar que el angulo que formen no sea recto, y que
sean de diferente longitud) (ver figura 1.3).
Si ahora las parejas (x1 , x2 ) y (y1 , y2 ) representan, respectivamente, a la flecha x
y a la flecha
y en el sistema de referencia dado, lo que significa que
x
= x1 v1 + x2 v2
y = y1 v1 + y2 v2
y que simplemente expresaremos escribiendo que x

= (x1 , x2 ) y y = (y1 , y2 ), uno puede comprobar
(geometricamente) que las flechas x
+ y y
x estar
an representadas, respectivamente, por las parejas
(x1 + y1 , x2 + y2 ) y (x1 , x2 ), es decir que
x
+ y = (x1 + y1 , x2 + y2 )
J. P
aez
y
6
x = (x1 , x2 )
b
x2 v2
b
v2
b
x1 v1
b
v1
b
0
Figura 1.3: Significado geometrico del hecho de que la pareja (x1 , x2 ) represente a la flecha (o vector)
x
.
Este procedimiento, que consiste en definir ciertos conceptos (en este caso la suma y producto
por un escalar en el conjunto de las flechas) partiendo de lo geometrico para despues determinar
como se expresan dichos conceptos en terminos de la representacion por n-adas (en este caso
parejas), es un procedimiento al que recurriremos con mucha frecuencia para dotar al conjunto
Rn de varias de sus estrucuturas, tanto algebraicas como geometricas.
De hecho, con base en lo anterior definimos en el conjunto Rn un par de operaciones, una suma
y un producto por escalares (reales), de la siguiente forma:
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn )
y
(x1 , . . . , xn ) := (x1 , . . . , xn )
para R.
Es muy facil probar que todas las propiedades que tiene la suma de n
umeros reales, se heredan
n
a esta suma definida en R ; en particular, a la n-ada cuyas coordenadas son todas cero lo llamaremos
el origen y la denotaremos por
0, es decir
0 := (0, . . . , 0)
del mismo modo que si x
= (x1 , . . . , xn ), denotaremos por
x a la n-ada (x1 , . . . , xn ), es decir
x := (x1 , . . . , xn ) = (1)(x1 , . . . , xn )
lo que a su vez aprovecharemos para definir la resta de elementos en Rn (la cual, como en el caso
de R, no es mas que una suma encubierta), de la siguiente manera: si x
, y Rn definimos
x
y := x
+ (
y)
y que, si pensamos a x
y y como flechas en el plano o en el espacio, la flecha x
y coincide con ser
la flecha que se obtiene uniendo el punto final de y con el punto inicial de x
, trasladada al origen,
como se muestra en la figura 1.4 para el caso del plano.
Para concluir esta breve secci
on, simplemente resaltaremos el hecho de que en Rn existen dos
propiedades distributivas: el producto por un escalar distribuye a la suma de elementos en Rn , y el
producto de un elemento de Rn distribuye a la suma de escalares, es decir, si x
, y Rn y , R,
entonces
(
x + y) =
x +
y y ( + ) x
=
x + x
J. P
aez
1.3. Aspectos geometricos de Rn
x
y
b
y
b
Figura 1.4: Construccion geometrica del vector x

y
1.3
Aspectos geom
etricos de Rn
Como vimos en la secci

on anterior, para establecer una correspondencia entre los puntos o flechas
del plano con las parejas ordenadas de n
umeros reales, no es necesario elegir un sistema de referencia
en el que las flechas que lo formen tengan que ser perpendiculares ni de la misma longitud. Tomarlas
de esta forma, en cuyo caso diremos que nuestro sistema de referencia es un sistema coordenado
cartesiano 1 , es una libertad adicional que nos podemos dar, y que nos permitira trasladar al
conjunto Rn toda la estructura geometrica que este concepto de perpendicularidad conlleva.
De esta forma, cuando a la pareja (x1 , x2 ) o a la terna (x1 , x2 , x3 ) de n
umeros reales la usamos
para designar a una flecha (o vector) de un cierto sistema coordenado cartesiano, la longitud (o
magnitud) de esta flecha es una cantidad que podemos escribir en terminos de las coordenadas
correspondientes. La expresi
on algebraica que representa a esta cantidad se deduce facilmente
usando el Teorema de Pit
agoras (como se muestra en la figura 1.5), y est
a dada por
para el caso del plano (R2 ), y por
q
q
x21 + x22
x21 + x22 + x23
para el caso del espacio (R3 ). Es importante resaltar que si la pareja o la terna designa a un punto
(en lugar de una flecha), estas expresiones lo que representan es la distancia que hay entre dicho
punto y el origen.
Tomando como base las expresiones anteriores, a cada x
= (x1 , . . . , xn ) Rn (para cualquier
n N) le asociaremos un n
umero real positivo, al que llamaremos la norma (euclideana) de x
, y
que denotaremos por k
xk. Este nuevo concepto est
a definido de la siguiente manera.
Definici
on 1.7 Para cada x
= (x1 , . . . , xn ) Rn definimos la norma (euclideana) de x
, que
denotamos por k
xk, como
q
(1.1)
k
xk := x21 + x22 + + x2n
Aun y cuando n sea mayor que 3, y de acuerdo con la interpretacion como una distancia que se
le da a dicha expresi
on para el caso en que n = 2 o n = 3, en general diremos que el n
umero k
xk
representa la distancia entre el punto determinado por x
y el origen 0.
1
Nombrado as en recuerdo de Rene Descartes (La Haye, Turena francesa, 31 de marzo de 1596 - Estocolmo,
Suecia, 11 de febrero de 1650), tambien llamado Renatus Cartesius, quien fue un fil
osofo, matem
atico y fsico frances,
considerado como el padre de la geometra analtica y de la filosofa moderna, as como uno de los nombres m
as
destacados de la revoluci
on cientfica. (fuente: Wikipedia).
J. P
aez
p x21
Figura 1.5: La cantidad
x2
x2
x1
= (x1 , x2 ).
x21 + x22 representa la magnitud del vector x
A fin de explorar las propiedades del concepto que acabamos de definir, vale la pena hacer
notar que si en esta definicion tomamos n = 1 (en cuyo caso nuestro conjunto coincide con ser
R), entonces la norma no es otra cosa m
as que el conocidsimo concepto de valor absoluto de los
n
umeros reales, lo que por cierto, nos permite pensar al concepto de norma como una generalizaci
on
n
a R del correspondiente concepto de valor absoluto de los n
umeros reales.
Es precisamente a partir de este hecho, y recordando las propiedades m
as elementales del valor
absoluto, que podemos establecer la siguiente
Proposici
on 1.8 La norma (euclideana) satisface las siguientes propiedades:
1. k
xk 0 para toda x
Rn y k
xk = 0 si y solo si x
= 0
2. k
xk = || k
xk para toda x
Rn y para toda R
3. k
x + yk k
xk + k
y k para cualesquiera x
, y Rn
(desigualdad del tri

angulo)
Demostraci
on. Las afirmaciones de los incisos 1 y 2 son inmediatas, y la prueba del inciso 3
requiere un nuevo concepto que desarrollaremos a continuaci
on.
Para poder probar el inciso tres de la proposici
on 1.8 introduciremos un nuevo concepto el cual
vamos a motivar a partir de un problema geometrico muy sencillo: dados dos vectores x
, y R2 ,
distintos de 0, cual es el escalar R que hace que los vectores x

y y y sean perpendiculares?
(ver figura 1.6).
x
y
Figura 1.6: Cu
al es el valor de que hace que los vectores x

y y y sean perpendiculares?
9
J. P
aez
Supongamos que los vectores x

y y tienen coordenadas (x1 , x2 ) y (y1 , y2 ), respectivamente. Dado
que deseamos que el tri
angulo formado por los vectores x
, x

y y
y sea un tri
angulo rect
angulo,
por el teorema de Pit
agoras debemos tener que
k
y k2 + k
x
y k2 = k
xk 2
(1.2)
lo cual, escrito en terminos de las coordenadas de los vectores, se traduce en

p
(y1
)2
+ (y2
)2
2
p
(x1 y1
)2
+ (x2 y2
)2
2
q
x21
x22
2
Cancelando los cuadrados con las races cuadradas, desarrollando los cuadrados que se encuentran dentro de la segunda raz cuadrada y cancelando y factorizando los terminos iguales, llegamos
a que debe de satisfacer la ecuaci
on

22 y12 + y22 2 (x1 y1 + x2 y2 ) = 0
la cual tiene las soluciones = 0 y
x1 y 1 + x2 y 2
x1 y 1 + x2 y 2
=
2
2
y1 + y2
k
y k2
(1.3)
Es importante observar que la soluci

on = 0 no tiene mucho que ver con el problema planteado
puesto que, independientemente de la posici
on de x
y y, tomando este valor de siempre se satisface
la ecuaci
on 1.2. Por esta raz
on, la segunda soluci
on de la ecuaci
on es la importante para el problema
que planteamos.
La expresi
on x1 y1 + x2 y2 (que aparece en el numerador de la expresi
on del n
umero que
calculamos renglones arriba) resultara ser muy relevante a la hora de precisar un concepto que hasta
ahora s
olo podemos manejar de una forma muy intuitiva: el angulo formado por los vectores x
y y.
La sospecha de que existe una relaci
on entre esta expresi
on y el concepto de angulo, la podemos
reforzar si en el problema que planteamos anteriormente observamos que, si los vectores x
y y
ya fueran perpendiculares, la u
nica soluci
on sera = 0 de donde se concluye que la expresi
on
x1 y1 + x2 y2 tendra que ser 0. Esto se puede confirmar con algunos ejemplos, como sera el caso de
los vectores (1, 0) y (0, 1), que de acuerdo con el sistema coordenado con el que estamos trabajando,
este se tom
o de tal forma que dichos vectores son perpendiculares (seguramente el lector podr
a
verificar en muchos m
as casos especficos que la perpendicularidad de dos vectores se corresponde
con el hecho de que la expresi
on x1 y1 + x2 y2 vale 0).
Tambien es facil verificar que, dado un vector x
= (x1 , x2 ) 6= 0 entonces el vector y = (x2 , x1 ) 6=
0 es perpendicular a x
puesto que junto con el vector x
y forman un tri
angulo rect
angulo, lo que
se deduce del hecho de que dicho tri
angulo satisface el teorema de Pit
agoras:
k
x yk2 = k(x1 , x2 ) (x2 , x1 )k2
= (x1 + x2 )2 + (x2 x1 )2

= x21 + x22 + (x2 )2 + x21
= k
xk2 + k
y k2
(ver figura 1.7).
J. P
aez
10
x1
x
y
x2
x1
x2
Figura 1.7: Los vectores x

= (x1 , x2 ) y y = (x2 , x1 ) son perpendiculares
mientras que, por otra parte, es facil ver que en este caso tambien se tiene que
x1 y1 + x2 y2 = x1 (x2 ) + x2 x1
=0
Ademas de hacernos sospechar que la perpendicularidad entre los vectores x
y y est
a ntimamente
relacionada con el hecho de que la expresi
on x1 y1 + x2 y2 es igual a cero, de la identidad 1.3 y las
figuras 1.8 deducimos que esta expresi
on debe ser positiva si el angulo formado por los vectores es
agudo (mayor que 0 y menor que /2), y negativa si el angulo formado por los vectores es obtuso
(mayor que /2 y menor que ).
Con el fin terminar de reforzar nuestras sospechas sobre la relaci
on que esta expresi
on tiene
con el concepto de
angulo entre dos vectores, ahora vamos a resolver el problema planteado
inicialmente recurriendo justamente a este concepto, y a las funciones trigonometricas b
asicas
que se definen con base en este.
Si es el
y y, y este es agudo (es decir que 0 < < /2),
sabemos que > 0 (ver figura 1.8 (a)) y que
k
yk
k
xk
k
yk
=
k
xk
cos() =
Si es un
angulo obtuso (es decir que /2 < < ), sabemos que < 0 (ver figura 1.8 (b)) y que
cos() = cos( )
k
yk
=
k
xk
k
yk
=
k
xk
de tal forma que en ambos casos obtenemos que
=
k
xk cos()
k
yk
11
J. P
aez
(a)
(b)
Figura 1.8: El calculo de usando el angulo

Si ahora igualamos los valores que hemos obtenido de por estos dos caminos, tenemos que
x1 y 1 + x2 y 2
2
k
yk
de donde
cos() =
k
xk cos()
k
yk
x1 y 1 + x2 y 2
k
xk k
yk
(1.4)
Esta u
ltima identidad es sin duda toda una revelacion en virtud de que nos proporciona una
forma m
as especfica y rigurosa de medir al angulo formado por los vectores x
y y en terminos
de sus coordenadas. En efecto, de la igualdad anterior obtenemos que

1 x1 y1 + x2 y2
(1.5)
= cos
k
xk k
yk

x1 y 1 + x2 y 2
= arccos
k
xk k
yk
en donde elegimos la rama de la funci
on arccos que toma sus valores en el intervalo [0, ].
Que la identidad anterior es una buena forma de medir dicho angulo se confirma si observamos,
por ejemplo, que este n
umero no vara, como es de esperarse, si tomamos otro par de vectores
que apunten en las mismas direcciones en las apuntan los vectores x
y y, respectivamente. Esta
condici
on se traduce en tomar vectores de la forma
x y
y , con , > 0; en este caso se tiene
que, si x
= (x1 , x2 ) y y = (y1 , y2 ) entonces
x = (x1 , x2 ) y
y = (y1 , y2 ) de tal forma que
si llamamos al
angulo formado por los vectores
x y
y y lo calculamos en terminos de sus
coordenadas, de acuerdo con la ecuaci
on 1.5, se tiene que

1 (x1 )(y1 ) + (x2 )(y2 )
= cos
k
xk k
yk

(x
y
+
x
y
1 1
2 2)
1
= cos
k
xk k
yk

1 x1 y1 + x2 y2
= cos
k
xk k
yk
=
Notese que este u
ltimo hecho nos permite suponer que los vectores x
y y tienen norma 1, puesto
que si este no fuera el caso, bastara con tomar = 1/ k
xk y = 1/ k
y k para que los vectores
xy
J. P
aez
12
y s tuvieran norma 1 (por cierto que, cuando a un vector x

6= 0 le aplicamos este procedimiento
de multiplicarlo por el recproco de su norma, diremos que hemos normalizado al vector x
; es
decir, normalizar al vector x
significara tomar el vector (1/ k
xk)
x, el vector que est
a en la misma
direcci
on que x
y cuya norma es 1). Recurriremos con tanta frecuencia a este procedimiento de
normalizacion, que en lugar de escribir (1/ k
xk)
x simplemente escribiremos x
/ k
xk.
Resumiendo toda la discusion anterior y a partir de las identidades 1.4 y 1.5, podemos concluir
que la expresi
on x1 y1 + x2 y2 contiene la informaci
on suficiente como para poder calcular el
y y, en donde (x1 , x2 ) es la pareja que representa (en un
sistema coordenado cartesiano) a x
y (y1 , y2 ) la que representa a y. Por esta raz
on, y con base en
esta expresi
on, definiremos sobre el conjunto Rn otra operaci
on (a la que llamaremos el producto
punto (o el producto interior)) entre dos elementos x
, y Rn , y que denotaremos por x
y, de
la siguiente manera.
Definici
on 1.9 Dados x
, y Rn , con x
= (x1 , . . . , xn ) y y = (y1 , . . . , yn ), definimos el producto
punto (o producto interior) de x
y y, que denotaremos por x
y, como el n
umero real dado por
x1 y1 + + xn yn , es decir
x
y := x1 y1 + + xn yn
n
X
xi y i
:=
i=1
Esta nueva operaci

on tiene una serie de propiedades b
asicas, las cuales resumimos en la siguiente
Proposici
on 1.10 Dados x
, y, z Rn y R, el producto punto de vectores definido en 1.9
satisface las siguientes propiedades:
1. x
x
0yx
x
= 0 si y s
olo si x
= 0
2. x
y = y x
3. x
(
y + z) = x
y + x
z
4. (
x) y = x
(
y ) = (
x y)
Ademas de mencionar que la demostracion de estas propiedades es muy sencilla (y que por esta
raz
on se deja como ejercicio al lector), es importante se
nalar que cualquier otra funcion definida de
n
n
R R en R que las satisfaga, tambien se le llamar
a un producto punto (o producto interior).
Si bien es cierto que es importante mostrar que la funcion dada en la definicion 1.9 satisface
las propiedades de la proposici
on anterior (pues con ello se prueba que dicha funcion s es un
producto punto), tambien es importante destacar la ntima relaci
on que existe entre este producto
y el concepto de norma euclideana que definimos anteriormente, la cual queda expresada en la
identidad
k
xk2 = x
x
(1.6)
Pero sin lugar a dudas la propiedad m
as importante que hay que destacar de esta nueva operaci
on, est
a relacionada con la identidad 1.4. En efecto, si escribimos esa misma identidad usando
la notaci
on del producto punto, esta se traduce en la siguiente identidad:
cos() =
x
y
k
xk k
yk
13
(1.7)
J. P
aez
la cual, por ahora, s

olo podemos dar por cierta para el caso de R2 , y sin ignorar que su demostracion
se obtiene a partir de nuestro (no muy bien definido) concepto de angulo y su relaci
on con las
funciones trigon
ometricas (las que por cierto, si est
an bien definidas).
La conclusion m
as importante que podemos obtener de la identidad 1.7 se deduce del hecho de
que los valores de la funci
on coseno se encuentran entre 1 y 1. En efecto, tomando en cuenta
esto tendremos entonces que, para cualesquiera par de vectores x
, y R2 diferentes de 0, se debe
cumplir que
|
x y|
1
k
xk k
yk
o que
|
x y| k
xk k
yk
(1.8)
para cualesquiera par de vectores x

, y R2 (n
otese que si alguno de estos vectores fuera 0, entonces
se satisface la igualdad).
Lo interesante de la desigualdad 1.8 es que no involucra a ning
un angulo y tiene todo el sentido
n
preguntarse si es valida en cualquier R . Y lo mejor de todo es que la respuesta a esta pregunta es
positiva! En efecto, la desigualdad 1.8 es valida para cualquier par de vectores en Rn y es conocida
como la desigualdad de Cauchy-Schwarz 2 .
Esta desigualdad jugar
a un papel muy importante a lo largo de todo este texto, y por esta
misma raz
on le concederemos el nivel de teorema.
Teorema 1.11 (Desigualdad de Cauchy-Schwarz) Para cualesquiera par de vectores x
, y
n
R se satisface que
|
x y| k
xk k
yk
Demostraci
on. Como ya se menciono, esta desigualdad es inmediata si x
o y es el vector
0.
Por esta raz
on, supondremos que x
y y son distintos de 0. Asimismo, probar la desigualdad del
enunciado es equivalente a probrar que

x
y
|
x y|

1
=

k
xk
k
yk
k
xk k
yk
por lo que tambien podemos suponer que k
xk = k
y k = 1.
Una vez establecido lo anterior, por los incisos 1 y 3 de la proposici
on 1.10 y la identidad 1.6,
sabemos que
0 (
x y) (
x y)
=x
x
2
x y + y y
= 2(1 x
y)
de donde concluimos que
x
y 1
Con base en las mismas propiedades, tambien sabemos que
0 (
x + y) (
x + y)
2
Llamada as en honor del matem

atico frances Augustin Louis Cauchy (Pars, 21 de agosto de 1789 - Sceaux, 23
de mayo de 1857), quien la public
o en 1821, y del matem
atico alem
an Karl Hermann Amandus Schwarz (25 de enero
1843 - 30 de noviembre 1921), quien la public
o en 1888. Aunque dicha desigualdad tambien fue establecida por el
matem
atico ruso Viktor Yakovlevich Bunyakovsky (Bar, Ucrania, 16 de diciembre 1804 - San Petesburgo, Rusia, 12
de diciembre 1889) en 1859. (fuente: Wikipedia).
J. P
aez
14
=x
x
+ 2
x y + y y
= 2(1 + x
y)
y ahora concluimos que
1 x
y
con lo que hemos probado que
1 x
y 1
o equivalentemente, que
|
x y| 1
que es lo que dese
abamos demostrar.
Es importante llamar la atenci
on del lector al hecho de que en esta prueba no hubo necesidad
de recurrir a las coordenadas de los vectores x
y y, y que las herramientas importantes fueron las
propiedades b
asicas del producto punto y su relaci
on con la norma.
Lo relevante de esta observaci
on es que, si definimos otro producto punto sobre el conjunto
Rn que satisfaga las propiedades de la proposici
on 1.10, y con base en este otro producto punto
definimos otra norma por medio de la identidad 1.6, esta otra norma satisfacer
a las propiedades
de la proposici
on 1.8 y la desigualdad de Cauchy-Schwarz, usando ese otro producto punto y esa
otra norma, seguira siendo cierta!.
Como una primera muestra de la importancia y utilidad de la desigualdad de Cauchy-Schwarz,
ahora la usaremos para probar el inciso 3 de la proposici
on 1.8 (la desigualdad del tri
angulo), junto
con otra desigualdad que tambien nos resultara muy u
til a lo largo de este texto.
Proposici
on 1.12 Para cualesquiera par de vectores x
, y Rn se satisface que:
1. k
x + yk k
xk + k
yk

angulo)
2. |k
xk k
y k| k
x + yk
Demostraci
on. Para la prueba de la desigualdad del tri
angulo (inciso 1), con base en la identidad
1.6 y la desigualdad de Cauchy-Schwarz, tenemos que
k
x + yk2 = (
x + y) (
x + y)
=x
x
+ 2
x y + y y
= k
xk2 + 2
x y + k
y k2
k
xk2 + 2 k
xk k
y k + k
y k2
(desigualdad de Cauchy-Schwarz)
= (k
xk + k
y k)2
de modo que, sacando raz cuadrada, llegamos a la desigualdad deseada.

Para la prueba del inciso 2, dado que
k
xk = k(
x + y) + (
y )k
usando el inciso anterior (la desigualdad del tri
angulo) y el hecho de que k
y k = k(1)
y k = k
yk
(inciso 2 de la proposici
on 1.8), se tiene que
k
xk = k(
x + y) + (
y )k
15
J. P
aez
1.4. Otras normas

k
x + yk + k
yk
y por lo tanto
k
xk k
yk k
x + yk
Analogamente, dado que k
y k = k(
x + y) + (
x)k, obtenemos que
k
y k = k(
x + y) + (
x)k
k
x + yk + k
xk
de donde
k
x + yk k
xk k
yk
es decir, que
k
x + yk k
xk k
y k k
x + yk
lo cual es equivalente a la desigualdad que se deseaba probar.
Para concluir esta secci
on, recordemos que la desigualdad de Cauchy-Schwarz nos fue sugerida
a partir de la identidad 1.7, identidad que surge de un problema geometrico el cual, a su vez, se
poda resolver a partir del concepto de
angulo. Todo ello en el plano, o en el conjunto R2 (pensando
a este conjunto como una representaci
on de dicho plano).
Lo importante de la prueba anterior es que esta es valida para cualquier Rn , y con base en la
misma identidad, podemos extender (y definir de manera m
as precisa) el concepto de angulo entre
cualquier par de elementos (distintos de 0) de este conjunto, y por lo tanto, definir el concepto de
angulo entre cualquier par de elementos (distintos de 0) del espacio espacio vectorial representado
por el conjunto Rn (como por ejemplo, el espacio de los polinomios de grado menor o igual a n 1).
Por todo lo anterior, damos la siguiente
Definici
on 1.13 Sean x
, y Rn distintos del 0. Definimos el
angulo (agudo) entre x
y y como el
n
umero dado por la f
ormula

x
y
1
:= cos
k
xk k
yk

x
y
:= arccos
k
xk k
yk
(donde cos1 (o arccos) es la funci
on inversa de cos que tiene como contradominio el intervalo
[0, ]).
1.4
Otras normas
Como el lector habra notado, todo lo realizado en la secci

on anterior est
a basado en lo que comunmente conocemos como geometra euclideana. La idea de esta secci
on es mostrar que, en
particular el concepto de longitud (o magnitud, o distancia al origen, o valor absoluto) de un
elemento x
= (x1 , . . . , xn ) Rn se puede definir de otras formas, sin necesidad de recurrir a la
geometra euclideana, y conservando las propiedades elementales que tiene la norma euclideana (y
que establecimos en la proposici
on 1.8).
Sin que se pretenda profundizar en el tema, ahora es prudente mencionar que a cualquier
funcion de Rn en los reales no negativos (conjunto al que denotaremos por R+ ) que satisfaga las
J. P
aez
16
1.4. Otras normas
propiedades establecidas en la proposici

on 1.8, se le conoce con el nombre de norma. Y aunque
existe (literalmente) una infinidad de maneras de definir una norma en Rn (en realidad, muchas
de ellas son muy parecidas), en esta breve secci
on s
olo abordaremos dos de ellas; la norma uno
(que denotaremos por kk1 ) y la norma infinito (que denotaremos por kk ), que definimos de la
siguiente manera.
Definici
on 1.14 Dado x
= (x1 , . . . , xn ) Rn , definimos:
1. la norma uno de x
, que denotamos por k
xk1 , como
k
xk1 := |x1 | + + |xn |
2. la norma infinito de x
, que denotamos por k
xk , como
k
xk := max{|x1 | , . . . , |xn |}
Queda como un ejercicio para el lector probar que las funciones definidas arriba satisfacen las
propiedades enlistadas en la proposici
on 1.8, con lo que de paso quedar
a justificado el hecho de que
a dichas funciones les llamemos normas.
Aun y cuando estas otras normas tienen algunas diferencias importantes con la norma euclideana
(en particular, para ninguna de estas normas se puede definir alg
un producto punto en Rn que
satisfaga lo equivalente a la identidad 1.6), en cuanto a formas de medir la longitud (o magnitud,
o distancia al origen, o valor absoluto) de un elemento x
Rn no resultan ser tan diferentes.
En efecto, en la u
nica proposici
on que enunciaremos en esta secci
on, mostraremos que todas
estas normas est
an relacionadas a traves de ciertas desigualdades las cuales permitiran establecer
que ciertos conceptos tales como: estar en el interior de un conjunto, estar en el exterior de
un conjunto, y estar en la frontera de un conjunto, y para cuya definicion necesitamos de una
norma, todos ellos resultaran ser iguales sin importar que norma usemos.
Proposici
on 1.15 Para cualquier elemento x
Rn se satisfacen las siguientes desigualdades:
1. k
xk k
xk
2.
1
n
n k
xk
k
xk1 k
xk k
xk1
Demostraci
on. Dado que el cuadrado de un n
umero real siempre es no negativo, se tiene que
x2i x21 + + x2n
de modo que
|xi |
x21 + + x2n = k
xk
(1.9)
y como la desigualdad anterior es valida para toda i {1, . . . , n}, concluimos que
k
xk = max{|x1 | , . . . , |xn |} k
xk
Por otra parte, como
|xi | max{|x1 | , . . . , |xn |} = k
xk
(para toda i {1, . . . , n}) entonces x2i k

xk2 de modo que
k
xk2 = x21 + + x2n k
xk2 + + k
xk2 = n k
xk2
17
J. P
aez
1.4. Otras normas
es decir
k
xk
n k
xk
con lo que concluimos la prueba de las dos desigualdades del primer inciso.
Para la primera desigualdad del segundo inciso, observese que
|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)
de tal forma que, por la desigualdad de Cauchy-Schwarz, tenemos que
|x1 | + + |xn | = (1, . . . , 1) (|x1 | , . . . , |xn |)
k(1, . . . , 1)k k(|x1 | , . . . , |xn |)k

q
= n |x1 |2 + + |xn |2
q
= n x21 + + x2n
xk
= n k
Para la segunda desigualdad, observe que

x
= (x1 , . . . , xn )
= (x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )
de tal forma que, por el problema 5 concluimos que
k
xk = k(x1 , 0, . . . , 0) + (0, x2 , 0, . . . , 0) + + (0, 0, . . . , 0, xn )k
k(x1 , 0, . . . , 0)k + + k(0, 0, . . . , 0, xn )k
= |x1 | + + |xn |
= k
xk1
que es la desigualdad que se deseaba probar.

on mencionaremos la importancia adicional que tiene el hecho de que en
Rn podamos contar con al menos una norma (de hecho, hasta ahora en Rn tenemos tres!).
Como mencionamos anteriormente, el concepto de norma nos permite hablar de la longitud
(o magnitud, o distancia al origen, o valor absoluto) de un elemento x
Rn . Si en particular
pensamos a la norma como una forma de medir la distancia que hay entre el punto representado
por el elemento x
Rn y el origen
0, esta interpretacion nos permite entonces hablar de la distancia
entre cualesquiera dos elementos x
, y Rn ; en efecto, dados estos dos elementos, en virtud de que
ax
y lo podemos pensar como la flecha que tiene punto inicial en y y punto final en x
, la norma
de este vector ser
a una medida de la distancia entre estos dos puntos.
Si recordamos que en Rn hemos definido tres normas diferentes, con base en el razonamiento
anterior estamos en condiciones de establecer tres formas diferentes de medir la distancia entre
elementos de Rn . Sin embargo, y como en el caso de la norma, la distancia que usaremos a lo largo
de todo este texto es aquella que se obtiene a partir de la norma euclideana (y que por razones
obvias, llamaremos la distancia euclideana). Este concepto lo formalizamos en la siguiente
Definici
on 1.16 Dados x
, y Rn definimos la distancia (euclideana) de x
a y, que denotamos por
d(
x, y), como
d(
x, y) := k
x yk
J. P
aez
18
1.5. Topologa de Rn
Un resultado muy sencillo de probar es que la distancia euclideana (y cualquier otra distancia
que se respete), cumple con las propiedades que establecemos en la siguiente proposici
on3 .
Proposici
on 1.17 La distancia (euclideana) satisface las siguientes propiedades:
1. d(
x, y) 0 para toda x
, y Rn , y d(
x, y) = 0 si y s
olo si x
= y
2. d(
x, y) = d(
y, x
) para toda x
, y Rn
3. d(
x, y) d(
x, z) + d(
z , y) para cualesquiera x
, y, z Rn

angulo)
Como es de esperarse, la prueba de esta proposici

on se deja al lector.
1.5
Topologa de Rn
La Topologa es un
area de las matem
aticas muy importante que se interesa por conceptos como
proximidad, continuidad, conectividad (o conexidad), compacidad, y muchos otros mas. Para
abordarlos, es necesario establecer un cierto tipo de conjuntos (que en Topologa se les conoce
como los conjuntos abiertos), y con base en esta familia de conjuntos es posible darse a la tarea de
definirlos de forma muy precisa.
Cuando en un conjunto se cuenta con una forma de medir la distancia entre cualesquiera dos
de sus elementos (como es el caso de Rn ), existe una manera de decir quienes son los conjuntos
abiertos y con base en estos, desarrollar los conceptos que mencionamos al principio de esta secci
on.
Eso es lo que vamos a hacer en esta secci
on y para ello empezaremos por definir un cierto tipo de
conjuntos que resultaran ser b
asicos en esta tarea: el concepto de vecindad de un punto x
Rn .
En Rn , este concepto de vecindad se define apoyandonos en alguna de las formas que disponemos
de medir la distancia entre elementos de Rn , que en nuestro caso ser
a la distancia euclideana (en los
problemas mostraremos que, en terminos topologicos, da lo mismo cu
al de estas distancias elijamos
o, en u
ltima instancia, cu
al norma elijamos).
Algunos objetos geometricos son muy sencillos de describir en terminos del concepto de distancia, y sin duda el m
as sencillo de ellos es el formado por los puntos que se encuentran a una
distancia constante r > 0 de un punto fijo x
Rn , que como todos sabemos, en R2 dicho objeto
es una circunferencia de radio r, y en R3 es una esfera, tambien de radio r. Sin embargo, para
nuestros objetivos, el conjunto que resultara de mayor interes no es tanto el formado por los puntos
que se encuentran a una distacia r de x
Rn , sino los que se encuentran a una distancia menor
2
a r. En R este conjunto consistira de los puntos que se encuentran dentro de la cincunferencia
de radio r, y en R3 consistira de los que est
an dentro de la esfera, tambien de radio r (ver figura
1.9).
Con base en lo anterior, definimos (en Rn ) el concepto de vecindad (o bola) de radio r > 0 con
centro en el punto x
Rn , que denotaremos por Br (
x), de la siguiente manera.
Definici
on 1.18 Dado x
Rn y r > 0, definimos la vecindad (o bola) de radio r > 0 con centro
en x
Rn como
Br (
x) := {
y Rn | d(
x, y) = k
x yk < r}
3
De hecho, cualquier funci
on de Rn Rn en R+ que cumpla con estas tres propiedades se le llamar
a una distancia
en Rn . Aun cuando en este texto podemos considerar tres diferentes distancias, con base en las tres diferentes normas
que definimos, no todas las distancias en Rn tienen que estar definidas a traves de una norma.
19
J. P
aez
1.5. Topologa de Rn
Figura 1.9: Las bolas de radio r con centro en el origen (en R2 y en R3 )
1.5.1
Clasificaci
on de puntos
Apoyandonos en este concepto ahora nos daremos a la tarea de, dado un conjunto A Rn , clasificar
a todos los puntos de Rn en terminos de su posici
on con respecto a dicho conjunto, en donde
por posici
on nos referimos a algo m
as profundo que el simple concepto de pertenencia. A fin de
precisar esta idea de posici
on con respecto a un conjunto A, recurriremos a la figura 1.10 en R2 .
Y
A
z
X
Figura 1.10: Las diferentes posiciones que puede tener un punto de Rn con respecto de un conjunto A
Suponiendo que el conjunto A est
a formado por los puntos del area sombreada, incluyendo los
puntos de la lnea continua, y excluyendo los puntos de la lnea punteada, tenemos que los puntos
x
y z pertenecen al conjunto, mientras que los puntos y y w
no pertenecen a A. Sin embargo, tanto
los que pertenecen como los que no pertenecen a A, tienen una posici
on diferente con respecto a
este conjunto.
En efecto, mientras que en el caso del punto x
existe un radio r > 0 tal que la vecindad de
este radio y centro en x
est
a contenida en A (es decir, Br (
x) A), en el caso del punto z no es
posible encontrar un radio con esta misma caracterstica, es decir, para todo r > 0 se tiene que
Br (
z ) Ac 6= y Br (
z ) A 6= , en donde Ac := Rn \ A (el complemento de A).
En el caso de los puntos y y w
se tiene una situaci
on an
aloga; mientras que para el punto y
existe un radio r > 0 tal que la vecindad de este radio y centro en y est
a contenida en Ac (es
c
y ) A ), en el caso del punto w
tambien se tiene que para todo r > 0, sucede que
decir, Br (
Br (w)
Ac 6= y Br (w)
A 6= (ve
ase la figura 1.11).
Resumiendo lo anterior tenemos que, dado un conjunto A Rn y x
Rn , entonces se satisface
una de las siguientes condiciones (y s
olo una de ellas, pues ser
an mutuamente excluyentes):
J. P
aez
20
1.5. Topologa de Rn
Y
y
X
Figura 1.11: Caracterizaci
on, en terminos de vecindades, de la posicion de los puntos de Rn con
respecto al conjunto A
1. existe r > 0 tal que Br (
x) A,
2. existe r > 0 tal que Br (
x) Ac , o
3. para todo r > 0 se cumple que Br (
x) Ac 6= y Br (
x) A 6= .
a de acuerdo, los puntos que satisfacen la condici
on 1 no s
olo son puntos
que deben pertenecer a A, sino que adem
as est
an realmente dentro (o en el interior) de A;
los que cumplen la condici
on 2 no s
olo son puntos que no pertenecen a A, sino que adem
as est
an
realmente fuera (o en el exterior) de A; y finalmente los que cumplen la condici
on 3, pueden
o no pertenecer a A, pero lo importante es que no est
an ni dentro ni fuera, raz
on por la cual
podemos decir que se encuentran en el borde (o en la frontera) de A.
Con base en lo anterior es que ahora estamos en condiciones de, dado un conjunto A Rn ,
dar una clasificaci
on de los puntos de Rn en terminos de su posici
on con respecto de dicho
conjunto, cosa que haremos en la siguiente
Definici
on 1.19 Sean A Rn y x
Rn . Decimos que:
1. x
es un punto interior de A si existe r > 0 tal que Br (
x) A. Denotamos por int(A) al
conjunto formado por todos estos puntos, es decir
int(A) := {
x Rn | x
es un punto interior de A}
y diremos que este conjunto es el interior de A.
2. x
es un punto exterior de A si existe r > 0 tal que Br (
x) Ac . Denotamos por ext(A) al
conjunto formado por todos estos puntos, es decir
ext(A) := {
x Rn | x
es un punto exterior de A}
y diremos que este conjunto es el exterior de A.
3. x
es un punto frontera de A si para todo r > 0 se tiene que Br (
x) A 6= y Br (
x) Ac 6= .
Denotamos por Fr(A) al conjunto formado por todos estos puntos, es decir
Fr(A) := {
x Rn | x
es un punto frontera de A}
y diremos que este conjunto es la frontera de A.
21
J. P
aez
1.5. Topologa de Rn
Como seguramente ya habra notado (y podr

a probar muy facilmente), los conjuntos definidos
anteriormente satisfacen unas propiedades muy elementales (adem
as de algunas otras que veremos
m
as adelante) y que dejamos expresadas en la siguiente
Proposici
on 1.20 Si A Rn entonces:
1. int(A) A
2. ext(A) Ac
3. int(A) ext(A) = int(A) Fr(A) = Fr(A) ext(A) =
4. Rn = int(A) Fr(A) ext(A)
5. int(Ac ) = ext(A) y Fr(A) = Fr(Ac )
A
un y cuando la definicion del tipo de puntos (y sus repectivos conjuntos) que acabamos de
dar, la hicimos bas
andonos en un subconjunto de R2 muy bonito, hay casos para los cuales
dichos conjuntos no resultan ser los que esperamos que sean (claro, si acaso tuvieramos una idea
de quienes deberan de ser!). El ejemplo que a continuaci
on presentamos, es uno de esos casos.
Ejemplo 1.21 Sea
A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}
Determinaremos quienes son el int(A), el ext(A) y la Fr(A).
Primero mostraremos que si x
= (x, y) es un punto arbitrario de R2 y r es cualquier n
umero
2
real positivo, entonces Br (
x) (R \ Q Q) 6= de tal forma que, como A Q Q tendremos que
Br (
x) (R2 \ A) = Br (
x) Ac 6= . Sea pues x
= (x, y) R2 y r cualquier n
umero real positivo.
Como es de todos conocido, existe x

/ Q tale que x < x < x + r. De estas desigualdades
concluimos que si y = (x , y) entonces d(
x, y) = k(x, y) (x , y)k = |x x | < r de modo que
y Br (
x), y como y
/ Q Q (pues x
/ Q) entonces Br (
x) (R2 \ Q Q) 6= .
De lo que acabamos de probar se desprende inmediatamente que int(A) = pues si x
A, no
existe forma de encontrar r > 0 tal que Br (
x) A pues cualquier vecindad, sin importar cual es
su radio (e incluso sin importar cual es su centro) interseca a Ac de tal forma que por el inciso 1
de la proposici
on 1.20 tendremos que int(A) = .
El siguiente paso ser
a mostrar que [0, 1] [0, 1] Fr(A). Sea x
= (x, y) [0, 1] [0, 1] y
r > 0. Por el primer resultado que probamos, ya sabemos que Br (
x) Ac 6= . Restara probar que
Br (
x) A 6= .
Supongamos por ahora que 0 x < 1 y 0 y < 1. Por la densidad
de los n
umeros racionales
y
+
r/
2}.
sabemos que existen x , y Q tales que x < x < min{1, x + r/ 2}y y < y < min{1,
Tenemos entonces que (x , y ) A y adem

as, dado que |x x | < r/ 2 y |y y | < r/ 2, entonces

p
(x, y) (x , y ) = (x x )2 + (y y )2
q
< (r/ 2)2 + (r/ 2)2

=r
de modo que (x , y ) Br (
x), es decir, Br (
x) A 6= .
Ahora, escogiendo a x y y como en el caso anterior (siempre que se pueda), si x = 1 y y < 1

entonces nos fijamos en la pareja (1, y ); si x < 1 y y = 1 elegimos a la pareja (x , 1), y si x = 1
J. P
aez
22
1.5. Topologa de Rn
y y = 1 a la pareja (1, 1). En todos estos casos, dichas parejas pertenecen a Br (

x) A con lo cual
queda probado tambien en estos casos que Br (
x) A 6= , y por lo tanto que [0, 1] [0, 1] Fr(A).
Finalmente, probaremos que R2 \ [0, 1] [0, 1] ext(A). Sea x
= (x, y)
/ [0, 1] [0, 1] y
supongamos por ahora que x < 0 o 1 < x (la otra posibilidad es que y < 0 o 1 < y). Si x < 0
tomamos r = |x| > 0 y afirmamos que Br (
x) R2 \[0, 1][0, 1] Ac . En efecto, si (x , y ) Br (
x),
por la desigualdad 1.9 se tiene que

x x (x, y) (x , y )
<r
= |x|
= x
de modo que x < x x < x y por la primera desigualdad, concluimos que x < 0 y por lo tanto
que (x , y )
/ [0, 1] [0, 1], con lo que probamos que Br (
x) R2 \ [0, 1] [0, 1] Ac . Si 1 < x
tomamos r = x 1 > 0 y afirmamos nuevamente que Br (
x) R2 \ [0, 1] [0, 1] Ac . En efecto,
si (x , y ) Br (
x), otra vez por la desigualdad 1.9 se tiene que

x x (x, y) (x , y )
<r
=x1
de modo que 1x < xx < x1 y por la segunda desigualdad, concluimos que 1 < x . Por lo tanto
se tiene que (x , y )
/ [0, 1] [0, 1] con lo que probamos tambien que Br (
x) R2 \ [0, 1] [0, 1] Ac .
Si y < 0 o 1 < y procedemos de forma an
aloga.
Reuniendo lo que hemos probado hasta ahora, y por los incisos 3 y 4 de la proposici
on 1.20,
tenemos que
[0, 1] [0, 1] Fr(A) = Rn \ ext(A) [0, 1] [0, 1]
de donde concluimos que Fr(A) = [0, 1] [0, 1] y que ext(A) = Rn \ [0, 1] [0, 1].
1.5.2
Conjuntos abiertos y cerrados
Una vez que hemos hecho esta clasificaci

on de los puntos de Rn en relaci
on con un conjunto A Rn ,
ahora estamos en condiciones de dar una caracterizaci
on de cierto tipo de subconjuntos de Rn .
n
Dado un conjunto A R , ya sabemos que int(A) A y que ext(A) Ac , pero en el caso
de la Fr(A) en general no siempre se cumple alguna de estas relaciones de contenci
on, y justo
el conjunto A de la figura 1.11 ilustra un caso de ese tipo (lo que s sabemos en general es que
A = int(A) (A Fr(A)), identidad que siempre vale la pena recordar).
Por esta raz
on, los conjuntos para los cuales se cumple que Fr(A) A o Fr(A) Ac (esto
u
ltimo equivalente a que Fr(A) A = ) merecen un nombre aparte.
Cuando un conjunto no tenga a ninguno de sus puntos frontera (es decir que Fr(A) A = ),
diremos que el conjunto es abierto, y si Fr(A) A diremos que el conjunto es cerrado. Esta
clasificaci
on de conjuntos la dejamos expresada en la siguiente
Definici
on 1.22 Sea A Rn . Decimos que:
1. A es un conjunto abierto si Fr(A) A =
2. A es un conjunto cerrado si Fr(A) A
23
J. P
aez
1.5. Topologa de Rn
Una primera observaci

on que es muy importante hacer con relaci
on a las definiciones anteriores,
es que las condiciones Fr(A) A = y Fr(A) A no son complementarias en el sentido de que
una de ellas sea la negaci
on de la otra. Es decir, si Fr(A) A 6= esto no implica que Fr(A) A,
y recprocamente, si Fr(A) " A esto no implica que Fr(A) A = .
Dicho de otra forma, y en terminos de las definiciones que acabamos de dar: si un conjunto
A no es abierto esto no implica que tenga que ser cerrado, y recprocamente, si un conjunto A
no es cerrado esto no implica que tenga que ser abierto. m
as aun, y dado que las condiciones
Fr(A) A 6= y Fr(A) " A no se contraponen (es decir, que pueden pasar ambas, como sucede
con el conjunto A de la figura 1.11), confirmamos que hay conjuntos que no son abiertos y tampoco
son cerrados, y que son justo aquellos que contienen a algunos de sus puntos frontera, pero no a
todos ellos.
La segunda observaci
on importante con relaci
on a las definiciones que acabamos de dar, es que
estas no son las m
as comunes, raz
on por la cual lo primero que haremos ser
a probar una proposici
on
en la que se establecen las equivalencias con las definiciones m
as populares (o m
as conocidas, si
se prefiere).
Proposici
on 1.23 Sea A Rn . Las siguientes afirmaciones son equivalentes:
1. A es un conjunto abierto si y s
olo si para todo x
A existe r > 0 tal que Br (
x) A (es
decir, si A int(A) y por tanto que A = int(A))
2. A es un conjunto cerrado si y s
olo si Ac es abierto
Demostraci
on. Inciso 1) (=) Sea x
A; de acuerdo con el inciso 1 de la definicion 1.22 se tiene
que x
/ Fr(A) y por lo tanto, de acuerdo con el inciso 3 de la definicion 1.19, debe existir r > 0
tal que Br (
x) A = o Br (
x) Ac = . Como x
Br (
x) A la identidad que se debe cumplir
es la segunda, es decir, que Br (
x) Ac = , lo que significa que Br (
x) A (y por lo tanto que
x
int(A)).
Inciso 1) (=) Dado que A = A Rn , por los incisos 2, 3 y 4 de la proposici
on 1.20 se tiene
que
A = A Rn = (A int(A)) (A Fr(A)) (A ext(A)) = A int(A)
de donde A int(A) (y por el inciso 1 de la misma proposici
on, se tiene que A = int(A)).
Inciso 2) (=) De acuerdo con el inciso 1 de la definicion 1.22, como A es cerrado se tiene que
Fr(A) A y por tanto que Fr(A) Ac = ; dado que Fr(A) = Fr(Ac ) (inciso 5 de la proposici
on
1.20) tenemos que Fr(Ac ) Ac = y por lo tanto, de acuerdo con la defincion 1.22, se tiene que
Ac es un conjunto abierto.
Inciso 2) (=) Lea hacia atr
as el p
arrafo anterior!
En realidad, y para ser sinceros, las condiciones de la proposici
on anterior son las m
as populares porque suelen ser las mas u
tiles cuando se trata de demostrar que un conjunto es abierto
o que un conjunto es cerrado. Y como prueba de esta afirmacion, a continuaci
on damos algunos
ejemplos.
Ejemplo 1.24 Observe que:
1. Rn es un conjunto abierto. En efecto, n
otese que para todo x
Rn se tiene que Br (
x) R n
sin importar como sea r (muy grande o muy peque
no) de forma que, por el inciso 1 de la
proposici
on anterior, Rn es un conjunto abierto.
J. P
aez
24
1.5. Topologa de Rn
2. Rn es un conjunto cerrado. En virtud de lo anterior, tenemos que Rn = int(Rn ) de forma tal

que Fr(Rn ) = (y de hecho tambien ext(Rn ) = ) de modo que Fr(Rn ) Rn y por el inciso
2 de la proposici
on anterior, Rn tambien es un conjunto cerrado.
3. Por los dos incisos anteriores (y la multicitada proposici
on), se concluye que el conjunto
tambien es un conjunto abierto y cerrado (lo que por cierto prueba que los conjuntos (al menos
algunos de ellos) no son como las puertas: los hay algunos que son abiertos y cerrados al
mismo tiempo! El lector podra mostrar otro ejemplo con la misma caracterstica?).
4. Para todo x
Rn y toda r > 0 se tiene que Br (
x) es un conjunto abierto. Veamos que se
cumple la condici
on del inciso 1 de la susodicha proposici
on. Sea y Br (
x); como se ilustra
en la figura 1.12 (para el caso de R2 ), todo parece indicar que si tomamos r = r k
x yk > 0
y ) Br (
x). La clave para probar esta contenci
on est
a en la
entonces se debe tener que Br (
desigualdad del tri
angulo (inciso 1 de la proposici
on 1.12) pues, con base en dicha desigualdad,
y ) entonces
tenemos que si z Br (
k
x zk = k(
x y) + (
y z)k
k
x yk + k
y zk
= k
x yk + k
z yk
< k
x yk + r k
x yk
=r
y ) Br (
x). Esto prueba que se satisface la condici
on
y por lo tanto z Br (
x), de donde Br (
del inciso 1 de la famosa proposici
on, y por lo tanto que Br (
x) es un conjunto abierto.
}|
z
b
y
b
yk
kx }|
Figura 1.12: La bola de radio r con centro en x

es un conjunto abierto
Pareciera geometricamente natural esperar que si a un conjunto A le quitamos sus puntos
frontera, el conjunto que nos queda ser
a un conjunto abierto (el conjunto de la figura 1.12 refuerza
esta sospecha). Cuando a un conjunto A le quitamos sus puntos frontera, solo nos quedamos con
los puntos interiores de A, es decir que
A \ Fr(A) = int(A)
25
(1.10)
J. P
aez
1.5. Topologa de Rn
de donde nuestra sospecha se traduce en que el interior de todo subconjunto A de Rn (int(A))

ser
a un conjunto abierto (y por lo tanto el ext(A) tambien ser
a abierto dado que ext(A) = int(Ac )
(inciso 5 de la proposici
on 1.20)).
Siguiendo la misma lnea de pensamiento que en el p
arrafo anterior, ahora nos podemos preguntar que sucede si a un conjunto A, en lugar de quitarle sus puntos frontera, se los agregamos.
Es decir, que tipo de conjunto resultara ser A Fr(A)?
Pues bien, como seguramente el lector ya intua, este conjunto siempre resultara ser un conjunto
cerrado y hasta tiene un nombre que refleja esta propiedad: la cerradura de A. Este conjunto lo
usaremos mucho a lo largo de este texto, y por esta raz
on le dedicamos la siguiente
n
como
Definici
on 1.25 Sea A R . Definimos la cerradura de A, que denotamos por A,
A := A Fr(A)
Resumiendo lo hecho hasta aqu, dado A Rn arbitrario, hemos definido (por ahora) cuatro
Ahora, si recordamos, por el
conjuntos asociados a dicho conjunto: int(A), ext(A), Fr(A) y A.
inciso 4 de la proposici
on 1.20, que
(Fr(A))c = Rn \ Fr(A) = int(A) ext(A)
todo parece indicar que el complemento de la Fr(A) ser
a un conjunto abierto, y por lo tanto este
ser
a cerrado. Es decir, de estos cuatro conjuntos, el int(A) y el ext(A) ser
an conjuntos abiertos,
mientras que Fr(A) y A ser

an conjuntos cerrados. Dada la importancia de estas propiedades, las
dejaremos establecidas en la siguiente
Proposici
on 1.26 Sea A Rn arbitrario. Las siguientes afirmaciones son ciertas:
1. el int(A) y el ext(A) son conjuntos abiertos
2. la Fr(A) y A son conjuntos cerrados
Demostraci
on. Inciso 1) De acuerdo con el inciso 1 de la proposici
on 1.23, necesitamos mostrar
que si x
int(A) entonces existe r > 0 tal que Br (
x) int(A). Ahora, como x
int(A) sabemos
que existe r > 0 tal que Br (
x) A; aseguramos que Br (
x) int(A). En efecto, si y Br (
x) como
y ) Br (
x) A, lo que prueba
se mostro en el inciso 4 del ejemplo 1.24, existe r > 0 tal que Br (
que y int(A) y por tanto que Br (
x) int(A).
En cuanto al ext(A), como mencionamos arriba, dado que ext(A) = int(Ac ) (inciso 5 de la
proposici
on 1.20), por la primera parte de este inciso tenemos que este conjunto tambien es abierto.
Inciso 2) Como tambien hicimos notar anteriormente, por el inciso 4 de la proposici
on 1.20,
tenemos que
(Fr(A))c = Rn \ Fr(A) = int(A) ext(A)
de tal forma que, por el inciso (a) del problema 21 concluimos que (Fr(A))c es un conjunto abierto y
por lo tanto que Fr(A) es cerrado. Con respecto a A observese que, como A = int(A) (A Fr(A))
entonces A Fr(A) = int(A) Fr(A) y por tanto
c = Rn \ (A Fr(A)) = Rn \ (int(A) Fr(A)) = ext(A)
(A)
c es un conjunto abierto y por lo tanto A ser
de modo que (A)
a un conjunto cerrado.
J. P
aez
26
1.5. Topologa de Rn
1.5.3
Otra clasificaci
on de puntos
Si en la definicion 1.19 hicimos una clasificaci

on de los puntos de Rn en terminos de su posici
on
n
con respecto de un conjunto A R (mas alla de su relaci
on de pertenencia con dicho conjunto),
ahora introduciremos una nueva clasificaci
on en la que trataremos de reflejar si un punto x
Rn
n
est
a pegado a (o contrariamente aislado de) un conjunto A R .
Para hacer esto, nuevamente haremos uso de las vencidades (o bolas) centradas en este punto
x
. De hecho, parece natural pensar que un punto x
Rn est
a pegado a un conjunto A Rn
si cualquiera de sus vecindades Br (
x) (es decir, sin importar el tama
no de su radio) comparte
muchos puntos con el conjunto (y por lo tanto, diferentes de x
, el cual ni siquiera tendra que
pertenecer a A).
Con base en esta idea intuitiva es que definimos los conceptos de punto de acumulaci
on y punto
n
aislado (este u
ltimo como lo contrario del primero) de un conjunto A R .
Definici
on 1.27 Sean A Rn y x
Rn . Decimos que:
1. x
es un punto de acumulaci
on de A si para toda r > 0 se tiene que (Br (
x) \ {
x}) A 6= 4 .
Al conjunto formado por los puntos de acumulaci
on de A lo denotamos por A , es decir
A := {
x Rn | x
es punto de acumulaci
on de A}
2. x
es un punto aislado de A si x
no es un punto de acumulaci
on de A, es decir, si existe r > 0
tal que (Br (
x) \ {
x}) A = .
Es muy importante destacar que esta relaci
on entre un punto x
y un conjunto A es completamente independiente de la relaci
on de pertenencia que x
tenga con el conjunto A. En efecto, si x
es
un punto de acumulaci
on de A esto no significa que x
tenga que pertenecer a A, y recprocamente,
aun y cuando x
A, puede suceder que x
no es un punto de acumulaci
on de A, es decir, puede
suceder que x
es un punto aislado de A. El siguiente ejemplo ilustra (en R2 ) estos hechos.
Ejemplo 1.28 Sea A = {(x, y) R2 | x2 + y 2 < 1} {(2, 2)} = B1 ((0, 0)) {(2, 2)} (ver figura
1.13). Afirmamos que:
on de A. En efecto,
1. el punto (1/ 2, 1/ 2), que no pertenece a A, es un punto de acumulaci
observe que dado r > 0, entonces el punto

r
1
r
1
1

,
(1, 1)
=
2
2(r + 1)
2
2(r + 1)
2(r + 1)
es tal que

1

r
1
r

= 1
,
k(1, 1)k

2
2(r + 1)
2
2(r + 1)
2(r + 1)
1
2
=
2(r + 1)
1
=
r+1
<1
4
Un conjunto de la forma Br (
x) \ {
x} se dice que es una vecindad agujerada de x
.
27
J. P
aez
1.5. Topologa de Rn
y por lo tanto pertenece a A.

Por otra parte, se tiene que

1 1
r
1
r
1

,

0< ,
2
2
2
2(r + 1)
2
2(r + 1)

r
r

,
=
2(r + 1)
2(r + 1)
r
k(1, 1)k
=
2(r + 1)
r
=
2
2(r + 1)
r
=
(r + 1)
<r
de donde concluimos que este punto tambien pertenece al conjunto
Br ((1/ 2, 1/ 2)) \ {(1/ 2, 1/ 2)}

y por lo tanto que

Br ((1/ 2, 1/ 2)) \ {(1/ 2, 1/ 2)} A 6=
on de A.
es decir, que (1/ 2, 1/ 2) es un punto de acumulaci
2. el punto (2, 2), que es un punto que pertenece a A, es un punto aislado de A. Observese que
si tomamos la bola (o vecindad) de radio 1 con centro en este punto, entonces
(B1 ((2, 2)) \ {(2, 2)}) A =
En efecto, si (x, y) B1 ((2, 2)) \ {(2, 2)} entonces (x, y) 6= (2, 2) y adem
as se cumplen las
siguientes desigualdades:
k(2, 2)k k(x, y)k k(2, 2) (x, y)k < 1
de modo que
k(2, 2)k 1 < k(x, y)k
y como
1 < 2 2 1 = k(2, 2)k 1 < k(x, y)k
entonces 1 < x2 + y 2 , es decir, (x, y)

/ B1 ((2, 2)) y por lo tanto (x, y)
/ A.
Dado un conjunto A Rn , la relaci
on de los puntos de acumulaci
on con aquellos que se
definieron en 1.19 no es muy estrecha, pues cada uno de ellos expresan una relaci
on diferente con
dicho conjunto. Sin embargo, existen algunas contenciones entre ellos que es importante destacar.
Tal es el caso de los puntos interiores de A, los cuales siempre resultan ser puntos de acumulaci
on,
es decir que int(A) A .
Tambien resulta natural que los puntos exteriores de A esten (o sean) aislados de A, es decir que
A ext(A) = , o equivalentemente, que A Rn \ ext(A) = int(A) Fr(A). Estas contenciones
J. P
aez
28
1.5. Topologa de Rn
2
b
1
2
Figura 1.13: El conjunto A = {(x, y) R2 | x2 + y 2 < 1} {(2, 2)} del ejemplo 1.28
establecen una relaci
on muy especfica entre los puntos de acumulaci
on de un conjunto A y sus
correspondientes puntos interiores y exteriores, lo que no sucede con los puntos frontera.
En efecto, el conjunto A del ejemplo 1.24 nos es u
til para ilustrar este hecho; en este caso, el
(0, 0) es un punto de acumulaci
on de A (ya que es un punto interior de A) y no es un punto frontera
de A (por la misma raz
on); sin embargo, el punto (2, 2) es un punto frontera de A y como se mostro
en ese ejemplo, no es un punto de acumulaci
on de A.
Las contenciones dadas en el p
arrafo anterior son muy importantes y por esta raz
on las dejamos
expresadas en la siguiente
Proposici
on 1.29 Si A Rn es un conjunto arbitrario entonces
int(A) A int(A) Fr(A)
Demostraci
on. Como es de suponerse, la prueba de esta proposici
Cuando expresamos en terminos intuitivos lo que debera de pasar para que un punto x

Rn fuera un punto de acumulaci
on de un conjunto A, dijimos que cualquier vecindad Br (
x) (sin
importar que tan grande o peque
no fuera r) tendra que tener muchos puntos de A.
Lo siguiente que vamos a mostrar es que, de la definicion formal que dimos, en efecto se desprende que esto debe ser as: x
Rn es un punto de acumulaci
on de A si y s
olo si para toda r > 0,
Br (
x) A es un conjunto infinito.
Proposici
on 1.30 Sea A Rn . Se satisface que x
Rn es un punto de acumulaci
on de A si y
s
olo si para todo r > 0 se tiene que Br (
x) A es un conjunto infinito.
Demostraci
on. Para probar que esta propiedad es una condici
on necesaria del hecho de que x
es
on de A, procederemos por el metodo de la contrapuesta.
Supongamos entonces que existe r > 0 tal que Br (
x) A es un conjunto finito.
Si (Br (
x) \ {
x}) A = entonces x
es un punto aislado de A y por lo tanto ya habremos
terminado.
Si (Br (
x) \ {
x}) A = {
x1 , . . . , x
k } hacemos r = min{k
xx
i k | i {1, . . . , k}}. Es claro que
x) \ {
x}) A = con
r > 0 y adem
as, como r k
xx
i k para toda i {1, . . . , k} entonces (Br (
lo que de nuevo concluimos que x
es un punto aislado de A.
Para probar la suficiencia, basta observar que si Br (
x) A es un conjunto infinito para toda
r > 0, entonces es inmediato que (Br (
x) \ {
x}) A 6= de modo que x
es un punto de acumulaci
on
de A.
29
J. P
aez
1.5. Topologa de Rn
La proposici
on anterior tiene un corolario muy interesante, pues establece una condici
on suficiente para que un conjunto no tenga puntos de acumulaci
on (o si se prefiere, una condici
on (o
consecuencia) necesaria del hecho de que un conjunto s tenga puntos de acumulaci
on): si un conjunto A Rn es finito entonces A = (o equivalentemente: si A 6= entonces A es un conjunto
infinito). Escribiremos el corolario de la segunda forma.
Corolario 1.31 Sea A Rn . Si A 6= entonces A es un conjunto infinito.
Una pregunta muy importante es si la afirmacion recproca del corolario anterior es cierta: si
A es un conjunto infinito entonces A 6= ? La respuesta es negativa y el ejemplo es el conjunto A
que se da en el problema 25.
La siguiente pregunta es entonces: adem
as de ser infinito, que otra propiedad debe tener un
conjunto A para que se pueda asegurar que al menos tiene un punto de acumulaci
on? Y la clave
para responder esta pregunta nos la da el conjunto A que acabamos de usar como contraejemplo,
y el resultado del problema 35.
En este problema se establece que, si un conjunto tiene al menos un punto de acumulaci
on
(es decir, que A 6= ) entonces para cualquier cantidad positiva (sin importar que peque
na la
tomemos), deben existir un par de elementos de A cuya distancia entre ellos es menor que esa
cantidad positiva.
Es decir, sin importar que distancia elijamos, siempre debemos de poder encontrar elementos en
A cuya distancia entre ellos sea menor que la distancia elegida. Y si el lector observa con cuidado,
el conjunto A del problema 25 no satisface esta propiedad, y peor aun, en este caso tenemos que
k
x yk 1 para todo x
, y A, x
6= y.
De la discusion anterior se desprende la siguiente pregunta: que propiedad tiene el conjunto A
del problema 25, que adem
as de ser infinito, permite que la distancia entre cualesquiera dos de sus
elementos sea mayor o igual que una cierta cantidad positiva fija? Pues una propiedad del conjunto
A que hasta ahora no hemos observado es que, sin importar que grande se elija un n
umero M > 0,
siempre podemos encontrar un x
A tal que k
xk M . Mas aun, observese que dado un n
umero
M > 0, sin importar lo grande que este sea, la norma de casi todos los elementos del conjunto A
(es decir, todos salvo un n
umero finito de ellos) rebasa a este n
umero M .
Cuando un conjunto A tiene la propiedad de que, sin importar que grande se elija un n
umero
M > 0, siempre podemos encontrar un x
A tal que k
xk M , se dice que este conjunto es no
acotado. O dicho de manera positiva, cuando sucede lo contrario, decimos que el conjunto est
a
acotado.
Este concepto resultara ser muy importante para la pregunta que nos hicimos con respecto a la
proposici
on recproca del corolario 1.31, y por esta raz
on lo dejamos plasmado en la siguiente
Definici
on 1.32 Sea A Rn . Decimos que A es un conjunto acotado (o simplemente que est
a
acotado) si existe M > 0 tal que k
xk M para todo x
A.
En terminos geometricos, decir que un conjunto A est
a acotado significa que este queda contenido en alguna bola (o vecindad) con centro en el origen (observe que, de la definicion anterior,
se desprende que A BM +1 (
0)).
Como seguramente el lector ya habra sospechado, para que podamos asegurar que un conjunto
infinito A tiene al menos un punto de acumulaci
on, ser
a suficiente con que este tambien sea acotado.
Este es un resultado tan importante, que hasta tiene nombre: teorema de Bolzano-Weierstrass5 . La
5
El teorema de Bolzano-Weierstrass lleva el nombre de los matem

aticos Bernard Bolzano (Bernard Placidus Johann
Gonzal Nepomuk Bolzano (Praga, Bohemia (actual Rep
ublica Checa), 5 de octubre de 1781 - dem, 18 de diciembre de
J. P
aez
30
1.5. Topologa de Rn
prueba de este teorema requiere que contemos con la versi

on generalizada (a Rn ) de un conocido
teorema de los n
umeros reales: el teorema de los intervalos anidados.
Por esta raz
on, primero definiremos todo lo necesario para formular dicha generalizaci
on, la
probaremos, y finalmente la usaremos para demostrar el teorema de Bolzano-Weierstrass.
Lo primero que haremos ser
a generalizar el concepto de intervalo cerrado, de la siguiente manera.
Definici
on 1.33 Dados a1 , . . . , an , b1 , . . . , bn R tales que ai bi para i = 1, . . . , n, decimos que
el conjunto
R = [a1 , b1 ] [an , bn ] = {(x1 , . . . , xn ) Rn | ai xi bi , i {1, . . . , n}}
es un rect
angulo cerrado. Asimismo, definimos la diagonal de R, que denotamos por diag(R), como
diag(R) := k(b1 , . . . , bn ) (a1 , . . . , an )k
Con relaci
on a este tipo de conjuntos, estableceremos sus propiedades mas elementales en el
siguiente
Lema 1.34 Sea R = [a1 , b1 ] [an , bn ] = {(x1 , . . . , xn ) Rn | ai xi bi , i = 1, . . . , n} un
rect
angulo cerrado. Se satisfacen las siguientes afirmaciones:
1. R es un conjunto cerrado
2. si x
, y R entonces k
x yk diag(R)
3. si x
R y diag(R) < r entonces R Br (
x)
olo si [ai , bi ] [ai , bi ] para toda
4. si R = [a1 , b1 ] [an , bn ] se tiene que: R R si y s
i {1, . . . , n}
a de acuerdo, todas estas propiedades son muy sencillas de probar, raz
on
por la cual se deja que el las haga.
Con base en la definicion y lema anteriores, estamos en condiciones de formular y probar lo que
llamaremos el teorema de los rect
angulos anidados, de la siguiente manera.
Teorema 1.35 (de los rect
angulos anidados) Si {Rk } es una sucesi
on anidada de rect
angulos
cerrados (es decir, Rk+1 Rk para toda k N) entonces
k=1
Rk 6=
Si adem
as se tiene que limk diag(Rk ) = 0 entonces
k=1
para alg
un x
0 Rn .
Rk = {
x0 }
1848), conocido como Bernard Bolzano fue un matem

atico, l
ogico, fil
osofo y te
ologo bohemio que escribi
o en alem
an
y que realiz
o importantes contribuciones a las matem
aticas y a la Teora del conocimiento), y Karl Weierstrass (Karl
Theodor Wilhelm Weierstra (escrito Weierstrass cuando no est
a disponible el caracter ) (Ostenfelde, 31 de
octubre de 1815 - Berln, 19 de febrero de 1897) matem
atico alem
an al que se suele citar como el padre del an
alisis
moderno). En realidad, este teorema fue demostrado por primera vez en 1817 por Bolzano, como un lema en la
demostraci
on del teorema de valor intermedio. Unos cincuenta a
nos m
as tarde, el resultado fue identificado como
significativo por derecho propio, y demostrado una vez m
as por Weierstrass. Desde entonces se ha convertido en un
teorema fundamental del an
alisis. (fuente: Wikipedia).
31
J. P
aez
1.5. Topologa de Rn
Demostraci
on. Esta prueba estar
a basada en el correspodiente teorema de los intervalos anidados.
Supongamos que para cada k N se tiene que
i
h
i
h
(k) (k)
(k)
Rk = a1 , b1 a(k)
,
b
n
n
Por el inciso 4 del lema 1.34 sabemos que, para cada i {1, . . . , n}, la sucesion
io
h
n
(k) (k)
(i)
Ik = ai , bi
T
(i)
es una sucesion de intervalos (cerrados) anidados, de tal forma que
k=1 Ik 6= . Por tanto, si para
T
T
(i)
= (x1 , . . . , xn )
cada i {1, . . . , n} elegimos xi
k=1 Rk .
k=1 Ik entonces se verifica que x
En efecto, para cada i {1, . . . , n} se tiene que
i
h
(k) (k)
(i)
x i I k = a i , bi
de tal forma que
i
h
i
h
(k) (k)
(k)
= Rk
x
= (x1 , . . . , xn ) a1 , b1 a(k)
n , bn
T
T
y como esto es valido para cada k N entonces x
k=1 Rk , esTdecir que
k=1 Rk 6= .
Supongamos ahora que limk diag(Rk ) = 0 y que x

, y k=1 Rk . Por el inciso 2 del lema
1.34 sabemos que
0 k
x yk diag(Rk )
de tal forma que, si en las desigualdades anteriores tomamos el lmite cuando k , obtenemos
que
0 k
x yk 0
T
es decir, que k
x yk = 0 y por tanto que x
= y. Esto prueba que todos los elementos de
k=1 Rk
son iguales, lo que significa que dicho conjunto consta de un s
olo punto.
Ya casi todo est
a listo para poder formular y probar el teorema de Bolzano-Weierstrass y
s
olo resta mencionar la forma en que, en dicha demostracion, subdividiremos a un rect
angulo
R = [a1 , b1 ] [an , bn ]. Simplemente partimos a cada intervalo coordenado [ai , bi ] en los
subintervalos [ai , (ai + bi )/2] y [(ai + bi )/2, bi ] y construiremos todos los rect
angulos que tengan
como i-esimo intervalo coordenado a alguno de estos subintervalos, para i {1, . . . , n}. Con este
procedimiento obtenemos 2n rect
angulos cerrados
S2n Rk cuyas propiedades, que por ahora nos interesa
destacar, son las siguientes: Rk R, R = k=1 Rk y diag(Rk ) = diag(R)/2 (propiedades que el
lector podr
a probar muy facilmente).
Una vez hecho lo anterior formularemos el teorema de Bolzano-Weierstrass, no sin antes mencionar que el procedimiento que usaremos en su demostracion hasta tiene un nombre: la cacera
del le
on.
Teorema 1.36 (de Bolzano-Weierstrass) Si A Rn es un conjunto infinito y acotado entonces
A tiene al menos un punto de acumulaci
on (es decir, A 6= ).
Demostraci
on. Sea M > 0 tal que k
xk M para toda x
A. Si hacemos R = [M, M ]
[M, M ] tenemos entonces que A R. Ahora subdividimos a R en la forma que mencionamos
antes.
Dado que A R, que R es la uni
on de todos los rect
angulos inducidos por la subdivision que
hicimos, y que A es infinito, se debe tener entonces que en alguno de estos rect
angulos inducidos, al
J. P
aez
32
1.5. Topologa de Rn
que llamaremos R1 , debe de haber una infinidad de puntos de A, es decir, R1 R es un rect

angulo
cerrado tal que A R1 es un conjunto infinito y
diag(R1 ) = diag(R)/2 = (2 2M )/2 = 2M

Ahora subdividimos a R1 en la forma que mencionamos antes. Dado que A R1 R1 , que R1
es la uni
angulos inducidos por la subdivision que le hicimos, y que A R1 es
infinito, entonces en alguno de estos rect
angulos inducidos, al que llamaremos R2 , debe de haber
una infinidad de puntos de A R1 , es decir, R2 R1 es un rect
angulo cerrado tal que
(A R1 ) R2 = A (R1 R2 ) = A R2
es un conjunto infinito y
diag(R2 ) = diag(R1 )/2 = diag(R)/22 = (2 2M )/22 = 2M/2
Como el lector ya habra notado, este es un procedimiento que podemos seguir indefinidamente,
es decir, es un proceso inductivo. En efecto, si para una cierta k N ya hemos construido un
rect
angulo cerrado Rk con las siguientes propiedades:
1. Rk Rk1 R1 R
2. A Rk es un conjunto infinito, y
3. diag(Rk ) =
2M
2k1
entonces podemos construir un rect

angulo cerrado Rk+1 , que tenga las propiedades equivalentes.
Como? De la siguiente manera: subdividimos a Rk en la forma en que hemos venido haciendolo.
Dado que A Rk Rk , que Rk es la uni
angulos inducidos por la subdivisi
on
que le hicimos, y que A Rk es infinito, en alguno de los rect
angulos inducidos por esta subdivisi
on,
al que llamaremos Rk+1 , debe de haber una infinidad de puntos de A Rk , es decir, Rk+1 ser
a un
rect
angulo cerrado que satisface las propiedades deseadas:
1. Rk+1 Rk ,
2. (A Rk ) Rk+1 = A (Rk Rk+1 ) = A Rk+1 es un conjunto infinito, y
3. diag(Rk+1 ) = diag(Rk )/2 = ( 2M/2k1 )/2 = 2M/2k

(ver figura 1.14).
Con base en este procedimiento obtenemos entonces una sucesion (infinita) de rect
angulos
cerrados {Rk } que satisfacen las propiedades que enlistamos anteriormente. De esta forma, por el
teorema 1.35 (de los rect
angulos anidados), sabemos que
k=1
Rk = {
x0 }
para alg
un x
0 Rn .
Aseguramos que x
0 es un punto de acumulaci
on de A. Sea r > 0; como
lim diag(Rk ) = 0
existe N N tal que si k N entonces 0 diag(Rk ) < r. Por otra parte, como x
0 Rk para toda
k N entonces por el inciso 3 del lema 1.34 se tiene que Rk Br (
x0 ) de tal forma que A Rk
A Br (
x0 ), y como A Rk es un conjunto infinito, podemos concluir que (Br (
x0 ) \ {
x0 }) A 6=
y por lo tanto que x
on de A.
33
J. P
aez
1.5. Topologa de Rn
R2
R3
R1
M
Figura 1.14: La cacera del le

on
1.5.4
Conjuntos conexos
Concluiremos esta secci

on (y este captulo!) mostrando de que forma los conceptos que hasta ahora
hemos desarrollado, se pueden usar para definir de manera muy precisa un hecho geometrico que es
intuitivamente muy claro: cuando un conjunto est
a formado de una sola pieza? Es decir, cuando
un conjunto no est
a roto?
En realidad lo que haremos ser
a establecer cu
ando se puede decir que un conjunto est
a roto
o separado (y consecuentemente los conjuntos que son de una sola pieza (o conexos, como suele
llam
arseles) ser
an los que no est
an rotos o separados).
Intuitivamente, un conjunto A Rn estar
a roto si se puede poner como la uni
on de otros dos
conjuntos B y C, para los cuales hay alguna forma de decir que est
an separados.
Tal vez la primera idea que se nos venga a la cabeza para decir que dos conjuntos est
an separados,
es que simplemente sean ajenos (y claro, diferentes del vaco!). Desafortunadamente, aun y cuando
dos conjuntos sean ajenos, estos pueden embonar (o empatar) muy bien, de tal forma que al unirlos
formen un conjunto que no este roto.
Tal es el caso de los siguientes conjuntos: B = [0, 1/2] [0, 1] y C = (1/2, 1] [0, 1] (ver figura
1.15) los cuales, al unirlos, nos da el conjunto A = [0, 1] [0, 1] el cual no es el tipo de conjunto
del que se pudiera decir que est
a roto. De hecho, cualquier conjunto A (este o no este roto,
y con m
as de un punto) podemos expresarlo como la uni
on de dos conjuntos ajenos; bastara con
tomar un subconjunto propio B (y no vaco) de A ( 6= B A) y C = A \ B para que el conjunto
A quedara expresado de esta forma.
Por el ejemplo (y la observaci
on) anterior concluimos que pedir que dos conjuntos s
olo sean
ajenos, no es una buena forma de decir que estos est
an separados. Pero no hay que desanimarse,
pues la clave de nuestro problema se encuentra en la segunda clasificaci
on que hicimos de los puntos
de Rn con respecto de un conjunto A.
En efecto, como se recordara, intuitivamente los puntos de acumulaci
on de un conjunto se
pueden interpretar como los puntos que est
an pegados a A, de tal forma que si un conjunto no
J. P
aez
34
1.5. Topologa de Rn
1
2
Figura 1.15: El conjunto A = [0, 1] [0, 1], que no esta roto, es la uni
on de los conjuntos ajenos
B = [0, 1/2] [0, 1] y C = (1/2, 1] [0, 1].
s
olo es ajeno a A sino que tampoco tiene puntos que est
an pegados a A (es decir, es ajeno a A ),
entonces s que podremos decir que dicho conjunto estar
a separado de A. En resumen, si B y C
son dos conjuntos tales que B C = y adem
as B C = entonces podemos decir que B est
a
separado de C; y recprocamente, si tambien sucede que B C = entonces podemos decir que

ambos est
an separados uno del otro.
Con base en la discusion anterior definiremos lo que significa que dos conjuntos esten separados.
Como seguramente el lector ya sospecha, en esta definicion aparecera la uni
on de un conjunto y su
correspondiente conjunto de puntos de acumulaci
on, es decir A A . Por esta raz
on, adelantaremos
que el lector probara en el inciso (d) del ejercicio 27 que esta uni
on es igual a la cerradura de A, es
y que es como nos referiremos a ella en la siguiente
decir que A A = A,
C.
Definici
on 1.37 Sean B, C Rn . Decimos que B y C est
an separados si B C = = B
Si bien es cierto que en la discusion previa a esta definicion hicimos notar que el hecho de que
dos conjuntos sean ajenos no es suficiente para que estuvieran separados, si los conjuntos son de
cierto tipo, entonces el que sean ajenos si es suficiente para que esten separados. Estos casos los
dejaremos expresados en la siguiente proposici
on, cuya prueba quedar
a a cargo del lector.
Proposici
on 1.38 Sean B, C Rn .
1. Si B y C son abiertos, entonces B y C est
an separados si y s
olo si B y C son ajenos (es
decir, B C = )
2. Si B y C son cerrados, entonces B y C est
an separados si y s
olo si B y C son ajenos (es
decir, B C = )
Como habamos adelantado, una vez que contamos con este concepto es muy sencillo definir lo
que significa que un conjunto este roto, o que sea disconexo, que es el termino que realmente se
usa.
Definici
on 1.39 Sea A Rn . Decimos que A es un conjunto disconexo si existen B, C Rn , no
vacos, tales que:
1. A = B C, y
C
2. B y C est
an separados, es decir B C = = B
35
J. P
aez
1.5. Topologa de Rn
Y como tambien ya habamos mencionado, un conjunto ser

a conexo si no es disconexo (o dicho
con toda propiedad, si es no disconexo), lo que formalizamos en la (casi) u
ltima definicion de este
captulo.
Definici
on 1.40 Sea A Rn . Decimos que A es un conjunto conexo si A es no disconexo.
La definicion anterior amerita un comentario importante: el concepto de conexidad se define
con base en una negaci
on. Este es una caracterstica importante de resaltar puesto que este tipo
de conceptos son un poco m
as difciles de manejar. Especficamente, si se quisiera desmostrar
directamente que un conjunto A es conexo, habra que demostrar que no existen B, C Rn , no
vacos y separados, tales que A = B C.
Y como seguramente el lector a estas alturas ya habra aprendido, demostrar que algo no existe
siempre suele ser m
as difcil y casi siempre lo m
as pr
actico es suponer que ese algo si existe, para
despues tratar de llegar a una contradicci
on, es decir, proceder por contradicci
on.
Por esta misma raz
on, encontrar condiciones suficientes y/o necesarias para que un conjunto
sea conexo adquiere particular importancia, y eso es justo lo que vamos a hacer en lo que resta de
este captulo.
Y para iniciar esta tarea, empezaremos por establecer una condici
on necesaria y suficiente para
que un conjunto abierto sea conexo, para lo cual nos ser
au
til dar la siguiente
Definici
on 1.41 Sean x
, y Rn . Definimos el segmento (de recta) que une a x
con y, y que
denotamos por [
x, y], como al conjunto dado por
[
x, y] := {
x + t(
yx
) = (1 t)
x + t
y Rn | 0 t 1}
El primer resultado que probaremos, y que nos ser
a muy u
til en todo lo relacionado con la conexidad, es geometricamente muy claro: si dos conjuntos B, C Rn est
an separados, y tomamos
un punto x
B y otro punto y C, es de esperarse que el segmento que une a estos puntos no
este contenido en la uni
on de B y C, es decir que [
x, y] * B C. Este hecho lo probaremos en el
siguiente
Lema 1.42 Sean B, C Rn tales que x
B y y C. Si B y C est
an separados entonces el
segmento que une a x
y y no est
a contenido en la uni
on de B y C, es decir que [
x, y] * B C.
Demostraci
on. Construimos el siguiente conjunto:
c para toda t [0, s]}
S = {s [0, 1] | x
+ t(
yx
) (C)
Observe que este conjunto es no vaco, pues tomando s = 0 en la definicion del conjunto S obtenemos
c , en donde esta u
el punto x
que pertenece a B (C)
ltima contenci
on se cumple ya que B C = ,
lo cual a su vez es cierto puesto que B y C est
an separados. Por otra parte, S est
a contenido en el
intervalo [0, 1] y por lo tanto est
a acotado superiormente por el 1 (e inferiormente por el 0, lo que
por ahora no resulta muy importante).
De esta forma, por la propiedad del supremo de los n
umeros reales, existe R tal que
= sup(S). Dado que S [0, 1] se tiene que [0, 1] de modo que si x
0 = x
+ (
yx
) entonces
x
0 [
x, y]. Con respecto a este n
umero es importante hacer notar que se satisface la siguiente
contenci
on:
[0, ) S
(1.11)
J. P
aez
36
1.5. Topologa de Rn
ya que si 0 s < , de la definicion de supremo sabemos que existe s S tal que s < s < de
c para
modo que, por la forma en que est
a definido el conjunto S, se tiene que x
+ t(
yx
) (C)
toda t [0, s ] y por lo tanto para toda t [0, s] [0, s ], por lo que se concluye que s S.
Otro hecho que podemos asegurar es que x
0
/ B. En efecto, si x
0 estuviera en B, dado que
c (por la raz
c , y como C es un conjunto
B (C)
on que ya explicamos) entonces < 1 y x
0 (C)
c es un conjunto abierto de modo que existira
cerrado (inciso 2 de la proposici
on 1.26) entonces (C)
c
r > 0 tal que Br (

x0 ) (C) . Notese ahora que, si

r
1
,
r = min
2
2k
x yk
entonces para toda t + r se tiene que
k
x0 (
x + t(
yx
))k = k(
x + (
yx
)) (
x + t(
yx
))k
= k( t)(
yx
))k
= (t )k
x yk
r k
x yk
r
2
<r
c . De esta contenci
y por lo tanto x
+t(
y x
) Br (
x0 ) (C)
on, y por la contenci
on 1.11, concluimos
c
que x
+ t(
yx
) (C) para toda t [0, + r ] [0, 1] y por lo tanto que + r S, lo cual
contradice el hecho de que = sup(S).
Si x
0
/ C ya habremos terminado pues entonces x
0
/ B C. Pero s puede suceder que x
0 C
(podra dar el lector un ejemplo en el que esto fuera cierto?). En este caso mostraremos que
podemos obtener otro punto x
0 [
x, y] tal que x
0
/ B C, de la siguiente forma: si x
0 C, dado
c
que B C = (porque B y C est

an separados) entonces 0 < y x
0 (B) , y como este es un
c . Sea
conjunto abierto, existe r > 0 tal que Br (
x0 ) (B)

r
,
t = min
2 2k
x yk
+ ( t )(
yx
) [
x, y] tenemos, por la
Entonces, como 0 < t < 1, si tomamos x
0 = x
c
/ C. Por
0
contenci
on 1.11, que t S y por lo tanto que x
0 (C) , de donde concluimos que x
otra parte, como

k
x0 x
0 k = (
x + (
yx
)) ((
x + ( t )(
yx
)))

= t (
yx
)
= t k
x yk
r
2
<r
c de donde ahora concluimos que x

/ B C.
/ B. Es decir, x
0
x0 ) (B)
0
se tiene que x
0 Br (
Con base en este lema vamos a obtener resultados muy importantes, y con el primero de ellos
lograremos probar que una clase muy grande y muy importante de conjuntos, son conexos. Nos
referimos a los llamados conjuntos convexos, los cuales definimos a continuaci
on.
37
J. P
aez
1.5. Topologa de Rn
Definici
on 1.43 Sea A Rn . Decimos que A es un conjunto convexo si para cada par de puntos
x
, y A se tiene que [
x, y] A.
Antes de probar el resultado que anunciamos, mostraremos algunos ejemplos de conjuntos
convexos.
Ejemplo 1.44 Los siguientes conjuntos, son ejemplos de conjuntos convexos:
1. El espacio total Rn . Esto es un hecho inmediato, puesto que estamos hablando de el conjunto
que constituye el universo sobre el cual se est
a trabajando. De esta forma, si x
, y Rn ,
n
por supuesto que [
x, y] R .
2. Para todo x
, y Rn el segmento que los une [
x, y]. Observe que, si tomamos x
+ s(
yx
) y
x
+ s (
yx
), con s, s [0, 1], es decir x
+ s(
yx
), x
+ s (
yx
) [
x, y], entonces se tiene
que
(
x + s(
yx
)) + t(
x + s (
yx
) (
x + s(
yx
))) = x
+ (s + t(s s))(
yx
)
=x
+ ((1 t)s + ts )(
yx
)
y como (1t)s+ts [0, 1] para toda t [0, 1] concluimos que [

x+s(
y
x), x+s (
y
x)] [
x, y],
es decir que [
x, y] es convexo.
3. Cualquier bola (o vecindad) con centro en cualquier punto x
0 Rn y de cualquier radio r > 0
(Br (
x0 )). En efecto, si x
, y Br (
x0 ) y t [0, 1] se tiene que
k
x0 (
x + t(
yx
))k = k(
x0 + t(
x0 x
0 )) (
x + t(
yx
))k
= k(t
x0 + (1 t)
x0 ) (t
y + (1 t)
x)k
= kt(
x0 y) + (1 t)(
x0 x
)k
t k
x0 yk + (1 t) k
x0 x
k
< tr + (1 t)r
=r
lo que prueba que [
x, y] Br (
x0 ).
4. Cualquier rect
angulo cerrado R = [a1 , b1 ] [an , bn ]. Sean x
= (x1 , . . . , xn ), y = (y1 , . . . , yn )
R y sea t [0, 1]. Como ai xi , yi bi y t [0, 1] entonces tai tyi tbi y (1 t)ai
(1 t)xi (1 t)bi de tal forma que
ai = tai + (1 t)ai tyi + (1 t)xi tbi + (1 t)bi = bi
es decir, tenemos que
ai tyi + (1 t)xi = xi + t(yi xi ) bi
para cada i {1, . . . , n}, y por lo tanto que x
+t(
y x
) = (x1 +t(y1 x1 ), . . . , xn +t(yn xn ))
R para toda t [0, 1], lo que significa que [
x, y] R.
El resultado que probaremos a continuaci
on, tendra como un corolario el importante hecho de
que todos los conjuntos mencionados en el ejemplo anterior, ser
an conjuntos conexos.
J. P
aez
38
1.5. Topologa de Rn
Proposici
on 1.45 Sea A Rn . Si A es convexo entonces A es conexo.
Demostraci
on. Supongamos que A no es conexo. Entonces existen B, C Rn no vacos y
separados, tales que A = B C. Dado que B y C son no vacos, elegimos x
B y y C. Por el
lema 1.42 tenemos entonces que [
x, y] * B C = A lo cual contradice el hecho de que A es convexo.
Por lo tanto, A es conexo.
Una pregunta que siempre nos tenemos que hacer es si el recproco de una proposici
on es cierto.
En el caso de la proposici
on anterior la respuesta es negativa pero para poder dar un ejemplo
de este hecho, ser
a necesario ampliar la familia de conjuntos para los cuales hayamos probado que
realmente son conexos. Y justo eso es lo que haremos en la siguiente proposici
on que probaremos, la
cual nos proporciona una condici
on necesaria y suficiente para que un conjunto abierto sea conexo.
Para facilitar la redacci
on de su prueba, introducimos el siguiente concepto: dados x
, y, x1 , . . . , x
k
n
R diremos que el conjunto [
x, x
1 ] [
x1 , x
2 ] [
xk , y] es una poligonal que une a x
con y (o que
empieza en x
y termina en y, o que tiene extremos x
y y).
Proposici
on 1.46 Sea A Rn abierto y no vaco. A es conexo s y s
olo si para cada par de
puntos x
, y A, existen x
1 , . . . , x
k A tales que [
x, x
1 ] [
x1 , x2 ] [
xk , y] A. Es decir, A es
conexo s y s
olo si para cada par de puntos x
, y A existe una poligonal contenida en A que une a
x
con y.
Demostraci
on. Supongamos que A es conexo y sea x
0 A un punto fijo. Notese que nuestra
demostracion se reduce a demostrar que para cualquier x
A, siempre existe una poligonal que
une a x
0 con x
(por que?). Para lograr esto, definimos los siguientes conjuntos:
U = {
x A | existe una poligonal contenida en A que une a x
0 con x
}
y
V = {
x A | no existe una poligonal contenida en A que une a x
0 con x
}
Observe que nuestro objetivo es probar que U = A.
Como se prueba facilmente, los conjuntos U y V tienen las siguientes propiedades:
1. A = U V
2. U V =
3. U 6= (pues x
0 U )
Lo que ahora vamos a demostrar es que U y V son conjuntos abiertos. En efecto, si x
U A,
como A es un conjunto abierto sabemos que existe r > 0 tal que Br (
x) A; aseguramos que
Br (
x) U ya que si y Br (
x) sabemos que [
x, y] Br (
x) A (las bolas son convexas) de tal
forma que si [
x0 , x
1 ] [
x1 , x2 ] [
xk , x
] es una poligonal contenida en A que une a x
0 con x
,
entonces [
x0 , x1 ] [
x1 , x
2 ] [
xk , x
] [
x, y] es una poligonal contenida en A que une a x
0 con
y, de donde tenemos que y U , es decir, Br (
x) U y por lo tanto U es un conjunto abierto.
Analogamente, si x
V A, como A es un conjunto abierto sabemos que existe r > 0 tal que
Br (
x) A; aseguramos que Br (
x) V pues de lo contrario, existira y Br (
x) A tal que y
/V
y por tanto se tendra que y U en cuyo caso existira [
x0 , x
1 ] [
x1 , x
2 ] [
xk , y] una poligonal
contenida en A que une a x
0 con y, y como [
y , x] Br (
x) A entonces [
x0 , x
1 ] [
x1 , x
2 ]
[
xk , y] [
y , x] sera una poligonal contenida en A que unira a x
0 con x
, contradiciendo el hecho
39
J. P
aez
1.5. Topologa de Rn
de que x
V . As pues, se debe tener que Br (
x) V con lo cual concluimos que V tambien es
abierto.
Resumiendo, tenemos que A es la uni
on de dos conjuntos abiertos y ajenos U y V , que por la
proposici
on 1.38 est
an separados. Por estas razones, si adem
as tambien se cumpliera que V 6= ,
obtendramos que A no es conexo, lo que sera una contradicci
on. De esta forma se debe tener que
V = y por tanto que A = U , que es justo lo que se quera probar.
La condici
on de suficiencia para la conexidad es una consecuencia inmediata del lema 1.42. En
efecto, si A no fuera conexo sabemos que existen B y C conjuntos no vacios y separados tales que
A = B C. De esta forma, si elegimos x
B y y C, y tomamos [
x, x
1 ] [
x1 , x
2 ] [
xk , y]
una poligonal que une a estos puntos, entonces aseguramos que [
x, x
1 ] [
x1 , x
2 ] [
xk , y] * A.
En efecto, n
otese que si llamamos x
0 = x
y x
k+1 = y entonces existe i {0, . . . , k} tal que
x
i B y x
i+1 C de tal forma que, por el lema 1.42, [
xi , x
i+1 ] * B C = A. Resumiendo, si A no
fuera conexo, no existira una poligonal contenida en A que una a x
y y, lo que contradice nuestra
hip
otesis.
Volviendo al recproco de la proposici
on 1.45, aun y cuando geometricamente es muy sencillo
mostrar un ejemplo de un conjunto que sea conexo pero no convexo (ver figura 1.16), con base en
el resultado anterior podemos probar que el siguiente ejemplo ilustra el mismo hecho.
1
b
1
Figura 1.16: El conjunto A es conexo pero no es convexo ya que el segmento [
x, y] no esta contenido
en A.
Ejemplo 1.47 Sea
A = R2 \ {(x, y) R2 | x 0 y y = 0}
El lector probar
a en el problema 16 que este conjunto es abierto. Aqu s
olo mostraremos que para
cualquier x
= (x, y) A, el segmento que lo une con el punto x
0 = (1, 0) A est
a totalmente contenido en A (ver figura 1.17), lo que mostrar
a que este conjunto satisface la condici
on de suficiencia
de la proposici
on anterior y por lo tanto ser
a conexo.
Dado (x, y) A, distinguimos tres casos:
1. y = 0 y x > 0. En este caso el segmento [
x, x0 ] = [(x, 0), (1, 0)] est
a dado por
{(x + t(1 x), 0) = ((1 t)x + t, 0) R2 | t [0, 1]}
y como (1 t)x + t > 0 para toda t [0, 1], se tiene que est
a contenido en A.
J. P
aez
40
1.5. Topologa de Rn
2. y > 0 y x R. En este caso el segmento [

x, x0 ] = [(x, y), (1, 0)] est
a dado por
{(x + t(1 x), y ty) = ((1 t)x + t, (1 t)y) R2 | t [0, 1]}
de tal forma que, como (1 t)y > 0 para toda t [0, 1) y para t = 1 obtenemos el punto
(1, 0) = x
0 , entonces en esta caso tambien dicho segmento est
a contenido en A.
3. y < 0 y x R. En este caso el segmento [
x, x
0 ] = [(x, y), (1, 0)] est
a dado por el mismo
conjunto del inciso anterior, s
olo que ahora (1 t)y < 0 para toda t [0, 1) y para t = 1
obtenemos otra vez el punto (1, 0) = x
0 , de modo que nuevamente el segmento estar
a contenido
en A.
Ahora s
olo nos resta probar que A no es convexo. En efecto, si tomamos los puntos x
= (1, 1) y
y = (1, 1) se tiene que x
, y A y sin embargo el punto (1, 0) = x
+ (1/2)(
yx
) [
x, y] no
pertenece a A, es decir, [
x, y] " A.
Figura 1.17: El conjunto A = R2 \ {(x, y) R2 | x 0 y y = 0} es conexo pero no es convexo ya que

el segmento [
x, y] no est
a contenido en A
Concluimos esta secci
on con un resultado que nos permite caracterizar a los conjuntos disconexos (y por tanto a los conexos) en terminos de conjuntos abiertos. Aun y cuando no es la
caracterizaci
on m
as conocida en terminos de este tipo de conjuntos (la cual podremos probar hasta
el captulo 2), este caso tambien resultara ser de gran utilidad.
Proposici
on 1.48 Sea A Rn . A es disconexo si y s
olo si existen U, V Rn conjuntos abiertos
tales que:
1. A U V ,
2. A U 6= y A V 6= , y
3. A U V = .
41
J. P
aez
1.5. Topologa de Rn
Demostraci
on. Si A es disconexo, sabemos que existen B, C Rn no vacos y separados tales
mostraremos que U y V satisfacen las propiedades
que A = B C. Sea U = Rn \ C y V = Rn \ B;
requeridas.
C = = B C de tal forma que C Rn \ B
=V
Como B y C est
an separados sabemos que B
n
y B R \ C = U y de aqu que
A=BC
(Rn \ B)
(Rn \ C)
= U V
Por otra parte
A U = A (Rn \ C)
AB
=B
6=
y an
alogamente
A V = A (Rn \ B)
AC
=C
6=
Finalmente
(Rn \ C)
A U V = A (Rn \ B)
n
C))
= A (R \ (B
C))
= (B C) (Rn \ (B
=
Para probar la implicaci

on recproca, tomamos B = A U y C = A V ; por los incisos 1 y 2 de
la hip
otesis tenemos que B 6= , C 6= y que A = B C, de modo que s
olo nos restara mostrar
que estos conjuntos est
an separados.
Supongamos que
C = (A U ) (A V ) 6=
B
x) V . Por otra parte,
Si x
(A U ) (A V ) V , como V es abierto existe r > 0 tal que Br (
como x
(A U ) por el inciso (a) del problema 27 sabemos que
6= Br (
x) (A U ) V (A U ) = A U V
lo que contradice el inciso 3 de la hip

otesis. Por tanto BC
= (A U )(AV ) = . Analogamente
se prueba que C B = (A V ) (A U ) = .
Como mencionamos anteriormente, como un corolario inmediato tenemos la siguiente caracterizacion de los conjuntos conexos.
J. P
aez
42
1.6. Otros sistemas coordenados
Corolario 1.49 Sea A Rn . A es conexo si y s

olo si no existen U, V Rn conjuntos abiertos
tales que:
1. A U V ,
2. A U 6= y A V 6= , y
3. A U V = .
1.6
Otros sistemas coordenados
Al inicio de este captulo describimos situaciones las cuales nos llevaron a considerar funciones
que dependen de la posici
on de un objeto, o que asignan una flecha. En todos estos ejemplos,
usamos el hecho de que una posici
on o una flecha se puede describir si se establece un sistema
coordenado cartesiano, en cuyo caso la funcion involucrada se tendra que escribir en terminos de
estas coordenadas.
Hay situaciones en las que las funciones que las describen se pueden expresar de manera
m
as sencilla usando otras cantidades que caracterizan a una posici
on o a una flecha (como la
distancia a un punto fijo o un
angulo).
En el caso particular de los puntos y/o flechas (con un punto inicial fijo) del plano o del
espacio, estas situaciones se presentan con m
as frecuencia y por lo mismo existen otras formas
de representar estos objetos por medio de otro tipo de parejas o ternas ordenadas de n
umeros
reales. Aun y cuando no siempre es necesario, estas otras formas de representacion se realizan con
base en un sistema cartesiano establecido previamente, que es justo como lo haremos en este texto.
1.6.1
Coordenadas polares
Para el caso del plano, si x

representa un punto o una flecha, adem
as de asignarle sus coordenadas
(x0 , y0 ) en un sistema cartesiano dado, podemos asignarle otra pareja de n
umeros (, ), a la que
llamaremos unas coordenadas polares de x
, en donde es igual a la distancia que hay de x
al origen
(es decir, la magnitud o norma de x
), y es el angulo (dirigido) formado por la parte positiva del
eje X y la semirecta que parte del origen y pasa por x
(ver figura 1.18).
Y
X
Figura 1.18: Obtenci
on de coordenadas polares de un punto (o una flecha) x
del plano.
En analoga con la interpretacion geometrica de las coordenadas cartesianas, la cual consiste
en ver a x
como el u
nico punto en el que se intersectan las rectas x = x0 (paralela al eje Y , y
que es justo todo el conjunto de puntos del plano cuya coordenada cartesiana x es igual a x0 ) y
43
J. P
aez
y = y0 (paralela al eje X, y que es justo todo el conjunto de puntos del plano cuya coordenada
cartesiana y es igual a y0 ), sus coordenadas polares (0 , 0 ) nos proporcionan el radio (0 ) de la
u
nica circunferencia (que es justo todo el conjunto de puntos del plano cuya coordenada polar es
igual a la constante 0 ), y el
angulo (0 ) de la u
nica semirecta que parte del origen (que es justo
todo el conjunto de puntos del plano cuya coordenada polar es igual a la constante 0 ), que tienen
como intersecci
on al punto (o vector) x
(ver figura 1.19).
Y
0
X
Figura 1.19: Las coordenadas polares (0 , 0 ) nos proporcionan el radio (0 ) de la u

nica circunferencia,
y el angulo (0 ) de la u
nica semirecta que parte del origen, que tienen como interseccion al punto (o
vector) x
.
Otro aspecto importante que hay que hacer notar con relaci
on a estas nuevas coordenadases es
que para asignarlas, no es necesario recurrir a todas las parejas ordenadas de R2 ; es decir, basta
con tomar las parejas (, ) tales que 0 y 0 < 2 para que todo punto (o flecha) del plano
tenga asociada una de ellas.
De hecho, salvo por el origen
0 (cuyas coordenadas polares pueden estar dadas por cualquier
pareja de la forma (0, ), con cualquier n
umero real), la asignaci
on de unas coordenadas polares
establece una biyecci
on entre un plano menos un punto (aquel que se haya elegido como el origen)
y el subconjunto (0, ) [0, 2) R2 . m
as aun, n
otese que el angulo siempre se puede elegir en
cualquier intervalo de la forma 0 < 0 + 2, en donde 0 es un angulo fijo.
De esta forma, un mismo punto (o vector) x
tiene muchas coordenadas polares, raz
on por la
cual al inicio de esta subseccion hablamos de unas coordenadas polares del punto x
.
En reciprocidad con lo anterior, tambien es importante hacer notar que cualquier pareja (, )
R2 (incluso con < 0) se puede interpretar como coordenadas polares de un punto (o vector) x
2
del plano, obteniendo (o construyendo) x
de la siguiente manera: dada una pareja (, ) R ,
h
agase una rotaci
on del eje X por radianes, y sobre ese eje rotado, localice el n
umero ; este ser
a
el punto x
que le corresponda a la pareja (, ) (ver figura 1.20).
Con base en lo anterior, n
otese que podemos concluir que, si (, ) y ( , ) son coordenadas
polares de un mismo vector x
del plano, entonces se debe cumplir que = y = + k para
alguna k Z. m
as especficamente, se tiene que = si y s
olo si = + 2k para alguna k Z,
y = si y s
olo si = + (2k + 1) para alguna k Z.
Otra observaci
on importante con relaci
on a las coordenadas polares, es que las operaciones de
suma y producto por un escalar que definimos para las parejas de R2 , ya no se corresponden con
la suma y producto por un escalar que definimos geometricamente para vectores (o flechas) del
J. P
aez
44

Y
X
Figura 1.20: Cualquier pareja (, ) R2 (en este caso con < 0) se puede interpretar como
coordenadas polares de un punto (o vector) x
del plano, el cual se obtiene de la siguiente manera:
hagase una rotaci
on del eje X por radianes, y sobre ese eje rotado, localice el n
umero ; este ser
a el
punto x
que le corresponda a la pareja (, ).
plano. Es decir, si (1 , 1 ) y (2 , 2 ) son coordenadas polares de x
1 y x
2 , respectivamente, entonces
la pareja (1 + 2 , 1 + 2 ) no son necesariamente coordenadas polares de x
1 + x
2 (en donde esta
u
ltima suma de vectores es la que se obtiene por medio de la ley del paralelogramo); y si
R entonces la pareja (1 , 1 ) no son necesariamente coordenadas polares de
x1 . Sin duda un
problema interesante consiste en encontrar coordenadas polares para x
1 + x
2 y
x1 en terminos de
coordenadas polares de x
1 y x
2 , y por lo mismo lo dejamos como un problema para el lector.
Lo que si queremos mencionar aqu es la interpretacion geometrica de ciertas operaciones
aritmeticas con coordenadas polares; especficamente, si (, ) son coordenadas polares de un
vector x
y h R entonces (, + h) son coordenadas polares de un vector x
h que se obtiene
rotando h radianes a x
; y ( + h, ) son coordenadas polares de un vector x
h que est
a en la misma
direcci
on que est
ax
, s
olo modificando su magnitud por una cierta cantidad h (y suponiendo que
+ h no tiene signo diferente a ; que sucede geometricamente si y + h tienen signo diferente?)
(ver figura 1.21).
Finalmente, y con base en las funciones trigonometricas, deducimos las ecuaciones que nos permiten obtener, dadas cualesquiera coordenadas polares (, ) de un vector x
, sus correspondientes
coordenadas cartesianas (x, y) (ambas consideradas sobre el mismo sistema coordenado cartesiano
XY ). Estas ecuaciones son las siguientes:
x = cos()
(1.12)
y = sen()
(ver figura 1.22).
Recprocamente, si conocemos las coordenadas cartesianas (x, y) de un vector x
, podemos
obtener unas coordenadas polares de x
de la siguiente forma: dado que representa la distancia de x
al origen (es decir, la norma de x
), sabemos que
p
= x2 + y 2
45
J. P
aez

Y
( + h, )
(, )
(, + h)
x
h
x
h
(, )
x
X
(b)
(a)
Figura 1.21: Si un vector x

tiene coordenadas polares (, ), entonces el vector x
h de coordenadas
polares ( + h, ) est
a en la misma direcci
on que x
(si y + h tienen el mismo signo) (a), y el vector
(b).
x
h de coordenadas polares (, + h) se obtiene rotando h radianes el vector x
Y
sen()
cos()
Figura 1.22: Dadas cualesquiera coordenadas polares (, ) de un vector x

, sus correspondientes coordenadas cartesianas son ( cos(), sen()).
(lo que tambien se puede confirmar a partir de las dos identidades anteriores).
Obtener una expresi
on para es un poco m
as elaborado y hay que analizar algunos casos. Como
ya habamos mencionado, si x
= 0, cualquier pareja de la forma (0, ) ( R) son coordenadas
polares de x
. Si x = 0 y y > 0 (es decir que x
est
a en la parte positiva del eje Y ), bastara con
tomar = /2 o en general
= + 2k
2
Y si x = 0 y y < 0 (es decir que x
est
a en la parte negativa del eje Y ), bastara con tomar = 3/2
o en general
3
=
+ 2k
2
con k Z.
Si x 6= 0, de las identidades 1.12 se tiene que
sen()
y
=
x
cos()
= tan()
J. P
aez
46
de tal forma que si arctan es la rama de la funcion inversa de la funcion tangente que toma sus
valores entre /2 y /2 entonces, cuando se tenga x > 0, bastara con tomar = arctan(y/x) o
en general
y
+ 2k
= arctan
x
con k Z; y si x < 0, bastara con tomar = arctan(y/x) + o en general

y
= arctan
+ (2k + 1)
x
con k Z.
1.6.2
Coordenadas cilndricas
Para el caso de puntos y/o flechas en el espacio, y nuevamente partiendo de un sistema cartesiano
dado, vamos a dar otra forma de asignarles ternas de n
umeros que los representen, de la siguiente
manera.
Si x
es un punto o una flecha en el espacio cuyas coordenadas cartesianas (en el sistema XY Z
dado) son (x0 , y0 , z0 ), nos fijamos en el vector del plano XY que tiene coordenadas cartesianas
(x0 , y0 ) (y que geometricamente se obtiene de proyectar a x
en el plano XY ). Si ahora la pareja
(0 , 0 ) son unas coordenadas polares del vector (x0 , y0 ), decimos entonces que la terna (0 , 0 , z0 )
son unas coordenadas cilndricas del vector x
(ver figura 1.23).
Z
b
0
x
z0
b
x0
y0
X
Figura 1.23: Si la pareja (0 , 0 ) son unas coordenadas polares del vector (x0 , y0 ) del plano XY , decimos
entonces que la terna (0 , 0 , z0 ) son unas coordenadas cilndricas del vector x
.
Como en el caso de la coordenadas polares, geometricamente las coordenadas cilndricas nos
proporcionan el radio (0 ) del cilindro circular recto (paralelo al eje Z, y que es justo todo el
conjunto de puntos del espacio cuya coordenada cilndrica es igual a la constante 0 ); el
angulo
(0 ) (medido con respecto a la parte positiva del eje X) del semiplano perpendicular al plano XY
(y que es justo todo el conjunto de puntos del espacio cuya coordenada cilndrica es igual a la
constante 0 ) del semiplano perpendicular al plano XY ; y la altura (z0 ) del plano paralelo al plano
XY (que es justo todo el conjunto de puntos del espacio cuya coordenada cilndrica z es igual a la
constante z0 ), que tienen como intersecci
on u
nicamente al punto (o vector) x
(ver figura 1.24).
47
J. P
aez
Figura 1.24: Las coordenadas cilndricas (0 , 0 , z0 ) de un punto x

nos proporcionan el radio 0 del
cilindro circular recto, el
angulo 0 del semiplano perpendicular al eje X, y la altura z0 del plano
paralelo al plano XY , que tienen como interseccion u
nicamente al punto x
.
Nuevamente es importante hacer notar que para asociar unas coordenadas cilndricas a un
vector x
, no es necesario recurrir a todas las ternas de R3 pues basta con que 0 , 0 < 2 y
z R, es decir, a todo vector en el espacio se le puede asignar unas coordenadas cilndricas de tal
forma que estas esten en el subconjunto [0, ) [0, 2) (, ) R3 , e incluso, de manera m
as
general, en un subconjunto de la forma [0, ) [0 , 0 + 2) (, ) R3 , con 0 R, fijo.
No obstante lo anterior, y como en el caso de las coordenadas polares, cualquier terna (, , z)
3
R se puede interpretar como coordenadas cilndricas de un vector del espacio. Para hacer esto,
basta con localizar en el plano XY el vector que se le debe asignar a la pareja (, ) (de acuerdo
con el procedimiento descrito en la secci
on anterior) y despues elevarlo a la altura z (ver figura
1.25).
Con base en lo anterior tenemos que, si dos ternas (, , z) y ( , , z ) son coordenadas cilndricas
del mismo vector x
entonces podemos asegurar que = , = + k para alguna k Z, y
z = z .
Z
x
z0
0
b
X
Figura 1.25: Cualquier terna (0 , 0 , z0 ) R3 se puede interpretar como coordenadas cilndricas de un
punto x
del espacio.
J. P
aez
48
Analogamente a lo que sucede con las coordenadas polares, la aritmetica definida entre ternas
no se corresponde con la aritmetica definida geometricamente entre vectores del espacio. Sin
embargo, tambien es importante identificar geometricamente el efecto de sumar una cierta cantidad
h R en una s
ola de estas coordenadas.
De esta forma, si (0 , 0 , z0 ) son coodenadas cilndricas de un vector x
, entonces (0 + h, 0 , z0 )
son coodenadas cilndricas del vector que est
a en el mismo plano que pasa por x
y que contiene al
eje Z (y suponiendo que 0 + h no tiene signo diferente a 0 ; que sucede geometricamente si 0 y
0 + h tienen signo diferente?), a la misma altura sobre el eje Z, pero con la diferencia de que su
proyeccion sobre el plano XY es un vector de norma 0 + h (|0 + h| en el caso general) (ver figura
1.26 (a)).
Si ahora consideramos (0 , 0 + h, z0 ), estas ser
an coordenadas cilndricas del vector que se
obtiene al rotar, con respecto el eje Z, h radianes el vector x
(ver figura 1.26 (b)).
Finalmente, si ahora tomamos (0 , 0 , z0 + h), estas ser
an coordenadas cilndricas del vector que
se obtiene cambiando la punta del vector x
a la altura z0 + h (ver figura 1.26 (c)); en particular,
este vector y el vector x
tendran la misma proyeccion sobre el plano XY .
Z
Z
b
x
h
x
h
b
Z
x
h
b
z0
z0
z0
b
b
b
(a)
h
b
b
b
(b)
(c)
Figura 1.26: Si el vector x

tiene coodenadas cilndricas (0 , 0 , z0 ) entonces, en los siguientes casos, el
vector x
h tiene coordenadas cilndricas: (a) (0 + h, 0 , z0 ); (b) (0 , 0 + h, z0 ); (c) (0 , 0 , z0 + h).
Como en el caso de la coordenadas polares, si (, , z) son cualesquiera coordenadas cilndricas
de un vector x
, usando nuevamente las funciones trigonometricas, obtenemos que la terna (x, y, z),
con
x = cos()
y = sen()
z=z
son las coordenadas cartesianas de x
(n
otese que la tercera, y extra
na identidad anterior, refleja el
abuso de notaci
on que cometemos al nombrar con la misma letra a la tercera coordenada polar y
a la tercera coordenada cartesiana del vector x
, lo cual se justifica por el hecho de que ambas
tienen el mismo significado geometrico).
Recprocamente, para obtener unas coordenadas cilndricas de un vector x
a partir de sus
coordenadas cartesianas (x, y, z), calculamos y procediendo justo igual que en el caso de las
coordenadas polares, y la coordenada polar z se toma igual a la coordenada cartesiana z (por las
razones que ya explicamos en el p
arrafo anterior).
49
J. P
aez
1.6.3
Coordenadas esf
ericas
Concluimos esta breve secci

on introduciendo una forma m
as de asignarle una terna de n
umeros
reales a un vector x
del espacio.
Como en el caso anterior, partiendo de un sistema cartesiano XY Z dado, asignamos a x
la terna
de n
umeros reales (, , ), de la siguiente forma: (como en el caso de las coordenadas polares)
representa la magnitud de x
, es el
angulo (dirigido) formado por la parte positiva del eje X y la
proyeccion del vector x
sobre el plano XY , siempre que esta proyeccion sea diferente del vector
0, y
si dicha proyecci
on es el vector
0, hacemos = 0; y finalmente, ser
a el angulo (dirigido) formado
por la parte positiva del eje Z y el vector x
(6 ) (ver figura 1.27). A la terna (, , ) construida de
esta forma le llamaremos unas coordenadas esfericas del vector x
.
Z
x
0
Y
0
b
Figura 1.27: La terna (0 , 0 , 0 ) son unas coordenadas esfericas del vector x

.
En este caso, y desde un punto de vista geometrico, las coordenadas esfericas (0 , 0 , 0 ) de un
vector (o punto) x
, nos proporcionan el radio (0 ) de una esfera (que es justo todo el conjunto de
puntos del espacio cuya coordenada esferica es igual a la constante 0 ); el angulo (0 ) (medido
con respecto a la parte positiva del eje X) de un semiplano perpendicular al plano XY (que es
justo todo el conjunto de puntos del espacio cuya coordenada esferica es igual a la constante 0 );
y el angulo (0 ) de un cono circular con vertice en el origen (cuyo eje es el eje Z, y que es justo
todo el conjunto de puntos del espacio cuya coordenada esferica es igual a la constante 0 ), que
se intersectan u
nicamente en el punto (o vector) x
(ver figura 1.28).
De la misma forma que en los dos casos anteriores, para asignar unas coordenadas esfericas
a un vector x
no es necesario recurrir a todas las ternas de R3 ; como se podr
a notar, basta con
que 0 , 0 < 2 y 0 , o de manera mas general, que 0 , 0 < 0 + 2 y
0 0 + , con 0 , 0 R fijos.
Tambien, como en los dos casos anteriores, toda terna (, , ) R3 se puede interpretar
como coordenadas esfericas de un vector x
del espacio, de la siguiente forma: sobre el plano XZ, y
con respecto a la parte positiva del eje Z, r
otese radianes el eje Z; a continuaci
on, tomando como
eje de rotaci
on el eje Z, y con respecto a la parte positiva del eje X, rote la recta real resultante
(o si prefiere todo el plano XZ) radianes; finalmente, sobre esta u
ltima recta real que se obtiene,
ubique el n
umero .
El vector x
determinado por el procedimiento anterior, ser
a el vector que asociaremos a la terna
(, , ) y diremos que los elementos de esta terna tambien son coordenadas esfericas de x
. Todo
lo anterior sin duda requiere de un
6
En algunos textos el
angulo se toma como el
angulo (dirigido) formado por el plano XY y el vector x
.
J. P
aez
50
Figura 1.28: Las coordenadas esfericas (0 , 0 , 0 ) de un punto x

nos proporcionan el radio 0 de la
esfera, el
angulo 0 del semiplano perpendicular al eje X, y el angulo 0 del cono, que tienen como
interseccion u
nicamente al punto x
.
Ejemplo 1.50 Sea x
el vector que en un sistema cartesiano dado tiene coordenas (cartesianas)
(1, 1, 1). De acuerdo con el procedimiento de asignaci
on de coordenadas esfericas, tenemos que la
.
terna ( 3, /4, /4) nos da unas coordenadas de este tipo para x
Por otraparte, y de acuerdo con
otese que
el metodo de asignaci
on de un vector a una terna, n
las ternas ( 3, 3/4, /4), ( 3, 3/4, 3/4), y ( 3, /4, 3/4) tambien son coordenadas
esfericas de nuestro vector x
(ver figura 1.29).
Aun y cuando existen diferentes coordenadas esfericas para un mismo vector x
(como sucede
con los otros tipos de coordenadas que hemos visto en esta secci
on), si (, , ) y ( , , ) son dos
de ellas, lo que podemos asegurar es que se debe tener que = , que = + k para alguna
k Z, y que = + k (/2) tambien para alguna k Z.
Como en los casos anteriores, la aritmetica definida entre ternas no se corresponde con la
aritmetica definida geometricamente entre vectores del espacio. Sin embargo, y como tambien
hicimos en los otros casos, es importante identificar geometricamente el efecto de sumar una cierta
cantidad h R en una s
ola de estas coordenadas.
De esta forma, si (, , ) son coordenadas esfericas de un vector x
, entonces el vector que tenga
coordenadas esfericas ( + h, , ) ser
a aquel que est
a en la misma recta que tiene a x
, con norma
| + h| y apuntando en la misma direcci
on que (o contraria a) x
, dependiendo de si y + h tienen
el mismo signo (o signo diferente); asimismo, el vector que tenga coordenadas esfericas (, + h, )
ser
a aquel que se obtiene de rotar h radianes al vector x
, tomando como eje de rotaci
on al eje Z;
finalmente, el vector que tenga coordenadas esfericas (, , + h) ser
a aquel que se obtiene de rotar
h radianes al vector x
, realizando dicha rotaci
on sobre el plano que contenga a x
y al eje Z (ver
figura 1.30).
Finalmente, y recurriendo de nuevo a las funciones trigon
ometricas, si (, , ) son cualesquiera
coordenadas esfericas de un vector x
, obtenemos que la terna (x, y, z), con
x = sen() cos()
(1.13)
y = sen() sen()
z = cos()
51
J. P
aez
3
4
1
1
1
Z
1
3
b
Figura 1.29: El punto x

el cual tambien tiene como coodenadas esfericas a la terna ( 3, /4, 3/4)
se obtiene de la siguiente forma: sobre el plano XZ, y con respecto a la parte positiva del eje Z, rote
on, tomando como eje de rotacion el eje Z, y con respecto a la parte
3
4 radianes el eje Z; a continuaci
positiva del eje X, rote la recta real resultante 4 radianes; finalmente, sobre esta u
ltima recta real que
se obtiene, ubique el n
umero 3.
son las coordenadas cartesianas de x
(ver figura 1.31).
Para obtener unas coordenadas esfericas de un vector x
a partir de sus coordenadas cartesianas
(x, y, z), procedemos de la siguiente forma: en general, por la definicion de la coordenada , tenemos
que
p
= x2 + y 2 + z 2
identidad que tambien se deduce de las identidades anteriores.
Para determinar el
angulo basta con analizar dos casos; en el caso en que x = 0 = y entonces
hacemos = 0 si z 0 y = si z < 0. Si x2 + y 2 > 0, nuevamente por las ecuaciones 1.13
concluimos que se debe cumplir que
( cos())2
z2
=
x2 + y 2
( sen() sen())2 + ( sen() cos())2
( cos())2
=
( sen())2
= tan2 ()
de forma que
|tan()| = p
|z|
x2 + y 2
y por tanto, si z 0 bastara con tomar
= arctan
y si z < 0 bastara con tomar
= arctan
2
J. P
aez
52
x2 + y 2
z
p
x2 + y 2
1.7. Problemas
Z
Z
x
h
b
x
h
0
b
b
x
h
b
b
b
b
(a)
(b)
0
b
(c)
Figura 1.30: Si el vector x

tiene coodenadas esfericas (0 , 0 , 0 ) entonces, en los siguientes casos, el
vector x
h tiene coordenadas esfericas: (a) (0 + h, 0 , 0 ); (b) (0 , 0 + h, 0 ); (c) (0 , 0 , 0 + h).
Z
cos()
os
en
(
)c
)
(
en
b
sen() sen()
(
)
X
Figura 1.31: Recurriendo a las funciones trigonometricas, si (, , ) son coordenadas esfericas de
un vector x
, deducimos que la terna (x, y, z) = ( sen() cos(), sen() sen(), cos()) son sus
correspondientes coordenadas cartesianas.
en donde nuevamente arctan es la inversa de la funcion tangente que toma sus valores entre /2
y /2.
En cuanto al
angulo , si x = 0 y y 0 hacemos = /2, y si y < 0 entonces tomamos
= 3/2. Cuando x 6= 0, por las ecuaciones 1.13 debemos tener que
cos()
y
=
x
sen()
= tan()
de modo que, en general, podemos obtener de la misma manera en que lo hicimos para el caso
de las coordenadas polares.
1.7
Problemas
1. Pruebe las proposiciones 1.8 y 1.10.

53
J. P
aez
1.7. Problemas
2. Pruebe que las normas definidas en 1.14 son en efecto normas, es decir, que satisfacen las
propiedades dadas en la proposici
on 1.8.
3. Pruebe que, si x
= (x1 , . . . , xn ) Rn entonces |xi | k
xk, |xi | k
xk1 y |xi | k
xk para
i = 1, . . . , n.
n 2
n
P
P
ai n
a2i
4. Sean a1 , . . . , an R. Pruebe que
i=1
i=1
5. Pruebe que si x
1 , . . . , x
k Rn entonces
k
x1 + + x
k k k
x1 k + + k
xk k
(recuerde que en el texto, la desigualdad del tri
angulo s
olo se probo para dos vectores).
6. Sean x
1 , . . . , xk Rn tales que x
i x
j = 0 si i, j {1, . . . , n}, i 6= j. Pruebe que:
k
x1 + + x
n k2 = k
x1 k2 + + k
xn k2
(Este resultado es conocido como el teorema de Pit
agoras. Notese que k n. Por que?)
7. Sean x
, y Rn . Pruebe que:
(a) x
y = 0 s y s
olo si k
x + yk = k
x yk
(b) x
y > 0 s y s
olo si k
x + yk > k
x yk
(c) x
y < 0 s y s
olo si k
x + yk < k
x yk
Interprete geometricamente estos resultados
8. Sean x
, y Rn diferentes de
0. Pruebe que:
(a) si k
xk = k
y k = k
x yk entonces el angulo entre x
y y es /3
(b) si k
xk = k
x yk entonces el
angulo entre x
y y es igual al angulo entre y y y x
Interprete geometricamente estos resultados

9. Sean x
(a) k
x + yk = k
xk + k
y k s y s
olo si existe R, > 0, tal que x
=
y
(b) k
x yk = k
xk + k
y k s y s
olo si existe R, < 0, tal que x
=
y

(c) k
x + yk2 + k
x yk2 = 2 k
xk2 + k
y k2
(d) |k
xk k
y k| k
x yk
10. Pruebe la proposici

on 1.17.
11. Sean x
, y Rn y r > 0 tales que y Br (
x). Si x
= (x1 , . . . , xn ) y y = (y1 , . . . , yn ), hacemos
x
i = (y1 , . . . , yi , xi+1 , . . . , xn )
yi = (x1 , . . . , xi , yi+1 , . . . , yn )
para cada i {1, . . . , n 1}, x

0 = yn = x
y y0 = x
n = y. Pruebe que:
(a) x
i , yi Br (
x) para cada i {1, . . . , n 1}
J. P
aez
54
1.7. Problemas
(b) si i = x
i1 + (
xi x
i1 ) y i = yi1 + (
yi yi1 ) con , (0, 1), pruebe que

k
yx
k
y
k
i x
k k
yx
k
i x
para cada i {1, . . . , n}
(c) dibuje los puntos x

i , yi para el caso de R2 y R3
(1)
()
12. Sea r > 0 y x

Rn . Definimos Br (
x) = {
y Rn | k
yx
k1 < r} y Br
k
yx
k < r}.
(
x0 ) = {
y Rn |
(1)
()
(a) describa geometricamente los conjuntos Br (0) y Br (0) cuando n = 2 y n = 3.
(1)
()
x) para definir int1 (A),

(b) en la definicion 1.19, sustituya Br (
x) por Br (
x) y por Br (
int (A), ext1 (A), ext (A), Fr1 (A) y Fr (A), respectivamente. Pruebe que int1 (A) =
int (A) = int(A), ext1 (A) = ext (A) = ext(A), y Fr1 (A) = Fr (A) = Fr(A).
13. Sean A, B subconjuntos de Rn . Diga si cada una de las siguientes identidades y contensiones
son ciertas. Pruebe su respuesta.
(a) int(A B) = int(A) int(B); int(A B) = int(A) int(B)
(b) ext(A B) = ext(A) ext(B); ext(A B) = ext(A) ext(B)

(c) Fr(A B) = Fr(A) Fr(B); Fr(A B) = Fr(A) Fr(B)
(d) si A B entonces: int(A) int(B); ext(B) ext(A); Fr(A) Fr(B)

14. Sea r > 0 y x
Rn . Si A = Br (
x) pruebe que:
(a) {
y Rn | k
yx
k > r} ext(A)
(b) {
y Rn | k
yx
k = r} Fr(A)
(c) las contensiones de los incisos anteriores son identidades
15. Pruebe que, si A Rn es un conjunto cerrado entonces int(Fr(A)) = .

16. Pruebe que el conjunto A del ejemplo 1.47 es un conjunto abierto.
17. Sean a1 , . . . , an , b1 , . . . , bn R tales que ai < bi para i = 1, . . . , n. Pruebe que el conjunto
A = (a1 , b1 ) (an , bn ) = {(x1 , . . . , xn ) Rn | ai < xi < bi , i = 1, . . . , n} es un conjunto
abierto
18. Sean a1 , . . . , an , b1 , . . . , bn R tales que ai bi para i = 1, . . . , n. Pruebe que el conjunto
A = [a1 , b1 ] [an , bn ] = {(x1 , . . . , xn ) Rn | ai xi bi , i = 1, . . . , n} es un conjunto
cerrado

19. Sean A, B Rn . Si A B = (
x, y) R2n | x
A, y B , pruebe que:
(a) si A y B son abiertos (en Rn ) entonces A B es abierto (en R2n )
(b) si A y B son cerrados (en Rn ) entonces A B es cerrado (en R2n )
(c) si A y B son acotados (en Rn ) entonces A B es acotado (en R2n )

55
J. P
aez
1.7. Problemas
20. Sea U Rn un conjunto abierto no vaco y Qn := Q Q (Q multiplicado n veces).

Pruebe que:
(a) U Qn 6=
(b) U se puede poner como la uni

on de bolas (o vecindades) con centro en Qn y radio racional
21. Sean A1 , . . . , Ak subconjuntos de Rn . Pruebe que:
(a) si cada Ai es abierto entonces A1 Ak y A1 Ak son abiertos
(b) si cada Ai es cerrado entonces A1 Ak y A1 Ak son cerrados

Estas afirmaciones siguen siendo ciertas para un n
umero infinito de conjuntos? Pruebe
su respuesta.
on 1.29 y muestre con un ejemplo que las contenciones que se dan ah
pueden ser propias.
23. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe su
respuesta.
(a) Si A B entonces A B
(b) (A B) = A B
(c) (A B) = A B
24. Si A = ([0, 1] [0, 1]) (Q Q) = {(x, y) R2 | x, y Q y 0 x 1, 0 y 1}

Pruebe sus respuestas.
(a) quien es Fr(A), int(A), ext(A), A y A?
(b) A es abierto o cerrado? Pruebe sus respuestas.
25. Si A = {(m, 0) R2 | m Z}, responda las mismas preguntas del problema anterior. Pruebe
sus respuestas.
(1)
()
26. En la definicion 1.27, sustituya Br (

x) por Br (
x) y por Br
respectivamente. Pruebe que A1 = A = A .
(
x) para definir A1 y A ,
27. Sea A un subconjunto de Rn . Pruebe que:

(a) x
A si y s
olo si para todo r > 0 se tiene que Br (
x) A 6=
(b) A es cerrado si y s
olo si A = A
(c) A es cerrado si y s
olo si A A
(d) A A = A
c
(e) A = ext(A)
= A
(f) int(int(A)) = int(A) y (A)
(g) Fr(A) = A (Ac )
28. Sea A un subconjunto de Rn . Pruebe que:

(a) si B A y B es abierto entonces B int(A) (es decir, de los conjuntos abiertos que
est
an contenidos en A, int(A) es el m
as grande)
J. P
aez
56
1.7. Problemas
(b) si A B y B es cerrado entonces A B (es decir, de los conjuntos cerrados que

contienen a A, A es el m
as chico)
29. Sean A, B subconjuntos de Rn . Diga si las siguientes afirmaciones son ciertas. Pruebe sus
respuestas.
(a) si A B entonces A B
(b) (A B) = A B
(c) (A B) A B
(d) (A B) = A B
30. Sea A Rn . Pruebe que: A es un conjunto acotado si y s

olo si para todo x
Rn existe
M > 0 (que depende de x
) tal que k
x yk M para todo y A.
31. Pruebe que el conjunto A definido en cada uno de los problemas 17 y 18, es un conjunto
acotado.
32. Sea A R, A 6= . Pruebe que si A es cerrado y acotado entonces inf(A), sup(A) A.
33. Sea A Rn un conjunto infinito. Pruebe que, si A es un conjunto cerrado y acotado entonces
todo subconjunto infinito B de A tiene un punto de acumulaci
on en A.
34. Sea {Ak } una sucesion de subconjuntos de Rn , cerrados, acotados y no vacos tales que
Ak+1 Ak para toda k N (es decir, lo que se llama una sucesion anidada de conjuntos).
Pruebe que
\
Ak 6=
kN
Este resultado sigue siendo cierto si los conjuntos no son cerrados? o no son acotados?
35. Sea A Rn tal que A 6= . Pruebe que para todo > 0 existen x
, y A tales que
0 < k
x yk < .
36. Determine si la siguiente proposici
on es verdadera: si A Rn es un conjunto infinito y para
todo > 0 existen x
, y A tales que 0 < k
x yk < entonces A =
6 . Pruebe su respuesta.
37. Sean A Rn un conjunto infinito y c R, con c > 0. Pruebe que, si k
x yk c para todo
x
, y A, entonces A es un conjunto no acotado.
38. Sea A Rn tal que A = . Pruebe que si M > 0 y AM = {
x A | k
xk M } entonces AM
es finito.
39. Sean a1 , . . . , an , b1 , . . . , bn R tales que ai < bi para i = 1, . . . , n. Pruebe que el conjunto
A = (a1 , b1 ) (an , bn )
= {(x1 , . . . , xn ) Rn | ai < xi < bi , i = 1, . . . , n}
es un conjunto convexo
40. Sea A R, A 6= . Pruebe que las siguientes afirmaciones son equivalentes:
57
J. P
aez
1.7. Problemas
(a) A es conexo
(b) si para todos a, b A, a < b, y c R tal que a < c < b entonces c A
(c) A es un intervalo (es decir, A es de alguna de las siguientes formas: (, b), (, b],
(a, b), (a, b], [a, b),[a, b], (a, ), o [a, ))

on 1.38.
42. Sea A Rn abierto, A 6= . Pruebe que A es disconexo s y s
olo si existen B, C Rn tales
que B y C son abiertos ajenos no vacos y A = B C.
43. Sea A Rn cerrado, A 6= . Pruebe que A es disconexo si y s
olo si existen B, C Rn tales
que B y C son cerrados ajenos no vacos y A = B C.
44. Sean A, B, C Rn . Pruebe que si B y C est
an separados entonces C A y B A est
an
separados.
45. Sean A, B, C Rn tales que 6= A B C. Pruebe que, si A es conexo y B y C est
an
separados entonces A B
o A C.
46. Sean A, D Rn conjuntos conexos tales que A D 6= . Determine si las siguientes afirmaciones son ciertas. Pruebe su respuesta.
(a) A D es conexo
(b) A D es conexo
47. La proposici
on 1.46 es cierta si A no es abierto? Pruebe su respuesta.
48. Sea A Rn . A es un conjunto estrellado si existe x
0 A tal que para todo x
A se satisface
que [
x0 , x
] A (en cuyo caso se dice que A es estrellado con respecto de x
0 ). Pruebe que
todo conjunto estrellado es conexo.
49. Sean x
1 y x
2 dos vectores en el plano. Si (1 , 1 ) y (2 , 2 ) son coordenadas polares de x
1
yx
2 (en un cierto sistema cartesiano dado), respectivamente, encuentre coordenadas polares
para x
1 + x
2 y
x1 ( R), en donde estas operaciones de suma y producto por un escalar,
son las que se definieron geometricamente en el texto. Compruebe su respuesta convirtiendo
a las coordenadas cartesianas correspondientes.
J. P
aez
58
Captulo 2
Funciones de Rn en Rm
Al inicio del captulo anterior dimos una lista de ejemplos que plantean diversas situaciones, y
nuestro objetivo principal fue mostrar que las funciones que permiten describir cada una de estas
situaciones, son funciones cuyas variables independiente o dependiente (o ambas) pertenecen a alg
un
espacio vectorial, raz
on por la cual estas siempre son suceptibles de representarse (describirse
o medirse) por una cierta cantidad de n
umeros reales (dos, tres, cuatro o m
as!), es decir, por
una n-ada de n
umeros reales.
De esta forma, cada una de las funciones que surgen de estos ejemplos se pueden considerar, en
u
ltima instancia, como funciones cuya variable independiente pertenece a alg
un subconjunto de Rn
m
y la variable dependiente a alg
un subconjunto de R , y las m-adas que representen a esta u
ltima
estar
an expresadas en terminos de las n-adas que representen a la primera.
En el captulo anterior nos concentramos en estudiar al conjunto de las n-adas, es decir Rn , y
por las razones anteriormente expuestas, en este captulo realizaremos un an
alisis m
as detallado
de las funciones definidas sobre subconjuntos de Rn y cuyos valores esten en Rm , sin importar
(por ahora) a que espacios vectoriales pertenezcan las variables (independientes y dependientes)
representadas por estas n-adas (y m-adas) de n
umeros reales.
2.1
Algebra
Iniciamos esta secci

on estableciendo la nomenclatura y la notaci
on con la cual trabajeremos a lo
largo de todo este texto. Casi siempre usaremos la letra f para denotar a una funcion, y si est
a
definida sobre un conjunto A Rn y toma valores en Rm , todo ello lo escribiremos de la siguiente
forma:
f : A Rn Rm
Si los valores de f est

an en Rm esto significa que para cada x
A se debe tener que f (
x) R m ,
raz
on por la cual este valor f (
x) debe de tener m coordenadas, a las cuales denotaremos por
fi (
x) R, con i = 1, . . . , m, es decir f (
x) = (f1 (
x), . . . , fm (
x)). De esta forma, toda funci
on
n
m
n
f : A R R determina (o est
a determinada por) m funciones fi : A R R, a las
cuales conoceremos con el nombre de funciones coordenadas, y con frecuencia escribiremos que
f = (f1 , . . . , fm ).
Las funciones coordenadas siempre son funciones de valores reales y veremos que tienen un
papel muy importante en los conceptos y resultados que desarrollaremos a lo largo de este texto.
La siguiente lista ejemplifica el tipo de funciones con las cuales trabajaremos.
Ejemplo 2.1 Considere las siguientes funciones:
59
Captulo 2. Funciones de Rn en Rm
2.1. Algebra
1. f : Rn R definida como f (
x) = k
xk
2. f : [0, 2] R R2 definida como f (t) = (cos(t), sen(t))
3. f : A = [0, 2][0, ] R2 R3 definida como f (x, y) = (cos(x) sen(y), sen(x) sen(y), cos(y))
4. f : A = R2 \ {(0, 0)} R2 R2 definida como
f (x, y) =
x
p
x2 + y 2
,p
y
x2 + y 2
5. f : A = R2 \ {(x, y) R2 | x 0 y y = 0} R2 R definida como
f (x, y) =
si 0 x
x2
si x 0 y 0 < y
x2
si x 0 y y < 0
Otro aspecto que mencionaremos r

apidamente, es el relacionado con las operaciones algebraicas
entre este tipo de funciones y con las que trabajaremos en este texto. Todas ellas las reunimos en
la siguiente
Definici
on 2.2 Sean f, g : A Rn Rm , R y h : D Rm Rk . Definimos:
1. la suma de f y g, que denotamos por f + g, como (f + g)(
x) := f (
x) + g(
x) para cada x
A
2. el producto del escalar por la funci
on f , que denotamos por f , como (f )(
x) := f (
x)
para cada x
A
3. el producto punto de f por g, que denotamos por f g, como (f g)(
x) := f (
x) g(
x) para cada
x
A
4. si m = 3, el producto cruz de f por g, que denotamos por f g, como (f g)(
x) := f (
x)g(
x)
para cada x
A
5. si m = 1, el cociente de f entre g, que denotamos por f /g, como (f /g)(
x) := f (
x)/g(
x) para
cada x
B = {
x A | g(
x) 6= 0}
6. la composici
on de h con f , que denotamos como h f , como (h f )(
x) := h(f (
x)) para cada
x
B = {
x A | f (
x) D}
Aun y cuando el n
umero de variables involucradas en las funciones con las cuales vamos a
trabajar impone una limitante para recurrir a alg
un tipo de representacion geometrica, en algunos
casos (sobre todo cuando el n
umero de variables no es muy grande), existe la posibilidad de hacer
un poco de geometra con ellas.
Para lograr lo anterior, asociados con una funcion f : A Rn Rm existen algunos conjuntos a
los cuales haremos alusi
on a lo largo de todo este texto. El primero que definiremos, y sin importar
que tan grandes sean n y m, ser
a lo que llamaremos la gr
afica de f .
J. P
aez
60

2.1. Algebra
Definici
on 2.3 Dada f = (f1 , . . . , fm ) : A Rn Rm definimos la gr
afica de f , que denotaremos
por Gf , como el siguiente conjunto:

Gf := (x1 , . . . , xn , f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn )) Rn Rm = Rn+m | (x1 , . . . , xn ) A
y que con frecuencia escribiremos simplemente (para evitar expresiones muy largas, pero no sin
cierto abuso de notaci
on) como

Gf := (
x, f (
x)) Rn Rm = Rn+m | x
A

a de acuerdo, la gr
afica de una funcion s
olo la podremos dibujar (y ver!)
si 2 n + m 3, es decir, en muy pocos casos. Peor aun, en el caso n = 1 y m = 2 este conjunto
no resulta de mucha utilidad, y como el caso n = 1 y m = 1 ya se estudio con mucho cuidado en
los cursos previos de c
alculo de una variable, s
olo en el caso n = 2 y m = 1 podremos dibujar la
gr
afica, lo que no le quita interes a su estudio.
De acuerdo con lo anterior, el tipo de funcion para el cual vale la pena destacar algunas estrategias que nos permitan darnos una idea geometrica de como es su gr
afica (independientemente de
que hoy en da se cuenta con herramientas muy sofisticadas para dibujarlas), ser
a cuando tengamos
2
una funcion f : A R R. En este caso, la gr
afica de este tipo de funciones se puede escribir
como

Gf = (x, y, z) R3 | z = f (x, y) y (x, y) A
lo que en principio establece que los elementos de la gr
afica deben satisfacer la ecuaci
on
z = f (x, y)
con la restriccion de que (x, y) A. De esta forma, la experiencia que el lector haya obtenido en
sus cursos de geometra analtica para visualizar conjuntos en R3 definidos a partir de una ecuaci
on
(la mayora de las veces de tipo cuadratico en las variables x, y y z), le ser
a de gran utilidad.
Relacionado con lo anterior, y de la misma forma que no cualquier subconjunto de R2 puede
ser la gr
afica de una funci
on de R en R, no cualquier subconjunto de R3 puede ser la gr
afica de una
2
funcion de R en R.
Y as como en el caso de R2 se tiene el criterio geometrico que establece que la gr
afica de
una funci
on definida de R (o de un subconjunto de R) en R debe ser un subconjunto de R2 que
s
olo puede intersectar a cualquier recta paralela al eje Y en a lo m
as un punto, en el caso que nos
ocupa hay un criterio geometrico equivalente: la gr
afica de una funcion definida de R2 (o de un
2
subconjunto de R ) en R debe ser un subconjunto de R2 que s
olo puede intersectar a cualquier
recta paralela al eje Z en a lo m
as un punto.
Como seguramente el lector recordara, lo que justifica a este criterio es el hecho de que estamos
hablando de funciones, de tal forma que a cada elemento del dominio le corresponde uno y s
olo un
valor del contradominio.
El siguiente ejemplo ilustra los hechos que mencionamos en los p
arrafos anteriores.

Ejemplo 2.4 Esboce la gr
afica de la funci
on f : A R2 R, con A = (x, y) R2 | x2 + y 2 1 ,
definida como
p
f (x, y) = 1 (x2 + y 2 )
que
Con base en la observaci

on que hicimos anteriormente, las ternas (x, y, z) Gf deben ser tales
z = f (x, y)
(2.1)
61
J. P
aez
2.1. Algebra
=
1 (x2 + y 2 )
de tal forma que, tomando el cuadrado en ambos lados de esta identidad (operaci
on que ser
a muy
importante recordar m
as adelante), concluimos que estas ternas satisfacen la ecuaci
on
z 2 = 1 (x2 + y 2 )
o equivalentemente, la ecuaci
on
x2 + y 2 + z 2 = 1
(2.2)
que seguramente el lector reconocer

a como la ecuaci
on de una esfera de radio 1 con centro en el
origen (0, 0, 0).
Pero justo por la observaci
on anterior a este ejemplo, dado que muchas rectas paralelas al eje
Z (incluyendo el propio eje) intersectan a esta esfera en m
as de un punto, la gr
afica de nuestra
funci
on no puede ser toda la esfera.
Y para determinar que parte de esta esfera corresponde a la gr
afica de nuestra funci
on, recordemos que la ternas que est
an en la gr
afica satisfacen la ecuaci
on 2.1 de donde se deduce que la
coordenada z de estas ternas siempre es mayor o igual a 0 (a diferencia de las ternas que satisfacen
la ecuaci
on 2.2, de la que no se puede deducir que la coordenada z tenga que cumplir con la misma
condici
on).
Como seguramente el lector ya lo habr
a notado, esta perdida del signo de la coordenada z fue
producto de haber tomado el cuadrado en la ecuaci
on 2.1.
Resumiendo lo anterior, concluimos que la gr
afica de nuestra funci
on es la parte de la esfera unitaria
que se encuentra por arriba (y sobre) el plano XY , como se muestra en la figura 2.1.
Figura 2.1: Gr
afica de la funcion f (x, y) =
1 (x2 + y 2 )
Otro conjunto asociado a una funci

on de Rn en R, y al que con frecuencia haremos referencia,
es el llamado conjunto de nivel. Su definicion formal es la siguiente.
J. P
aez
62

2.1. Algebra
Definici
on 2.5 Sean f : A Rn R y c R. Definimos el conjunto de nivel c de f , que
denotamos por Nc (f ), como
Nc (f ) := {
x A | f (
x) = c}
Una propiedad evidente (pero importante) de los conjuntos de nivel es que, para valores distintos
de c, estos conjuntos no se intersectan. Esto es una consecuencia inmediata del hecho de que f sea
una funcion y la dejaremos plasmada en la siguiente
Observaci
on 2.6 Dados c, d R tales que Nc (f ) 6= y Nd (f ) 6= , se tiene que
Nc (f ) Nd (f ) = si y s
olo si c 6= d
Como es de esperarse, los conjuntos de nivel s
olo se pueden ver o dibujar si el dominio
de nuestra funci
on est
a contenido en R2 o R3 (lo que no reduce su importancia para dimensiones
mayores). Por esta raz
on, daremos algunos ejemplos s
olo en estos casos.
Ejemplo 2.7 Determine los conjuntos de nivel de las siguientes funciones:
p
1. f (x, y) = x2 + y 2 con (x, y) R2 . Dado que f (x, y) 0 para toda (x, y) R2 , para c < 0
se tiene que Nc (f ) = . Si c = 0 entonces Nc (f ) = {(0, 0)}, y si c > 0 entonces
n
o
p
Nc (f ) = (x, y) R2 | x2 + y 2 = f (x, y) = c
que no es m
as que la circunferencia de radio c con centro en el origen (ver figura 2.2).
Y
p
b
x2 + y 2 = c
x2 + y 2 = c
Figura 2.2: Curvas de nivel c de las funciones f (x, y) =
rencias de radio c y c, respectivamente.
x2 + y 2 y f (x, y) = x2 + y 2 , las circunfe-
2. f (x, y) = x2 + y 2 con (x, y) R2 . Como para esta funci

on tambien se tiene que f (x, y) 0
para toda (x, y) R2 , si c < 0 entonces Nc (f ) = . Asimismo, si c = 0 entonces Nc (f ) =
{(0, 0)}, y si c > 0 entonces

Nc (f ) = (x, y) R2 | x2 + y 2 = f (x, y) = c
que en este caso es la circunferencia de radio c con centro en el origen (ver figura 2.2).
63
J. P
aez
2.1. Algebra
3. f (x, y, z) = x + y + z con (x, y, z) R3 . En este caso se cumple que Nc (f ) 6= para toda

cRy

Nc (f ) = (x, y, z) R3 | x + y + z = f (x, y) = c
que, como el lector reconocer

a f
acilmente, se trata de un plano con vector normal (1, 1, 1) (ver
figura 2.3).
Z
Figura 2.3: Conjunto de nivel 1 de la funcion f (x, y, z) = x + y + z

Entre otras cosas, y para el caso de R2 , este tipo de conjuntos tambien ser
an u
tiles para esbozar
la gr
afica de una funci
on. En efecto, si cada conjunto de nivel Nc (f ) (o una cantidad suficiente de
ellos) se traslada paralelamente al plano XY a la altura c, obtenemos un bosquejo de la gr
afica
de f (ver figura 2.4).
Este hecho, junto con todas las dem
as tecnicas (como por ejemplo, la intersecci
on con los planos
coordenados) que el lector haya aprendido en sus cursos de Geometra Analtica, le ser
an u
tiles a
2
la hora de intentar visualizar la gr
afica de una funcion de R en R.
En realidad, los conjuntos de nivel son un caso particular de otros conjuntos con los cuales vamos
a trabajar en este mismo captulo un poco mas adelante. Dada esta relaci
on, la aprovechamos para
definir lo que se conoce como la imagen inversa de D bajo f , de la siguiente manera.
Definici
on 2.8 Sean f : A Rn Rm y D Rm . Definimos la imagen inversa de D bajo f ,
que denotamos por f 1 (D), como el conjunto dado por:
f 1 (D) := {
x A | f (
x) D}
Esperemos que la notaci
on usada en esta definicion no cause confusi
on con la notaci
on de funci
on
inversa; si lo que est
a entre parentesis (el argumento) es un conjunto, nos referimos a la imagen
inversa; y si es un elemento de Rn , hablamos de la funcion inversa de f .
Observaci
on 2.9 Como el lector podr
a verificar f
acilmente, si f : A Rn R y c R, entonces
Nc (f ) = f 1 ({c})
Para concluir con la lista de conjuntos asociados con una funcion f : A Rn Rm , dado un
conjunto B A, defineremos ahora lo que se conoce como la imagen directa (o simplemente la
imagen ) de B bajo f de la siguiente manera.
J. P
aez
64

2.1. Algebra
Figura 2.4: Bosquejo de la gr

afica de la funcion f (x, y) =
curvas de nivel
1 (x2 + y 2 ) a partir de algunas de sus
Definici
on 2.10 Sean f : A Rn Rm y B A. Definimos la imagen (directa) de B bajo f ,
que denotamos1 por f (B), como el conjunto dado por:
f (B) := {f (
x) R m | x
B} = {
y Rm | existe x
B tal que f (
x) = y}
Desde un punto de vista geometrico, la imagen de un conjunto bajo una funcion f : A Rn
jugara un papel relevante cuando n m. En estos casos, dado un conjunto B A ser
a muy
importante reconocer quien es el conjunto f (B).
De hecho, apoyados en este concepto de imagen directa (y por ahora de manera informal), si un
subconjunto C Rm se puede obtener (todo el o en partes) como la imagen de un conjunto bajo
una funcion f : I R Rm (que cumpla con ciertas propiedades de derivabilidad que definiremos
m
as adelante), diremos que es una curva en Rm .
Analogamente, si un subconjunto S Rm se puede obtener (todo el o en partes) como la
imagen de un conjunto bajo una funcion f : A R2 Rm (que tambien cumpla con algunas
propiedades de derivabilidad), nos referiremos a este como una superficie en Rm .
Como es de suponer, los u
nicos casos en lo que ser
a posible dibujar (o bosquejar) la imagen de
un conjunto bajo una funci
on, ser
an aquellos en los que el contradominio de la funcion es R2 o R3 ,
es decir s
olo para funciones de R en R2 , de R en R3 , de R2 en R2 , de R2 en R3 y de R3 en R3 .
En el captulo 3 vamos a estudiar con mas detalle a las funciones de R en Rn (en particular en
2
R y en R3 ), raz
on por la cual ahora s
olo nos concretaremos en dar ejemplos de como es la imagen
de algunos conjuntos bajo este tipo de funciones.
Rm
Ejemplo 2.11 Sea f : R R2 dada por f (t) = (cos(t), sen(t)). Describiremos (o bosquejaremos)
los conjuntos f ([/2, /2]), f ([t0 , t0 + 2]) y f ({t0 + k/2 | k Z}) con t0 R fijo, en ambos
casos.
1
Como en el caso de la imagen inversa, nuevamente esperemos que esta notaci
on no cause confusi
on con la notaci
on
de funci
on; si lo que est
a entre parentesis es un conjunto, nos referimos a la imagen directa; y si es un elemento de
Rn , hablamos de la funci
on evaluada en ese elemento.
65
J. P
aez
2.1. Algebra
Para esta funci

on, es importante observar que las parejas (cos(t), sen(t)) pertenecen a la circunferencia unitaria con centro en el origen, pues satisfacen la ecuaci
on x2 + y 2 = 1 para toda t R, en
donde adem
as la variable t representa el a
ngulo (medido en radianes) formado por la parte positiva
del eje X, y la semirecta que parte del origen, y que pasa por el punto (cos(t), sen(t)).
Tomando en consideraci
on este hecho, ahora f
acilmente podemos concluir que: f ([/2, /2])
es el conjunto formado por la parte de la circunferencia unitaria con centro en el origen que se
encuentra en el semiplano derecho (figura 2.5 (a)), f ([t0 , t0 + 2)) es dicha circunferencia completa
(figura 2.5 (b)), y f ({t0 + k/2 | k Z}) es un conjunto formado s
olo por cuatro puntos (figura
2.5 (c)).
t0
b
1
b
b
(a)
(c)
(b)
Figura 2.5: Los conjuntos f ([/2, /2]), f ([t0 , t0 + 2]) y f ({t0 + k/2 | k Z})
Ejemplo 2.12 Sea f : A R2 R3 , con A = [0, 2] [0, ], dada por
f (t, s) = (cos(t) sen(s), sen(t) sen(s), cos(s))
Describiremos (o bosquejaremos) los conjuntos f ({(t, s0 ) | t [0, 2]}), f ({(t0 , s) | s [0, ]})
con s0 [0, ] y t0 [0, 2] fijos.
Como en el ejemplo anterior, ahora es importante notar que las ternas
(cos(t) sen(s), sen(t) sen(s), cos(s))
satisfacen la ecuaci
on x2 + y 2 + z 2 = 1 por lo que podemos concluir que los conjuntos que buscamos
est
an contenidos en la esfera de radio 1 con centro en el origen.
Como todas las ternas f (t, s0 ) = (cos(t) sen(s0 ), sen(t) sen(s0 ), cos(s0 )) tienen la particularidad
de que su tercera coordenada es la misma, entonces satisfacen la ecuaci
on del plano z = cos(s0 ) el
cual es paralelo al plano XY .
En virtud de nuestra primera observaci
on, concluimos que nuestro conjunto est
a contenido en
la intersecci
on de la esfera que mencionamos y este plano (que no es m
as que una circunferencia de
radio sen(s0 ) con centro en el punto (0, 0, cos(s0 ))), y dado que t [0, 2] tenemos que el conjunto
buscado coincide con esta circunferencia (ver figura 2.6).
Por otra parte, como las parejas (cos(t0 ) sen(s), sen(t0 ) sen(s)) (que son la proyecci
on sobre el
plano XY de las ternas (cos(t0 ) sen(s), sen(t0 ) sen(s), cos(s)) = f (t0 , s)) pertenecen a la semirecta
que parte del origen y que forma un
angulo de t0 radianes con la parte positiva del eje X (observe
que sen(s) 0 para toda s [0, ]), concluimos que el conjunto f ({(t0 , s) | s [0, ]}) est
a
J. P
aez
66

2.1. Algebra
Y
X
Figura 2.6: El conjunto f ({(t, s0 ) | t [0, 2]}) se obtiene al intersectar la esfera x2 + y 2 + z 2 = 1

con el plano z = cos(s0 )
contenido en la intersecci
on de la esfera unitaria con centro en el origen y el plano cuya ecuaci
on
es sen(t0 )x + cos(t0 )y = 0.
Esta intersecci
on es una circunferencia completa, pero dado que la proyecci
on de los elementos
de nuestro conjunto s
olo caen en la semirecta antes descrita, inferimos que este conjunto s
olo abarca
la mitad de esta circunferencia, la que une a los puntos (0, 0, 1) = f (t0 , 0) y (0, 0, 1) = f (t0 , ) y
que se proyecta sobre dicha semirecta (ver figura 2.7).
Figura 2.7: El conjunto f ({(t0 , s) | s [0, ]}) esta contenido en la interseccion de la esfera x2 + y 2 +
z 2 = 1 con el plano z = cos(s0 ), y s
olo consta de una semicircunferencia.
Las propiedades m
as importantes relacionadas con los conceptos de imagen inversa e imagen
directa las dejaremos plasmadas en la siguiente proposicion, y dada la sencillez de sus pruebas,
estas quedar
an a cargo del lector.
67
J. P
aez
2.1. Algebra
Proposici
on 2.13 Sean f : A Rn Rm , A , B, C A, y D , D, E Rm , con I, I un
conjunto de ndices. Se cumple que:
1. si D E entonces f 1 (D) f 1 (E)

S
S 1
1
D =
2. f
f (D )
I
3. f 1
f 1 (D )
4. f 1 (D c ) = (f 1 (D))c A = A \ f 1 (D)
5. si B C entonces f (B) f (C)

S
S
A =
6. f
f (A )
I
7. f
f (A ) y si f es inyectiva entonces f
f (A )
8. f (A) \ f (B) f (A \ B) y si f es inyectiva entonces f (A \ B) = f (A) \ f (B)

9. B f 1 (f (B)) y si f es inyectiva entonces B = f 1 (f (B))
10. f (f 1 (D)) D y f (f 1 (D)) = D si y s
olo si D f (A)
on mencionando otra forma de representar geometricamente a las funciones de R2 en R2 y de R3 en R3 . Esta otra forma se desprende b
asicamente de las dos maneras
geometricas en que podemos representar a una pareja (o terna) de n
umeros reales. En efecto,
como ya hemos mencionado en muchas ocasiones, las parejas o ternas las podemos dibujar, o bien
como un punto, o bien como una flecha (o vector).
Combinando estas dos representaciones, dada una funcion f : A R2 R2 (o f : A R3
3
R ), esta la representaremos geometricamente de la siguiente forma: a cada elemento x
A lo
dibujaremos como un punto y a f (
x) como un vector colocado sobre este punto x
.
Otra forma de decir lo anterior, es que en el punto x
A sembramos el vector f (
x), y tal
vez por esta forma m
as coloquial de decirlo, es que a este tipo de funciones (y su representaci
on
geometrica) tambien se les conoce con el nombre de campos vectoriales.
Es importante mencionar que en la descripcion anterior se est
a suponiendo que, mientras el
sistema coordenado con base en el cual se dibuja a cada x
A, es fijo, el que se usa para dibujar a
f (
x) tendra como origen al punto x
y sus ejes (a menos que se indique lo contrario) ser
an paralelos
a los ejes del primero. Es decir, mientras que el sistema coordenado en el que representamos a los
elementos del dominio A no cambia, el que usamos para representar a los valores de f cambiar
a
con cada punto.
Los siguientes ejemplos ilustran esta forma de representar geometricamente a este tipo de funciones.
Ejemplo 2.14 Considere las siguientes funciones.
1. f (x, y) = (x, y). En este caso, como el dominio de f es todo R2 , cada punto del plano tiene
asignado un vector, como se muestra en la figura 2.8 (a).
J. P
aez
68

2.1. Algebra
2. f (x, y) = (y, x). Nuevamente, como el dominio de f tambien es todo R2 , cada punto del
plano tiene asignado un vector, como se muestra en la figura 2.8 (b).
f (x, y) = (y, x)
f (x, y) = (x, y)
b
(x, y)
b
b
(x, y)
b
b
(a)
(b)
Figura 2.8: Representaci

on geometrica de funciones de R2 en R2 . La pareja (x, y) se representa por
un punto y el valor de f en este punto (f (x, y)) por una flecha cuyo punto inicial es el punto (x, y).
3. f : R3 \ {
0} R3 R3 dada por
f (x, y, z) =
x
p
,p
x2 + y 2 + z 2
y
x2 + y 2 + z 2
,p
z
x2 + y 2 + z 2
En este caso, sobre cada punto de R3 distinto del origen, la funci

on asigna un vector que
tiene la particularidad de ser siempre de norma 1.
f (x, y, z)
b
b
b
(x, y, z)
b
b
b
b
b
Y
b
Figura 2.9: Representaci

on geometrica de una funcion de R3 en R3 . La terna (x, y, z) se representa
por un punto y el valor de f en este punto (f (x, y, z)) por una flecha cuyo punto es el punto (x, y, z).
69
J. P
aez
2.2
2.2. Lmite y continuidad de funciones de Rn en Rm
Lmite y continuidad de funciones de Rn en Rm
Como el lector seguramente recordara de su primer curso de calculo, para el caso de las funciones
de R en R los conceptos de lmite y continuidad est
an ntimamente relacionados con la idea de
cercana, la cual, trat
andose de los n
umeros reales, se formaliza a traves del concepto de valor
absoluto.
Para las funciones de Rn en Rm los conceptos de lmite y continuidad no cambian esencialmente
y siguen siendo una expresi
on de las ideas de cercana y aproximacion.
De esta manera, dado que en Rn contamos con varias formas de medir la distancia entre sus
elementos (o de generalizar el concepto de valor absoluto), en principio tenemos muchas maneras
de definir estos conceptos (aunque, como veremos mas adelante, y a la luz de las desigualdades de
la proposici
on 1.15 del captulo 1, todas ellas ser
an equivalentes).
Y as como en el caso de los n
umeros reales, nuestro primer acercamiento a la idea de lmite (o
aproximacion) lo realizamos a traves del concepto de sucesion, eso mismo haremos para el caso de
Rn .
2.2.1
Sucesiones en Rn
El concepto de sucesion en Rn (o en un conjunto arbitrario) es an

alogo al de sucesion en R:
una sucesion es una funci
on que a cada natural le asocia un elemento de Rn . Este concepto lo
formalizamos en la siguiente
Definici
on 2.15 Una sucesi
on en Rn es una funci
on s : N Rn . Denotamos por x
k a s evaluada
en k, es decir, x
k = s(k) y para referirnos a la funci
on s, escribiremos {
xk }.
Como sucede con cualquier funci
on, una sucesion en Rn queda totalmente determinada si se
conoce la regla de asociasi
on, es decir si conocemos x
k para cada k N. Dado que x
k Rn , esta
(i)
debe tener n coordenadas (a las cuales denotaremos2 ) por xk , es decir que

(1)
(n)
x
k = xk , . . . , xk
De esta forma, toda sucesion determina (o est

a determinada por) n sucesiones de n
umeros reales,
a las cuales conoceremos con el nombre de sucesiones coordenadas. Las sucesiones coordenadas
tendran un papel muy importante en los conceptos y resultados que desarrollaremos en esta secci
on,
pues la mayora de ellos se pueden reducir a los conceptos y resultados an
alogos al caso real.
Sin duda el concepto m
as importante con relaci
on a las sucesiones en Rn es el de convergencia,
el cual deseamos que refleje la misma idea de aproximacion que se tiene para el caso real.
En terminos intuitivos (o geometricos), diremos que una sucesion {
xk } en Rn tiende (o converge, que es el temino que usaremos) a un punto x
0 Rn si los terminos de la sucesion est
an cada
vez m
as cerca de x
0 conforme el ndice k se va haciendo cada vez m
as grande (o conforme k tiende
a infinito, que es la forma en que expresamos esta idea de que k se va haciendo cada vez m
as
grande).
Como se recordara, en el caso de los n
umeros reales esta idea de aproximacion o cercana
se formaliza a traves del concepto de valor absoluto, y dado que en Rn contamos con conceptos
equivalentes, la definicion de convergencia de una sucesion en Rn ser
a una copia de la definicion
para sucesiones de n
umeros reales.
2
En este caso usaremos un superndice (encerrado entre parentesis) para denotar la coordenada de un elemento
de Rn dado que en este caso el subndice denota el termino de la sucesi
on.
J. P
aez
70
Definici
on 2.16 Sea {
xk } una sucesi
on en Rn . Decimos que {
xk } es convergente (o que converge)
n
si existe x
0 R tal que para toda cantidad positiva existe un ndice N N tal que para cualquier
otro ndice k N se tiene que
k
xk x
0 k <
es decir: si para todo > 0 existe N N tal que si k N entonces x
k B (
x0 ).
En este caso decimos que la sucesi
on {
xk } converge a x
0 , lo que denotamos como {
xk } x
0 o
lim x
k = x
0
Una interpretacion geometrica de la definicion anterior sera la siguiente: cuando una sucesion
{
xk } converge a un punto x
0 se tiene que para cualquier bola que tomemos con centro en x
0 , sin
importar que peque
no pueda ser su radio, esta contiene a casi todos los terminos de la sucesion
(salvo quizas un n
umero finito de ellos). La figura 2.10 ilustra este hecho en R2 .
x
N +1
b
x
1
b
x
N +2
x
0
b
b
x
2
x
N
b
x
N 1
b
Figura 2.10: Una sucesion {

0 si para todo > 0 existe N N tal que si
k N entonces x
k B (
x0 ).
Como seguramente el lector lo habra pensado, una opcion para definir la convergencia de una
sucesion en Rn hubiera sido hacerlo a traves de las sucesiones coordenadas, es decir, definir que
o
n

(n)
(1)
x
k = xk , . . . , xk
n o
(i)
converge si cada sucesion coordenada (de n
umeros reales) xk converge (para cada i {1, . . . , n}).
Y el lector hubiera estado en lo correcto, como lo mostraremos, dada su importancia, en la primera
proposici
on que formularemos con relaci
on a la convergencia de sucesiones en Rn .
n

o
(1)
(n)
Proposici
on 2.17 Sea x
k = xk , . . . , xk
una sucesi
on en Rn . La sucesi
on {
xk } converge
n o
(i)
converge para cada i {1, . . . , n}. Es decir, {
xk } x
0 =
si y s
olo si la sucesi
on xk

n o
(i)
(n)
(1)
(i)
x0 , . . . , x0
si y s
olo si xk x0 para cada i {1, . . . , n}.
Demostraci
on.
Por los incisos 1 y 2 de la proposici
on 1.15 (del captulo 1) sabemos que para cualquier x
=
n
(x1 , . . . , xn ) R se tiene que
|xi | k
xk |x1 | + + |xn |
71
J. P
aez
para cada i {1, . . . , n} de tal forma que

(n)
(1)
(i)
(n)
(1)
(i)
xk x
0 k xk x0 + + xk x0
xk x0 k
para cada i {1, . . . , n} y para toda k N.
(1)
(n)
Supongamos ahora que {

xk } x
0 = x0 , . . . , x0
existe un ndice N N tal que si k N entonces
(2.3)

. Sabemos entonces que, dado > 0,
k
xk x
0 k <
de tal forma que, por la primera desigualdad de 2.3, se tiene (para cada i {1, . . . , n}) que

(i)
(i)
xk x
0 k <
xk x0 k
n o
(i)
(i)
para toda k N de donde concluimos que xk x0 (para cada i {1, . . . , n}).
n o
(i)
(i)
Si ahora suponemos que xk x0 para cada i {1, . . . , n}, sabemos que dado > 0, para
/n > 0 y para cada i {1, . . . , n} existe un ndice Ni N tal que

(i)
(i)
xk x0 <
n
para toda k Ni (y para cada i {1, . . . , n}). Por tanto, si N = max{N1 , . . . , Nn }, por la segunda
desigualdad de 2.3, si k N , como N Ni para cada i {1, . . . , n}, entonces

(1)
(n)
(1)
(n)
k
xk x
0 k xk x0 + + xk x0
< + +
n
n
=
con lo que concluimos que {
xk } x
0 .
Con base en la proposici

on anterior, y dando como un hecho conocido (y probado!) que la
suma y producto de sucesiones de n
umeros reales convergentes, tambien es convergente, obtenemos
el siguiente resultado (relacionado con el diferente tipo de operaciones algebraicas que podemos
realizar con sucesiones en Rn ).
Como es de suponerse, la prueba de la siguiente proposici
Proposici
on 2.18 Sean {
xk }, {
yk } sucesiones en Rn , y R. Si {
xk } x
0 y {
yk } y0
entonces:
1. {
xk } + {
yk } := {
xk + yk } x
0 + y0
2. {
xk } := {
xk }
x0
3. {
xk } {
yk } := {
xk yk } x
0 y0
4. si n = 3, {
xk } {
yk } := {
xk yk } x
0 y0
J. P
aez
72
Y hablando de criterios que nos permiten garantizar la convergencia de una sucesion en Rn ,

seguramente el lector recordara el muy conocido criterio de convergencia de sucesiones de n
umeros
reales, el afamado criterio de Cauchy.
Como en el caso de la definicion de convergencia en Rn , tambien podramos recurrir a las
sucesiones coordenadas para generalizar este concepto a las sucesiones en Rn .
Sin embargo, y al igual que hicimos con la convergencia, puesto que este concepto tambien
expresa una cierta idea de cercana (y por lo tanto de distancia), la definiremos con base al concepto
(o a uno de ellos) de distancia que hemos definido en Rn , y despues formularemos un resultado que
muestra que esta definicion resulta equivalente a que las sucesiones coordenadas tambien sean de
Cauchy.
Definici
on 2.19 Sea {
xk } una sucesi
xk } es de Cauchy si para toda
cantidad positiva existe un ndice N N tal que para cualquier otro par de ndices k, l N se
tiene que
k
xk x
l k <
es decir: si para todo > 0 existe N N tal que si k, l N entonces k
xk x
l k < .
Como mencionamos antes, la definicion anterior resulta equivalente a que las sucesiones coordenadas tambien sean de Cauchy, lo que plasmamos en la siguiente proposici
on y cuya prueba, como
es de suponerse, queda a cargo del lector.
o
n

(n)
(1)
una sucesi
on {
xk } es de
Proposici
on 2.20 Sea x
k = xk , . . . , xk
n o
(i)
es de Cauchy para cada i {1, . . . , n}.
Cauchy si y s
olo si la sucesi
on xk
La importancia del concepto de sucesion de Cauchy radica en que dicha propiedad es una
condici
on equivalente a la propiedad de ser convergente, resultado que podemos obtener como un
facil corolario de la proposici
on anterior, y del correspondiente resultado para las sucesiones de
n
umeros reales.
Corolario 2.21 Sea {
xk } una sucesi
on {
xk } es convergente si y s
olo si {
xk }
es de Cauchy.
Es importante mencionar que el resultado anterior se puede probar sin recurrir a la proposici
on
2.20, prueba que dejamos como un problema para el lector (problema 25).
Otro concepto que resulta muy importante en relaci
on a las sucesiones, es el de subsucesi
on.
Con la misma idea bajo la cual se define el concepto de subsucesi
on de n
umeros reales, tambien se
define para el caso de sucesiones en Rn .
Es decir, una subsucesi
on de una sucesion {
xk } ser
a una nueva sucesion que se construye
eligiendo terminos de la sucesion original {
xk }, con la u
nica restriccion de que los ndices de los
terminos que se elijan vayan creciendo, es decir, que estos formen una sucesion de n
umeros naturales creciente (restriccion que no debe extra
narnos, sobre todo si recordamos que lo importante
de las sucesiones es lo que sucede con sus terminos justo cuando su ndice crece (o tiende a
infinito)).
La formalizaci
on de este concepto la damos en la siguiente
Definici
on 2.22 Sean {
xk } una sucesi
on en Rn y {kl } una sucesi
on de n
umeros naturales (es
decir, una funci
on que al natural l, le asocia el natural kl ). Decimos que {
xkl } es una subsucesi
on
de {
xk } si {kl } es una sucesi
on creciente de n
umeros naturales (es decir, que kl < kl+1 para toda
l N).
73
J. P
aez
Como dijimos antes, una subsucesi

on {
xkl } de una sucesion {
xk } es a su vez una sucesion, y es
importante recalcar que el ndice (o variable) de esta nueva sucesion est
a representado por la letra
l; es decir, el decimo termino de la sucesion {
xkl } es el k10 termino de la sucesion original {
xk }.
Tambien es importante hacer notar que toda sucesion es subsucesi
on de s misma; en efecto, si
tomamos kl = l la funci
on identidad de N en N, que sin duda es creciente, entonces la subsucesi
on
{
xkl } es {
xl }, es decir la sucesion original {
xk } (en donde la u
nica diferencia es que cambiamos el
nombre de su ndice (o variable), l por k).
De la idea intuitiva de convergencia es de esperarse que si una sucesion {
xk } converge al punto
x
0 Rn entonces cualquier subsucesi
on de esta tambien converja a x
0 . El recproco de la afirmacion
anterior tambien es cierto; es decir, si todas las subsucesiones de una sucesion {
xk } convergen a un
n
mismo punto x
0 R entonces {
xk } tambien converge a x
0 , afirmacion que resulta evidente puesto
que, como dijimos antes, toda sucesion es subsucesi
on de si misma.
Lo interesante es que, aun y cuando excluyamos a la sucesion {
xk } como subsucesi
on de s
misma, el resultado sigue siendo cierto. Este es un hecho importante y lo dejamos plasmado en la
siguiente proposici
on.
Con relaci
on a su prueba, vale la pena mencionar que, como ya va siendo costumbre, hay
dos caminos para hacerla: usar la proposici
on 2.17 y el correspondiente resultado para sucesiones
de n
umeros reales (que es la que haremos aqu), o hacerla sin usar esta proposici
on y probarla
directamente (que es la que dejaremos como un problema para el lector).
Proposici
on 2.23 Sea {
xk } una sucesi
on {
xk } converge al punto x
0 Rn si
y s
olo si cualquier subsucesi
on {
xkl } de {
xk }, diferente de {
xk }, tambien converge a x
0 .
Demostraci
on. Para entender un poco mejor esta prueba, n
otese que la proposici
on se puede
n
reformular de la siguiente manera: {
0 R si y s
olo si para cualquier
sucesion creciente de n
umeros naturales {kl } tal que kl 6= l para alguna l N, se tiene que {
xk l }
tambien converge al puntox
0 .

(1)
(n)
(n)
(1)
yx
0 = x0 , . . . , x0 . Si {
xk } x
0 , por la proposici
on
Supongamos que x
k = xk , . . . , xk
(i)
(i)
2.17 sabemos que {xk } x0 para cada i {1, . . . , n}. Ahora, si tomamos cualquier subsucesi
on
(i)
(i)
on de {xk } (para cada i {1, . . . , n}), por el
{
xkl } 6= {
xk }, dado que {xkl } es una subsucesi
(i)
(i)
(1)
(n)
correspondiente resultado para sucesiones de n

umeros reales sabemos que {xkl } x0 (para cada
i {1, . . . , n}) de modo que, nuevamente por la proposici
on 2.17, tenemos que {
xkl } x
0 .
Por otra parte, si cualquier subsucesi

on {
xk l } =
6 {
xk } converge a x
0 = x0 , . . . , x0
entonces
n o n o
(i)
(i)
(i)
cualquier subsucesi
on xkl 6= xk converge a x0 (para cada i {1, . . . , n}) de tal forma que,
de
umeros reales, sabemos que
o cuenta por el correspondiente resultado para sucesiones de n
n nueva
(i)
(i)
as por la proposici
on 2.17, tenemos
xk x0 (para cada i {1, . . . , n}) de modo que, una vez m
que {
xk } x
0 .
El resultado anterior tiene una consecuencia pr

actica muy importante: si {
xk } es una sucesion
que tiene una subsucesi
on que no converge, o tiene dos subsucesiones que convergen a puntos
diferentes, entonces {
xk } no es convergente.
Para concluir con la lista de condiciones necesarias y suficientes (o ambas) para que una sucesion
en Rn sea convergente (sin duda el tema m
as importante con relaci
on a estas), retomaremos la
interpretacion geometrica que dimos al hecho de que una sucesion sea convergente.
Como se recordara, si una sucesion {
0 entonces dada una bola con
centro en este punto, sin importar su radio, casi todos los terminos de la sucesion (salvo un n
umero
J. P
aez
74
finito de ellos) se quedan dentro de dicha bola. Entre otras cosas, de este hecho se deduce que el
conjunto formado por los terminos de la sucesion (y que m
as adelante definiremos formalmente)
est
a ubicado esencialmente alrededor del punto x
0 y por lo tanto ser
a un conjunto acotado.
El conjunto formado por los terminos de una sucesion (al que se le conoce como el rango de la
sucesion) es un conjunto que resulta ser importante, y m
as aun cuando este est
a acotado, raz
on por
la cual defineremos formalmente a este conjunto y daremos un nombre particular (que seguramente
el lector ya adivina) a las sucesiones para las cuales se cumple esta propiedad.
Definici
on 2.24 Sea {
xk } una sucesi
on en Rn . Definimos el rango de la sucesi
on, que denotamos
por R({
xk }), como el conjunto formado por los terminos de la sucesi
on, es decir
R({
xk }) := {
xk | k N}
Definici
on 2.25 Sea {
xk } una sucesi
xk } es una sucesi
on acotada si
R({
xk }) es un conjunto acotado, es decir, si existe M > 0 tal que k
xk k M para toda k N.
Con base en estas definiciones, la discusion que hicimos previa a ellas se puede resumir en la
siguiente
Proposici
on 2.26 Sea {
xk } una sucesi
on en Rn . Si {
xk } es una sucesi
on convergente entonces
{
xk } es una sucesi
on acotada.
Demostraci
on. Sea x
0 Rn tal que {
xk } x
0 . De acuerdo con la definicion de convergencia,
sabemos que para = 1 > 0 (o cualquier otra cantidad positiva que se nos ocurra) existe un
ndice N N tal que si k N entonces x
k B1 (
x0 ), o equivalentemente, que k
xk x
0 k < 1.
De esta forma, si tomamos M = max{k
x1 k , . . . , k
xN 1 k , k
x0 k + 1} tenemos que k
xk k M si
k {1, . . . , N 1} y si k N entonces k
xk x
0 k < 1 y por lo tanto
k
xk k = k(
xk x
0 ) + x
0 k
k
xk x
0 k + k
x0 k
< 1 + k
x0 k
con lo que concluimos que k

xk k M para toda k N, es decir, que {
xk } es una sucesion acotada.
El resultado anterior nos proporciona una consecuencia (o condici
on) necesaria de las sucesiones
convergentes y suele ser muy u
til cuando dicha condici
on no se cumple pues nos permite concluir
que la sucesion en cuesti
on no es convergente (como suele suceder con todas las condiciones que
son necesarias).
Desafortunadamente esta propiedad no es una condici
on suficiente que garantice la convergencia
de una sucesion, como es facil verificarlo en el siguiente

Ejemplo 2.27 Considere la sucesi
on en R2 dada por x
k = (1)k , 1/k . Como
q
k
xk k = ((1)k )2 + (1/k)2
p
= 1 + 1/k 2
2
(1)
concluimos que {
xk } es una sucesi
on acotada. Sin embargo, como xk = (1)k no es convergente,
por la proposici
on 2.17 tenemos que {
xk } es una sucesi
on no convegente.
75
J. P
aez
A pesar del ejemplo anterior, del hecho de que una sucesion {

xk } sea acotada se puede obtener
un resultado muy importante: si bien la sucesion {
xk } completa puede que no sea convergente,
lo que siempre sucede es que existe al menos una subsucesi
on de {
xk } que si converge, como sucede
con la sucesion del ejemplo anteriorpara la cual es facil ver que la subsucesi
on cuyos ndices son los
n
umeros pares {
x2l = (1)2l , 1/2l } converge
al
punto
(1,
0),
y
que
la
subsucesi
on de los ndices

2l1
impares {
x2l1 = (1)
, 1/(2l 1) } converge al punto (1, 0). Este importante resultado lo
dejamos plasmado en el siguiente
Teorema 2.28 Sea {
xk } una sucesi
on en Rn . Si {
xk } est
a acotada entonces existe {
xkl }, subsucesi
on de {
xk }, tal que {
xkl } es convergente.
Demostraci
on. Existen al menos tres pruebas diferentes de este teorema (dos de las cuales se
dejan como problema al lector). La prueba que haremos aqu se basara, como en casos anteriores,
en la proposici
on 2.17 y en el resultado equivalente para sucesiones de n
umeros reales.
Procederemos por induccion en n, la dimension del espacio en el que estamos tomando la
sucesion. De esta forma, para n = 1 estamos en el caso de sucesiones en R el cual vamos a dar por
n
probado. Supongamos
entonces
que el teorema
n

oes cierto para sucesiones en R y lo probaremos
(1)
(n) (n+1)
para una sucesion x
k = xk , . . . , xk , xk
en Rn+1 acotada.
o
n

(n)
(1)
; por el problema 22 (aplic
andolo en ambos sentidos) teneDefinimos yk = xk , . . . , xk
n
mos que {
yk } es una sucesion acotada en R de tal forma que, por hip
otesis de induccion, tiene
una subsucesi
on {
ykl } que es convergente.
o
n
o
n
(n+1)
(n+1)
est
a
Consideremos ahora la sucesion de n
umeros reales xl = xkl
; dado que xk
acotada entonces {xl } tambien est
a acotadande tal forma que,opor el mismo teorema para sucesiones
(n+1)
(n+1)
de {xl } que converge.
= xk l
en R, sabemos que existe una subsucesi
on xlm
m
o

n
(n)
(1)
es una subsucesi
on de {
ykl }, por la proposici
on 2.23
Ahora, como yklm = xkl , . . . , xkl
m
m
se tiene que esta tambien converge y por lo tanto (nuevamente por la proposici
on 2.17, en ambos
sentidos) obtenemos que la subsucesi
on
o

n
(n+1)
(n)
(1)
x
k lm = x k l , . . . , x k l , x k l
m
de {
xk }, tambien converge, afirmacion con la que concluye nuestra prueba.
2.2.2
Lmite
Como sucede con las sucesiones en Rn , los conceptos de lmite y continuidad para funciones de Rn
en Rm expresan la misma idea de aproximacion que expresan los mismos conceptos para el caso de
funciones de R en R, y adem
as se definen de manera completamente an
aloga a como se hace para
este tipo de funciones.
Aun tomando en cuenta lo anterior, es importante hacer notar que ahora que contamos con una
clasificaci
on m
as detallada del tipo de puntos asociados a un conjunto A Rn , si este conjunto
es el dominio de una funci
on f , los puntos para los cuales tendra sentido preguntarse por el lmite
de f ser
an justo aquellos que est
an pegados a A, es decir, el tipo de punto al que nos podemos
aproximar por medio de puntos diferentes de el y que esten en A (ver inciso (b) del problema 29).
Como el lector recordara, estos puntos son aquellos que llamamos de acumulaci
on de A y cuyo
conjunto formado por ellos denotamos como A .

Una vez dicho lo anterior, damos la siguiente
J. P
aez
76
Definici
on 2.29 (de lmite por sucesiones) Sean f : A Rn Rm y x
0 A . Decimos que
m
f tiene lmite en x
0 y que su lmite es l R , si para toda sucesi
on {
xk } contenida en A \ {
x0 }
que converge a x
0 se tiene que la sucesi
on {f (
xk )} converge a l. En este caso escribimos que
lim f (
x) = l
x0
y decimos que
l es el lmite de f en x
0 .
De forma an
aloga a lo que sucede con las sucesiones en Rn , y como una consecuencia de este
hecho, si f = (f1 , . . . , fm ), la existencia del lmite de f en un punto x
0 A es una condici
on
necesaria y suficiente de la existencia del lmite (en el mismo punto) de cada una de sus funciones
coordenadas fi . Este importante resultado lo dejamos expresado en la siguiente
Proposici
on 2.30 Sean f = (f1 , . . . , fm ) : A Rn Rm y x
0 A . La funci
on f tiene lmite en
m
x
0 y su lmite es l = (l1 , . . . , lm ) R si y s
olo si la funci
on fi tiene lmite en x
0 y su lmite es li ,
para cada i {1, . . . , m}.
La prueba de esta proposici
on es una consecuencia inmediata de la proposici
on 2.17 y se deja
como un problema para el lector.
La proposici
on anterior tiene la virtud de reducir el problema de determinar la existencia del
lmite (y en caso de existir, su c
alculo) de una funcion de Rn en Rm , a s
olo funciones de Rn en
R. Por esta raz
on, a continuaci
on daremos una serie de ejemplos en los cuales s
olo consideraremos
funciones de este u
ltimo tipo.
Antes de dar los ejemplos, describiremos un procedimiento que consiste en experimentar
con algunas sucesiones que satisfagan la definicion 2.29 y observar que es lo que sucede con las
correspondientes sucesiones de im
agenes. Los pasos a seguir despues de hacer estos experimentos
dependeran de sus resultados.
Si para varias sucesiones especficas las correspondientes sucesiones de im
agenes siempre convergen al mismo valor, y el lector intuye (intuici
on que seguramente desarrollara despues de
calcular muchos lmites) que la funcion debe de tener lmite (el cual debera de ser aquel valor al
que convergieron todas las sucesiones de im
agenes con las que se experimento), habra que hacer
una demostracion de que ese valor es el lmite de cualquier otra sucesion de im
agenes {f (
xk )}, en
donde sea {
xk } cualquier otra sucesion (totalmente arbitraria) que cumpla con las condiciones de
la definicion de lmite.
Por otra parte, si tenemos la suerte de encontrar sucesiones para las cuales las correspondientes
sucesiones de im
agenes no convergen, o convergen a valores diferentes, entonces de acuerdo a la
definicion 2.29 podemos concluir que la funcion no tiene lmite en el punto en cuesti
on. Como se
podr
a notar, cuando el problema sea mostrar que una funcion no tiene lmite en un punto, las
sucesiones son una herramienta muy u
til y muy sencilla de usar.
Ejemplo 2.31 Determinaremos si las siguientes funciones tienen lmite en el punto que se indica.
1. f (x, y) = xy/(x2 + y 2 ) en el punto (0, 0).
Observe que esta funci
on est
a definida en A = R2 \ {(0, 0)} y el (0, 0) es un punto de acumulaci
on de A, de tal forma que s es v
alido preguntarse si esta funci
on tiene lmite en dicho
punto.
N
otese tambien que, en caso de existir el lmite, este tendra que ser 0, pues si en particular
tomamos la sucesi
on {
xk = (1/k, 0)}, la cual satisface las condiciones de la definici
on 2.29
77
J. P
aez

(1)
ya que x
k A para toda k N, y {
xk } (0, 0) en virtud de que {xk
(2)
on constante cero), entonces
{xk 0} 0 (la sucesi
= 1/k} 0 y
(1/k)(0)
(1/k)2 + 02
=0
f (
xk ) =
para toda k N, es decir, la sucesi

on de im
agenes {f (
xk )} es la sucesi
on constante cero, la
cual converge a 0.
Sin embargo, si ahora consideramos {
xk = (1/k, 1/k)}, para esta sucesi
on tambien se tiene
que {
xk } (0, 0) y
(1/k)(1/k)
(1/k)2 + (1/k)2
1
=
2
f (
xk ) =
para toda k N, es decir, ahora la sucesi

on de im
agenes {f (
xk )} es la sucesi
on constante
1/2 la cual converge a 1/2.
Con base en el comportamiento de estas dos sucesiones, podemos concluir que la funci
on no
tiene lmite en el punto (0, 0).
p
2. f (x, y) = xy/ x2 + y 2 en el punto (0, 0).
Como en el inciso anterior, es f

acil ver que si {
xk = (1/k, 0)}, {
xk = (0, 1/k)} o {
xk =
(1/k, 1/k)} entonces en todos estos casos se tiene que la correspondientes sucesiones de
im
agenes satisfacen que {f (
xk )} 0.
M
as aun, si {
xk = (1/k, m/k)}, con m R, en cuyo caso los terminos x
k satisfacen la
2
ecuaci
on de la recta (en R ) y = mx (es decir que la sucesi
on {
xk } se aproxima al (0, 0)
por (o sobre) esta recta), entonces
f (
xk ) = p
(1/k)(m/k)
(1/k)2 + (m/k)2
m(1/k)2
=
(1/k) 1 + m2

1
m
=
k
1 + m2
de donde tambien tenemos que {f (

xk )} 0.
Los experimentos anteriores nos hacen sospechar que la funci
on s tiene lmite (en cuyo
caso tendra que ser 0), y para demostrar que esta afirmaci
on es cierta, recurriremos a una
de las desigualdades que el lector prob
o en el problema 3 del captulo 1 y que resultar
a muy
u
til a la hora de hacer demostraciones de lmites.
En ese problema se prueba que, si x
= (x1 , ..., xn ) Rn entonces
xk para cada
p |xi | k
2
2
i = 1, ..., n. De esta forma, si x
= (x, y) entonces |x| , |y| k
xk = x + y y por tanto
|xy| k
xk2
J. P
aez
78

y si x
6=
0, tenemos que

xy

|f (
x)| = p

2
2
x +y
|xy|
k
xk
k
xk
Sea ahora {
xk } cualquier sucesi
on contenida en A = R2 \ {(0, 0)} tal que {
xk } (0, 0); por
la desigualdad anterior, se tiene que
|f (
xk ) 0| = |f (
xk )|
k
xk k
Ahora, como {
xk } (0, 0), por el problema 14 tenemos que {k
xk k} 0 y por la desigualdad
anterior (aplicando la ley del sandwich para sucesiones de n
umeros reales) concluimos que
la sucesi
on {|f (
xk ) 0|} 0 y por el problema 13 tenemos que {f (
xk )} 0.
De esta forma, hemos probado que
lim
xy
(x,y)(0,0)
x2 + y 2
=0
En el ejemplo anterior, inciso (2), usamos la conocida ley del sandwich para sucesiones de
n
umeros reales. Este resultado lo podemos extender a las funciones de Rn en R y va a resultar
ser una herramienta muy u
til para el calculo de lmites.
Proposici
on 2.32 Sean f, g, h : A Rn R y x
0 A . Si existe r > 0 tal que
f (
x) h(
x) g(
x)
para toda x
(Br (
x0 ) \ {
x0 }) A y
lim f (
x) = l = lim g(
x)
x0
x0
entonces h tiene lmite en x

0 y
lim h(
x) = l
x0
Esta proposici
on es una consecuencia inmediata de la mencionada ley del sandwich para
sucesiones de n
umeros reales y como es de suponer, su prueba se deja al lector.
Lo que si vamos a hacer, es resaltar el hecho de que la hip
otesis relacionada con las desigualdades
que deben satisfacer las funciones involucradas, s
olo se debe de satisfacer en una vecindad del
punto en donde se va a tomar el lmite, confirmando con ello que este concepto s
olo depende del
comportamiento local de dichas funciones.
Otro hecho muy facil de probar, pero no por ello menos es importante, es la relaci
on del concepto
de lmite con la aritmetica de las funciones. Los resultados que formularemos en la siguiente
proposici
on se deducen (casi todos ellos) de las correspondientes propiedades de las sucesiones que
quedaron plasmadas en la proposici
on 2.18, raz
on por la cual, salvo por la u
ltima afirmacion, la
prueba se deja al lector.
79
J. P
aez
Proposici
on 2.33 Sean f, g : A Rn Rm , R, l, l Rm y x
0 A . Si f y g tienen lmite
en x
0 y
lim f (
x) = l
y
lim g(
x) = l
x
x0
x0
entonces:
1. la funci
on f + g tiene lmite en x
0 y adem
as
lim (f + g)(
x) = lim f (
x) + lim g(
x)
x0
x0
x0
= l + l
2. la funci
on f tiene lmite en x
0 y adem
as
lim (f )(
x) = lim f (
x)
x0
x0
= l
3. la funci
on f g tiene lmite en x
0 y adem
as

lim (f g)(
x) = lim f (
x) lim g(
x)
x
x0
x0
= l l
x0
4. si m = 3, la funci
on f g tiene lmite en x
0 y adem
as

lim (f g)(
x) = lim f (
x) lim g(
x)
x
x0
x0
= l l
x0
5. si m = 1, B = {
x A | g(
x) 6= 0} y l =
6 0 entonces x
0 B y adem
as

limxx0 f (
x)
f
(
x) =
lim
x
x0 g
limxx0 g(
x)
l
=
l
Demostraci
on. (inciso 5). Primero probaremos que x
0 B . Como x
0 A , de acuerdo con
el inciso (b) del problema 29 sabemos que existe una sucesion {
x0 } tal que
{
xk } converge a x
0 .
De la definicion de lmite tenemos
que la sucesion (de n
umeros reales) {g(
xk )} converge
entonces

a l 6= 0 de tal forma que, para = l > 0 sabemos que existe N N tal que, si k N entonces

xk ) l < = l
g(
Notese que en la desigualdad anterior no puede ser que g(

xk ) = 0 y por tanto podemos concluir
que, si k N entonces g(
xk ) 6= 0 y de aqu que x
k B \ {
x0 } para toda k N.
J. P
aez
80
Por tanto, si hacemos yl = x

l+N entonces {
yl } es una sucesion en B \ {
x0 } que adem
as de ser
una subsucesi
on de la sucesion {
xk } (tomando kl = l + N ), se tiene que {
yl } tambien converge a
x
0 , de modo que, nuevamente por el inciso (b) del problema 29, concluimos que x
0 B .
Esto prueba que x
0 es punto de acumulaci
on del dominio de la funcion f /g; por otra parte,
que esta funci
on tiene lmite en x
0 , y que su lmite es el cociente de los lmites de f y g, es una
consecuencia inmediata del correspondiente resultado para el cociente de sucesiones de n
umeros
reales, que aqu daremos por probado.
Como el lector habra notado, de las operaciones entre funciones mencionadas en la proposici
on
anterior, no se incluye a la composici
on de funciones. El motivo es que el posible resultado que
se podra formular para esta operaci
on no resulta cierto; es decir, si g : A Rn Rm , x
0 A ,
m
k
k
f : D R R , l D y
l R son tales que:
x) = l y limyl f (
y) = l , y
1. limxx0 g(
2. x
0 (A g1 (D)) (esta condici
on es para garantizar que x
0 sea punto de acumulaci
on del
dominio de la funci
on f g)
no es posible asegurar que la funci
on f g tenga lmite en el punto x
0 , como lo mostraremos en el
siguiente
Ejemplo 2.34 Sean g(x, y) = x para (x, y) R2 y f (t) = 0 si t 6= 0 y g(0) = 1.
Lo primero que se tiene que observar en este ejemplo es que el dominio de la funci
on g est
a
dado por A = R2 y que (0, 0) A .
Por otra parte, si {
xk } es cualquier sucesi
on contenida en A tal que {
xk = (xk , yk )} (0, 0),
como g(
xk ) = xk para toda k N, y por la proposici
on 2.17 se tiene que {xk } 0, entonces
{g(
xk )} 0 y por lo tanto concluimos que lim(x,y)(0,0) g(x, y) = 0.
Asi mismo, es claro que la funci
on f est
a definida para toda t R y que limt0 f (t) = 0. Por
tanto, la funci
on f g tambien est
a definida para toda (x, y) A de modo que s es v
alido preguntar
si esta funci
on tiene lmite en el punto (0, 0).
Afirmamos que dicho lmite no existe; en efecto, si tomamos la sucesi
on {
xk = (0, 1/k)} se
tiene que {
xk } (0, 0) y por otra parte g(
xk ) = g(0, 1/k) = 0 de modo que (f g)(
xk ) = 1 para
toda k N y por tanto {(f g)(
xk )} 1.
Si ahora elegimos la sucesi
on {
yk = (1/k, 0)} entonces {
yk } (0, 0) y g(
yk ) = g(1/k, 0) =
1/k 6= 0 de modo que (f g)(
yk ) = 0 para toda k N y por tanto {(f g)(
yk )} 0. De esta forma,
concluimos que la funci
on f g no tiene lmite en el punto (0, 0).
Mas adelante, una vez que hayamos introducido el concepto de continuidad, retomaremos el
problema de formular un resultado que relacione la composici
on de funciones y el concepto de
lmite.
Si bien es cierto que definir el concepto de lmite a traves de sucesiones resulta ser muy intuitivo
(y muy u
til, cuando se trata de probar que una funcion no tiene lmite en un punto), tambien es
cierto que esta definicion puede resultar un poco complicada de usar cuando se trata de probar
que una funci
on s tiene lmite en un punto.
Lo que ahora vamos a hacer ser
a introducir otra forma de definir el concepto de lmite (la muy
conocida definicion ) que entre otras muchas virtudes, resultara ser m
as sencilla de usar cuando
se quiera probar que una funci
on s tiene lmite en un punto. Y como es de suponerse, probaremos
que ambas definiciones resultan ser equivalentes.
81
J. P
aez
Definici
on 2.35 ( ) Sean f : A Rn Rm y x
0 A . Decimos que f tiene lmite en x
0 y
m
que su lmite
es
l
R
si
para
toda
>
0
existe
>
0
tal
que
si
k
x
k
<
(y
x
A
\
{
x
0
0 })

entonces f (
x) l < . Es decir, si para toda bola de radio > 0 (con centro en l) existe una
bola de radio > 0 (con centro en x
0 ) tal que si x
B (
x0 ) (A \ {
x0 }) entonces f (
x) B (l) (o
x0 })) B (l)).
f (B (
x0 ) (A \ {
Una de las ventajas de la definicion anterior es que esta se puede ilustrar geometricamente,
como se muestra en la figura 2.11.
x
0
f (
x)
Figura 2.11: La funcion f tiene lmite en x

0 A y su lmite es l Rm si para toda bola de radio > 0
(con centro en
l) existe una bola de radio > 0 (con centro en x
0 ) tal que si x
B (
x0 ) (A \ {
x0 })
entonces f (
x) B (l)
Probar que la definicion anterior es equivalente a la definicion 2.29 es sin duda algo que
tenemos que hacer, pero antes mostraremos por medio de un ejemplo la conveniencia de usar esta
definicion, sobre todo cuando pretendamos demostrar que una funcion s tiene lmite.
Ejemplo 2.36 Considere la funci
on
f (x, y, z) = p
xy 2
x4 + y 4 + z 2 + z 4
que est
a definida para todo (x, y, z) A = R3 \ {(0, 0, 0)}. Mostraremos, usando la definici
on 2.35,
que esta funci

on tiene lmite en el 0 = (0, 0, 0) A y que dicho lmite es 0.
Sea pues una cantidad > 0; nuestra tarea es mostrar que existe una
> 0 (que en
cantidad

general depender
a de la cantidad dada) para la cual se satisfaga que, si x
0 < (y x
A\{
0})
entonces |f (
x) 0| < .
Para lograr esto, y como seguramente el lector recordar
a de sus cursos anteriores de c
alculo, lo
que
hay
que
buscar
es
la
forma
de
acotar
la
cantidad
|f
(
x
)
0|
=
|f
(
x
)|
en
t
e
rminos
de
la
cantidad

x
0 = k
xk, y para ello habr
a que echar mano de todo el acervo de desigualdades de las que
disponemos.
Por ejemplo, recordemos que todo n
umero elevado a una potencia par siempre es no negativo
de tal forma que
p
p
x4 + y 4 + z 2 x4 + y 4 + z 2 + z 4
J. P
aez
82

y por lo tanto
1
1
p
p
x4 + y 4 + z 2 + z 4
x4 + y 4 + z 2
lo cual es cierto para toda (x, y, z) A.

p
Si por otra parte observamos que la cantidad x4 + y 4 + z 2 es la norma (euclidiana) del vector
(x2 , y 2 , z) y que esta u
ltima siempre es mayor o igual que el valor absoluto de cualquiera de sus
coordenadas (problema 3 del captulo 1) es decir

p
y 2 = y 2 (x2 , y 2 , z) = x4 + y 4 + z 2
concluimos que
y2
x4 + y 4 + z 2
tambien para toda (x, y, z) A.

Por tanto, reuniendo las desigualdades anteriores tenemos que
|f (
x) 0| = |f (
x)|

2
xy

= p

x4 + y 4 + z 2 + z 4
p
|x| y 2
x4 + y 4 + z 2
y2
= |x| p
x4 + y 4 + z 2
|x|
k(x, y, z)k

= x
0

x
0 < = entonces, como |f (
de
modo
que,
si
tomamos
y
x
A
es
tal
que
x) 0|

x
0 , tenemos que |f (
x) 0| < .
De esta forma mostramos que se verifica la definici
on 2.35 y concluimos nuestro ejemplo.
Una vez hecho el ejemplo anterior, mostraremos que las dos definiciones de lmite que hemos
dado son equivalentes, lo cual lo dejaremos formulado en el siguiente
Teorema 2.37 Sean f : A Rn Rm , x
0 A y l Rm . Si f y l satisfacen la definici
on
2.35 entonces satisfacen la definici

on 2.29. Y recprocamente, si f y l satisfacen la definici
on 2.29
entonces satisfacen la definici
on 2.35.
Demostraci
on. Supongamos que f y l satisfacen la definicion 2.35. Para probar que satisfacen la
definicion 2.29, tomemos {
xk } una sucesion contenida en A \ {
x0 } tal que {
xk } x
0 ; mostraremos
que {f (
xk )} l.
Para probar esto u
ltimo, tomamos cualquier > 0; de la definicion 2.35 sabemos que existe
> 0 tal que si x
B (
x0 ) (A \ {
x0 }) entonces f (
x) B (l).
Ahora, dado que {
xk } x
0 , para esta > 0 sabemos que existe N N tal que si k N
entonces k
xk x
0 k < , es decir x
k B (
x0 ) (A \ {
x0 }); as, por la propiedad que tiene tenemos
83
J. P
aez

que f (
xk ) B (l), es decir que f (
xk ) l < para toda k N , con lo que concluimos que
{f (
xk )} l.
Supongamos ahora que f y l satisfacen la definicion 2.29. En esta parte de la prueba procederemos por el metodo de la contrapuesta, es decir, que f y l no satisfacen la definicion 2.35. Esto
significa que existe una cantidad > 0 tal que para cualquier cantidad > 0 que se

tome, siempre

x) l .
existe x
B (
x0 ) (A \ {
x0 }) con la propiedad de que f (
x)
/ B (l), es decir que f (
k A \ {
x0 } tal que k
xk x
0 k < 1/k
lo anterior para cada k N podemos tomar x
Aplicando

xk ) l .
y f (
De esta forma obtenemos una sucesion {
x0 } tal que {
0 (problema
xk } x

13) para la cual se tiene que {f (

xk )} no converge a l (puesto que f (
xk ) l > 0 para toda
k N).
Como esta propiedad es justo la negaci
on de nuestra hip
otesis, con esto concluimos la prueba
de la segunda parte del teorema.
2.2.3
Continuidad
Como en el caso de las funciones de R en R, una de las primeras aplicaciones del concepto de lmite
est
a en la formalizaci
on del concepto de continuidad de una funcion.
Dada una funci
on f : A Rn Rm , la idea intuitiva de que esta sea continua consiste en
que si x
, y son elementos de su dominio que est
an cercanos entonces sus valores bajo f (f (
x) y
f (
y)) est
an cercanos.
Esta idea intuitiva se puede simplificar si dejamos fijo uno de estos puntos, que ahora
llamaremos x
0 , y decimos que la funci
on f es continua en x
0 A si para todo x
A que est
a
cerca de x
0 se tiene que f (
x) est
a cerca de f (
x0 ).
Como seguramente el lector ya est
a intuyendo, esta u
ltima expresi
on se puede formalizar
usando el concepto de lmite diciendo que una funcion f es continua en x
0 A si tiene lmite en
este punto y su lmite es f (
x0 ) (el valor de f en x
0 ), es decir si
lim f (
x) = f (
x0 )
x0
(2.4)
Aun cuando todo parezca indicar que hemos logrado una buena definicion de continuidad, es
importante precisar algunos aspectos.
El primero de ellos es que el concepto de continuidad se definira para un punto y este siempre
tiene que ser un elemento de su dominio, es decir, un punto para el cual la funcion f est
a definida.
El segundo aspecto tiene que ver con el uso del concepto de lmite; como se recordara, el lmite
de una funcion s
olo se define para los puntos de acumulaci
on del dominio de esta, lo que puede ser
n
un obst
aculo ya que, dado A R , en general no es cierto que todo elemento de A tiene que ser
on de A (es decir, A * A ).
Si dado x
0 A tenemos la suerte de que este sea un punto de acumulaci
on de A (
x0 A ), decir
que f es continua en x
0 usando la identidad 2.4 es sin duda la forma m
as adecuada de hacerlo, y
s
olo restara analizar el caso en que x
0 no fuera un punto de acumulaci
on de A (aun y cuando s
pertenezca a A). Notese que en este caso x
0 sera un punto aislado de A, es decir un punto de A
para el cual existe r > 0 con la propiedad de que Br (
x0 ) A = {
x0 } (ver definicion 1.27), lo que
significa que el u
nico punto de A que realmente est
a cerca de x
0 es el mismo!
Con base en esta observaci
on y aunque parezca un poco in
util tratar de definir que una
funcion sea continua en un punto aislado de su dominio (y que por cierto no tendra nada de
J. P
aez
84
insensato que esta definicion fuera tal que cualquier funcion resultara siempre continua en este
tipo de puntos de su dominio), todo se ajustar
a adecuadamente si escribimos la identidad 2.4
usando precisamente la definicion 2.35.
De acuerdo con esta definicion, la identidad 2.4 va a significar que, para cualquier cantidad
> 0 existe una cantidad > 0 tal que, si x
A \ {
x0 } tiene la propiedad de que k
xx
0 k <
entonces kf (
x) f (
x0 )k < , es decir que, si x
B (
x0 ) (A \ {
x0 }) entonces f (
x) B (f (
x0 )).
Si ahora observamos que, dado que ahora s estamos seguros de que x
0 A, y que las condiciones anteriores se siguen cumpliendo aun y cuando x
sea igual a x
0 , todo parece indicar que,
independientemente de que tipo de punto sea x
0 con respecto de A (de acumulaci
on o aislado), la
siguiente definicion es la mejor opci
on para expresar el hecho de que una funcion sea continua en
un punto de su dominio.
Definici
on 2.38 Sean f : A Rn Rm y x
0 A. Decimos que f es continua en x
0 si para
cualquier cantidad > 0 existe una cantidad > 0 tal que, si x
A tiene la propiedad de que
k
xx
0 k < entonces kf (
x) f (
x0 )k < , es decir que, si x
B (
x0 ) A entonces f (
x)
B (f (
x0 )) (o equivalentemente, que f (B (
x0 ) A) B (f (
x0 ))).
Toda las observaciones y afirmaciones que hicimos para deducir la definicion anterior, las
dejaremos plasmadas en la siguiente proposici
on, y aprovechando el teorema 2.37, incluiremos una
forma equivalente de expresar la continuidad de una funcion en un punto, en terminos de sucesiones
(y que bien podra llamarse la definici
on de continuidad por sucesiones).
Proposici
0 A.
1. Si x
0 es un punto aislado de A entonces f es continua en x
0 .
2. Si x
on de A se satisface que: f es continua en x
0 si y s
olo si f
tiene lmite en x
0 y adem
as
lim f (
x) = f (
x0 )
x
x0
3. La funci
0 si y s
olo si para toda sucesi
on {
xk } contenida en A que
converje a x
0 se tiene que la sucesi
on {f (
xk )} converje a f (
x0 ).
La demostracion de esta proposici
on es muy sencilla y se deja como un problema para el lector.
Otro hecho que sin duda tambien resultara evidente para el lector, es la relaci
on que existe
entre la continuidad de una funci
on f : A Rn Rm en un punto x
0 A y la de sus funciones
coordenadas (en el mismo punto).
En efecto, si f = (f1 , . . . , fm ) es de esperarse que f ser
a continua en x
0 A si y s
olo si fi es
continua en x
0 para cada i {1, . . . , m}, propiedad que, a pesar de su predecibilidad, es muy
importante y por lo mismo la dejamos expresada en la siguiente
Proposici
0 A. La funci
0 si y s
olo si
fi es continua en x
0 , para cada i {1, . . . , m}.
Con relaci
on a la continuidad de una funcion, dejaremos expresadas en la siguiente proposici
on
la relaci
on del concepto de continuidad con la aritmetica de las funciones.
Dada la cercana de este concepto con el de lmite, casi todas las afirmaciones de esta proposici
on
(salvo por el inciso 6) ser
an una consecuencia inmediata de las correspondientes afirmaciones de la
proposici
on 2.33, en virtud de lo cual su prueba, una vez mas, quedar
a a cargo del lector (incluyendo
el inciso 6).
85
J. P
aez
Proposici
on 2.41 Sean f, g : A Rn Rm , R y x
0 A. Si f y g son continuas en x
0
entonces:
1. la funci
on f + g es continua en x
0
2. la funci
0
3. la funci
on f g es continua en x
0
4. si m = 3, la funci
on f g es continua en x
0
5. si m = 1 y g(
x0 ) 6= 0, la funci
on f /g es continua en x
0
6. si y0 = f (
x0 ) D Rm y h : D Rm Rk es continua en y0 entonces h f es continua en
y0
Como el lector habra notado, de las operaciones entre funciones que acabamos de enlistar en la
proposici
on anterior, ahora s incluimos a la operaci
on composici
on (a diferencia de la proposici
on
2.33).
La raz
on de esto, es que el concepto de continuidad s se comporta bien con esta operaci
on (a
diferencia del concepto de lmite, como vimos en el ejemplo 2.34), y lo que ahora queremos destacar
es que hay un resultado un poco m
as general para el cual no se requiere que ambas funciones
(las que se vayan a componer) tengan que ser continuas en los correspondientes puntos (como se
requiere en el inciso 6 de la proposici
on anterior).
Este resultado es muy importante (y muy u
til) y lo dejaremos formulado en la siguiente
Proposici
on 2.42 Sean g : A Rn Rm , f : D Rm Rk , x
0 Rn y l Rm tales que l D
1
y x
0 B , con B = A g (D). Si limxx0 g(
x) = l y f es continua en l entonces f g tiene
lmite en x
0 y adem
as

lim (f g)(
x) = f l = f lim g(
x)
x
x0
x0
Demostraci
on. Usaremos la definicion de lmite para hacer esta demostracion. Sea > 0
arbitraria. De la definicion de continuidad sabemos que existe > 0 tal que

y) B f l
(2.5)
si y B l D entonces f (
y de la definicion de lmite tenemos que existe > 0 tal que

si x
B (
x0 ) (A \ {
x0 }) entonces g(
x) B l
(2.6)

(ver figura 2.12).
Afirmamos que, si x
B (
x0 ) (B \ {
x0 }) entonces (f g)(
x) B f l
En efecto, dado que B A entonces
B (
x0 ) (B \ {
x0 }) B (
x0 ) (A \ {
x0 })
de tal forma que, si x
B (
x0 ) (B \ {
x0 }) entonces x
B (
x0 ) (A \ {
x0 }) demodo
que por 2.6
se tiene que g(
x) B l , y por 2.5 concluimos que (f g)(
x) = f (g(
x)) B f l .
Con frecuencia se suele decir coloquialmente que el resultado anterior nos asegura que el
lmite se puede meter dentro (o a traves) de una funcion continua. Esta propiedad es de mucha
utilidad cuando nos enfrentamos al problema de mostrar que una funcion tiene lmite, como lo
haremos ver en el siguiente
J. P
aez
86

B = A g1 (D)
x
0
x
f (g(
x))
g(
x)
bc
f (l)
b
g(A)
Figura 2.12: Prueba geometrica de la proposicion 2.42

Ejemplo 2.43 Sea
h(x, y) = cos
x2 y
x2 + y 2
Mostraremos que esta funci

on tiene lmite en el punto (0, 0) y calcularemos cu
al es su valor.
Dado que la funci
on f (t) = cos(t) es continua en R, por la proposici
on 2.42 bastar
a mostrar
que la funci
on
x2 y
g(x, y) = 2
x + y2
tiene lmite en el punto (0, 0) y calcular cu
anto vale este. Para ello, observese que, como
2
x y = x2 |y|

x2 + y 2 k(x, y)k
se tiene que

x2 y

x2 + y 2 k(x, y)k
para toda (x, y) 6= (0, 0) y por lo tanto que

x2 y

|g(x, y) 0| = 2
x + y2
k(x, y)k
= k(x, y) (0, 0)k
de tal forma que, dado > 0, si tomamos = y (x, y) R2 tal que 0 < k(x, y) (0, 0)k <
entonces
|g(x, y) 0| k(x, y) (0, 0)k < =
de modo que se satisface la definici
on 2.35 y concluimos que
lim
(x,y)(0,0)
g(x, y) =
x2 y
(x,y)(0,0) x2 + y 2
lim
=0
Por la proposici
on 2.42 tenemos entonces que
lim
(x,y)(0,0)
h(x, y) =
lim
(x,y)(0,0)
87
(f g)(x, y)
J. P
aez
lim cos

= cos
lim
(x,y)(0,0)
x2 y
x2 + y 2
x2 y
(x,y)(0,0) x2 + y 2
= cos(0)

=1
Otra pregunta que resulta interesante con relaci
on a la proposici
on 2.42 es si las hip
otesis sobre
las funciones f y g son intercambiables. Es decir, si ahora suponemos que g es continua en x
0 A
y f tiene lmite en l = g(
x0 ) D , se cumple que la funcion f g tiene lmite en x
0 ?
La respuesta a esta pregunta es negativa y el ejemplo 2.34 de la secci
on anterior nos sirve como
contraejemplo. Sin embargo, y justo tomando en cuenta las caractersticas de ese ejemplo, podemos
agregar una hip
otesis que nos permita formular una proposici
on an
aloga.
Proposici
on 2.44 Sean g : A Rn Rm , f : D Rm Rk , x
0 Rn y l Rk tales que x
0 A
y y0 = g(
x0 ) D . Si g es continua en x
0 , limyy0 f (
y ) = l y existe r > 0 tal que g(
x) 6= y0 para
toda x
Br (
x0 ) \ {
x0 } entonces f g tiene lmite en x
0 y adem
as
lim (f g)(
x) = l
x0

on es muy parecida a la de la proposici
on 2.42 y por lo mismo se deja
al lector. Por otra parte, y aun y cuando la conclusion de esta proposici
on asegura la existencia de
un lmite, se suele usar con m
as frecuencia para demostrar que una funcion no tiene lmite, como
se muestra en el siguiente
Ejemplo 2.45 Sea
f (x, y) =
x2 y
x4 + y 2
Mostraremos que esta funci

on no tiene lmite en el punto (0, 0).
Lo que haremos ser
a aproximarnos al punto (0, 0) a traves de diferentes curvas, las cuales
definiremos por medio de funciones de R en R2 (funciones que ser
an el tema principal del captulo
3), y que tienen la particularidad de pasar por el punto que nos interesa.
Primero consideraremos una funci
on de la forma g(t) = (t, mt), con m 6= 0 arbitrario. N
otese
que esta funci
on claramente es continua para cualquier t R (proposici
on 2.40) y su imagen es
una recta (de pendiente m) que justo pasa por el origen (0, 0) cuando t = 0. Si ahora realizamos
la composici
on f g tenemos que
t2 (mt)
(f g)(t) =
(t2 )2 + (mt)2
mt
= 2
t + m2
para toda t R, y obtenemos que
lim (f g)(t) = 0
t0
Si adem
as observamos que f (t, 0) = 0 = f (0, t) para toda t R podemos decir que f se
aproxima a 0 cuando nos aproximamos al (0,
0) a traves de cualquier recta.
2
Ahora consideremos la funci
on h(t) = t, t . En este caso la funci
on es otra vez claramente
continua para cualquier t R, describe (o recorre) la par
abola y = x2 y nuevamente en t = 0
J. P
aez
88
pasa por el origen (0, 0), lo que significa que en este caso nos aproximamos al (0, 0) a traves
de esta curva. Si consideramos nuevamente la composici
on f h tenemos que
t2 t2
(f h)(t) =
(t2 )2 + (t2 )2
1
=
2
para toda t R, t 6= 0, de modo que ahora tenemos que

lim (f h)(t) =
t0
1
2
Con base en estos dos resultados y la proposici

on 2.44 podemos concluir que nuestra funci
on f
no tiene lmite en el (0, 0).
Para terminar esta subseccion (y antes de pasar a los teoremas fuertes de continuidad),
definiremos lo que significa que una funcion sea continua en un subconjunto de su dominio (definicion
que al lector le resultara del todo natural), y probaremos una interesante y u
til caracterizaci
on
de esta propiedad.
Definici
on 2.46 Sean f : A Rn Rm y B A. Decimos que f es continua en (o sobre) B si
f en continua en cada punto de B, es decir, si f es continua para cada x
B.
Proposici
on 2.47 Sea f : A Rn Rm . f es continua en A si y s
olo si para todo conjunto
abierto V Rm existe un conjunto abierto U Rn tal que f 1 (V ) = A U .
Demostraci
on. (=) Sea V Rm abierto y x
f 1 (V ) (si f 1 (V ) = tomamos U = ).
Entonces f (
x) V de modo que, como V es abierto, existe x > 0 tal que Bx (f (
x)) V y como
f es continua en x
(pues es continua en A) existe x > 0 tal que
f (Bx (
x) A) Bx (f (
x))
Tomamos
U=
(2.7)
Bx (
x)
x
f 1 (V )
Dado que las bolas (o vecindades) son conjuntos abiertos, por el problema 21 del captulo 1 sabemos
que U es un conjunto abierto, de tal forma que s
olo nos resta probar que f 1 (V ) = A U .
1
Que f (V ) A U es inmediato. Sea entonces y A U ; como
[
AU =A
B (
x)
x
x
f 1 (V )
x
f 1 (V )
Bx (
x) A
entonces existe x
f 1 (V ) tal que y Bx (
x) A de modo que, por 2.7, se tiene que f (
y)
1
1
Bx (f (
x)) V y por lo tanto y f (V ). Por lo tanto f (V ) = A U con lo cual concluimos
esta parte de la prueba.
89
J. P
aez
(=) Sea x
A y > 0. Como la bola B (f (
x)) Rm es un conjunto abierto, por hip
otesis
n
1
existe U R abierto tal que f (B (f (
x))) = U A . Ahora, dado que x
f 1 (B (f (
x))) = U A
y U es abierto, existe > 0 tal que B (
x) U de modo que
B (
x) A U A = f 1 (B (f (
x)))
y por lo tanto f (B (
x) A) f (f 1 (B (f (
x)))) B (f (
x)), lo que prueba que f es continua en
x
.
2.2.4
Teoremas fuertes de continuidad
Como seguramente el lector estar

a de acuerdo, trat
andose de funciones continuas de R en R, dos
son los resultados mas importantes relacionados con este tipo de funciones: el Teorema del Valor
Intermedio, y el Teorema del valor M
aximo (y el valor Mnimo) que asegura que toda funci
on
continua sobre un intervalo de la forma [a, b] (un subconjunto cerrado y acotado (adem
as de conexo)
de R) siempre alcanza su valor m
aximo y su valor mnimo.
Sin restarles importancia a estos teoremas, lo que es m
as relevante aun, son los dos resultados
que podemos probar o reformular a partir de ellos (o de los argumentos usados en su prueba).
El primero de ellos, que se prueba a partir del Teorema del Valor Intermedio, es aquel que asegura
que si se tiene funci
on continua sobre un intervalo I R (totalmente arbitrario, sin importar si I
es abierto, cerrado, acotado o no acotado) entonces su imagen f (I) R tambien es un intervalo.
Si observamos que los intervalos son los u
nicos subconjuntos conexos de R (problema 40, captulo
1), el resultado que acabamos de mencionar se podra reformular de la siguiente manera: si f es
continua sobre el conjunto I R, e I es conexo entonces f (I) R es conexo.
Y el segundo resultado importante, que se puede probar usando los mismos argumentos que se
usan para la prueba del Teorema del valor Maximo (y el valor Mnimo), es aquel que asegura que
si A R es un conjunto cerrado y acotado (aun y cuando este conjunto A no sea de la forma [a, b])
entonces f (A) R tambien es un conjunto cerrado y acotado.
Lo que vamos a hacer en esta subseccion, es mostrar que los resultados que acabamos de
mencionar (para funciones de R en R) se siguen cumpliendo para funciones de Rn en Rm .
Teorema 2.48 Sea f : A Rn Rm continua en A y B A. Si B es conexo entonces f (B) es
conexo.
Demostraci
on. En esta prueba, adem
as de hacerla por el metodo de la contrapuesta, usaremos la
equivalencia para conjuntos disconexos probada en la proposici
on 1.48 del captulo 1. Supongamos
, V Rm
entonces que f (B) no es conexo; por la proposici
on mencionada, sabemos que existen U
conjuntos abiertos tales que:
V ,
(a) f (B) U
6= y f (B) V 6= , y
(b) f (B) U
V = .
(c) f (B) U
) =
Por la proposici
on 2.47 sabemos que existen U, V Rn conjuntos abiertos tales que f 1 (U
1
A U y f (V ) = A V . Afirmamos que U y V satisfacen que:

(1) B U V ,
J. P
aez
90
(2) B U 6= y B V 6= , y
(3) B U V = .
Para probar lo anterior, usaremos varias de las propiedades de la imagen inversa y la imagen
directa formuladas en la proposici
on 2.13.
Por el inciso (a) de nuestra suposici
on, sabemos que
B f 1 (f (B))
V )
f 1 (U
) f 1 (V )
= f 1 (U
= (A U ) (A V )
= A (U V )
y por lo tanto B U V , con lo cual probamos el inciso (1).

6= entonces existe x
. Por
Ahora, por el inciso (b), como f (B) U
B tal que f (
x) U
1
) = A U de modo que x
tanto, x
f (U
B U , es decir, B U 6= . Analogamente se prueba
que B V 6= con lo cual tenemos probado el inciso (2).
Finalmente, dado que B A y B f 1 (f (B)), tenemos que
B U V = B (U A) (V A)
) f 1 (V )
= B f 1 (U
) f 1 (V )
f 1 (f (B)) f 1 (U
V )
= f 1 (f (B) U
= f 1 ()
=
de donde B U V = , con lo cual probamos el inciso (3).

Como el lector habra notado, los incisos (1), (2) y (3), por la misma proposici
on 2.13, implican
que B es disconexo, conclusion con la cual terminamos la prueba.
Con base en el teorema anterior, se establece una interesante versi
on del teorema del valor
intermedio para funciones de Rn en R, resultado que dejamos plasmado en el siguiente corolario y
cuya prueba se deja al lector.
Corolario 2.49 Sean f : A Rn R continua en A, B A conexo y x
1 , x
2 B tales que
f (
x1 ) < f (
x2 ). Si c R es tal que f (
x1 ) < c < f (
x2 ) entonces existe x
B tal que f (
x) = c.
Como mencionamos al inicio de esta subseccion, otro tipo de conjuntos que preservan sus
caractersticas bajo funciones continuas, son los conjuntos cerrados y acotados. Este resultado
tiene consecuencias muy importantes, en particular las relacionadas con la existencia de valores
m
aximos y mnimos de funciones de Rn en R, tema que trataremos ampliamente en el captulo 4.
Teorema 2.50 Sea f : A Rn Rm continua en A y B A. Si B es cerrado y acotado entonces
f (B) es cerrado y acotado.
91
J. P
aez
2.3. Continuidad uniforme
Demostraci
on. En la prueba de este teorema jugaran un papel muy importantes varios de los
resultados que probamos para sucesiones.
Primero probaremos que f (B) est
a acotado y usaremos nuevamente el metodo de la contrapuesta. Supongamos entonces que f (B) no est
a acotado. Bajo este supuesto, para cada k N
existe x
k B tal que kf (
xk )k > k.
Dado que B est
a acotado, entonces {
xk } es una sucesion acotada, de modo que por el teorema
2.28 existe una subsucesi
on {
xkl } que converge. Si x
0 Rn es tal que {
xk l } x
0 (cuando l ),
por el inciso (a) del problema 29 se tiene que x

0 B y como B es un conjunto cerrado entonces
y por lo tanto x
B=B
0 B.
Ahora, como f es continua en x
0 se debe tener que {f (
xkl )} f (
x0 ) (cuando l ), lo cual
contradice el hecho de que kf (
xkl )k > kl para toda l N y que {kl } es una sucesion creciente de
naturales.
Para probar que f (B) es un conjunto cerrado mostraremos que (f (B)) f (B). Si (f (B)) =
la contenci
on es inmediata. Supongamos entonces que y0 (f (B)) ; por el inciso (b) del mismo
problema 29, sabemos que existe una sucesion {
yk } f (B) tal que {
yk } y0 de tal forma que si
x
k B es tal que f (
xk ) = yk entonces {
xk } B es una sucesion acotada.
Nuevamente, por el teorema 2.28 existe una subsucesi
on {
xkl } que converge. Si x
0 Rn es tal
que {
xk l } x
0 (cuando l ), por el mismo argumento usado en la primera parte de esta prueba
se tiene que x
0 B y como f es continua en x
0 entonces {f (
xkl ) = ykl } f (
x0 ) (cuando l ).
Por otra parte, dado que {
ykl } es una subsucesi
on de {
yk } entonces {
ykl } y0 y como el punto
de convergencia de una sucesion es u
nico, se tiene que y0 = f (
x0 ), lo que prueba que y0 f (B).
Como anunciamos anteriormente, con base en este teorema podemos probar un resultado muy
importante que nos proporciona condiciones suficientes para que una funcion continua de Rn en R
alcance valores m
aximos y mnimos sobre un conjunto.
Este resultado lo dejamos formulado en el siguiente corolario y su prueba (nuevamente!) se
deja al lector.
Corolario 2.51 Sean f : A Rn R continua en A y B A. Si B es cerrado y acotado
entonces existen x
1 , x
2 B tales que f (
x1 ) f (
x) f (
x2 ) para toda x
B. Es decir, f alcanza
un valor m
aximo y un valor mnimo sobre B.
2.3
Continuidad uniforme
Concluimos este captulo definiendo el concepto de continuidad uniforme para funciones de Rn en

Rm . La forma explcita de esta definicion es totalmente equivalente a la de las funciones de R en
R y expresa la misma propiedad de una funcion f sobre un conjunto B: a saber que, para cada
cantidad > 0 existe una cantidad > 0 tal que f (B (
x) B) B (f (
x)) para toda x
B. Es
decir, dada una > 0 se puede encontrar una > 0 que sirve para cualquier x
B (en el sentido
de que f (B (
x) B) B (f (
x))), propiedad que sin duda dice que, adem
as de que f es continua
en cada x
B, esta continuidad tiene cierta cualidad de uniformidad sobre este conjunto.
Definici
on 2.52 Sean f : A Rn Rm y B A. Decimos que f es uniformemente continua
sobre B si para cada > 0 existe > 0 con la propiedad de que: si x
, y B son tales que
k
x yk < entonces kf (
x) f (
y )k < . Es decir, f (B (
x) B) B (f (
x)) para toda x
B.
Como ha sucedido con los conceptos de lmite y de continuidad para funciones de Rn en Rm , que
se pueden caracterizar en terminos de los conceptos correspondientes de sus funciones coordenadas,
J. P
aez
92
para el caso de la continuidad uniforme sucede lo mismo, propiedad que vamos a dejar expresada
en la siguiente proposici
on y cuya prueba ... (adivine el lector!).
Proposici
on 2.53 Sean f = (f1 , . . . , fm ) : A Rn Rm y B A. f es uniformemente continua
sobre B si y s
olo si cada fi es uniformemente continua sobre B, para i {1, . . . , m}.
Como mencionamos en el comentario previo a la definicion 2.52, toda funcion que es uniformemente continua sobre un conjunto B tambien es continua sobre el mismo conjunto, hecho que
dejamos plasmado en la siguiente proposici
on y cuya veracidad es tan inmediatamente clara, que
omitiremos su prueba.
Proposici
on 2.54 Sean f : A Rn Rm y B A. Si f es uniformemente continua sobre B
entonces f es continua en B.
Como seguramente el lector tendra presente para el caso de las funciones de R en R, el recproco
de la proposici
on anterior es falso, situaci
on que se repite para las funciones de Rn en Rm , como lo
mostraremos en el siguiente
Ejemplo 2.55 Sea
f (x, y) = p
x2 + y 2
1
=
k(x, y)k
con (x, y) A = R2 \ {(0, 0)}.

Mostraremos en general que, si B A es tal que (0, 0) B entonces f no es uniformemente
continua en B.
Este ejemplo, adem
as de mostrar que el recproco de la proposici
on 2.54 no se satisface, tendr
a
el merito de exhibir un metodo para probar que una funci
on no es uniformemente continua sobre
un conjunto.
De acuerdo con la definici
on 2.52, para probar que f no es uniformemente continua sobre el
conjunto B es necesario mostrar que existe una cantidad especfica > 0 tal que para cualquier
> 0, siempre se pueden encontrar puntos x
1 , x
2 B tales que k
x1 x
2 k < y sin embargo
|f (
x1 ) f (
x2 )| .
Tomemos = 1 y sea > 0 arbitrario. Como (0, 0) B existe x
1 B tal que 0 < k
x1 k =
k
x1 (0, 0)k < , y por la misma raz
on, existe x
2 B tal que
k
x2 k = k
x2 (0, 0)k
k
x1 k
<
k
x1 k + 1
de tal forma que 0 < k
x2 k < k
x1 k y por lo tanto

1
1

|f (
x1 ) f (
x2 )| =
k
x1 k k
x2 k
1
1
=
k
x2 k k
x1 k
k
x1 k + 1
1
>
k
x1 k
k
x1 k
93
J. P
aez

=1
que es lo que deseabamos probar.

El ejemplo anterior tambien tiene la virtud de mostrar el tipo de caractersticas que deben de
tener una funci
on f y un conjunto B, si se desea mostrar que f no es uniformemente continua sobre
B.
Si en el conjunto B existen puntos tan cercanos como se quiera, tales que sus im
agenes bajo
la funcion f se alejan entre ellas (o permanecen a una distacia mayor que una constante), como
sucede con aquellos puntos que est
an cerca del (0, 0) en el ejemplo anterior, en donde los valores
de f se hacen cada vez m
as grandes (y mas alejados entre ellos) si la evaluamos en puntos cada
vez mas cercanos a este punto.
Por otra parte, en el problema 61 se pide al lector probar que la misma funcion f del ejemplo
anterior s es uniformemente continua sobre cualquier subconjunto B de su dominio, siempre y
cuando se satisfaga que el (0, 0) no es punto de acumulaci
on de B.
Con esta prueba se mostrara que la continuidad uniforme es un concepto que depende no s
olo de
la funcion que estemos tratando, sino tambien del conjunto sobre el cual la estemos considerando.
La misma funci
on puede ser uniformemente continua sobre algunos conjuntos, y no serlo sobre
otros. No tiene sentido afirmar que una funcion es (o no es) uniformemente continua, si no se
menciona un conjunto sobre el cual se pretende que lo sea (o que no lo sea).
Regresando al recproco de la proposici
on 2.54, dado que a la funcion involucrada no le podemos
pedir algo m
as que ser continua, la opcion es pedirle algunas caractersticas al conjunto sobre el
cu
al queremos que esta sea uniformemente continua. Una manera de dar con estas caractersticas
(que en matem
aticas suele dar sus frutos), consiste en intentar hacer la prueba y sobre la marcha
ubicar que es lo que se va necesitando. Manos a la obra!
Sea f : A Rn Rm , con f continua sobre A, y una cantidad > 0 arbitraria. La continuidad
de f en cada punto de x
A nos asegura que para cada uno de ellos existe x > 0 tal que
f (Bx (
x) A) B (f (
x)).
Sin duda que nuestro primer impulso para encontrar una sola > 0 para la cual la contenci
on
anterior se cumpla, para esa y para toda x
A, sera tomar la mnima (o el nfimo, para ser
m
as precisos) de entre todas las x , pero a estas alturas ya sabemos que esa mnima (o el nfimo)
de todas ellas no tiene por que ser mayor que cero.
Ante esta situaci
on, vale la pena observar lo siguiente: el conjunto A siempre est
a contenido (o
queda cubierto) por la uni
on de todas las vecindades Bx (
x), es decir
A
Bx (
x)
x
A
Mas aun, podemos tomar la mitad de cada uno de los radios x (o la tercera parte, o la cuarta
parte, o cualquier otra cantidad menor!) y se sigue cumpliendo que
A
x)
B x (
x
A
Si de entre todas estas vecindades (o bolas) se puede encontrar un n

umero finito de ellas que
sigan teniendo la propiedad de que cubren a A, es decir que existen x
1 , . . . , xk A tales que
xk )
x1 ) B xk (
A B x1 (
2
J. P
aez
94
entonces podemos elegir = min{x1 /2, . . . , xk /2} (la cual s ser

a mayor que 0 puesto que ahora
s estamos tomando el mnimo de un conjunto finito), cantidad para la cual se va a satisfacer el
siguiente hecho: si x
, y A son tales que k
x yk < entonces existe j {1, . . . , k} tal que
xj )
x
, y Bxj (
es decir, que x
y y pertenecen a la misma vecindad.
La afirmacion anterior (que m
as adelante daremos su prueba) resulta ser muy importante puesto
que ahora, dado que f (Bxj (
xj ) A) B (f (
xj )), por una sencilla aplicaci
on de la desigualdad del
tri
angulo, tendremos que
kf (
x) f (
y)k = k(f (
x) f (
xj )) (f (
xj ) f (
y ))k
kf (
x) f (
xj )k + kf (
xj ) f (
y)k
<+
= 2
y por lo tanto, ya que fue una cantidad arbitraria, podemos concluir que f es uniformemente
continua!
Como seguramente el lector habra notado, la hip
otesis que resulta determinante en la argumentacion que
acabamos
de
dar
est
a
en
el
supuesto
de que, para cada familia (o conjunto) de

vecindades Bx /2 (
x) | x
A que cubren al conjunto A (familia de vencindades que depende de
cada cantidad > 0 que se tome), existe una subfamilia finita que sigue teniendo la propiedad de
cubrir a A.
Los conjuntos que tienen esta propiedad (o una equivalente, en donde las vecindades se sustituyen por conjuntos abiertos arbitrarios), reciben el nombre de conjuntos compactos, los cuales
introducimos en la siguiente
Definici
on 2.56 Sean K Rn y {U Rn | I} una familia de subconjuntos abiertos de Rn
indexada por un conjunto I. Decimos que:
1. la familia de subconjuntos U ={U Rn | I} es una cubierta (abierta) de K si
K
2. el conjunto K es un conjunto compacto si toda cubierta (abierta) U ={U Rn | I} de

K tiene una subcubierta finita, es decir, si existen 1 , . . . , k I tales que
K U1 Uk
Con base en esta definicion, ya estamos en condiciones de formular un resultado que da respuesta
a la pregunta que hicimos sobre el recproco de la proposici
on 2.54, el cual dejaremos plasmado en
el siguiente
Teorema 2.57 Sean f : A Rn Rm y K A. Si f es continua sobre K y K es un conjunto
compacto entonces f es uniformemente continua sobre K.
95
J. P
aez
Demostraci
on. Sea > 0. Como f es continua para cada x
K, sabemos que existe x > 0 tal
que f (Bx (
x) K) B/2 (f (
x)). Dado que la familia de vecindades U ={Bx /2 (
x) | x
K} es una
cubierta abierta de K, sabemos que existen x
1 , . . . , x
k K tales que
xk )
x1 ) B xk (
K B x1 (
2
Tomamos
= min
(2.8)
x
x1
,..., k
2
2
>0
y sean x
, y K tales que k
x yk < . Por la contenci
on 2.8 sabemos que existe j {1, . . . , k} tal
que
x
B xj (
xj )
2
y como k
x yk < xj /2 se tiene que
k
yx
j k = k(
yx
) + (
xx
j )k
k
yx
k + k
xx
j k
x
<+ j
2
xj
xj ) K concluimos que
xj ). Asi, como x
, y Bxj (
de donde y Bxj (
kf (
x) f (
y)k = k(f (
x) f (
xj )) (f (
xj ) f (
y ))k
kf (
x) f (
xj )k + kf (
xj ) f (
y)k

< +
2 2
=
y por lo tanto que f es uniformemente continua sobre K.

No podemos ignorar que al lector le parecera un tanto m
agica la forma en que hemos introducido el concepto de conjunto compacto, raz
on por la cual dedicaremos los u
ltimos resultados de
esta secci
on (y de este captulo!) a establecer una caracterizaci
on (en Rn ) muy importante de este
tipo de conjuntos.
En efecto, existe un conocido y muy importante teorema que da una caracterizaci
on de los conjuntos compactos, el teorema de Heine-Borel3 , el cual establece que en Rn , los conjuntos compactos
no son m
as que nuestros muy conocidos conjuntos cerrados y acotados!
Teorema 2.58 (de Heine-Borel) Sea K Rn . K es un conjunto compacto si y s
olo si K es un
conjunto cerrado y acotado.
3
Heinrich Eduard Heine (16 de marzo de 1821, Berlin21 de octubre de 1881, Halle) matem
atico alem
an. Heine
es conocido por sus resultados sobre funciones especiales y en an
alisis real. En particular, escribi
o un importante
tratado sobre funciones arm
onicas esfericas y funciones de Legendre. Tambien investig
o series hipergeometricas
b
asicas e introdujo la f
ormula MehlerHeine.
Felix Edouard
Justin Emile
Borel (7 de enero de 18713 de Febrero 1956) fue un matem
atico y poltico frances.
Como matem
atico, es conocido por su trabajo fundacional en las
areas de teora de la medida y probabilidad. (fuente:
Wikipedia).
J. P
aez
96
Demostraci
on. (=) Primero mostraremos que K es un conjunto acotado. Para ello, consideremos la familia U ={Bk (
0) | k N} de subconjuntos abiertos de Rn . Dado que
[
Bk (0) = Rn
kN
entonces U es una cubierta abierta de K, de modo que existen k1 , . . . , kl N tales que

K Bk1 (0) Bkl (0)
de tal forma que, si N = max{k1 , . . . , kl } se tiene que
K Bk1 (0) Bkl (0)
= BN (0)
de donde concluimos que K est
a acotado.
Para probar que K es cerrado, mostraremos que K c := Rn \ K es un conjunto abierto. Sea
x); dado que B1/k (
x) = {
y Rn | k
yx
k
x
Rn \ K y para cada k N hacemos Uk = Rn \ B1/k (
1/k} es un conjunto cerrado, Uk es un conjunto abierto, y como
\
B1/k (
x) = {
x}
kN
se tiene que
K Rn \ {
x}
\
n
B1/k (
x)
=R \
kN

[
=
Rn \ B1/k (
x)
kN
Uk
kN
de tal forma que U = {Uk | k N} es una cubierta abierta de K. Como K es compacto, existen
k1 , . . . , kl N tales que
K Uk1 Ukl

= Rn \ B1/k1 (
x) Rn \ B1/kl (
x)
x)
= Rn \ B1/N (
en donde N = max{k1 , . . . , kl }. Por tanto

B1/N (
x) B1/N (
x)
Rn \ K
con lo que concluimos que Rn \ K es abierto y por lo tanto que K es cerrado.

(=) Supongamos ahora que K Rn es un conjunto cerrado y acotado. Para esta implicaci
on
procederemos por contradicci
on. Supongamos entonces que K no es comparto. Bajo este supuesto,
97
J. P
aez
entonces debe existir una cubierta abierta U = {U | I} de K tal que ning

un n
umero finito de
elementos de U sigue cubriendo a K.
Ahora, por el problema 20 del captulo 1, sabemos que cada U se puede expresar como la uni
on
de bolas (o vecindades) con centro en un punto de Qn y radio racional.
Dado que Qn y los racionales (positivos) son conjuntos numerables, entonces la familia V de
todas las vecindades de este tipo que son necesarias para expresar a todos los U como uni
on de
estas, tambien es numerable, y por lo tanto existe una sucesion {
xk } de puntos en Qn y una sucesion
{rk } de n
umeros racionales positivos tales que la familia de bolas V = {Brk (
xk ) | k N} satisface
las siguientes condiciones:
1. para cada k N existe I tal que Brk (
x k ) U , y
2.
Brk (
xk ) =
kN
Notese que, dado que no existen un n

umero finito de elementos de U que cubra a K, por el
inciso 1 tampoco existe un n
umero finito de elementos de V que cubra a K; y por el inciso 2, dado
que U es una cubierta abierta de K, V tambien es una cubierta abierta de K.
Ahora, para cada k N, hacemos
Ak = (Rn \ (Br1 (
x1 ) Brk (
xk ))) K
Observese que estos conjuntos Ak satisfacen las siguientes condiciones, para cada k N:
a. Ak 6= (recuerde que no existe un n
umero finito de elementos de V que cubra a K),
b. Ak+1 Ak (pues Br1 (
x1 ) Brk (
xk ) Br1 (
x1 ) Brk (
xk ) Brk+1 (
xk+1 )), y
c. Ak es cerrado y acotado (es la intersecci
on de dos conjuntos cerrados, uno de los cuales, K,
est
a acotado)
Por tanto, por el problema 34 del captulo 1, se tiene que
\
6=
Ak
kN
kN
(Rn \ (Br1 (
x1 ) Brk (
xk ))) K
kN
=
=
(Rn \ (Br1 (
x1 ) Brk (
xk )))
R \
Rn \
kN
kN
x1 ) Brk (
xk ))
(Br1 (
!
Brk (
xk )
Por otra parte, como V = {Brk (

xk ) | k N} tambien es una cubierta de K, se debe tener que
[
K
Brk (
xk )
kN
J. P
aez
98

y por tanto que
n
R \
Brk (
xk )
kN
K =
Con esta contradicci

on, concluimos nuestra prueba.
Como seguramente el lector recordara, los conjuntos cerrados y acotados son viejos conocidos
para nosotros, pues junto con los conjuntos conexos, son el tipo de conjuntos que preservan sus
caractersticas bajo funciones continuas, resultado que dejamos formulado en el teorema 2.50.
De esta forma, y como una consecuencia inmediata del teorema de Heine-Borel, podemos reescribir el teorema 2.50 diciendo ahora que los conjuntos compactos tambien se preservan bajo
funciones continuas.
Y aunque no hara falta hacer ninguna prueba de este hecho, haremos otra muy sencilla, en
la que s
olo usaremos la (singular) caracterizaci
on de la continuidad de una funcion dada en
la proposici
on 2.47, y algunas propiedades elementales de la imagen inversa establecidas en la
proposici
on 2.13.
Teorema 2.59 Sean f : A Rn Rm continua en A y K A. Si K es un conjunto compacto
entonces f (K) es es un conjunto compacto.
Demostraci
on.
Sea V = {V | I} una cubierta (de abiertos en Rm ) de f (K). Por la proposici
on 2.47,
sabemos que para cada V V existe U Rn abierto tal que f 1 (V ) = U A. Ahora, dado que
K f 1 (f (K))
[
f 1
=
f 1 (V )
(U A)
y que K A, se tiene que U = {U | I} es una cubierta abierta de K, y como K es compacto,

entonces existen 1 , . . . , k I tales que
K U1 Uk
Usando nuevamente que K A, tenemos que
K (U1 Uk ) A
= (U1 A) (Uk A)
= f 1 (V1 ) f 1 (Vk )
y por tanto

f (K) f f 1 (V1 ) f 1 (Vk )
99
J. P
aez
2.4. Problemas
= f (f 1 (V1 )) f (f 1 (Vk ))
V1 Vk
con lo que concluimos que f (K) es compacto.
2.4
Problemas
1. Considere las siguientes funciones definidas para alg

un subconjunto A R2 . En cada caso
identifique al conjunto A y haga un esbozo de su gr
afica.
p
i) f (x, y) = x2 + y 2
ii) f (x, y) = 1 x2
iii) f (x, y) = x2 + y 2
iv) f (x, y) = xy
v) f (x, y) =
1
x2 +y 2
vi) f (x, y) = x2 y 2
2. Sean g : A R2 R, k R y (x0 , y0 ) R2 . Determine el dominio (y describa o esboce la

gr
afica) de las siguientes funciones en terminos del dominio (de la gr
afica) de g:
i) f (x, y) = g(x, y) + k
ii) f (x, y) = kg(x, y)
iii) f (x, y) = g(x, y)
iv) f (x, y) = g(x x0 , y y0 )
3. Determine los conjuntos de nivel de cada una de las siguientes funciones:

i) f (x, y) = x2 y 2 ii) f (x, y) = 2xy iii) f (x, y, z) = x2 y 2 + z 2 iv) f (x, y, z) = yz
4. Determine cu
al es el conjunto f (A), si:
(a) la funci
on f : R2 R3 est
a definida como f (x, y) = (x cos(y), x sen(y), x) y A = R2

(b) la funci
on f : R2 R3 est
a definida como f (x, y) = x2 cos(y), x2 sen(y), x2 y A = R2

(c) la funci
on f : R2 R3 est
a definida como f (x, y) = x cos(y), x sen(y), x2 y A = R2
(d) la funci
on f : R2 R3 est
a definida como f (x, y) = (a cos(x), a sen(x), y), a > 0, y
A = [0, 2] R R2
(e) la funci
on f : R2 R3 est
a definida como
f (x, y) = (r cos(x) sen(y), r sen(x) sen(y), r cos(y))

r > 0, y A = [0, 2] [/2, /2] R2
(f) la funci
on f : R2 R3 est
a definida como

p
p
x2 + 1 cosh(y), x2 + 1 senh(y), x
f (x, y) =
y A = R2

(g) la funci
on f : R2 R3 est
a definida como f (x, y) = x + y, x y, x2 y 2 y A = R2
5. Encuentre una funci

on de R2 en R3 cuya imagen coincida con el elipsoide
x2 /a2 + y 2 /b2 + z 2 /c2 = 1
J. P
aez
100
2.4. Problemas
6. Considere las siguientes funciones:
(a) f (x, y) = (x sen(y), x cos(y)); cual es la imagen bajo esta funcion de las rectas de la
forma x = c y y = d, con c y d cualesquiera n
umeros reales?
(b) f (x, y) = (ex sen(y), ex cos(y)); cual es la imagen bajo esta funcion de las rectas de la
forma x = c y y = d, con c y d cualesquiera n
umeros reales?
(c) f (x, y, z) = (x cos(y), x sen(y), z); cual es la imagen bajo esta funcion de los planos de
la forma x = c, y = d y z = k, con c, d y k cualesquiera n
umeros reales?
(d) f (x, y, z) = (x sen(y) cos(z), x sen(y) sen(z), x cos(y)); cual es la imagen bajo esta funci
on
de los planos de la forma x = c, y = d y z = k, con c, d y k cualesquiera n
umeros reales?
7. Sean g = (g1 , g2 ), h : R2 \ {(0, 0)} R2 definidas como sigue:
p
g1 (x, y) = x2 + y 2
si x > 0
arctan xy
si x = 0
g2 (x, y) =
2
si x = 0
arctan xy +
si x < 0
arctan xy
si x < 0
yy>0
yy<0
yy0
yy<0
y h(x, y) = g(x, y + /2), en donde arctan toma sus valores entre /2 y /2.
(a) determine cu
ales son los conjuntos g(R2 \ {(0, 0)}) y h(R2 \ {(0, 0)})
(b) pruebe que (f g)(x, y) = (x, y) = (f h)(x, y) para toda (x, y) R2 \ {(0, 0)}
(c) si f es la funci
on definida en el inciso a. del problema 6, para cu
ales (x, y) R2 se
satisface que (gf )(x, y) = (x, y)? para cu
ales (x, y) R2 se satisface que (hf )(x, y) =
(x, y)?
on 2.13 y de ejemplos de funciones en los que las contenciones de los incisos
7, 8, 9 y 10 sean propias.
9. Sea f : A Rn R. Pruebe que para toda c R existe h : A Rn R tal que
Nc (f ) = N0 (h).
10. Sea f : A Rn Rm .
(a) pruebe que existe H : A Rn Rm+n tal que Gf = H(A).
(b) pruebe que existe h : U Rm+n R tal que Gf = N0 (h) = h1 ({0}).

11. Decimos que L : Rn Rm es una funcion lineal, si L(
x + y) = L(
x) + L(
y ) para todos
, R, y para todos x
(a) L(
0) =
0
(b) la funci
on constante cero (de Rn en Rm ) es la u
nica funcion constante que es lineal
101
J. P
aez
2.4. Problemas
(c) existe M 0 tal que kL(

x)k M k
xk para toda x
Rn
(d) si L : R2 R es una funci

on lineal entonces la gr
afica de L es un plano que pasa por el
origen
(e) cualquier plano cuya ecuaci
on sea de la forma
Ax + By + Cz = 0
con C 6= 0, coincide con ser la gr
afica de alguna funcion lineal L : R2 R (de las
variables x y y).
(f) si L : R3 R, con L diferente de la funcion constante cero, entonces cualquier conjunto
de nivel de L es un plano
12. Determine cu
ales de las siguientes sucesiones convergen y su punto de convergencia (si es que
convergen)
i)) {
xk = (k sen(1/k), (1 + 1/k)k )}
ii) {
xk = (sen(k)/k, (1 + k)1/k )}
iii) {
xk = (ak + bk )1/k , kck , (1)k (1 + 1/k))}
iv) {
xk = ((k2 + 1)1/8 (k + 1)1/4 , k+1
13. Pruebe que una sucesion {

xk } en Rn converge al punto x
0 Rn si y s
olo si la sucesion de
n
umeros reales {k
xk x
0 k} converge a 0.
14. Sea {
xk } una sucesion en Rn que converge al punto x
0 Rn . Pruebe que la sucesion de
n
umeros reales {k
xk k} converge a k
x0 k. Es cierto lo recproco para cualquier x
0 Rn ?
15. En la definicion 2.16 sustituya la norma euclideana por la norma uno y la norma infinito y
pruebe que la proposici
on 2.17 sigue siendo cierta con cada una de ellas. Con base en lo
anterior, pruebe que todas estas definiciones de convergencia son equivalentes.
on 2.18, usando la proposici
on 2.17 y sin usar dicha proposici
on.
on 2.20.
18. En la definicion 2.19 sustituya la norma euclideana por la norma uno y la norma infinito y
pruebe que la proposici
on 2.20 sigue siendo cierta con cada una de ellas. Con base en lo
anterior, pruebe que todas estas definiciones son equivalentes.
19. Pruebe, sin usar la proposici
on 2.17, la proposici
on 2.23 (sugerencia: recuerde (o pruebe)
que si {kl } es una sucesion creciente de n
umeros narurales (es decir que kl < kl+1 para toda
l N) entonces l kl para toda l N).
20. Sea {
xk } una sucesion en Rn cuyo rango A es finito. Pruebe que existe y A y una subsucesi
on
{
xkl } de {
xk } tal que x
kl = y para toda l N.
21. Sea {
xk } una sucesion en Rn cuyo rango A es infinito. Pruebe que:
(a) si {
0 Rn entonces x
0 es el u
nico punto de acumulaci
on de A.
(b) si x
on de A entonces existe una subsucesi
on {
xkl } de {
xk }
que converge a x
0 .
J. P
aez
102
k+1
k )}
2.4. Problemas
22. Sea
(i)
o

(n)
(1)
una sucesion en Rn . Pruebe que: {
xk } est
a acotada si y s
olo si
x
k = xk , . . . , xk
a acotada para cada i {1, . . . , n}.

{xk } est
23. Pruebe que, si {

xk } es una sucesion de Cauchy en Rn entonces cualquier subsucesi
on {
xk l }
de {
xk }, tambien es de Cauchy.
24. Sea {
xk } una sucesion de Cauchy en Rn . Pruebe, directamente de la definicion, que:
(a) la sucesion {
xk } est
a acotada
(b) si el rango de {
xk } es finito entonces existe N N tal que x
k = x
0 para toda k N
(c) si {
xkl } es una subsucesi
on de {
xk } que converge a x
0 Rn , entonces {
xk } converge a
x
0
25. Pruebe el corolario 2.21 sin usar la proposici

on 2.20 (sugerencia: para probar que la condici
on
de Cauchy es suficiente para la convergencia, use el problema anterior y el teorema de BolzanoWeierstrass).
26. Determine si la siguientes proposiciones son falsas o verdaderas. Pruebe sus respuestas.
(a) si una sucesion {
xk } en Rn es convergente entonces su rango tiene un u
nico punto de
acumulaci
on
(b) si una sucesion {
xk } en Rn es tal que su rango tiene un u
nico punto de acumulaci
on
entonces {
xk } es convergente
(c) existe una sucesion {
xk } en Rn no convergente que tiene una u
nica subsucesi
on convergente
(d) existe una sucesion {

xk } en Rn no convergente cuyo rango tiene un u
nico punto de
acumulaci
on
27. Pruebe, usando el teorema de Bolzano-Weierstrass y sin usar el caso real, el teorema 2.28
(sugerencia: analice dos casos: cuando el rango de {
xk } es finito, en cuyo caso ser
au
til el
problema 20, y cuando el rango de {
xk } es infinito, en cuyo caso ser
a u
til el teorema de
Bolzano-Weierstrass y el inciso (b) del problema 21).
28. Pruebe, sin usar el teorema de Bolzano-Weierstrass y el caso real, el teorema 2.28 (sugerencia:
use que los naturales son infinitos y el teorema de los rect
angulos anidados, imitando el
metodo de la cacera del le
on usado en la prueba del teorema de Bolzano-Weierstrass).
29. Sea A Rn . Pruebe que:
(a) x
0 A si y s
olo si existe una sucesion {
xk } en A tal que {
xk } converge a x
0
(b) x
0 A si y s
olo si existe una sucesion {
xk } en A \ {
x0 } tal que {
xk } converge a x
0
(c) si x
0 es un punto aislado de A y {
xk } A es una sucesion que converge a x
0 , entonces
existe N N tal que x
k = x
0 para toda k N

on 2.30.
31. Sea f : A R Rn y x0 R.
103
J. P
aez
2.4. Problemas
(a) Defina el concepto de lmite lateral (por la izquierda y por la derecha) de f en x0 ; es

decir, defina lo que significa que l Rn sea tal que
l = lim f (x)
xx+
0
o que
l = lim f (x)
xx
0
Para dar estas definiciones, que condici

on es necesario que cumpla el punto x0 ? es
suficiente que x0 A ? Justifique su respuesta.
(b) Con base en las definiciones anteriores (y suponiendo que x0 satisface las condiciones
que hayan hecho falta), pruebe que
l = lim f (x)
xx0
si y s
olo si
l = lim f (x) y
xx+
0
l = lim f (x)
xx
0
32. Determine si las siguientes funciones tienen lmite en el punto que se indica. Pruebe su
respuesta.
i) f (x, y) =
x3 y 2
x6 +y 4
iii) f (x, y) =
x2 (y1)
x4 +(y1)2
v) f (x, y, z) =
vii) f (x, y) =
ix) f (x, y) =
xy+yz+zx
x2 +y 2 +z 2
x3 y 4
x4 +y 4
x3 +y 4
x2 +y 2
en (0, 0)
ii) f (x, y) =
x3 +xy 2 x2 yy 3
x2 +y 2
en (0, 0)
en (0, 1)
iv) f (x, y) =
x2 y+x2
x2 +y 2 +2y+1
en (0, 1)
en (0, 0, 0)
vi) f (x, y, z) = xy+yz+zx

2
2
2
en (0, 0)
viii) f (x, y) =
en (0, 0)
x) f (x, y) =
x +y +z
en (0, 0, 0)
xy 3
x2 +y 6
en (0, 0)
x2 y 5
x2 +(y1)2
en (0, 1)
33. Determine en que puntos de su dominio son continuas las funciones g y h definidas en el
problema 7. Pruebe su respuesta.
34. Sean f : A Rn Rm , x
0 A y l Rm . Pruebe que l = limxx0 f (
x) si y s
olo si
l = lim f (
x + h).
h0
35. Sean f, g : A Rn Rm y x
0 A . Pruebe que, si g est
a acotada en una vecindad
agujerada de x
0 (es decir que existen r > 0 y M > 0 tales que kg(
x)k M para toda
x) = 0 entonces limxx0 (g f )(
x) = 0.
x
(Br (
x0 ) \ {
x0 }) A) y limxx0 f (
36. Sean f : A Rn Rm y x
0 A . Pruebe que limxx0 f (
x) = 0 si y s
olo si limxx0 kf (
x)k =
0.
37. En la definicion 2.35 sustituya la norma euclideana por las normas uno e infinito y pruebe
que todas estas definiciones son equivalentes.
38. Sean f, g : A Rn Rm , x
0 A y k N. Pruebe que, si
lim
x0
J. P
aez
kf (
x) g(
x)k
k
xx
0 kk
104
=0
2.4. Problemas
entonces
lim
x0
para toda s Z tal que s k.
kf (
x) g(
x)k
=0
k
xx
0 ks
39. Sea L : Rn Rm una funci

on lineal, es decir que L(
x + y) = L(
x) + L(
y ) para todos
, R, y para todos x
, y Rn . Pruebe que, si

L(h)

lim
= 0
h
0 h

entonces L es la funci
on constante cero (L 0).
40. Sean f : A Rn Rm , x
0 A y l Rm tales que l = limxx0 f (
x). Determine si las
siguientes afirmaciones son ciertas. Pruebe sus respuestas.
(a)
l (f (A))
(b) si D Rm es tal que

l D y (A f 1 (D)) 6= entonces x
0 (A f 1 (D))
(c) si las afirmaciones anteriores no son ciertas, de hip

otesis adicionales sobre la funci
on f
para que estas s sean ciertas

on 2.33, primero usando la proposici
on 2.18, y despues usando s
olo la
definicion 2.35.
42. Pruebe las proposiciones 2.39, 2.40 y 2.41.
43. Sea f : A Rn Rm continua en x
0 A tal que f (
x0 ) 6= 0. Pruebe que:
(a) existe > 0 tal que f (
x) 6= 0 para toda x
B (
x0 ) A
x0 ) A
(b) existen c > 0 y > 0 tales que kf (
x)k c para toda x
B (
on 2.44.
45. Sea f : A Rn Rm . Pruebe que: f es continua en A si y s
olo si para todo conjunto
cerrado C Rm , existe un conjunto cerrado D Rn tal que f 1 (C) = D A.
46. Sea f : A Rn Rm . Pruebe que:

A f (B) para todo B A
(a) f es continua en A si y s
olo si f B
(b) f es continua en A si y s
olo si f (B A) f (B) para todo B A
47. Pruebe que:
(a) A = {(x, y) R2 | 1 < x2 + y} es un conjunto abierto
(b) A = {(x, y, z) R3 | (zx + zy)/(x2 + y 2 ) < 0} es un conjunto abierto

(c) A = {(x, y) R2 | y = 1/x} es un conjunto cerrado
105
J. P
aez
2.4. Problemas
48. Sean f : U Rn R, x
0 U , (a, b) R tal que f (U ) (a, b) y g : (a, b) R R.
Definimos : U Rn R como
g(f (
x))g(f (
x0 ))
si f (
x) f (
x0 ) 6= 0
f (
x)f (
x0 )
(
x) =
g (f (
x0 ))
si f (
x) f (
x0 ) = 0
Pruebe que, si f es continua en x
0 y g es derivable en f (
x0 ) entonces es continua en x
0 .
49. Pruebe que las siguientes funciones son continuas en su dominio:

(a) f : Rn R definida como f (
x) = k
xk
(b) f : Rn R definida como f (

x) = f (x1 , . . . , xn ) = xi , donde i {1, . . . , n}
(c) L : Rn Rm cualquier funci
on lineal
50. Sea
S n1 = {
x Rn | k
xk = 1}
Pruebe que S n1 es un conjunto cerrado.
51. Sean, A Rn un abierto, x
A, y (A A )c y f : [0, 1] R Rn continua tal que f (0) = x
y f (1) = y. Pruebe que existe t (0, 1) tal que f (t) F r(A).

52. Sea f : A Rn R continua en A, con A conexo y tal que f (
x) 6= 0 para toda x
A.
Pruebe que f (
x) > 0 para toda x
A o f (
x) < 0 para toda x
A.
53. Sea f : A Rn Rm continua en A, con A conexo y tal que kf (
x)k =
6 1 para toda x
A.
Pruebe que si kf (
x0 )k < 1 para alguna x
0 A entonces kf (
x)k < 1 para toda x
A.
54. Sean f : A Rn R continua en A, y B A conexo, cerrado y acotado. Pruebe que existen
a, b R tales que f (B) = [a, b].
55. Sea A Rn un conjunto cerrado y acotado y y Ac . Pruebe que existe x
0 A tal que
k
yx
0 k k
x yk para todo x
A. Muestre, con un ejemplo, que esta afirmacion no
es valida si no suponemos que A es cerrado. Esta afirmacion sigue siendo valida si s
olo
suponemos que A es cerrado? Pruebe su respuesta.
56. Sean A, B Rn conjuntos cerrados y acotados tales que A B = . Pruebe que existen
x
0 A y y0 B tales que k
y0 x
0 k k
x yk para todo x
A y para todo y B. Muestre,
con un ejemplo, que esta afirmacion no es valida si no suponemos que A es cerrado. Esta
afirmacion sigue siendo valida si s
olo suponemos que A es cerrado? Pruebe su respuesta.
57. Sea f : A Rn Rm continua, con A cerrado y acotado. Pruebe que existen x
0 , x
1 A
tales que kf (
x0 )k kf (
x)k kf (
x1 )k para toda x
A.
58. Sea f : A Rn Rm continua e inyectiva en A, con A cerrado y acotado. Pruebe que
f 1 : f (A) Rm Rn (la funci
on inversa de f ) es continua en f (A). Esta afirmacion se
sigue cumpliendo si A no es cerrado? Pruebe su respuesta.
59. En la definicion 2.52 sustituya la norma euclideana por las normas uno e infinito y pruebe
que todas estas definiciones son equivalentes.
J. P
aez
106
2.4. Problemas
on 2.53.
61. Pruebe que la funci

on definida en el ejemplo 2.55 es uniformemente continua sobre cualquier
2
subconjunto B R \ {(0, 0)} que no tenga como punto de acumulaci
on al (0, 0).
62. Sea L : Rn Rm una funci
on lineal. Pruebe que L es uniformemente continua en Rn .
63. Sean f : A Rn Rm uniformemente continua en A y {
xk } A una sucesion de Cauchy.
Pruebe que {f (
xk )} es una sucesion de Cauchy.
64. Sea A Rn . Definimos fA : Rn R como fA (
x) = dist(
x, A) := inf{k
x yk | y A} (para
cada x
Rn ). Pruebe que:
(a) fA (
x) = 0 si y s
olo si x
A
(b) fA es uniformemente continua en Rn (sugerencia: pruebe que |fA (

x) fA (
y )| k
x yk
n
para todo x
, y R )
(c) si A, B Rn est
an separados entonces existen U, V Rn abiertos tales que A U ,
B V y U V = (sugerencia: considere la funcion f (
x) = fA (
x) fB (
x))
107
J. P
aez
J. P
aez
2.4. Problemas
108
Captulo 3
La derivada de funciones de R en Rn
Con este breve captulo damos inicio al estudio del concepto de derivacion para funciones de varias
variables, pero a diferencia del captulo anterior, empezaremos haciendolo s
olo para el caso de
funciones de R en Rn .
Como tambien mencionamos anteriormente, dado que lo importante de las funciones de este
tipo es su imagen, estas suelen ser u
tiles para describir objetos geometricos a los que (bajo ciertas
condiciones) nos referiremos como curvas; o para describir el movimiento de un objeto, raz
on
por la cual a estas funciones tambien las conoceremos con el nombre de trayectorias. Y justo a
partir de estos dos usos es que motivaremos su concepto de derivada, pero previamente daremos
algunos ejemplos de ambas formas de usarlas.
3.1
Geometra y movimiento
Aun y cuando a estas alturas el lector posiblemente no conozca una definicion precisa de lo que
significa la palabra curva (definicion que precisaremos m
as adelante), cualquiera que esta fuera
debiera de abarcar a objetos geometricos tan conocidos como las rectas y las c
onicas en el plano.
A falta de tal definicion y a manera de ejemplo, por ahora s
olo nos limitaremos a mostrar que,
entre otros muchos objetos geometricos, las rectas y las conicas se pueden obtener como la imagen
de una funci
on de R en R2 . Tal es el caso de las rectas en el plano (R2 ) las cuales podemos pensar
en general como un conjunto definido de la siguiente forma:
R = {(x, y) R2 | ax + by + c = 0}
en donde a2 + b2 > 0.
Una forma muy sencilla de ver a R como la imagen de una funcion de R en R2 , consiste en
observar que, como a2 + b2 > 0, entonces a 6= 0 o b 6= 0 de modo que si suponemos que sucede lo
primero, entonces para cualquier (x, y) R se tiene que
x=
c by
a
(3.1)
de tal forma que a la pareja (x, y) la podemos escribir como

c by
,y
a
es decir, la podemos escribir en terminos de una sola variable (o de un s
olo par
ametro, que es
el temino que se suele usar en este contexto), de tal forma que basados en lo anterior, es facil
109
Captulo 3. La derivada de funciones de R en Rn
3.1. Geometra y movimiento
comprobar que si consideramos la funci

on1 : R R2 dada por

c bt
,t
(t) =
a
se tiene que (R) = R.
En efecto, n
otese que para toda t R se tiene que

c bt
+ bt + c = (c bt) + bt + c
a
a
=0
con lo cual concluimos que (R) R. Por otra parte, si (x, y) R, por la identidad 3.1 tenemos
que bastara tomar t = y para que se cumpla que

c by
(y) =
,y
a
= (x, y)
con lo que concluimos que R (R) y por lo tanto que (R) = R.
Aunque laborioso (pero no difcil), tambien se puede probar que la circunferencia con centro en
el origen (de un sistema coordenado cartesiano dado) de radio r > 0 dada por
Cr = {(x, y) R2 | x2 + y 2 = r 2 }
se puede obtener como la imagen de la funcion : [0, 2) R2 dada por
(t) = (r cos(t), r sen(t))
O que la elipse E R2 dada por
E=

x2 y 2
(x, y) R2 | 2 + 2 = 1
a
b
se puede obtener como la imagen de la funcion : [0, 2) R2 dada por

(t) = (a cos(t), b sen(t))
O que la par
abola P R2 dada por
P = {(x, y) R2 | y = x2 }
se puede obtener como la imagen de la funcion : R R2 dada por
(t) = (t, t2 )
Aun y cuando todava no tenemos todo lo necesario para definir lo que significa que un subconjunto de Rn sea una curva, con base en estos ejemplos ya podemos definir lo que significa que una
de estas funciones parametrice a un conjunto C Rn .
En general, si C Rn es tal que coincide con la imagen de una funcion de R en Rn , diremos
que dicha funci
on es una parametrizaci
on de C.
1
Es com
un que se usen letras griegas para nombrar a las funciones de R en Rn .
J. P
aez
110
Definici
on 3.1 Sea C Rn . Si existe = (1 , . . . , n ) : I R Rn tal que (I) = C decimos
que es una parametrizaci
on de C. En este caso diremos que las identidades
x1 = 1 (t)
x2 = 2 (t)
..
.
xn = 2 (t)
son unas ecuaciones parametricas de C.
Con relaci
on a la definicion anterior, es importante llamar la atenci
on al hecho de que a la
funcion no se le pide ninguna propiedad. Identificar los subconjuntos de Rn para los cu
ales existe
una parametrizacion, es sin duda un problema interesante (y tal vez no muy difcil), pero que est
a
fuera de los objetivos de este texto.
De hecho, hablando de propiedades de funciones de R en Rn , hemos definido ya lo que significa
que una de estas funciones sea continua, y sin duda otra pregunta interesante sera la siguiente:
que subconjuntos de Rn tienen una parametrizacion que sea continua?
Este es un problema mucho mas interesante (y difcil!) que el anterior, y para los deseosos en
saber algo al respecto, les recomendamos investigar acerca de las llamadas curvas de Peano 2 .
Como seguramente el lector ya habra notado, m
as que responder estas preguntas, el objetivo
de este texto est
a centrado en desarrollar las propiedades que pueden tener este tipo de funciones,
entre la cuales se encuentra la de la derivabilidad.
Con respecto a la misma definicion 3.1, tambien vale la pena destacar el uso que se hace del
artculo una. En efecto, n
otese que si I R y son como en dicha definicion, y se tiene que
: J R R es tal que (J) = I, entonces : J R Rn definida como = es tal que
(J) = C y por tanto ser
a otra parametrizacion de C. Es decir, si un subconjunto C Rn
tiene una parametrizacion, entonces con base en ella podemos obtener m
as parametrizaciones del
mismo conjunto.
Por esta misma raz
on, lo m
as adecuado es decir que
x = r cos(t)
y = r sen(t)
para t [0, 2), son unas ecuaciones parametricas de la circunferencia de radio r > 0 con centro
en el origen, y que
x = r sen(2t)
y = r cos(2t)
para t [0, 1), son otras ecuaciones parametricas de la misma circunferencia.
Otro tipo de objeto geometrico que se puede obtener como la imagen de una funcion de R en
R2 es uno con el cual el lector debe estar muy familiarizado: la gr
afica de una funcion de R en R.
En efecto, si f : I R R sabemos que la gr
afica de f es un subconjunto de R2 definido como

Gf := (x, f (x)) R2 | x I
y es muy facil comprobar que la funcion : I R R2 dada por (t) = (t, f (t)) es una
parametrizacion de Gf .
2
Giuseppe Peano (Spinetta, 27 de agosto de 1858 Turn, 20 de abril de 1932) fue un matem
atico, l
ogico y fil
osofo
italiano, conocido por sus contribuciones a la l
ogica matem
atica y la teora de n
umeros.
111
J. P
aez
Como el lector seguramente estar

a de acuerdo, la observacion anterior incrementa sustancialmente la cantidad de subconjuntos de R2 que podemos describir como la imagen de una funci
on
2
de R en R . Ahora sabemos que subconjuntos como las gr
aficas de la funciones f (x) = |x| o
f (x) = sen(x) se pueden obtener de esta forma (ver figura 3.1).
Figura 3.1: Las gr

aficas de la funciones f (x) = |x| y f (x) = sen(x) se pueden obtener como la imagen
de una funcion R en R2 .
Concluimos esta breve secci
on mostrando como las funciones de R en Rn resultan ser una
herramienta adecuada para describir el camino o trayectoria seguido por un objeto. Para ello,
recurriremos a un conocido ejemplo el cual justamente se puede plantear en estos terminos de la
siguiente forma: suponga que se tiene una rueda, la cual vamos a rodar (sin resbalar) en lnea recta
y sobre una superficie plana, y sobre dicha rueda hacemos una marca.
Nuestro objetivo es encontrar una funcion que nos proporcione la posici
on (una vez establecido
un sistema cartesiano de referencia) de dicha marca, conforme la rueda va girando. Para ello,
simplificaremos el problema sustituyendo la rueda por una circunferencia de radio r > 0, a la marca
por un punto P de dicha circunferencia, supondremos que la posici
on inicial de la circunferencia
es tal que su centro C se encuentra en el punto de coordenadas (0, r) y que las correspondientes al
punto P est
an dadas por (0, 2r) (ver figura 3.2 (a)). Tambien supondremos que la circunferencia
rueda hacia la derecha, en la direcci
on positiva del eje X.
Una cuesti
on muy importante en este tipo de problemas es la eleccion de la variable (o par
ametro,
que es el termino que se suele usar en estos casos) en terminos de la cual queremos expresar la
posici
on del punto que nos interesa. Esta eleccion depende en general del problema que se este
tratando (lo que significa que no existen reglas para su eleccion).
En el caso que nos ocupa, una vez que la circunferencia haya rodado una cierta distancia (que
supondremos fue peque
na), el punto P del cual nos interesa describir su movimiento ocupara una
nueva posici
on, y las coordenadas de esta nueva posici
on las vamos a determinar usando el angulo
formado por la semirecta (paralela al eje Y ) que parte del centro de la circuferencia (en direcci
on
hacia arriba), y el segmento de recta que une al centro C con el punto P , angulo que denotaremos
por la letra y que de acuerdo a la observacion que hicimos antes, jugara el papel de par
ametro
a encontrar las nuevas coordenadas del centro C de la circunferencia
desplazada, y para ello es importante hacer notar que la distancia recorrida por dicho centro, dado
que la circunferencia rueda sin resbalar, coincide con la longitud del arco subtendido por el angulo
opuesto a , la cual est
a dada por r. De esta forma, las coordenadas del centro C son (r, r).
Si ahora observamos que para obtener las coordenadas del punto P , basta con tomar las de
punto C y sumarle la longitud de los correspondientes catetos del tri
angulo rect
angulo formado por
J. P
aez
112
P
b
r
b
r
b
r
(a)
(b)
Figura 3.2: Deducci

on de una parametrizacion de la cicloide.
los puntos C, P y Q (ver figura 3.2 (b)), concluimos que las nuevas coordenadas de P est
an dadas
2
por (r + r sen(), r + r cos()). Por tanto, la funcion de R en R definida como
() = r( + sen(), 1 + cos())
describe el movimiento del punto P en terminos del angulo . En la figura 3.3 se muestra la imagen
de esta funci
on para [0, 2] y representa a la trayectoria seguida por el punto P cuando la
circunferencia ha realizado una vuelta completa, trayectoria conocida con el nombre de cicloide.
Figura 3.3: Trayectoria seguida por el punto P cuando la circunferencia (de radio 1) ha realizado una
vuelta completa, trayectoria conocida con el nombre de cicloide.
Existen una buena cantidad de interesantes trayectorias definidas de manera an
aloga, pero
desafortundamente no est
a entre los objetivos de este libro profundizar en este tipo de ejemplos3 .
Nuestro objetivo principal en este captulo es introducir el concepto de derivada para funciones de
R en Rn , y lo motivaremos a partir del uso de estas en la geometra y en la fsica, raz
on por la cual
analizamos s
olo estos pocos ejemplos.
3
Para el lector interesado en conocer m

as ejemplos de este tipo, le recomendamos visitar el sitio de internet:
www-history.mcs.st-and.ac.uk/Curves/Curves.html
113
J. P
aez
3.2
3.2. La derivada
La derivada
Dada una funci

on : I R Rn con la cual describimos a un conjunto C Rn , si este tiene el
aspecto de una lnea doblada (como por ejemplo una conica), nos vamos a plantear el problema
de encontrar la recta tangente a C en un punto x
0 .
Si t0 I es tal que (t0 ) = x
0 y t I es cercano a t0 , ver a la diferencia
(t) (t0 )
(3.2)
como una flecha nos da la oportunidad de obtener la recta que pasa por x
0 y que sigue la direcci
on
determinada por (t) (t0 ) (ver problema 3) suponiendo, por supuesto, que esta flecha no es el
vector 0.
Como se muestra en la figura 3.4 esta recta es secante a la curva C y en la medida de que t este
m
as cercano a t0 , dicha secante se ver
a cada vez m
as como una tangente.
(t0 )
b
b
(t)
Figura 3.4: Si el vector (t) (t0 ) no es el vector 0, la recta cuya direcci

on esta determinada por este
y que pasa por el punto (t0 ), es una recta secante a la curva C que tiende a ser tangente (en (t0 ))
si t tiende a t0 .
La construccion anterior estara muy bien si no fuera por el hecho de que la diferencia 3.2 se
parecera cada vez mas al vector
0 en la medida de que t este m
as cercano a t0 (sobre todo si es
una funcion continua, lo que seguramente sucedera en la mayora de los casos que sean de nuestro
interes), con lo cual perdemos toda oportunidad de definir una recta.
La soluci
on que daremos a este problema ser
a que, en lugar de considerar al vector 3.2, vamos
a considerar al vector dado por la expresi
on
1
(t) (t0 )
((t) (t0 )) =
t t0
t t0
(3.3)
podemos seguir construyendo rectas secantes a C.

con el cual, si no es el vector 0,
Una raz
on por la cual vamos a considerar al vector 3.3 es que este no s
olo nos sigue proporcionando informaci
on de cu
al es la direcci
on que tiende a ser tangente al conjunto C en el punto x
0 ,
sino que adem
as su norma nos da informaci
on sobre la raz
on de cambio (con respecto a la distancia
entre t y t0 ) de la distancia entre los puntos (t) y (t0 ).
Mas adelante, cuando veamos a como una funcion que describe el movimiento de un objeto,
tambien veremos que el vector 3.3 es la forma m
as adecuada de medir la velocidad promedio
de dicho objeto y, en u
ltima instancia, veremos como este vector se relaciona de manera muy
J. P
aez
114
3.2. La derivada
adecuada con el concepto de derivada para funciones de R en R, justo del tipo que son las
funciones coordenadas de .
Como seguramente el lector ya lo intuye, lo siguiente que haremos ser
a fijarnos en el
lim
tt0
(t) (t0 )
t t0
y en caso de que este exista (y que no sea el vector 0, lo que no siempre podemos asegurar), si a
dicho lmite lo denotamos (casualmente) por (t0 ), sin duda que la recta definida parametricamente
por la expresi
on
(t0 ) + t (t0 )
con t R, es una recta que tiene el aspecto y las caractersticas adecuadas para ser llamada la
recta tangente a C en el punto x
0 = (t0 ).
Con base en la discusion anterior, damos las siguientes definiciones.
Definici
on 3.2 Sea : I R Rn , con I un intervalo. Dado t0 I decimos que es derivable
en t0 si
(t) (t0 )
lim
tt0
t t0
existe. Este lmite lo denotamos por (t0 ) y lo llamamos la derivada de en t0 , es decir
(t0 ) := lim
tt0
(t) (t0 )
t t0
Observaci
on 3.3 En virtud de que la definici
on anterior la restringimos a funciones cuyo dominio
es un intervalo, es importante se
nalar que en caso de que t0 I fuera un extremo de I, el lmite
que se deber
a tomar ser
a el correspondiente lmite lateral y cuya definici
on fue dada por el lector
en el problema 31 del captulo 2.
Definici
on 3.4 Sea C Rn y x
0 C. Si : I R Rn es una parametrizaci
on de C tal que
(t0 ) = x
0 para alguna t0 I y (t0 ) 6= 0, decimos que la recta definida (parametricamente) como
R(t) := (t0 ) + t (t0 )
es la recta tangente a C en x
0 .
Con relaci
on a esta u
ltima definion, es necesario hacer algunas observasiones importantes. La
primera de ellas es que, aun y cuando el aspecto geometrico del conjunto C en el punto x
0 nos
de la impresion de que existe la recta tangente, esto no significa que con cualquier parametrizacion
de C sea posible calcularla.
Esto se debe fundamentalmente al hecho de que, a pesar de que exista una parametrizacion
: I R Rn de C tal que (t0 ) = x
0 y derivable en t0 , nada nos garantiza que se satisfaga la
condici
on de que (t0 ) 6=
0. En el siguiente ejemplo mostramos un conjunto y dos parametrizaciones
de este que ilustran las dos posibilidades en el calculo de la recta tangente.
Ejemplo 3.5 Sea C = {(x, y) R2 | y = x2 }. Considere las siguientes parametrizaciones de C.
115
J. P
aez

1. Sea : R R2 dada por
3.2. La derivada
(t) = (t, t2 )
Como el lector f
acilmente puede comprobar, es una parametriazaci
on de C y en particular
en el punto (0) = (0, 0) se tiene que
(t) (0)
t0
t0
= lim (1, t)
(0) = lim
t0
= (1, 0)
de tal forma que la recta
l(t) = (0) + t (0)
= (0, 0) + t(1, 0)
= (t, 0)
que no es mas que el eje X, es tangente a C en el punto (0, 0).
(t) = (t3 , t6 )
Como en el caso anterior, tambien es f

acil comprobar que es una parametrizaci
on de C y
que (0) = (0, 0). Por otra parte, se tiene que
(t) (0)
= lim (t2 , t5 )
t0
t0
t0
= (0, 0)
lim
de modo que (0) = (0, 0) y por lo tanto la parametrizaci

on no proporciona un vector que
permita construir la recta tangente a C en el (0, 0).
Otra observaci
on importante es que la existencia misma de (t0 ) no tiene mucho que ver con
el aspecto geometrico que tenga el conjunto C en el punto x
0 = (t0 ).
A diferencia de lo que suceda con el aspecto geometrico de la gr
afica de una funcion de R en
R cuando esta era derivable en un punto, si el conjunto C tiene un pico en x
0 esto no significa
que (t0 ) no exista, como el lector puede comprobar facilmente en el caso de la cicloide (figura
3.3), la cual tiene un pico en el punto (, 0) = () a pesar de que () si existe (lo que se
deduce de un resultado que probaremos m
as adelante).
Otra ilustracion de este mismo hecho lo tenemos justo con la gr
afica de la funcion valor absoluto,
como lo veremos en el siguiente
Ejemplo 3.6 Sea C R2 la gr
afica de la funci
on f (x) = |x|; es decir, C = {(x, |x|) R2 | x R}.
Considere las siguientes parametrizaciones de C.
(t) = (t, |t|)
N
otese que para esta parametrizaci
on de C (la m
as com
un) no existe (0) pues por una
parte
lim
t0+
J. P
aez
1
(t) (0)
= lim (t, t)
t0
t0+ t
116
3.2. La derivada
= (1, 1)
mientras que
lim
t0
1
(t) (0)
= lim (t, t)
t0
t0 t
= (1, 1)
de tal forma que, por el problema 31 del captulo 2

(t) (0)
t0
t0
(0) = lim
no existe.
2. Sea ahora : R R2 dada por
(t) =
(t2 , t2 )
si t 0
(t2 , t2 )
si t 0
Tambien es f
acil ver que esta es una parametrizaci
on de C y n
otese que ahora
lim
t0+
(t) (0)
1
= lim (t2 , t2 )
+
t0
t0 t
= lim (t, t)
t0+
= (0, 0)
y
lim
t0
1
(t) (0)
= lim (t2 , t2 )
t0
t0 t
= lim (t, t)
t0
= (0, 0)
de tal forma que, por el mismo problema 31 del captulo 2, se tiene que (0) si existe y es
igual al vector (0, 0).
Con base en los ejemplos anteriores se concluye que, si C R2 es un conjunto que se puede
parametrizar por una funci
on y (t) existe, si este vector es diferente del vector 0, s
olo entonces
se podr
a asegurar que C es un conjunto que no tiene un pico en el punto (t) (en cuyo caso, y
por razones obvias, diremos que el conjunto C es suave en el punto (t)). Y si (t) = 0 entonces
no podemos asegurar nada sobre el aspecto geometrico de C en el punto (t).
Para concluir con las observaciones relacionadas con la definicion de recta tangente que hemos
dado, es importante recordar que este es un concepto que el lector ya conoce para cierto tipo de
conjuntos en R2 , especficamente aquellos que se obtienen como la gr
afica de una funcion de R en
R.
Por otra parte, y como vimos en la primera secci
on de este captulo, si f : I R R sabemos
que la gr
afica de f es un subconjunto de R2 definido como

Gf := (x, f (x)) R2 | x I
117
J. P
aez
3.2. La derivada
y que la funcion : I R R2 dada por (t) = (t, f (t)) es una parametrizacion de Gf .

En el problema 8 de este captulo, el lector probara que, si la funcion f es derivable en t0 I,
entonces la parametrizacion tambien es derivable en t0 y adem
as que la recta tangente dada en
la definicion 3.4 no es m
as que una forma parametrica de la recta tangente que le fue definida en
su primer curso de c
alculo diferencial.
De la observaci
on anterior se concluye que la definicion de recta tangente dada en la defincion 3.4
amplia a la familia de subconjuntos de R2 para los cuales ahora tenemos definido este concepto.
Lo que haremos a continuaci
on ser
a dar un ejemplo de un subconjunto de R2 el cual no se puede
ver (completo) como la gr
afica de una funcion de R en R (aunque en el captulo 5 probaremos un
importante resultado que nos asegura que algunas partes de este s se pueden ver de esa forma),
pero que s se puede parametrizar y que por lo tanto, con base en la definicion 3.4, podremos
calcular su recta tangente en algunos de sus puntos.
Adicional a lo anterior, en este ejemplo tambien mostraremos como se puede encontrar la
parametrizacion de un subconjunto de R2 que est
a definido a traves de coordenadas polares.

Ejemplo 3.7 Sea C = x
= (r, ) R2 | 0 2, r = 2(1 + cos()) , en donde la pareja (r, )
representa coordenadas polares del punto x
.
Este conjunto es conocido como la curva cardiode (ver figura 3.5).
Figura 3.5: La curva cardiode cuya ecuacion polar esta dada por r = 2(1 + cos()).
a calcular una parametrizaci
on de C. Dado que este conjunto
est
a descrito en termino de coordenadas polares, y que las operaciones de suma y producto por
un escalar de vectores (operaciones que es necesario realizar para el c
alculo de la derivada de una
parametrizaci
on) no se pueden expresar en forma sencilla en este tipo de coordenadas, lo primero
que haremos ser
a describir a los elementos de C en terminos de coordenadas cartesianas.
De esta forma, aplicando las ecuaciones de cambio de coordenadas vistas en el captulo 1,
tendremos que, si (x, y) representan las coordenadas cartesianas de x
C, entonces
x = r cos()
= 2(1 + cos()) cos()
y
y = r sen()
J. P
aez
118
3.2. La derivada
= 2(1 + cos()) sen()

es decir que

C = (2(1 + cos()) cos(), 2(1 + cos()) sen()) R2 | 0 2
de modo que si definimos : [0, 2] R2 como
() = (2(1 + cos()) cos(), 2(1 + cos()) sen())

ser
a una parametrizaci
on de C expresada en terminos de las coordenadas cartesianas de sus
elementos.
Ahora que ya contamos con una parametrizaci
on de C, para calcular la derivada de esta, haremos uso del primer resultado que formularemos en la siguiente secci
on (proposici
on 3.8), lo que
sin lugar a dudas constituye un peque
no y breve abuso, que esperamos el lector disculpe.
Con base en este resultado, tendremos que
() = (2 sen() cos() 2(1 + cos()) sen(), 2 sen() sen() + 2(1 + cos()) cos())

= 2 sen() 4 sen() cos(), 2 cos() + 2 cos2 () sen2 ()
= (2 sen() 2 sen(2), 2 cos() + 2 cos(2))
de donde podemos concluir que, por ejemplo, la recta tangente a la cardiode en el punto (/2) =
(0, 2) es la recta parametrizada por
(/2) + t (/2) = (0, 2) + t (2, 2)
= (2t, 2t + 2)
es decir, la recta cuya ecuaci

on cartesiana es y = x + 2. An
alogamente, la recta tangente a la
cardiode en el punto (3/2) = (0, 2) es la recta parametrizada por
(3/2) + t (3/2) = (0, 2) + t (2, 2)
= (2t, 2t 2)
es decir, la recta cuya ecuaci

on cartesiana es y = x 2.
on mencionando otra interpretacion del concepto de derivada que hemos
introducido.
Cuando a una funci
on : I R Rn la utilizamos para describir el movimiento de un objeto,
y en particular el par
ametro (o la variable) t del cual depende la funcion representa al tiempo, de
tal forma que para un valor especfico t0 I, (t0 ) representa su posici
on en este instante, sin duda
el lector estar
a de acuerdo en que si, t I es otro instante muy cercano a t0 , entonces el vector
(t) (t0 )
1
((t) (t0 )) =
t t0
t t0
contiene informaci
on muy valiosa del movimiento descrito por cerca del instante t0 .
En efecto, este vector nos da informaci
on de hacia d
onde se est
a moviendo nuestro objeto (a
partir de su posici
on en el tiempo t0 ), y su norma nos da un promedio de la rapidez con la que
se est
a moviendo cerca del instante t0 .
En virtud de lo anterior, se suele decir que este vector representa la velocidad promedio de
nuestro objeto durante el intervalo de tiempo comprendido entre t0 y t.
119
J. P
aez
3.3. Propiedades de la derivada
Como seguramente el lector ya est

a imaginando, si
lim
tt0
(t) (t0 )
t t0
existe, dicho valor lmite (que tambien es un vector) se puede interpretar como la velocidad de
nuestro objeto en el instante t0 , o como se suele decir, la velocidad instant
anea de nuestro objeto,
en el instante t0 .
3.3
Propiedades de la derivada
Como hicimos en el caso de los conceptos de lmite y continuidad, lo siguiente que haremos ser
a
n
mostrar la estrecha relaci
on que existe entre la derivada de una funcion : I R R y sus
funciones coordenadas 1 , . . . , n (en un sistema de referencia dado), las cuales ser
an funciones de
R en R y para las que ya conocemos el concepto de derivada.
Como seguramente el lector ya intuye, la derivabilidad de la funcion es una condici
on necesaria
y suficiente de la derivabilidad de sus funciones coordenadas, resultado que dejamos plasmado en
la siguiente
Proposici
on 3.8 Sea = (1 , . . . , n ) : I R Rn y t0 I. es derivable en t0 si y s
olo si
cada i es derivable en t0 , para i {1, . . . , n}. En ambos casos se tiene que
(t0 ) = (1 (t0 ), . . . , n (t0 ))
on es una consecuencia inmediata de la proposici
on 2.30 del captulo
2 y se deja al lector.
Lo siguiente que haremos ser
a mostrar la relaci
on que existe entre el concepto de derivada
y las operaciones aritmeticas entre funciones de este tipo. Con base en la proposici
on anterior,
los correspondientes resultados de derivacion para funciones de R en R, y la proposici
on 2.33 del
captulo 2, la prueba de estas propiedades es inmediata y tambien se dejan al lector.
Proposici
on 3.9 Sean , : I R Rn , t0 I y h : I R R. Si , y h son derivables en
t0 entonces:
1. + es derivable en t0 y adem
as
( + ) (t0 ) = (t0 ) + (t0 )
2. h es derivable en t0 y adem
as
(h) (t0 ) = h (t0 )(t0 ) + h(t0 ) (t0 )
En particular, si h es la funci
on constante c, entonces
(c) (t0 ) = c (t0 )
3. : I R R es derivable en t0 y adem
as
( ) (t0 ) = (t0 ) (t0 ) + (t0 ) (t0 )
J. P
aez
120
4. si n = 3, es derivable en t0 y adem
as
( ) (t0 ) = (t0 ) (t0 ) + (t0 ) (t0 )
Otras operaciones que podemos realizar con una funcion de R en Rn , es la composici
on por la
izquierda con una funci
on de Rn en Rm , o por la derecha con una funcion de Rm en R.
Dado que habra que esperar hasta los captulos 3 y 4 para contar con un concepto de derivada
para funciones de Rn en Rm (con n > 1), y que hasta este momento para funciones de Rm en
R, s
olo sabemos c
omo derivarlas cuando m = 1, por ahora nos vamos a conformar con formular
un resultado (la primera regla de la cadena de este texto!) que establece condiciones para que la
composici
on (por la derecha) de una funcion de R en Rn con otra de R en R sea derivable, y una
formula para calcular su derivada.
Proposici
on 3.10 Sean J R un intervalo, h : J R R, : I R Rn , t0 I y x0 J
tales que h(J) I y h(x0 ) = t0 . Si h es derivable en x0 y es derivable en t0 entonces h es
derivable en x0 y adem
as
( h) (x0 ) = (h(x0 ))h (x0 )
= (t0 )h (x0 )
Si = (1 , . . . , n ) entonces h = (1 h, . . . , n h) de modo que la prueba de esta proposici

on
tambien es una consecuencia inmediata de la proposici
on 3.8 y de la regla de la cadena para funciones
de R en R, por lo que se deja al lector.
La prueba tambien se puede hacer sin recurrir a las funciones coordenadas y a la proposici
on
3.8, imitando la prueba para funciones de R en R, lo que se pide hacer en el problema 6 de este
captulo.
En cuanto a la formula para calcular ( h) (x0 ) es importante mencionar que, aun y cuando
para escribir la multiplicaci
on de un escalar por un vector siempre hemos puesto primero al escalar,
en esta ocasi
on lo hemos escrito despues del vector con la idea de conservar la forma en que se suele
expresar la regla de la cadena.
Como en el caso de las funciones de R en R, la derivabilidad de una funcion de R en Rn en un
punto t0 implica la continuidad de esta en dicho punto. Como es de esperarse, esto tambien es una
consecuencia inmediata de la proposici
on 3.8 y del correspondiente resultado para el caso real, lo
que dejamos expresado en la siguiente
Proposici
on 3.11 Sean : I R Rn y t0 I. Si es derivable en t0 entonces es continua
en t0 .
Aun y cuando ya mencionamos que la prueba de esta proposici
on es una consecuencia inmediata
de la proposici
on 3.8 y del correspondiente resultado para el caso real, esta tambien se puede hacer
imitando la prueba que se hace en este caso observando que
(t) (t0 ) = (t t0 )
(t) (t0 )
t t0
para todo t 6= t0 , de modo que

lim ((t) (t0 )) = lim (t t0 )
tt0
tt0
= (0) (t0 )
121
(t) (t0 )
t t0
J. P
aez
= 0
y de donde concluimos que es continua en t0 .
Sin duda, el resultado m
as importante relacionado con el concepto de derivada de funciones de
R en R, es el Teorema del Valor Medio. Lamentablemente este teorema no se puede generalizar a
funciones de R en Rn y los siguientes ejemplos ilustran tan desafortunado hecho.
Ejemplo 3.12 Considere las siguientes funciones:
1. : [1, 1] R R2 dada por
(t) =
N
otese que
(t2 , t2 )
(t2 , t2 )
2t(1, 1)
(0, 0)
(t) =
2t(1, 1)
si 1 t 0
si 0 t 1
si 1 t < 0
si t = 0
si 0 < t 1
de modo que no existe (1, 1) para el cual se satisfaga que

(1) (1) = (1 (1)) ()
= 2 ()
puesto que el vector (1) (1) = (1, 1) (1, 1) = (2, 0) no es un m

ultiplo escalar de (t)
para ning
un valor de t (1, 1) (figura 3.6 (a)).
2. : [0, 1] R R3 dada por (t) = (cos(2t), sen(2t), t). Entonces
(t) = (2 sen(2t), 2 cos(2t), 1)
de modo que no existe (0, 1) tal que
(1) (0) = (2 0)
()
= (4 sen(), 4 cos(), 2)
puesto que (1) (0) = (0, 0, 1) y 2 6= 1. De hecho, dado que para ning
un valor de t las
2
funciones sen(2t) y cos(2t) son simult
aneamente cero (recuerde que sen (2t)+cos2 (2t) =
1 para toda t R), el vector (1) (0) nunca es paralelo (o m
ultiplo escalar) de (t) para
ning
un valor de t (figura 3.6 (b)).
No obstante los ejemplos anteriores, se puede formular una cierta versi
on parecida al Teorema de Valor Medio (s
olo para funciones de R en R2 ) que se puede probar justamente como una
consecuencia del Teorema del Valor Medio Generalizado de Cauchy para funciones de R en R, y
que se deja como problema al lector (problema 12).
Concluiremos esta secci
on, introduciendo el concepto de derivada de orden superior para una
n
funcion de R en R . De forma an
aloga a lo que sucede en el caso de funciones de R en R, si
una funcion : I R Rn es derivable para cada t del intervalo J I, entonces la funci
on
J. P
aez
122
3.4. Derivada y geometra
Y
b
(1) (1)
b
(1) (0)
1
(a)
(b)
Figura 3.6: El teorema del Valor Medio no se puede generalizar a funciones de R en Rn . Como lo
muestran estos ejemplos, los vectores (1) (1) y (1) (0) no son paralelos a la derivada de
y , respectivamente, evaluada en alg
un punto intermedio.
: J R Rn que a cada t J asocia la derivada de en t, es decir t 7 (t), es nuevamente
una funcion de J R en Rn .
Si esta funci
on tambien resulta ser derivable en cada punto de J, se define entonces la segunda
derivada de , que denotamos por o por (2) , como la funcion : J R Rn dada por
(t) := ( ) (t)
(t + h) (t)
h0
h
:= lim
para cada t J.
Siguiendo este procedimiento, en general podemos dar de manera inductiva la siguiente
Definici
on 3.13 Sean : I R Rn derivable para cada t del intervalo J I, y n N. Si
(1)
(t) := (t) y (n) est
a definida y es derivable para cada t J, definimos (inductivamente) la
n + 1 derivada de en t, que denotamos por (n+1) (t), como
(n+1) (t) := ( (n) ) (t)
(n) (t + h) (n) (t)
h0
h
:= lim
para cada t J.
En las siguientes secciones daremos las posibles interpretaciones que se le pueden dar a las
derivadas de orden superior, dependiendo del contexto en el que se este trabajando.
3.4
Derivada y geometra
Una vez que ya contamos con el concepto de derivada para funciones de R en Rn , tenemos todo lo
necesario para definir el concepto de curva, el cual constituye uno de los usos m
as importantes de
este tipo de funciones.
Definici
on 3.14 Sea C Rn . Decimos que C es una curva si existe : I R Rn derivable en
el intervalo I tal que (I) = C. Si adem
as (t) 6= 0 para toda t I decimos que C es una curva
suave (o regular). Como ya se mencion
o en la definici
on 3.1, decimos que es una parametrizaci
on
de C.
123
J. P
aez
Si es una funci
on derivable que parametriza a un conjunto C, adem
as de proporcionarnos
una forma de encontrar una ecuaci
on (par
ametrica) de su recta tangente en (t) (si (t) 6= 0), la
derivada de nos puede ser u
til para resolver el siguiente problema geometrico: apoyados en la
idea intuitiva que tengamos de lo que es (o debiera de ser!) la longitud de C, como calcular
esta longitud?
Para abordar este problema, vamos a suponer que la curva se puede parametrizar por una
funcion : [a, b] R Rn , la cual es derivable en el intervalo [a, b] y que adem
as es inyectiva.
Es intuitivamente claro que si elegimos un n
umero finito de puntos en C, digamos x
0 , . . . ,
x
k , de tal forma que x
0 y que x
k sean sus extremos y que x
i1 y x
i sean consecutivos para
i {1, . . . , k}, entonces la suma
k
X
k
xi x
i1 k
i=1
es una aproximacion a la longitud de C, y que esta aproximacion ser

a mejor en la medida de que
tomemos m
as (y muy bien distribuidos) puntos en C (ver figura 3.7).
b
b
x
k
x
i1
xi
b
b
b
x
0
Figura 3.7: La suma de las distancias entre los puntos consecutivos x

i1 y x
i es una muy buena
aproximaci
on a la longitud de C.
De la suposici
on de que parametriza a la curva C y que es inyectiva, al conjunto de puntos
{
x0 , . . . , xk } le corresponde una partici
on P ={t0 , . . . , tk } del intervalo [a, b] tal que x
i = (ti ) para
i {1, . . . , k}. De esta forma, tenemos entonces que
k
X
i=1
k
xi x
i1 k =
k
X
i=1
k(ti ) (ti1 )k
y la suma de la derecha ser

a una buena aproximacion a la longitud de C si P es una partici
on
muy fina del intervalo [a, b]. Ahora lo que haremos ser
a analizar m
as de cerca como se puede
expresarvcada vector (ti ) (ti1 ).
Aun y cuando ya mostramos que el Teorema del Valor Medio no se cumple en general para
funciones de R en Rn , lo que s podemos asegurar es que, si = (1 , . . . , n ), aplicando el Teorema
del Valor Medio (para funciones de R en R) a cada una de estas funciones coordenadas, entonces
(j)
para cada j {1, . . . , n} se sabe que existe i (ti1 , ti ) tal que

(j)
(ti ti1 )
j (ti ) j (ti1 ) = j i
de tal forma que
(ti ) (ti1 ) = (1 (ti ) 1 (ti1 ), . . . , n (ti ) n (ti1 ))

(n)
(1)
(ti ti1 )
(ti ti1 ), . . . , n i
= 1 i
J. P
aez
124

(n)
(1)
(ti ti1 )
, . . . , n i
= 1 i
Si ahora suponemos tambien que cada funcion coordenada de j es continua (lo que es equivalente a que sea continua) en el intervalo cerrado [a, b], entonces el vector

(n)
(1)
, . . . , n i
1 i
se parecera a la derivada (i ) evaluada en cualquier i (ti1 , ti ) (y este parecido ser

a mucho
mejor nuevamente cuando la partici
on P sea una partici
on muy fina del intervalo [a, b]) de tal
forma que

(n)
(1)
(ti ti1 )
, . . . , n i
k(ti ) (ti1 )k = 1 i

(i )(ti ti1 )

= (i ) (ti ti1 )
En virtud de lo anterior, si la suma
k
X
i=1
k
xi x
i1 k
es una buena aproximacion a la longitud de C en la medida de que la partici

on P sea una
partici
on cada vez mas fina del intervalo [a, b], entonces con la suma
k
X

(i ) (ti ti1 )
i=1
sucedera lo mismo, y lo relevante de la conclusion anterior es que esta u

ltima suma tiene la peculariedad de ser una suma de Riemann correspondiente a la funcion f (t) = k (t)k (para t [a, b])
por lo que dicha suma se aproxima a la integral
Zb
a

(t) dt
(3.4)
y esta aproximacion ser

a mejor justo cuando P sea una partici
on muy fina del intervalo [a, b]!
Resumiendo la discusion anterior (y todas las aproximaciones que ah aparecen!), todo parece
indicar que, si C Rn es una curva que se puede parametrizar por una funcion : [a, b] R Rn ,
la cual es derivable en el intervalo [a, b], inyectiva y adem
as : [a, b] R Rn es continua,
entonces su longitud deber
a estar dada por la integral 3.4.
Con el fin de reforzar esta conclusion, mostraremos en el siguiente ejemplo que esto sucede
as, calculando la integral anterior con una curva (y una parametrizacion de ella) para la cual ya
conocemos su longitud.
Ejemplo 3.15 Sea C R2 la circunferencia de radio r > 0 con centro en un punto x
0 = (x0 , y0 ).
Mostraremos que, si tomamos la parametrizaci
on de C dada por la funci
on
(t) = (r cos(t) + x0 , r sen(t) + y0 )
con t [0, 2], y calculamos la integral dada en 3.4, dicha integral vale 2r, que como sabemos
desde hace mucho tiempo, es el permetro de la cincunferencia C.
125
J. P
aez
En efecto, n
otese que (t) = (r sen(t), r cos(t)) de modo que

(t) = r
para toda t [0, 2] y por lo tanto tenemos que

Zb
a

(t) dt =
Z2
rdt
= 2r
Como mencionamos al inicio de toda esta discusion, la realidad es que a estas alturas no contamos (salvo por algunos casos especficos) con una definicion de longitud de una curva, y justo
lo que estamos a punto de hacer es llenar ese vaco.
En realidad definiremos (aprovechando que la integral 3.4 s
olo depende de la funcion ) lo
que llamaremos la longitud asociada a esta parametrizaci
on y u
nicamente cuando cumpla con
ciertas condiciones (como por ejemplo, que sea inyectiva, salvo tal vez por un n
umero finito de
puntos de su dominio) dicha longitud asociada la podremos interpretar como la longitud de la
curva que est
a parametriza por .
Todo ello lo recogemos en la siguiente
Definici
on 3.16 Sea : [a, b] R Rn tal que k (t)k es integrable en [a, b]. Definimos la
longitud de (que denotamos por l()) como
l() :=
Zb
a

(t) dt
Si es una funci
on inyectiva en [a, b], salvo quizas por un n
umero finito de puntos, y C = ([a, b])
entonces el n
umero l() dado en la definicion anterior se puede interpretar como la longitud de
C. De hecho, con base en esta idea de longitud, podemos definir una funcion : [a, b] R R
como
Zt

(t) = (u) du
a
cuyo valor en t [a, b] tambien se puede interpretar como la longitud del subarco de C dado por
([a, t]).
Si adem
as de la inyectividad de en casi todo su dominio, tenemos que k (t)k es una funci
on
continua de t (lo que se satisface si es continua en [a, b]), por el Teorema Fundamental del C
alculo
sabemos que ser
a una funci
on derivable y que

(t) = (t) 0
lo que significa que siempre resulta ser una funcion no decreciente en el intervalo [a, b] cuya
imagen es el intervalo [0, l()].
Lo interesante de esta funci
on es que, si adem
as (t) 6= 0 para toda t [a, b] (es decir que
C = ([a, b]) es una curva suave (o regular)) entonces

(t) = (t) > 0
J. P
aez
126
de modo que en este caso es una funcion estrictamente creciente en el intervalo [a, b], y por tanto
su funcion inversa 1 : [0, l()] R [a, b] R existe, la cual, dado que es continua y (t) 6= 0
para toda t [a, b], por el Teorema de la Funci
on Inversa (para funciones de R en R), tambien es
derivable.
Lo importante de la discusion anterior es que, si C = ([a, b]) es una curva suave (o regular),
entonces a traves de la funci
on 1 podemos obtener otra parametrizacion de C, dada por
= 1 : [0, l()] R Rn
la cual resulta tener propiedades muy relevantes.
A este tipo de parametrizacion de C se le conoce con el nombre de parametrizaci
on por longitud
de arco (para el caso de la parametrizacion este nombre es muy adecuado puesto que su par
ametro
s = (t) [0, l()] es justo la longitud del subarco ([a, t])) de C), y la u
ltima parte de esta secci
on
la dedicaremos a mostrar algunas de sus caractersticas.
Antes de hacer esto, es importante llamar la atenci
on a la forma en que construimos a la
parametrizacion a partir de la parametrizacion original , que es un caso particular de una
relaci
on m
as general que puede haber entre dos parametrizaciones de una misma curva C, relaci
on
que da lugar al concepto de reparametrizaci
on, el cual definiremos antes de estudiar las propiedades
especficas de la parametrizacion (o reparametrizacion) por longitud de arco.
Definici
on 3.17 Sean C Rn una curva y : I R Rn una parametrizaci
on (derivable) de
C. Decimos que : J R Rn , una funci
on derivable, es una reparametrizaci
on de si existen
J R y : J R R derivable, tales que (J) = I y (s) = ( )(s) para toda s J. Si
(s) 0 para toda s J decimos que preserva la orientaci
on de , y si (s) 0 para toda
s J decimos que invierte la orientaci
on de .
Dada una parametrizacion : [a, b] R Rn de una curva C Rn , una reparametrizaci
on
de que siempre se puede construir, es la que se obtiene a partir de la funcion : [a, b] [a, b]
dada por (t) = a + b t. Como (a) = b y (b) = a, la funcion tiene la propiedad de que
( )(a) = (b) y ( )(b) = (a), es decir, parametriza al conjunto C con la particularidad
de que su punto inicial ( )(a) es el punto final (b) de , y su punto final ( )(b) es el punto
inicial (a) de (ver figura 3.8), raz
on por la cual a esta reparametrizacion se le suele denotar por
.
Por todo lo anterior, y dado que
() (t) = ( ) (t)
= ((t)) (t)
= (a + b t)
se tiene que recorre a C en la direcci
on contraria en que la recorre .
Como se mostro en los p
arrafos previos a la definicion 3.17, y a diferencia de la reparametrizaci
on
n
, la reparametrizacion por longitud de arco s
olo se puede obtener si C R es una curva
suave y : [a, b] R Rn es una parametrizacion de C tal que (t) es continua y diferente de
0
para toda t [a, b].
Sin duda una propiedad muy caracterstica de la reparametrizacion por longitud de arco de
una curva suave C, es la referente a la rapidez con que la recorre.
En efecto, como se puede observar en la reparametrizacion que se obtiene a partir de una
parametrizacion definida sobre un intervalo [a, b], queda definida sobre el intervalo [0, l()] de
127
J. P
aez
C
()(a)
(b)
b
b
b
(a)
()(b)
Figura 3.8: Las parametrizaciones y de la misma curva C.

tal manera que su par
ametro s vara dentro de un intervalo que tiene la misma longitud que la
curva C.
De esta forma, pareciera que para recorrer a esta curva, a la parametrizacion le bastara
con recorrer una unidad de distancia sobre C por cada unidad de distancia que recorra el
par
ametro s, lo que en terminos de rapidez, significa que esta u
ltima tendra que valer 1.
Esta propiedad, que m
as adelante mostraremos con todo rigor que efectivamente la tiene la
reparametrizacion , la tomaremos justo como base para definir lo que significa en general que una
curva C Rn este parametrizada por longitud de arco.
Definici
on 3.18 Sea C Rn una curva y : I R Rn una parametrizaci
on (derivable) de C.
Decimos que es una parametrizaci

on por longitud de arco de C si k (t)k = 1 para toda t I.
De la definicion anterior se desprende inmediatamente que si C Rn es una curva que posee
una parametrizacion por longitud de arco, entonces C es una curva suave (o regular).
Lo que a continuaci
on haremos ser
a mostrar que toda curva suave (o regular) C Rn que
tenga una parametrizacion : I R Rn que adem
as de ser derivable, su derivada tambien sea
continua, entonces tiene una parametrizacion por longitud de arco.
La forma en que construiremos esta parametrizacion es b
asicamente la misma que usamos para
contruir la reparametrizacion en los p
arrafos anteriores.
Proposici
on 3.19 Sea C Rn una curva suave. Si : I R Rn es una parametrizaci
on de
C tal que (t) es continua y diferente de 0 para toda t I entonces C tiene una parametrizaci
on
por longitud de arco.
Demostraci
on. Sea t0 I un punto fijo; definimos : I R R como
(t) =
Zt
t0

(u) du
(3.5)
Por el Teorema Fundamental del C

alculo sabemos que es derivable y que adem
as

(t) = (t)
para toda t I. De esta forma, dado que (t) = k (t)k > 0 (adem
as de ser continua), por el
Teorema de la Funci
on Inversa (para funciones de R en R), sabemos que es invertible y que su
inversa 1 , que est
a definida sobre el intervalo (I), tambien es derivable.
J. P
aez
128
Definimos : (I) R Rn como (s) = ( 1 )(s) para cada s (I). Claramente es

una parametrizacion de C (puesto que es una reparametrizacion de ), y por la regla de la cadena
probada en la proposici
on 3.10, tenemos que
(s) = ( 1 ) (s)
= (1 (s))(1 ) (s)
de modo que
(s) = (1 (s))(1 ) (s)
1
= (1 (s)) 1
( (s))
1
= (1 (s)) 1
k ( (s))k
para cada s (I).

(s) = 1
Con relaci
on a la construccion de la parametrizacion por longitud de arco que se da en la
prueba de la proposici
on anterior, es importante hacer dos observaciones.
La primera de ellas tiene que ver con el hecho de que no toda parametrizacion por longitud
de arco de una curva C, se puede obtener siguiendo la misma construccion. Aunque sutil, esto es
un hecho que hay que mencionar y que se deja al lector probarlo por medio de un ejemplo (ver
problema 18).
on tiene que ver justo con la construccion de la parametrizacion que se
hace en la prueba de la proposici
on. Desde un punto de vista teorico, la construccion que ah se
da es impecable; sin embargo (y para ser sinceros), desde un punto de vista pr
actico, obtener una
expresi
on explcita para puede resultar ser una tarea muy difcil (y en algunos casos imposible!).
Esta dificultad (o imposibilidad) est
a relacionada con el hecho de que en la construccion de
est
a involucrada la obtenci
on de la inversa de la funcion dada por la identidad 3.5, lo que no
siempre se puede hacer de manera explcita.
Para no contribuir con una posible causa de depresion de los amables lectores de este texto,
daremos un ejemplo en el que s es posible calcular .
Ejemplo 3.20 Sea C R3 la curva parametrizada por la funci
on : R R3 dada por
(t) = (cos(t), sen(t), t)
(ver figura 3.9).
Calcularemos, con base en , una parametrizaci
on por longitud de arco de C. Definimos :
R R como
(t) =
Zt
0

(u) du
Zt
2du
129
J. P
aez
Figura 3.9: La curva (helice) del ejemplo 3.20.

=
2t
Entonces, despejando la variable t de la ecuaci

on
s = (t)
= 2t
obtenemos que
s
t=
2
1
= (s)
de tal forma que
(s) = ( 1 )(s)
= (1 (s))
= (s/ 2)
= (cos(s/ 2), sen(s/ 2), s/ 2)
para s R.
Una vez que ya hemos definido lo que es una parametrizacion por longitud de arco (y mostrado
como y cu
ando podemos obtener una de estas), lo que haremos a continuaci
on ser
a mostrar la
forma en que se puede usar para definir algunas caractersticas geometricas de las curvas.
Dado que la caracterstica principal de una parametrizacion por longitud de arco de una curva
C Rn , es que su rapidez es constante 1 (es decir, k (s)k = 1), si podemos calcular la derivada
de (es decir ), la informaci
on que esta nos proporciona s
olo est
a relacionada con el cambio de
direcci
on de o con la forma en que se dobla la curva C.
De manera m
as precisa, y dado que por el problema 10 ya sabemos que (s) siempre es
perpendicular a (s), la manera en que (valga la redundancia) se curva la curva C, deber
a estar
contenida en la norma de (s).

Que este n
umero tiene esta informaci
on lo podemos comprobar calcul
andolo para una circunferencia de radio r, en cuyo caso, adem
as de depender de r, deber
a ser el mismo en cualquier punto
de esta.
J. P
aez
130
Ejemplo 3.21 Sea C R2 la circunferencia de radio r > 0 con centro en el origen y : R R2

una parametrizaci
on por longitud de arco de C dada por

s
s
(s) = r cos
, r sen
r
r
Entonces tenemos que
y
de modo que
para toda s R.
s

s
, cos
(s) = sen
r
r

s 1
s
1
(s) = cos
, sen
r
r
r
r
1
(s) =
r
Ademas de confirmar nuestras sospechas, el ejemplo anterior ilustra un hecho geometrico muy
intuitivo: si el radio r de una circunferencia es muy grande, esta est
a menos curvada, y si el radio
es muy peque
no entonces la circunferencia est
a muy curvada.
Ambos hechos se ven reflejados en el n
umero k (s)k puesto que en el primer caso este es m
as
cercano a 0, mientras que en el segundo caso es muy grande. Con base en estos razonamientos y el
ejemplo anterior, damos la siguiente
Definici
on 3.22 Sea : I R Rn una parametrizaci
on por longitud de arco de una curva
n
C R tal que (s) existe para cada s I. Definimos la curvatura de C en el punto (s) C,
que denotamos por k(s), como

k(s) := (s)
Como ya habamos mencionado, si es una parametrizacion por longitud de arco de una curva
C Rn , los vectores (s) y (s) son perpendiculares, y dado que (s) es tangente a C (adem
as
de tener norma 1), entonces se dice que (s) apunta en la direcci
on normal a la curva C (que
es la direcci
on en la que esta se curva).
Con base en estas observaciones, establecemos las siguientes definiciones y notaciones.
Definici
n
C R tal que (s) existe para toda s I.

1. Definimos el vector tangente unitario a C en (s) (determinado por ), el cual denotamos
por T (s), como
T (s) := (s)
2. Si (s) 6=
0, definimos el vector normal unitario a C en (s), el cual denotamos por N (s),
como
(s)
N (s) :=
k (s)k
3. Si (s) 6=
0, definimos el plano osculador a C en (s), el cual denotamos por s , como el
plano generado por lo vectores T (s) y N (s) que contiene al punto (s). Es decir
s := {T (s) + N (s) + (s) | , R}
131
J. P
aez
4. Si (s) 6=
0, definimos la circunferencia osculadora a C en (s), la cual denotamos por Cs ,
a la circunferencia contenida en el plano osculador con centro en el punto
(s) +
llamado centro de curvatura, y radio
1
N (s)
k(s)
1
k(s)
en donde a este n
umero lo llamaremos el radio de curvatura de la curva C en (s).
5. Si C R3 y (s) 6=
0, definimos el vector binormal unitario a C en (s), el cual denotamos
por B(s), como
B(s) := T (s) N (s)
No podemos dejar de mencionar que en las dos definiciones anteriores hara falta mostrar que
los conceptos ah plasmados (salvo por los vectores tangente y binormal unitarios), todos ellos son
independientes de la parametrizacion por longitud de arco que se este usando. Aunque probar esto
no es muy difcil, si resultara bastante laborioso y por lo mismo escapa a los objetivos de este
texto.
Para ilustrar todos los objetos asociados a una curva suave dados en la definicion anterior,
damos el siguiente
Ejemplo 3.24 Sea C R3 la helice del ejemplo 3.20 y su parametrizaci
on por longitud de arco
(s) = (cos(s/ 2), sen(s/ 2), s/ 2)

que ah calculamos.
Tenemos entonces que:
1. el vector tangente unitario T (s) est
a dado por
T (s) = (s)

1
1
1
= sen(s/ 2), cos(s/ 2),
2
2
2
2. la curvatura k(s) est
a dada por

k(s) = (s)

1
1

= cos(s/ 2), sen(s/ 2), 0

2
2
=
1
2
3. el vector normal unitario N (s) est

a dado por
(s)
k (s)k

= cos(s/ 2), sen(s/ 2), 0
N (s) =
J. P
aez
132
4. el plano osculador s , expresado en forma parametrica, est

a dado
s = {T (s) + N (s) + (s) | , R}
(3.6)

n
= 1/ 2 sen(s/ 2) + 2(1 ) cos(s/ 2), cos(s/ 2) + 2(1 ) sen(s/ 2), + s

| , R}
Como s est
a generado por los vectores T (s) y N (s), aprovechando que estamos en R3 podemos recurrir al vector binormal para obtener un vector normal a s y con este calcular su
ecuaci
on cartesiana.
De esta forma, dado que
B(s) = T (s) N (s)

1
= sen(s/ 2), cos(s/ 2), 1
2
y que s contiene al punto (s), su ecuaci
on cartesiana estar
a dada por

sen(s/ 2), cos(s/ 2), 1 ((x, y, z) (cos(s/ 2), sen(s/ 2), s/ 2)) = 0
la cual queda expresada como
s
sen(s/ 2)x cos(s/ 2)y + z =
2
y que, como es de esperarse, es satisfecha por las ternas dadas en la identidad 3.6.
5. finalmente, el centro de la circunferencia osculadora Cs est
a dado por

1
1
(s) +
N (s) = (cos(s/ 2), sen(s/ 2), s/ 2) + cos(s/ 2), sen(s/ 2), 0
k(s)
1/ 2

= (1 2) cos(s/ 2), (1 2) sen(s/ 2), s/ 2
de modo que, como dicha circunferencia

a contenida en el plano generado por los vectores
est
T (s) y N (s), y su radio es 1/k(s) = 2, una expresi
on parametrica para Cs estara dada por
(s) + 2N (s) + 2 cos()T (s) + 2 sen()N (s)

con [0, 2].
En la figura 3.10 se muestran todos los objetos que calculamos en el ejemplo anterior, incluyendo la curva determinada por los centros de curvatura de C, la cual recibe el nombre de
evoluta de la curva C y que en este caso es nuevamente una helice.
Una primera consecuencia interesante (e inmediata) de las definiciones 3.22 y 3.23, es la relaci
on
existente entre los vectores T (s) y N (s), la cual dejamos plasmada en la siguiente proposici
on y
cuya prueba dejamos al lector.
Proposici
n
suave C R . Si (s) existe y es diferente de 0 entonces

T (s) = k(s)N (s)
133
J. P
aez
T (s)
b
N (s)
B(s)
Figura 3.10: La curva helice y algunos de sus objetos calculados en el ejemplo 3.24, incluyendo su
evoluta.
De forma an
aloga a la proposici
on anterior, cuando nuestra curva C est
a contenida en R3 se
tiene que el vector B (s) es un m
ultiplo escalar del vector N (s), afirmacion que probamos en la
siguiente proposici
on y con base en la cual introducimos el concepto de torsi
on para curvas suaves
contenidas en R3 .
Proposici
on 3.26 Sea : I R R3 una parametrizaci
suave C R3 . Si para s I se tiene que B (s) existe entonces B (s) es un m
ultiplo escalar de
N (s).
Demostraci
on. Dado que
kB(s)k = kT (s) N (s)k
= kT (s)k kN (s)k sen(/2)
=1
por el problema 10 de este captulo sabemos que B (s) es perpendicular a B(s), es decir B(s)B (s) =
0.
Por otra parte, de la definicion de B(s), el inciso 4 de la proposici
on 3.9 y la identidad de la
proposici
B (s) = T (s) N (s) + T (s) N (s)
= k(s)(N (s) N (s)) + T (s) N (s)
= T (s) N (s)
de modo que B (s) tambien es perpendicular a T (s), es decir T (s) B (s) = 0.

Por tanto, dado que la terna {T (s), N (s), B(s)} es una base (ortonormal) de R3 , entonces existen
, , R tales que
B (s) = T (s) + N (s) + B(s)
J. P
aez
134

de donde obtenemos que
0 = T (s) B (s)
= T (s) (T (s) + N (s) + B(s))

=
y
0 = B(s) B (s)
= B(s) (T (s) + N (s) + B(s))

=
y por lo tanto que

B (s) = N (s)
que es lo deseabamos demostrar.
Como habamos mencionado, con base en la afirmacion de la proposici
on anterior, definimos el
3
concepto de torsi
on para curvas suaves contenidas en R , y que desde un punto de vista geometrico,
se interpreta como una medida de que tanto se tuerce una curva (y consecuentemente que tanto
tiende a salirse de un plano, a diferencia de lo que sucede con la curvatura, que puede curvarse
sin salirse de este).
Definici
on por longitud de arco de una curva suave
3
C R . Si para s I se tiene que B (s) existe, definimos la torsi
on de la curva C en el punto
(s), que denotamos por (s), como el n
umero real tal que
B (s) = (s)N (s)
El uso del signo negativo en la definicion anterior no tiene ning
un significado especfico y obedece
s
olo a razones de caracter hist
orico (al parecer, as se us
o desde que se introdujo!).
Para ilustrar este concepto, calcularemos la torsi
on de la helice del ejemplo 3.24 aprovechando
los calculos que ah mismo hicimos.
Ejemplo 3.28 Sea C R3 la helice del ejemplo 3.24 y su parametrizaci
on por longitud de arco
(s) = (cos(s/ 2), sen(s/ 2), s/ 2)
De ese mismo ejemplo sabemos que

N (s) = cos(s/ 2), sen(s/ 2), 0
de modo que
1
B(s) = sen(s/ 2), cos(s/ 2), 1
2
B (s) =
y por tanto tenemos que
1
cos(s/ 2), sen(s/ 2), 0
2
(s) =
1
2
para toda s R.
135
J. P
aez

on y completar las expresiones dadas en las proposici
on 3.25 y la
definicion 3.27, daremos una expresi
on del vector N (s) para el caso de curvas suaves en R3 . Como
hemos venido mencionando, los vectores {T (s), N (s), B(s)} forman una base (ortonormal) de R3 y
por esta simple raz
on el vector N (s) siempre se puede expresar como una combinaci
on lineal de
estos.
Lo m
as interesante es que en realidad el vector N (s) s
olo se escribe como combinaci
on lineal
de los vectores T (s) y B(s), y que los coeficientes de esta combinaci
on lineal est
an dados por k(s)
y (s), respectivamente. Este hecho es lo que probaremos en la siguiente
Proposici
suave C R3 . Si para s I se tiene que N (s) existe entonces
N (s) = k(s)T (s) + (s)B(s)
Demostraci
on. De la definicion del vector B(s), y de acuerdo con la regla de la mano derecha
del producto vectorial, sabemos que
N (s) = B(s) T (s)
y por la regla de derivaci
on del producto vectorial (inciso (4) de la proposici
on 3.9), tenemos que
N (s) = B (s) T (s) + B(s) T (s)
de modo que, sustituyendo las identidades de la proposici
on 3.25 y la definicion 3.27, obtenemos
que
N (s) = B (s) T (s) + B(s) T (s)
= ( (s)N (s)) T (s) + B(s) (k(s)N (s))
= k(s)(N (s) B(s)) + (s)(T (s) N (s))
= k(s)T (s) + (s)B(s)
Las identidades
T (s) =
k(s)N (s)
N (s) = k(s)T (s)
B (s) =
+ (s)B(s)
(s)N (s)
son conocidas como las F

ormulas de Frenet-Serret 4 y tienen importantes aplicaciones en la cinem
atica.
4
Jean Frederic Frenet (Perigueux, Francia, 7 de febrero de 1816 - Perigueux, Francia, 12 de junio de 1900), fue un
famoso matem
atico frances que introdujo la Teora de Curvas junto a Joseph Serret.
Joseph Alfred Serret (Pars, Francia, 30 de agosto de 1819 - Versalles, Francia, 2 de marzo de 1885), m
as conocido
como Joseph Serret, fue un matem
atico frances famoso por desarrollar junto a Jean Frenet la Teora de Curvas.
(Fuente: Wikipedia)
J. P
aez
136
3.5. Derivada y movimiento
3.5
Derivada y movimiento
Para concluir este captulo, mostraremos algunas conclusiones importantes que se pueden obtener
cuando a una funci
on : I R Rn se le interpreta como una forma de describir el movimiento
de un objeto.
Como ya habamos mencionado anteriormente, bajo esta interpretacion se tiene entonces que
(t) y (t) representan la velocidad y la aceleraci
on de dicho objeto, y r(t) = k (t)k su rapidez,
todas ellas al tiempo t.
Un primer resultado importante que abordaremos es aquel que nos dice cu
ales son las componentes de la aceleraci
on en dos direcciones b
asicas del movimiento descrito por : la direcci
on
tangente y la direcci
on normal a este movimiento.
Como vimos en las secciones anteriores, la direcci
on tangente nos la proporciona el vector
(t) de tal forma que, si hacemos (bajo el supuesto de que (t) 6= 0 para toda t I)
(t)
k (t)k
(t)
=
r(t)
T (t) =
(3.7)
entonces T (t) es un vector en la direcci

on tangente cuya norma es constante uno, y por el
problema 10 tendremos que T (t) es perpendicular a T (t) de modo que T (t) nos proporcionara la
direcci
on normal al movimiento.
De esta forma, si T (t) 6=
0, hacemos
N (t) =
T (t)
kT (t)k
y bajo todos los supuestos anteriores, lo que mostraremos en la siguiente proposici

on ser
a la forma
explcita en que (t) se expresa como combinaci
on (lineal) de los vectores T (t) y N (t).
Proposici
on 3.30 Sea : I R Rn tal que T (t) existe para toda t I. Si T (t) 6= 0 entonces
(t) = r (t)T (t) + r 2 (t)k(t)N (t)
(3.8)
en donde k(t) es la curvatura (de la curva descrita por ) en el punto (t).

Demostraci
on. Por la identidad 3.7 tenemos que
(t) = r(t)T (t)
de tal forma que, usando la regla de derivacion del inciso 2 de la proposici
(t) = r (t)T (t) + r(t)T (t)

T (t)
= r (t)T (t) + r(t) T (t)
kT (t)k

= r (t)T (t) + r(t) T (t) N (t)
y por el inciso (a) del problema 28, tenemos que
(t) = r (t)T (t) + r 2 (t)k(t)N (t)

137
J. P
aez
La identidad 3.8 amerita algunos comentarios. El primero de ellos es que si la rapidez de un

objeto es constante, entonces r (t) = 0 y por lo tanto la magnitud de la componente tangencial de su
aceleraci
on es cero, lo que significa que esta u
ltima act
ua s
olo en la direcci
on normal al movimiento,
hecho que ya habamos mencionado cuando tratamos con parametrizaciones por longitud de arco
y el tema de la curvatura.
El segundo comentario es acerca de la magnitud de la componente normal de la aceleraci
on, la
cual es igual al cuadrado de la rapidez del objeto multiplicado por la curvatura de la curva que este
describe. Como seguramente el lector ya se ha dado cuenta, esto explica por que un autom
ovil se
vuelca cuando se toma una curva muy cerrada (curvatura grande) a una rapidez tambien muy
grande.
Lo siguiente que haremos, ser
a mostrar un par de propiedades que deben satisfacer aquellos
objetos (como por ejemplo un planeta o un cometa) que se mueven bajo la influencia de la gravedad
de un objeto de masa muy grande (como por ejemplo una estrella).
Para ello, primero recordaremos la Ley de la Gravitaci
on Universal formulada por Newton, en
la que se establece cu
al es la fuerza ejercida entre dos cuerpos de masas m1 y m2 separados por
una distancia r.
Ley de la Gravitacion Universal

La magnitud F de la fuerza ejercida entre dos cuerpos de masas m1 y m2 que est
an
separados por una distancia r, es directamente proporcional al producto de sus masas e
inversamente proporcional al cuadrado de su distancia, es decir que
F =G
m1 m2
r2
La fuerza F (cuya magnitud es F ) ejercida entre ambos cuerpos act

ua en la direcci
on
de la lnea que los une. El n
umero G es conocido como la constante de la Gravitaci
on
Universal.
Notese que, si el centro de masa de cada uno de los cuerpos de masa m1 y m2 est
a ubicado en
el punto x
1 y x
2 , respectivamente, y suponemos que m2 > m1 , entonces la fuerza de atracci
on F
que ejerce el objeto de masa m2 sobre el objeto de masa m1 estar
a dada por
F = G
m1 m2
k
x2 x
1 k3
(
x2 x
1 )
(3.9)
Otra ley de la fsica de la que tambien echaremos mano, es la Segunda ley del movimiento
(igualmente formulada por Newton) la cual establece que, si un objeto de masa m se mueve debido
a la accion de un campo de fuerzas (en el caso que analizaremos, el campo de fuerzas gravitatorias
determinadas por una estrella (o sol) de masa M ), entonces la fuerza ejercida sobre el objeto
(en la posici
on que este tenga en cada instante t de su movimiento) tambien se puede obtener
multiplicando la masa del objeto por su aceleraci
on en dicho instante.
Es decir, si : I R R3 es la funcion que nos asocia la posici
on del objeto (de su centro de
masa, para ser m

as exactos) en cada instante t, y denotamos por F ((t)) la fuerza ejercida sobre
este en la posici
on (t), entonces
F ((t)) = ma(t)
= m (t)
J. P
aez
138
Lo que probaremos en la siguiente proposici

on ser
a que, si un objeto se mueve bajo la acci
on
de un campo de fuerzas como el que describimos anterioremente, entonces dicho movimiento necesariamente se tiene que llevar a cabo sobre un plano (fijo). Este hecho es importante para probar
la Primera Ley de Kepler, la cual establece que la orbita (o curva) descrita por el objeto es una
elipse5 .
Proposici
on 3.31 Si un objeto de masa m se mueve debido a la acci
on de un campo de fuerzas
gravitatorias (determinadas por otro objeto de masa M que est
a fijo) entonces el movimiento del
primer objeto se lleva a cabo sobre un plano fijo (al que tambien pertenece el objeto de masa M ).
Demostraci
on. Fijemos un sistema cartesiano cuyo origen se encuentre en el centro de masa del
objeto de masa M , y sea : I R R3 la funcion que nos asocia la posici
on del centro de masa
del objeto de masa m en cada instante t. Mostraremos que el producto vectorial
(t) (t)
no depende de t, es decir, que es un vector constante c, de donde el movimiento descrito por se
llevar
a a cabo en el plano que es perpendicular a este vector. Para ello, derivaremos este producto
y mostraremos que dicha derivada es el vector 0 para toda t I.
Primero notemos que, por la Ley de Gravitacion Universal y de acuerdo con la identidad 3.9,
dado que el origen de nuestro sistema coordenado est
a ubicado en el centro de masa del segundo
objeto, la fuerza ejercida por este en cada posici
on (t) est
a dada por
mM
(t)
F ((t)) = G
k(t)k3
Por otra parte, y de acuerdo con la segunda ley del movimiento, tenemos que
F ((t)) = m (t)
de tal forma que de estas dos identidades, concluimos que (t) y (t) son vectores paralelos y por
tanto que
(t) (t) = 0
para toda t I.
Ahora, derivando el producto vectorial ( )(t) = (t) (t), se tiene que
( ) (t) = (t) (t) + (t) (t)
= 0
lo que significa que
(t) (t) = c
(3.10)
para toda t I.
Para concluir esta breve secci
on, y como una continuaci
on del an
alisis del movimiento de nuestro
objeto de masa m (debido a la acci
on del campo gravitatorio de un segundo objeto de masa M ),
desarrollaremos todo lo indispensable para probar lo que se conoce como la Segunda Ley de Kepler.
Para ello, y dando por cierto que dicho movimiento se realiza en un plano, vamos a establecer
un sistema cartesiano XY Z de tal forma que la curva descrita por el objeto este contenida en el
5
Para los interesados en la prueba de las leyes de Kepler, se pueden concultar en [3].
139
J. P
aez
plano XY . Daremos tambien como un hecho que la trayectoria seguida es una curva cerrada que
rodea al origen (de hecho, una elipse, como mencionamos p
arrafos arriba).
Lo importante de los supuestos anteriores es que, si recurrimos a las coordenadas polares (, )
para describir la posici
on del objeto, y escribimos a su coordenada como una funcion del angulo
(es decir que = f ()), entonces el
area A encerrada por la curva descrita y dos semirectas con
angulos 1 y 2 (1 < 2 ) (ver figura 3.11), est
a dada por la expresi
on
1
A=
2
Z2
f 2 ()d
Y
b
= f ()
b
2
1
Figura 3.11: La region A encerrada por la curva descrita por sus coordenadas polares (, ), en donde
= f (), y las semirectas con
angulos 1 y 2 (1 < 2 ).
Con base en lo anterior, podemos formular la Segunda Ley de Kepler en los siguientes terminos:
si (t) es la funci
on que nos da el
angulo del vector de posici
on al tiempo t, y
1
A() =
2
f 2 (u)du
(3.11)
es la funcion del
angulo que nos da el area barrida a partir de un angulo fijo 0 , entonces la
funcion (A )(t) = A((t)) tiene raz
on de cambio constante, es decir, que (A ) (t) es constante.
Dicho de manera menos tecnica, esto significa que el vector de posici
on de nuestro objeto barre
areas iguales en tiempos iguales.
Proposici
on 3.32 Si un objeto de masa m se mueve debido a la acci
on de un campo de fuerzas
gravitatorias (determinadas por otro objeto de masa M ) entonces el movimiento del objeto de masa
m satisface la Segunda Ley de Kepler, es decir, el vector de posici
on del objeto barre a
reas iguales
en tiempos iguales.
Demostraci
on. Sean : I R R3 la funcion que asigna la posici
on del objeto (de masa m) al
tiempo t (y cuyo movimiento se realiza en el plano XY ), (t) la funcion que nos da el angulo del
vector de posici
on (t), y f () la funci
on que determina la coordenada del vector de posici
on en
terminos del angulo .
Si ahora definimos
u
() = (cos(), sen(), 0)
tendremos que (t) (en coordenadas cartesianas) estar
a dada por
(t) = f ((t))
u((t))
J. P
aez
140
3.6. Problemas
de modo que
(t) = f ((t))
u ((t)) (t) + f ((t)) (t)
u((t))
Si ahora sustituimos las dos u
ltimas identidades en la expresi
c = (t) (t)
= (f ((t))
u((t))) (f ((t))
u ((t)) (t) + f ((t)) (t)
u((t)))
= (f ((t))
u((t))) (f ((t))
u ((t)) (t)) + (f ((t))
u((t))) (f ((t)) (t)
u((t)))
= f 2 ((t)) (t)(
u((t)) u
((t)))
y por tanto, dado que

u
((t)) u
((t))) = (cos((t)), sen((t)), 0) ( sen((t)), cos((t)), 0)
= (0, 0, 1)
para toda t, deducimos que

k
ck = f 2 ((t)) (t)(
u((t)) u
((t)))

= f 2 ((t)) (t) u
((t)) u
((t))
= f 2 ((t)) (t)

(t) =
k
ck
f 2 ((t))
Por otra parte, por la regla de la cadena (para funciones de R en R) y el Teorema Fundamental
del C
alculo, concluimos que
(A ) (t) = A ((t)) (t)

k
ck
1 2
f
((t))
=
2
f 2 ((t))
k
ck
=
2
es decir, que (A ) (t) es constante.
Si la fuerza F que se ejerce sobre el objeto en la posici
on (t) no es de tipo gravitatorio, sino
que es de la forma F ((t)) = (t)(t) (donde (t) es un escalar que depende de t), las dos u
ltimas
proposiciones se siguen cumpliendo. Se dice que estos campos son de tipo central y dejamos
como un problema al lector realizar las pruebas correspondientes.
3.6
Problemas
1. Sea R R2 la recta cuya ecuaci

on cartesiana es ax + by + c = 0 (con a2 + b2 > 0). Muestre
que:
(a) si x
0 = (x0 , y0 ) y x
1 = (x1 , y1 ) son dos puntos diferentes que pertenecen a R, entonces
la funci
on : R R2 dada por
(t) = x
0 + t(
x1 x
0 )
es una parametrizacion de R.
141
J. P
aez
3.6. Problemas
(b) si x
0 R y u
= (u1 , u2 ) 6=
0 es un vector paralelo a la recta R (es decir, que au1 + bu2 =
0), entonces la funci
on : R R2 dada por
(t) = x
0 + t
u
2. Sea R R3 la recta determinada por la intersecci
on de los planos ax + by + cz + d = 0 y
a
x + by + cz + d = 0. Muestre que:
(a) si x
0 = (x0 , y0 , z0 ) y x
1 = (x1 , y1 , z1 ) son dos puntos diferentes que pertenecen a R,
entonces la funci
on : R R3 dada por
(t) = x
0 + t(
x1 x
0 )
(b) si x
0 R y u
= (u1 , u2 , u3 ) 6= 0 es un vector paralelo a la recta R (es decir, que
au1 + bu2 + cu3 = 0 y a
u1 + bu2 + cu3 = 0), entonces la funcion : R R3 dada por
(t) = x
0 + t
u
3. Sean x
0 , x
1 Rn dos puntos diferentes y u
6= 0 Rn , con n > 3.
(a) como se define, por medio de ecuaciones cartesianas, a la recta que pasa por los puntos
x
0 y x
1 Rn ?
(b) como se define, por medio de ecuaciones cartesianas, a la recta en la direcci

on del vector
u
que pasa por el punto x
0 ?
(c) como definira, sin usar ecuaciones cartesianas, a la recta que pasa por los puntos x
0
yx
1 , y a la recta que pasa por el punto x
0 que est
a en la direcci
on determinada por el
vector u
? (los dos problemas anteriores le pueden dar una pista).
4. Sobre la parte exterior de una circunferencia fija de radio a rueda (sin resbalar) otra circunferencia de radio b. Encuentre una funcion de R en R2 que describa el movimiento de un
punto que se encuentre en la circunferencia exterior.
on 3.9 usando los resultados que se indican en el texto, y despues sin usar
la proposici
on 3.8.
on 3.10 sin usar funciones coordenadas y la proposici
on 3.8.
7. Muestre que la curva descrita por la funcion (t) = (sen(2t), 2 sen2 (t), 2 cos(t)) (t R)
pertenece a una esfera con centro en el origen. Calcule su rapidez y muestre que la proyecci
on
en el plano XY de su velocidad tiene norma constante.
8. Sea f : I R R y (t) = (t, f (t)) parametrizacion de la gr
afica de f (Gf ). Pruebe que:
(a) si f es derivable en t0 I entonces la parametrizacion tambien es derivable en t0 y
adem
as (t0 ) = (1, f (t0 ))
J. P
aez
142
3.6. Problemas
(b) la recta tangente a Gf en el punto (t, f (t0 )) es una parametrizacion de la misma recta
(tangente) dada por la ecuaci
on y = f (t0 )(x t0 ) + f (t0 )
9. Sea : I R Rn y t0 I. Pruebe que las siguientes afirmaciones son equivalentes:
(a) la funci
on es derivable en t0
(b) existe un vector l Rn tal que
lim
tt0
(t) ((t0 ) + (t t0 ) l)
=0
t t0
(interprete geometricamente este lmite)

(c) existe una funci
on lineal L : R Rn tal que
lim
tt0
(t) ((t0 ) + L (t t0 ))
=0
t t0
(identifique geometricamente al conjunto {(t0 ) + L (t t0 ) Rn | t R})

Muestre que, de la equivalencia entre los incisos (a) y (b) se concluye que l = (t0 ), de la
equivalencia entre los incisos (b) y (c) que L(1) = l, y de la equivalencia entre los incisos (c)
y (a) que (t0 ) = L(1).
10. Sea : I R Rn derivable. Pruebe que: k(t)k es constante si y s
olo si (t) (t) = 0
para toda t I. Interprete geometricamente.
11. Sea : I R Rn derivable y r(t) = k(t)k. Si r(t0 ) 6= 0 y r(t0 ) es un m
aximo o mnimo
local de r, pruebe que (t0 ) (t0 ) = 0. Interprete geometricamente.
12. Sea = (f, g) : [a, b] R R2 continua en el intervalo [a, b] y derivable en el intervalo (a, b)
tal que (t) 6=
0 para toda t (a, b). Pruebe que existen (a, b) y R tales que
(b) (a) = ()
13. Sea : [a, b] R Rn continua en el intervalo [a, b] y derivable en el intervalo (a, b). Pruebe
que existe (a, b) tal que
k(b) (a)k2 = (b a) () ((b) (a))
14. Sea : I R Rn .
(a) si existen x
0 , u
Rn tales que (t) = x
0 + t
u para toda t I pruebe que k (t)k es
constante.
(b) muestre con un ejemplo que el recproco de la afirmacion del inciso anterior es falsa.
(c) si existen x
0 , u
0 + t
u para toda t I, pruebe que (t) =
0 para
toda t I.
(d) si (t) =
0 para toda t I, pruebe que existen x
0 , u
0 + t
u para
toda t I.
143
J. P
aez
3.6. Problemas
(e) de un ejemplo en el que la funcion parametrice una recta y para la cual se satisfaga
que (t) 6=
0 para toda t I.
Interprete las afirmaciones de los incisos anteriores partiendo del hecho de que describe
el movimiento de un objeto.
15. Dada : [a, b] R Rn continua, con = (1 , . . . , n ). Defina
Z
(t)dt =
Z
1 (t)dt, . . . ,
n (t)dt
a
Pruebe que:
(a) si c = (c1 . . . , cn ) es un vector constante, entonces
(b)
Rb
a
c (t)dt = c
Z b
Z b

(t)dt
k(t)k dt

a
Rb
a
(t)dt
(sugerencia: use la desigualdad de Cauchy-Schwarz para probar que

(u)
b
a
Z b

(t)dt k(u)k
(t)dt

a
para toda u [a, b]; integre con respecto de u y use la identidad del primer inciso).
Rb
(c) si tiene derivada continua, entonces k(b) (a)k a k (t)k dt = l(). Interprete
geometricamente.
16. Considere las funciones (t) = (cos(t), sen(t)), t [0, /2], y (u) =
Pruebe que es una reparametrizacion de .
1u2
, 2u
1+u2 1+u2

, u [0, 1].
17. Sea : [a, b] R Rn una parametrizacion por longitud de arco de una curva C Rn .
(a) muestre que l() = b a
(b) muestre un ejemplo en el que la longitud de C no conincida con la longitud determinada
por (es decir, l()).
18. De un ejemplo de una curva C Rn y una parametrizacion por longitud de arco de esta, que
no se pueda obtener por el metodo seguido en la prueba de la proposici
on 3.19 (sugerencia:
observe que el dominio (I) de la reparametrizacion que se construye en la prueba de la
proposici
on 3.19 siempre es tal que 0 (I)).
19. Sea : I R Rn una parametrizacion por longitud de arco de una curva C Rn . Pruebe
que si C est
a contenida en una recta, entonces k(s) = 0 para toda s I. Esta afirmacion
contradice lo que se pide ejemplificar en el inciso (e) del problema 14? Justifique su respuesta.
20. Pruebe el recproco del problema anterior. Es decir, si C Rn es una curva suave y : I
R Rn es una parametrizacion por longitud de arco de C tal que k(s) = 0 para toda s I
entonces C est
a contenida en una recta.
J. P
aez
144
3.6. Problemas
21. Sea : I R Rn una parametrizacion por longitud de arco de una curva C Rn . Si T (s)
es el vector tangente unitario y (s, h) representa el angulo formado por los vectores T (s) y
T (s + h), pruebe que

(s, h)

k(s) = lim
h0
h
(sugerencia: use la ley de los cosenos).
22. Sea : I R R3 una parametrizacion por longitud de arco de una curva C R3 . Si B(s)
es el vector binormal unitario y (s, h) representa el angulo formado por B(s) y B(s + h),
pruebe que

(s, h)

(s) = lim
h0
h
23. Sea : I R R3 una parametrizacion por longitud de arco de una curva suave C R3 .
Si (s) 6=
0 para toda s I, pruebe que:
(s) =
[ (s) (s)] (s)

k (s)k2
24. Sea : I R R3 una parametrizacion por longitud de arco de una curva suave C R3 .
Si (s) = 0 para toda s I entonces C est
a contenida en un plano.
25. Sea : I R R3 una parametrizacion por longitud de arco de la curva suave C R3 .
Pruebe que, si la curvatura k(s) es constante (distinta de cero) y (s) = 0 para toda s I
entonces la curva descrita por es (o est
a contenida en) una circunferencia (sugerencia:
pruebe que el centro de curvatura en (s) es el mismo para toda s I usando la expresi
on
para N (s) probada en la proposici
on 3.29).
26. Sea : I R R2 una parametrizacion por longitud de arco de la curva suave C R2 .
Pruebe que, si la curvatura k(s) es constante (distinta de cero) en cada punto (s) entonces la
curva descrita por es (o est
a contenida en) una circunferencia (sugerencia: use el problema
anterior).
27. Sea : I R Rn una parametrizacion por longitud de arco de la curva suave C Rn .
Dado t0 R fijo, definimos : J R Rn , con J = {s R | t0 s I}, como
(s) = (t0 s). Pruebe que:
(a) es una parametrizacion por longitud de arco de C
(b) si T (s), T(s), N (s), N (s), k(s) y k(s)

son los vectores tangente unitario, normal unitario y
la curvatura, correspondientes a las parametrizaciones y , respectivamente, entonces
i) T(s) = T (t0 s)
(s) = N (t0 s)
ii) N
iii) k(s)
= k(t0 s)
para cada s J
(c) si n = 3 y B(s), B(s),

(s) y (s) son los vectores binormal unitario y la torsi
on, correspondientes a las parametrizaciones y , respectivamente, entonces
i) B(s)
= B(t0 s)
ii) (s) = (t0 s)
para cada s J
145
J. P
aez
3.6. Problemas
(d) si n = 3, se satisfacen las formulas de Frenet-Serret escribiendo sus elementos en terminos

de .
28. Sea : I R R3 una curva suave C R3 . Sea T (t) = (t)/ k (t)k y bajo el supuesto de
que T (t) 6=
0 para toda t I, hacemos N (t) = T (t)/ kT (t)k y B(t) = T (t) N (t). Pruebe
que:
(a) si k(t)
= kT (t)k entonces k(t) = k(t)/
k (t)k (donde k(t) es la curvatura de C en el
punto (t))
(b) B (t) B(t) = 0 = B (t) T (t)
(c) B (t) es un m
ultiplo escalar de N (t)
(d) si denotamos por

(t) al n
umero (del inciso anterior) tal que B (t) =
(t)N (t), pruebe
que (t) = (t)/ k (t)k (donde (t) es la torsi

on de C en el punto (t))
(e) N (t) = k(t)T (t) + (t)B(t)

29. Sea : I R Rn una curva suave. Pruebe que la curvatura k en cada punto (t) est
a
dada por:
1/2

k (t)k2 k (t)k2 ( (t) (t))2
k (t)k3
30. Sea : I R R3 una curva suave tal que (t) 6= 0 para toda t I. Pruebe que la
curvatura k y la torsi
on en cada punto (t) est
a dada por:
i) k =
k (t) (t)k
k (t)k3
ii) =
[ (t) (t)] (t)

k (t) (t)k2
31. Sea : I R R3 una curva suave. Pruebe que si la curvatura k es constante (distinta
de cero) y la torsi
on es cero en cada punto (t) entonces la curva descrita por es (o est
a
contenida en) una circunferencia.
32. Sea f : [a, b] R una funci
on dos veces derivable. Pruebe que la curvatura en el punto
(x, f (x)), de la gr
afica de f , est
a dada por
k(x) = h
|f (x)|
1 + (f (x))2
i3/2
33. Sea (t) = (a cos(t), a sen(t), bt), t R

(a) calcule la parametrizacion por longitud de arco de esta curva
(b) calcule los vectores T (s), N (s) y B(s) en cada punto de esta curva
(c) calcule la curvatura, el radio de curvatura y la torsi
on en cada punto de esta curva
34. Un objeto gira (en el sentido de las manecillas del reloj) sobre una circunferencia centrada en
el origen y de radio
rapidez constante v. Si el objeto se desprende de la circunferencia
R con
anto tiempo intersecta al eje Y ? Cu
al
en el punto (R/ 2, R/ 2), en que punto y en cu
debera ser la rapidez del objeto sobre la circunferencia para que alcance el mismo punto en
la mitad del tiempo?
J. P
aez
146
3.6. Problemas
35. Un rat
on se mueve con rapidez constante v sobre una circunferencia de radio R y un gato,
tambien con rapidez constante v, persigue al rat
on (empezando desde el centro de la circunferencia) de tal forma que el rat
on, el gato y el centro de la circunferencia siempre son
coliniales. Alcanza el gato al rat
on? en que punto? en que tiempo?
36. La posici
on (en R3 ) de un objeto de masa m est
a dada por la funcion (t). Si la fuerza F
que se ejerce sobre el objeto en la posici
on (t) (la cual produce su movimiento) es tal que
F ((t)) = (t)(t) (donde (t) es un escalar que depende de t), pruebe que:
(a) el objeto se mueve sobre un plano (sugerencia: considere el producto (t) (t) y use
la segunda ley de Newton).
(b) suponiendo que la curva descrita es cerrada, pruebe que el movimiento del objeto satisface la Segunda Ley de Kepler (sugerencia: proceda como en la prueba de la proposici
on
3.32).
147
J. P
aez
J. P
aez
148
3.6. Problemas
Captulo 4
La derivada de funciones de Rn en R
El contenido de este captulo ser
a sin duda el primero en el que apareceran conceptos realmente
novedosos para el lector. Y aun y cuando los primeros conceptos de derivacion que definiremos
para este tipo de funciones son muy parecidos al concepto de derivada de funciones de R en R,
la definicion general de la derivada de funciones de Rn en R abrira un camino hacia una vision m
as
general de este concepto.
Antes de iniciar nuestro recorrido por estos temas, vamos a revisar algunos aspectos relacionados
con los conjuntos en donde se encuentran las variables de las funciones con las que vamos a trabajar,
y la relaci
on entre las varias representaciones que podemos hacer de estos por medio del conjunto
Rn .
4.1
Un interludio de Algebra
Lineal
Como vimos en el captulo 1, los objetos matem

aticos que sirven para representar a las variables
(independientes o dependientes) de las funciones que nos ocupan, pertenecen a conjuntos que suelen
estar dotados de una estructura algebraica que hacen de ellos un cierto tipo de espacio, y que se
conocen con el nombre de espacios vectoriales de dimensi
on finita sobre los n
umeros reales.
Como ya tambien vimos, una de las caractersticas m
as importantes de este tipo de espacios
con el que vamos a trabajar, y que por ahora denotaremos en general con la letra V , es que siempre
hay varias maneras de elegir una coleccion finita de elementos de V , digamos {
v1 , . . . , vn }, con la
propiedad de que para cualquier otro elemento v V existen 1 , . . . , n R, u
nicos, tales que
v = 1 v1 + + n vn
Como mencionamos en su momento (y como seguramente el lector ya lo sabe), este tipo de
colecciones reciben el nombre de base de V , y la propiedad que las define es la que permite identificar al conjunto V con el conjunto Rn . Esta identificaci
on de V con Rn tiene la ventaja de
que hace corresponder adecuadamente la estructura algebraica de V con la estructura algebraica
que definimos para Rn , estructura que por cierto, convierte a Rn en un espacio vectorial!
Ademas de lo anterior, en el captulo 1 tambien vimos que algunos tipos especficos de espacios
vectoriales, como es el caso de las flechas (del plano o el espacio) que parten de un punto fijo,
est
an dotados de estructuras geometricas (tales como el concepto de distancia o de angulo) las
cuales pudimos traer a Rn , y consecuentemente a cualquier otro espacio vectorial que se pueda
identificar con este.
Observemos que si {
v1 , . . . , vn } es una base del espacio vectorial V , la n-ada con la que se
identifica al vector vi es aquella que tiene casi todas sus coordenadas 0, salvo por la i-esima, que
149
Captulo 4. La derivada de funciones de Rn en R
4.1. Un interludio de Algebra

Lineal
deber
a ser 1; a esta n-ada la denotaremos por ei , es decir que
ei := (0, . . . , 0, 1, 0, . . . , 0)
en donde el 1 est
a en la coordenada i. Como seguramente el lector ya sabra (y si no lo podr
a probar
muy facilmente), la colecci
on {
e1 , . . . , en } es una base para Rn y se le conoce con el nombre de base
can
onica.
De acuerdo con los conceptos de magnitud (norma) y de angulo (producto punto) que definimos
en el captulo 1, todos los elementos de esta base tienen magnitud 1 y son mutuamente perpendiculares, es decir k
ei k = 1 para cada i {1, . . . , n} y ei ej = 0 para cada i, j {1, . . . , n}, con i 6= j,
o lo que es lo mismo
si i = j
1
ei ej =
0
si i 6= j
para cada i, j {1, . . . , n}. En general, cuando los elementos de una base de un espacio vectorial
cumplen estas dos caractersticas, decimos que esta es ortonormal.
Como ya lo habamos mencionado en el captulo 1, este tipo de bases son las que se utilizan
para construir (en el caso del plano o del espacio) un sistema de referencia cartesiano y es por esta
raz
on que en estos casos, cuando se pueda dibujar los vectores (o flechas) que representen a una
base de este tipo, habra que hacerlo con estas caractersticas (mutuamente perpendiculares, y de
la misma longitud). No sin cierto abuso de notaci
on, usaremos los mismos e1 , . . . , en para nombrar
a los vectores (o flechas) que representen geometricamente a la base can
onica de Rn .
Una vez establecidos los conceptos y notaciones anteriores, la situaci
on principal que deseamos
abordar en esta secci
on es la siguiente: supongamos que la variable independiente de una cierta
funcion pertenece a un espacio vectorial V , y que las colecciones {
v1 , . . . , vn } V y {
v1 , . . . , vn }
V , ambas, son bases de V .
Si para identificar al espacio V con Rn lo hacemos atraves de la base {
v1 , . . . , vn } (en cuyo caso
cada vector vi se correspondera con la n-ada ei ), entonces usando esta misma manera de identificar
a V con Rn , cada vector vi se correspondera con alguna n-ada, que denotaremos por ei , y se tendra
a una base (o sistema coordenado) de Rn (afirmacion que
que la coleccion de n-adas {
e1 , . . . , en } ser
seguramente el lector ya habra probado en su curso de Algebra

Lineal).
a una base
Algo que es importante destacar es que, aun y cuando la coleccion {
e1 , . . . , en } ser
n
de R , esta no tiene que ser necesariamente ortonormal, aunque para los fines de este texto, suponan de tal manera que la
dremos que las colecciones {
v1 , . . . , vn } V y {
v1 , . . . , vn } V se elegir
a una base ortonormal (o sistema coordenado cartesiano) de Rn .

coleccion {
e1 , . . . , en } siempre ser
on que
De esta forma, dadas las colecciones {
v1 , . . . , vn } V y {
v1 , . . . , vn } V , la situaci
tendremos (como ya lo habamos mencionado desde el captulo 1) es que habra dos formas diferentes
de identificar al espacio vectorial V con el conjunto (o espacio vectorial) Rn , doble identificaci
on
que para nosotros se traducira en lo siguiente: as como para cada v V existiran dos formas de
Rn
expresar a v como combinaci
on lineal de las bases {
v1 , . . . , vn } y {
v1 , . . . , vn }, para cada x
n
(pensando a R m
as como un representante del espacio vectorial V , que como un conjunto de
n-adas), consideraremos dos sistemas coordenados cartesianos en los cuales expresaremos a x
.
Es decir, un vector x
Rn tendra coordenadas (x1 , . . . , xn ) en el sistema coordenado cartesiano determinado por la base can
onica {
e1 , . . . , en }, y coordenadas (x1 , . . . , xn ) en el otro sistema
coordenado cartesiano determinado por la base ortonormal {
e1 , . . . , en }.
La figura 4.1 ilustra esta situaci
on para el caso particular del espacio vectorial V formado por
las flechas que parten de un punto fijo O, raz
on por la cual las bases {
e1 , e2 } y {
e1 , e2 } se fijan
en el mismo punto.
J. P
aez
150

Lineal
x1 e1
e 1
x1
e
2
x2
x2 e2
e2
e 2
e 1
b
e1
Figura 4.1: El vector x

y sus correspondientes coordenadas (x1 , x2 ) y (x1 , x2 ) en las bases ortonormales
{
e1 , e2 } y {
e1 , e2 }, respectivamente.
En virtud de lo anterior tendremos que una misma funcion f definida para los elementos de un
sunconjunto A del espacio vectorial V (y que en un abuso de lenguaje diremos que f est
a definida
n
para los elementos de un subconjunto A del espacio vectorial R ), esta se podr
a poner en terminos
de unas ciertas variables (o coordenadas) x1 , . . . , xn , o de otras variables (o coordenadas) x1 , . . . , xn .
Aun y cuando los conceptos de derivabilidad con los que vamos a trabajar en este captulo los
definiremos sin tener que recurrir a las coordenadas determinadas por alguna base, para efectos
de la realizaci
on de c
alculos especficos s ser
a necesario recurrir a alguna de estas, y lo que nos
proponemos en este captulo es dejar clara la relaci
on que existe entre los calculos realizados con
unas cooredenadas x1 , . . . , xn o con otras coordenadas x1 , . . . , xn .
Para alcanzar el objetivo anterior, empezaremos por establecer la relaci
on que existe entre dos
n
conjuntos de coordenadas (cartesianas) de un mismo elemento x
R .
Si, como dijimos antes, (x1 , . . . , xn ) son las coordenadas de x
en el sistema coordenado carte
siano determinado por la base can
onica {
e1 , . . . , en }, y (x1 , . . . , xn ) son otras coordenadas en un
sistema coordenado cartesiano determinado por una base ortonormal {
e1 , . . . , en }, nuestro objetivo
es mostrar c
omo se obtienen unas coordenadas a partir de las otras; es decir, si conocemos las
coordenadas (x1 , . . . , xn ), c
omo podemos obtener las coordenadas (x1 , . . . , xn ) y recprocamente, si
conocemos las coordenadas (x1 , . . . , xn ), como podemos obtener las coordenadas (x1 , . . . , xn ).
Como seguramente el lector ya lo sabra, cada uno de estos problemas es un problema de cambio
de coordenadas, y tambien sabra que se resuelve de la siguiente manera.
Rn en la base ortonormal
Supongamos primero que tenemos las coordenadas (x1 , . . . , xn ) de x
onica. Para ello,
{
e1 , . . . , en } y que deseamos conocer sus coordenadas (x1 , . . . , xn ) en la base can
bastara con saber cu
ales son las coordenadas de cada vector ei en la base can
onica {
e1 , . . . , en }
(informaci
on que es con la que se cuenta la mayora de las veces).
Si suponemos que

(i)
ei = a1 , . . . , a(i)
n
(i)
= a1 e1 + + a(i)
n
n e
para cada i {1, . . . , n}, entonces

x
= x1 e1 + + xn en

(1)
n +
= x1 a1 e1 + + a(1)
n e
151
J. P
aez

Lineal
..
.

(n)
e
+ xn a1 e1 + + a(n)
n
n

(1)
(n)
= a1 , . . . , a1
(x1 , . . . , xn )
e1 +
..
.

(n)
(x1 , . . . , xn )
en
+ a(1)
n , . . . , an
de donde concluimos que la i-esima coordenada del vector x

en la base can
onica estar
a dada por

(1)
(n)
(x1 , . . . , xn )
xi = ai , . . . , ai
para cada i {1, . . . , n}, o equivalentemente y escrito usando matrices, que

(1)
(1)
a1
an

..
..
x1 xn = x1 xn ...
.
.
(n)
(n)
a1
an
(4.1)
Como el lector se podr

a imaginar, para resolver el problema recproco (obtener las coordenadas
a suficiente con calcular las coordenadas
(x1 , . . . , xn ) a partir de las coordenadas (x1 , . . . , xn )), ser
de cada vector ei en el sistema cartesiano determinado por la base {
e1 , . . . , en }.
Es decir, si ahora

(i)
(i)
ei = b1 , . . . , bn
(i)
= b1 e1 + + b(i)
n
n e

x
= x1 e1 + + xn en

(1)
= x1 b1 e1 + + b(1)
n n +
..
.

(n)
(n)
+ xn b1 e1 + + bn en

(1)
(n)
= b1 , . . . , b1
(x1 , . . . , xn )
e1 +
..
.

(n)
(x1 , . . . , xn )
en
+ b(1)
,
.
.
.
,
b
n
n
a dada por
de donde concluimos que la i-esima coordenada del vector x
en la base {
e1 , . . . , en } estar

(1)
(n)
(x1 , . . . , xn )
xi = bi , . . . , bi
para cada i {1, . . . , n}, o lo que es lo mismo, escrito en forma

(1)
b
1.

x1 xn = x1 xn ..
(n)
b1
J. P
aez
152
matricial, que
(1)
bn
..
..
.
.
(n)
bn
(4.2)

Lineal
Si llamamos
(1)
an
..
.
(n)
an
(1)
..
.
bn
..
.
bn
a1
b1
..
M = .
(n)
b1
se prueba que:
(1)
..
.
a1
..
M = .
(n)
(1)
(n)
1. cada matriz M y M es la inversa una de la otra (M = M 1 ),

2. la inversa de cada una de ellas es su propia transpuesta (M 1 = M t ), y
3. ambas matrices tienen determinante 1
Notese que de las propiedades 1 y 2 se deduce que
(i)
(j)
bj = a i
(4.3)
para todas i, j {1, . . . , n}.

Las matrices que tienen las caractersticas anteriores son conocidas con el nombre de matrices
ortonormales (por razones que seguramente quedan claras), y si el lector aun no conoce la prueba
de estas afirmaciones, muy probablemente pronto las ver

a en su curso de Algebra
Lineal).
Resumiendo la discusion anterior,
y con base en las identidades 4.1, 4.2 y 4.3 concluimos que:
(i)
(i)
si cada vector ei tiene coordenadas a1 , . . . , an (i {1, . . . , n}) en el sistema determinado por

la base {
e1 , . . . , en }, y un vector x
tiene coordenadas (x1 , . . . , xn ) en el mismo sistema, entonces
an dadas
(en el sistema determinado por la base {
e1 , . . . , en }) est
las coordenadas (x1 , . . . , xn ) de x
por la identidad (escrita en forma matricial)
(1)
(n)
a1
a1

..
..
x1 xn = x1 xn ...
(4.4)
.
.
(1)
an
(n)
an

(i)
(i)
Analogamente, si cada vector ei tiene coordenadas b1 , . . . , bn (i {1, . . . , n}) en el sis-
tiene coordenadas (x1 , . . . , xn ) en el

tema determinado por la base {
e1 , . . . , en }, y un vector x
mismo sistema, entonces las coordenadas (x1 , . . . , xn ) de x
(en el sistema determinado por la base
{
e1 , . . . , en }) est
an dadas por la identidad (escrita en forma matricial)
(1)
(n)
b1
b1

..
..
(4.5)
x1 xn = x1 xn ...
.
.
(n)
(1)
bn bn
Notese que, de acuerdo con las identidades 4.3, tambien se tiene que
(1)
(1)
b1
bn

..
..
x1 xn = x1 xn ...
.
.
(n)
(n)
b1
bn
153
(4.6)
J. P
aez

Lineal

y
x1
xn
x1
(1)
a
1.
xn ..
(n)
a1
(1)
..
.
an
..
.
(n)
an
(4.7)
identidades que tambien nos ser

an muy u
tiles.
Por ahora nos ser
a suficiente con conocer las relaciones establecidas en 4.4, 4.5, 4.6 y 4.7, y para
concluir con esta secci
on, s
olo nos resta ilustrar la discusion anterior con un
Ejemplo 4.1 En el plano, una vez establecido un origen O, considere el sistema coordenado cartesiano determinado por dos vectores {
e1 , e2 } (y que por lo mismo tendremos que dibujar mutuamente perpendiculares y de la misma longitud), y el sistema cartesiano determinado por los vectores {
e , e
se obtiene de girar (en el sentido contrario a las manecillas del reloj)
}, en donde e
radianes al vector e1 , y e
se obtiene de girar (en el sentido contrario a las manecillas del reloj)
/2 radianes al vector e (ver figura 4.2).
cos()
sen()
e1
n(
se
sen()
e2
s(
cos()
n(
se
co
e2
co
s(
e1
Figura 4.2: Las bases ortonormales {

e1 , e2 } y {
e , e
} del ejemplo 4.1.
estos forman una base ortonorDe la manera de construir los vectores e y e
, sabemos que
mal y que sus coordenadas en el sistema determinado por {
e1 , e2 } son (cos(), sen()) para e , y
( sen(), cos()) para e
. Es decir, se tiene que
e = cos()
e1 + sen()
e2
e
(4.8)
= sen()
e1 + cos()
e2
De esta forma, si x
es un vector del plano que parte del punto O y que tiene coordenadas (x , y )
en el sistema coordenado determinado por {
e , e
}, de acuerdo con la identidad 4.1, las coordenadas
(x, y) de x
en el sistema coordenado determinado por la base {
e1 , e2 } estar
an dadas por la identidad
de matrices

cos() sen()
x y = x y
sen() cos()
es decir
x = cos()x sen()y
y = sen()x + cos()y
Recprocamente, si ahora observamos que

e1 = cos()
e sen()
e
e2 = sen()
e + cos()
e
J. P
aez
154
4.2. La derivada direccional
(identidades que podemos obtener despejando los vectores e1 y e2 de las identidades 4.8) de
acuerdo con la identidad 4.2, si (x, y) son las coordenadas de x
en el sistema coordenado determi
nado por la base {

e1 , e2 }, las coordenadas (x , y ) en el sistema coordenado determinado por {
e , e
}
estar
an dadas por la identidad de matrices
x y
cos() sen()
sen() cos()
o lo que es lo mismo, que

x = cos()x + sen()y
y = sen()x + cos()y
N
otese que en este ejemplo se confirma que las matrices
M=
cos() sen()
sen() cos()
M =
cos() sen()
sen() cos()
tienen las propiedades que habamos mencionado.
4.2
La derivada direccional
Antes de entrar de lleno en la definicion del concepto de derivada direccional, es importante mencionar que de aqu en adelante (salvo que se diga lo contrario) supondremos que las funciones con
las que trabajeremos est
an definidas sobre un conjunto abierto y conexo U Rn .
Sea pues, f : U Rn R y x
0 U . Recordemos que el concepto de derivacion de una funci
on
f de R en R en un punto x0 de su dominio, consiste b
asicamente en los siguientes pasos: calcular el
cambio de los valores de f en x y en x0 , es decir, calcular f (x) f (x0 ), en donde x 6= x0 ; calcular
el cambio que hay entre x y x0 es decir, calcular x x0 ; calcular la raz
on (o proporci
on)
entre estas dos cantidades, es decir
f (x) f (x0 )
;
x x0
y finalmente determinar si estas razones (o proporciones) tienen un valor lmite cuando la
variable x se aproxima (o tiende) al valor x0 .
Como seguramente el lector ya habra notado, este procedimiento no lo podemos copiar al caso
de las funciones que nos ocupan.
En efecto, si f : U Rn R y x
0 , x
U, x
6= x
0 , el cambio de los valores de la funcion en x
y
en x
0 (es decir, f (
x)f (
x0 )) y el cambio entre x
yx
0 , es decir, x
x
0 , son de naturaleza distinta;
mientras que la primera de estas cantidades es un n
umero real (f (
x) f (
x0 )), la otra (
xx
0 ) es
un vector, de tal forma que no tenemos una manera de calcular la raz
on (o proporci
on) entre
dichas cantidades.
Sin embargo, no todo est
a perdido y la idea original de derivada la podemos adecuar de
alguna manera al tipo de funciones que nos ocupa.
Dado que estamos suponiendo que U es un conjunto abierto, si x
0 U y u
es un vector fijo que
no sea el vector
0, los vectores de la forma x
=x
0 + h
u, con h R, tienen la peculariedad de seguir
perteneciendo a U si h es suficientemente peque
na, aunque cabe aclarar que esta peque
nez
de h tambien dependera de la magnitud del vector u
. m
as especficamente, sabemos que existe
155
J. P
aez
r > 0 tal que si k

xx
0 k < r entonces x
U , de modo que si tomamos x
=x
0 + h
u, este punto
pertenecera a U si
r > k
xx
0 k
= k
x0 + h
ux
0 k
= kh
uk
= |h| k
uk
es decir, si |h| < r/ k
uk.
Por otra parte, si observamos que
k
xx
0 k = |h| k
uk
vemos que la magnitud del cambio entre x
y x
0 est
a determinada tanto por h, como por la
magnitud del vector u
.
Por estas razones, si al tomar x
=x
0 +h
u pedimos que el vector u
tenga magnitud 1, lograremos
las siguientes ventajas: primera, que la pertenencia del vector x
al conjunto U s
olo dependera del
n
umero h, (bastara con que |h| < r para que x
=x
0 + h
u pertenezca a la bola Br (
x0 ), la que a
su vez est
a contenida en U ); y segunda, el cambio entre x
yx
0 (es decir el vector x
x
0 ) estar
a
completamente determinado por el n
umero h (no s
olo su magnitud! tambien su direcci
on!).
Con base en los supuestos anteriores, el cociente
f (
x0 + h
u) f (
x0 )
h
(4.9)
ser
a una medida de la raz
on (o proporci
on) entre el cambio de los valores de la funcion (en los
puntos x
0 + h
uyx
0 ) y el cambio entre dichos valores de la variable, el cual est
a determinado por
el n
umero h.
Aqu es importante enfatizar que los puntos sobre los cuales estamos evaluando a f (para
compararlos con su valor en x
0 ) est
an restringidos a aquellos que son de la forma x
0 + h
u, es
decir, s
olo estamos evaluando a f sobre los puntos que est
an en la recta que pasa por x
0 y cuya
direcci
on est
a determinada por el vector u
(y que adem
as se quedan contenidos en U !).
Por esta raz
on, si existe el lmite del cociente 4.9 cuando h tiende a 0, diremos que la funci
on
f es derivable en el punto x
0 en la direcci
on del vector u
, y al valor de este lmite le llamaremos la
derivada direccional de f en x
0 en la direcci
on del vector u
. Toda la discusion anterior la dejamos
plasmada en la siguiente
Definici
on 4.2 Sean f : U Rn R, x
0 U y u
Rn tal que k
uk = 1. Decimos que f es
derivable en el punto x
0 en la direcci
on del vector u
, si
f (
x0 + h
u) f (
x0 )
h0
h
lim
existe, en cuyo caso el valor de dicho lmite lo llamaremos la derivada direccional de f en x

0 en la
direcci
on de u
, y la denotaremos por Du f (
x0 ), es decir
f (
x0 + h
u) f (
x0 )
h0
h
Du f (
x0 ) := lim
J. P
aez
156
Aun y cuando en terminos generales este concepto de derivada es una medida de la raz
on
de cambio de la funci
on f sobre los puntos de la recta que pasa por x
0 y cuya direcci
on est
a
determinada por el vector u
, a semejanza de lo que sucede con las funciones de R en R, en algunos
casos dicha derivada tambien tiene una interpretacion geometrica importante.
Para el caso particular de R2 , si nos fijamos en la curva que obtenemos al intersecar la gr
afica de
f con el plano perpendicular al plano XY que contenga a la recta que mencionamos anteriormente
(ver figura 4.3), la derivada direccional de f en x
0 en la direcci
on de u
la podemos interpretar como
la pendiente de la recta tangente a dicha curva en el punto (
x0 , f (
x0 )).
f (
x0 )
u
x
0
Figura 4.3: En R2 , si intersecamos la grafica de f con el plano perpendicular al plano XY que contenga
a la recta que pasa por x
0 en la direcci
on de u
, obtenemos una curva, y la derivada Du f (
x0 ) la podemos
interpretar como la pendiente de la recta tangente a dicha curva en el punto (
x0 , f (
x0 )).
Sin duda lo siguiente que tendremos que hacer ser
a dar un ejemplo que ilustre este concepto, pero
antes de ello convendra hacer algunas observaciones importantes. Como el lector podr
a notar, en
la definicion que acabamos de dar no fue necesario recurrir a ning
un sistema coordenado especfico.
Por otra parte, como para hacer calculos especficos s ser
a necesario expresar a f en terminos de
algunas coordenadas, en el siguiente ejemplo no s
olo vamos a mostrar como se calcula la derivada
direccional de f en alg
un punto x
0 y en alguna direcci
on u
, sino que mostraremos que dichos
calculos son idependientes (cuando menos para este ejemplo especfico) del sistema coordenado que
usemos.
Ejemplo 4.3 Sea f : R2 R tal que, si un punto x
R2 tiene coordenadas (x, y) en la base
can
onica, entonces el valor de f en x
est
a dada por
f (
x) = f (x, y)
= x2 + y 2
yx
0 , u
R2 que en la base can
onica tienen coordenadas (x0 , y0 ) y (u1 , u2 ), respectivamente.
Primero vamos a calcular Du f (
x0 ). De acuerdo con la definici
on 4.2, tenemos que
f (
x0 + h
u) f (
x0 )
h0
h
f (x0 + hu1 , y0 + hu2 ) f (x0 , y0 )
= lim
h0
h
Du f (
x0 ) = lim
157
J. P
aez
(x0 + hu1 )2 + (y0 + hu2 )2 (x20 + y02 )

h0
h
2
2x0 hu1 + (hu1 ) + 2y0 hu2 + (hu2 )2
= lim
h0
h

= lim 2x0 u1 + 2y0 u2 + hu21 + hu22
= lim
h0
= 2(x0 u1 + y0 u2 )
Supongamos ahora que tenemos otro sistema coordenado determinado por una base {
e1 , e2 } tal
que el cambio de coordenadas de este sistema al sistema can
onico est
a dado por la matriz

a11 a12
M=
a21 a22
es decir, si un punto x
tiene coordenadas (x , y ) en la base {
e1 , e2 }, entonces sus coordenadas (x, y)
en la base can
onica estar
an dadas por

a11 a12
x y = x y M= x y
a21 a22
x = a11 x + a21 y
y = a12 x + a22 y
de tal forma que ahora el valor de f en x
, expresado en terminos de sus coordenadas (x , y ), estar
a
dado por
f (x , y ) = f (
x)
= f (x, y)
= x2 + y 2
= (a11 x + a21 y )2 + (a12 x + a22 y )2

= a211 + a212 (x )2 + 2(a11 a21 + a12 a22 )x y + a221 + a222 (y )2
Si ahora recordamos que la matriz de cambio de base M es tal que

1 0
= M M 1
0 1
= MMt

a11 a21
a11 a12
=
a12 a22
a21 a22
concluimos que a211 + a212 = 1 = a221 + a222 y que a11 a21 + a12 a22 = 0, de tal forma que
f (
x) = f (x , y )
= (x )2 + (y )2
No debera causar sorpresa al lector que las expresiones de f en terminos de las coordenadas
(x, y) y de las coordenadas (x , y ) sean an
alogas en este caso ya que, en terminos geometricos, f
J. P
aez
158
asigna a cada punto x

su norma al cuadrado (cantidad que se expresa de forma an
aloga en ambos
sistemas coordenados, en virtud de que estos son ortonormales).
De esta forma, si las coordenadas del punto x
0 y del vector u
en el sistema coordenado deterx0 )
an dadas por (x0 , y0 ) y (u1 , u2 ) respectivamente, al calcular Du f (
minado por la base {
e1 , e2 } est
usando la expresi
on de f en este sistema y repitiendo los c
alculos que hicimos al principio, obtendremos nuevamente que
Du f (
x0 ) = 2(x0 u1 + y0 u2 )
Lo que ahora mostraremos es que los dos valores que obtuvimos para Du f (
x0 ) usando la expresi
on de f en cada uno de los sistemas coordenados, coinciden. Para ello, recordemos que las
coordenadas del punto x
0 y del vector u
en ambos sistemas tambien satisfacen las identidades

x0 y0 = x0 y0 M
y
u1 u2
u1 u2
respectivamente, de tal forma que, usando la notaci

on del producto de matrices, obtenemos que

u1

2(x0 u1 + y0 u2 ) = 2 x0 y0
u2
t

u1 u2 M
=2
x0 y0 M

u1
t
= 2 x0 y0 (M M )
u2

u1
= 2 x0 y0 (M M 1 )
u2

u1
= 2 x0 y0
u2
= 2(x0 u1 + y0 u2 )
Aun y cuando lo que acabamos de hacer s

olo muestra para un ejemplo especfico que el valor de
Du f (
x0 ) no depende del sistema coordenado que usemos, parte del material que vamos a desarrollar
en este captulo ser
a u
til para probar que este concepto es, en general, independiente de dichos
sistemas.
Dada la similitud que existe entre el concepto de derivada direccional y el de derivada para
funciones de R en R, es de suponerse que muchas de las propiedades de esta u
ltima, las satisfaga
la primera.
Una de estas propiedades, y que en el caso real resulta ser muy importante, es el hecho de que
toda funci
on que sea derivable en un punto, tiene que ser continua en ese punto.
Dado que la derivada direccional Du f (
x0 ) s
olo toma en cuenta la variaci
on de la funcion sobre
la recta que pasa por x
0 en la direcci
on del vector u
, lo que podemos probar es que si dicha derivada
direccional existe entonces la funci
on, restringida a dicha recta, ser
a continua en el punto x
0 .
Este hecho lo dejamos plasmado en la siguiente proposici
on y su prueba la dejamos al lector.
Proposici
0 U y u
Rn tal que k
uk = 1. Si Du f (
x0 ) existe
entonces
lim f (
x0 + h
u) = f (
x0 )
h0
159
J. P
aez
Otras propiedades importantes de la derivada direccional son las relacionadas con la aritmetica
de las funciones. Nuevamente, de forma an
aloga a lo que sucede con las funciones de R en R,
adem
as de que dicha aritmetica preserva la existencia de la derivada direccional, las formulas de
derivacion que se obtienen resultaran ser muy u
tiles.
Proposici
on 4.5 Sean f, g : U Rn R, x
0 U , y u
Rn tal que k
uk = 1. Si Du f (
x0 ) y
Du g(
x0 ) existen entonces:
1. Du (f + g)(
x0 ) existe y adem
as
Du (f + g)(
x0 ) = Du f (
x0 ) + Du g(
x0 )
2. si R, Du (f (
x0 ) existe y adem
as
Du (f )(
x0 ) = Du f (
x0 )
3. Du (f g)(
x0 ) existe y adem
as
Du (f g)(
x0 ) = f (
x0 )Du g(
x0 ) + g(
x0 )Du f (
x0 )
4. si g es continua en x
0 y g(
x0 ) 6= 0, Du (f /g)(
x0 ) existe y adem
as
Du (f /g)(
x0 ) =
g(
x0 )Du f (
x0 ) f (
x0 )Du g(
x0 )
2
g (
x0 )
Aun y cuando la prueba de esta proposici

on tambien se deja al lector, es importante hacer un
comentario acerca de la hip
otesis de continuidad que se pide en el inciso 4.
En realidad, dicha hip
otesis se incluye para seguir garantizando la condici
on que nos impusimos
de que las funciones con las que vamos a trabajar a partir de este captulo, esten definidas sobre un
conjunto abierto. Notese que por el inciso (a) del problema 43 del captulo 2, y del hecho de que
el dominio de g sea el abierto U , podemos asegurar que la funcion f /g est
a definida en un abierto
que contiene al punto x
0 .
Para concluir con las propiedades de la derivada direccional relacionadas con las operaciones
entre funciones, formularemos en una proposici
on aparte, aquella que nos habla de la composici
on
de funciones.
El caso que va a resultar m
as interesante ser
a cuando compongamos a f con una funcion g de R
en R. Esta propiedad, que en realidad es una consecuencia de un resultado m
as general conocido
como la regla de la cadena (que probaremos m
as adelante), la dejamos plasmada en la siguiente
Proposici
0 U , u
Rn tal que k
uk = 1 y (a, b) R tal que
f (U ) (a, b). Si g : (a, b) R R es derivable en f (
x0 ) y Du f (
x0 ) existe entonces Du (g f )(
x0 )
existe y adem
as
Du (g f )(
x0 ) = g (f (
x0 ))Du f (
x0 )
Demostraci
on. De acuerdo con la definicion de Du (g f )(
x0 ), debemos probar que
g(f (
x0 + h
u)) g(f (
x0 ))
(g f )(
x0 + h
u) (g f )(
x0 )
= lim
h0
h0
h
h
lim
existe.
J. P
aez
160
Como seguramente el lector recordara de la correspondiente prueba para el caso de funciones

de R en R, si hacemos
kh = f (
x0 + h
u) f (
x0 )
el lmite anterior se podra escribir como
g(f (
x0 ) + kh ) g(f (
x0 ))
g(f (
x0 + h
u)) g(f (
x0 ))
= lim
h0
h0
h
h
lim
de tal forma que si kh 6= 0 entonces

g(f (
x0 ) + kh ) g(f (
x0 ))
g(f (
x0 + h
u)) g(f (
x0 ))
= lim
h0
h0
h
h

g(f (
x0 ) + kh ) g(f (
x0 ))
= lim
h0
kh

g(f (
x0 ) + kh ) g(f (
x0 ))
= lim
h0
kh
lim

kh
h

f (
x0 + h
u) f (
x0 )
Si ahora notamos que, por la proposici

on 4.4, se tiene que kh 0 cuando h 0 puesto que
lim kh = lim (f (
x0 + h
u) f (
x0 ))
h0
h0
=0
entonces
g(f (
x0 ) + kh ) g(f (
x0 ))
= g (f (
x0 ))
h0
kh
lim
y obtendramos el resultado deseado.

Como seguramente el lector ya sabe, el problema con el argumento anterior es que este s
olo
funciona si kh 6= 0, y como tambien recordara, la soluci
on a este problema est
a en definir una
funcion auxiliar.
Definimos : (r, r) R R, con r > 0 tal que Br (
x0 ) U , de la siguiente manera:
g(f (
x0 )+kh )g(f (
x0 ))
si kh 6= 0
kh
(h) =
g (f (
x0 ))
si kh = 0
Lo primero que es importante observar (y que es muy facil de verificar) es que
g(f (
x0 ) + kh ) g(f (
x0 ))
f (
x0 + h
u) f (
x0 )
= (h)
h
h
para toda h (r, r), h 6= 0, de tal forma que nuestro problema se reduce a demostrar que
lim (h) = g (f (
x0 ))
h0
Sea entonces > 0; dado que g es derivable en f (

x0 ) sabemos que existe > 0 tal que si
|k| < (y f (
x0 ) + k (a, b)) entonces

g(f (
x0 ) + k) g(f (
x0 ))

g (f (
x0 )) <
(4.10)

k
161
J. P
aez
Por otra parte, por la proposici

on 4.4 sabemos que
lim kh = lim (f (
x0 + h
u) f (
x0 ))
h0
h0
=0
y por tanto existe 0 < r tal que si |h| < entonces |kh | < . De esta forma, si |h| < ,
independientemente de que kh 6= 0 o kh = 0, por la desigualdad 4.10 o por el valor de cuando
kh = 0, en ambos casos se tiene que

(h) g (f (
x0 )) <
y por lo tanto que
lim (h) = g (f (
x0 ))
h0
con lo cual concluimos la prueba.

Terminamos esta serie de proposiciones con una en la que se establece una propiedad que bien
podra interpretarse como la versi
on del Teorema del Valor Medio para la derivada direccional.
Su formulaci
on es la siguiente, en donde recordamos que [
a, b] representa al segmento de recta
que une al punto a

con el punto b.
h i
Proposici
on 4.7 Sean f : U Rn R, a
, b U , a
6= b, tales que a
, b U y u
=

h i

b a
/ b a
Rn . Si Du f (
x) existe para toda x
a
, b entonces existe 0, b a
tal
que si = a
+ u
, se cumple que

f (b) f (
a) = b a
Du f
Demostraci
on. Como es de suponerse, la prueba hde esta proposici
on se basa en el Teorema del
i

a + t
u).
R R como g(t) = f (
Valor Medio para funciones R en R. Definimos g : 0, b a
i
h

Notese que g es derivable para toda t 0, b a
puesto que
g(t + h) g(t)
h0
h
f (
a + (t + h)
u) f (
a + t
u)
= lim
h0
h
f ((
a + t
u) + h
u) f (
a + t
u)
= lim
h0
h
= Du f (
a + t
u)
g (t) = lim
de tal
que,

por el Teorema del Valor Medio para funciones R en R, se tiene que existe
forma

tal que
0, b a

f b f (
a) = g b a
g (0)

= b a
0 g ()

= b a
Du f (
a + u
)

= b a
Du f
J. P
aez
162
4.2.1
Derivadas parciales
Si una funci
on f est
a escrita en terminos de las coordenadas x1 , . . . , xn asociadas a un sistema de
referencia determinado por una base ortonormal {
e1 , . . . , en } de Rn , calcular la derivada direccional
de f en la direcci
on de estos vectores b
asicos (en cualquier punto x
del dominio de f ), resultara
m
as sencillo (y m
as importante).
En efecto, si
x
= x1 e1 + + xn en
= (x1 , . . . , xn )
y el valor de f en x
se puede escribir en terminos de las coordenadas (x1 , . . . , xn ), es decir que
f (
x) = f (x1 , . . . , xn )
entonces el c
alculo de la derivada direccional de f en x
, en la direcci
on de cada vector ei , se traduce
en lo siguiente.
De la definicion de la derivada direccional Dei f (
x) sabemos que
f (
x + h
ei ) f (
x)
h0
h
Dei f (
x) = lim
y dado que las coordenadas del vector x

+ h
ei son (x1 , . . . , xi + h, . . . , xn ), el lmite anterior escrito
en terminos de coordenadas, se convierte en
f (
x + h
ei ) f (
x)
h0
h
f (x1 , . . . , xi + h, . . . , xn ) f (x1 , . . . , xn )
= lim
h0
h
Dei f (
x) = lim
Como seguramente el lector podr

a intuir, en el lmite anterior la u
nica coordenada en la que
se est
a teniendo un incremento h es en la iesima, mientras que en las otras coordenadas no hay
cambios, es decir, permanecen fijas.
En terminos m
as informales, esto significa que para el calculo de la derivada direccional Dei f (
x)
bastara con derivar la expresi
on f (x1 , . . . , xn ) tomando como u
nica variable a xi , y considerando
a las restantes (x1 , . . . , xi1 , xi+1 , . . . , xn ) como si fueran constantes.
En el siguiente ejemplo ilustramos este hecho de manera m
as clara.
Ejemplo 4.8 Sea f : R2 R la funci
on cuyo valor en un punto x
R2 est
a dado en terminos de
sus coordenadas (x, y) (en la base can
onica, que en este caso a sus elementos los denotamos por ex
y ey ) por la expresi
on
f (x, y) = 4x5 y 2
x) para cualquier x
R2 .
Calcularemos Dey f (
x), se tiene que
Si x
= (x, y), de acuerdo con la definici
on de la derivada direccional Dey f (
f (
x + h
ey ) f (
x)
h0
h
f (x, y + h) f (x, y)
= lim
h0
h
4x5 (y + h)2 4x5 y 2
= lim
h0
h
x) = lim
Dey f (
163
J. P
aez
(y + h)2 y 2
h0
h
(y + h)2 y 2
= 4x5 lim
h0
h
5
= 4x (2y)
= lim 4x5
= 8x5 y
x) se
Como el lector habra notado en este ejemplo, el calculo de la derivada direccional Dey f (
redujo a derivar la expresi
on 4x5 y 2 considerando s
olo como variable a la coordenada y, y tratando
al resto de la expresi
on (4x5 ) como una constante.
Una de las ventajas de lo anterior (entre otras m
as!) es que podemos simplificar el calculo de
estas derivadas direccionales usando los metodos de derivacion que aprendimos para las funciones
de R en R.
Por estas caractersticas, y algunas otras que veremos m
as adelante, las derivadas direccionales
en la direcci
on de los vectores de una base ortonormal, tienen un nombre y una notaci
on propia,
las cuales establecemos en la siguiente
Definici
0 U y u
Rn tal que k
uk = 1. Si x1 , . . . , xn denotan
las variables (o coordenadas) determinadas por una base ortonormal {
e1 , . . . , en } de Rn , definimos
f
(
x0 ), como
la derivada parcial de f con respecto de la variable xi en x
0 , que denotamos por x
i
f
(
x0 ) := Dei f (
x0 )
xi
f (
x0 + h
ei ) f (
x0 )
:= lim
h0
h
Como es de suponerse, dado que cualquier derivada parcial no es m
as que una cierta derivada
direccional, las proposiciones 4.4, 4.5, 4.6, y 4.7, tienen sus correspondientes versiones para derivadas
parciales, las cuales formalizaremos a continuaci
on (sin probar). En todas ellas supondremos que
x1 , . . . , xn son las variables (o coordenadas) determinadas por una base ortonormal {
e1 , . . . , en } de
n
R .
Proposici
0 U . Si
f
x0 )
xi (
existe entonces
lim f (
x0 + h
ei ) = f (
x0 )
h0
Proposici
on 4.11 Sean f, g : U Rn R y x
0 U . Si
i {1, . . . , n} entonces:
1.
(f +g)
x0 )
xi (
f
x0 )
xi (
existe y adem
as
f
g
(f + g)
(
x0 ) =
(
x0 ) +
(
x0 )
xi
xi
xi
2. si R,
(f )
x0 )
xi (
existe y adem
as
f
(f )
(
x0 ) =
(
x0 )
xi
xi
J. P
aez
164
g
x0 )
xi (
existen para alguna

3.
(f g)
x0 )
xi (
existe y adem
as
(f g)
g
f
(
x0 ) = f (
x0 )
(
x0 ) + g(
x0 )
(
x0 )
xi
xi
xi
4. si g es continua en x
0 y g(
x0 ) 6= 0,
(f /g)
x0 )
xi (
existe y adem
as
f
g
g(
x0 ) x
(
x0 ) f (
x0 ) x
(
x0 )
(f /g)
i
i
(
x0 ) =
2
xi
g (
x0 )
Proposici
0 U y (a, b) R tal que f (U ) (a, b). Si
f
g : (a, b) R R es derivable en f (
x0 ) y x
(
x0 ) existe para alguna i {1, . . . , n} entonces
i
(gf )
x0 )
xi (
existe y adem
as
(g f )
f
(
x0 ) = g (f (
x0 ))
(
x0 )
xi
xi
h i
Proposici
on 4.13 Sean f : U Rn R, a
, b U , a
6= b, tales que a
, b U y b a
= (b a)
ei .
h i
f
Si para alguna i {1, . . . , n} se tiene que x
(
a
, b entonces existe
i

h i

0, b a
= |b a| tal que si = a
+
ei a
, b , se cumple que
f
()
f (b) f (
a) = (b a)
xi
(4.11)
En esta u
ltima proposici
on es importante hacer notar dos aspectos importantes: uno, que la
hip
otesis de que a
, b U sean tales b a
= (b a)
ei , significa que las coordenadas de a
y b (en la
base {
e1 , . . . , en }) s
olo difieren en la iesima coordenada; y dos, que en el caso en que la cantidad
b a sea negativa, entonces el vector u
que se construye en la proposici
on 4.7 es tal que
b a

u
=

b a
ba
ei
|b a|
=
ei
de tal forma que, de acuerdo con la conclusion de dicha proposici

on (y el facil resultado que el
lector probara en el problema 1 de este captulo), se tiene que

f (b) f (
a) = b a
Du f ()
= |b a| Dei f ()
= (b a)(Dei f ())
f
()
= (b a)
xi
y por lo tanto la identidad 4.11 se cumple independientemente de la relaci

on (de orden) que guarden
a y b.
165
J. P
aez
4.3
4.3. La derivada global
La derivada global
Salvo por el caso de las derivadas direccionales, quedarnos s

olo con la idea de que la derivada es
una forma de medir la raz
on de cambio de una funcion, es algo que dificilmente nos ayudar
aa
n
extender el concepto de derivada a funciones de R en R.
Por esta raz
on, en esta secci
on empezaremos por recordar que la derivabilidad de una funci
on
f de R en R en un punto x0 , adem
as de proporcionarnos una medida de la raz
on de cambio de
f en x0 , tambien nos ayuda a resolver un problema geometrico: encontrar la recta tangente a la
gr
afica de la funci
on en el punto (x0 , f (x0 )).
Como el lector seguramente recordara, la derivada de una funcion f de R en R en un punto x0
(f (x0 )) tiene la propiedad de que, si tomamos la recta con esta pendiente que pasa por el punto
(x0 , f (x0 )), esta recta es tangente a la gr
afica de la funcion en dicho punto.
Especficamente, lo anterior se traduce en lo siguiente: la recta con pendiente f (x0 ) que pasa
por el punto (x0 , f (x0 )) es aquella cuya ecuaci
on se puede escribir de la forma
y = f (x0 )(x x0 ) + f (x0 )
Que esta recta sea tangente a la gr
afica de f en (x0 , f (x0 )), significa no s
olo que pasa por ese
punto, sino que adem
as se parece mucho a f cerca de x0 , donde eso de parecerse mucho a f
cerca de x0 se traduce en que
lim
xx0
f (x) (f (x0 )(x x0 ) + f (x0 ))

=0
x x0
es decir, que la diferencia f (x) (f (x0 )(x x0 ) + f (x0 )) se va m

as r
apido a cero de lo que se va
la diferencia x x0 .
De hecho, como seguramente el lector tambien recordara, la existencia de una recta con estas
caractersticas garantiza la derivabilidad de la funcion en el punto x0 . Dado que las rectas que
pasan por el punto (x0 , f (x0 )) tienen una ecuaci
on de la forma
y = m(x x0 ) + f (x0 )
si una de estas rectas tiene la propiedad de que
lim
xx0
f (x) (m(x x0 ) + f (x0 ))

=0
x x0
entonces podemos asegurar que f es derivable en x0 y que adem

as f (x0 ) = m.
En efecto, como
f (x) (m(x x0 ) + f (x0 ))
x x0

f (x) f (x0 )
m
= lim
xx0
x x0
0 = lim
xx0
entonces
m = lim
=
f (x) f (x0 )
x x0
xx0
f (x0 )
lo que comprueba nuestra afirmacion.

J. P
aez
166
(4.12)
De lo anterior concluimos que la derivabilidad de una funci

on f de R en R en un punto x0 , es
equivalente a la existencia de una funcion de la forma r(x) = m(x x0 ) + f (x0 ) que satisfaga la
identidad 4.12. En realidad bastara con considerar las funciones de la forma L(x) = mx, puesto
que la funci
on r(x) no es mas que, en terminos de sus gr
aficas, la traslaci
on de L(x) (que pasa
por el origen) al punto (x0 , f (x0 )) (ver figura 4.4).
Las funciones de la forma L(x) = mx son justo el tipo de funciones de R en R conocidas con el
nombre de funciones lineales (las cuales introdujimos en el problema 39 del captulo 2 para el caso
general de funciones de Rn en Rm ), y que son las funciones L : R R que tienen las siguientes dos
propiedades:
1. L(x + y) = L(x) + L(y) para todas x, y R, y
2. L(x) = L(x) para todas , x R
Es un problema sencillo mostrar que L : R R es una funci
on lineal si y s
olo si existe m R tal
que L(x) = mx para toda x R (en ambas implicaciones se deduce que m = L(1)).
r
(x0 , f (x0 ))
f
b
x0
Figura 4.4: La funcion r(x) = m(x x0 ) + f (x0 ) es la traslaci

on de la funcion L(x) = mx (que pasa
por el origen) al punto (x0 , f (x0 )).
Como seguramente el lector ya estar
a imaginando, la discusion anterior nos sugiere la forma en
que podemos dar la definicion de derivada (global) de una funcion de Rn en R.
En terminos generales, que una funcion f de este tipo sea derivable en un punto x
0 de su
dominio, significara que existe una funcion lineal L de Rn en R tal que al trasladarla para que
su valor en x
0 sea f (
x0 ), esta funci
on lineal trasladada (L(
xx
0 ) + f (
x0 )), que recibe el nombre
de funci
on (o transformaci
on) afn se parece mucho a la funcion f cerca de x
0 .
Especficamente, nuestra definicion de derivabilidad ser
a la siguiente.
Definici
on 4.14 Sean f : U Rn R y x
0 U . Decimos que f es derivable en x
0 si existe una
n
funci
on lineal L : R R tal que
lim
x0
f (
x) (L(
xx
0 ) + f (
x0 ))
=0
k
xx
0 k
(4.13)
Sin duda que despues de esta definicion, sera conveniente dar un ejemplo que la ilustrara.
Sin embargo, es importante hacer notar que hasta ahora no tenemos ninguna herramienta que
nos permita, dada una funci
on (expresada en alg
un sistema coordenado), proponer (o intuir) cu
al
debera de ser la funci
on lineal que satisfaga la condici
on que se le pide en esta definicion.
167
J. P
aez
Por esta raz

on, primero nos enfocaremos en dar algunas propiedades relacionadas con este
concepto de derivada que, entre otras cosas, nos permitiran darnos una idea de como encontrar la
ya famosa funci
on lineal L.
De hecho, la primera proposici
on que probaremos es justo la que nos asegura que s
olo puede
haber una u
nica funci
on lineal que satisfaga la propiedad de la definicion 4.14.
: Rn R funciones lineales. Si L y L
Proposici
0 U y L, L
satisfacen la condici
on 4.13 de la definici
on 4.14 entonces L y L son iguales.
Demostraci
on. Dado que por hip
otesis sabemos que
lim
f (
x) (L(
xx
0 ) + f (
x0 ))
=0
k
xx
0 k
lim
xx
f (
x) (L(
0 ) + f (
x0 ))
=0
k
xx
0 k
x0
y
x
x0
restando ambos lmites concluimos que

lim
x0
L)(
xx
(L
xx
0 )
L(
0 ) L(
xx
0 )
= lim
x
x0
k
xx
0 k
k
xx
0 k
=0
=x
=L
L y h
es una funcion lineal para la cual
de tal forma que si hacemos L
x
0 , entonces L
se satisface que
h)
L(

lim
= 0

h
0 h

es la constante cero, o lo que es

de tal forma que, por el problema 39 del captulo 2, se tiene que L
lo mismo, que L y L son iguales.
Con base en esta proposici

on ya podemos completar la definicion 4.14 de la siguiente forma:
si f : U Rn R es derivable en x
0 U , a la funcion lineal que satisface la condici
on 4.13, que
por la proposici
on anterior sabemos que es u
nica, la denotaremos por Df (
x0 ) y diremos que es la
derivada de f en x
0 . De esta forma, la derivada de una funci
on de Rn en R es una funci
on lineal.
n
Mas adelante veremos que toda funcion lineal de R en R se puede representar (dependiendo
del sistema coordenado que se elija) por una matriz de 1 n o por un vector en Rn , de tal forma
que en algunas ocasiones diremos (abusando ciertamente del lenguaje) que la derivada de este tipo
de funciones tambien es (o dicho de manera mas correcta, que se puede representar por) una de
estas matrices (o uno de estos vectores).
Y justamente, con el objetivo de poder calcular (o conocer) la derivada de una funcion en
un punto x
0 , el siguiente resultado que veremos establece una importante relaci
on entre la funci
on
lineal Df (
x0 ) (que es la derivada en el punto x
0 ) y las derivadas direccionales en dicho punto.
En terminos generales, la siguiente proposici
on que probaremos nos asegura que si una funci
on
es derivable en un punto x
0 entonces la derivada direccional en x
0 , en la direcci
on de cualquier
vector u
, tambien existe y adem
as el valor de dicha derivada direccional se obtiene evaluando la
funcion lineal Df (
x0 ) en el vector u
.
J. P
aez
168
Proposici
0 U y u
Rn tal que k
uk = 1. Si f es derivable en
x
0 entonces la derivada direccional de f en x
0 en la direcci
on de u
tambien existe y adem
as
Du f (
x0 ) = Df (
x0 )(
u)
Demostraci
on. De la definicion 4.14 sabemos que
lim
x0
f (
x) f (
x0 ) Df (
x0 )(
xx
0 )
f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))
= lim
x
x0
k
xx
0 k
k
xx
0 k
=0
de tal forma que si en particular tomamos x

=x
0 + h
u, tenemos entonces que x
x
0 si h 0 y
por lo tanto se tendra que
f (
x) f (
x0 ) Df (
x0 )(
xx
0 )
x
x0
k
xx
0 k
|f (
x) f (
x0 ) Df (
x0 )(
xx
0 )|
= lim
x
x0
k
xx
0 k
|f (
x0 + h
u) f (
x0 ) Df (
x0 )(h
u)|
= lim
h0
kh
uk
|f (
x0 + h
u) f (
x0 ) Df (
x0 )(h
u)|
= lim
h0
|h|

f (
x0 + h
u) f (
x0 ) hDf (
x0 )(
u)

= lim

h0
h

f (

x0 + h
u) f (
x0 )
= lim
Df (
x0 )(
u)
h0
h
0 = lim
lo cual es equivalente a que
f (
x0 + h
u) f (
x0 )
= Df (
x0 )(
u)
h0
h
lim
de donde concluimos que la derivada direccional de f en x

0 en la direcci
on de u
existe y adem
as
que
Du f (
x0 ) = Df (
x0 )(
u)
Para abordar el problema de calcular la derivada de una funcion, es necesario establecer algunos
hechos importantes acerca de las funciones lineales, lo cual haremos a continuaci
on.
n
Es facil ver que si L : R R es una funcion lineal, para conocer el valor de L en cualquier
punto x
Rn , es suficiente con saber los valores de L en los elementos de una base de Rn .
En efecto, n
otese que si x
tiene coordenadas (x1 , . . . , xn ) en un sistema coordenado determinado
por una base = {
v1 , . . . , vn }, esto significa que
x
= x1 v1 + + xn vn
de tal forma que, por la linealidad de L se tiene que
L(
x) = L(x1 v1 + + xn vn )
169
J. P
aez
= x1 L(
v1 ) + + xn L(
vn )
lo que confirma que para saber el valor de L en x
, es suficiente con conocer las coordenadas de x
en una base = {
v1 , . . . , vn } y los valores de L en los elemento de esta base.
Si denotamos por a1i = L(
vi ), se suele construir la matriz de 1 n

M = a11 a1n
y decir que la matriz M respresenta a la funcion lineal L en la base = {
v1 , . . . , vn }.
De hecho, esta representaci
on matricial y las operaciones entre matrices son u
tiles para expresar
a L(
x) como
L(
x) = L(x1 , . . . , xn )
=
a11
a1n
x1
= M ...
xn
x1
.
..
xn
En el caso particular de funciones lineales de Rn en R, tambien podemos representar a L por

el vector (L(
v1 ), . . . , L(
vn )) y usar el producto punto para expresar a L(
x) como
L(
x) = L(x1 , . . . , xn )
(4.14)
= (L(
v1 ), . . . , L(
vn )) (x1 , . . . , xn )
Con base en lo anterior, si una funcion f est
a expresada en terminos de las coordenadas
x1 , . . . , xn determinadas por alguna base ortonormal {
e1 , . . . , en } de Rn , para encontrar la matriz
que representa (en la misma base {
e1 , . . . , en }) a la derivada de f en un punto x
0 de su dominio, es
decir Df (
x0 ), bastara con saber el valor Df (
x0 )(
ei ) (para cada i {1, . . . , n}), y de acuerdo con
lo probado en la proposici
Df (
x0 )(
ei ) = Dei f (
x0 )
Y si ahora recordamos, de acuerdo con la definicion 4.9, que
Dei f (
x0 ) =
f
(
x0 )
xi
entonces concluimos que para calcular (o conocer) a Df (

x0 ) basta con calcular las derivadas
parciales de f en x
0 .
En cuanto a la discusion previa, es importante hacer notar que la mera existencia de las derivadas
parciales de una funci
on f en un punto x
0 de su dominio, no garantizan que la funcion sea derivable
en dicho punto.
Lo que en el fondo est
a sucediendo, es que en la proposici
on 4.16 se establece que la existencia
de las derivadas direccionales (incluyendo las derivadas parciales) es una condici
on (o consecuencia)
necesaria de la derivabilidad de f en x
0 , pero lo recproco no es cierto (mas adelante daremos un
ejemplo que ilustra esta afirmacion).
Sin embargo, la importancia de la discusion anterior est
a en que se muestra con toda precision
cu
al es la u
nica funci
on lineal que podra ser la derivada de f en x
0 , lo que sin duda es un hecho
de gran valor. Y una vez aclarado lo anterior, pasamos a dar el siguiente
J. P
aez
170
Ejemplo 4.17 Sea f : R2 R que est

a dada (en terminos de las coordenadas de la base can
onica)
por la expresi
on
f (x, y) = x2 + y 2 1
Mostraremos que f es derivable en cualquier punto x
0 = (x0 , y0 ) R2 y calcularemos Df (
x0 ).
De acuerdo con lo visto anteriormente, hay que calcular las derivadas parciales de f con respecto
de las variables x y y,
f
f
(x, y) = 2x
y
(x, y) = 2y
x
y
evaluarlas en x
0 = (x0 , y0 )
f
(x0 , y0 ) = 2x0
x
f
(x0 , y0 ) = 2y0
y
y mostrar que la funci

on lineal (expresada en el mismo sistema coordenado)
L(
x) = L(x, y)

= f
x (x0 , y0 )
=
2x0 2y0
= 2x0 x + 2y0 y
f
y (x0 , y0 )
x
y
x
y
satisface la condici
on 4.13 de la definci
on 4.14.
En efecto, sustituyendo f y L en dicha expresi
on, tenemos que
lim
x0
x2 + y 2 1 (2x0 (x x0 ) + 2y0 (y y0 ) + x20 + y02 1)

f (
x) (L(
xx
0 ) + f (
x0 ))
p
= lim
x
x0
k
xx
0 k
(x x0 )2 + (y y0 )2
(x2 2x0 x + x20 ) + (y 2 2y0 y + y02 )
p
x
x0
(x x0 )2 + (y y0 )2
(x x0 )2 + (y y0 )2
= lim p
x
x0
(x x0 )2 + (y y0 )2
p
= lim (x x0 )2 + (y y0 )2
= lim
x0
=0
de donde concluimos que f es derivable en x

0 y que adem
as Df (
x0 ) es la funci
on lineal representada (o asociada), en el mismo sistema coordenado en que est
a expresada f , por la matriz
es decir que
f
x (x0 , y0 )
f
y (x0 , y0 )
Df (
x0 )(x, y) =
2x0 2y0
2x0 2y0
= 2x0 x + 2y0 y
171
x
y
J. P
aez
Para aprovechar el ejemplo anterior, en el cual podemos ver la gr

afica de la funcion f , y
confirmar la estrecha relaci
on que existe entre el concepto de derivada y el concepto de tangencia,
observemos que la gr
afica de la funci
on lineal
Df (
x0 )(x, y) = 2x0 x + 2y0 y
es un plano (que contiene al origen) y que la gr
afica de la funcion
L(x, y) = Df (
x0 )(x x0 , y y0 ) + f (x0 , y0 )
= 2x0 (x x0 ) + 2y0 (y y0 ) + x20 + y02 1
afica de la
es un plano (trasladado al punto (x0 , y0 , x20 + y02 1)) que se ve tangente a la gr
funcion f (x, y) = x2 + y 2 1 en este mismo punto (ver figura 4.5).
(x0 , y0 , f (x0 , y0 ))
Figura 4.5: El plano tangente a la gr

afica de la funcion f (x, y) = x2 + y 2 1 en el punto (x0 , y0 ) =
(1, 1).
Con base en las observaciones anteriores, damos la siguiente
Definici
on 4.18 Sea f : U R2 R derivable en el punto x
0 = (x0 , y0 ) U . Decimos que el
plano que tiene como ecuaci
on
z=
f
f
(x0 , y0 ) (x x0 ) +
(x0 , y0 ) (y y0 ) + f (x0 , y0 )
x
y
(4.15)
es el plano tangente a la gr
afica de f en el punto (x0 , y0 , f (x0 , y0 )).
Notese que la ecuaci
on 4.15 se puede escribir como

f
f
(x0 , y0 ), (x0 , y0 ), 1 (x x0 , y y0 , z f (x0 , y0 )) = 0
x
y
de tal forma que el vector

f
f
(x0 , y0 ), (x0 , y0 ), 1
x
y
es un vector normal a este plano tangente.

J. P
aez
172
(4.16)
De aqu en adelante escribiremos, sin duda abusando de la notaci

on, que la funcion lineal Df (
x0 )
es igual a la matriz (de 1 n) que la representa en el sistema de referencia que se este usando, y
en cuyas coordenadas est
a expresada f .
Sin embargo, no hay que olvidar que esta matriz depende del sistema de referencia que se
este usando, y parte de lo que haremos a continuaci
on ser
a mostrar la relaci
on que existe entre
las matrices asociadas a la funci
on lineal Df (
x0 ) en dos sistemas de referencia (ortonormales)
diferentes, y c
omo se puede obtener una a partir de la otra.
Una vez dicho lo anterior, si x1 , . . . , xn denotan a las variables determinadas por una base
ortonormal {
e1 , . . . , en }, entonces escribiremos que
i
h
f
f
(4.17)
Df (
x0 ) = x
(
x
)
(
x
)
0
0
xn
1
de tal forma que si u
Rn tiene coordenadas (u1 , . . . , un ) en la base {
e1 , . . . , en }, se tiene que
h
i u1
f
f
Df (
x0 )(
u) = x
(
x0 ) ...
(
x0 ) x
n
1
un
f
f
(
x 0 ) + + un
(
x0 )
= u1
x1
xn
As pues, si ahora x1 , . . . , xn denotan a las variables determinadas por otra base ortonormal
{
e1 , . . . , en } de Rn , y se tiene que

(i)
ei = a1 , . . . , a(i)
n
(i)
= a1 e1 + + a(i)
n
n e

f
(
x0 ) = Dei f (
x0 )
xi

= Df (
x0 ) ei
f
(i) f
(
x0 ) + + a(i)
(
x0 )
= a1
n
x1
xn
lo cual establece la forma de obtener las derivadas parciales de f , con respecto a las variables (o
coordenadas) x1 , . . . , xn , en terminos de las variables x1 , . . . , xn .
Notese que esta u
ltima identidad tambien se puede obtener como una cosecuencia de la proposici
on
4.16 puesto que, como ei es un vector de norma uno, y

(i)
ei = a1 e1 + + a(i)
n
n e
entonces
f
(
x0 ) = Dei f (
x0 )
xi

= Df (
x0 ) ei

(i)
= Df (
x0 ) a1 e1 + + an(i) en
173
J. P
aez
(i)
= a1 Df (
x0 ) (
e1 ) + + a(i)
x0 ) (
en )
n Df (
f
(i) f
= a1
(
x0 ) + + a(i)
(
x0 )
n
x1
xn
Para terminar de encontrar la relaci
on que existe entre las matrices asociadas a la derivada
Df (
x0 ) en dos sistemas de referencia (ortonormales) diferentes, recordemos que en la base {
e1 , . . . , en }
esta funcion lineal estar
a representada por la matriz
i
h
f
f
(
x
)
(
x
)
0
0
x
x
n
de modo que las matrices (de 1 n) que representan a la funcion lineal Df (

x0 ) (en las correspon
e1 , . . . , en }) est
an relacionadas por la identidad
dientes bases {
e1 , . . . , en } y {
h
f
x0 )
x1 (
f
x0 )
xn (
f
x0 )
x1 (
f
x0 )
xn (
(1)
(n)
a1
..
.
..
.
a1
..
.
(1)
an
(n)
an
(1)
..
.
an
..
.
(n)
an
(4.18)
(4.19)
o por la identidad
h
f
x0 )
x1 (
f
x0 )
xn (
f
x0 )
x1 (
i a1
f
.
x0 )
..
xn (
(n)
a1
(1)
las cuales, sin duda alguna, har

a que el lector recuerde las identidades 4.4 y 4.7, que son las que
obtuvimos cuando analizamos el problema relacionado con el cambio de coordenadas (de un
mismo vector x
) determinadas por dos bases ortonormales de Rn .
4.3.1
El gradiente
Ademas de sus implicaciones pr

acticas para el calculo explcito de la derivada de una funci
on,
la proposici
on 4.16 tiene otra consecuencia importante, la que resultara muy u
til para conocer el
comportamiento de una funci
on en la vecindad de un punto en el cual sea derivable.
Como asegura la proposici
on 4.16, si f es derivable en un punto x
0 entonces la derivada direccional de f en x
0 , en la direcci
on del vector (unitario) u
, se obtiene evaluando la funcion lineal
Df (
x0 ) (la derivada de f en x
0 ) en u
.
Si ahora recordamos que toda funci
on lineal es continua (problema 62 del captulo 2) y que el
conjunto
S n1 = {
u Rn | k
uk = 1}
es cerrado (problema 50 del captulo 2) y claramente acotado, por el corolario 2.51 del captulo 2
sabemos que deben existir u
1 y u
2 en S n1 tales que
Df (
x0 )(
u1 ) Df (
x0 )(
u) Df (
x0 )(
u2 )
para toda u
S n1 , o equivalentemente, que
Du1 f (
x0 ) Du f (
x0 ) Du2 f (
x0 )
para toda u
S n1 .
J. P
aez
174
Es decir, en terminos m
as coloquiales, siempre existen direcciones u
1 y u
2 , una en la que la
raz
on de cambio de la funci
on f es mnima (
u1 ), y otra en la que la raz
on
f es m
axima (
u2 ).
De hecho, lo siguiente que probaremos es que si la Df (
x0 ) no es la funcion lineal constante
cero (en cuyo caso todas las derivadas direccionales valen 0), entonces u
1 y u
2 son u
nicos y adem
as
u
1 =
u2 .
Proposici
on 4.19 Sea f : U Rn R y x
0 U . Si f es derivable en x
0 entonces existe
n1
u
0 S
tal que
Du0 f (
x0 ) Du f (
x0 ) Du0 f (
x0 )
para toda u
S n1 . Si la derivada Df (
x0 ) no es la constante cero entonces u
0 es u
nico.
Demostraci
on. Como mencionamos anteriormente, dado que toda funcion lineal es continua, y
que el conjunto S n1 es cerrado y acotado, por el corolario 2.51 del captulo 2 sabemos que existe
u
0 S n1 tal que
Du f (
x0 ) Du0 f (
x0 )
para toda u
S n1 .
Por otra parte, si u
S n1 entonces
u S n1 de modo que
Du f (
x0 ) Du0 f (
x0 )
y como
Du0 f (
x0 ) = Df (
x0 )(
u0 )
= Df (
x0 )(
u0 )
= Du0 f (
x0 )
Du f (
x0 )
= Df (
x0 )(
u)
= Du f (
x0 )
obtenemos la otra desigualdad.

Para probar la unicidad de u
0 , supongamos ahora que Df (
x0 ) no es la constante cero (de modo
x0 )(
u0 ).
0 , tal que Df (
x0 )(
u0 ) = Df (
0 6= u
que Df (
x0 )(
u0 ) > 0) y que existe otro u
0 S n1 , u
0 = 0 y por lo tanto
u0 entonces u
0 + u
Primero notemos que si u
0 =
0 = Df (
x0 )(0)
= Df (
x0 )(
u0 + u
0 )
= Df (
x0 )(
u0 ) + Df (
x0 )(
u0 )
= 2Df (
x0 )(
u0 )
de donde se tendra que Df (
x0 )(
u0 ) = 0. Por tanto, u
0 + u
0 6= 0 de modo que si tomamos
u
=
u
0 + u
0
S n1
k
u0 + u
0 k
entonces
Df (
x0 )(
u) =
k
u0
1
(Df (
x0 )(
u0 ) + Df (
x0 )(
u0 ))
+u
0 k
175
J. P
aez

=
k
u0
2
Df (
x0 )(
u0 )
+u
0 k
0 ,
u0 , por el inciso (b) del problema 9 del captulo 1
0 S n1 y u
0 6= u
Ahora, dado que u
0 , u
se tiene que

u
0 + u
0 < u
u0 k
0 + k
=2
de donde
1<
k
u0
2
+u
0 k
k
u0
2
Df (
x0 )(
u0 )
+u
0 k
y por lo tanto
Df (
x0 )(
u0 ) <
= Df (
x0 )(
u)
lo cual contradice la propiedad de que Df (

x0 )(
u0 ) es el valor m
aximo de Df (
x0 ) sobre el conjunto
S n1 .
Como seguramente el lector ya se estar
a preguntando, el siguiente problema que abordaremos
ser
a el de calcular esta direcci
on u
0 en la cual la derivada direccional alcanza su m
aximo valor.
Como siempre, este c
alculo depende de que se tenga una expresi
on explcita de la funcion en cuesti
on
(en alg
un sistema coordenado), y de la forma en que se represente a su derivada.
Y justo en la soluci
on de este problema es que echaremos mano de la otra forma en que podemos
representar a una funci
on lineal de Rn en R. Como se recordara, adem
as de usar el lenguaje de
matrices para representar a estas funciones lineales, tambien podemos usar un vector y el producto
punto en Rn , como lo escribimos en la expresi
on 4.14.
Con base en esta expresi
on, tenemos entonces que, si nuestra funcion f est
a expresada en
terminos de las coordenadas x1 , . . . , xn (determinadas por la base {
e1 , . . . , en }) y el vector (unitario)
u
tiene coordenadas (u1 , . . . , un ), entonces podemos escribir que
Du f (
x0 ) = Df (
x0 )(
u)
= (Df (
x0 )(
e1 ), . . . , Df (
x0 )(
en )) (u1 , . . . , un )
x0 )) (u1 , . . . , un )
= (De1 f (
x0 ), . . . , Den f (

f
f
(
x0 ), . . . ,
(
x0 ) (u1 , . . . , un )
=
x1
xn
(4.20)
Si ahora recordamos que

f
f
f
f
(
x0 ), . . . ,
(
x0 ) (u1 , . . . , un ) =
(
x0 ), . . . ,
(
x0 )
k(u1 , . . . , un )k cos()

x1
xn
x1
xn

f

f

=
(
x0 ), . . . ,
(
x0 )
cos()
x1
xn
(identidad 1.7 del captulo 1) en donde es el angulo formado por estos vectores, concluimos que el
m
aximo valor de Du f (
x0 ) = Df (
x0 )(
u) (suponiendo que Df (
x0 ) no es la constante cero) se alcanza
J. P
aez
176
cuando cos() = 1, es decir si = 0, lo que significa que el vector u

0 de la proposici
on anterior
estar
a expresado por

f
f
(
x
)
(
x
),
.
.
.
,
0
0
x1
xn

(4.21)
u
0 =
f

f
(
x
)
x0 ), . . . , x
x1 (

0
n
Dado que siempre que tomemos un sistema de coordenadas x1 , . . . , xn (inducido por una base
ortonormal {
e1 , . . . , en }), el vector con coordenadas

f
f
(
x0 ), . . . ,
(
x0 )
(4.22)
x1
xn
es tal que al hacerlo unitario (cuando no sea el vector 0) representa al vector cuya existencia
probamos en la proposici
on 4.19, el vector 4.22 recibe un nombre especial: el gradiente de f en x
0
y lo denotaremos por f (
x0 ), es decir

f
f
f (
x0 ) :=
(
x0 ), . . . ,
(
x0 )
(4.23)
x1
xn
Es importante insistir en que, si tomamos otro sistema de coordenadas x1 , . . . , xn (inducido por
otra base ortonormal {
e1 , . . . , en }), el vector con coordenadas

f
f
(
x0 ), . . . , (
x0 )
x1
xn
nuevamente es tal que
f
f
x0 ), . . . , x
x0 )
(
x1 (
n

u
0 =
f

f
x0 )
x0 ), . . . , x (
x (
n
1
en donde u
0 es el multicitado vector cuya existencia probamos en la proposici
on 4.19 (prueba que
por cierto, hicimos sin recurrir a un sistema coordenado especfico).
En virtud de lo anterior, usaremos la expresi
on f (
x0 ) como una forma de referirnos a este vector u
0 , recordando siempre que en un sistema de coordenadas especfico x1 , . . . , xn , sus coordenadas
est
an dadas por 4.23, y que para obtener sus coordenadas en otro sistema x1 , . . . , xn , simplemente
habra que recurrir a la identidad 4.18.
Desde un punto de vista m
as pr
actico, el vector gradiente de f en x
0 tiene dos usos importantes:
uno, para representar (y expresar) a la derivada de f en x
0 (identidad 4.20), es decir que
Df (
x0 )(
x) = f (
x0 ) x
para toda x
Rn ; y dos, para designar la direcci
on en la que f tiene la m
axima raz
on de cambio,
es decir, la direcci
on en la que su derivada direccional (en x
0 ) alcanza su m
aximo valor (identidad
4.21). Con base en lo anterior, lo siguiente que haremos ser
a ilustrar con un ejemplo estos dos usos.
Ejemplo 4.20 Sea f : R2 R que est
on
f (x, y) = 8 x2 y 2 + x y
yx
0 = (2, 1).
Tenemos entonces que
f
(x, y) = 2x + 1
x
177
J. P
aez

y
f
(x, y) = 2y 1
y
de modo que

f
f
f (2, 1) =
(2, 1),
(2, 1)
x
y
= (3, 3)
Por tanto, la derivada de f en (2, 1) (Df (2, 1)) es la funci
on lineal dada por la expresi
on
Df (2, 1)(x, y) = f (2, 1) (x, y)
= (3, 3) (x, y)
= 3x 3y
de tal forma que la funci

on afn
Df (2, 1)(x 2, y 1) + f (2, 1) = 3(x 2) 3(y 1) + 4
es la que debe satisfacer la condici

on 4.13 de la definci
on 4.14.
En efecto, se tiene que
f (x, y) (Df (2, 1)(x 2, y 1) + f (2, 1))

k(x, y) (2, 1)k
(x,y)(2,1)
lim
8 x2 y 2 + x y (3(x 2) 3(y 1) + 4)
p
(x,y)(2,1)
(x 2)2 + (y 1)2
lim
x2 + 4x y 2 + 2y 5
p
(x,y)(2,1)
(x 2)2 + (y 1)2
(x 2)2 (y 1)2
p
=
lim
(x,y)(2,1)
(x 2)2 + (y 1)2
(x 2)2 + (y 1)2
=
lim p
(x,y)(2,1)
(x 2)2 + (y 1)2
p
=
lim (x 2)2 + (y 1)2
=
lim
(x,y)(2,1)
=0
Por otra parte, se tiene que el vector

f (2, 1)
kf (2, 1)k
1
(3, 3)
=p
2
(3) + (3)2

1
1
= ,
2
2
es el vector que determina la direcci
on en la que, parados en el punto (2, 1), obtenemos la m
axima
raz
on f .
O en terminos geometricos, si cortamos a la gr
afica de f por el plano perpendicular al plano
XY que
contiene
a
la
recta
que
pasa
por
el
punto
(2,
1), y cuya direcci
on est
a dada por el vector
(1/ 2, 1/ 2), entonces obtenemos la curva que en el punto (2, 1, f (2, 1)) = (2, 1, 4) tiene la
recta tangente de m
axima pendiente (ver figura 4.6).
u
0 =
J. P
aez
178
x
0
Figura 4.6: En el ejemplo 4.20, el plano perpendicular

al
plano XY que pasa por el punto x
0 = (2, 1), y
cuya direcci
on est
a dada por el vector u
= (1/ 2, 1/ 2), contiene a la curva y a su recta tangente,
que resulta ser la de m
axima pendiente que pasa por el punto (2, 1, f (
x0 )) = (2, 1, 4).
4.3.2
Otras propiedades de la derivada
Una vez establecidas estas importantes propiedades del gradiente, continuaremos con el an
alisis de
las condiciones necesarias y suficientes de la derivabilidad de una funcion. La siguiente propiedad
que veremos es una condici
on necesaria, y por lo tanto nos ser
a muy u
til para determinar cu
ando
una funcion no es derivable.
Esta condici
on es una generalizaci
on (al tipo de funciones que estamos tratando) de la propiedad
que ya sabamos para el caso de funciones de R en R, y que simplemente nos asegura que, si una
funcion es derivable en un punto entonces debe ser continua en ese mismo punto.
Proposici
on 4.21 Sea f : U Rn R. Si f es derivable en x
0 U entonces f es continua en
x
0 .
Demostraci
on. Como f es derivable en x
0 sabemos que
lim
x0
f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))
=0
k
xx
0 k
y como
f (
x) f (
x0 ) Df (
x0 )(
xx
0 ) =
f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))
k
xx
0 k
k
xx
0 k
si x
6= x
0 , tenemos entonces que
lim (f (
x) f (
x0 ) Df (
x0 )(
xx
0 )) = lim
x0
x0
=0
179

f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))
k
xx
0 k
k
xx
0 k
J. P
aez
Por otra parte, por el problema 62 del captulo 2 sabemos que toda funcion lineal es continua,
de tal forma que
lim Df (
x0 )(
xx
0 ) = lim (Df (
x0 )(
x) Df (
x0 )(
x0 ))
x0
x0
=0
y por lo tanto
lim (f (
x) f (
x0 )) = lim [(f (
x) f (
x0 ) Df (
x0 )(
xx
0 )) + Df (
x0 )(
xx
0 )]
x0
x0
= lim (f (
x) f (
x0 ) Df (
x0 )(
xx
0 )) + lim Df (
x0 )(
xx
0 )
x
x0
x0
=0
lo que prueba que f es continua en x

0 .
Como sucede en el caso real, la condici
on anterior no es suficiente. Es decir, no es suficiente
que una funcion sea continua en un punto x
0 para que esta sea derivable en dicho punto.
El ejemplo que vamos a dar es la generalizaci
on del que se suele dar para ilustrar el mismo
hecho en el caso de funciones de R en R (la funcion valor absoluto).
Ejemplo 4.22 Sea f : Rn R definida como
f (
x) = k
xk
Como sabemos, f es continua para toda x
Rn , en particular para x
= 0. Sin embargo,
mostraremos que f no es derivable en
0. Para ello, primero mostraremos que en el 0 no existe la
derivada direccional para cualquier vector u
Rn tal que k
uk = 1.
En efecto, por definici
on sabemos que
f (0 + h
u) f (0)
Du f (
0) = lim
h0
h

kh
uk 0
= lim
h0
h
|h|
= lim
h0 h
y como el lector recordar
a, este u
ltimo lmite no existe. Por lo tanto, por la proposici
on 4.16 f no
es derivable en el 0.
Y ya que estamos en los contraejemplos y aprovechando la proposici
on anterior, mostraremos
que el recproco de la proposici
on 4.16 no es cierto; es decir, que la existencia de todas las derivadas
direccionales de una funci
on f en un punto x
0 de su dominio, no es suficiente para poder asegurar
que f sea derivable en dicho punto.
Ejemplo 4.23 Sea f : R2 R definida como
2
x y
x4 +y2
f (x, y) =
J. P
aez
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
180
Mostraremos primero que la derivada direccional Du f (0) existe para cualquier vector u
=
(u1 , u2 ) Rn tal que k
uk = 1.
Supongamos primero que u2 6= 0. En este caso se tiene que
f (0 + h
u) f (0)
Du f (0) = lim
h0
h

1
(hu1 )2 (hu2 )
= lim
h0 h
(hu1 )4 + (hu2 )2
!
h3 u21 u2
1

= lim
h0 h
h2 h2 u41 + u22
u21 u2
2
h0 h2 u4
1 + u2
u2
= 1
u2
= lim
y si u2 = 0, es decir que u
= (1, 0) = e1 , entonces
f (0 + h
u) f (0)
h0
h
f (h, 0) f (0, 0)
= lim
h0
h
00
= lim
h0
h
=0
Du f (0) = lim
lo cual prueba que Du f (

0) existe para cualquier vector u
Rn tal que k
uk = 1.
Por otra parte, si evaluamos a f en puntos de la forma (t, t2 ), con t 6= 0, se tiene que
(t)2 t2
+ (t2 )2
t4
= 4
t + t4
1
=
2
f (t, t2 ) =
(t)4
de tal forma que, como (t, t2 ) (0, 0) si t 0, concluimos que f no es continua en el 0 y por la
proposici
on 4.21, que f no es derivable en el 0.
Si bien es cierto que la existencia de las derivadas direccionales de una funcion f en un punto
x
0 no es suficiente para garantizar su derivabilidad en dicho punto, un an
alisis m
as de cerca del
ejemplo anterior nos puede arrojar luz sobre cu
ales hip
otesis adicionales habra que considerar para
poder asegurar la derivabilidad de f en x
0 .
a mostrar que la funcion del ejemplo anterior s es derivable en
0. Para ello, como ya sabemos, ser
a necesario calcular las derivadas
cualquier punto x
= (x, y) 6=
parciales f /x y f /y en x
y mostrar que la funcion lineal representada por la matriz
i
h
f
f
(x,
y)
(x,
y)
x
y
181
J. P
aez
satisface la condici
on establecida en la definicion 4.14.
Con base en varios de los incisos de la proposici
on 4.11 y en los calculos realizados en el ejemplo
anterior, tenemos que
2xy(y 2 x4 )
si (x, y) 6= (0, 0)
(x4 +y 2 )2
f
(4.24)
(x, y) =
0
si (x, y) = (0, 0)
f
(x, y) =
x2 (x4 y 2 )
(x4 +y 2 )2
si (x, y) 6= (0, 0)
(4.25)
si (x, y) = (0, 0)
Si ahora tomamos x
0 = (x0 , y0 ) 6= (0, 0), para cualquier otra x
= (x, y) R2 se tiene que
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|

f
f

(
x0 )(x x0 )
(
x0 )(y y0 )
= f (x, y) f (x0 , y0 )
x
y

f
f
= f (x, y) f (x0 , y) + f (x0 , y) f (x0 , y0 )
(
x0 )(x x0 )
(
x0 )(y y0 )
x
y
Dado que las derivadas parciales f /x y f /y existen para toda x

R2 , por la proposici
on
4.13 sabemos que
f (x, y) f (x0 , y) = (x x0 )
f
(x , y)
x
f (x0 , y) f (x0 , y0 ) = (y y0 )
f
(x0 , y )
y
y por tanto
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|

f
f
(
x0 )(x x0 )
(
x0 )(y y0 )
= f (x, y) f (x0 , y) + f (x0 , y) f (x0 , y0 )
x
y

f
f
f
f

= (x x0 )
(x , y) + (y y0 )
(x0 , y )
(
x0 )(x x0 )
(
x0 )(y y0 )
x
y
x
y

f

f
f
f
=
(x , y)
(
x0 ) (x x0 ) +
(x0 , y )
(
x0 ) (y y0 )
x
x
y
y

f

f
f
f

(x , y)
(
x0 ) |x x0 | + (x0 , y )
(
x0 ) |y y0 |
x
x
y
y

f
f
f
f
(
x0 ) k
(
x0 ) k
xx
0 k + (x0 , y )
xx
0 k
(x , y)
x
x
y
y

f
f

f
f

= (x , y)
(
x0 ) + (x0 , y )
(
x0 ) k
xx
0 k
x
x
y
y
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
k
xx
0 k

f

f
f
f
(
x0 ) + (x0 , y )
(
x0 )
(x , y)
x
x
y
y
J. P
aez
182
Si ahora notamos que, de acuerdo con las expresiones 4.24 y 4.24 de las derivadas parciales de
f , estas son continuas en cualquier punto x
0 6= 0, y que los puntos (x , y) y (x0 , y ) tienden al punto
(x0 , y0 ) = x
0 si el punto x
= (x, y) tiende al punto (x0 , y0 ) = x
0 , tenemos que
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
x
x0
k
xx
0 k

f

f
f
f

(
x0 ) + (x0 , y )
(
x0 )
lim (x , y)
x
x0
x
x
y
y
=0+0
0 lim
=0
lim
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
=0
k
xx
0 k
lim
f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))
=0
k
xx
0 k
x0
o equivalentemente que
x0
es decir, que f es derivable en x

0 .
Ojala y el lector este de acuerdo en que el arduo trabajo que nos tomamos para probar que la
funcion del ejemplo 4.23 es derivable para cualquier x
0 R2 distinto del 0, ser
a redituable.
En efecto, n
otese que m
as all
a de la forma explcita de f , lo importante en la argumentaci
on
anterior fueron dos cosas:
1. que las derivadas parciales de f existieron para todos los puntos de R2 , y
2. que fueron continuas en x
0 .
Con respecto al punto 1, y como el lector estar
a de acuerdo (dado el caracter local de la
derivada), en el desarrollo anterior hubiera bastado con que las derivadas parciales existieran en
una vecindad del punto x
0 .
Pues bien, lo que probaremos a continuaci
on es que estas dos condiciones (con la modificaci
on
propuesta a la primera), son suficientes para poder asegurar que una funcion es derivable en un
punto x
0 , lo que dejaremos formulado en la siguiente
Proposici
0 U y r > 0 tal que Br (
x0 ) U . Si
para cada x
Br (
x0 ) y
x
0 .
f
xi
f
x)
xi (
existe
es continua en x
0 (para cada i {1, . . . , n}) entonces f es derivable en

(0)
(0)
= (x1 , . . . , xn ), hacemos
Demostraci
on. Sea x
Br (
x0 ), x
6= x
0 . Si x
0 = x1 , . . . , xn y x

(0)
x
i = x1 , . . . , xi , xi+1 , . . . , x(0)
n
para cada i {1, . . . , n 1} y x

n = x
. Por el inciso (a) del problema 11 del captulo 1 sabemos
que x
i Br (
x0 ) para cada i {1, . . . , n 1} y como Br (
x0 ) es un conjunto convexo entonces los
segmentos [
xi1 , xi ] Br (
x0 ) para cada i {1, . . . , n}.
183
J. P
aez
Por otra parte, n

otese que
f (
x) f (
x0 ) = (f (
x) f (
xn1 )) + (f (
xn1 ) f (
xn2 )) + + (f (
x2 ) f (
x1 )) + (f (
x1 ) f (
x0 ))
n
X
(f (
xi ) f (
xi1 ))
=
i=1
Ahora, dado que

(0)
ei
x
i x
i1 = xi xi
por la proposici
on 4.13 sabemos que existe i [
xi1 , x
i ] tal que

(0) f
f (
xi ) f (
xi1 ) = xi xi
i
xi
para cada i {1, . . . , n}, de modo que
f (
x) f (
x0 ) =
n
X
(f (
xi ) f (
xi1 ))
i=1
n
X
f
i
xi
i=1

f
f f
1 ,
2 , . . . ,
n
(
xx
0 )
=
x1
x2
x2
Por lo tanto
(0)
xi xi
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
de modo que
= |f (
x) f (
x0 ) Df (
x0 )(
xx
0 )|

f
f
f

1 ,
2 , . . . ,
n
(
xx
0 ) f (
x0 ) (
xx
0 )
=
x
x
x2
1 2

f
f
f

=
1 ,
2 , . . . ,
n
f (
x0 ) (
xx
0 )
x
x2
x2
1

f
f
f
1 ,
2 , . . . ,
n
xx
0 )k

f (
x0 )
k(

x1
x2
x2
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
k
xx
0 k

f
f
f

,
,
.
.
.
,

f
(
x
)
1
2
n
0

x1
x2
x2
Si ahora recordamos que por el inciso (b) del problema 11 del captulo 1 se tiene que

xx
0 k
0 k
i x
entonces i x
0 si x
x
0 de modo que, como
tenemos que
0 lim
x0
J. P
aez
f
xi
es continua en x
0 (para cada i {1, . . . , n}),
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
k
xx
0 k
184

f
f f

1 ,
2 , . . . ,
n
f (
x0 )
lim

x
x0
x1
x2
x2
= kf (
x0 ) f (
x0 )k
=0
es decir
lim
x0
|f (
x) (Df (
x0 )(
xx
0 ) + f (
x0 ))|
=0
k
xx
0 k
lo cual prueba que f es derivable en x

0 .
Es importante hacer notar que la condici

on de la proposici
on anterior s
olo es una condici
on
suficiente de la derivabilidad de f en x
0 ; es decir, si bien es cierto que la existencia de la derivada
de f en x
0 garantiza la existencia de todas sus derivadas direccionales en este punto (incluyendo
sus derivadas parciales), este hecho ni siquiera garantiza que existan todas las derivadas parciales
de f en todos los puntos de alguna vecindad de x
0 .
Esta u
ltima afirmacion la ilustramos en el siguiente
f (x, y) = |xy|
N
otese que
f (h, 0) f (0, 0)
f
(0, 0) = lim
h0
x
h
|h0| |00|
= lim
h0
h
=0
y que
f
f (0, h) f (0, 0)
(0, 0) = lim
h0
y
h
|0h| |00|
= lim
h0
h
=0
Por lo tanto, tomando a Df (0, 0) como la constante 0, tenemos que
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))
k(x, y) (0, 0)k
(x,y)(0,0)
|xy|
=
lim
(x,y)(0,0) k(x, y)k
lim
k(x, y)k2
(x,y)(0,0) k(x, y)k
lim
lim
(x,y)(0,0)
k(x, y)k
=0
185
J. P
aez
de modo que
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))
=0
k(x, y) (0, 0)k
(x,y)(0,0)
lim
lo que prueba que f es derivable en el (0, 0).

Por otra parte, n
otese que tomando cualquier punto de la forma (x0 , 0), con x0 6= 0, de acuerdo
con la definici
on de derivada parcial, se tiene que
f (x0 , h) f (x0 , 0)
f
(x0 , 0) = lim
h0
y
h
|x0 h| 0
= lim
h0
h
|h|
= |x0 | lim
h0 h
y como este u
ltimo lmite no existe, entonces f
y (x0 , 0) no existe.
An
alogamente, para cualquier punto de la forma (0, y0 ), con y0 6= 0, se tiene que
f (h, y0 ) f (0, y0 )
f
(0, y0 ) = lim
h0
x
h
|hy0 | 0
= lim
h0
h
|h|
= |y0 | lim
h0 h
de modo que f
x (0, y0 ) tampoco existe.
Por tanto, en cualquier vecindad del (0, 0) se tiene que existen puntos para los cuales
no existen, que es lo que deseabamos mostrar (ver figura 4.7).
f
x
f
y
Figura 4.7: Grafica de la funcion f (x, y) = |xy| (del ejemplo 4.25) cuyas derivadas parciales no existen
en los puntos de la forma (x, 0), con x 6= 0 y (0, y), con y 6= 0.
Aun y cuando el ejemplo anterior muestra sin lugar a dudas que la proposici
on 4.24 s
olo nos
proporciona una condici
on suficiente de la derivabilidad de una funcion en un punto, nos tomaremos
J. P
aez
186
el trabajo de dar otro ejemplo en el que, a diferencia del ejemplo anterior, las derivadas parciales
s existen en una vecindad del punto en cuesti
on, y lo u
nico que no sucede es que sean continuas
en el punto en el que la funci
on s es derivable.

1
2
2
(x + y ) sen
x2 +y 2
f (x, y) =
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
En este caso tenemos que
f
f (h, 0) f (0, 0)
(0, 0) = lim
h0
x
h
1
= lim h sen
h0
|h|
=0
y
f (0, h) f (0, 0)
f
(0, 0) = lim
h0
y
h

1
= lim h sen
h0
|h|
=0
y si (x, y) 6= (0, 0), con base en la proposici

on 4.11, obtenemos que

1
x
1
2x sen 2 2 2 2 cos 2 2
f
x +y
x +y
x +y
(x, y) =
2y sen
f
(x, y) =
1
x2 +y 2
2y 2
x +y
cos
21 2
x +y
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
Si ahora tomamos puntos de la forma (t, 0), con t > 0, se tiene que

f
1
1
(t, 0) = 2t sen
cos
x
t
t
y como
no existe, concluimos que

1
1
cos
lim 2t sen
t0
t
t

f
(x, y)
(x,y)(0,0) x
lim
187
J. P
aez
alogamente, evaluando en puntos de la

no existe, de modo que f
x no es continua en el (0, 0). An
f
forma (0, t), con t > 0, concluimos que y no es continua en el (0, 0).

1
2
2
(x + y ) sen
x2 +y 2
f (x, y) (Df (0, 0)((x, y) (0, 0)) + f (0, 0))
lim
=
lim
k(x, y) (0, 0)k
k(x, y)k
(x,y)(0,0)
(x,y)(0,0)
!
1
=
lim k(x, y)k sen p
(x,y)(0,0)
x2 + y 2
=0
lo que demuestra que f s es derivable en el (0, 0).

Con el ejemplo anterior concluimos el an
alisis de las condiciones necesarias y suficientes relacionadas con la derivabilidad de una funcion. Lo siguiente que haremos ser
a mostrar la relaci
on
entre este concepto y la aritmetica de las funciones, la cual dejaremos plasmada en la siguiente
Proposici
on 4.27 Sean f, g : U Rn R y x
0 U . Si f y g son derivables en x
0 entonces:
1. f + g es derivable en x
0 y adem
as
D(f + g)(
x0 ) = Df (
x0 ) + Dg(
x0 )
2. si R, f es derivable en x
0 y adem
as
D(f )(
x0 ) = Df (
x0 )
3. f g es derivable en x
0 y adem
as
D(f g)(
x0 ) = f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )
4. si g(
x0 ) 6= 0, f /g es derivable en x
0 y adem
as
D(f /g)(
x0 ) =
1
(g(
x0 )Df (
x0 ) f (
x0 )Dg(
x0 ))
g 2 (
x0 )
Demostraci
on. A manera de ejemplo, probaremos el inciso 3 y el resto quedar
an como problemas
para el lector. Una vez dicho lo anterior, n
otese que
(f g)(
x) (f g)(
x0 ) [f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )] (
xx
0 )
= f (
x) [g(
x) g(
x0 )] + g(
x0 ) [f (
x) f (
x0 )] [f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )] (
xx
0 )
= f (
x) [g(
x) g(
x0 ) Dg(
x0 ) (
xx
0 )] + [f (
x) f (
x0 )] Dg(
x0 ) (
xx
0 )
+ g(
x0 ) [f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )]
de tal forma que
(f g)(
x) (f g)(
x0 ) (f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )) (
xx
0 )
k
xx
0 k
J. P
aez
188
g(
x) g(
x0 ) Dg(
x0 ) (
xx
0 )
Dg(
x0 ) (
xx
0 )
+ [f (
x) f (
x0 )]
k
xx
0 k
k
xx
0 k
f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
+ g(
x0 )
k
xx
0 k
= f (
x)
Para el primer y tercer sumando que aparecen en el lado derecho de esta u

ltima identidad, dado
que f y g son derivables en x
0 (y por lo tanto continuas en ese mismo punto), podemos concluir
que

g(
x) g(
x0 ) Dg(
x0 ) (
xx
0 )
g(
x) g(
x0 ) Dg(
x0 ) (
xx
0 )
= lim f (
x)
lim
lim f (
x)
x
x0
x
x0
x
x0
k
xx
0 k
k
xx
0 k
= f (
x0 )0
=0
y
lim g(
x0 )
x0
f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
= g(
x0 ) lim
x
x0
k
xx
0 k
k
xx
0 k
= g(
x0 )0
=0
que
Por otra parte, por el inciso (c) del problema 11 del captulo 2, sabemos que existe M 0 tal
|Df (
x0 ) (
xx
0 )| M k
xx
0 k
para toda x
Rn , y como f es continua en x
0 , concluimos que

Dg(
x0 ) (
xx
0 )

0 lim [f (
x) f (
x0 )]

x
x0
k
xx
0 k
M lim |f (
x) f (
x0 )|
x
x0
= M0
=0
y por lo tanto que
lim [f (
x) f (
x0 )]
x0
Sumando estos lmites, concluimos que

lim
x0
Dg(
x0 ) (
xx
0 )
=0
k
xx
0 k
(f g)(
x) (f g)(
x0 ) (f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )) (
xx
0 )
=0
k
xx
0 k
de modo que la funci

on f g es derivable en x
0 y adem
as que
D(f g)(
x0 ) = f (
x0 )Dg(
x0 ) + g(
x0 )Df (
x0 )
Para concluir con las propiedades de la derivada relacionadas con las operaciones entre funciones, formularemos (en dos proposiciones separadas) aquellas que nos hablan de la composici
on
de funciones.
189
J. P
aez
Ser
an dos proposiciones diferentes puesto que existen dos formas de componer a una funcion de
Rn en R con funciones para las cuales tambien tenemos una definicion de derivada: por la izquierda,
con una funcion de R en R, o por la derecha, con una funcion de R en Rn .
Ambas proposiciones ser
an un caso particular de un resultado m
as general que veremos m
as
adelante (y que se le conoce con el nombre de regla de la cadena).
Proposici
0 U , (a, b) R tal que f (U ) (a, b) y g : (a, b)
R R. Si f es derivable en x
0 y g es derivable en f (
x0 ) entonces g f es derivable en x
0 y adem
as
D(g f )(
x0 ) = g (f (
x0 ))Df (
x0 )
Demostraci
on. Recordemos que, de acuerdo con la definicion 4.14, lo que tenemos que demostrar
es que
(g f )(
x) (g f )(
x0 ) g (f (
x0 ))Df (
x0 )(
xx
0 )
=0
lim
x
x0
k
xx
0 k
raz
on por la cual empezaremos por buscar una expresi
on adecuadamente equivalente al numerador del cociente anterior.
Para ello, definamos
kx = f (
x) f (
x0 )
y observemos que, como f es derivable en x
0 entonces f es continua en x
0 (proposici
on 4.21), se
tiene que
x) f (
x0 ))
lim kx = lim (f (
x0
x0
=0
En el caso en que kx 6= 0, tenemos que

(g f )(
x) (g f )(
x0 ) = g(f (
x)) g(f (
x0 ))
g(f (
x0 ) + kx ) g(f (
x0 ))
kx
=
kx
g(f (
x0 ) + kx ) g(f (
x0 ))
=
(f (
x) f (
x0 ))
kx
g(f (
x0 ) + kx ) g(f (
x0 ))
(f (
x) f (
x0 ) Df (
x0 )(
xx
0 ) + Df (
x0 )(
xx
0 ))
=
kx
g(f (
x0 ) + kx ) g(f (
x0 ))
=
(f (
x) f (
x0 ) Df (
x0 )(
xx
0 ))
kx
g(f (
x0 ) + kx ) g(f (
x0 ))
+
Df (
x0 )(
xx
0 )
kx
de tal manera que
(g f )(
x) (g f )(
x0 ) g (f (
x0 ))Df (
x0 )(
xx
0 )
g(f (
x0 ) + kx ) g(f (
x0 ))
(f (
x) f (
x0 ) Df (
x0 )(
xx
0 ))
=
kx

g(f (
x0 ) + kx ) g(f (
x0 ))
+
g (f (
x0 )) Df (
x0 )(
xx
0 )
kx
J. P
aez
190
y por lo tanto
(g f )(
x) (g f )(
x0 ) g (f (
x0 ))Df (
x0 )(
xx
0 )
k
xx
0 k

x) f (
x0 ) Df (
x0 )(
xx
0 )
g(f (
x0 ) + kx ) g(f (
x0 )) f (
=
kx
k
xx
0 k

g(f (
x0 ) + kx ) g(f (
x0 ))
x
x
0
+
g (f (
x0 )) Df (
x0 )
kx
k
xx
0 k
(4.26)
Como seguramente el lector ya habra notado, cada uno de los sumandos del lado derecho de
esta u
ltima identidad tienden a 0 cuando x
x
0 .
En efecto, los factores del primer sumando tienen lmite; el primero tiende a g (f (
x0 )) (puesto
que g es derivable en f (
x0 )) y el segundo tiende a 0 (puesto que f es derivable en x
0 ).
En cuanto al segundo sumando, su primer factor tiende a 0 (nuevamente porque g es derivable
en f (
x0 )) mientras que para el segundo factor, por el inciso (c) del problema 11 del captulo 2,
sabemos que existe M 0 tal que
|Df (
x0 ) (
xx
0 )| M k
xx
0 k
de tal modo que

x
x
0
Df (
M
x0 )

k
xx
0 k
y por lo tanto todo el sumando tiende a 0 cuando x

x
0 .
Toda la argumentaci
on anterior es correcta bajo el supuesto de que kx = f (
x) f (
x0 ) 6= 0; lo
que ahora mostraremos es que para considerar el caso en que kx = 0, ser
a necesario introducir una
funcion auxiliar1 : U Rn R definida de la siguiente forma
g(f (
x))g(f (
x0 ))
si f (
x) f (
x0 ) 6= 0
f (
x)f (
x0 )
(
x) =
g (f (
x0 ))
si f (
x) f (
x0 ) = 0
Lo primero que haremos notar es que la igualdad 4.26 se escribe en terminos de la funci
on
como

(g f )(
x) (g f )(
x0 ) g (f (
x0 ))Df (
x0 )(
xx
0 )
f (
x) f (
x0 ) Df (
x0 )(
xx
0 )
= (
x)
k
xx
0 k
k
xx
0 k

x
x
0
+ (
x) g (f (
x0 )) Df (
x0 )
k
xx
0 k
y que ahora esta identidad se cumple para toda x
U, x
6= x
0 .
Si ahora recordamos que f es continua en x
0 , y dado que g es derivable en f (
x0 ), aplicando el
resultado del problema 48 del captulo 2, sabemos que es continua en x
0 y por tanto
(g f )(
x) (g f )(
x0 ) g (f (
x0 ))Df (
x0 )(
xx
0 )
x
x0
k
xx
0 k

f (
x) f (
x0 ) Df (
x0 )(
xx
0 )
x
x
0
= lim (
x)
+ (
x) g (f (
x0 )) Df (
x0 )
x
x0
k
xx
0 k
k
xx
0 k
lim
Esto es lo que siempre se hace en todas las pruebas de las diferentes variantes de la regla de la cadena, como
seguramente el lector ya habr
a notado a estas alturas.
191
J. P
aez

x
x
0
f (
x) f (
x0 ) Df (
x0 )(
xx
0 )
x) g (f (
x0 )) Df (
x0 )
+ lim (
= lim (
x)
x
x0
x
x0
k
xx
0 k
k
xx
0 k

x
x
0
x) g (f (
x0 )) Df (
x0 )
= (
x0 )0 + lim (
x
x0
k
xx
0 k

x
x
0
x) g (f (
x0 )) Df (
x0 )
= lim (
x
x0
k
xx
0 k
=0

en donde la u
ltima identidad se satisface dado que

x) g (f (
x0 )) = lim (
x) g (f (
x0 ))
lim (
x
x0
x0
= (
x0 ) g (f (
x0 ))
= g (f (
x0 )) g (f (
x0 ))
=0
y que, como mencionamos p

arrafos arriba, existe M 0 tal que

x
x
0
Df (
M
x
)
0

k
xx
0 k
para toda x
Rn , x
6= x
0 .
Como afirmamos anteriormente, a una funcion f de Rn en R tambien la podemos componer

(por la derecha) con una funci
on de R en Rn , y para esta composici
on tambien podemos establecer una regla de la cadena, es decir, una regla que establece que bajo la hip
otesis de que
ambas funciones son derivables (en los puntos adecuados), entonces dicha composici
on tambien es
derivable, y adem
as nos da una forma de como calcular esta derivada.
En la formulaci
on (y prueba) de este resultado representaremos a la derivada de f a traves de
su vector gradiente.
Proposici
0 U , : (a, b) R Rn tal que (a, b) U , y
t0 (a, b) tal que (t0 ) = x
0 . Si f es derivable en x
0 y es derivable en t0 entonces f es
derivable en t0 y adem
as
(f ) (t0 ) = f (
x0 ) (t0 )
Demostraci
on. Dado que la composici
on f es una funcion de R en R, de acuerdo con la
defincion de la derivada de este tipo de funciones, debemos de mostrar que
lim
tt0
(f )(t) (f )(t0 )
t t0
existe.
De esta forma, lo primero que haremos ser
a escribir de manera mas adecuada a este cociente.
Notese que, si (t) (t0 ) 6=
0, entonces
(f )(t) (f )(t0 )
t t0

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 )) + f ((t0 )) ((t) (t0 ))
=
t t0
k(t) (t0 )k
J. P
aez
192

k(t) (t0 )k
=
t t0
f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 ))

k(t) (t0 )k
+ f ((t0 ))
(t) (t0 )
t t0
De esta u
ltima identidad es facil concluir que, como: (t) (t0 ) si t t0 (puesto que es
continua en t0 ya que es derivable en t0 ), que f es derivable en x
0 = (t0 ), y que la expresi
on
k(t) (t0 )k
t t0
est
a acotada en una vecindad de t0 pues

k(t) (t0 )k
(t) (t0 )
= lim

lim
tt0 t t0

tt0
t t0

= (t0 )
(nuevamente porque es derivable en t0 ), de modo que

k(t) (t0 )k f ((t)) f ((t0 )) f ((t0 )) ((t) (t0 ))
=0
lim
tt0
t t0
k(t) (t0 )k
Ahora, por el inciso 3 de la proposici

(t) (t0 )
(t) (t0 )
lim f ((t0 ))
= lim f ((t0 )) lim
tt0
tt0
tt0
t t0
t t0
= f ((t0 )) (t0 )
con lo cual obtendramos el resultado deseado.
Sin embargo (y como el lector ya habra notado), el argumento anterior s
olo es correcto si (t)
(t0 ) 6= 0. Para que el razonamiento anterior sea valido incluso en el caso en el que (t) (t0 ) =
0,
nuevamente recurriremos a una funcion auxiliar que resuelve el problema.
Sea : (a, b) R R definida como
f ((t))f ((t0 ))f ((t0 ))((t)(t0 ))
si (t) (t0 ) 6= 0
k(t)(t0 )k
(t) =
0
si (t) (t0 ) = 0
Es facil verificar que
k(t) (t0 )k
(f )(t) (f )(t0 )
= (t)
+ f ((t0 ))
t t0
t t0
(t) (t0 )
t t0
para toda t (a, b), t 6= t0 , y por otra parte, como el lector probara en el problema 12, es continua
en t0 de tal forma que
k(t) (t0 )k
lim (t)
=0
tt0
t t0
de modo que

(t) (t0 )
k(t) (t0 )k
(f )(t) (f )(t0 )
= lim (t)
+ f ((t0 ))
lim
tt0
tt0
t t0
t t0
t t0
= f ((t0 )) (t0 )
193
J. P
aez
que es lo que dese

abamos demostrar.
Esta u
ltima proposici
on, adem
as de proporcionarnos una regla de derivacion, tiene dos consecuencias de caracter pr
actico muy importantes.
La primera de ellas se relaciona con los conjuntos de nivel de una funcion f de Rn en R y
el problema de determinar un vector que este en la direcci
on normal a dicho conjunto (en un
punto especfico de este). Concretamente, mostraremos que si x
0 pertenece al conjunto de nivel
Nc (f ) := {
x U Rn | f (
x) = c}, entonces f (
x0 ) es normal a Nc (f ) en x
0 , afirmacion que
dejaremos formulada en el siguiente corolario y cuya demostracion se deja al lector.
Si x
Corolario 4.30 Sea f : U Rn R derivable en x
0 U tal que f (
x0 ) 6= 0.
0 Nc (f ) (el
conjunto de nivel c de f ) entonces f (
x0 ) es normal a Nc (f ) en x
0 . Es decir que para cualquier
: (a, b) R Rn tal que: (t) Nc (f ) para toda t (a, b), es derivable en t0 (a, b), y
(t0 ) = x
0 , se tiene que
f ((t0 )) (t0 ) = 0
Como se ilustro en el captulo 2, una buena cantidad de objetos geometricos muy conocidos
(sobre todo en R2 y en R3 ) se pueden ver como conjuntos de nivel de una funcion de Rn en R.
Lo interesante del corolario anterior, es que nos proporciona los elementos suficientes para definir
(de forma muy sencilla) el concepto de recta tangente y plano tangente para el caso particular de
conjuntos de nivel en R2 y en R3 , respectivamente.
Definici
on 4.31 Sea f : U R2 R derivable en x
0 = (x0 , y0 ) U tal que f (
x0 ) 6= 0. Decimos
2
que la recta (en R ) determinada por la ecuaci
on cartesiana
f
f
(
x0 ) (x x0 ) +
(
x0 ) (y y0 ) = 0
x
y
es la recta tangente en x
0 del conjunto (o curva) de nivel Nf (x0 ) .
Definici
on 4.32 Sea f : U R3 R derivable en x
0 = (x0 , y0 , z0 ) U tal que f (
x0 ) 6=
0.
3
Decimos que el plano (en R ) determinado por la ecuaci
on cartesiana
f
f
f
(
x0 ) (x x0 ) +
(
x0 ) (y y0 ) +
(
x0 ) (z z0 ) = 0
x
y
z
es el plano tangente en x
0 del conjunto de nivel Nf (x0 ) .
A continuaci
on, daremos un par de ejemplos en los que se muestra como se obtienen esta recta
y este plano tangente.
Ejemplo 4.33 Consideremos:
1. la curva determinada por la ecuaci
on
(x2 + y 2 2x)2 = 4(x2 + y 2 )
la cual corresponde a la ya conocida cardiode.
Lo que ahora queremos hacer notar es que la cardiode es el conjunto de nivel 0 de la funci
on
f (x, y) = (x2 + y 2 2x)2 4(x2 + y 2 )
J. P
aez
194
que resultar
a muy conveniente si se quiere calcular sus rectas tangentes.
Para esta funci
on se tiene que
f
(x, y) = 2(x2 + y 2 2x) (2x 2) 8x
x
y
f
(x, y) = 2(x2 + y 2 2x) (2y) 8y
y
de tal forma que

f (x, y) = 4 (x2 + y 2 2x) (x 1) 2x, y(x2 + y 2 2x 2)

= 4 (x 1)2 + y 2 1 (x 1) 2 (x 1) 2, y (x 1)2 + y 2 3

= 4 (x 1) (x 1)2 + y 2 3 2, y (x 1)2 + y 2 3
de modo que, si f (x0 , y0 ) 6= (0, 0), este vector es normal a la curva (en el punto (x0 , y0 )) y
se tiene que la recta dada por la ecuaci
on
f (x0 , y0 ) (x x0 , y y0 ) = 0
o equivalentemente
f
f
(x0 , y0 )(x x0 ) +
(x0 , y0 )(y y0 ) = 0
x
y
es la ecuaci
on de la recta tangente a la curva (en el punto (x0 , y0 )).
Si en particular tomamos los puntos en que la cardiode intersecta al eje Y , es decir los puntos
(0, 2) y (0, 2), se tiene que
f (0, 2) = (16, 16)
f (0, 2) = (16, 16)
de modo que la ecuaci

on de las respectivas rectas tangentes est
an dadas por
16x + 16(y 2) = 0
y =x+2
y
16x 16(y + 2) = 0
y = x 2
lo que ya habamos obtenido en el captulo 3.

2. Sea S R3 el conjunto definido como

x2 y 2 z 2
S = (x, y, z) R3 | 2 + 2 + 2 = 1
a
b
c
el cual corresponde a un elipsoide con centro en el (0, 0, 0) (ver figura 4.8).
Como en el caso de la cardiode, este conjunto tampoco se puede obtener (completo) como la
gr
afica de una funci
on de R2 en R.
Aun y cuando algunas partes de este conjunto s se pueden ver como una de estas gr
aficas,
en terminos de los c
alculos que hay que realizar (usando la ecuaci
on 4.16), resulta mucho
m
as f
acil observar que se puede obtener como el conjunto de nivel 1 de la funci
on
f (x, y, z) =
195
x2 y 2 z 2
+ 2 + 2
a2
b
c
J. P
aez
y como
x y z
, ,
a2 b2 c2
si (x0 , y0 , z0 ) es cualquier punto del elipsoide, entonces f (x0 , y0 , z0 ) 6= (0, 0, 0) y por lo tanto
la ecuaci
on del plano tangente en este punto estar
a dada por
x y z
0
0
0
f (x0 , y0 , z0 ) (x x0 , y y0 , z z0 ) = 0 =
, ,
(x x0 , y y0 , z z0 )
a2 b2 c2
f (x, y, z) = 2
la cual, al simplificarla, se reduce a la ecuaci

on
y
z
x
0
0
0
x
+
y
+
z=1
a2
b2
c2
Figura 4.8: El elipsoide determinado por la ecuacion
x2
8
y2
3
z2
5
= 1, analogo al del ejemplo 4.33.
Como el lector habra notado, en el ejemplo anterior se hace enfasis en que los conjuntos involucrados no se pueden obtener como la gr
afica de una funcion de R en R, para el primer inciso, o de
2
una funcion de R en R, para el segundo.
La raz
on de ello es que el concepto de recta tangente y plano tangente ya se tenan definidos
para este tipo de objetos, pero dada la incapacidad de verlos de esta forma, se quiso resaltar la
conveniencia de poderlos obtener como un conjunto de nivel de una cierta funcion, para as poder
aplicar las definiciones 4.31 y 4.32.
Pero si bien es cierto que no todo conjunto de nivel en R2 se puede ver como la gr
afica de una
funcion de R en R, ni todo conjunto de nivel en R3 se puede ver como la gr
afica de una funcion de
R2 en R, lo recproco s se cumple (problema 10 del captulo 2).
Pues bien, en los problemas 5 y 6 de este captulo, pedimos al lector que pruebe que los
conceptos de recta y plano tangente dados en las definiciones 4.31 y 4.32, coinciden con los conceptos
correspondientes para los de gr
afica de una funcion.
Mas adelante, en el captulo 5, probaremos un importante resultado (el Teorema de la Funci
on
Implcita) del cual podremos deducir, bajo ciertas hip
otesis, que un conjunto de nivel en R2 (o
en R3 ) s se puede obtener, cuando menos en partes, como la gr
afica de una funcion de R en R
(de R2 en R). Apoyados en este teorema, se podr
a probar entonces que la recta y plano tangente
definidos en 4.31 y 4.32 tambien se pueden obtener como la recta (o plano) tangente a la gr
afica
de una cierta funci
on de R en R (o de R2 en R), respectivamente.
J. P
aez
196
Otra interpretacion del resultado de la proposici

on 4.29 que tendra un uso muy importante, es el
siguiente: si f : U Rn R, x
0 U , : (a, b) R Rn , con (a, b) U , y t0 (a, b), son tales
que (t0 ) = x
0 , es un hecho que la composici
on (f )(t) = f ((t)) refleja el comportamiento de
f sobre los puntos de la curva recorrida por la funcion .
Con base en lo anterior, es facil convencerse de que la derivada de esta composici
on en t0 se
puede interpretar como la raz
on de cambio de f en x
0 cuando nos aproximamos a este punto por
la curva descrita por .
Aqu es importante destacar que resulta natural que esta raz
on de cambio se vea afectada
por la velocidad con la que se aproxima al punto x
0 , lo que queda evidenciado en la formula
(f ) (t0 ) = f ((t0 )) (t0 )
(4.27)
De esta manera, si lo que deseamos es interpretar a (f ) (t0 ) como la raz

on de cambio de f
en x
0 (cuando nos acercamos a este punto por la curva descrita por la funcion ), es importante
que sea tal que (t0 ) 6=
0.
De hecho, si suponemos que es una parametrizacion por longitud de arco, es decir que k (t)k =
1 para cada t (a, b), para que no haya problema con la velocidad (o para ser mas exactos, con
la rapidez) con la que nos aproximamos a x
0 , la derivada de f en t0 no es mas que la derivada
direccional de f en x
0 , en la direcci
on del vector (t0 ) (que ahora sera de norma 1).
En efecto, si ahora usamos la notaci
on Df (
x0 ) para referirnos a la derivada de f en x
0 , usando
la proposici
(f ) (t0 ) = f ((t0 )) (t0 )
= Df (
x0 )( (t0 ))
= D (t0 ) f (
x0 )
y m
as aun, si s
olo se tiene que (t0 ) 6= 0 (aunque este vector no sea de norma 1), la identidad 4.27
se puede escribir como
(f ) (t0 ) = f ((t0 )) (t0 )

(t0 )

= (t0 ) f ((t0 ))
k (t0 )k

(t0 )

= (t0 ) Df (
x0 )
k (t0 )k

x0 )
= (t0 ) D (t0 ) f (
(4.28)
k (t0 )k
Que la raz
on de cambio de una funcion f sobre la curva descrita por una funcion en un punto
x
0 sea igual a la derivada direccional de f en x
0 , en la direcci
on de (t0 ) (normalizado) multiplicada
por la rapidez con que se aproxima a x
0 , no hace mas que confirmar que el concepto de derivada
es un concepto local (simplemente recuerde el lector que, cerca del punto x
0 = (t0 ), y su recta
tangente se parecen mucho).
Ilustremos la discusion anterior con el siguiente
Ejemplo 4.34 Sean f : R2 \ {(0, 0)} R definida como
f (x, y) =
x2
xy
+ y2
y : R R2 definida como (t) = (r cos(t), r sen(t)).

197
J. P
aez
N
otese que
(f )(t) = f ((t))
(r cos(t)) (r sen(t))
=
(r cos(t))2 + (r sen(t))2
cos(t) sen(t)
=
cos2 (t) + sen2 (t)
= cos(t) sen(t)
de modo que
(f ) (t) = cos(t) sen (t) + cos (t) sen(t)
= cos2 (t) sen2 (t)

f (x, y) =
=
=

f
f
(x, y),
(x, y)
x
y
!

y x2 + y 2 2x (xy) x x2 + y 2 2y (xy)
,
(x2 + y 2 )2
(x2 + y 2 )2

!
y y 2 x2 x x2 y 2
,
(x2 + y 2 )2 (x2 + y 2 )2
y
(t) = (r sen(t), r cos(t))
de tal forma que, de acuerdo con la identidad 4.27 se debe tener que
(f ) (t)
= f ((t)) (t)

2
2
2
2
(r cos(t)) (r cos(t)) (r sen(t))
(r sen(t)) (r sen(t)) (r cos(t))
,
=
(t)
2
2

2
2
2
2
(r cos(t)) + (r sen(t))
(r cos(t)) + (r sen(t))

1
sen(t) sen2 (t) cos2 (t) , cos(t) cos2 (t) sen2 (t) (r sen(t), r cos(t))
r

= cos2 (t) sen2 (t) [( sen(t), cos(t)) ( sen(t), cos(t))]
=
= cos2 (t) sen2 (t)
lo cual coincide con el primer c

alculo que hicimos.
La identidad

(f ) (t0 ) = (t0 ) D
(t0 )
f (
x0 )
k (t0 )k
(bajo el supuesto de que (t0 ) 6=

0) tendra implicaciones pr
acticas muy importantes, sobre todo en
lo relacionado con el c
alculo de la derivada de una funcion f cuando esta este descrita en terminos
de coordenadas diferentes a las cartesianas, como las que mencionamos en el captulo 1.
Y justo esto es lo que nos disponemos a desarrollar en la siguiente secci
on.
J. P
aez
198
4.3.3
La derivada en otras coordenadas
En el captulo 1 introdujimos, para el caso particular de los puntos o vectores del plano o del
espacio, otros sistemas de coordenadas diferentes de las coordenadas cartesianas. En ese captulo
ya describimos las caractersticas m
as importantes de esas otras coordenadas, de tal forma que aqu
las vamos a usar con toda libertad.
Nuestro objetivo en esta secci
on, es encontrar una representacion de la derivada de una funci
on
que est
a dada en terminos de algunas de estas coordenadas. Para ello, es importante tener presentes
los siguientes dos hechos:
1. dado que la derivada es una funcion lineal, para tener una representacion de ella es suficiente
conocer sus valores en los elementos de una base ortonormal de R2 o R3 (dependiendo de
d
onde este contenido el dominio de la funcion con la que estemos tratando), y
2. si nuestra funci
on est
a expresada en terminos de algunas de estas coordenadas (polares,
cilndricas o esfericas), los u
nicos calculos que estaremos en condiciones de hacer, consistiran
en derivar estas expresiones con respecto a las variables en las que esten escritas.
Empezaremos por analizar el segundo punto, y para ello supondremos que tenemos una funci
on
f : U R2 R que est
a expresada en terminos de las coordenadas polares (, ) de cada punto
x
U.
Derivar la expresi
on que define a la funcion f con respecto a una de sus variables, por ejemplo
, significara que en dicha expresi
on s
olo consideraremos como variable a , y a la variable la
trataremos como una constante.
En terminos m
as elementales, es decir, recordando que todo proceso de derivacion con respecto
de una variable consiste en el c
alculo de un lmite (independientemente de que para obtener estas
derivadas hagamos uso de algunas de las reglas de derivacion que ya conocemos), lo que estaremos
haciendo es obtener el siguiente lmite:
f ( + h, ) f (, )
h0
h
lim
(4.29)
Sin duda el cociente que aparece en el lmite anterior representa una raz
on de cambio de la
funcion f , y lo que analizaremos con mas cuidado es sobre que puntos del dominio de f se est
a
calculando esta raz
on de cambio.
Para tener una idea m
as precisa de que tipo de puntos son aquellos cuyas coordenadas polares
son de la forma ( + h, ), recurriremos a las formulas de conversi
on entre coordenadas polares y
coordenadas cartesianas que dedujimos en el captulo 1.
De esta forma, si llamamos x
U al punto cuyas coordenadas polares son (, ), tenemos que
las coordenadas cartesianas de x
est
an dadas por la pareja ( cos(), sen()), y si llamamos x
h U
al punto cuyas coordenadas polares son ( + h, ), sus coordenadas cartesianas estar
an dadas por
(( + h) cos(), ( + h) sen()).
Notese entonces que
x
h = (( + h) cos(), ( + h) sen())
= ( cos(), sen()) + h(cos(), sen())
=x
+ h(cos(), sen())
lo que significa que x
h siempre es un punto que est
a en la recta que pasa por x
, en la direcci
on del
vector (cos(), sen()) (justo la que hace un angulo con el eje polar) (ver figura 4.9).
199
J. P
aez
Y
( + h, )
(, )
x
h
sen()
e (
x)
cos()

h de coordenadas polares
( + h, ) esta en la misma direcci
on que x
(si y + h tienen el mismo signo), y que el vector unitario
e (
x) de coordenadas cartesianas (cos(), sen()).
En virtud de lo anterior, si denotamos por e (
x) al vector de coordenadas (cartesianas) (cos(), sen()),
tenemos que el lmite 4.29 se reescribe como
f (
x + h
e (
x)) f (
x)
f ( + h, ) f (, )
= lim
h0
h0
h
h
lim
de tal forma que, por la definicion 4.2 y la proposici

f (
x + h
e (
x)) f (
x)
f ( + h, ) f (, )
= lim
h0
h0
h
h
= De (x) f (
x)
lim
= Df (
x)(
e (
x))
Df (
x)(
e (
x)) = lim
h0
f ( + h, ) f (, )
h
(4.30)
Esta u
ltima identidad es muy afortunada ya que nos dice que el proceso de derivacion con
respecto de la variable que describimos al inicio de esta discusion, coincide con ser la evaluaci
on
de la derivada de f en x
(Df (
x)) en el vector unitario e (
x), lo que sin duda es de mucha ayuda
para lograr nuestro objetivo (el de obtener una expresi
on de Df (
x), como lo mencionamos al inicio
de esta secci
on).
a de acuerdo, lo que ahora habra que hacer es la otra
derivada, es decir, derivar la expresi
on que define a f con respecto de la variable (tratando
a la variable como constante), y esperar que esta otra derivada tambien coincida con ser la
evaluaci
on de la derivada de f en x
(Df (
x)) en alg
un otro vector unitario, que junto con el vector
2
e (
x), forme una base ortonormal de R (so
nar no cuesta nada!).
Aun y cuando este sue
no no se nos cumplira completo, lograremos despertar con una soluci
on
al problema que nos planteamos resolver en esta secci
on! Manos a la obra!
Derivar la expresi
on que define a f con respecto de la variable (tratando a la variable como
constante), nuevamente se traduce en calcular el siguiente lmite:
f (, + h) f (, )
h0
h
lim
J. P
aez
200
(4.31)
Como en el caso anterior, el cociente que aparece en este lmite tambien representa una raz
on
de cambio de la funci
on f , y lo que haremos otra vez, ser
a analizar sobre que puntos del dominio
de f se est
a calculando esta raz
on de cambio, para lo cual recurriremos nuevamente a las formulas
de conversi
on entre coordenadas polares y coordenadas cartesianas.
Si como antes llamamos x
al punto cuyas coordenadas polares son (, ), y x
h ahora al de
coordenadas polares (, + h), tendremos que las correspondientes coordenadas cartesianas ser
an
( cos(), sen()) y ( cos( + h), sen( + h)), respectivamente.
Con base en estas coordenadas cartesianas, es facil notar ahora que x
y x
h son puntos que
pertenecen a la misma circunferencia (la de radio con centro en el origen), y que si h es un
n
umero cercano a 0, entonces x
h es un punto cercano a x
(ver figura 4.10).
Y
(, + h)
x
h
(, )
h
X
h de coordenadas
polares (, + h) est
a en la misma circunferencia (la de radio ) que x
.
De esta forma, la derivada con respecto de la variable de la funcion f (que se obtiene al
calcular el lmite 4.31) se puede interpretar como el calculo de la raz
on f
cuando nos aproximamos a x
por puntos de la misma circunferencia que pasa por este punto.
Por lo tanto, si parametrizamos esta circunferencia por la funcion : R R2 definida como
(h) = ( cos( + h), sen( + h))
el lmite 4.31) tambien se puede reescribir como
f ((h)) f ((0))
f (, + h) f (, )
= lim
h0
h0
h
h
= (f ) (0)
lim
Como seguramente el lector recordara, la proposici

on 4.29 nos asegura que
(f ) (0) = f ((0)) (0)
= f (
x) ( sen(), cos())
= f (
x) ( sen(), cos())
= Df (
x)( sen(), cos())
de tal forma que si ahora denotamos por e (

x) al vector de coordenadas cartesianas ( sen(), cos())
(que es de norma 1 y perpendicular al vector e (
x)!), tenemos que
f (, + h) f (, )
= Df (
x)(
e (
x))
h0
h
lim
201
J. P
aez
Aun y cuando esta u

ltima identidad no nos asegura que la derivada con respecto de la variable
de la funcion f sea exactamente igual a la derivada de f en x
(Df (
x)) evaluada en alg
un vector
unitario (como sucedio en el caso anterior), si 6= 0, concluimos que
Df (
x)(
e (
x)) =
f (, + h) f (, )
1
lim
h0
h
(4.32)
Las identidades 4.30 y 4.32 nos proporcionan la soluci

on al problema que nos planteamos al
incio de esta secci
on (para el caso de las coordenadas polares): como encontrar una representaci
on
de la derivada de una funci
on que est
a dada en terminos de este tipo de coordenadas.
Es fundamental que el lector tenga claro la forma en que qued
o resuelto este problema. Como
mencionamos en el punto n
umero 1 al incio de esta secci
on, dado que la derivada de una funcion es
una funcion lineal, esta queda completamente determinada si se conocen sus valores en los elementos
de una base ortonormal (en este caso de R2 ). Y las identidades 4.30 y 4.32 justo nos proporcionan
estos valores para la base ortonormal formada por los vectores e (
x) y e (
x), que sin duda forman
una de estas bases.
Lo que es importante destacar es que estos vectores dependen del punto en el que estemos
calculando la derivada de f (lo que por cierto, explica la notaci
on que usamos para representarlos);
si cambiamos de punto, cambiamos de base en la cual estamos representando a la funcion lineal
Df (
x) (ver figura 4.11).
Y
e (
x)
e (
x )
e (
x )
e (
x)
X
Figura 4.11: Cuando una funcion f est
a dada en terminos de coordenadas polares, la derivada de f
se expresa en una base ortonormal que depende del punto en donde se evalue, {
e (
x), e (
x)} para el
punto x
, y {
e (
x ), e (
x )} para el punto x
.
El otro aspecto importante de la soluci
on que encontramos a nuestro problema est
a en la forma
en que est
an dados los valores de la derivada de f en x
(Df (
x)) en los vectores e (
x) y e (
x):
calculando lo u
nico que podamos calcular (como lo mencionamos en el punto 2 al inicio de esta
secci
on), la derivada con respecto a las variables y de la expresi
on que define a f , y que se
obtienen por medio de los lmites que aparecen en las identidades 4.30 y 4.32.
Estas derivadas parciales, aunque an
alogas a las que definimos en 4.9 no son del mismo tipo
en virtud de que no siempre resultan ser una derivada direccional. Por esta raz
on, lo siguiente que
haremos ser
a definir este otro tipo de derivadas parciales.
Definici
on 4.35 Sea f : U R2 R una funci
on que est
a expresada en terminos de las coordenadas polares (, ) de cada punto x
U . Si x
0 U tiene coordenadas polares (0 , 0 ), definimos:
J. P
aez
202
1. la derivada parcial de f con respecto de en x

0 , que denotamos por
f
x0 ),
(
como
f
x0 ),
(
como
f
f (0 + h, 0 ) f (0 , 0 )
(
x0 ) := lim
h0
h
2. la derivada parcial de f con respecto de en x
0 , que denotamos por
f (0 , 0 + h) f (0 , 0 )
f
(
x0 ) := lim
h0
h
Con base en estas definiciones podemos resumir lo obtenido hasta ahora, de la siguiente manera:
si f : U R2 R es una funci
on que est
a expresada en terminos de las coordenadas polares (, )
de cada punto x
U, y x
0 U , x
0 6= (0, 0), tiene coordenadas polares (0 , 0 ), la derivada de f en
x
0 (Df (
x0 )) est
a representada en la base ortonormal formada por los vectores
e (
x0 ) := (cos(0 ), sen(0 ))
e (
x0 ) := ( sen(0 ), cos(0 ))
por la matriz (de 1 2)
o por el vector
f
x0 )
(

f (
x0 ) =
1 f
x0 )
0 (

f
1 f
(
x0 ),
(
x0 )
1 f
f
(
x0 )
e (
x0 ) +
(
x0 )
e (
x0 )
es decir que f
x0 ) y 10 f
x0 ) son las coordenadas del gradiente de f en x
0 (f (
x0 )) en la base
(
(
{
e (
x0 ), e (
x0 )} .
Por otra parte, y de acuerdo con las identidades 4.19 y 4.18, como
e (
x0 ) = (cos(0 ), sen(0 ))
= cos(0 )
e1 + sen(0 )
e2
y
e (
x0 ) = ( sen(0 ), cos(0 ))
= sen(0 )
e1 + cos(0 )
e2
se tiene que
h
h
f
x0 )
x (
f
x0 )
y (
f
x0 )
(
1 f
x0 )
0 (
=
i
h
=
f
x0 )
(
1 f
x0 )
0 (
i cos( ) sen( )
0
0
sen(0 ) cos(0 )
(4.33)
f
x0 )
y (
i cos( ) sen( )
0
0
sen(0 ) cos(0 )
(4.34)
f
x0 )
x (
f
f
1
f
(
x0 ) = cos(0 ) (
x0 )
sen(0 ) (
x0 )
x
203
J. P
aez
f
f
1
f
(
x0 ) = sen(0 ) (
x0 ) +
cos(0 ) (
x0 )
y
y
f
f
f
(
x0 ) = cos(0 ) (
x0 ) + sen(0 ) (
x0 )
x
y
f
f
f
(
x0 ) = 0 sen(0 ) (
x0 ) + 0 cos(0 ) (
x0 )
x
y
en donde recuerde que (0 , 0 ) son las coordenadas polares de x
0 .
Con relaci
on a la condici
on que impusimos de que x
0 6= (0, 0), como el lector ya sabra, las
coordenadas polares del origen son cualquier pareja de la forma (0, ), en donde puede ser cualquier
valor. Este hecho imposibilita la elecci
on de la base ortonormal {
e (
x0 ), e (
x0 )}, lo que a su vez
(en algunos casos) se ve reflejado en la imposibilidad de calcular el lado derecho de la identidad
4.32. Esto es lo que nos hace imponer la condici
on de que x
0 6= (0, 0).
El lector seguramente estar
a de acuerdo en que lo siguiente que habra que hacer es un ejemplo
que ilustre todo lo desarrollado en esta secci
on. Y eso es justo lo que haremos.
on f : R2 R que est
a expresada en terminos de las coordenadas
polares (, ) de cada punto x
R2 por
f (, ) = (2 2 cos())2 42
f
(, ) = 2(2 2 cos()) (2 2 cos()) 8
f
(, ) = 2(2 2 cos()) (2 sen())
de tal forma que la derivada de f en un punto x

6= 0 cuyas coordenadas polares sean (, ), es la
funci
on lineal Df (
x) cuya matriz asociada (de 1 2) en la base ortonormal {
e (
x), e (
x)} es
h
i

f
1 f
(,
)
(,
)
= 2(2 2 cos()) (2 2 cos()) 8 4 sen()(2 2 cos())

o la determinada por el vector que tiene coordenadas (tambien en la base {
e (
x), e (
x)})

2(2 2 cos()) (2 2 cos()) 8, 4 sen()(2 2 cos())
es decir que

f (, ) = 2(2 2 cos()) (2 2 cos()) 8, 4 sen()(2 2 cos())
Si en particular tomamos el punto x

0 cuyas coordenadas polares son (2, /2), tenemos que las
coordenadas del gradiente de f en x
0 en la base {
e (
x0 ), e (
x0 )} est
an dadas por
f (
x0 ) = (16, 16)
Si ahora el lector observa que la funci
on f de este ejemplo es la misma funci
on que dimos en el
inciso 1 del ejemplo 4.33 (basta con que recurra a las f
ormulas de cambio de coordenadas para que
J. P
aez
204
4.4. Derivadas direccionales de orden superior Captulo 4. La derivada de funciones de Rn en R

compruebe este hecho); que el punto x
0 que tiene coordenadas polares (2, /2), tiene coordenadas
cartesianas (0, 2) (en la base can
onica {
e1 , e2 }); y que
e (
x0 ) = (cos(/2), sen(/2))
= (0, 1)
= 0
e1 + 1
e2
y
e (
x0 ) = ( sen(/2), cos(/2))
= (1, 0)
= 1
e1 + 0
e2
de acuerdo con la identidad 4.19, se debe tener que
h
f
x0 )
x (
f
x0 )
y (
=
=
16 16
16 16
0 1
1 0
o lo que es equivalente, que las coordenadas de f (

x0 ) en la base can
onica {
e1 , e2 } deben estar
dadas por

f
f
(
x0 ),
(
x0 )
f (
x0 ) =
x
y
= (16, 16)
lo cual coincide con lo obtenido en el ejemplo mencionado.
Aun y cuando el c
alculo de la derivada s
olo lo hicimos para funciones de R2 en R expresadas en
terminos de coordenadas polares, para funciones de R3 en R expresadas en terminos de coordenadas
cilndricas o esfericas, el an
alisis es completamente an
alogo al anterior y lo dejaremos como un par
de problemas para el lector.
4.4
Derivadas direccionales de orden superior
Si para una funci

on f : U Rn R y un vector unitario u
Rn fijo, se tiene que Du f (
x)
n
existe para todo x
U , entonces Du f es nuevamente una funcion de U R en R, es decir,
Du f : U Rn R. De esta forma, todos los conceptos de derivacion que hasta ahora hemos
definido para una funci
on f , los podemos trabajar para esta nueva funcion.
En particular, podemos ahora preguntarnos por la existencia de la derivada direccional de Du f
en un punto x
U , en la direcci
on de cualquier otro vector unitario v Rn . De acuerdo con la
definicion 4.2, dicha derivada se denotara por Dv (Du f )(
x) y estara dada por
Du f (
x + h
v ) Du f (
x)
h0
h
Dv (Du f )(
x) := lim
Mas aun, si ahora para u

y v fijos, se tiene que Dv (Du f )(
U , entonces
Dv (Du f ) ser
a otra vez una funci
on de U Rn en R y por tanto tiene sentido tomar otro vector
205
J. P
aez
Captulo 4. La derivada de funciones de Rn en R 4.4. Derivadas direccionales de orden superior

unitario w
Rn y preguntarnos por la existencia de la derivada direccional de Dv (Du f ) en un
punto x
U , en la direcci
on del vector w,
es decir, si existe
Dw (Dv (Du f ))(
x) := lim
h0
Dv (Du f )(
x + hw)
Dv (Du f )(
x)
h
Antes de seguir por este camino, tomemos un respiro y notemos lo siguiente: seguramente a
estas alturas, y tomando en cuenta resultados como los de la proposici
on 4.24, el lector ya intuye
la importancia de las derivadas direccionales de una funcion f en la direcci
on de los vectores de
una base ortonormal {
e1 , . . . , en }, es decir, de las derivadas parciales.
Por esta raz
on, y aun y cuando las ideas planteadas en los p
arrafos anteriores se pueden seguir
trabajando en ese contexto m
as general, nos concentraremos en el caso particular de las derivadas
parciales, ideas que dejaremos expresadas en la siguiente
Definici
0 U , r > 0 tal que Br (
x0 ) U , y x1 , . . . , xn las
f
(
x) existe para toda
coordenadas determinadas por una base ortonormal {
e1 , . . . , en } de Rn . Si x
i
x
Br (
x0 ) definimos la segunda derivada parcial de f con respecto a xi y respecto a xj en x
0 , que
f
2f
x0 ), como la derivada parcial de la funci
on xi con respecto de xj en x
0 ,
denotaremos por xj xi (
es decir
f
f
(
x0 + h
ej ) x
(
x0 )
2f
i
(
x0 ) := lim xi
h0
xj xi
h
Si j = i, la derivada anterior la denotamos por
parcial de f con respecto de xi , en x
0 .
2f
(
x0 )
x2i
y decimos que es la segunda derivada
Como en el caso de la (primera) derivada parcial, desde un punto de vista pr

actico el calculo
de las segundas derivadas parciales se realiza siguiendo el mismo esquema: en cada paso, derivar
s
olo con respecto a una variable, suponiendo que las dem
as son constantes. Como es de esperarse,
lo que ahora sigue es un ejemplo que ilustre este concepto.
Ejemplo 4.38 Sea f : R2 R dada por la expresi
on
f (x, y) = x cos(xy) + y sen(xy)
Lo que haremos ser
a calcular todas las posibles segundas derivadas parciales de f (que son
cuatro) para cualquier x
= (x, y) R2 .
Para ello, notemos primero que
f
(x, y) = xy sen(xy) + cos(xy) + y 2 cos(xy)
x
y que
f
(x, y) = x2 sen(xy) + xy cos(xy) + sen(xy)
y
Por tanto, se tiene que

2f
x2
(x, y) =
f
x
(x, y)
x
= xy 2 cos(xy) y sen(xy) y sen(xy) y 3 sen(xy)
= xy 2 cos(xy) 2y sen(xy) y 3 sen(xy)

J. P
aez
206

y que
2f
yx
(x, y) =
f
x
(x, y)
y
= x2 y cos(xy) x sen(xy) x sen(xy) xy 2 sen(xy) + 2y cos(xy)
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + 2y cos(xy)

Finalmente
2f
xy
(x, y) =
f
y
(x, y)
x
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + y cos(xy) + y cos(xy)
= x2 y cos(xy) 2x sen(xy) xy 2 sen(xy) + 2y cos(xy)

y
2f
y 2
(x, y) =
f
y
(x, y)
y
= x3 sen(xy) x2 y sen(xy) + x cos(xy) + x cos(xy)
= x3 sen(xy) x2 y sen(xy) + 2x cos(xy)
Del ejemplo anterior es muy importante hacer dos observaciones con respecto al calculo de las
segundas derivadas parciales en las que aparecen ambas variables (x y y), y que se les conoce con
el nombre de derivadas parciales mixtas (o cruzadas).
Una, que se refiere al orden en que se toman estas variables para calcular las correspondientes
derivadas, y que es de derecha a izquierda, seg
un aparezcan en el denominador correspondiente; y
dos, que en este ejemplo, estas segundas derivadas parciales resultaron ser iguales.
De esta segunda observaci
on, sin duda surge la pregunta de si dicha igualdad siempre se cumple,
y la respuesta es que no. En el problema 19 el lector encontrar
a un ejemplo de que esta identidad
no siempre sucede.
Por nuestra parte, lo siguiente que haremos ser
a justo enunciar un resultado que nos proporciona
las condiciones suficientes para que dicha igualdad s se cumpla.
Un punto importante en la prueba de este resultado tiene que ver con un hecho muy sencillo,
relacionado con los valores de una funcion sobre cualesquiera cuatro puntos de su dominio (que
los podemos pensar como cuatro vertices de un cuadrilatero), y el calculo de ciertas diferencias
tomadas a partir de estos valores.
Notese que, si x
1 , x2 , x
3 y x
4 son puntos del dominio de una funcion f , entonces se tiene que
(f (
x3 ) f (
x2 )) (f (
x4 ) f (
x1 )) = (f (
x3 ) f (
x4 )) (f (
x2 ) f (
x1 ))
Teorema 4.39 (de las parciales cruzadas) Sean f : U Rn R, x
0 U y r > 0 tal que
2f
2f
Br (
x0 ) U . Si las segundas derivadas parciales xj xi y xi xj existen para cada x
Br (
x0 ) y
son continuas en x
0 entonces
2f
2f
(
x0 ) =
(
x0 )
xj xi
xi xj
207
J. P
aez

Demostraci
on. Sea Br (
0) = {(h1 , h2 ) R2 | k(h1 , h2 )k < r}. Notese que si (h1 , h2 ) Br (
0)
entonces x
0 + h1 ei + h2 ej , x
0 + h1 ei y x
0 + h2 ej pertenecen a Br (
x0 ) Rn , de modo que podemos
definir H : Br (
0) R2 R como
H(h1 , h2 ) = (f (
x0 + h1 ei + h2 ej ) f (
x0 + h1 ei )) (f (
x0 + h2 ej ) f (
x0 ))
(4.35)
Ahora, si (h1 , h2 ) Br (
0) definimos
q

q
q
g : x R | |x| < r 2 h22 = r 2 h22 , r 2 h22 R R
como
g(x) = f (
x0 + x
ei + h2 ej ) f (
x0 + x
ei )

p
p
Entonces, como h1 r 2 h22 , r 2 h22 , se tiene que
H(h1 , h2 ) = (f (
x0 + h1 ei + h2 ej ) f (
x0 + h1 ei )) (f (
x0 + h2 ej ) f (
x0 ))
= g(h1 ) g(0)
Por otra parte, observe que por la proposici

on 4.29 g es derivable en su dominio y
g (x) =
f
f
(
x0 + x
ei + h2 ej )
(
x0 + x
ei )
xi
xi
de modo que por el Teorema de Valor Medio (para funciones de R en R), existe

q
q
2
2
2
2
r h2 , r h2
tal que
H(h1 , h2 ) = g(h1 ) g(0)
= g ()h1

f
f
=
(
x0 +
ei + h2 ej )
(
x0 +
ei ) h1
xi
xi
Finalmente, como [
x0 +
ei , x0 +
ei + h2 ej ] Br (
x0 ) y (
x0 +
ei + h2 ej ) (
x0 +
ei ) = h2 ej ,
f
por la proposici
on 4.13 (aplicada a la funcion xi ) se tiene que existe (0, |h2 |) tal que

f
f
H(h1 , h2 ) =
(
x0 +
ei + h2 ej )
(
x0 +
ei ) h1
xi
xi

f
x
i
(
x0 +
ei +
ej )h1 h2
=
xj
2f
(
x0 +
ei +
ej )h1 h2
=
xj xi
Por lo tanto, si h1 h2 6= 0, por la continuidad de
(0, 0), concluimos que
2f
xj xi
en x
0 , y que (, ) (0, 0) si (h1 , h2 )
2f
H(h1 , h2 )
=
lim
(
x0 +
ei +
ej )
h1 h2
(,)(0,0) xj xi
(h1 ,h2 )(0,0)
lim
J. P
aez
208
2f
(
x0 )
xj xi
Observe ahora que para cada (h1 , h2 ) Br (0), la funcion H definida en 4.35 tambien se puede
escribir como
H(h1 , h2 ) = (f (
x0 + h1 ei + h2 ej ) f (
x0 + h2 ej )) (f (
x0 + h1 ei ) f (
x0 ))
de tal forma que si definimos

q

q
q
g : x R | |x| < r 2 h21 = r 2 h21 , r 2 h21 R R
como
g(x) = f (
x0 + h1 ei + x
ej ) f (
x0 + x
ej )

p
p
dado que h2 r 2 h21 , r 2 h21 , se tiene que
H(h1 , h2 ) = g(h2 ) g(0)
Procediendo
con la funci
p
on g como lo hicimos anteriormente con la funcion g, se tiene que existe
p
r 2 h21 , r 2 h21 tal que
H(h1 , h2 ) = g(h2 ) g(0)
= g ( )h2

f
f
(
x0 + h1 ei + ej )
(
x0 + ej ) h2
=
xj
xj
y como [
x0 + ej , x
0 + h1 ei + ej ] Br (
x0 ), con (
x0 + h1 ei + ej ) (
x0 + ej ) = h1 ei , nuevaf
) se tiene que existe (0, |h1 |) tal
mente por la proposici
on 4.13 (aplicada a la funcion x
j
que

f
f
H(h1 , h2 ) =
(
x0 + h1 ei + ej )
(
x0 + ej ) h2
xj
xj

f
x
j
=
(
x0 + ei + ej )h1 h2
xi
2f
(
x0 + ei + ej )h1 h2
=
xi xj
De esta forma, si h1 h2 6= 0, por la continuidad de
(h1 , h2 ) (0, 0), concluimos que
2f
xi xj
en x
0 y que ( , ) (0, 0) si
H(h1 , h2 )
2f
=
lim
(
x0 + ei + ej )
h1 h2
(h1 ,h2 )(0,0)
( , )(0,0) xi xj
lim
2f
(
x0 )
xi xj
de donde, como el lmite de cualquier funcion, si existe, es u

nico, tenemos que
2f
H(h1 , h2 )
(
x0 ) =
lim
xj xi
h1 h2
(h1 ,h2 )(0,0)
209
J. P
aez
2f
(
x0 )
xi xj
que es la identidad que deseabamos probar.

Como mencionamos al incio de esta secci
on, podemos calcular sucesivamente tantas derivadas
direccionales (en la misma o en diferentes direcciones) como nos lo permita la funcion con la que
estemos trabajando.
Dado que en terminos pr
acticos es suficiente con hacer esto para los vectores de una base
can
onica de Rn , lo siguiente que haremos ser
a extender la definicion 4.37 para cualquier k N.
Definici
0 U , r > 0 tal que Br (
x0 ) U , k N y x1 , . . . , xn
las coordenadas determinadas por una base ortonormal {
e1 , . . . , en } de Rn . Si i1 , . . . , ik , ik+1
kf
{1, . . . , n} son tales que xi x
(
Br (
x0 ) definimos la k + 1 derivada
i
k
parcial de f con respecto a xi1 , . . . , xik , xik+1 , en x

0 , que denotaremos por
como la derivada parcial con respecto de xik+1 de la funci
on
k+1 f
(
x0 ) := lim
h0
xik+1 xik xi1
k f
x0
xik xi1 (
k f
xik xi1
+ h
eik+1 )
h
en x
0 , es decir
k f
x0 )
xik xi1 (
Si i1 = i2 = = ik = ik+1 = i, la derivada anterior la denotamos por
que es la k + 1 derivada parcial de f con respecto de xi , en x

0 .
k+1 f
x0 ),
xik+1 xik xi1 (
k+1 f
(
x0 )
xk+1
i
y decimos
A proposito de la notaci
on usada en esta definicion, y en concordancia con la u
ltima parte,
en general, si en la expresi
on xik xi1 existen m ndices consecutivos iguales, esta parte de la
expresi
on la sustituiremos por xm
i , en donde xi es la variable que se repite m veces consecutivas.
Por ejemplo, la derivada parcial de orden 6
6f
(
x0 )
x3 x2 x2 x3 x1 x1
se podr
a escribir como
6f
(
x0 )
x3 x22 x3 x21
Dada k N, como seguramente el lector recordara de sus cursos de algebra, existen nk formas
de elegir ordenaciones (con repetici
on) con elementos del conjunto {1, . . . , n}, de tal forma que
k
existen n derivadas parciales de orden k para una funcion f de Rn en R.
Cuando todas estas derivadas parciales existen en los puntos de un conjunto (abierto) sobre el
cual este definida la funci
on f , y adem
as son continuas en este mismo conjunto, diremos que f
es una funci
on de clase C k . Este concepto jugara un papel muy importante mas adelante, y lo
dejaremos plasmado en la siguiente
Definici
on 4.41 Sean f : U Rn R y k N. Decimos que f es una funci
on de clase C k en
U si existen todas las derivadas parciales de orden k de f en cada punto de U , y adem
as estas
derivadas parciales son continuas en cada punto de U .
El concepto anterior est
a muy relacionado con las hip
otesis de la proposici
on 4.24 y el teorema
4.39, raz
on por la cual enunciaremos el siguiente par de proposiciones y dejaremos su prueba al
lector.
J. P
aez
210
4.5. Aproximaci
on polinomial
Proposici
on 4.42 Si f : U Rn R es de clase C 1 en U entonces f es derivable para toda
x
U.
Proposici
on 4.43 Si f : U Rn R es de clase C 2 en U entonces
2f
2f
(
x) =
(
x)
xi xj
xj xi
para toda x
U y para todas i, j {1, . . . , n}.
Cuando una funci
on es de clase C k , muchas de sus derivadas parciales de orden k coinciden. En
efecto, si en dos derivadas parciales de orden k de una funcion f se deriva con respecto a las mismas
variables, y adem
as se deriva (con respecto de cada una de ellas y sin importar el orden) el mismo
n
umero de veces, entonces estas derivadas parciales son iguales. Enunciar con toda precision (y
probar!) la afirmacion anterior no est
a dentro de los objetivos de este texto, y s
olo baste decir que
en el fondo su prueba se basa en el teorema 4.39.
Antes de iniciar con otro tema, es importante enfatizar que conceptos hemos definido (y cu
ales
no hemos definido!) en esta secci
on.
Como lo dice su nombre, aqu s
olo definimos el concepto de derivadas direccionales de orden
superior de una funci
on f , lo que no significa que hayamos definido el concepto de derivada (global)
de orden superior de f .
Como hemos venido insistiendo, la derivada de una funcion f es una funcion que a cada x
del
n
dominio de f le asocia una funci
on lineal de R en R que denotamos por Df (
x). Siguiendo la idea
de que la segunda derivada de una funcion f debera de ser la derivada de la derivada de f , para
definir este concepto tendramos que definir lo que significa derivar una funcion cuyo dominio est
a
contenido en Rn y que tiene como contradominio al conjunto de las funciones lineales de Rn en R.
Como posiblemente el lector estar
a de acuerdo, este es un tema que escapa a los objetivos de
este texto.
No obstante lo anterior, con los conceptos desarrollados en esta secci
on nos es suficiente para
abordar un tema muy importante relacionado con la aproximacion de una funcion cerca de un
punto, tema que abordaremos en la siguiente secci
on.
4.5
Aproximaci
on polinomial
Como el lector recordara, el concepto de derivada (global) de una funcion f de Rn en R en un

punto x
0 , est
a intimamente relacionado con el problema de aproximar a dicha funcion alrededor (o
cerca) de x
0 por medio de una funci
on lineal.
En terminos m
as concretos, la derivabilidad de f en x
0 se reduce al hecho de que la funci
on
P (
x) = Df (
x0 )(
xx
0 ) + f (
x0 )
es la u
nica funci
on de este tipo que tiene la propiedad de que
lim
x0
f (
x) P (
x)
=0
k
xx
0 k
(4.36)
Si ahora recordamos que

Df (
x0 )(
xx
0 ) = f (
x0 ) (
xx
0 )
211
J. P
aez
4.5. Aproximaci
on polinomial

(0)
(0)
tendremos que en un sistema de coordenadas x1 , . . . , xn , en donde x
0 = x1 , . . . , xn , la funci
on
P toma la forma
P (
x) = P (x1 , . . . , xn )
= f (
x0 ) (
xx
0 ) + f (
x0 )
n

X f
(0)
+ f (
x0 )
(
x0 ) xi xi
=
xi
(4.37)
i=1
de donde concluimos que P es una funcion polinomial de grado a lo mas 1 de las coodenadas (o
variables) x1 , . . . , xn con la particularidad de que P (
x0 ) = f (
x0 ).
Visto de esta forma, y con base en la proposici
on 4.24, podemos asegurar que si las derivadas
f
parciales x
existen
en
una
vecindad
del
punto
x
este (lo que se satisface

0 y son continuas en
i
1
sobradamente si f es de clase C en una vecindad de x
0 ), entonces el polinomio de grado a lo m
as
1 en las variables x1 , . . . , xn dado por 4.37 es el u
nico polinomio que satisface la condici
on 4.36.
Como seguramente el lector ya se estar
a imaginando, la siguiente pregunta que nos haremos
ser
a la siguiente: que propiedades deber
a tener una funcion f para que podamos asegurar que
existe una funci
on polinomial de grado a lo m
as 2 en las variables x1 , . . . , xn , con la particularidad
de que valga lo mismo que f en x
0 , tal que se parezca mucho a f alrededor de x
0 ?
Para abordar este problema, empezaremos analizando el caso de una funcion definida en R2 .
Supongamos entonces que f : U R2 R y que x
0 = (x0 , y0 ) U .
Primero notemos que una funci
on P2 (x, y) polinomial en las variables x y y de grado a lo m
as
2, es de la forma
P2 (x, y) = Ax2 + By 2 + Cxy + Dx + Ey + F
y que si se desea que esta funci
on tome el valor f (
x0 ) cuando (x, y) = (x0 , y0 ) entonces deber
a ser
de la forma
P2 (x, y) = A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + D(x x0 ) + E(y y0 ) + f (
x0 ) (4.38)
por lo que nuestro problema se reduce a encontrar los coeficientes A, B, C, D y E.
Ahora, si el criterio para decir que P2 se parece mucho a f alrededor de x
0 es que satisfaga la
condici
on 4.36, dado que
(x x0 )2 , (y y0 )2 , |(x x0 )(y y0 )| k
xx
0 k2
entonces
(y y0 )2
(x x0 )(y y0 )
(x x0 )2
=
lim
=
lim
=0
xx
0 k
xx
0 k (x,y)(x0 ,y0 )
k
xx
0 k
(x,y)(x0 ,y0 ) k
(x,y)(x0 ,y0 ) k
lim
de modo que
f (
x) P2 (
x)
x
x0
k
xx
0 k

f (
x) A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) + D(x x0 ) + E(y y0 ) + f (
x0 )
= lim
x
x0
k
xx
0 k
f (
x) (D(x x0 ) + E(y y0 ) + f (
x0 ))
= lim
x
x0
k
xx
0 k
0 = lim
J. P
aez
212
4.5. Aproximaci
on polinomial
lo cual es equivalente a que f sea derivable en el punto x

0 , y por lo tanto se deber
a tener que
D=
f
(
x0 )
x
E=
f
(
x0 )
y
De esta forma, si f es derivable en x

0 entonces la funcion polinomial
P2 (x, y) = A(xx0 )2 +B(yy0 )2 +C(xx0 )(yy0 )+
f
f
(
x0 )(xx0 )+ (
x0 )(yy0 )+f (
x0 ) (4.39)
x
y
cumple la condici
on 4.36 para cualesquiera A, B y C n
umeros reales.
Y tal vez esta u
ltima parte no sea del todo una buena noticia, pues nos asegura que hay una
gran cantidad de funciones polinomiales de grado 2 que se parecen mucho a f alrededor de x
0 , lo
que sin duda nos deja con la pregunta de si de entre todas ellas no habra alguna que sea la mejor
de todas.
on ser
a mostrar que s existe un criterio con base en el cual podemos
elegir, de entre todas las funciones polinomiales dadas por 4.39, la que se parece mas a f alrededor
de x
0 . Para ello, basta con hacer notar que una forma de interpretar la multicitada condici
on 4.36,
es que el n
umero f (
x) P (
x) se hace 0 mucho m
as r
apido que el n
umero k
xx
0 k.
Con base en esta interpretacion, y dado que, si k
xx
0 k 1 se tiene que k
xx
0 k2 k
xx
0 k,
entonces pedir que
f (
x) P (
x)
=0
(4.40)
lim
2
x
x0 k
xx
0 k
sin duda es una condici
on m
as fuerte que la condici
on 4.36 (de hecho, por el problema 38 del
captulo 2, sabemos que si se cumple la condici
on anterior entonces se cumple la condici
on 4.36
(pero no lo recproco!)). Por esta raz
on, si suponemos que una funcion polinomial de grado a lo
m
as 2 satisface la condici
on 4.40, podemos dar por hecho que ya es de la forma 4.39.
Supongamos entonces que P2 es una funcion polinomial como en 4.39 que satisface la condici
on
4.40, es decir, supongamos que
f (
x) P2 (
x)
2
x
x0 k
xx
0 k

f (
x) A(x x0 )2 + B(y y0 )2 + C(x x0 )(y y0 ) +
= lim
x
x0
k
xx
0 k2
=0
lim
f
x0 )(x
x (
x0 ) +
f
x0 )(y
y (

y0 ) + f (
x0 )
Si nos aproximarnos a (x0 , y0 ) por puntos de la forma (x, y) = (x0 + h, y0 ), se deber

a tener que

(x
,
y
)h
+
f
(x
,
y
)
f (x0 + h, y0 ) Ah2 + f
0
0
0
0
x
0 = lim
2
h0
h
#
"
f (x0 + h, y0 ) f
x (x0 , y0 )h f (x0 , y0 )
A
= lim
h0
h2
de modo que al cociente
f (x0 + h, y0 )
f
x (x0 , y0 )h
h2
f (x0 , y0 )
lo podemos tratar como un cociente de dos funciones que dependen de la variable (real) h.
213
J. P
aez
4.5. Aproximaci
on polinomial
Ahora, si suponemos que f y sus derivadas parciales son funciones derivables en todos los puntos
de una vecindad del punto x
0 (lo cual se puede garantizar suponiendo que f es de clase C 2 en una
vecindad de este punto), aplicando (las veces que haga falta) la regla de LHospital para este tipo
de funciones (y por supuesto la regla de la cadena probada en la proposici
on 4.29), tenemos que
lim
h0
f (x0 + h, y0 )
f
x (x0 , y0 )h
h2
f (x0 , y0 )
f
x (x0
+ h, y0 ) f
x (x0 , y0 )
h0
2h
f
f
1
x (x0 + h, y0 ) x (x0 , y0 )
= lim
2 h0
h
2
1 f
=
(x0 , y0 )
2 x2
= lim
1 2f
(x0 , y0 )
2 x2
Aproximandonos a (x0 , y0 ) por puntos de la forma (x, y) = (x0 , y0 + h), por un procedimiento
an
alogo se concluye que
1 2f
B=
(x0 , y0 )
2 y 2
A=
Finalmente, para deducir el valor del coeficiente C, nos aproximaremos a (x0 , y0 ) por puntos de
la forma (x, y) = (x0 + h, y0 + h).
En este caso, usando nuevamente la regla de LHospital en la segunda y tercera identidad, se
deber
a tener que

2
2
f
x0 )h2 + 12 yf2 (
x0 )h2 + Ch2 + f
(
x
)h
+
(
x
)h
+
f
(
x
)
f (x0 + h, y0 + h) 12 xf2 (
0
0
x 0
y
0 = lim
2
h0
h

f
f
2f
2f
f
f
(x
+
h,
y
+
h)
+
(x
+
h,
y
+
h)
(
x
)
+
(
x
)
(
x
)h
+
(
x
)h
+
2Ch
+
0
0
0
0
0
0
x 0
y
x 0
y
x2
y 2
= lim
h0
2h
2
2
1 f
2f
2f
f
= lim
(x
+
h,
y
+
h)
+
(x
+
h,
y
+
h)
+
(x
+
h,
y
+
h)
+
(x0 + h, y0 + h)
0
0
0
0
0
0
h0 2 x2
yx
xy
y 2
2

f
2f
(
x0 ) + 2 (
x0 ) + 2C
x2
y

2f
1 2f
(
x0 ) +
(
x0 ) 2C
=
2 yx
xy
1
C=
2

2f
2f
(
x0 ) +
(
x0 )
yx
xy
De lo anterior concluimos que, si existen las segundas derivadas parciales de f (en al menos
una vecindad del punto x
0 y en este punto son continuas), y P2 es una funcion polinomial de grado
menor o igual a 2 que satisface la condici
on 4.40, entonces necesariamente P2 est
a dado por

2
1 f
2f
2f
2f
2
2
P2 (x, y) =
(
x0 ) +
(
x0 ) (x x0 )(y y0 )
(
x0 )(x x0 ) + 2 (y y0 ) +
2 x2
y
yx
xy
(4.41)
f
f
(
x0 )(x x0 ) +
(
x0 )(y y0 ) + f (
x0 )
+
x
y
J. P
aez
214
4.5. Aproximaci
on polinomial
Es importante enfatizar que el resultado anterior se obtuvo bajo el supuesto de que f es de clase
C 2 en una vecindad del punto x
0 , y de que existe una funcion polinomial de grado menor o igual
a 2 que satisface la condici
on 4.40. La buena noticia es que, bajo las mismas hip
otesis sobre f , lo
recproco tambien es cierto, es decir la funcion polinomial dada por 4.41 cumple la condici
on 4.40.
Seguramente a esta alturas el lector ya estar
a empezando a vislumbrar el resultado m
as general
hacia el cual estamos dirigiendo nuestros pasos. Todo parece indicar que, si f : U Rn R y
x
0 U son tales que f es de clase C N en una vecindad del punto x
0 para alguna N N, entonces
la funcion polinomial de grado a lo m
as N dada por
PN (
x)
= f (
x0 ) +
n

X
1
f
(0)
+ +
(
x0 ) xi xi
xi
N!
i=1
n
X
i1 ,...,iN =1

N f
(0)
(0)
(
x 0 ) x i1 x i1 x iN x iN
xi1 xiN

(0)
(0)
en donde x
= (x1 , . . . , xn ) y x
0 = x1 , . . . , xn , debe ser tal que
lim
x0
f (
x) PN (
x)
k
xx
0 kN
=0
y adem
as es la u
nica con esta propiedad.
Este resultado es conocido como el Teorema de Taylor , y aqu lo formularemos un poco diferente
a como lo acabamos de describir en el p
arrafo anterior. Tambien es importante mencionar que la
prueba de este teorema se basa en el Teorema de Taylor, en su versi
on para funciones de R en R.
Teorema 4.44 (de Taylor) Sean f : U Rn R, x
0 U , r > 0 y N N tales que f es de
N
+1
clase C
en Br (
x0 ) U . Definimos el polinomio de Taylor de grado N de la funci
on f en x
0 ,
que denotamos por PN,f,x0 (
x), como
PN,f,x0 (
x)
= f (
x0 ) +
n

X
1
f
(0)
+ +
(
x0 ) xi xi
xi
N!
i=1
n
X
i1 ,...,iN =1

N f
(0)
(0)
(
xiN xi1

(0)
(0)
0 , que
(en donde x
= (x1 , . . . , xn ) y x
0 = x1 , . . . , xn ), y el residuo de orden N de f en x
denotamos por RN,f,x0 (
x), como
RN,f,x0 (
x) = f (
x) PN,f,x0 (
x)
para x
U . PN,f,x0 y RN,f,x0 satisfacen que:
1. si x
Br (
x0 ) existe [
x0 , x
] tal que
RN,f,x0 (
x)
=
1
(N + 1)!
n
X
i1 ,...,iN ,iN+1 =1

N +1 f
(0)
(0)
(0)
xiN+1 xiN+1
xi1 xi1 xiN xiN
xiN+1 xiN xi1
2.
lim
x0
RN,f,x0 (
x)
N
k
xx
0 k
= lim
x0
215
f (
x) PN,f,x0 (
x)
k
xx
0 kN
=0
J. P
aez
4.5. Aproximaci
on polinomial
3. PN,f,x0 es el u
nico polinomio de grado menor o igual a N que satisface la condici
on del inciso
2.
Demostraci
on. Para la prueba del inciso (1), tomamos x
Br (
x0 ), x
6= x
0 (el caso x
=x
0 es
inmediato tomando = x
0 ), y definimos
g : (r/ k
xx
0 k , r/ k
xx
0 k) R R
como g(t) = f (
x0 + t(
xx
0 )).
=x
Por el problema 24 (tomando h
x
0 ) sabemos que g es de clase C N +1 en su dominio de
tal forma que, por el Teorema de Taylor para funciones de R en R, tenemos que
RN,0,g (1)
1
g(N +1) ()(1 0)
=
(N + 1)!
1
g(N +1) ()
=
(N + 1)!
n

X
N +1 f
1
(0)
(0)
(0)
xiN+1 xiN+1
=
xi1 xi1 xiN xiN
(N + 1)!
xiN+1 xiN xi1
i1 ,...,iN ,iN+1 =1
en donde = x
0 + (
xx
0 ) para alguna (0, 1), de modo que [
x0 , x
].
Por otra parte, como
RN,0,g (1) = g(1) PN,0,g (1)
= f (
x)
N
X
g (i) (0)
i=0
i!
(1 0)i
1
1 (N )
g (0) + +
g (0)
2!
N!
n

X
f
(0)
+ +
f (
x0 ) +
(
x0 ) xi xi
xi
= f (
x) (g(0) + g (0) +
= f (
x)
1
+
N!
n
X
i1 ,...,iN =1
i=1

N f
(0)
(0)
(
xiN xi1
= f (
x) PN,f,x0 (
x)
= RN,f,x0 (
x)
concluimos que
RN,f,x0 (
x)
1
=
(N + 1)!
n
X
i1 ,...,iN ,iN+1 =1
para alguna [
x0 , x
].
Ahora, dado que
J. P
aez

N +1 f
(0)
(0)
(0)
xiN+1 xiN+1
xi1 xi1 xiN xiN
xiN+1 xiN xi1

(0)
xx
0 k
xi xi k
216
4.5. Aproximaci
on polinomial
|RN,f,x0 (
x)|

1
=
(N + 1)!

(0)
(0)
(0)
xiN+1 xiN+1
xi1 xi1 xiN xiN
xiN+1 xiN xi1

i1 ,...,iN ,iN+1 =1

n

X

N +1 f
1
(0)
xi x(0) xi x(0) xi

x
N+1
N
iN+1
i1
iN
xi
1
(N + 1)!
xiN xi1
N+1
i1 ,...,iN ,iN+1 =1

n

X

1
N +1 f

k
xx
0 k k
xx
0 k k
xx
0 k
xi
(N + 1)!
x
x
i
i
1
N+1
N
i1 ,...,iN ,iN+1 =1

n

X

k
xx
0 kN +1
N +1 f

=

xi
(N + 1)!
xiN xi1
N+1
n
X
N +1 f
i1 ,...,iN ,iN+1 =1
de tal forma que
|RN,f,x0 (
x)|
k
xx
0 kN
1
k
xx
0 k
(N + 1)!
n
X
i1 ,...,iN ,iN+1 =1

xi

N +1 f

x
x
i
i
1
N+1
N
Por tanto, dado que f es de clase C N +1 en Br (

x0 ), se tiene que

N +1 f
N +1 f
(
x0 )
=
lim
x
x0 xiN+1 xiN xi1

xiN+1 xiN xi1
para todas i1 , , iN , iN +1 {1, . . . , n}, as concluimos que

lim
x0
RN,f,x0 (
x)
k
xx
0 kN
=0
lo cual prueba el inciso (2).

Finalmente, para la prueba del inciso (3), supongamos que PN es otro polinomio de grado menor
o igual a N para el cual se satisface que
lim
x0
f (
x) PN (
x)
k
xx
0 kN
=0
Dado que
lim
x0
f (
x) PN,f,x0 (
x)
N
k
xx
0 k
= lim
x0
=0
RN,f,x0 (
x)
k
xx
0 kN
restando estos dos u

ltimos lmites tenemos que
lim
x0
PN (
x) PN,f,x0 (
x)
k
xx
0 kN
=0
de tal forma que si hacemos P (

x) = PN (
x) PN,f,x0 (
x), se tiene que P es un polinomio de grado
menor o igual a N con la propiedad de que
lim
x0
P (
x)
k
xx
0 kN
217
=0
J. P
aez
4.5. Aproximaci
on polinomial
El siguiente paso ser

a demostrar que un polinomio con estas caracatersticas tiene que ser la
funcion constante 0.
Para ello, sea x
Rn , fija. Definimos p(t) = P (
x0 + t(
xx
0 )) para t R; n
otese que p ser
a un
polinomio en la variable t de grado a lo m
as N con la propiedad de que

p(t)
|P (
x0 + t(
xx
0 ))|
= lim

lim
t0 k(
t0 tN
x0 + t(
xx
0 )) x
0 kN
=0
o equivalentemente, que
p(t)
=0
t0 tN
lim
Por lo tanto, como para el caso de polinomios de una variable ya sabemos que p tiene que ser
la constante cero, concluimos que
0 = p(1)
= P (
x)
= PN (
x) PN,f,x0 (
x)
es decir, que PN (
x) = PN,f,x0 (
x) para toda x
Rn que es lo que queramos demostrar.
Los polinomios de Taylor son una herramienta muy importante en el an
alisis del comportamiento
de una funcion alrededor de un punto, y nos ser
an muy u
tiles cuando en la pr
oxima secci
on abordemos el tema de los valores m
aximos y mnimos de una funci
on.
Por ahora, veremos con un ejemplo c
omo se pueden usar para el calculo de lmites.
on
f (x, y) =
ln(1 + x2 ) + ln(1 + y 2 )
x2 + y 2
para (x, y) R2 , (x, y) 6= (0, 0).

Nuestro objetivo es calcular
lim
(x,y)(0,0)
f (x, y)
Para ello, bastar

a con calcular el polinomio de Taylor de grado 2 en el (0, 0) de la funci
on
g(x, y) = ln(1 + x2 ) + ln(1 + y 2 ) (dado que el denominador de f es x2 + y 2 = k(x, y)k2 ).
Para la funci
on g se tiene que
2x
g
(x, y) =
x
1 + x2
g
2y
(x, y) =
y
1 + y2
de modo que
2g
2
4x2
(x,
y)
=
x2
1 + x2 (1 + x2 )2
2g
(x, y) = 0
yx
y an
alogamente
2g
(x, y) = 0
xy
J. P
aez
2g
2
4y 2
(x,
y)
=
y 2
1 + y 2 (1 + y 2 )2
218
4.6. M
aximos y mnimos
De esta forma tenemos que
g
1
g
(0)x +
(0)y +
P2,g,0 (x, y) = g(
0) +
x
y
2
= x2 + y 2
2g
2g
2g 2
2g 2
(
0)x
+
(
0)xy
+
(
0)yx
+
(0)y
x2
yx
xy
y 2
y por lo tanto
lim
(x,y)(0,0)
ln(1 + x2 ) + ln(1 + y 2 )
x2 + y 2
(x,y)(0,0)
g(x, y)
=
lim
(x,y)(0,0) x2 + y 2
P2,g,0 (x, y) + R2,g,0 (x, y)
=
lim
x2 + y 2
(x,y)(0,0)
f (x, y) =
lim
lim
x2 + y 2 + R2,g,0 (x, y)
x2 + y 2
(x,y)(0,0)
lim
(x,y)(0,0)
=1+0
1+
R2,g,0 (x, y)
k(x, y)k2
=1
4.6
M
aximos y mnimos
Una de las aplicaciones m

as comunes de la derivada, es la localizacion de los puntos en los que una
funcion alcanza sus valores m
aximo y mnimo. De acuerdo con el corolario 2.51 del captulo 2, si
una funcion f : A Rn R es continua en un subconjunto B de su dominio A, y este subconjunto
es cerrado y acotado (es decir compacto), s
olo en este caso podemos estar seguros de que existen
un par de puntos en B en los cuales la funcion f alcanza su valor m
aximo y su valor mnimo, en
donde adem
as estos valores son m
aximo y mnimo s
olo con respecto a los valores de f sobre los
elementos del subconjunto B.
Puesto que todo conjunto B Rn que sea cerrado se puede descomponer en la uni
on de su
interior y su frontera (B = Fr(B)int(B)), que son dos conjuntos ajenos, y dado que int(B) siempre
es un conjunto abierto y Fr(B) siempre es un conjunto cerrado (y flaco, ya que por el problema
15 se tiene que int(Fr(B)) = ), vamos a reducir nuestro an
alisis a estos dos casos: cuando los
puntos en los que una funci
on f alcanza su valor m
aximo o mnimo (o alguno de ellos) pertenecen
al interior de B, y cuando estos mismos puntos (o alguno de ellos) pertenecen a la frontera de B.
De acuerdo con el enfoque anterior, lo que haremos ser
a analizar en general que caractersticas
especficas satisfacen los puntos en los que una funcion f alcanza su valor m
aximo y su valor mnimo,
dependiendo de si estos pertenecen a un conjunto abierto (como el int(B)) o a un conjunto cerrado
con interior vaco (como la Fr(B), cuando B es cerrado).
Definici
on 4.46 Sean f : A Rn R, B A y x
0 B. Decimos que:
1. f alcanza (o tiene) un valor m
aximo (mnimo ) en x
0 sobre B si f (
x) f (
x0 ) (f (
x0 ) f (
x))
para todo x
B.
219
J. P
aez
4.6. M
aximos y mnimos
2. f alcanza (o tiene) un valor m

aximo local (mnimo local) en x
0 sobre B si existe r > 0 tal
que f (
x) f (
x0 ) (f (
x0 ) f (
x)) para todo x
B Br (
x0 ).
Con respecto a las definiciones anteriores es importante hacer dos observaciones; una, que
todo punto x
0 en donde una funci
on f alcance un valor m
aximo (mnimo) sobre un conjunto B,
necesariamente en ese mismo punto la funcion f alcanza (o tiene) un valor m
aximo local (mnimo
local) sobre B, pero no recprocamente, es decir, si f alcanza en x
0 un valor m
aximo local (mnimo
local) sobre B, este no es necesariamente m
aximo (mnimo) sobre todo B (ver figura 4.12).
on es que, si B es un conjunto abierto, entonces f alcanza en x
0 un valor
m
aximo local (mnimo local) sobre B si y s
olo si existe r > 0 tal que f (
x) f (
x0 ) (f (
x0 ) f (
x))
para todo x
Br (
x0 ) B.
b
b
x
0
x
1
Figura 4.12: En el punto x

0 la funcion f tiene un maximo local pero no global, y en el punto x
1 tiene
un maximo local que tambien es global.
Y justo el primer resultado importante que vamos a probar en esta secci
on tiene que ver con
los puntos en los que una funci
on f alcanza un valor m
aximo (o mnimo) local sobre un conjunto
abierto. Si en un punto x
0 , adem
as de satisfacer la propiedad anterior, f tambien es derivable,
entonces la derivada en x
0 (Df (
x0 )) tiene que ser la funcion lineal constante 0 (como seguramente
el lector ya est
a observando, este resultado generaliza lo que sucede para las funciones de R en R).
Proposici
on 4.47 Sean f : U Rn R (U abierto) y x
0 U . Si f alcanza en x
0 un valor
m
aximo local (mnimo local) sobre U y f es derivable en x
0 entonces Df (
x0 ) es la constante cero
(Df (
x0 ) 0).
Demostraci
on. Dado que la derivada de f en x
0 est
a representada (en un sistema coordenado
f
ortonormal) por la matriz de 1 n cuya iesima entrada est
a dada por x
(
x0 ), bastara con
i
demostrar que cada uno de estos n
umeros es 0.
Suponiendo que f alcanza en x
0 un valor m
aximo local sobre U (el caso del mnimo local se
prueba de manera an
aloga), sea r > 0 tal que f (
x) f (
x0 ) para todo x
Br (
x0 ) U . Por tanto,
si |h| < r tenemos que f (
x0 + h
ei ) f (
x0 ) de tal forma que
f (
x0 + h
ei ) f (
x0 ) 0
Ahora, si tomamos h tal que 0 < h < r entonces
f (
x0 + h
ei ) f (
x0 )
0
h
J. P
aez
220
4.6. M
aximos y mnimos
y por lo tanto
f
f (
x0 + h
ei ) f (
x0 )
(
x0 ) = lim
h0
xi
h
0
Por otra parte, si tomamos h tal que r < h < 0 entonces
0
f (
x0 + h
ei ) f (
x0 )
h
de donde
f (
x0 + h
ei ) f (
x0 )
h0
h
f
(
x0 )
=
xi
0 lim
de modo que
0
y por lo tanto
f
(
x0 ) 0
xi
f
(
x0 ) = 0
xi
Como seguramente el lector ya habra notado, si bien la proposici

on anterior es importante, esta
s
olo nos proporciona una condici
on necesaria al hecho de que una funcion alcance en x
0 un valor
m
aximo (o mnimo) local. Y como suele suceder con frecuencia, esta condici
on no es suficiente.
En efecto, el hecho de que la derivada de una funcion f en un punto x
0 sea la constante 0, no
es suficiente para que podamos asegurar que f alcance en x
0 un valor m
aximo (o mnimo) local.
Antes de dar un ejemplo que ilustra este hecho, mencionaremos que a pesar de todo, aquellos
puntos en que la derivada de una funcion es la constante 0 resultan ser muy importantes y reciben
un nombre especial: puntos crticos, lo cual dejamos plasmado en la siguiente
Definici
on 4.48 Sean f : U Rn R y x
0 U . Si f es derivable en x
0 y la derivada de f en
x
0 (Df (
x0 )) es la constante 0, decimos que x
0 es un punto crtico de f .
Con base en la definicion anterior, lo que mostraremos en el siguiente ejemplo es que los puntos
crticos de una funci
on f no tienen por que ser necesariamente puntos en los que f alcance un valor
m
aximo (o mnimo) local.
Ejemplo 4.49 Sea f : R2 R dada por la expresi
on
f (x, y) = x2 y 2
Dado que
f
(x, y) = 2x
x
f
(x, y) = 2y
y
se tiene que el u
nico punto crtico de f es el (0, 0).
221
J. P
aez
4.6. M
aximos y mnimos
Sin embargo, para cualquier r > 0 se tiene que: si 0 < |x| < r entonces (x, 0) Br ((0, 0)) y
f (x, 0) = x2
>0
= f (0, 0)
Por otra parte, si 0 < |y| < r entonces (0, y) Br ((0, 0)) y
f (0, y) = y 2
<0
= f (0, 0)
lo que demuestra que f no tiene un m
aximo local ni un mnimo local en el (0, 0) (ver figura 4.13
(a)).
Aquellos puntos crticos en los que una funcion no tiene un m
aximo local o un mnimo local, y
justo por el aspecto geometrico del ejemplo anterior en una vecindad del (0, 0) (el de una silla de
montar), reciben el nombre de punto silla, aunque no todos los puntos silla tienen este aspecto.
Por ejemplo para la funci
on f (x, y) = x3 , todos sus puntos crticos (los puntos de la forma
(0, y)) son puntos silla en el sentido de que en ellos la funcion f no tiene un m
aximo local o un
mnimo local. Sin embargo, geometricamente la funcion f no tiene el aspecto de una silla de montar
(a)
(b)
Figura 4.13: La funcion f (x, y) = x2 y 2 (figura (a)) tiene un punto silla en el punto (0, 0), y la
funcion f (x, y) = x3 (figura (b)) tiene puntos silla en los puntos de la forma (0, y).
El ejemplo anterior, y el hecho de que la proposici
on 4.47 es valida para m
aximos o mnimos
locales, nos plantea el problema de contar con un criterio que nos permita clasificar a los puntos
crticos de una funci
on.
on ser
a desarrollar un criterio an
alogo al criterio de la segunda
derivada para la clasificaci
on de puntos crticos de funciones de R en R, pero para ello ser
a necesario
introducir el concepto (que tomaremos prestado nuevamente del Algebra Lineal!) de: forma
cuadratica.
J. P
aez
222
4.6. M
aximos y mnimos
De acuerdo con el problema 27 (que es una consecuencia del teorema de Taylor), si f : U

Rn R es una funci
on de clase C 2 en U , x
0 U y r > 0 son tales que Br (
x0 ) U , sabemos que

n
= (h1 , . . . , hn ) R es tal que h < r, entonces
si h
= P2,f,x (
f (
x0 + h)
x0 + h)
x0 (
0 x0 + h) + R2,f,
n
n
X
f
1 X 2f
= f (
x0 ) +
(
x0 )hi +
(
x0 )hi hj + R2,f,x0 (
x0 + h)
xi
2
xj xi
i=1
i,j=1
en donde
R2,f,x0 (
x0 + h)
=0
2

h
0
h
lim
de modo que, si x
0 es un punto crtico de f , se tiene que
n
1 X 2f
f (
x0 + h) f (
x0 ) =
(
x0 )hi hj + R2,f,x0 (
x0 + h)
2
xj xi
i,j=1
De esta u
ltima identidad, nos detendremos a estudiar con detalle a la expresi
on
n
X
i,j=1
2f
(
x0 )hi hj
xj xi
(4.42)
y lo primero que haremos notar es que se puede escribir en foma matricial, de la siguiente manera
h1
n
2
X

f
(
x0 )hi hj = h1 hn A ...
xj xi
i,j=1
hn
en donde la matriz A es
A=
2f
(
x0 )
x21
..
.
..
.
x0 )
x1 xn (
2f
2f
x0 )
xn x1 (
..
.
2f
(
x0 )
x2
n
(4.43)
La ventaja de escribir a la expresi

on 4.42 en forma matricial es que nos permite relacionarla
con un concepto del Algebra Lineal que est

a muy bien estudiado: las formas cuadr
aticas.
Las formas cuadraticas en Rn son (adem
as de la funcion constante 0, que es la u
nica forma
cuadratica que es constante), las funciones polinomiales de las coordenadas x1 , . . . , xn que tienen
la particularidad de que todos los monomios que la forman son expresiones de grado 2.
Por ejemplo, en el caso de R2 , cualquier forma cuadratica en las variables x, y se escribe como
ax2 + 2bxy + cy 2
(4.44)
la cual, como en el caso de la expresi

on 4.42, se puede escribir en forma matricial de la siguiente
manera:

a b
t
2
2
ax + 2bxy + cy = x y
x y
b c
223
J. P
aez
4.6. M
aximos y mnimos
x y
a b
b c

x
y
En general, toda forma cuadratica en Rn se identifica con una matriz A de n n con entradas
reales (A M22 (R)) la cual es simetrica, es decir, que es igual a su traspuesta (A = At ). Y
recprocamente, si A es una de estas matrices, la funcion F : Rn R definida como
F (x1 , . . . , xn ) =
=
x1
x1

xn A ...
xn
x1
xn
x1
xn
t
claramente define una forma cuadratica en Rn .

A la matriz A dada por 4.43 se le conoce como la matriz hessiana 2 de f en x
0 , que de aqu en
adelante denotaremos por Hf (
x0 ), y a la forma cuadratica asociada a esta le llamaremos la hessiana
de f en x
0 . La hessiana de f en x
0 lo denotaremos por Hfx0 de tal forma que si x
= (x1 , . . . , xn ),
entonces
Hfx0 (
x) = Hfx0 (x1 , . . . , xn )

x0 ) x1
= x1 xn Hf (
x1

..
= x1 xn Hf (
x0 ) .
xn
xn
t
Hay una clasificaci

on de las formas cuadraticas que en particular resultara muy importante
para el problema de la identificaci
on de los puntos crticos de una funcion. Se dice que la forma
cuadratica F : Rn R es semipositiva (an
alogamente seminegativa) si F (
x) 0 (F (
x) 0) para
n
toda x
R y si F satisface la condici
on de que F (
x) = 0 si y s
olo si x
= 0, entonces decimos que
F es no degenerada.
Lo interesante de esta clasificaci
on de las formas cuadraticas es que, con base en ella, podremos
establecer criterios que nos permita determinar si los puntos crticos de una funcion son puntos en
los que esta alcanza un valor m
aximo o mnimo, locales en ambos casos.
En efecto, lo siguiente que haremos ser
a probar un resultado en el que, dependiendo de que tipo
de forma cuadratica resulte ser la hessiana de f en un punto x
0 , podremos asegurar que f tiene un
cierto tipo de valor extremo (m
aximo o mnimo local). Para ello, ser
a necesario probar antes un
sencillo resultado que formularemos en el siguiente
Lema 4.50 Si F : Rn R es una forma cuadr
atica semipositiva (seminegativa) y no degenerada
asociada a una matriz A (es decir que F (
x) = x
A
xt ) entonces existe M > 0 (m < 0) tal que
Rn .
para toda h
2

M
F (h)

h
2

m
(F (h)
)
h
Llamada as en honor de Ludwig Otto Hesse (22 abril 1811 - 4 agosto 1874) quien fue un matem
atico alem
an.
Hesse naci
o en K
onigsberg, Prussia, y muri
o en Munich, Bavaria. Trabaj
o en la teora de invariantes.
J. P
aez
224
4.6. M
aximos y mnimos
Demostraci
on. Dado que S n1 = {
x Rn | k
xk = 1} es un conjunto cerrado y acotado (compacto) y toda forma cuadratica es una funcion continua, por el corolario 2.51 del captulo 2 sabemos
que existe un valor mmino para F (si F es semipositiva) que llamaremos M > 0 (un valor m
aximo
para F , si F es seminegativa, que llamaremos m < 0) tal que
F (
x) M
(F (
x) m)
para toda x
Rn .
Por tanto, dado que las

desigualdades que deseamos probar se satisfacen si h = 0, si tomamos

6= 0 y hacemos x
h
entonces x
h
= h/
S n1 y por lo tanto
M F (
x)
=x
A
xt

t
h h

=
A
h
h

1
h
t
= 2 hA

h
es decir, se tiene que
= 2 F (h)

h
2
M

F (h)
h

2
Rn (an
m

Rn ).
para toda h
alogamente se prueba que F (h)
h
para toda h
Una vez hecho todo lo anterior, ahora estamos en condiciones de formular un resultado que nos
permitira determinar si un punto crtico x
0 de una funcion f es un punto en donde esta alcanza
un m
aximo local o un mnimo local. S
olo probaremos uno de estos casos y como es de imaginar, el
otro caso quedar
a como un problema para el lector.
Proposici
on 4.51 Sea f : U Rn R de clase C 2 en U , y x
0 U un punto crtico de f . Se
satisface lo siguiente:
1. si la hessiana de f en x
0 es una forma cuadr
atica semipositiva y no degenerada entonces f
tiene un mnimo local en x
0 , y
2. si la hessiana de f en x
atica seminegativa y no degenerada entonces f
tiene un m
aximo local en x
0 .
Demostraci
on. S
olo probaremos el inciso 1. Sea r0 > 0 tal que Br0 (
x0 ) U . Como ya habamos
mencionado anteriormente, por el problema 27 sabemos que, como f : U Rn R es una
funci
on

2
2

de clase C en U y x
0 U es un punto crtico de f , si h = (h1 , . . . , hn ) R es tal que h
< r0 ,
entonces
= P2,f,x (
f (
x0 + h)
x0 + h)
x0 (
0 x0 + h) + R2,f,
225
J. P
aez
4.6. M
aximos y mnimos
n
n
X
1 X 2f
f
(
x0 )hi +
(
x0 )hi hj + R2,f,x0 (
x0 + h)
= f (
x0 ) +
xi
2
xj xi
i,j=1
i=1
1
+ R2,f,x (
= f (
x0 ) + Hfx0 (h)
0 x0 + h)
2
en donde
R2,f,x0 (
x0 + h)
=0
2

h
0
h
lim
(4.45)
Ahora, dado que Hfx0 es semipositiva, por el lema 4.50 sabemos que existe M > 0 tal que
2
M

Hfx0 (h)
h

Rn . Por tanto, por 4.45 sabemos que existe > 0 tal que si

para toda h
h
< entonces

(
x
+
h)
R2,f,x0 0

M
<
2

2
h
y en particular que
0<
R2,f,x0 (
x0 + h)
M
+
2

2
h

Por lo tanto, si r = min{, r0 } y 0 < h
< r, tendremos que
1
+ R2,f,x (
f (
Hfx0 (h)
f (
x0 + h)
x0 )
0 x0 + h)
= 2
2
2

h
h
R2,f,x0 (
x0 + h)
1 Hfx0 (h)
2 +
2

2
h
h
R2,f,x0 (
x0 + h)
M
+
2

2
h
>0
f (
x0 ) f (
x0 + h)

si h
0 .
< r, lo que demuestra que f tiene un mnimo local en x
Como el lector habra notado, el resultado anterior es una especie de equivalente (en Rn ) al
criterio de la segunda derivada para la clasificaci
on de puntos crticos de funciones de R en R, y
como sucede en ese caso, su recproco no se cumple, lo que ilustramos en el siguiente
J. P
aez
226
4.6. M
aximos y mnimos
f (x, y) = x4 + y 4
para cada (x, y) R2 . Como es f
acil de verificar (ver figura 4.14), el (0, 0) es el punto en el que f
alcanza su mnimo global (y por tanto tambien local) y dado que
2f
2f
2f
(x, y) = 0
(x,
y)
=
(x,
y)
=
x2
x2
yx
para toda (x, y) R2 , en particular se tiene que la hessiana de f en el (0, 0) es la funci
on constante
0, la cual es la mas degenerada (en el sentido matem
atico de la palabra!) de todas las formas
cuadr
aticas.
Z
Y
b
Figura 4.14: La funcion f (x, y) = x4 + y 4 tiene un mnimo global (y por tanto tambien local) en el
punto (0, 0), y su forma cuadr
atica asociada en ese punto (su hessiana) es degenerada.
A pesar del ejemplo anterior, para la proposici
on 4.51 se puede establecer una proposici
on casirecproca. Como seguramente el lector recordara, para el caso de funciones de R en R se sabe que
si f tiene un m
aximo (mnimo) local en un punto x0 , y f (x0 ) existe, entonces se debe cumplir
que f (x0 ) 0 (f (x0 ) 0) (resultado que por cierto nos ser

a de mucha utilidad en la prueba de
nuestra siguiente proposici
on).
Pues bien, para una funci
on f de Rn en R se extiende el resultado anterior en el sentido de
que, si f tiene un m
aximo (o un mnimo) local en un punto x
0 , entonces la hessiana de f en x
0
ser
a seminegativa (o semipositiva), es decir, lo u
nico que no podremos asegurar es que la hessiana
es no degenerada (as como en el caso real no podemos asugurar que f (x0 ) no sea 0).
Proposici
on 4.53 Sea f : U Rn R de clase C 2 en U , y x
0 U un punto crtico de f . Se
satisface lo siguiente:
1. si f tiene un mnimo local en x
0 entonces la hessiana de f en x
atica
semipositiva, y
2. si f tiene un m
aximo local en x
0 entonces la hessiana de f en x
atica
seminegativa.
227
J. P
aez
4.6. M
aximos y mnimos
Demostraci
on. S
olo probaremos el inciso 2. Sean, r0 > 0 tal que Br0 (
x0 ) U , y u
=
(u1 , . . . , un ) Rn tal que k
uk = 1. Definimos : (r0 , r0 ) R R como (t) = x
0 + t
u y
g : (r0 , r0 ) R R como g = f .
Notese que, por la proposici
on 4.29 sabemos que g es derivable en su dominio y que
g (t) = f ((t)) (t)
n
X
f
((t))ui
=
xi
i=1
y dado que f es de clase C 2 en U , por la misma proposici

on 4.29 (aplicada a cada miembro de la
suma anterior), se tiene
n
n
2
X
X
f
g (t) =
((t))uj ui
xj xi
i=1
j=1
n
X
i,j=1
2f
((t))ui uj
xj xi
de tal forma que

g (0) =
=
n
X
i,j=1
n
X
i,j=1
2f
((0))ui uj
xj xi
2f
(
x0 )ui uj
xj xi
= Hfx0 (
u)
Por otra parte, es sencillo demostrar (problema 34) que, como f tiene un m
aximo local en x
0 ,
entonces g tiene un m
aximo local en t = 0, de tal forma que, por el resultado para funciones de R
en R que mencionamos previamente a esta proposici
on, se debe tener que
Hfx0 (
u) = g (0)
0
Por lo tanto, si x
Rn , x
6=
0, si hacemos u
=x
/ k
xk se tendra que

x
Hfx0 (
u) = Hfx0
k
xk
1
Hfx0 (
x)
=
k
xk2
0
de donde Hfx0 (
x) 0 para toda x
Rn , lo que prueba que la hessiana de f en x
0 es seminegativa.
Aun y cuando hasta aqu todo parece funcionar muy bien, no podemos dejar de mencionar que
el problema de determinar si una funci
on f tiene un m
aximo o un mnimo local (o ninguno de estos
J. P
aez
228
4.6. M
aximos y mnimos
dos) en un punto crtico x

0 , lo trasladamos al problema de determinar si la hessiana de f en este
punto x
0 es una funci
on cudratica semipositiva o seminegativa (o ninguna de estas dos).
En la siguiente secci
on mencionaremos (sin probar) algunas condiciones necesarias y suficientes
para que una forma cuadratica F en Rn (en terminos de su matriz asociada) sea semipositiva o
seminegativa, y no degenerada. Estas condiciones necesarias y suficientes son un tema importante
de Algebra
Lineal que desafortunadamente no podemos incluir en este texto (pero que el lector
interesado puede consultar en [2]) para saber m
as de este tema).
Sin embargo, para que el amable lector no se sienta muy desalentado por esta ausencia, mostraremos
y probaremos cu
ales son estas condiciones para el caso particular de las formas cuadraticas en R2 ,
las que dejaremos plasmadas en la siguiente
Proposici
on 4.54 Sea F : R2 R la forma cuadr
atica asociada a la matriz

a b
A=
b c
y que est
on
F (x, y) =
=
x y
x y
A

t
x y

a b
x
b c
y
= ax2 + 2bxy + cy 2
F es semipositiva (seminegativa) y no degenerada si y s

olo si a > 0 (a < 0) y ac b2 = det(A) > 0.
Demostraci
on. Supongamos que F es semipositiva (el caso en que sea seminegativa se prueba de
manera an
aloga) y no degenerada. Por esta u
ltima propiedad, dado que
a = F (1, 0) > 0
concluimos que a > 0. Por tanto, podemos reescribir a F como
F (x, y) = ax2 + 2bxy + cy 2

b2
b 2
y2
=a x+ y + c
a
a

ac b2
b 2
y2
=a x+ y +
a
a
(4.46)
de tal forma que

0 < F (b/a, 1)
=
ac b2
a
y por lo tanto ac b2 > 0.

Supongamos ahora que a > 0 y ac b2 > 0. De la identidad 4.46 concluimos que F (x, y) 0
para toda (x, y) R2 , es decir, F es semipositiva. Ahora, si (x, y) es tal que F (x, y) = 0, se tiene
que

ac b2
y2 = 0
a
229
J. P
aez
4.6. M
aximos y mnimos
y

b
x+ y
a
2
=0
de tal forma que de la primera identidad concluimos que y = 0, y sustituyendo esto u

ltimo en la
segunda identidad, concluimos que x = 0. Esto prueba que F es no degenerada.
Como una consecuencia inmediata de la proposici
on anterior y de la proposici
on 4.51, podemos
formular el siguiente resultado el cual establece criterios muy concretos para determinar si un punto
crtico de una funci
on de R2 en R es un m
aximo o mnimo local.
Proposici
on 4.55 Sea f : U R2 R de clase C 2 en U , y x
0 U un punto crtico de f .
1. Si
2f
(
x0 ) > 0
x2
2f
2f
(
x
)
(
x0 )
0
x2
y 2
2
2f
(
x0 ) > 0
yx
2
2f
(
x0 ) > 0
yx
entonces f tiene un mnimo local en x

0 , y
2. si
2f
(
x0 ) < 0
x2
2f
2f
(
x
)
(
x0 )
0
x2
y 2
entonces f tiene un m
aximo local en x
0 .
Antes de hacer unos breves comentarios adicionales acerca de las formas cuadraticas, daremos
algunos ejemplos que ilustren el trabajo realizado hasta ahora sobre el tema de m
aximos y mnimos.
Ejemplo 4.56
1. Sea f : R2 R dada por
f (x, y) = (x + 1)2 + y 2

y B = (x, y) R2 | k(x, y)k 2 .
De acuerdo a lo realizado hasta este momento, si los puntos en los que f alcanza un valor
m
aximo o mnimo local (o global) sobre B, se encuentran en el interior de B, entonces deben
ser puntos crticos de f de modo que lo primero que se tendr
a que hacer ser
a localizar este
tipo de puntos.
Para lograr esto, hay que resolver las ecuaciones
f
(x, y) = 0
x
f
(x, y) = 0
y
que en este caso son

2(x + 1) = 0
2y = 0
de donde obtenemos que (1, 0) es el u

nico punto crtico de f (en todo R2 ).
Por otra parte, dado que f (x, y) 0 para toda (x, y) R2 , que f (1, 0) = 0 y (1, 0) B,
sin necesidad de mayores c
alculos podemos concluir que f alcanza su valor mnimo sobre B
(de hecho, sobre todo R2 ) en el punto (1, 0) y que dicho valor mnimo es 0.
J. P
aez
230
4.6. M
aximos y mnimos
En cuanto al valor m
aximo de f sobre B, dado que f no tiene m
as puntos crticos, este valor
m
aximo se debe de alcanzar en alg
un punto de la frontera de B, es decir, sobre el conjunto

Fr(B) = (x, y) R2 | k(x, y)k = 2
Dado que para este tipo de conjuntos (cerrados con interior vaco) no hemos desarrollado
ninguna herramienta que nos permita resolver este problema, para este caso particular recurriremos al siguiente hecho: la Fr(B) se puede obtener como la imagen de una funci
on de R en
2
2
R . En efecto, n
otese que la funci
on : [0, 2] R R dada por
(t) = (2 cos(t), 2 sen(t))
es una parametrizaci
on del conjunto Fr(B), es decir, ([0, 2]) = Fr(B).
Aprovechando este hecho, si definimos la funci
on g : [0, 2] R R como
g(t) = (f )(t)
= f ((t))
= (2 cos(t) + 1)2 + 4 sen2 (t)

= 4 cos(t) + 5
y encontramos los puntos del dominio de g en los que esta funci
on alcanza sus valores m
aximo
y mnimo, podremos entonces localizar los valores m
aximo y mnimo de f sobre la Fr(B).
Como ya se sabe, hay que proceder de manera an
aloga a lo que estamos haciendo con f ; es
decir, hay que localizar los puntos crticos de g en el intervalo abierto (0, 2), determinar si
en estos puntos crticos g alcanza un m
aximo o mnimo local, y comparar el valor de g en
estos puntos con los valores de g en los extremos del intervalo [0, 2] (que son la frontera de
[0, 2]).
De esta forma, lo primero que hay que localizar son los valores de t (0, 2) para los cuales
se cumple que
g (t) = 4 sen(t)
=0
y que claramente s
olo sucede para t = . Dado que g(t) 1 para toda t [0, 2] y que
g() = 1, concluimos que g alcanza su valor mnimo en t = y que este valor mnimo es 1.
Finalmente, dado que g(0) = g(2) = 9 concluimos que el valor m
aximo de g sobre el intervalo
[0, 2] es 9, y que este valor lo alcanza en t = 0 y t = 2 (es decir, en la frontera de su
dominio). De todo lo anterior concluimos entonces que el valor mnimo de f sobre Fr(B)
es 1 y que este valor lo alcanza en el punto () = (2, 0), y que su valor m
aximo sobre la
Fr(B) lo alcanza en el punto (0) = (2) = (2, 0) y que este valor m
aximo es 9.
Por lo tanto, comparando los valores de f en los puntos crticos que est
an en el interior de
B (f (1, 0) = 0), junto con los valores m
aximo y mnimo de f sobre la Fr(B) (f (2, 0) = 1
y f (2, 0) = 9), concluimos que los valores m
aximo y mnimo de f sobre B son 0 y 9, y que
estos valores se alcanzan en los puntos (1, 0) y (2, 0), respectivamente (ver figura 4.15).
2. Sea f : R2 R dada por
f (x, y) = x(x 1)2 + y 2

231
J. P
aez
4.6. M
aximos y mnimos
(2, 0)
(1, 0)
(2, 0)
2
2
Figura
aximo
4.15: Los2 valores m
y mnimo de la funcion f (x, y) = (x + 1) + y sobre el conjunto
B = (x, y) R | k(x, y)k 2 se alcanzan en los puntos (2, 0) y (1, 0), respectivamente.

y B = (x, y) R2 | k(x, y)k 1 .
Nuevamente, para determinar los puntos en los que f alcanza un valor m

aximo o mnimo
local (o global) sobre B, procederemos como en el inciso anterior. Primero encontraremos los
puntos crticos de f , para lo cual hay que resolver las ecuaciones
f
(x, y) = (x 1)2 + 2x(x 1)
x
= (x 1)(3x 1)
=0
y
f
(x, y) = 2y
y
=0
y cuyas soluciones son las parejas (1, 0) y (1/3, 0), en donde este u
ltimo punto es el u
nico que
queda dentro del interior de B.
Ahora ser
a necesario calcular las segundas derivadas parciales de f , las cuales resultan ser:
2f
(x, y) = 6x 4
x2
2f
(x, y) = 0
yx
2f
(x, y) = 2
y 2
de modo que para el punto crtico (1/3, 0) se tiene que
2f
(1/3, 0) = 2
x2
J. P
aez
232
4.6. M
aximos y mnimos
2f
(1/3, 0) = 0
yx
2f
(1/3, 0) = 2
y 2
es decir
2f
2 f
(1/3,
0)
(1/3, 0)
x2
y 2
2
2f
(1/3, 0) = 4
yx
<0
y por lo tanto, por el problema 41 (o el problema 40), concluimos que f tiene un punto silla
en el (1/3, 0).
Como en el inciso anterior, nos resta localizar los puntos en lo que f alcanza sus valores
m
aximo y mnimo sobre la frontera del conjunto B, que ahora es el conjunto

Fr(B) = (x, y) R2 | k(x, y)k = 1
y que, como en el inciso anterior, podemos parametrizar por la funci
on : [0, 2] R R2
dada por
(t) = (cos(t), sen(t))
Como en el caso anterior, definimos g : [0, 2] R R como
g(t) = (f )(t)
= f ((t))
= cos(t)(cos(t) 1)2 + sen2 (t)

de tal forma que
g (t) = f ((t)) (t)
= (cos(t) 1)(3 cos(t) 1)( sen(t)) + 2 sen(t) cos(t)
= sen(t) (2 cos(t) (cos(t) 1)(3 cos(t) 1))

= sen(t) 3 cos2 (t) + 6 cos(t) 1
Dado que la races de la ecuaci

on cuadr
atica 3x2 + 6x 1 = 0 son 1 6/3 y 1 + 6/3,
concluimos que los puntos crticos de g en el
intervalo abierto (0, 2) son , t0 , y 2 t0 ,
en
donde
t
(0,
)
es
tal
que
cos(t
)
=
1
6/3. Por lo tanto, como g(0) = 0, g(t0 ) =

0
0
aximo sobre
4 6/9 = g(2 t0 ), g() = 4 y g(2) = 0, concluimos que f alcanza su valor m
la Fr(B) en los puntos

q
q
(t0 ) = 1 6/3, 2( 6 1)/3 , (2 t0 ) = 1 6/3, 2( 6 1)/3
y este m
aximo es 4 6/9, mientras que su valor mnimo lo alcanza en el punto () = (1, 0)
y este valor es 4.
En resumen, comparando los valores de f en los puntos

q
q
(1, 0), 1 6/3, 2( 6 1)/3 , 1 6/3, 2( 6 1)/3 , (1, 0)

233
J. P
aez
4.6. M
aximos y mnimos
(el punto crtico (1/3, 0) no lo consideramos puesto que ah la funci

on f tiene un punto
silla), concluimos que el valor mnimo de f sobre
el
conjunto
B
es
4
y lo alcanza en el
punto (1, 0), mientras que su valor m

aximo es 4 6/9 y lo alcanza en los puntos

q
q
y
1 6/3, 2( 6 1)/3 .
1 6/3, 2( 6 1)/3
4.6.1
Breve comentario sobre formas cuadr

aticas
A fin de justificar intuitivamente el resultado mas conocido en el cual se establece (para el

caso general en Rn ) cu
ando una forma cuadratica F asociada a una matriz A es semipositiva (o
seminegativa) y no degenerada, desarrollaremos las siguientes ideas.
Sin lugar a dudas, las formas cuadraticas del tipo
F (x1 , . . . , xn ) = 1 x21 + + n x2n
(4.47)
son las m
as simples de analizar, pues es muy facil comprobar que F es una forma cuadratica
semipositiva (seminegativa) y no degenerada si y s
olo si i > 0 (i < 0) para cada i {1, . . . , n}
(n
otese que F (
ei ) = i ).
Tambien es facil comprobar que
1 0

t

F (x1 , . . . , xn ) = x1 xn ... . . . ... x1 xn
0 n
de tal manera que la matriz asociada a F es la matriz
1
.. . .
D= .
.
Un hecho interesante de este tipo de matrices
1
..
Dk = .
0
entonces
diagonal
0
..
.
n
es que si definimos, para cada k {1, . . . , n},
0
.
..
. ..
det(Dk ) = 1 k
de tal forma que ahora podemos reformular la afirmacion anterior de la siguiente manera: F es una
forma cuadratica semipositiva (seminegativa) y no degenerada si y s
olo si det(Dk ) > 0 (det(Dk ) < 0
si k es impar y det(Dk ) > 0 si k es par) para cada k {1, . . . , n}.
La buena noticia es que este criterio (por medio de los determinantes de las submatrices Dk )
que se cumple para el caso particular de F , se sigue cumpliendo en el caso general.
Es decir, si F : Rn R es una forma cuadratica que tiene asociada la matriz simetrica
a11 a1n
..
..
A = ...
.
.
an1
J. P
aez
234
ann
4.6. M
aximos y mnimos
se prueba que: F es semipositiva (seminegativa) y no degenerada si y s

olo si det(Ak ) > 0 (det(Ak ) <
0 si k es impar y det(Ak ) > 0 si k es par) para cada k {1, . . . , n}, en donde
a11 a1k
..
..
Ak = ...
.
.
ak1
akk
Como el lector puede comprobar facilmente, en la proposici

on 4.54 se prueba esta afirmacion
para el caso n = 2.
Para reforzar un poco m
as las ideas anteriores, resulta relevante mencionar un resultado muy
importante del Algebra Lineal (Teorema 6.20 de [2] ): si A Mnn (R) es una matriz simetrica
entonces existe B Mnn (R) una matriz ortonormal tal que BAB t es una matriz diagonal, es
decir que
1 0
BAB t = ... . . . ...

(4.48)
0
Como seguramente el lector recordara, las matrices ortonormales son justo las matrices que se
obtienen al (y que se usan para) realizar un cambio entre bases ortonormales de Rn .
De esta forma, y con base en este resultado, podemos afirmar que: si F : Rn R es una forma
cuadratica que tiene asociada la matriz simetrica A (en una base ortonormal {
e1 , . . . , en }), es decir
que
F (
x) = F (x1 , . . . , xn )

= x1 xn A x1
xn
t
entonces existe otra base ortonormal {

e1 , . . . , en } tal que la matriz asociada a F en esta nueva base
es una matriz diagonal.
En efecto, observe que si
b11 b1n
..
..
B = ...
.
.
bn1 bnn
es la matriz ortonormal tal que BAB t es una matriz diagonal, entonces tomando
ei = bi1 e1 + + bin en
para i {1, . . . , n}, de acuerdo con la identidad 4.1, obtenemos que si x
Rn tiene coordenadas
e1 , . . . , en },
e1 , . . . , en } entonces sus coordenadas (x1 , . . . , xn ) en la base {
(x1 , . . . , xn ) en la base {
est
an dadas por la identidad
b11 b1n

..
..
x1 xn = x1 xn ...
.
.
=
x1
xn
bn1
bnn
De esta manera, la forma cuadratica F expresada en terminos de las nuevas coordenadas

x1 , . . . , xn se escribe como
F (
x) = F (x1 , . . . , xn )
235
J. P
aez
4.6. M
aximos y mnimos
t

A x1 xn

t
=
x1 xn B A x1 xn B

t
= x1 xn
BAB t
x1 xn
1 0

t

= x1 xn ... . . . ... x1 xn
0 k
2

2
= 1 x1 + + n xn
x1
xn
on cuadratica F tiene la forma 4.47.

es decir, en la base {
e1 , . . . , en } la funci
Sin duda que la parte medular de estas u
ltimas ideas est
a en como, dada la matriz A, se
encuentra la matriz ortonormal B y los escalares 1 , . . . , n que satisfagan la identidad 4.48, pero
este problema es justo todo un tema de un curso de Algebra

Lineal.
4.6.2
M
aximos y mnimos sobre restricciones
Como se muestra en el ejemplo 4.56, para localizar los puntos en donde una funcion f alcanza sus
valores extremos, no basta con encontrar sus puntos crticos (e incluso puede suceder que estos
valores extremos no se alcancen en este tipo de puntos, como sucede en inciso 2 de este mismo
ejemplo).
En la mayora de los casos, la localizacion de los valores extremos (globales) de una funci
on
de Rn en R, requerir
a la localizaci
on de valores extremos sobre conjuntos m
as peque
nos, cuya
caracterstica principal ser
a que son flacos (es decir, de interior vaco).
En los incisos del ejemplo 4.56 estos conjuntos fueron

(x, y) R2 | k(x, y)k = 2
y
(x, y) R2 | k(x, y)k = 1
que adem
as de poderse parametrizar por una funcion de R en R2 (propiedad que fue fundamental
para encontrar los valores extremos sobre estos conjuntos), tambien tienen la propiedad de ser los
conjuntos de nivel de alguna funci
on de R2 en R. De hecho, ambos conjuntos son conjuntos de
2
2
nivel de la funci
on g(x, y) = x + y para c = 4 y c = 1, es decir N4 (g) y N1 (g), respectivamente.
Lo interesante de la observaci
on anterior es que, si ahora nos fijamos en los conjuntos de nivel
2
de la funcion f (x, y) = (x + 1) + y 2 (la funcion del inciso 1 del mencionado ejemplo) para c = 1
y c = 9 (que son los valores extremos que alcanz
o f sobre N4 (g), y que denotamos por N1 (f ) y
N9 (f ), respectivamente), notaremos que estos conjuntos de nivel se intersectan tangencialmente
con el conjunto de nivel N4 (g) en los puntos (2, 0) y (2, 0), que son justo los puntos en donde f
alcanza estos valores extremos (ver figura 4.16).
Lo importante de este hecho geometrico es que este se puede traducir en una identidad (es
decir, se puede escribir en forma analtica).
En efecto, si ahora recordamos que el gradiente de una funci
on en un punto x
0 siempre es normal
al conjunto de nivel que contiene a este punto, concluimos entonces que los vectores f (2, 0) y
g(2, 0) deben ser paralelos (es decir, uno debe ser m
utiplo del otro), y lo mismo debe suceder
para los vectores f (2, 0) y g(2, 0), lo que es muy facil de verificar, ya que
f (x, y) = (2(x + 1), 2y)
g(x, y) = (2x, 2y)
para todo (x, y) R2 , de modo que

f (2, 0) = (6, 0)
J. P
aez
y
236
g(2, 0) = (4, 0),
4.6. M
aximos y mnimos
N9 (f )
N4 (g)
b
(4, 0)
(2, 0)
(2, 0)
N1 (f )
Figura 4.16: Los conjuntos de nivel N9 (f ) y N1 (f ) (de la funcion f (x, y) = (x + 1)2 + y 2 ) intersectan
tangencialmente al conjunto de nivel N4 (g) (de la funcion g(x, y) = x2 + y 2 ) en los puntos (2, 0) y
(2, 0), respectivamente.
y
f (2, 0) = (2, 0)
g(2, 0) = (4, 0)
lo que comprueba que

f (2, 0) =
3
g(2, 0)
2
f (2, 0) =
1
g(2, 0)
2
La discusion anterior parece sugerir lo siguienteo: si tenemos una funcion f para la cual queremos
calcular sus valores extremos sobre un conjunto de nivel de una funcion g (digamos Nc (g)), y
localizar los puntos de este conjunto en los cuales alcanza estos valores extremos, es suficiente con
encontrar los puntos x
Nc (g) en los cuales se satisface que f (
x) y g(
x) son paralelos.
Aprovechando que ya sabemos cu
ales son estos puntos para las funciones f y g del inciso 2 del
ejemplo 4.56, sigamos el procedimiento descrito en el p
arrafo anterior y veamos si llegamos a las
mismas soluciones. Manos a la obra!
Como f (x, y) = x(x 1)2 + y 2 y g(x, y) = x2 + y 2 se tiene que
f (x, y) = ((x 1)2 + 2x(x 1), 2y)
= ((x 1)(3x 1), 2y)
y
g(x, y) = (2x, 2y)
de modo que nuestro problema es localizar las parejas (x, y) N1 (g) para las cuales se satisfaga
que
f (x, y) = g(x, y)
para alguna R.
Lo anterior se traduce en encontrar las parejas (x, y) R2 y los n
umeros R que sesatisfagan
las siguientes ecuaciones:
g
f
(x, y) = (x, y)
x
x
g
f
(x, y) = (x, y)
y
y
237
J. P
aez
4.6. M
aximos y mnimos
g(x, y) = c
que en nuestro caso se traducen en el sistema de ecuaciones
(x 1)(3x 1) = 2x
2y = 2y
(1)
(2)
x +y =1
(3)
que en principio se debiera poder resolver, pues es un sistema de tres ecuaciones con tres inc
ognitas
(x, y y ).
Empecemos por observar que, si alguna soluci
on de las ecuaciones anteriores fuera tal que y 6= 0,
entonces de la ecuaci
on (2) deducimos que = 1, de modo que la ecuaci
on (1) se convierte en la
ecuaci
on cuadratica (en la variable x)
3x2 6x + 1 = 0
cuyas soluciones son
x1 =
6+
=1+
62 4(3)(1)
2(3)
6
3
y
x2 =
=1
62 4(3)(1)
2(3)
6
3
Si sustituimos estas soluciones en la ecuaci

on (3), concluimos que s
olo podemos tomar el segundo
valor, obteniendo las siguientes soluciones a nuestro sistema original
s
6
2( 6 1)
,
con
=1
(x, y) = 1
3
3
y
6
,
(x, y) = 1
3
2( 6 1)
3
con
=1
Si ahora suponemos que tenemos una soluci

on de nuestro sistema de ecuaciones con y = 0, de
la ecuaci
on (3) de este sistema concluimos que x = 1 o x = 1, lo cual, de la ecuaci
on (1) nos
conduce a las soluciones
(x, y) = (1, 0)
con
=0
y
(x, y) = (1, 0)
con
=4
Como seguramente el lector ya se percat

o, con este procedimiento obtuvimos los mismos puntos
que obtuvimos anteriormente, y la buena noticia es que el procedimiento sigue siendo valido en
cualquier Rn .
J. P
aez
238
4.6. M
aximos y mnimos
Es decir, aseguramos que: si f es una funcion derivable sobre un conjunto de nivel Nc (g) de una
funcion derivable g, y x
0 Nc (g) es un punto en el que la funcion f tiene un m
aximo o mnimo
local (sobre Nc (g)), entonces se debe cumplir que f (
x0 ) y g(
x0 ) son vectores paralelos, es decir,
que existe R tal que
f (
x0 ) = g(
x0 )
La importancia de la afirmacion anterior es que, si deseamos localizar los puntos en los que una
funcion f alcanza sus valores extremos (incluso locales) sobre un conjunto de nivel Nc (g) de una
funcion derivable g, basta con encontrar los puntos de este conjunto para los cuales se satisface que
los gradientes de f y de g son paralelos.
Ilustraremos la afirmacion anterior con un ejemplo geometrico (en R3 ) que sin duda el lector
conoce (y sabe la respuesta): dado un plano P cuya ecuaci
on est
a dada por
Ax + By + Cz + D = 0
(con A2 + B 2 + C 2 > 0) y un punto x
0 = (x0 , y0 , z0 ) R3 , calcular la distacia del punto x
0 al plano
P.
Como sabemos, la distacia del punto x
0 al plano P se obtiene como la mnima distacia entre
el punto x
0 y los puntos del plano P , es decir que nuestro problema lo podemos plantear de la
siguiente manera: consideramos la funcion d que nos da la distancia entre el punto x
0 y cualquier
otro punto x
= (x, y, z) R3 , es decir
p
d(x, y, z) = (x x0 )2 + (y y0 )2 + (z z0 )2
y nos planteamos el problema de localizar el mnimo valor de la funcion d sobre el conjunto N0 (g),
en donde g la definimos como
g(x, y, z) = Ax + By + Cz + D
Para simplificar los c
alculos, y dado que el punto en N0 (g) en el que se minimiza la distacia con
x
0 es el mismo en el que se minimiza la distacia al cuadrado, trabajaremos con la funcion
f (x, y, z) = d2 (x, y, z)
= (x x0 )2 + (y y0 )2 + (z z0 )2
(esta es una simplificacion que el lector debera de tener siempre muy presente).
Dado que
f (x, y, z) = (2(x x0 ), 2(y y0 ), 2(z z0 ))
y
g(x, y, z) = (A, B, C)
nuestro problema se reduce a resolver el sistema de ecuaciones
2(x x0 ) = A
2(y y0 ) = B
2(z z0 ) = C
Ax + By + Cz + D = 0
De las primeras tres ecuaciones concluimos que
1
x = A + x0
2
239
J. P
aez
4.6. M
aximos y mnimos
1
y = B + y0
2
1
z = C + z0
2
y si sustituimos estos valores en la cuarta ecuaci
on, obtenemos que

1
1
1
A
A + x0 + B
B + y0 + C
C + z0 + D = 0
2
2
2
es decir que
2 (Ax0 + By0 + Cz0 + D)
(4.49)
A2 + B 2 + C 2
Por lo tanto, sustituyendo en los valores despejados de x, y y z, el punto x
p dado por la terna

Ax0 + By0 + Cz0 + D
Ax0 + By0 + Cz0 + D
Ax0 + By0 + Cz0 + D
,
y
B
,
z
C
x
p = x0 A
0
0
A2 + B 2 + C 2
A2 + B 2 + C 2
A2 + B 2 + C 2
Ax0 + By0 + Cz0 + D
(A, B, C)
=x
0
A2 + B 2 + C 2
=
es el u
nico punto del plano P para el cual se satisface que
f (
xp ) = g(
xp )
en donde est
a dada por 4.49 (n
otese que, si x
0 P entonces x
p = x
0 , como era de esperarse!),
de modo que la distacia del punto x
0 al plano P estar
a dada por
d(
x0 , P ) =
q
f (
xp )
= k
xp x
0 k

Ax0 + By0 + Cz0 + D

=
(A,
B,
C)

A2 + B 2 + C 2
|Ax0 + By0 + Cz0 + D|

k(A, B, C)k
|Ax0 + By0 + Cz0 + D|
=
A2 + B 2 + C 2
lo que sin duda el lector recordara muy bien de sus cursos de Geometra Analtica.
El ejemplo anterior no s
olo refuerza nuestra sospecha de que, si una funcion f alcanza un valor
extremo sobre un conjunto de nivel de otra funcion g en un punto x
0 de este conjunto, entonces los
vectores gradiente de f y g en x
0 deben ser paralelos, sino que nos permite plantear un problema
que nos conducira a formular un resultado mas general que el descrito en el p
arrafo anterior.
El problema ahora es el siguiente:
1. dada una recta l determinada por la intersecci
on de los planos P1 y P2 cuya ecuaci
on de cada
uno de ellos est
a dada por
A1 x + B1 y + C1 z + D1 = 0
A2 x + B2 y + C2 z + D2 = 0
respectivamente (con (A1 , B1 , C1 ) y (A2 , B2 , C2 ) vectores no paralelos (en particular diferentes
de 0) para que s determinen una recta), y
J. P
aez
240
4.6. M
aximos y mnimos
2. un punto x
0 = (x0 , y0 , z0 ) R3 ,
calcular la distacia del punto x

0 a la recta l.
Como en el ejemplo anterior, usaremos la funcion que nos calcula la distacia al cuadrado entre
el punto x
0 y un punto de la recta l, y nuestra tarea ser
a localizar el punto de l en el que esta
funcion alcanza su valor mnimo (con respecto a los puntos de la recta l).
Es decir, tomaremos la funci
on
f (x, y, z) = d2 (x, y, z)
= (x x0 )2 + (y y0 )2 + (z z0 )2
y nuestro objetivo es localizar un punto x
l del conjunto

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
tal que f alcanza su valor mnimo (con respecto a los puntos de S) en x

l , en donde g1 y g2 est
an
dadas por
g1 (x, y, z) = A1 x + B1 y + C1 z + D1
g2 (x, y, z) = A2 x + B2 y + C2 z + D2
Desde un punto de vista geometrico, si x
l es el punto de la recta l que est
a m
as cerca del punto
x
0 , esto significa que x
l es el u
nico punto de esta recta que pertenece al conjunto de nivel Nc (f ) de
f , en donde
c = f (
xl )
= k
xl x
0 k2
0 . Dicho de otra forma, la recta l es tangente a

y Nc (f ) es la esfera de radio c con centro en x
la esfera Nc (f ) en el punto x
l .
Notese ahora que, si tomamos el vector que va de x
0 a x
l , que llamaremos v, este debe ser
perpendicular a la recta l, y si por otra parte recordamos que los vectores (A1 , B1 , C1 ) y (A2 , B2 , C2 )
son normales a los planos P1 y P2 (que determinan a la recta l y que por lo tanto la contienen)
tendremos que dichos vectores tambien deber
an ser perpendiculares a l (ver figura 4.17).
Del razonamiento anterior concluimos que, como los vectores v, (A1 , B1 , C1 ) y (A2 , B2 , C2 ) son
perpendiculares a la misma recta l, y estos son linealmente independientes, se debe cumplir que el
vector v se puede escribir como una combinaci
on lineal de los vectores (A1 , B1 , C1 ) y (A2 , B2 , C2 ).
Finalmente, si ahora observamos:
1. que el vector (A1 , B1 , C1 ) coincide con ser el vector gradiente de g1 evaluado en cualquier
punto del plano P1 (en particular en x
l ),
2. que lo mismo sucede con el vector (A2 , B2 , C2 ) y la funcion g2 , y
3. que los vectores f (
xl ) y v son paralelos, pues ambos son normales a la esfera Nc (f )
concluimos que el vector f (
xl ) se debe poder expresar como una combinaci
on lineal de los
vectores g1 (
xl ) y g2 (
xl ), es decir, deben existir 1 , 2 R tales que
f (
xl ) = 1 g1 (
xl ) + 2 g2 (
xl )
241
J. P
aez
P1
(A1 , B1 , C1 )
4.6. M
aximos y mnimos
(A2 , B2 , C2 )
P2
b
x
l
v
x
0
Figura 4.17: Dado que la recta l, que es la interseccion de los planos P1 y P2 , es tangente en el punto
x
l a la esfera con centro en x
0 , los vectores v = x
l x
0 , (A1 , B1 , C1 ) y (A2 , B2 , C2 ) (los vectores
normales a P1 y P2 , respectivamente) son perpendiculares a l, y por lo mismo pertenecen a un mismo
plano.
Para aprovechar la discusion anterior, formularemos un resultado mas general que seguramente
el lector ya est
a intuyendo: si un conjunto S R3 es la intersecci
on de dos conjuntos de nivel
(que sin perdida de generalidad supondremos que son los conjuntos de nivel 0) de dos funciones
(derivables) g1 y g2 , es decir que

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
yx
0 S es un punto tal que:
1. los vectores g1 (
x0 ) y g2 (
x0 ) son linealmente independientes, y
2. una funci
on f (derivable) alcanza un valor extremo (incluso local) en x
0 sobre (o con respecto
a) S
entonces se debe cumplir que el vector f (
x0 ) se puede expresar como una combinaci
on lineal
de los vectores g1 (
x0 ) y g2 (
x0 ), es decir, deben existir 1 , 2 R tales que
f (
x0 ) = 1 g1 (
x0 ) + 2 g2 (
x0 )
Y si el lector ya est
a covencido de que el resultado anterior debe ser cierto, seguramente estar
a
de acuerdo en que su siguiente generalizaci
on (para funciones de Rn en R) tambien debe ser cierto:
si g1 , . . . , gm : U Rn R son m funciones de clase C 1 en U , con m < n, S Rn es el conjunto
dado por
S = {
x U Rn | g1 (
x) = 0, . . . , gm (
x) = 0}
yx
0 S es un punto tal que:
1. los vectores g1 (
x0 ), . . . , gm (
x0 ) son linealmente independientes, y
2. una funci
on f : U Rn R de clase C 1 en U alcanza un valor extremo (incluso local) en x
0
sobre (o con respecto a) S
J. P
aez
242
4.6. M
aximos y mnimos
entonces se debe cumplir que el vector f (

x0 ) se puede expresar como una combinaci
on lineal
de los vectores g1 (
x0 ), . . . , gm (
x0 ), es decir, deben existir 1 , . . . , m R tales que
f (
x0 ) = 1 g1 (
x0 ) + + m gm (
x0 )
Todo el trabajo que nos hemos tomado a lo largo de esta secci
on ha sido con el u
nico objetivo de
llegar al resultado anterior, el cual es conocido como el Teorema de los multiplicadores de Lagrange 3 .
Antes de formularlo de manera m
as formal, conviene hacer algunas observaciones, empezando
por su nombre: el termino multiplicadores se refiere a los escalares 1 , . . . , m . Al conjunto S se
le conoce con el nombre de conjunto de restricciones y la condici
on de que m sea menor a n tiene
que ver con los siguientes dos hechos: uno, que s
olo si m es menor o igual a n, se puede cumplir
que m vectores en Rn sean linealmente independientes, y dos, si m = n lo m
as probable es que el
conjunto S sea vaco, o s
olo contega a lo m
as un n
umero finito de puntos.
Finalmente, la condici
on de que las funciones g1 , . . . , gm y f sean de clase C 1 en U est
a directamente relacionada con las herramientas que usaremos en su prueba, la que por cierto, daremos
hasta el siguiente captulo, pues mucha de esta herramienta la desarrollaremos hasta entonces.
La versi
on que probaremos en este texto del teorema de los multiplicadores de Lagrange es la
siguiente.
Teorema 4.57 (de los multiplicadores de Lagrange) Sean:
1. g1 , . . . , gm : U Rn R funciones de clase C 1 en U , con m < n,
2. S Rn el conjunto dado por
S = {
x U Rn | g1 (
x) = 0, . . . , gm (
x) = 0}
3. x
0 S tal que g1 (
x0 ), . . . , gm (
x0 ) son linealmente independientes.
Si f : U Rn R es una funci
on de clase C 1 en U tal que f tiene un m
aximo o mnimo
(global o s
olo local) en x
0 sobre S entonces existen 1 , . . . , m R tales que
f (
x0 ) = 1 g1 (
x0 ) + + m gm (
x0 )
Dado que la prueba de este teorema tendra que esperar hasta el siguiente captulo, por ahora
s
olo haremos una importante observacion con relaci
on a la tercera hip
otesis de su enunciado. Esta
observacion se relaciona con el hecho de que un mismo conjunto de restricciones S se puede obtener
usando diferentes colecciones de funciones g1 , . . . , gm , y no en todos los casos estas colecciones
satisfacen la condici
on del inciso 3, la cual es fundamental para la validez del teorema.
En el ejemplo siguiente ilustramos esta situaci
on.

Ejemplo 4.58 Sea S = (t, 0, 0) R3 | t R y
f (x, y, z) = k(x, y, z) (0, 1, 1)k2
Joseph-Louis Lagrange, bautizado como Giuseppe Lodovico Lagrangia, tambien llamado Giuseppe Luigi Lagrangia o Lagrange (Turn, 25 de enero de 1736 - Pars, 10 de abril de 1813), fue un fsico, matem
atico y astr
onomo
italiano que despues vivi
o en Prusia y Francia. Lagrange trabaj
o para Federico II de Prusia, en Berln, durante veinte
a
nos. Lagrange demostr
o el teorema del valor medio, desarroll
o la mec
anica Lagrangiana y tuvo una importante
contribuci
on en astronoma. (fuente: Wikipedia)
243
J. P
aez
4.6. M
aximos y mnimos
= x2 + (y + 1)2 + (z + 1)2
(la distancia al cuadrado entre el punto (x, y, z) y el punto (0, 1, 1)).
a de acuerdo, se sabe que 0 = (0, 0, 0) es el punto en el cual la
funci
on f alcanza su mnimo valor (global) sobre el conjunto S y que en este punto se tiene que
f (0) = (0, 2, 2)
Primero observemos que si g1 (x, y, z) = z y g2 (x, y, z) = z + y 2 entonces el conjunto S coincide
con ser

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
y si g3 (x, y, z) = y tambien se tiene que

S = (x, y, z) R3 | g1 (x, y, z) = 0, g3 (x, y, z) = 0
En el primer caso se tiene que g1 (0) = (0, 0, 1) = g2 (0), es decir, no son linealmente
independientes, y el vector f (
0) = (0, 2, 2) no se puede escribir como combinaci
on lineal de ellos
(ver figura 4.18), mientras que en el segundo caso se tiene que g1 (0) = (0, 0, 1) y g3 (0) = (0, 1, 0)
los cuales s son linealmente independientes y se verifica que
f (
0) = 2g1 (0) + 2g3 (0)
que es lo que asegura el teorema de los multiplicadores de Lagrange (ver figura 4.19).
Z
g1 (
0) = g2 (
0) = (0, 0, 1)
f (0) = (0, 2, 2)
S
g1 (x, y, z) = 0
Y
X
g2 (x, y, z) = 0
Figura 4.18: En el ejemplo 4.58, los vectores g1 (0) = g2 (0) = (0, 0, 1) no son linealmente independientes y el vector f (
0) = (0, 2, 2) no se puede escribir como combinacion lineal de ellos.
Finalmente, mostraremos c
omo se usa el teorema 4.57 concluyendo el problema con el cual lo
a
motivamos: encontrar la distacia de un punto x
0 = (x0 , y0 , z0 ) R3 a una recta l, la cual est
determinada como la intersecci
on de dos planos.
Desafortunadamente, resolver el caso general planteado inicialmente implica realizar largas y
tediosas manipulaciones algebraicas, raz
on por la cual nos limitaremos a resolver el problema para
un punto y una recta especficos.
J. P
aez
244
4.6. M
aximos y mnimos
f (0) = (0, 2, 2)
g1 (0) = (0, 0, 1)
g1 (x, y, z) = 0
g3 (0) = (0, 1, 0)
X
g3 (x, y, z) = 0
= (0, 1, 0) s son linealmente

Figura 4.19: En el ejemplo 4.58, los vectores g1 (0) = (0, 0, 1) y = g3 (0)
independientes y el vector f (0) = (0, 2, 2) s se puede escribir como combinacion lineal de ellos, como
asegura el teorema de los multiplicadores de Lagrange.
De esta forma, tomemos el punto (1, 1, 1) R3 y la recta determinada por la intersecci
on de los
planos
x+y1=0
yz+1=0
y calculemos el valor mnimo de la funcion

f (x, y, z) = (x 1)2 + (y 1)2 + (z 1)2
sobre el conjunto S R3 dado por

S = (x, y, z) R3 | g1 (x, y, z) = 0, g2 (x, y, z) = 0
en donde g1 (x, y, z) = x + y 1 y g2 (x, y, z) = y z + 1.

De acuerdo con el teorema de los multiplicadores de Lagrange, si x
0 = (x0 , y0 , z0 ) S es el
punto en el que f alcanza su valor mnimo (sobre S), deben existir 1 , 2 R tales que
f (
x0 ) = 1 g1 (
x0 ) + 2 g2 (
x0 )
lo que nos lleva a resolver el sistema de ecuaciones
g1
g2
f
(
x0 ) = 1
(
x 0 ) + 2
(
x0 )
x
x
x
g1
g2
f
(
x0 ) = 1
(
x 0 ) + 2
(
x0 )
y
y
y
g1
g2
f
(
x0 ) = 1
(
x 0 ) + 2
(
x0 )
z
z
z
g1 (
x0 ) = 0
g2 (
x0 ) = 0
y que en el caso particular que estamos analizando, se traduce en
2(x0 1) = 1
245
J. P
aez
4.7. Problemas
2(y0 1) = 1 + 2
2(z0 1) = 2
x0 + y 0 1 = 0
y0 z0 + 1 = 0
Para resolver este sistema, de las primeras tres ecuaciones, despejamos a x0 , y0 y z0 en terminos
de 1 y 2 y los sustituimos en las u
ltimas dos ecuaciones, con lo que obtenemos el siguiente sistema
en las inc
ognitas 1 y 2 :
21 + 2 = 2
1 + 22 = 2
que tiene como soluci

on 1 = 2/3 = 2 de tal forma que sustituyendo estos valores en las primeras
tres ecuaciones del sistema original, concluimos que
(x0 , y0 , z0 ) =
1
(2, 1, 4)
3
de manera que la distancia que se estaba buscando es

s
s
2
2
2
1
1
4
2
(2, 1, 4) =
1 +
1 +
1
f
3
3
3
3
6
=
3
Si el lector resolvi
o problemas de este estilo en sus cursos de Geometra Analtica, seguramente
not
o que en general los c
alculos son m
as sencillos, ademas de que se obtuvo explcitamente cu
al es
el punto de la recta que est
a m
as cercano al punto x
0 , lo que no se suele hacer por los metodos
desarrollados en esos cursos.
4.7
Problemas
0 U y u
Rn tal que k
uk = 1. Pruebe que, si la derivada direccional
Du f (
x0 ) existe entonces la derivada direccional Du f (
x0 ) tambien existe y adem
as
Du f (
x0 ) = Du f (
x0 )
2. Pruebe las proposiciones 4.4 y 4.5.
3. Sea f : U Rn R tal que f es constante sobre el conjunto abierto U . Pruebe que f es
derivable para toda x
U y que adem
as Df (
x) es la funcion lineal constante 0 (Df (
x) 0)
para toda x
U . Se cumple lo recproco? Es necesaria otra hip
otesis sobre el conjunto U ?
4. Si L : Rn R es una funci
on lineal, pruebe que L es derivable para toda x
Rn y que
DL(
x) = L.
5. Sea f : I R R derivable en x0 I, con I un intervalo abierto. Definimos h : I R
R2 R como h(x, y) = f (x) y. Pruebe:
J. P
aez
246
4.7. Problemas
(a) que h es derivable en el punto (x0 , y0 ) = (x0 , f (x0 )) I R
(b) que Gf = N0 (h) y que la recta tangente al conjunto de nivel N0 (h) en el punto (x0 , f (x0 )),
calculada de acuerdo a la definicion 4.31, coincide con ser la recta tangente a la gr
afica
de f en el punto (x0 , f (x0 )), calculada de acuerdo a como lo haca en su primer curso
de c
alculo.
6. Sea f : U R2 R derivable en x
0 = (x0 , y0 ) U . Definimos h : U R R3 R como
h(x, y, z) = f (x, y) z. Pruebe:
(a) que h es derivable en el punto (x0 , y0 , z0 ) = (x0 , y0 , f (x0 , y0 )) U R
(b) que Gf = N0 (h) y que el plano tangente al conjunto de nivel N0 (h) en el punto
(x0 , y0 , z0 ), calculada de acuerdo a la definicion 4.31, coincide con ser el plano tangente a la gr
afica de f en el punto (x0 , y0 , z0 ), calculado de acuerdo con la definicion
4.18.
7. De un ejemplo de una funci
on f : R2 R que s
olo sea derivable en el (0, 0).
8. Muestre que las derivadas parciales de la funcion definida en el ejemplo 4.23 no son continuas
en el (0, 0) (sugerencia: hay dos formas de hacer esto, uno directo, mostrando que el lmite de
ambas derivadas en el (0, 0) no existe, y una forma indirecta, usando los resultados probados
en el texto).
9. Sea f : U Rn R tal que U es un conjunto abierto e i {1, . . . , n} fija. Pruebe que,
si para todo par de puntos x
, y U tales que x
y =
ei para alguna R, se tiene que
f
existe para toda x
U
f (
x) = f (
y ) (es decir, que f no depende de la variable xi ) entonces x
i
y adem
as
f
(
x) = 0
xi
Se cumple lo recproco? Es necesaria otra hip
otesis sobre el conjunto U ? Pruebe sus
respuestas.
f
existe y es continua en cada punto x
U , para i {1, . . . , n}.
10. Sea f : U Rn R tal que x
i
e1 , . . . , en }),
Si x1 , . . . , xn es otro sistema de coordenadas (inducido por otra base ortonormal {
f
pruebe que x
U , para i {1, . . . , n}.
existe y es continua en cada punto x
i
x0 ) U . Pruebe que, si para toda
f
f
(
x
)
existe
para
cada
x
Br (
x0 ) y x
est
a acotada en Br (
x0 )
i {1, . . . , n} se tiene que x
i
i
entonces f es continua en x
0 .
0 U , : (a, b) R Rn tal que (a, b) U , y t0 (a, b) tal que
(t0 ) = x
0 . Definimos : (a, b) R R como
f ((t))f ((t0 ))f ((t0 ))((t)(t0 ))
si (t) (t0 ) 6= 0
k(t)(t0 )k
(t) =
0
si (t) (t0 ) = 0
Pruebe que, si f es derivable en x
0 y es continua en t0 entonces es continua en t0 .

on 4.27.
247
J. P
aez
4.7. Problemas
14. Pruebe el corolario 4.30.

15. Sea f : U R3 R una funci
on que est
a expresada en terminos de las coordenadas cilndricas
(, , z) de cada punto x
U . Si x
0 U tiene coordenadas cilndricas (0 , 0 , z0 )
f f
,
(a) defina
f
z
en el punto x
0 . Interprete el significado geometrico de estas derivadas
(b) relacione a cada una de las derivadas

direccional en el mismo punto
f f
,
f
z
en el punto x
0 con alguna derivada
(c) para cada punto x

U defina una base ortonormal de R3 en la cual se pueda expresar la
derivada de f en x
(Df (
x)) en terminos de las derivadas definidas en el inciso anterior
(d) exprese a cada una de las derivadas
derivadas
f f
x , y
f
z
f f
,
f
z
en el punto x
0 en terminos de las
en el punto x
0 , y viceversa
16. Repita el problema anterior suponiendo ahora que f est

a expresada en terminos de coordenadas esfericas (, , ).
17. Sean, f : U Rn R de clase C 2 en U , y u
, v Rn vectores unitarios. Pruebe que Dv (Du f )
y Du (Dv f ) existen y
Dv (Du f )(
x) = Du (Dv f )(
x)
para toda x
U.
18. (a) Defina las derivadas parciales de orden dos en coordenadas polares (ver definicion 4.35),
en coordenadas cilndricas (ver problema 15), y en coordenadas esfericas (ver problema
16)
(b) Pruebe que el teorema de las derivadas parciales cruzadas tambien se cumple para estas
derivadas parciales de orden dos
19. Sea
f (x, y) =
(a) calcule
f
x (x, y)
f
y (x, y)
(b) pruebe que
f
x (0, 0)
(c) pruebe que
2f
yx (0, 0)
=0=
xy(x2 y 2 )
x2 +y 2
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
para (x, y) 6= (0, 0)

f
y (0, 0)
= 1 y que
2f
xy (0, 0)
=1
(d) este ejemplo contradice el 4.39? Justifique su respuesta

20. Sean F1 , . . . , Fn : U Rn R tal que Fi es de clase C 1 en U para i = 1, . . . , n, y supongase
f
(
x) = Fi (
x) para toda x
U (i = 1, . . . , n). Pruebe
que existe f : U Rn R tal que x
i
que
Fi
x)
xj (
Fj
x)
xi (
para toda x
U (i, j = 1, . . . , n).
21. Sea f : U Rn R de clase C k+1 en U . Pruebe que cualquier derivada parcial de orden k
de f es (como funci
on de Rn en R) derivable en cualquier punto x
U.
22. Sea f : U Rn R. Pruebe que si f es de clase C k+1 en U entonces f es de clase C k en U
(para toda k N).
J. P
aez
248
4.7. Problemas
)
23. Sea f : Rn R de clase C 2 en Rn y g : R R dos veces derivable. Pruebe que x(gf
(
x)
j xi
n
existe para toda x
R (i, j = 1, . . . , n) y de una expresi
on para estas derivadas parciales en
terminos de f y g.
24. Sea f : U Rn R, x
0 U y r > 0 tales que f es de clase C k en Br (
x0 ) U . Si
n
u
= (u1 , . . . , un ) es tal que 0 < k
uk < r, y : (r/ k
uk , r/ k
uk) R R est
a dada por
(t) = x
0 + t
u, pruebe que la funcion
f : (r/ k
uk , r/ k
uk) R R
es de clase C k en (r/ k
uk , r/ k
uk) y que adem
as
(f )(m) (t) =
n
X
i1 ,...,im =1
mf
((t)) ui1 uim
xim xi1
para cada t (r/ k

uk , r/ k
uk) y cada m {1, . . . , k}.
25. Sean f, g : R R dos veces derivables.
(a) Definimos h : R2 R como h(x, t) = f (x at) + g(x + at) con a R una constante.
Pruebe que:
2h
2h
a2 2 (x, t) = 2 (x, t) para toda (x, t) R2
x
t
(b) Definimos h : R2 R como h(x, y) = xf (x + y) + yg(x + y). Pruebe que:
2h
2h
2h
(x,
y)
+
(x,
y)
=
2
(x, y) para toda (x, y) R2
x2
y 2
yx
(c) Definimos h : R2 R como h(x, y) = f (x2 + y 2 ). Pruebe que:
y2
2
h
h
2h
2 h
(x,
y)
x
(x, y) + x (x, y) y (x, y) = 0 para toda (x, y) R2
2
2
x
y
x
y
26. Sea f : U R2 R y x
0 U .
(a) Pruebe que, si f es derivable en x
0 entonces la funcion polinomial
P2 (x, y) = A(xx0 )2 +B(yy0 )2 +C(xx0 )(yy0 )+
f
f
(
x0 )(xx0 )+ (
x0 )(yy0 )+f (
x0 )
x
y
satisface que
lim
x0
f (
x) P2 (
x)
=0
k
xx
0 k
para cualesquiera A, B y C n
umeros reales.
(b) Muestre con un ejemplo que el inciso anterior es falso si s
olo suponemos que
f
x0 ) existen.
y (
249
f
x0 )
x (
J. P
aez
4.7. Problemas
27. Sea f : U Rn R de clase C N en U y x

0 U . Definimos
PN (x1 , . . . , xn ) = f (
x0 ) +
n
X
1
f
(
x0 )xi + +
xi
N!
i=1
n
X
i1 ,...,iN =1
N f
(
x0 )xi1 xiN
xi1 xiN
= (h1 , . . . , hn ), pruebe que

Si h
PN (h)
f (
x0 + h)
=0
N

h
0
h
lim
(sugerencia: use la expresi

on del residuo vista en la demostracion del teorema de Taylor (para
el caso N 1)).
28. Use el polinomio de Taylor de grado dos de la funcion f (x, y) = cos(x + y) para calcular (y
probar) el siguiente lmite:
1 cos(x + y)
lim
(x,y)(0,0) (x2 + y 2 )1/2
29. Sea f (x, y, z) = Ax2 +By 2 +Cz 2 +Dxy +Eyz +F xz +G. Pruebe que el residuo del polinomio
de Taylor de orden dos de esta funcion siempre vale cero (en cualquier punto). Con base en
lo anterior:
(a) escriba el polinomio x2 + y 2 + z 2 en potencias de x 1, y 1 y z 3
(b) escriba el polinomio x2 2y 2 + 4z 2 + xy yz + xz + 1 en potencias de x 1, y + 1 y z

30. Usando el polinomio de Taylor de grado adecuado de la funcion et , y sin hacer demasiados
calculos, encuentre todas las derivadas parciales de orden tres, en el (0, 0), de la funci
on
2
2
f (x, y) = (x2 + y 2 )ex +y
31. Por un procedimiento an
alogo al del problema anterior, encuentre el valor de todas las
derivadas parciales de orden tres, en el (0, 0), de la funcion f (x, y) = (exy 1) sen(x + y)
32. Sean x1 , . . . , xn R y N N. Use el teorema de Taylor para probar que
(x1 + + xn )
donde
k1 ++kn =N
0ki
N
k1 kn
N
k1 kn
xk11 xknn
N!
k1 ! kn !
(este n
umero es conocido con el nombre de coeficiente multinomial).
33. Sean f : U Rn R, H : V Rk Rn , U y V abiertos, x
0 U y y0 V tales que
H(
y0 ) = x
0 . Pruebe que, si f alcanza un valor m
aximo (mnimo) local en x
0 y H es continua
en y0 entonces f H alcanza un valor m
aximo (mnimo) local en y0 . Este resultado sigue
siendo cierto si H no es continua en y0 ? Pruebe su respuesta.
J. P
aez
250
4.7. Problemas
34. Sea f : U Rn R de clase C 2 en U , x

0 U y r0 > 0 tal que Br0 (
x0 ) U , y
u
= (u1 , . . . , un ) Rn tal que k
uk = 1. Definimos : (r0 , r0 ) R R como (t) = x
0 + t
u
y g : (r0 , r0 ) R R como g = f . Pruebe que, si f alcanza un valor m
aximo (mnimo)
local en x
0 entonces g alcanza un valor m
aximo (mnimo) local en 0.
35. Sea n N, n 2, y f (x, y) = axn + by n , con ab 6= 0. Muestre que el (0, 0) es el u
nico punto
crtico de f y determine su tipo en terminos de a, b y n.
36. Sea f (x, y, z) = ax2 + by 2 + cz 2 , abc 6= 0. Muestre que el (0, 0, 0) es el u
nico punto crtico de
f y determine su tipo en terminos de a, b y c.
37. Pruebe el inciso 2 de la proposici
on 4.51.
38. Pruebe el inciso 1 de la proposici
on 4.53.
39. Sea f una funci
on de clase C 2 en una vecindad de x
0 Rn . Pruebe que, si f alcanza un
mnimo local en x
0 entonces
2f
(
x0 ) 0
x2i
para cada i {1, . . . , n} (sugerencia: use la proposici
on 4.53).
40. Sea x
0 = (x1 , . . . , xn ) un punto crtico de una funcion f de clase C 2 en una vecindad de
x
0 Rn , tal que
2f
2f
(
x
)
(
x0 ) < 0
0
x2i
x2j
para algunas i, j {1, . . . , n}, con i 6= j. Pruebe que x
0 es un punto silla de f .
41. Sea x
0 = (x0 , y0 ) un punto crtico de una funcion f de clase C 2 en una vecindad de x
0 R2 ,
tal que
2
2
f
2f
2f
<0
(
x
)
(
x
)
(
x
)
0
0
0
x2
y 2
yx
Pruebe que x
0 es un punto silla de f (sugerencia: observe que la cantidad anterior est
a
relacionado con el discriminante del polinomio de grado 2 que se obtiene en la variable m al
evaluar Hfx0 (1, m), para m R).
42. Sea f : R2 R definida como f (x, y) = (y 3x2 )(y x2 ). Pruebe que:
(a) el origen es un punto crtico de f
(b) si a, b R y g(t) = (at, bt) con t R, entonces f g tiene un mnimo local en t = 0
(c) el origen no es un mnimo local de f
43. Sea f (x, y) = (x2 1)2 (x2 y x 1)2 . Pruebe que:

(a) f s
olo tiene dos puntos crticos
(b) ambos puntos crticos son m
aximos locales
(c) se puede presentar una situaci
on an
aloga para funciones de R en R? Pruebe su respuesta.
44. Sea f (x, y) = 3xey x3 e3y . Pruebe que:
251
J. P
aez
4.7. Problemas
(a) f s
olo tiene un punto crtico
(b) el punto crtico es un m
aximo local
(c) f no tiene un m
aximo global
(d) se puede presentar una situaci
on an
aloga para funciones de R en R? Pruebe su respuesta.
45. Encuentre el m
aximo y el mnimo de la funcion f (x, y) = xy y + x 1 sobre el conjunto
A = {(x, y) R2 | x2 + y 2 2}.
46. Sean (x1 , y1 ), . . . , (xn , yn ) puntos en R2 con x1 < x2 < . . . < xn . Pruebe que:
(a) la funci
on
d(m, b) =
n
X
(yi (mxi + b))2
i=1
alcanza un valor mnimo en R2 . Encuentre los valores m0 y b0 para los cuales se alcanza
este valor mnimo (la recta y = m0 x + b0 es la que mejor aproxima a los puntos
(x1 , y1 ), . . . , (xn , yn ) y al metodo que se usa para calcular m0 y b0 se le conoce como el
m
etodo de los cuadrados mnimos).
(b) si m0 y b0 son los valores del inciso anterior, pruebe que
n
X
(yi (m0 xi + b0 )) = 0
i=1
(c) si n = 2 (es decir, s

olo se toman dos puntos), entonces y = m0 x + b0 es la recta que pasa
por dichos puntos.
47. Encuentre los extremos de f relativos a S, donde:
(a) f (x, y) = x2 y 2 y S = {(x, cos(x)) R2 | x R}
(b) f (x, y, z) = x2 + y 2 + z 2 y S = {(x, y, z) R3 | z 2 + x2 + y 2 }

48. Escriba el n
umero 120 como suma de tres n
umeros de modo que la suma de sus productos,
tomados de dos en dos, sea m
axima.
49. Una compa
na planea fabricar cajas rectangulares cerradas con un volumen de 8 litros. El
material para la base y la tapa cuesta el doble que el que se usa para los lados. Encuentre
las dimensiones para las cuales el costo es mnimo.
50. Una ventana tiene la forma de un tri
angulo is
osceles montado sobre un rect
angulo. Si la base
del rect
angulo mide x, su altura mide y, los angulos de la base del tri
angulo miden , y el
permetro de la ventana mide 4 metros, encuentre los valores de x, y y que hacen que el
area de la ventana sea m
axima.
51. Tres alelos (formas mutantes de genes) A, B y O determinan los cuatro tipos sanguneos:
A (AA o AO), B (BB o BO), O (OO) y AB. La ley de Hardy-Weinberg establece que
la proporci
on P de individuos de una poblaci
on que llevan dos alelos diferentes es P =
2pq + 2pr + 2qr, donde p, q y r son las proporciones de los alelos A, B y O que se presentan
en dicha poblaci
on, respectivamente. Use el hecho de que p + q + r = 1 para demostrar que
P 2/3.
J. P
aez
252
4.7. Problemas
52. Sea P S = N1 (f ) R3 con f de clase C 1 en R3 . Supongase que P es un punto donde se

maximiza la distancia del origen a S. Pruebe que el vector que sale del origen y termina en
P es perpendicular a S.
53. Sea A una matriz de 3 3, simetrica diferente de la matriz cero. Definimos f (x, y, z) =
1
t
3
2
2
2
0 S es
2 (A(x, y, z) ) (x, y, z) y S = {(x, y, z) R | x + y + z = 1}. Pruebe que, si x
un punto en donde f alcanza su valor m
aximo (o mnimo) sobre S, entonces x
0 es un vector
propio de A correspondiente a un valor propio distinto de cero, es decir, existe 6= 0 tal que
A
x0 =
x0 .
54. Sean a1 , . . . , ak n
umeros positivos. Use multiplicadores de Lagrange para probar que:
(a1 ak )1/k
a1 + + ak
k
55. Use multiplicadores de Lagrange para demostrar que

1/p
a1 b1 + + an bn (ap1 + + apn )
donde ai , bi 0 para i = 1, . . . , n, y p, q > 1 tales que
como desigualdad de H
older ).
1
p
(bq1 + + bqn )
1/q
+ 1q = 1 (esta desigualdad es conocida
56. Pruebe que

1/p
((a1 + b1 )p + + (an + bn )p )1/p (ap1 + + apn )
1/p
+ (bp1 + + bpn )
donde ai , bi 0 para i = 1, . . . , n, y p 1 (esta desigualdad es conocida como desigualdad de

Minkowski ).
253
J. P
aez
J. P
aez
254
4.7. Problemas
Captulo 5
La derivada de funciones de Rn en Rm
En este captulo introduciremos el concepto de derivada para funciones de Rn en Rm , que entre
otras cosas, tendra que coincidir con los conceptos que hemos desarrollado en los captulos anteriores
cuando n = 1 o m = 1.
Y justo por la raz
on anterior, mucho del material que veremos ahora estar
a basado en las
ideas y conceptos de los captulos anteriores (sobre todo del captulo 4). Y como muestra de ello,
empezaremos por hacerlo as con la definicion de derivada.
5.1
La derivada
Como era de esperarse, la definicion de derivada de una funcion f : U Rn Rm en un punto

x
0 U est
a basada en la misma idea que se us
o para las funciones de Rn en R: la existencia de la
mejor aproximacion lineal a f alrededor del punto x
0 .
En efecto, como en el caso del captulo anterior, si L : Rn Rm es una funcion lineal, que al
trasladarla para que en el punto x
0 coincida con el valor de f en x
0 (es decir, que construimos
la funcion afn L(
xx
0 ) + f (
x0 )), esta se parece mucho a f (
x) alrededor de x
0 (en donde el
criterio para decir que estas funciones se parecen mucho es que la diferencia entre ellas tiende a
0 m
as r
apido, comparado con la rapidez con la que el punto x
se aproxime al punto x
0 ), entonces
diremos que f es derivable en x
0 y que la derivada de f en este punto es la funcion lineal L.
Lo anterior, dicho de manera m
as precisa, lo dejamos plasmado en la siguiente
Definici
on 5.1 Sean f : U Rn Rm y x
0 U . Decimos que f es derivable en x
0 si existe
n
m
L : R R una funci
on lineal tal que
lim
x0
f (
x) (L(
xx
0 ) + f (
x0 ))
=0
k
xx
0 k
o lo que es equivalente (problema 36 del captulo 2), si

lim
x0
kf (
x) (L(
xx
0 ) + f (
x0 ))k
=0
k
xx
0 k
Lo que ahora procede es dar un ejemplo de como calcular la derivada que acabamos de definir,
pero que esta no sea de una funci
on del tipo de las que ya vimos en el captulo 3 o en el captulo
4, es decir, la derivada de una funci
on de Rn en Rm en donde n > 1 y m > 1.
255
Captulo 5. La derivada de funciones de Rn en Rm
5.1. La derivada
Observaci
on 5.2 Antes de ello, y en beneficio del propio ejemplo, conviene hacer notar que la
definici
on anterior es en efecto una generalizaci
on de las definiciones de derivada dadas en los
captulos antes mencionados.
Que la definici
on 4.14 del captulo 4 es un caso particular de la definici
on 5.1, es un hecho que
el lector puede verificar con s
olo leer su enunciado.
Para verificar la equivalencia entre la definici
on 5.1 y la definici
on 3.2 dada en el captulo 3, el
lector tendr
a que recurrir al problema 9 de este captulo, y del cual se desprende f
acilmente lo que
aqu afirmamos.
Una vez dicho lo anterior, procedemos a dar el siguiente
Ejemplo 5.3 Sea f : R2 R3 definida como
f (x, y) = (x2 cos(y), x2 sen(y), x2 )
Dado que la definici

on 5.1, como ya mencionamos, es una generalizaci
on de los conceptos de
derivada que vimos en los captulos 3 y 4, por la proposici
on 3.8 del primero de estos dos captulos,
debemos sospechar que la derivabilidad (y la derivada!) de f est
a determinada por la derivabilidad
(y la derivada!) de cada una de sus funciones coordenadas, funciones que son del tipo de las que
vimos en el captulo 4.
En virtud de lo anterior, todo parece indicar que para obtener la derivada de f en un punto
(x0 , y0 ) R2 , ser
a necesario calcular la derivada de sus funciones coordenadas f1 (x, y) = x2 cos(y),
2
f2 (x, y) = x sen(y) y f3 (x, y) = x2 en este punto.
Ahora, por los resultados obtenidos en el captulo 4, sabemos que las funciones lineales L1 ,L2 y
L3 de R2 en R asociadas a las matrices de 1 2
i
h

f1
f1
(x
,
y
)
(x
,
y
)
= 2x0 cos(y0 ) x20 sen(y0 )
0 0
0 0
x
y
h
i

f2
f2
(x
,
y
)
(x
,
y
)
= 2x0 sen(y0 ) x20 cos(y0 )
0 0
0 0
x
y
y
f3
x (x0 , y0 )
f3
y (x0 , y0 )
2x0 0
son las funciones lineales que m

as se le parecen a las respectivas funciones coordenadas alrededor
del punto (x0 , y0 ).
Por esta raz
on, la funci
on lineal L de R2 en R3 que tiene como funciones coordenadas a las
funciones L1 ,L2 y L3 , y cuya matriz asociada (de 3 2) est
a dada por
f1
f1
2x0 cos(y0 ) x20 sen(y0 )
x (x0 , y0 )
y (x0 , y0 )
f2
f
x (x0 , y0 ) y2 (x0 , y0 ) = 2x0 sen(y0 ) x20 cos(y0 )
f3
2x0
0
(x0 , y0 ) f3 (x0 , y0 )
x
sin duda es la mejor candidata para satisfacer la condici

on de la definici
on 5.1.
En efecto, de la definici
on 4.14 del captulo 4 sabemos que para cada i {1, 2, 3} se satisface
que
fi (x, y) (Li (x x0 , y y0 ) + fi (x0 , y0 ))
=0
lim
k(x x0 , y y0 )k
(x,y)(x0 ,y0 )
y por la proposici
on 2.30 del captulo 2 podemos concluir que
f (x, y) (L(x x0 , y y0 ) + f (x0 , y0 ))
=0
k(x x0 , y y0 )k
(x,y)(x0 ,y0 )
lim
de modo que f es derivable en el punto (x0 , y0 ).

J. P
aez
256
5.1. La derivada
Tomaremos el ejemplo anterior como punto de partida para obtener algunas conclusiones sobre
las funciones de R2 en R3 , y empezaremos por aquellas que son de car
acter geometrico.
5.1.1
Elementos b
asicos acerca de superficies
Como seguramente el lector recordara, en el captulo 2 mencionamos que desde un punto de vista
geometrico, lo importante de las funciones de R2 en R3 es su imagen. Asi mismo, recordara que el
concepto de derivada para funciones de R en R3 nos fue u
til para definir la recta tangente en un
punto, de un conjunto que se puede ver como la imagen de una funcion de este tipo.
Ahora veremos que si un conjunto S R3 se puede obtener como la imagen de una funci
on, que
en esta subseccion denotaremos como : U R2 R3 , la cual es derivable en un punto x
0 U , y
esta derivada cumple con otra condici
on que precisaremos mas adelante, entonces podremos definir
lo que llamaremos el plano tangente a S en el punto (
x0 ).
3
Sea pues S R un conjunto que se puede ver como la imagen de una funcion = (1 , 2 , 3 ) :
U R2 R3 , la cual es derivable en un punto x
0 = (x0 , y0 ) U . Dado que estamos suponiendo
que U es un conjunto abierto, entonces existe r > 0 tal que Br (
x0 ) U . De esta forma, podemos
3
definir las funciones x , y : (r, r) R R como
x (t) = (x0 + t, y0 )
= (1 (x0 + t, y0 ), 2 (x0 + t, y0 ), 3 (x0 + t, y0 ))
y
y (t) = (x0 , y0 + t)
= (1 (x0 , y0 + t), 2 (x0 , y0 + t), 3 (x0 , y0 + t))
las cuales afirmamos que son derivables en t = 0.
En efecto, de acuerdo con la definicion 3.2 del captulo 3, se tiene que
x (t) x (0)
t0
(1 (x0 + t, y0 ) 1 (x0 , y0 ), 2 (x0 + t, y0 ) 2 (x0 , y0 ), 3 (x0 + t, y0 ) 3 (x0 , y0 ))
= lim
t0
t

1 (x0 + t, y0 ) 1 (x0 , y0 ) 2 (x0 + t, y0 ) 2 (x0 , y0 ) 3 (x0 + t, y0 ) 3 (x0 , y0 )
= lim
,
,
t0
t
t
t

2
3
1
(x0 , y0 ),
(x0 , y0 ),
(x0 , y0 )
=
x
x
x
x (0) = lim
t0
y
y (t) y (0)
t0
t0
(1 (x0 , y0 + t) 1 (x0 , y0 ), 2 (x0 , y0 + t) 2 (x0 , y0 ), 3 (x0 , y0 + t) 3 (x0 , y0 ))
= lim
t0
t

1 (x0 , y0 + t) 1 (x0 , y0 ) 2 (x0 , y0 + t) 2 (x0 , y0 ) 3 (x0 , y0 + t) 3 (x0 , y0 )
,
,
= lim
t0
t
t
t

2
3
1
(x0 , y0 ),
(x0 , y0 ),
(x0 , y0 )
=
y
y
y
y (0) = lim
257
J. P
aez
5.1. La derivada
Por lo anterior, si se satisface que

2
3
1
(x0 , y0 ),
(x0 , y0 ),
(x0 , y0 ) 6= 0
x (0) =
x
x
x
y (0)

1
2
3
(x0 , y0 ),
(x0 , y0 ),
(x0 , y0 ) 6= 0
y
y
y
entonces x ((r, r)) y y ((r, r)) son dos curvas contenidas en S que tienen recta tengente en el
punto (
x0 ).
Ahora, si adem
as los vectores x (0) y y (0) son linealmente independientes, el conjunto dado
por

(
x0 ) + tx (0) + sy (0) R3 | t, s R
representa un plano el cual tiene todo el aspecto de ser tangente a S en (
x0 ) (ver figura 5.1).
Z
Y
U
(
x0 )
b
x (0)
x
0 = (x0 , y0 )
y (0)
y
Y
S = (U )
Figura 5.1: Si los vectores x (0) y y (0) son linealmente independientes, entonces el plano P generado
por ellos y trasladado al punto (
x0 ) es tangente a la superficie S = (U ).
Con base en la discusion anterior, definiremos los siguientes conceptos.
Definici
on 5.4 Sea S R3 .
1. Decimos que S es una superficie, si existe = (1 , 2 , 3 ) : U R2 R3 derivable en cada
punto de U , y A U tales que (A) = S. En este caso decimos que es una parametrizaci
on
de S.
2. Si x
0 A y los vectores
(
x0 ) :=
x

1
2
3
(
x0 ),
(
x0 ),
(
x0 )
x
x
x
(
x0 ) :=
y

1
2
3
(
x0 ),
(
x0 ),
(
x0 )
y
y
y
son linealmente independientes, decimos que el plano P R3 definido parametricamente

como

3
(
x0 ) + s
(
x0 ) R | t, s R
P := (
x0 ) + t
x
y
es el plano tangente a S en el punto (

x0 ), y que S es suave en (
x0 ).
J. P
aez
258
5.1. La derivada
Con relaci
on a esta nueva definicion de plano tangente en un punto de una superficie, es importante hacer algunas observaciones.
La primera de ellas es que, aun y cuando una superficie S R3 es la imagen de alguna funci
on
derivable, esto no significa que el conjunto S no pueda tener picos. Una prueba de este hecho
nos lo proporciona la funci
on
(x, y) = (x2 cos(y), x2 sen(y), x2 )
del ejemplo 5.3 la cual ya sabemos que es derivable en cualquier punto (x, y) R2 .
Como el lector podr
a verificar facilmente, el conjunto S = (R2 ) es la parte superior del cono
determinado por la ecuaci
on cartesiana u2 + v 2 = w2 (figura 5.2) el cual claramente tiene un pico
en el punto (0, 0) = (0, 0, 0).
Figura 5.2: El cono determinado por la ecuacion cartesiana u2 + v 2 = w2 el cual tiene un pico en el
punto (, 0, 0, 0).
Una segunda observaci
on es que no cualquier parametrizacion de una superficie S R3 es u
til
para calcular su plano tangente en alg
un punto (del mismo modo a como sucedio en el caso de las
curvas).
El conjunto S R3 y el par de parametrizaciones de este que daremos en el siguiente ejemplo,
nos proporcionan una prueba de este hecho.
Ejemplo 5.5 Sea S R3 el siguiente conjunto:

S = (u, v, w) R3 | w = u2 + v 2
La figura 5.3 muestra un esbozo de S, el cual corresponde a un paraboloide. A continuaci

on
daremos un par de parametrizaciones de este conjunto.

1. Sea : R2 R3 definida como (x, y) = x, y, x2 + y 2 . Como el lector podr
a verificar
2
f
acilmente, se tiene que S = (R ).
Por otra parte, procediendo como en el ejemplo 5.3, se concluye que es derivable para
cualquier (x, y) R2 y adem
as que
(x, y) = (1, 0, 2x)

x
259
J. P
aez
5.1. La derivada
Figura 5.3: El paraboloide determinado por la ecuacion cartesiana u2 + v 2 = w tiene como plano
tangente en el punto (0, 0, 0) al plano XY .
y
(x, y) = (0, 1, 2y)

y
Por lo tanto, para el punto (0, 0) se tiene que
(0, 0) = (1, 0, 0)
x
y
(0, 0) = (0, 1, 0)
y
los cuales son vectores linealmente independientes, de tal forma que el conjunto

3
P = (0, 0) + t
(0, 0) + s
(0, 0) R | t, s R
x
y

= (0, 0, 0) + t (1, 0, 0) + s (0, 1, 0) R3 | t, s R

= (t, s, 0) R3 | t, s R
s resulta ser un plano (el plano XY ), que sin duda es el plano tangente a S en el punto
(0, 0) = (0, 0, 0).

2. Sea ahora : R2 R3 definida como (x, y) = x cos(y), x sen(y), x2 . Nuevamente el lector
podr
a verificar f
acilmente que S = (R2 ).
Por otra parte, para esta funci

on tambien es sencillo mostrar que es derivable para cualquier
(x, y) R2 y adem
as que
(x, y) = (cos(y), sen(y), 2x)

x
y
(x, y) = (x sen(y), x cos(y), 0)

y
Por lo tanto, para el punto (0, 0) se tiene que
(0, 0) = (1, 0, 0)
x
J. P
aez
260
(0, 0) = (0, 0, 0)
y
los cuales no son vectores linealmente independientes, de tal forma que el conjunto

3
(0, 0) + s
(0, 0) R | t, s R
P = (0, 0) + t
x
y

= (0, 0, 0) + t (1, 0, 0) + s (0, 0, 0) R3 | t, s R

= (t, 0, 0) R3 | t, s R
no resulta ser un plano.
Cocluimos nuestras observaciones acerca de la definicion de plano tangente a una superficie,

recordando que en el captulo 4 se definio este mismo concepto para dos objetos geometricos diferentes; la gr
afica de una funci
on de R2 en R (definicion 4.18), y el conjunto de nivel de una funci
on
3
de R en R (definicion 4.32).
En el problema 6 de este mismo captulo, el lector probo que la gr
afica de una funcion de R2 en
R siempre se puede obtener como el conjunto de nivel de una cierta funcion de R3 en R, y que el
plano tangente que se obtiene usando cualquiera de las definiciones antes mencionadas, es el mismo.
Algo an
alogo probara el lector en el problema 1 de este captulo; la gr
afica de una funcion de R2
2
en R siempre se puede obtener como la imagen de una cierta funcion R en R3 , y el plano tangente
que se obtiene usando la definicion 5.4 es el mismo que se obtiene usando la definicion 4.18.
Como mencionamos en el captulo 4, en este captulo probaremos el Teorema de la Funci
on
Implcita del cual podremos deducir (bajo ciertas hip
otesis), que todo conjunto de nivel de una
funcion de R3 en R se puede obtener (al menos por partes) como la gr
afica de una funcion de R2
en R y por lo dicho en el p
arrafo anterior, entonces tambien como la imagen de una cierta funci
on
2
3
de R en R .
En el problema 21 de este captulo el lector probara la afirmacion anterior, y adem
as que el
plano tangente calculado de acuerdo con la definicion 5.4 es el mismo que se obtiene usando la
definicion 4.32.
5.2
Propiedades de la derivada

a de acuerdo, para determinar la derivabilidad de la funci
on del
ejemplo 5.3 fue muy importante saber que sus funciones coordenadas eran derivables. Esto sin
duda nos lleva a concluir que en general, para deducir la derivabilidad de una funcion de Rn en Rm
en un punto, es suficiente con que sus funciones coordenadas lo sean en ese mismo punto.
La buena noticia es que la afirmacion recproca tambien es cierta, es decir, si una funci
on de
Rn en Rm es derivable en un punto, sus funciones coordenadas tambien deben ser derivables en ese
punto. Este hecho es el primer criterio importante que veremos para determinar la derivabilidad
(o no derivabilidad!) de una funci
on de Rn en Rm y lo dejamos plasmado en la siguiente
Proposici
on 5.6 Sean f : U Rn Rm , x
0 U y f1 , . . . , fm : U Rn R funciones
coordenadas de f (en una base ortonormal {
e1 , . . . , em } de Rm ). La funci
on f es derivable en x
0
si y s
olo si fi es derivable en x
0 para cada i {1, . . . , m}.
Demostraci
on. Sea L : Rn Rm una funcion lineal y supongamos que Li : Rn R son
las funciones coordenadas de L (por lo tanto tambien lineales) determinadas por la misma base
ortonormal de Rm que determina a las funciones coordenadas de f .
261
J. P
aez
Dado que la iesima coordenada del vector

f (
x) (L(
xx
0 ) + f (
x0 ))
1
(f (
x) (L(
xx
0 ) + f (
x0 ))) =
k
xx
0 k
k
xx
0 k
est
a dada por
fi (
x) (Li (
xx
0 ) + fi (
x0 ))
k
xx
0 k
para cada i {1, . . . , m}, por la proposici

on 2.30 (del captulo 2), se sigue que
lim
x0
f (
x) (L(
xx
0 ) + f (
x0 ))
=0
k
xx
0 k
si y s
olo si
lim
x0
fi (
x) (Li (
xx
0 ) + fi (
x0 ))
=0
k
xx
0 k
de donde las afirmaciones de esta proposici

on se concluyen inmediatamente.
Muchos resultados y propiedades de la derivada de funciones de Rn en Rm ser
an una consecuencia inmediata de la proposici
on anterior (y de los correspondientes resultados y propiedades
para funciones de Rn en R), y para empezar, la usaremos para probar la unicidad de la derivada
de las funciones de Rn en Rm .
En efecto, como por la proposici
on 4.15 del captulo 4 sabemos que la derivada de una funci
on
de Rn en R es u
nica, por la proposici
on anterior concluimos que esto mismo sucede para las
funciones de Rn en Rm . Por esta raz
on, de aqu en adelante hablaremos de la derivada de f en x
0
y la denotamos por Df (
x0 ) (igual que en el caso de las funciones de Rn en R); es decir, Df (
x0 )
designara a la funci
on lineal que mejor se le parece a f alrededor del punto x
0 .
Por otra parte, y como seguramente el lector recordara de su curso de Algebra

Lineal, toda
n
m
funcion lineal L : R R se puede representar por una matriz de m n con entradas reales (que
depende de las bases que se elijan para Rn y Rm ), y que se construye de la siguiente manera.
Si L : Rn Rm es una funci
on lineal, {
e1 , . . . , en } y {
e1 , . . . , em } son bases ortonormales de Rn
m
n
y R , respectivamente, y x
R es tal que
x
= (x1 , . . . , xn )
= x1 e1 + + xn en
entonces
L(
x) = L (x1 e1 + + xn en )
= x1 L (
e1 ) + + xn L (
en )
de tal forma que si

L (
ei ) = a1i e1 + + ami em
para cada i {1, . . . , n}, se tiene que
L(
x) = x1 L (
e1 ) + + xn L (
en )
= x1 (a11 e1 + + am1 em ) +
..
.
J. P
aez
262
+xn (a1n e1 + + amn em )
= (x1 , . . . , xn ) (a11 , . . . , a1n ) e1 +

..
.
+ (x1 , . . . , xn ) (am1 , . . . , amn ) em
de donde, usando matrices, obtenemos que
a11
..
L(
x) = .
am1
..
.
de tal forma que la matriz
a11
..
..
= .
.
am1
a1n
..
.
amn
x1
..
.
xn
a1n
..
.
amn
representa a la funci
on L (en las bases {
e1 , . . . , en } y {
e1 , . . . , em }).
Observese que las matrices i de 1 n dadas por

i = ai1 ain
para cada i {1, . . . , m}, representar

an a sus correspondientes funciones coordenadas Li , y recprocamente, si la matriz i representa a la funcion lineal Li , para cada i {1, . . . , m}, entonces la
matriz representa a la funci
on lineal L.
De lo anterior, y de la identidad 4.17 del captulo 4, tendremos que, si f1 , . . . , fm son las
funciones coordenadas de la funci
on f (las cuales, reiteramos que dependen de la base de Rm que
se elija), entonces la derivada de f en x
0 (Df (
x0 )) estar
a representada por la matriz
f1
x0 )
x1 (
..
..
.
.
fm
x0 )
x1 (
f1
x0 )
xn (
..
.
fm
x0 )
xn (
(5.1)
a la que se le concoce con el nombre de matriz jacobiana 1 , y no sin cierto abuso de notaci
on
(nuevamente!) escribiremos que
f1
f1
(
x0 )
x0 ) x
x1 (
n
..
..
..
(5.2)
Df (
x0 ) =
.
.
.
fm
x0 )
x1 (
fm
x0 )
xn (
Sin duda una condici

on que es necesaria y suficiente resulta ser muy u
til (como la que se da
en la proposici
on 5.6), sin embargo, las que s
olo son necesarias o s
olo son suficientes, tambien lo
son. Y aprovechando que conocemos dos de este tipo de propiedades para funciones de Rn en R,
enunciaremos sus equivalentes para funciones de Rn en Rm .
1
Llamada as en honor de Carl Gustav Jacob Jacobi (10 de diciembre de 1804 en Potsdam, Prusia, actual Alemania
-18 de febrero de 1851 en Berln). Autor muy prolfico, contribuy
o en varios campos de la matem
atica, principalmente
en el
area de las funciones elpticas, el
algebra, la teora de n
umeros y las ecuaciones diferenciales. Tambien destac
o en
su labor pedag
ogica, por la que se le ha considerado el profesor m
as estimulante de su tiempo. (fuente: Wikipedia).
263
J. P
aez
La primera de ellas es una condici

on necesaria de la derivabilidad de una funcion en un punto,
y es una consecuencia inmediata de las proposiciones 5.6, 4.21 (del captulo 4) y 2.40 (del captulo
2).
Proposici
on 5.7 Sea f : U Rn Rm . Si f es derivable en x
0 U entonces f es continua en
x
0 .
La otra propiedad que es muy importante mencionar, y que es una condici
on suficiente de la
derivabilidad de una funci
on en un punto, es una consecuencia inmediata de las proposiciones 5.6
y 4.24 (del captulo 4).
Proposici
on 5.8 Sean f : U Rn Rm , x
x0 ) U . Si f1 , . . . , fm son
f
fj
x) existe para cada x
Br (
x0 ) y xji es continua en x
0 ,
funciones coordenadas de f tales que xi (
para cada i {1, . . . , n} y para cada j {1, . . . , m}, entonces f es derivable en x
0 .
Como vimos en el captulo 4, la hip
otesis de la proposici
on 4.24 (an
aloga a la anterior) dio lugar
k
al concepto de funci
on de clase C , concepto que jugo un papel muy importante en el tema de
aproximacion polinomial, y que ahora vamos a generalizar, apoyados justo en la proposici
on 5.6, a
n
m
las funciones de R en R en la siguiente
Definici
on 5.9 Sean f : U Rn Rm , f1 , . . . , fm funciones coordenadas de f , y k N. Decimos
que f es una funci
on de clase C k en U si cada fj es una funci
on de clase C k en U , para j
{1, . . . , m}. Es decir, si existen todas las derivadas parciales de orden k de fj en cada punto de U ,
y adem
as estas derivadas parciales son continuas en cada punto de U , para j {1, . . . , m}.
Con respecto a la definicion anterior, hay que mencionar lo siguiente. Por el problema 10 del
captulo 4 y la identidad 5.3 que probaremos en la siguiente subseccion, el hecho de que una funci
on
sea de clase C k en un conjunto (abierto) es independiente, tanto del sistema coordenado que estemos
usando para representar a cada punto x
Rn , como del que estemos usando para representar a cada
m
punto y R . Es decir, este concepto es independiente de las variables coordenadas x1 , . . . , xn y
de las funciones coordenadas f1 , . . . , fm .
Como mencionamos anteriormente, con base en el concepto de funcion de clase C k (para k =
1) podemos establecer el siguiente resultado, cuya prueba es una consecuencia inmediata de la
proposici
on 4.42 del captulo 4 y de la proposici
on 5.6.
Proposici
on 5.10 Si f : U Rn Rm es de clase C 1 en U entonces f es derivable para toda
x
U.
Las propiedades de la derivada de funciones de Rn en Rm relacionadas con la aritmetica de estas,
tambien se obtienen de manera inmediata a partir de la proposici
on 5.6 y de las correspondientes
n
propiedades para funciones de R en R, raz
on por la cual tampoco las probaremos y s
olo las
dejaremos plasmadas en la siguiente
Proposici
on 5.11 Sean f, g : U Rn Rm , x
0 U y R. Si f y g son derivables en x
0
entonces:
1. f + g es derivable en x
0 y adem
as
D(f + g)(
x0 ) = Df (
x0 ) + Dg(
x0 )
J. P
aez
264

2. f es derivable en x
0 y adem
as
D(f )(
x0 ) = Df (
x0 )
3. f g es derivable en x
0 y adem
as

D(f g)(
x0 ) = f1 (
x0 )
fm (
x0 )
Dg(
x0 ) +
g1 (
x0 )
gm (
x0 )
Df (
x0 )
en donde f1 , . . . , fm y g1 , . . . , gm son funciones coordenadas de f y g, respectivamente.
5.2.1
Breve comentario sobre funciones coordenadas
Si el lector revisa con cuidado los conceptos de lmite, continuidad, continuidad uniforme y derivabilidad de una funci
on f de Rn en Rm , todos ellos se han definido sin tener que recurrir a alg
un
sistema coordenado, del dominio o del contradominio de la funcion. Los sistemas coordenados
son necesarios e importantes para realizar calculos especficos y por esta raz
on hemos probado
resultados que expresan estos conceptos en terminos de funciones coordenadas.
As como en el captulo anterior hicimos enfasis en que la variable x
Rn de nuestra funci
on
f se puede describir en terminos de diferentes coordenadas, dependiendo de la base ortonormal de
Rn en la que lo estemos representando, de igual manera las funciones coordenadas asociadas a f
tambien dependen de la base ortonormal de Rm con la que se este trabajando.
En efecto, si f1 , . . . , fm son las funciones coordenadas de f para una cierta base ortonormal
{
e1 , . . . , em } de Rm (lo que significa que fi (
x) es la jesima coordenada del vector f (
x) en esta
base), es decir que
f (
x) = f1 (
x)
e1 + + fm (
x)
em
y {
e1 , . . . , em } es otra base ortonormal de Rm , las funciones coordenadas de f en esta nueva base,
que denotaremos por f1 , . . . , fm , se podr
an obtener a partir de las funciones coordenadas f1 , . . . , fm
Mmm (R), matriz que se obtiene de la misma forma en
a traves de una matriz ortonormal M
que obtuvimos la matriz de cambio de coordenadas M de la identidad 4.2 del captulo 4.
Esto es, si

(j)
ej = b1 , . . . , b(j)
m
(j)
(j)
= b1 e1 + + bm
em
para cada j {1, . . . , m}, entonces

f (
x) = f1 (
x)
e1 + + fm (
x)
em

(1)
= f1 (
x) b1 e1 + + b(1)
e
m m +
..
.

(m)
(m)
+ fm (
x) b1 e1 + + bm
em

(1)
(m)
= b 1 , . . . , b1
(f1 (
x), . . . , fm (
x))
e1 +
..
.

(m)
(f1 (
x), . . . , fm (
x))
em
+ b(1)
,
.
.
.
,
b
m
m
265
J. P
aez
de donde concluimos que la jesima coordenada del vector f (

x) en la base {
e1 , . . . , em }, que en el
p
arrafo anterior dijimos que denotaramos por fj (
x), estar
a dada por
(1)
(m)
fj (
x) = bj f1 (
x) + + bj fm (
x)
(5.3)
para cada j {1, . . . , m}.

Equivalentemente, pero escrito en forma matricial, se tiene que
(1)
b

1.
x) fm (
x) ..
f1 (
x) fm (
x) = f1 (
(m)
b1
en donde la matriz
(1)
..
.
(m)
b1
..
M = .
b1
..
.
(1)
bm
..
.
(m)
bm
(1)
bm
..
.
(m)
bm
es una matriz ortonormal.

Lo relevante de la identidad 5.3 es que establece la forma sencilla en que se relacionan las diferentes funciones coordenadas que expresan (en diferentes bases ortonormales) a la misma funcion. Es
decir, si una funci
on f de Rn en Rm tiene funciones coordenadas f1 , . . . , fm en una cierta base
ortonormal {
e1 , . . . , em } de Rm , y tomamos otra base ortonormal {
e1 , . . . , em } de este mismo con
junto, sus funciones coordenadas f1 , . . . , fm en esta nueva base se obtienen como una combinaci
on
lineal de las primeras.
Esta relaci
on resulta de particular importancia para todos los conceptos que mencionamos al
inicio de esta subseccion, pues confirma el hecho de que todos ellos son independientes del sistema
coordenado de Rm que se este usando para representar a f .
Para el caso del concepto de derivada, la identidad 5.3 resulta particularmente importante,
pues si tenemos una expresi
on para la derivada Df (
x0 ) en terminos de unas funciones coordenadas
f1 , . . . , fm , de esta identidad podemos deducir cu
al ser
a una expresion de esta derivada, pero ahora
en terminos de las funciones coordenadas f1 , . . . , fm .

En efecto, si escribimos a Df (
x0 ) como D f1 , . . . , fm (
x0 ) para enfatizar que estamos escribiendo a f en terminos de las funciones coordenadas f1 , . . . , fm , de acuerdo con la identidad 5.2 se
debe tener que

Df (
x0 ) = D f1 , . . . , fm (
x0 )

f1
f1
(
x0 )
(
x0 ) x
n
x1 .
.
..
..
..
=
.
fm
x0 )
x1 (
fm
x0 )
xn (
de tal forma que, de la identidad 5.3 y los incisos 1. y 2. de la proposici

on 4.11 del captulo 4,
concluimos que, para cada i {1, . . . , n} y cada j {1, . . . , m}, se tiene que
fj
(1) f1
(m) fm
(
x 0 ) = bj
(
x 0 ) + + bj
(
x0 )
xi
xi
xi

f1
fm
(1)
(m)
(
x0 ), . . . ,
(
x0 )
= b j , . . . , bj
xi
xi
J. P
aez
266
5.3. La regla de la cadena


x0 ) =
D f1 , . . . , fm (
f1
x0 )
x1 (
..
.
fm
x0 )
x1 (
(1)
b1
..
.
..
(1)
bm
..
.
f1
x0 )
xn (
..
.
fm
x0 )
xn (
(m) f1
x0 )
b1
x1 (
..
.
(m)
bm
..
..
.
.
fm
x0 )
x1 (
t D (f1 , . . . , fm ) (
=M
x0 )
5.3
f1
x0 )
xn (
..
.
fm
x0 )
xn (
La regla de la cadena
Para concluir con las propiedades mas relevantes de la derivada de una funcion de Rn en Rm ,
formularemos un resultado muy importante en el cual se establecen las condiciones para asegurar
la derivabilidad de la composici
on de una funcion de Rn en Rm con una de Rm en Rk , y la formula
que nos permite calcular la derivada de esta composici
on.
Esta ser
a la versi
on m
as general de la regla de la cadena que daremos en este texto, y para
probarla podramos hacer uso de la proposici
on 5.6 de la siguiente manera: si f : U Rn Rm y
g : V Rm Rk , con g1 , . . . , gm funciones coordenadas de g, son tales que f (U ) V , se tiene que
la composici
on g f est
a bien definida y que las funciones gi f , para i {1, . . . , m}, son funciones
coordenadas de g f .
De esta forma, y justo por la proposici
on 5.6, para probar la derivabilidad de g f bastara
con probar la derivabilidad de cada gi f . Sin embargo, la prueba de la regla de la cadena para
la composici
on g f , suponiendo que g es una funcion de Rm en R, es casi igual a la prueba que
se puede hacer suponiendo que g es una funcion de Rm en Rk , en virtud de lo cual, optaremos por
esta u
ltima.
Proposici
on 5.12 (Regla de la cadena) Sean f : U Rn Rm , g : V Rm Rk y x
0 U
tales que f (U ) V . Si f es derivable en x
0 y g es derivable en y0 = f (
x0 ) entonces g f es
derivable en x
0 y adem
as se tiene que
D(g f )(
x0 ) = Dg(f (
x0 )) Df (
x0 )
O equivalentemente, si pensamos a las derivadas D(g f )(
x0 ), Dg(f (
x0 )) y Df (
x0 ) como matrices,
que
D(g f )(
x0 ) = Dg(f (
x0 ))Df (
x0 )
Demostraci
on. La idea detr
as de la prueba de este resultado es completamente an
aloga a la
seguida en la prueba de la proposic
on 4.29 del captulo 4, en virtud de lo cual haremos con menos
detalles los pasos que seguiremos en este caso.
Como hicimos en esa proposici
on, ser
a necesario introducir una funcion auxiliar
: U Rn Rk
definida de la siguiente forma:
g(f (
x))g(f (
x0 ))Dg(f (
x0 ))(f (
x )f (
x0 ))
kf (
x)f (
x0 )k
(
x) =
0
267
si f (
x) f (
x0 ) 6= 0
si f (
x) f (
x0 ) = 0
J. P
aez
Como el lector podr

a verificar muy facilmente, se tiene que
g(f (
x)) g(f (
x0 )) Dg(f (
x0 )) (Df (
x0 ) (
xx
0 ))
k
xx
0 k
x0 )) (f (
x) f (
x0 )) Dg(f (
x0 )) (Df (
x0 ) (
xx
0 ))
kf (
x) f (
x0 )k Dg(f (
+
= (
x)
k
xx
0 k
k
xx
0 k

f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
kf (
x) f (
x0 )k
= (
x)
+ Dg(f (
x0 ))
k
xx
0 k
k
xx
0 k
para toda x
U, x
6= x
0 .
Ahora, del hecho de que f es derivable en x
0 , y por los problemas 5.12 y 5.6, obtenemos las dos
siguientes conclusiones: una, que la funcion es continua en x
0 , y dos, que la expresi
on
kf (
x) f (
x0 )k
k
xx
0 k
est
a acotada en una vecindad (agujerada) de x
0 , de tal forma que
lim (
x)
x0
kf (
x) f (
x0 )k
=0
k
xx
0 k
Por otra parte, dado que f es derivable en x

0 sabemos que
f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
=0
k
xx
0 k
y como toda funci
on lineal es continua, tenemos que

f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
lim Dg(f (
x0 ))
x
x0
k
xx
0 k

f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
= Dg(f (
x0 )) lim
x
x0
k
xx
0 k
= Dg(f (
x0 )) 0
=
0
de tal forma que
g(f (
x)) g(f (
x0 )) Dg(f (
x0 )) (Df (
x0 ) (
xx
0 ))
x
x0
k
xx
0 k

f (
x) f (
x0 ) Df (
x0 ) (
xx
0 )
kf (
x) f (
x0 )k
+ Dg(f (
x0 ))
= lim (
x)
x
x0
k
xx
0 k
k
xx
0 k
= 0
lim
lo que prueba que g f es derivable en x

0 y que su derivada es Dg(f (
x0 )) Df (
x0 ).
5.3.1
Cambio de coordenadas y regla de la cadena
Desde el captulo 1, y a lo largo de todo este texto, se ha venido insistiendo en ver a Rn como
el representante por excelencia (o prototipo) de los espacios vectoriales de dimension n sobre
J. P
aez
268
los n
umeros reales. Por esta misma raz
on, se ha enfatizado la posibilidad de que los elementos
de Rn se pueden describir por medio de diferentes sistemas coordenados (lo que no deja de ser un
poco extra
no, pues lo elementos de Rn est
an definidos en terminos de n-adas), incluyendo sistemas
coordenados no cartesianos, como lo son los sistemas coordenados polar (en R2 ), y cilndrico y
esferico (en R3 ).
Con base en lo anterior, se ha puesto particular interes en mostrar que el concepto de derivada
es independiente de estos sistemas coordenados, pero al mismo tiempo se ha visto como se expresa
en estos, as como la manera de pasar de una expresi
on a otra cuando pasamos de un sistema
coordenado a otro (ejemplo de esto son las identidades 4.18, 4.19, 4.33 y 4.34). Lo que ahora
deseamos mostrar es que estas mismas identidades se pueden obtener usando la regla de la
cadena que acabamos de probar.
Por ejemplo, supongamos que {
e1 , . . . , en } y {
e1 , . . . , en } son dos bases ortonormales de Rn , y
Rn en cada una de
que x1 , . . . , xn y x1 , . . . , xn denotan las coordenadas de un mismo punto x
estas bases, respectivamente. Si
(i)
n
ei = a1 e1 + + a(i)
n e
para cada i {1, . . . , n}, en el captulo 4 dedujimos que si (x1 , . . . , xn ) son las coordenadas de un
punto x
Rn en la base {
e1 , . . . , en }, entonces las coordenas (x1 , . . . , xn ) del mismo punto en la
base {
e1 , . . . , en } est
an dadas por
x1
xn
x1
(1)
a
1.
xn ..
(n)
a1
(1)
..
.
an
..
.
an
(n)
De esta forma, si definimos g : Rn Rn como

g(
x) = g(x1 , . . . , xn )

(1)
(n)
(n)
= x1 a1 + + xn a1 , . . . , x1 a(1)
+
+
x
a
n
n n
se tendra que g no es mas que la funcion identidad, solo que a los elementos de su dominio los
estamos expresando en la base {
e1 , . . . , en }, mientras que a los de su contradominio los estamos
expresando en la base {
e1 , . . . , en }. Este tipo de funciones son conocidas como funciones de cambio
de coordenadas.
Dado que g es la funci
on identidad, sin duda g es derivable en todos los puntos de Rn . Por otra
parte, y de acuerdo con la identidad 5.1, tenemos que la matriz jacobiana de g (es decir Dg(
x)),
a dada por
expresada con respecto a las bases {
e1 , . . . , en } y {
e1 , . . . , en }, est
(1)
a1
..
Dg(
x) = .
(1)
an
(n)
..
.
a1
..
.
an
(n)
para toda x
Rn , que coincide con la matriz transpuesta de la matriz de cambio de coordenadas
que obtuvimos anteriormente.
Ahora, si f : U Rn R es una funcion derivable que est
a expresada en terminos de las
coordenadas x1 , . . . , xn , dado que g es la funcion identidad, que la composici
on f g est
a bien definida
y que en sentido estricto (f g)(
x) = f (
x) para toda x
U (identidad que no es equivalente a escribir
que f (g(x1 , . . . , xn )) = f (x1 , . . . , xn ), puesto que f no depende de las coordenadas x1 , . . . , xn ),
269
J. P
aez
podemos decir que f g es la misma funcion f , pero expresada en terminos de las coordenadas
x1 , . . . , xn . Este hecho es lo que justifica que nos podamos tomar la libertad de escribir que
f
(f g)
(
x) =
(
x)
xi
xi
para cada i {1, . . . , n} y cada x
U , aun y cuando f no dependa directamente de las coordenadas
x1 , . . . , xn .
Por otra parte, y de acuerdo con la identidad (matricial) de la regla de la cadena (proposici
on
5.12), se tiene que
D(f g)(
x) = Df (g(
x))Dg(
x)
= Df (
x)Dg(
x)
(5.4)
es decir que
h
f
x)
xi (
f
x)
xn (
(f g)
(
x)
x1
f
x)
xi (
(f g)
x)
xn (
f
x)
xn (
o equivalentemente, que para cada i {1, . . . , n} se cumple que
(1)
a1
..
.
(1)
an
(n)
..
.
a1
..
.
(n)
an
f
f
(i) f
(
x) = a1
(
x) + + a(i)
(
x)
n
xi
x1
xn
n
X
(i) f
(
x)
aj
=
xj
(5.5)
(5.6)
j=1
Como seguramente el lector reconocer

a, la identidad 5.5 es la misma que obtuvimos en el captulo
4 (identidad 4.18).
Observaci
on 5.13 Es relevante hacer notar que las identidades 5.4, 5.5 y 5.6 conllevan un cierto
abuso de notaci
on el cual puede ser inofensivo s
olo si dichas identidades se escriben en terminos
de x
y no de sus correspondientes coordenadas x1 , . . . , xn .
Si deseamos poner a la identidad 5.6 en terminos de estas coordenadas, lo correcto es escribir
que

(f g)
(i) f
(i) f
(x
,
.
.
.
,
x
)
=
a
(g
x
,
.
.
.
,
x
(g
x
,
.
.
.
,
x
)
+
+
a
)
1
n
1
n
1
n
n
1
xi
x1
xn

f
f
(i)
g x1 , . . . , xn + + an(i)
g x1 , . . . , xn
= a1
x1
xn
Lo anterior es muy importante tenerlo presente, sobre todo si se desea calcular derivadas parciales de orden superior de la funci
on f g.
Para concluir esta subseccion, lo que ahora queremos mostrar es que se puede proceder de forma
an
aloga al caso anterior y obtener identidades equivalentes, aun y cuando los sistemas involucrados
no sean cartesianos. Por ejemplo, consideremos la funcion g : R2 R2 dada por
g(, ) = ( cos(), sen())
J. P
aez
270
la que sin duda se puede considerar como la funci

on de cambio de coordenadas polares a coordenadas
cartesianas para puntos en R2 , y supongamos que f : R2 R es una funcion derivable que est
a
expresada en terminos de las coordenadas cartesianas x y y.
Nuevamente, por la regla de la cadena, y considerando que sin usar ning
un tipo de coordenadas
para x
podemos asumir que g(
x) = x
, entonces
i
h
(f g)
(f g)
= D(f g)(
x)
(
x
)
(
x
)
= Df (g(
x))Dg(
x)
= Df (
x)Dg(
x)
"
h
i
f
f
x) y (
x)
= x (
=
f
x)
x (
( cos())
( sen())
( cos())
( sen())

i cos() sen()
f
x)
y (
sen() cos()
de modo que, como g es la funci

on identidad, nos podemos tomar la libertad de escribir que
f
(f g)
(
x) =
(
x)
f
(f g)
(
x) =
(
x)
y concluir que
h
f
x)
(
f
x)
(
f
x)
x (
f
x)
y (
i cos() sen()
sen() cos()
(5.7)
Es importante hacer notar que la matriz de 2 2 que aparece en esta u

ltima identidad, s
olo es
una matriz ortonormal (es decir, una matriz de cambio de coordenadas entre bases ortonormales)
si = 1 o = 1. Sin embargo, si tomamos 6= 0, la identidad anterior la podemos reescribir
como
h
i h
i cos() sen()
f
f
f
1 f
x) (
x) = x (
x) y (
x)
(
sen() cos()
y ahora la matriz de 2 2 de esta u

ltima identidad (que por cierto coincide con la identidad
4.34 del captulo 4) s es una matriz que corresponde a un cambio de coordenadas entre bases
ortonormales (entre la base can
onica {
e1 , e2 } y la base {
e , e } dada por e = cos()
e1 + sen()
e2
y e = sen()
e1 + cos()
e2 ), con la particularidad de que la base {
e , e } no siempre es la misma
si cambiamos de punto x
.
Aun y corriendo el riesgo de parecer repetitivos, es importante insistir en que las identidades
f
f
f
(
x) = cos() (
x) + sen() (
x)
x
y
y
f
f
f
(
x) = sen() (
x) + cos() (
x)
x
y
que se obtienen a partir de la identidad 5.7, contienen un cierto abuso de notaci
on y que si se
quieren escribir en terminos de las coordenadas (, ) del punto x
, lo correcto es escribir que
f
f
(f g)
(, ) = cos() (g(, )) + sen() (g(, ))
x
y
271
J. P
aez
= cos()
5.4. El teorema de la funci

on implcita

f
f
g (, ) + sen()
g (, )
x
y
y
f
f
(f g)
(, ) = sen() (g(, )) + cos() (g(, ))
x
y

f
f
g (, ) + cos()
g (, )
= sen()
x
y
Como ya se menciono antes, estas identidades son las que hay que considerar si se desea calcular
las derivadas parciales de orden superior (con respecto a las variables o ) de la funcion f g.
5.4
El teorema de la funci
on implcita
Una vez que hemos desarrollado las herramientas b

asicas relacionadas con el concepto de derivada
n
m
para funciones de R en R , estamos en condiciones de abordar uno de los teoremas m
as importantes del calculo diferencial de varias variables: el Teorema de la Funci
on Implcita.
5.4.1
El caso lineal
Con el fin de motivar y deducir el contenido de este teorema, empezaremos por analizar algunas
propiedades y caractersticas de las soluciones de los sistemas de ecuaciones lineales en Rn que
tienen la particularidad de tener menos ecuaciones que inc
ognitas, es decir, sistemas de la forma
a11 x1 + a12 x2 + + a1n xn + b1 = 0
(5.8)
a21 x1 + a22 x2 + + a2n xn + b2 = 0

..
.
am1 x1 + am2 x2 + + amn xn + bm = 0

en donde m < n.
Sin duda el caso m
as sencillo de este tipo de sistemas de ecuaciones lo tenemos en R2 , y se trata
de un sistema que consta de una sola ecuaci
on de la forma
ax + by + c = 0
Como seguramente recordara el lector, si a2 + b2 > 0 la ecuaci
on anterior representa una recta
en el plano, y si de obtener sus soluciones se trata, es facil probar que, si a 6= 0 entonces estas son
de la forma

by c
,y
a
para cualquier y R, y si b 6= 0 entonces todas las soluciones las podemos escribir como las parejas

ax c
x,
b
Es decir, si el coeficiente de la inc

ognita x es diferente de cero (a 6= 0), esta inc
ognita se puede
poner en funci
on de la otra inc
ognita y (x = h(y) = (by c)/a) y todas las soluciones de la
ecuaci
on son de la forma (h(y), y), con y R.
J. P
aez
272

on implcita
Sucede lo an
alogo si el coeficiente de la inc
ognita y es diferente de cero (b 6= 0); en este caso y
se puede poner en funci
on de x (y = h(x) = (ax c)/b) y todas las soluciones de la ecuaci
on son
de la forma (x, h(x)), con x R.
Para sistemas de ecuaciones en R3 , la situaci
on empieza a ponerse un poco m
as interesante. El
primer caso que se puede tener es el de una s
ola ecuaci
on de la forma
ax + by + cz + d = 0
(5.9)
(la cual geometricamente representa a un plano si a2 + b2 + c2 > 0), y la obtenci

on de sus soluciones
es muy similar al caso anterior.
En efecto, n
otese que si el coeficiente de la inc
ognita x es diferente de cero (a 6= 0), entonces
podemos poner a x en funci
on de las inc
ognitas y y z como
x = h(y, z)
(by + cz + d)
=
a
y todas las ternas de la forma
(h(y, z), y, z) =
(by + cz + d)
, y, z
a
con (y, z) R2 , son las soluciones de la ecuaci

on 5.9. Como el lector puede constatar facilmente,
se tiene una situaci
on an
aloga si b 6= 0 o c 6= 0.
El caso que se empieza a poner aun m
as interesante es cuando tenemos un sistema de dos
ecuaciones de la forma
a11 x + a12 y + a13 z + b1 = 0
(5.10)
a21 x + a22 y + a23 z + b2 = 0

y lo primero que haremos, ser
a recordar que en un sistema de este tipo se pueden presentar las
siguientes situaciones.
Una posibilidad es que una de las ecuaciones sea m
ultiplo de la otra, es decir, que una de ellas
se puede obtener de la otra multiplicando por un escalar, lo que significa que en realidad nuestro
sistema s
olo consta de una ecuaci
on, caso que ya analizamos.
La segunda posibilidad es que los planos que representan cada una de las ecuaciones, sean dos
planos distintos pero paralelos, es decir, que los vectores normales a cada uno de ellos ((a11 , a12 , a13 )
y (a21 , a22 , a23 )), sean paralelos; en este caso no existen soluciones y no hay nada mas que se pueda
hacer.
La tercera y u
ltima posibilidad (sin duda la m
as interesante) es justo cuando los vectores
(a11 , a12 , a13 ) y (a21 , a22 , a23 ) no son paralelos, y por lo tanto el conjunto de soluciones del sistema
est
a formado por todos los puntos de la recta en la que se intersectan ambos planos. Del hecho de
que los vectores (a11 , a12 , a13 ) y (a21 , a22 , a23 ) no sean paralelos, podemos concluir entonces que el
producto cruz de estos vectores no es el vector 0, es decir que
(a11 , a12 , a13 ) (a21 , a22 , a23 ) = (a12 a23 a13 a22 , a13 a21 a11 a23 , a11 a22 a12 a21 )
6= 0
(5.11)
y por lo tanto tenemos tres posibilidades: a12 a23 a13 a22 6= 0, a13 a21 a11 a23 6= 0 o a11 a22 a12 a21 6=
0, posibilidades que a continuaci
on nos disponemos a analizar.
273
J. P
aez

on implcita
Lo primero que habra que destacar es que cada una de las coordenadas del vector dado por 5.11,
resulta ser el determinante de la matriz formada por los coeficientes de algunas de las inc
ognitas
de nuestras ecuaciones.
En efecto, n
otese que a12 a23 a13 a22 es el determinante de la matriz que se obtiene al considerar
solo los coeficientes (de ambas ecuaciones del sistema dado por 5.10) de las inc
ognitas y y z;
a13 a21 a11 a23 es el determinante de la matriz que se obtiene al considerar solo los coeficientes de
las inc
ognitas x y z, y a11 a22 a12 a21 es el determinante de la matriz que se obtiene al considerar
solo los coeficientes de las inc
ognitas x y y.
Con base en la observaci
on anterior, si por ejemplo se tiene que a12 a23 a13 a22 6= 0, todo parece
indicar que lo m
as adecuado sera reescribir el sistema de ecuaciones 5.10 en la forma
a12 y + a13 z = a11 x b1
a22 y + a23 z = a21 x b2
o mejor aun, en la forma matricial

y
a12 a13
(a11 x + b1 )
=
a22 a23
z
(a21 x + b2 )
de tal manera que, si escribimos
M=
a12 a13
a22 a23
como det(M ) = a12 a23 a13 a22 6= 0, sabemos que M es invertible y por lo tanto tendremos que las
inc
ognitas y y z se pueden poner en funcion de la inc
ognita x, como

y
(a11 x + b1 )
1
=M
z
(a21 x + b2 )

h1 (x)
=
h2 (x)
y que las soluciones del sistema 5.10 estaran dadas por las ternas
(x, h1 (x), h2 (x))
con x R.
Tomando en consideracion el an
alisis anterior, seguramente el lector estar
a de acuerdo en que,
si ahora lo que se tiene es que a13 a21 a11 a23 6= 0, entonces las inc
ognitas x y z se podr
an poner
en funcion de la inc
ognita y (x = h1 (y) y z = h2 (y)) y que las soluciones del sistema estar
an dadas
por las ternas (h1 (y), y, h2 (y)) con y R.
Y si lo que sucede es que a11 a22 a12 a21 6= 0, entonces las inc
ognitas x y y se podr
an poner en
funcion de la inc
ognita z (x = h1 (z) y y = h2 (z)) y que las soluciones del sistema estar
an dadas
por las ternas (h1 (z), h2 (z), z), con z R.
Sin duda el caso anterior es muy ilustrativo y nos da la pauta para resolver el problema general
sobre el calculo de las soluciones del sistema de ecuaciones dado por 5.8. De esta manera, si por
ejemplo se tiene que la matriz de m m formada por los coeficientes de las inc
ognitas x1 , . . . , xm ,
dada por
a11 a1m
..
..
M = ...
.
.
am1
J. P
aez
274
amm

on implcita
tiene determinante distinto de cero (y por lo tanto tiene inversa), entonces el sistema
terminos de la matriz M toma la forma

a1(m+1) xm+1 + + a1n xn + b1

x1
a11 a1m
..
..
.. .. =
..
.
.
.
. .

am(m+1) xm+1 + + amn xn + bm
xm
am1 amm
5.8 escrito en
y por lo tanto las inc

ognitas x1 , . . . , xm se podr
an poner en funcion de las inc
ognitas restantes
xm+1 , . . . , xn como

a1(m+1) xm+1 + + a1n xn + b1

x1
..
..
1
. =M
.

xm
Por lo tanto, si definimos
H = (h1 , . . . , hm ) : Rnm Rm
como

a1(m+1) xm+1 + + a1n xn + b1
..
H(xm+1 , . . . , xn ) = M 1
.

entonces encontramos que existen h1 , . . . , hm : Rnm R tales que

xj = hj (xm+1 , . . . , xn )
para j {1, . . . , m}, y que las soluciones del sistema de ecuaciones 5.8 est
an dadas por las nadas
(h1 (xm+1 , . . . , xn ), . . . , hm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) Rn
con (xm+1 , . . . , xn ) Rnm .
En el caso general se tendra que, si los ndices 1 i1 < i2 < < im n, 1 jm+1 < jm+2 <
< jn n, con {i1 , . . . , im } {jm+1 , . . . , jn } = , son tales que la matriz
a1i1
..
.
ami1
..
.
a1im
..
.
amim
es invertible, entonces las inc

ognitas xi1 , . . . , xim se pueden poner en funcion de las inc
ognitas
nm
restantes xjm+1 , . . . , xjn , es decir que existen hi1 , . . . , him : R
R tales que
xik = hik (xjm+1 , . . . , xjn )
para k {1, . . . , m}, y que las soluciones del sistema de ecuaciones 5.8 est
an dadas por las
nadas formadas con los n n
umeros reales hi1 (xjm+1 , . . . , xjn ),. . .,him (xjm+1 , . . . , xjn ),xjm+1 ,. . .,xjn ,
en donde hik (xjm+1 , . . . , xjn ) es la ik -esima coordenada y xjl es la jl esima coordenada, para
k {1, . . . , m} y l {m + 1, . . . , n}.
275
J. P
aez
5.4.2

on implcita
El caso no lineal
Una vez que hemos analizado el caso de un sistema de ecuaciones lineales, el siguiente paso ser
a
considerar un sistema de ecuaciones, pero no necesariamente lineales, sino el determinado por m
funciones g1 , . . . , gm : Rn R dado por
g1 (x1 , . . . , xn ) = 0
g2 (x1 , . . . , xn ) = 0
..
.
(5.12)
gm (x1 , . . . , xn ) = 0
en donde supondremos que cada funci
on gi es de clase C 1 en Rn .
Denotaremos por S al conjunto de soluciones de este sistema, es decir
S = {
x = (x1 , . . . , xn ) Rn | g1 (
x) = 0, . . . , gm (
x) = 0}
y nuestro objetivo no ser
a encontrar y caracterizar a todos los elemento de S (como hicimos en el
caso del sistema de ecuaciones lineales), lo que sin duda es un problema bastante difcil.
Nuestro objetivo es algo mas modesto y consiste en lo siguiente: si tenemos una soluci
on x
0
del sistema 5.12, es decir que x
0 S, es posible decir algo de las soluciones de 5.12 que est
an
cerca de x
0 ? La respuesta a esta pregunta es justo el teorema de la funci
on implcita, el cual nos
dice algo sobre el comportamiento de las soluciones del sistema de ecuaciones 5.12 alrededor
del punto x
0 .
La idea principal detr
as del teorema de la funcion implcita es la siguiente: dado que nuestro
objetivo es conocer el comportamiento de las soluciones del sistema de ecuaciones 5.12 cerca o
alrededor del punto x
0 , entonces sustituyamos cada ecuaci
on gi (x1 , . . . , xn ) = 0 por su mejor
aproximacion lineal en x
0 , es decir por la ecuaci
on
Dgi (
x0 )(
xx
0 ) + gi (
x0 ) = Dgi (
x0 )(
xx
0 ) = 0
o lo que es lo mismo, por la ecuaci
on
gi
gi
gi
(
x0 )x1 +
(
x0 )x2 + +
(
x0 )xn + bi = 0
x1
x2
xn
en donde bi = Dgi (
x0 )(
x0 ), para cada i {1, . . . , n}.
De esta forma, si para el sistema de ecuaciones lineales dado por
g1
(
x0 )x1 +
x1
g2
(
x0 )x1 +
x1
g1
(
x0 )x2 + +
x2
g2
(
x0 )x2 + +
x2
..
.
gm
gm
(
x0 )x1 +
(
x0 )x2 + +
x1
x2
se tiene que la matriz
g1
x0 )
x1 (
..
..
.
.
gm
x0 )
x1 (
J. P
aez
276
g1
(
x0 )xn + b1 = 0
xn
g2
(
x0 )xn + b2 = 0
xn
(5.13)
gm
(
x0 )xn + bm = 0
xn
g1
x0 )
xm (
..
.
gm
x0 )
xm (
(5.14)

on implcita
es invertible, por lo visto para el caso de los sistemas de ecuaciones lineales, sabemos que las
inc
ognitas x1 , . . . , xm se pueden poner en funcion de las inc
ognitas xm+1 , . . . , xn , es decir que existe
nm
m
h : R
R tal que (x1 , . . . , xm ) = h (xm+1 , . . . , xn ), y que sus soluciones est
an dadas por
(h (xm+1 , . . . , xn ) , xm+1 , . . . , xn ) para todo (xm+1 , . . . , xn ) Rnm .
Pues bien, como el sistema de ecuaciones dado por 5.13 se parece mucho al sistema de
ecuaciones dado por 5.12 alrededor o cerca de x
0 , el teorema de la funcion implcita asegura
que, alrededor o cerca de x
0 , las inc
ognitas x1 , . . . , xm tambien se pueden poner en funci
on de
las inc
ognitas xm+1 , . . . , xn ; es decir, si

(0)
(0)
(0)
x
0 = x1 , . . . , x(0)
m , xm+1 , . . . , xn
este teorema nos asegura que existen r > 0 y

(0)
(0)
Rnm Rm
h : Br xm+1 , . . . , xn
de clase C 1 , tal que

(0)
(0)
= x1 , . . . , x(0)
h xm+1 , . . . , x(0)
m
n
y las nadas (h (xm+1

, . . . , xn ) tambien son soluciones del sistema 5.12 para cada
, . . . , xn ) , xm+1
(0)
(0)
, es decir que
(xm+1 , . . . , xn ) Br xm+1 , . . . , xn
(h (xm+1 , . . . , xn ) , xm+1 , . . . , xn ) S

(0)
(0)
.
para cada (xm+1 , . . . , xn ) Br xm+1 , . . . , xn
Antes de dar la formulaci
on m
as precisa del teorema de la funcion implcita, haremos unas
observaciones importantes. La primera de ellas tiene que ver con la eleccion de la matriz dada por
5.14. Como en el caso del sistema de ecuaciones lineales, si en general los ndices 1 i1 < i2 <
< im n, 1 jm+1 < jm+2 < < jn n, con {i1 , . . . , im } {jm+1 , . . . , jn } = , son tales
que la matriz
g
g1
1
(
x
)
x0 ) x
0
xi1 (
im
..
..
..
.
.
.
gm
gm
(
x
)
(
x
)
0
0
xi
xi
m
es invertible, entonces lo que el teorema de la funcion implcita afirma es que alrededor de x

0 S
las inc
ognitas xi1 , . . . , xim se pueden poner en funcion de las inc
ognitas restantes xjm+1 , . . . , xjn , es
decir que existen r > 0 y

(0)
(0)
Rnm R
hi1 , . . . , him : Br xjm+1 , . . . , xjn
tales que

(0)
(0)
(0)
xik = hik xjm+1 , . . . , xjn
para k {1, . . . , m}, y que las n-adas formadas con los n n

umeros reales hi1 (xjm+1 , . . . , xjn ),. . .,
him (xjm+1 , . . . , xjn ), xjm+1 ,. . .,xjn , en donde hik (xjm+1 , . . . , xjn ) es la ik esima coordenada y xjl es
la jl esima coordenada, para k {1, . . . , m} y l {m + 1, . . . , n}, son soluciones del sistema 5.12.
Las otras observaciones que haremos, en realidad son interpretaciones geometricas del teorema
de la funci
on implcita para los casos de R2 y R3 . El caso m
as sencillo es el de R2 , en el que s
olo
se puede tener una restriccion de la forma
g(x, y) = 0
277
J. P
aez

on implcita
y que no es mas que el conjunto de nivel 0 de g (N0 (g)).

De acuerdo con lo visto anteriormente, sihx
0 = (xi0 , y0 ) R2 es tal que g(x0 , y0 ) = 0 y
g
x0 )
x (
g
x0 )
x (
6= 0
es invertible!), entonces para puntos (x, y)

(es decir, que la matriz de 1 1 dada por
N0 (g) cercanos al punto x
0 = (x0 , y0 ), su coordenada (o variable) x se puede poner en funci
on
de su coordenada (o variable) y, es decir que existen r > 0 y h : (y0 r, y0 + r) R R tales que
h(y0 ) = x0 y g(h(y), y) = 0 para toda y (y0 r, y0 + r).
g
Analogamente, si y
(
x0 ) 6= 0 entonces para puntos de N0 (g) cercanos al punto x
0 = (x0 , y0 )
su coordenada (o variable) y se puede poner en funcion de coordenada (o variable) x, es decir que
existen r > 0 y h : (x0 r, x0 + r) R R tales que h(x0 ) = y0 y g(x, h(x)) = 0 para toda
x (x0 r, x0 + r).
g
(
x0 ) 6=
En terminos geometricos, lo anterior significa que si el vector g(
x0 ) no es horizontal ( y
0), es decir no es paralelo al eje X, entonces un sector de la curva de nivel 0 de g alrededor
del punto x
0 = (x0 , y0 ) se puede ver como la gr
afica de una funcion de la forma y = h(x) (ver
g
(
x0 ) 6= 0), es decir no es paralelo al eje Y ,
figura 5.4 (a)). Y si el vector g(
x0 ) no es vertical ( x
entonces un sector de la curva de nivel 0 de g alrededor del punto x
0 = (x0 , y0 ) se puede ver
como la gr
afica de una funci
on de la forma x = h(y) (ver figura 5.4 (b)).
Y
g(
x0 )
b
g(
x0 )
b
g(x, y) = 0
g(
x0 )
g(x, y) = 0
b
g(
x0 )
X
X
(b)
(a)
Figura 5.4: Si el vector g(

x0 ) no es horizontal (vector verde y azul en (a)), entonces un sector de
la curva de nivel 0 de g alrededor del punto x
0 se puede ver como la grafica de una funcion de la
forma x = h(y). Y si el vector g(
x0 ) no es vertical (vector rojo y azul en (b)), entonces un sector
de la curva de nivel alrededor del punto x
0 se puede ver como la grafica de una funcion de la forma
y = h(x).
Para el caso de R3 , si solo se tiene una restriccion de la forma
g(x, y, z) = 0
g
(
x0 ) 6= 0 (lo que significa que el vector
y x
0 = (x0 , y0 , z0 ) R3 es tal que g(x0 , y0 , z0 ) = 0 y x
g(
x0 ) no est
a en el plano Y Z), entonces para puntos (x, y, z) N0 (g) cercanos al punto x
0 ,
la coordenada (o variable) x se puede poner en funcion de las correspondientes coordenadas (o
variables) y y z, es decir que existen r > 0 y h : Br ((y0 , z0 )) R2 R tales que h(y0 , z0 ) = x0 y
g(h(y, z), y, z) = 0 para toda (y, z) Br ((y0 , z0 )).
Lo anterior, nuevamente en terminos geometricos, significa que un pedazo del conjunto de
nivel 0 de g que contiene al punto x
0 = (x0 , y0 , z0 ) se puede ver como la gr
afica de una funci
on
J. P
aez
278

on implcita
g
(
x0 ) 6= 0 y
de la forma x = h(y, z) (ver figura 5.5). Los otros casos ( y
interpretaciones geometricas semejantes.
g
x0 )
z (
6= 0) tienen
g(x0 , y0 , z0 )
(y0 , z0 )
g(x, y, z) = 0
Y
X
g
(
x0 ) 6= 0 (lo que significa que el vector g(
x0 ) no esta en el plano Y Z), entonces un
Figura 5.5: Si x
sector de la superficie de nivel 0 de g alrededor del punto x
0 = (x0 , y0 , z0 ) se puede ver como la
grafica de una funcion de la forma x = h(y, z).
La otra posibilidad en R3 es cuando tenemos dos restricciones de la forma

g1 (x, y, z) = 0
g2 (x, y, z) = 0
en cuyo caso el conjunto S de soluciones de este sistema se ve como una curva.
Si x
0 = (x0 , y0 , z0 ) S, n
otese que el sistema de ecuaciones dado por 5.13 se reduce al sistema
de dos ecuaciones
g1
(
x0 )x +
x
g2
(
x0 )x +
x
g1
(
x0 )y +
y
g2
(
x0 )y +
y
g1
(
x0 )z g1 (
x0 ) x
0 = 0
y
g2
(
x0 )z g2 (
x0 ) x
0 = 0
y
y el determinante de cada una de las tres posibles submatrices de 2 2 que se pueden construir a
partir de este sistema, coinciden (salvo posiblemente por el signo), con las coordenadas del vector
#
"
g1

g1
g1
1
(
x
)
(
x
)
(
x0 ) g
(
x0 )
0
0
y
z
x
z
e1 det g2
g1 (
x0 ) g2 (
x0 ) = det g2
e2
2
2
x0 ) g
x0 )
x0 ) g
x0 )
y (
z (
x (
z (
"
#
g1
g1
(
x
)
(
x
)
0
0
x
y
+ det g
e3
g2
2
(
x
)
x0 )
0
x
y (
De esta forma, si la matriz
"
g1
x0 )
y (
g2
x0 )
y (
g1
x0 )
z (
g2
x0 )
z (
tiene determinante distinto de 0 (es decir, si la primera coordenada del vector g1 (

x0 ) g2 (
x0 )
es distinta de 0, o equivalentemente, que este vector no pertenece al plano Y Z), entonces las
279
J. P
aez

on implcita
coordenadas (o variables) y y z de puntos de S cercanos al punto x

0 se pueden poner en funci
on
de la coordenada (o variable) x. Es decir, existen r > 0 y h1 , h2 : (x0 r, x0 + r) R R tales
que h1 (x0 ) = y0 , h2 (x0 ) = z0 y g(x, h1 (x), h2 (x)) = 0 para toda x (x0 r, x0 + r).
Lo anterior significa que la funci
on de R en R3 dada por h(x) = (x, h1 (x), h2 (x)) (para x
(x0 r, x0 +r)) es una parametrizacion de un pedazo de la curva determinada por las restricciones
g1 y g2 (ver figura 5.6).
Las otras dos posibilidades, correspondientes a las otras dos matrices de 2 2 que se pueden
obtener con las derivadas parciales de g1 y g2 , se interpretan de manera an
aloga.
Z
g1 (x, y, z) = 0
g2 (
x0 )
b
x
0
g1 (
x0 g2 (
x0 )
g1 (
x0 )
g2 (x, y, z) = 0
Figura 5.6: Si la primera coordenada del vector g1 (

x0 )g2 (
x0 ) es distinta de 0 entonces las variables
y y z alrededor del punto x
0 = (x0 , y0 , z0 ) se pueden poner en funcion de la variable x. Esto significa
que un sector de la curva S (determinada por la interseccion de las restricciones g1 y g2 ) se puede
parametrizar en terminos de la variable x.
Las dos primeras interpretaciones geometricas que acabamos de hacer, los casos en que el
conjunto S coincide con un conjunto de nivel en R2 o uno en R3 , son justo los hechos geometricos
que se mencionaron en los comentarios que hicimos posteriores al ejemplo 4.33 del captulo 4.
En ese ejemplo calculamos la recta tangente de un cierto conjunto de nivel en R2 , y el plano
tangente de un cierto conjunto de nivel en R3 , de acuerdo con las definiciones 4.32 y 4.18. Y
precisamente, adelant
andonos a las interpretaciones geometricas del teorema de la funcion implcita
que acabamos de hacer, comentamos que esa recta y ese plano tambien se podan obtener como
la recta tangente a la gr
afica de una funcion de R en R, y el plano tangente a la gr
afica de una
funcion de R2 en R, respectivamente.
Lo que ahora nos proponemos, es tomar esos mismos conjuntos y mostrar que estas afirmaciones
son ciertas.
Ejemplo 5.14
1. Consideremos el conjunto de nivel 0 (N0 (g)) de la funci
on de clase C 1 en R2
g(x, y) = (x2 + y 2 2x)2 4(x2 + y 2 )
que, como se mencion
o en el inciso 1. del ejemplo 4.33 del captulo 4, este conjunto de nivel
es la curva cardiode.
J. P
aez
280

on implcita
Como
g
(x, y) = 2(x2 + y 2 2x) (2x 2) 8x
x
g
(x, y) = 2(x2 + y 2 2x)2y 8y
y
para cada (x, y) R2 , en particular para el punto (0, 2) N0 (g) se tiene que
g
16 6= 0 y y
(0, 2) = 16 6= 0.
g
x (0, 2)
Dado que ambas derivadas parciales son distintas de 0, podemos aplicar el teorema de la
funci
on implcita para los dos casos.
g
Si consideramos el hecho de que x
(0, 2) 6= 0, el teorema nos asegura que existen r > 0 y
h : (2 r, 2 + r) R R de clase C 1 tal que h (2) = 0 y
g (h (t) , t) = 0
(5.15)
para toda t (2 r, 2 + r).
Derivando esta identidad usando la regla de la cadena, obtenemos que

g
g
(h (t) , t) h (t) +
(h (t) , t) = 0
x
y
para toda t (2 r, 2 + r), de modo que, evaluando para t = 2, se tiene que
g
g
(h (2) , 2) h (2) =
(0, 2) h (2)
x
x
g
(0, 2)
=
y
y por lo tanto, como
g
x (0, 2)
6= 0, concluimos que
g
y
h (2) = g
(0, 2)
(0, 2)
16
=
16
=1
x
Una vez que llegamos a este punto, es importante hacer la siguiente observaci
on. En estricto
sentido, la gr
afica de la funci
on h es el conjunto de parejas de la forma (t, h (t)) R2 , que
no son las parejas que pertenecen al conjunto de nivel 0 de la funci
on g.
De acuerdo con la identidad 5.15, hay que permutar las coordenadas de los elementos de la
gr
afica de h para que dichas parejas pertenezcan al conjunto N0 (g).
La explicaci
on de este hecho es que, en este caso, es la coordenada x a la que pusimos en
funci
on de la coordenada y. Para ser congruentes con lo anterior y no caer en errores, al
momento de escribir la ecuaci
on de la recta tangente a la gr
afica de h en el punto (0, 2),
habr
a que hacer lo mismo, escribir a la coordenada x en funci
on de la coordenada y, es decir,
escribir que
x = h (2) (y 2) + h (2)
281
J. P
aez

on implcita
=y2+0
o equivalentemente
y =x+2
Procediendo de esta forma, s obtenemos la misma recta que en el inciso 1. del ejemplo 4.33
del captulo 4.
2. Consideremos el conjunto de nivel 0 (N0 (g)) de la funci
on de clase C 1 en R3
g(x, y, z) =
x2 y 2 z 2
+ 2 + 2 1
a2
b
c
que, como se mencion

o en el inciso 2. del ejemplo 4.33 del captulo 4, este conjunto de nivel
es un elipsoide.
g
x
(x, y, z) = 2 2
x
a
g
y
(x, y, z) = 2 2
y
b
z
g
(x, y, z) = 2 2
z
c
de tal forma que si elegimos el punto (0, b, 0) N0 (g), entonces
g
(0, b, 0) = 0
x
g
2
(0, b, 0) =
y
b
g
(0, b, 0) = 0
z
g
Por tanto, como en este caso la y
(0, b, 0) = 2b es la u
nica derivada parcial que es distinta
de 0 en el punto (0, b, 0), el teorema de la funci
on implcita s
olo nos permite asegurar que
para puntos (x, y, z) N0 (g) que est
an cercanos al punto (0, b, 0), su coordenada y se puede
poner en funci
on de sus coordenadas x y z. Es decir, que existe r > 0 y h : Br (0, 0) R2 R
tal que h (0, 0) = b y
g (x, h (x, z) , z) = 0
para toda (x, z) Br (0, 0).
N
otese nuevamente, como en el inciso anterior, que en estricto sentido las ternas que pertenecen
a la gr
afica de la funci
on h son las de la forma (x, z, h (x, z)). Las ternas (x, h (x, z) , z) se
obtienen al hacer una permutaci
on de las coordenadas de las ternas (x, z, h (x, z)) (intercambiando la segunda coordenada con la tercera), y son las que pertenecen al conjunto N0 (g).
Dado que para calcular el plano tangente a la gr
afica de la funci
on h en el punto (0, b, 0),
es necesario calcular sus derivadas parciales en el punto (0, 0), esto lo logramos nuevamente
derivando la identidad anterior por medio de la regla de la cadena.
En efecto, como el lado izquierdo de la identidad anterior es la composici
on de la funci
on
2
3
H : Br (0, 0) R R dada por
H (x, z) = (x, h (x, z) , z)
J. P
aez
282

on implcita
seguida de la funci
on g, y esta composici
on nos da la funci
on constante 0, aplicando la regla
de la cadena obtemos que
D (g H) (x, z) = Dg (H (x, z)) DH (x, z)
=
=
h
g
x
(H (x, z))
0 0
g
y
(H (x, z))
g
z
(H (x, z))
1
h (x, z)
x
0
0
h
z (x, z)
1
para toda (x, z) Br (0, 0).

Por lo tanto, evaluando esta identidad de matrices en el punto (0, 0) se obtiene que
0=
g
h
2 h
g
(0, b, 0) +
(0, b, 0)
(0, 0) =
(0, 0)
x
y
x
b x
0=
h
g
2 h
g
(0, b, 0)
(0, 0) +
(0, b, 0) =
(0, 0)
y
z
z
b z
de donde
h
h
(0, 0) = 0 =
(0, 0)
x
z
Si ahora calculamos el plano tangente a la gr

afica de h en el punto (0, 0), de acuerdo con la
definici
on 4.18 del captulo 4, y como en el inciso anterior, recordando que la coordenada y
es la que se debe escribir en terminos de las coordenadas x y z, se tiene que
h
h
(0, 0) (x 0) +
(0, 0) (z 0) + h (0, 0)
x
z
=b
y=
Como el lector podr

a comprobar, esta ecuaci
on es la misma que se obtiene en el inciso 2. del
ejemplo 4.33 del captulo 4, tomando (x0 , y0 , z0 ) = (0, b, 0).
Una vez dicho y hecho todo lo anterior, escribiremos el tan mencionado teorema de la funci
on
implcita.
Con el fin de hacer sencilla su redacci
on, y dado que en la primera observacion que hicimos ya
mencionamos cu
al sera su formulaci
on m
as general, supondremos que la matriz de m m que se
necesita que sea invertible (como parte de las hip
otesis), es la correspondiente a las primeras m
variables (la matriz dada en 5.14). Y para simplificar aun m
as esta redacci
on, al espacio Rn lo
escribiremos como Rm Rk .
Teorema 5.15 (de la funci
on implcita) Sean g1 , . . . , gm : U Rm Rk R de clase C 1 en
U . Si
n
o
S = (
x, y) = (x1 , . . . , xm , y1 , . . . , yk ) Rm Rk | gi (
x, y) = 0 para i {1, . . . , m}

(0)
(0) (0)
(0)
S es tal que la matriz
y (
x0 , y0 ) = x1 , . . . , xm , y1 , . . . , yk
g1
x1
gm
x1
..
.
(
x0 , y0 )
(
x0 , y0 )
..
.
283
g1
xm
gm
xm
(
x0 , y0 )
..
.
(
x0 , y0 )
J. P
aez

on implcita
es invertible entonces existen r > 0 y h : Br (

y0 ) Rk Rm de clase C 1 en Br (
y0 ) tales que
h (
y0 ) = x
0 y (h (
y ) , y) S para toda y Br (
y0 ).
Por razones de comodidad, la prueba de este teorema la dejaremos pendiente hasta la siguiente
secci
on, en la que probaremos el teorema de la funcion inversa y con base en el cual demostraremos
el teorema anterior.
A cambio de esta prueba, y apoyados en el teorema de la funcion implcita, haremos una prueba
que en el captulo 4 dejamos pendiente: la prueba del teorema de los multiplicadores de Lagrange.
La formulaci
on que daremos a continuaci
on de este teorema, aunque totalmente equivalente a
la que dimos en el captulo 4, la escribiremos de tal forma que este m
as acorde con la formulaci
on
que acabamos de dar del teorema de la funcion implcita.
Teorema 5.16 (de los multiplicadores de Lagrange) Sean:
1. g1 , . . . , gm : U Rm Rk R funciones de clase C 1 en U .
2. S Rm Rk el conjunto dado por
n
o
S = (
x, y) U Rm Rk | g1 (
x, y) = 0, . . . , gm (
x, y) = 0
3. (
x0 , y0 ) S tal que g1 (
x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes.
Si f : U Rm Rk R es una funci
on de de clase C 1 en U tal que f tiene un m
aximo o
mnimo (local) en (
x0 , y0 ) sobre S entonces existen 1 , . . . , m R tales que
f (
x0 , y0 ) = 1 g1 (
x0 , y0 ) + + m gm (
x0 , y0 )
Demostraci
on. Dado que los vectores g1 (
x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes, se tiene que el rango por renglones de la matriz
g1
g1
g1
(
x
,
y
(
x
,
y
)
x0 , y0 ) x
0
0
0
0
x1 (
x
m
n
..
..
..
..
..
.
.
.
.
.
gm
x1
(
x0 , y0 )
gm
xm
(
x0 , y0 )
gm
xn
(
x0 , y0 )
debe ser m, y como este debe ser igual a su rango por columnas (inciso (c) del Corolario 2 del
Teorema 3.6 de la referencia [2]), dicha matriz debe tener m columnas linealmente independientes.
Supondremos, sin perdida de generalidad, que estas columnas son las primeras m de tal forma
que la matriz de m m
g1
g1
(
x0 , y0 )
x0 , y0 ) x
x1 (
m
..
..
..
.
.
.
gm
x1
(
x0 , y0 )
gm
xm
(
x0 , y0 )
ser
a invertible. De esta forma, por el teorema de la funcion implcita, sabemos que existen r > 0 y
h = (h1 , . . . , hm ) : Br (
y0 ) Rk Rm
de clase C 1 en Br (
y0 ) tales que h (
y0 ) = x
0 y (h (
y0 ).
k
m
k
Definamos ahora la funci
on H : Br (
y0 ) R R R como H(
y ) = (h (
y) , y) la cual es de
clase C 1 en Br (
y0 ). Ahora, como (h (
y0 ), se tiene que (gi H) (
y) = 0
para toda y Br (
y0 ) de modo que en particular
D(gi H) (
y0 ) = Dgi (H(
y0 )) DH(
y0 )
J. P
aez
284

on implcita
= Dgi (
x0 , y0 ) DH(
y0 )

= 0 0 M1k (R)
es decir que el producto de matrices
gi
x1
(
x0 , y0 )
gi
xm
(
x0 , y0 )
gi
y1
(
x0 , y0 )
gi
yk
(
x0 , y0 )
h1
y1
(
y0 )
..
..
.
.
hm
y0 )
y1 (
1
..
..
.
.
0
h1
yk
(
y0 )
..
.
hm
y0 )
yk (
0
..
.
1
(5.16)
M1k (R)
para cada i {1, . . . , m}.

Si ahora definimos los vectores

hm
h1
(
y0 ) , . . . ,
(
y0 ) , ej Rm Rk
wj =
yj
yj
para j {1, . . . , k} (en donde e1 , . . . , ek Rk son los vectores can
onicos), se tiene que w1 , . . . , wk
son linealmente independientes de modo que si W Rm Rk es el subespacio generado por estos
vectores (es decir que W = hw1 , . . . , wk i), entonces W es de dimension k (dim(W ) = k).
Ahora n
otese que, del hecho de que el producto de matrices 5.16 sea la matriz (de 1 k)
identicamente cero, se concluye que
gi (
x0 , y0 ) wj = 0
para cada i {1, . . . , m} y cada j {1, . . . , k}, de modo que gi (
x0 , y0 ) W (el complemento
ortogonal de W en Rm Rk ) para cada i {1, . . . , m}. Por otra parte, como

dim(W ) = dim Rm Rk dim (W )
= m+kk
=m
y g1 (
x0 , y0 ), . . . , gm (
x0 , y0 ) son linealmente independientes, concluimos que estos vectores son
una base de W .
Finalmente, si ahora consideramos la funcion f H (la cual est
a definida en alguna vecindad del
punto y0 Rk ), dado que f tiene un valor extremo (local) en el punto (
x0 , y0 ) = H(
y0 ) entonces
f H tiene un valor extremo (local) en el punto y0 (problema 33 del captulo 4), de modo que y0
es un punto crtico de f H y por lo tanto
D(f H) (
y0 ) = Df (H(
y0 )) DH(
y0 )
= Df (
x0 , y0 ) DH(
y0 )

= 0 0 M1k (R)
285
J. P
aez

on inversa
es decir que
f
x1
(
x0 , y0 )
f
xm
(
x0 , y0 )
f
y1
f
yk
(
x0 , y0 )
M1k (R)
(
x0 , y0 )
h1
y1
..
.
hm
y0 )
y1 (
1
..
..
.
.
(
y0 )
..
.
(
y0 )
..
hm
(
y
)
0
yk
..
.
1
h1
yk
Por tanto, tambien se tiene que

f (
x0 , y0 ) wj = 0
para cada j {1, . . . , j} de modo que f (
x0 , y0 ) tambien pertenece a W = hw1 , . . . , wk i , y como
g1 (
x0 , y0 ), . . . , gm (
x0 , y0 ) son una base de W , entonces f (
x0 , y0 ) debe ser una combinaci
on
lineal de estos vectores, es decir, existen 1 , . . . , m R tales que
f (
x0 , y0 ) = 1 g1 (
x0 , y0 ) + + m gm (
x0 , y0 )
con lo cual concluimos la prueba.
5.5
on inversa
Ademas del papel importante que juega en la prueba del teorema de la funcion implcita, el teorema
de la funcion inversa es relevante por meritos propios. De hecho, este teorema no debe ser ajeno al
lector pues el caso particular de este teorema para funciones de R en R forma parte de los resultados
importantes de un primer curso de c
alculo.
En este captulo haremos uso de todo el material desarrollado en la primera secci
on de este
captulo, pero adicionalmente necesitaremos algunos resultados relacionados con las funciones lineales de Rn en Rm y su representaci
on matricial, los cuales introduciremos a continuaci
on.
n
m
1
Si f : U R R es una funci
on de clase C en su dominio U , sabemos que para cada x
U
existe la derivada de f , que la derivada es una funcion lineal de Rn en Rm , que esta se representa
por una matriz (la cual depende de las bases que se elijan para Rn en Rm , y a la que llamamos
matriz jacobiana), y que para cada x
U esta matriz est
a dada por
f1
f1
(
x
)
x) x
x1 (
n
..
..
..
Df (
x) =
.
.
.
fm
x)
x1 (
fm
x)
xn (
Como se podr
a observar (y era de esperarse), para cada x
U tenemos asociada una matriz
cuyas entradas son funciones continuas de x
, y una cuesti
on importante es determinar de que forma
se refleja este hecho en las funciones lineales que representan estas matrices.
Para ello, observemos que si evaluamos dos de estas funciones lineales (es decir, la derivada de
f en dos puntos x
, x0 U ) en un punto arbitrario z = (z1 , . . . , zn ) Rn , se tiene que la diferencia
entre estos valores est
a dada por
Df (
x) (
z ) Df (
x0 ) (
z ) = (Df (
x) Df (
x0 )) (
z)
J. P
aez
286

on inversa
f1
x)
x1 (
..
.
z1
..
.
fm
fm
zn
x) xn (
x0 )
xn (
f1
x0 )
x1 (
f1
x)
xn (
..
=
.
fm
fm
x) x1 (
x0 )
x1 (
..
.
f1
x0 )
xn (
= ((f1 (
x) f1 (
x0 )) z, . . . , (fm (
x) fm (
x0 )) z)
(5.17)
de tal forma que su distancia satisface que

kDf (
x) (
z ) Df (
x0 ) (
z )k = k((f1 (
x) f1 (
x0 )) z, . . . , (fm(
x) fm (
x0 )) z)k
|(f1 (
x) f1 (
x0 )) z| + + |(fm (
x) fm (
x0 )) z|
kf1 (
x) f1 (
x0 )k k
z k + + kfm (
x) fm (
x0 )k k
zk
m
X
kfj (
x) fj (
x0 )k
= k
zk
j=1
v

2
m uX
X
u n
fj
fj
t
= k
zk
(
x)
(
x0 )
xi
xi
j=1
i=1
De lo anterior se desprende que, si

fj

fj

<
(
x
)
(
x
)
0
xi

xi
entonces
v

2
m uX
X
u n fj
fj
t
(
x)
(
x0 )
kDf (
x) (
z ) Df (
x0 ) (
z )k k
zk
xi
xi
i=1
j=1
v
m uX
X
u n
t
( )2
< k
zk
j=1
i=1
v
u n
m
X
uX
t
= k
zk
1
j=1
= k
z k n
i=1
m
X
j=1
= k
z k m n
(5.18)
para toda z Rn .
Esta u
ltima desigualdad lo que nos dice es que, si la distancia entre las entradas correspondientes
de Df (
x) y Df (
x0 ) es peque
na, entonces la distancia entre los valores de Df (
x) y Df (
x0 ) en
n
cualquier z R tambien es, con respecto a k
z k , proporcionalmente peque
na.
Lo interesante de la condici
on anterior es que lo recproco tambien es cierto. Es decir, si
x
, x
0 U son tales que
kDf (
x) (
z ) Df (
x0 ) (
z )k k
zk
para toda z Rn , entonces se tiene que

fj
fj

x)
(
x0 )
xi (
xi
287
J. P
aez

on inversa
para cada i {1, . . . , n} y cada j {1, . . . , m}. En efecto, dado que

Df (
x) (
z ) Df (
x0 ) (
z ) = ((f1 (
x) f1 (
x0 )) z, . . . , (fm (
x) fm(
x0 )) z)
para toda z Rn , entonces para cada i {1, . . . , n} se tiene que

f1
f1
fm
fm
(
x)
(
x0 ), . . . ,
(
x)
(
x0 )
Df (
x) (
ei ) Df (
x0 ) (
ei ) =
xi
xi
xi
xi
y por lo tanto

fj

fj

kDf (
(
x
)
(
x
)
x) (
ei ) Df (
x0 ) (
ei )k
0
xi

xi
k
ei k
=
para cada j {1, . . . , m}.

La discusion anterior da lugar a la siguiente proposici
on que nos aporta una caracterizaci
on de
1
las funciones de clase C en una regi
on U .
Proposici
on 5.17 Sea f = (f1 , . . . , fm ) : U Rn Rm . La funci
on f es de clase C 1 en U si y
s
olo si
1. f es derivable para cada x
U, y
2. para cada x
0 U y cada > 0 existe > 0 tal que B (
x0 ) U , y si x
B (
x0 ) entonces
kDf (
x) (
z ) Df (
x0 ) (
z )k k
zk
para toda z Rn .
Demostraci
on. ( = ) Como f es de clase C 1 en U , por la proposici
on 5.10 sabemos que f es
derivable para cada x
U.
f
0 para
Sean ahora x
0 U y > 0. Como f es de clase C 1 en U , entonces xji es continua en x
cada i {1, . . . , n} y cada j {1, . . . , m}, de tal forma que existe > 0 tal que B (
x0 ) U y si
x
B (
x0 ) U entonces

fj

fj
1

x)
(
x0 ) <
xi (
xi
m n
para toda i {1, . . . , n} y toda j {1, . . . , m}. Por tanto, tomando =

5.18, se tiene que
kDf (
x) (
z ) Df (
x0 ) (
z )k k
z k m n
m n
en la desigualdad
= k
zk
para toda z Rn .
( = ) Recprocamente, para x
0 U y > 0 sabemos que existe > 0 tal que si x
B (
x0 ) U
entonces
kDf (
x) (
z ) Df (
x0 ) (
z )k k
zk
para toda z Rn .
J. P
aez
288

on inversa
Ahora, por la identidad 5.17, tomando z = ei para cada i {1, . . . , n}, se tiene que

f1
fm
fm
f1
(
x)
(
x0 ), . . . ,
(
x)
(
x0 ) = Df (
x) (
ei ) Df (
x0 ) (
ei )
xi
xi
xi
xi
de modo que

fj

f1
f
f1
fm
fm
j

(
x
)
(
x
)
(
x
)
(
x
),
.
.
.
,
(
x
)
(
x
)
0
0
0
xi

xi
xi
xi
xi
xi
= kDf (
x) (
ei ) Df (
x0 ) (
ei )k
k
ei k
para cada j {1, . . . , m}, lo que prueba que

clase C 1 en U .
fj
xi
es continua en x
0 U , y por lo tanto que f es de
Dado que el tema de esta secci

on se centra en la b
usqueda de condiciones para que una funci
on
n
n
f de R en R sea invertible en la vecindad de un punto x
0 de su dominio, y que bajo ciertas
condiciones de derivabilidad de f en x
0 , esta se parece mucho (en una vecindad de este punto) a
una funcion lineal, empezaremos por dar condiciones para que una funcion lineal L de Rn en Rn
sea invertible.
Antes de hacer esto, como seguramente el lector recordara de su curso de Algebra

Lineal,
n
n
: Rn Rn
decimosque una
funci
o
n
lineal
L
:
R
R
es
invertible
si
existe
otra
funci
o
n
lineal
L

(
L (
existe,
tal que L L
x) = x
= L
x) para toda x
Rn , y que cuando esta funcion lineal L
entonces es u
nica y que por esta raz
on se le suele denotar por L1 .
Tambien es oportuno tener presente que en este mismo curso de Algebra

Lineal se debieron
haber probado dos condiciones necesarias y suficientes para que una funcion lineal L : Rn Rn
sea invertible. Una, que dice que L es invertible si y s
olo si L (
x) = 0 s
olo si x
= 0; y dos, que L es
invertible si y s
olo si la matriz M asociada a L (en cualesquiera bases de ambos Rn , el dominio y
el contradominio) es invertible, lo que a su vez es equivalente a que det(M ) 6= 0.
Una vez dicho lo anterior, lo siguiente que haremos ser
a formular (apoyados en algunas de
las condiciones mencionadas) otra condici
on necesaria y suficiente para que una funcion lineal
L : Rn Rn sea invertible.
Proposici
on 5.18 Sea L : Rn Rn una funci
on lineal. L tiene inversa (o L es invertible) si y
s
olo si existe m > 0 tal que
kL (
x)k m k
xk
para toda x
Rn .
Demostraci
on. Si L tiene inversa, sabemos que L (
x) = 0 s
olo si x
= 0 de tal forma que, si
consideramos el conjunto
S n1 = {
x Rn | k
xk}
entonces kL (
x)k > 0 para toda x
S n1 .
Ahora, dado que S n1 es un conjunto cerrado y acotado y L es una funcion continua (en Rn ),
entonces kLk alcanza su mnimo valor sobre S n1 , es decir, existe x
0 S n1 tal que
kL (
x)k kL (
x0 )k > 0
289
J. P
aez

on inversa
para toda x
S n1
x0 )k > 0 y tomamos x
Rn , con x
6= 0 (pues
si hacemos m = kL (
. Por tanto,

claramente L
0 = 0 = m 0 ), entonces
x
S n1
k
xk
y por lo tanto
L
k
xk
kL (
x0 )k = m
de modo que
kL (
x)k m k
xk
lo cual prueba la primera implicaci
on.
Recprocamente, si existe m > 0 tal que
kL (
x)k m k
xk
para toda x
Rn , entonces se tiene que
kL (
x)k m k
xk > 0
para toda x
Rn , con x
6=
0, es decir que L (
x) = 0 s
olo si x
= 0 lo que implica que L es invertible.
Con lo anterior, ya tenemos las herramientas de Algebra

Lineal necesarias para probar el teorema
principal de esta secci
on: el teorema de la funcion inversa. Antes de hacer esto, e incluso antes
de formular este teorema, daremos un par de lemas con los cuales iremos preparando el terreno
para enunciarlo y probarlo.
El primero de estos dos lemas nos permitira probar que, si la derivada de una funcion f (de
clase C 1 en un conjunto abierto U ) es invertible en un punto x
0 U (en donde Df (
x0 ) se toma
como funcion lineal o como matriz), entonces la derivada de f sigue siendo invertible para todo
punto en una vecindad del punto x
0 .
Lema 5.19 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x
0 U . Si Df (
x0 ) es
invertible entonces existen > 0 y m > 0 tales que B (
x0 ) U y
kDf (
x) (
z )k m k
zk
para toda x
B (
x0 ) y para toda z Rn .
Demostraci
on. Por la proposici
on 5.18, dado que Df (
x0 ) es invertible sabemos que existe m > 0
tal que
kDf (
x0 ) (
z )k m k
zk
para toda z Rn .
Por otra parte, como f es de clase C 1 en U (que es un abierto), por la proposici
on 5.17, tomando
= m /2 > 0, sabemos que existe > 0 tal que B (

x0 ) U
kDf (
x) (
z ) Df (
x0 ) (
z )k k
zk
J. P
aez
290
m
2

on inversa
para toda x
B (
x0 ) y para toda z Rn . Por lo tanto, de la desigualdad del tri
angulo tenemos
que
kDf (
x) (
z )k kDf (
x0 ) (
z )k kDf (
x) (
z ) Df (
x0 ) (
z )k
m k
z k k
zk
= k
zk
m
2
m
2
para toda x
B (
x0 ) U y para toda z Rn de tal manera que tomando m = m /2 > 0,
obtenemos el resultado deseado.
Como una consecuencia inmediata de este lema y de la proposici
on 5.18, obtenemos el siguiente
Corolario 5.20 Sea f : U Rn Rn de clase C 1 en U y x
0 U . Si Df (
x0 ) es invertible
entonces existe > 0 tal que B (
x0 ) U y Df (
x) es invertible para toda x
B (
x0 ).
El segundo lema que probaremos tambien es fundamental en la prueba del teorema de la funci
on
inversa, pues a partir de este podremos asegurar que una funcion f es localmente invertible, y que
la funcion inversa que se puede definir, es continua en su dominio. Antes, s
olo recordemos que en el
n
captulo 1 definimos otras normas para los elementos de R , una de ellas llamada la norma infinito
(que utilizaremos en la prueba del siguiente lema), y que est
a definida (y es denotada) como
k
xk := max{|x1 | , . . . , |xn |}
para cada x
= (x1 , . . . , xn ) Rn , y que con relaci
on a la norma euclideana satisface la desigualdad
xk
k
xk n k
la cual es valida para toda x
Rn .
Lema 5.21 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x
0 U . Si Df (
x0 ) es
invertible entonces existen > 0 y m > 0 tales que B (
x0 ) U y
m k
yx
k kf (
y ) f (
x)k
(5.19)
para toda x
, y B (
x0 ).
Demostraci
on. Primero recordemos que si f = (f1 , . . . , fn ) entonces
Df (
x) (
z ) = (f1 (
x) z, , . . . , fn (
x) z)
para cada x
U y cada z Rn .
Como Df (
x0 ) es invertible, por la proposici
on 5.18 sabemos que existe m > 0 tal que
kDf (
x0 ) (
z )k m k
zk
para toda z Rn .
Por otra parte, por la proposici

on 5.17 sabemos que para m /2 n > 0 existe > 0 tal que si
x
B (
x0 ) U entonces
m
kDf (
x) (
z ) Df (
x0 ) (
z )k k
zk
2 n
291
J. P
aez

on inversa
para toda z Rn .
Probaremos que esta > 0 y esta m = m /2 n > 0 son las cantidades para las que se satisface
la desigualdad 5.19, para toda x
, y B (
x0 ) U .
Sean x
, y B (
x0 ) y k {1, . . . , n} tal que kDf (
x0 ) (
yx
)k = |fk (
x0 ) (
yx
)|. Entonces
|fk (
x0 ) (
yx
)| = kDf (
x0 ) (
yx
)k
1
kDf (
x0 ) (
yx
)k
n
Ahora, como B (
x0 ) es un conjunto convexo, sabemos que el segmento
[
x, y] = {
x + t(
yx
) Rn | t [0, 1]}
est
a totalmente contenido en B (
x0 ) U , de tal forma que la funcion k : [0, 1] R R definida
como
k (t) = fk (
x + t(
yx
))
es derivable para toda t [0, 1].

De esta forma, aplicando el teorema del valor medio para funciones de R en R, sabemos que
existe k (0, 1) tal que
fk (
y) fk (
x) = k (1) k (0)
= (1 0) k (k )
= k (k )
= fk (
x + k (
yx
)) (
yx
)
Si recordamos ahora que para x
= (x1 , . . . , xn ) Rn se tiene que |xi | k
xk para toda i
{1, . . . , n}, entonces tambien tenemos que
kf (
y ) f (
x)k |fk (
y ) fk (
x)|
y
|fk (
x) (
yx
) fk (
x0 ) (
yx
)| kDf (
x0 ) (
yx
) Df (
x) (
yx
)k
Con base en las desigualdades anteriores (y la desigualdad del tri

angulo), se tiene que
kf (
y) f (
x)k |fk (
y) fk (
x)|

= (k )
k
= |fk (
x + k (
yx
)) (
yx
)|
|fk (
x0 ) (
yx
)| |fk (
x + k (
yx
)) (
yx
) fk (
x0 ) (
yx
)|
1
x0 ) (
yx
)k kDf (
x + k (
yx
)) (
yx
) Df (
x0 ) (
yx
)k
kDf (
n

m
1
yx
k
yx
k k
m k
n
2 n
m
yx
k
= k
2 n
= m k
yx
k
que es la desigualdad que se deseaba probar.

Como mencionamos anteriormente, de este lema se sigue el siguiente
J. P
aez
292

on inversa
Corolario 5.22 Sea f : U Rn Rn de clase C 1 en el conjunto abierto U , y x

0 U . Si
Df (
x0 ) es invertible entonces existe > 0 tal que B (
x0 ) U , f es inyectiva en B (
x0 ), y adem
as
1
n
n
f : f (B (
x0 )) R R es uniformemente continua en su dominio.
Demostraci
on. Por el lema anterior sabemos que existen > 0 y m > 0 tales que

f x
f (
x) m x
x

para todo x
, x
B (
x0 ) U .
Ahora, si tomamos x
, x
B (
x0 ), con x
6= x
, entonces

f x
f (
x) m x
x

>0
de modo que f (
x ) 6= f (
x) y por lo tanto se tiene que f es inyectiva en B (
x0 ).
Por otra parte, dado > 0, si tomamos = m y y, y f (B (
x0 )) tales que k
y yk < , si
x
, x
B (
x0 ) son tales que y = f (
x ) y y = f (
x), se tiene que
1

f
y f 1 (
y ) = x
x

1
f x
f (
x)
m

1
y y
=
m
1
<
m
=
lo que prueba que f 1 es uniformemente continua (y por tanto continua) en f (B (
x0 )).
Con base en todo el trabajo realizado previamente, ya estamos en condiciones de formular y
probar el teorema de la funci
on inversa.
on inversa) Sea f : U Rn Rn de clase C 1 en el conjunto abierto
U, y x
0 U . Si Df (
x0 ) es invertible entonces existe > 0 tal que:
1. B (
x0 ) U y f es inyectiva en B (
x0 ),
2. f 1 : f (B (
x0 )) Rn Rn es continua en f (B (
x0 )),
3. f (B (
x0 )) Rn es un conjunto abierto, y
4. f 1 es de clase C 1 en f (B (
x0 )) y adem
as, si y = f (
x) f (B (
x0 )) entonces
Df 1 (
y) = Df 1 (f (
x)) = (Df (
x))1
Demostraci
on. Por los lemas 5.19 y 5.21 sabemos que existen > 0 y m > 0 tales que

m x
x
f x
f (
x)
(5.20)
para toda x
, x
B (
x0 ) U , y que
kDf (
x) (
z )k m k
zk
293
(5.21)
J. P
aez

on inversa
para toda x
B (
x0 ) y toda z Rn .
Ahora, por el corolario 5.22 se tiene que f es inyectiva en B (
x0 ) y que f 1 es continua en
f (B (
x0 )), con lo cual se tiene la prueba de los incisos 1. y 2. del enunciado.
Probaremos ahora que f (B (
x0 )) Rn es un conjunto abierto. Sea y = f (
x ) f (B (
x0 )),
con x
B (
x0 ). Como B (
x0 ) es un conjunto abierto, existe > 0 tal que el conjunto

A= x
Rn | x
x

se queda contenido en B (
x0 ). Probaremos que existe r > 0 tal que Br (
y ) f (A) f (B (
x0 )).
Para justificar de manera intuitiva el valor de r que vamos a tomar, observese que si y
Br (
y ) fuera tal que y = f (
x) para alguna x
A, por la desigualdad 5.20 se debera tener que

x
x
= f 1 y f 1 y

1
y y
m
r
<
m
de tal forma que, para no caer en contradicci

on con el supuesto de que x
A, se deber
a elegir r de
tal forma que r/m .
Con base en el razonamiento anterior, tomamos r = m /2 > 0 y y Br (
y ). Para probar que
existe x
A tal que f (
x ) = y , definimos h : U Rn R como

2
h (
x) = f (
x) y

= f (
x) y f (
x) y
Dado que A U es un conjunto cerrado y acotado, y h es continua en U , sabemos que h alcanza

un valor mnimo sobre A, es decir, que existe x
A tal que

f x
y = h x
h (
x)

2
= f (
x) y
para toda x
A. Notese que ahora nuestro objetivo es probar que h (
x ) = 0 pues de este hecho
se concluye que f (
x ) = y .
Ahora, como x
A se tiene que k
x x
k de modo que, aun y cuando h alcanza un valor
mnimo en x
, no podemos asegurar que este sea un punto crtico de h.
Con el fin de probar que x
s es un punto crtico de h, descartaremos la posibilidad de que
k
x x
k = . Si este fuera el caso, por la desigualdad del tri
angulo se tendra que

h x
= f x
y

f x
y y y

= f x
f x
y y

m x
x
y y
> m
m
2
m
2

> y y
=
J. P
aez
294

on inversa

= f x
y

=h x
lo que contradice el hecho de que h (

x ) es el valor mnimo de h sobre A.
De esta forma, se debe tener que k
x x
k < y por tanto x
es un punto crtico de h, es decir
que

Dh x
= 2 f x
y Df x
= 0
y por lo tanto que

f x
y Df x
(
z) = f x
y Df x
(
z)
=0
para toda z Rn .
Si ahora recordamos que Df (
x) es invertible (y por tanto suprayectiva) para toda x
B (
x0 ),
entonces debe existir z0 Rn tal que

Df x
(
z0 ) = f x
y
de tal forma que en particular se tiene que

0= f x
y Df x
(
z0 )

= f x
y f x
y

2

= f x
y
y por lo tanto que f (

x ) = y , lo que prueba que Br (
y ) f (B (
x0 )), es decir que f (B (
x0 )) es
un conjunto abierto.
Para probar el u
ltimo inciso, nuestro primer paso ser
a demostrar que f 1 es derivable en todo
punto y = f (
x ) f (B (
x0 )).
Dado que Df (
x ) es invertible para toda x
B (
x0 ), mostraremos que la funcion lineal
1
L = Df (
x )
satisface la definicion 5.1, es decir que

lim
y
y
f 1 (
y ) f 1 (
y ) L(
y y )
=0
k
y y k
(5.22)
Para ello, recurriremos a la funcion g : B (

x0 ) Rn Rn dada por
x L(f (
x)f (
x ))
si x
6= x
kf (
x)f (
x )k
g (
x) =
0
si x
=x
la cual est
a bien definida puesto que f es inyectiva en la bola B (
x0 ).
Observese que la composici
on g f 1 tambien est
a bien definida sobre el conjunto abierto
f (B (
x0 )) \ {
y } y que

g f 1 (
y ) = g f 1 (
y)
295
J. P
aez

on inversa
f 1 (
y )f 1 (
y )L(
y
y )
k
y
y k
si y 6= y
si y = y
para toda y f (B (
x0 )) \ {
y }.
En virtud de lo anterior, tenemos que
lim
y
y

f 1 (
y ) f 1 (
y ) L(
y y )
= lim g f 1 (
y)
y
y
k
y y k
de tal forma que, como f 1 es continua en y , por el inciso 6. de la proposici

on 2.41 del captulo 2,
bastara probar que g es continua en x
= f 1 (
y ), lo que es equivalente a probar que
x) = lim
lim g (
=
0
x
x
(Df (
x ))1 (f (
x) f (
x ))
kf (
x) f (
x )k
Para probar este u

ltimo lmite, n
otese que
x
x
L(f (
x) f (
x ))
kf (
x) f (
x )k
=
x
x
(Df (
x ))1 (f (
x) f (
x ))
kf (
x) f (
x )k
(Df (
x ))1 [Df (
x ) (
xx
) (f (
x) f (
x ))]
kf (
x) f (
x )k

x) f (
x ) Df (
x ) (
xx
)
k
xx
k
1 f (
Df (
x)
=
kf (
x) f (
x )k
k
xx
k
de tal forma que, como (Df (

x ))1 es una funcion continua (toda funcion lineal es continua) y f
es derivable en x
, se tiene que

x) f (
x ) Df (
x ) (
xx
)
1 f (
lim Df (
x)
x
x
k
xx
k

f (
x) f (
x ) Df (
x ) (
xx
)
1
= Df (
x)
lim
k
xx
k
x
x

1
= Df (
x )
0
=
0
y como por la desigualdad 5.4 sabemos que

k
xx
k
1
kf (
x) f (
x )k
m
para toda x
, x
B (
x0 ), con x
6= x
, concluimos que
x
x
(Df (
x ))1 (f (
x) f (
x ))
x
kf (
x) f (
x )k

x) f (
x ) Df (
x ) (
xx
)
k
xx
k
1 f (
Df (
x)
= lim
x
x kf (
x) f (
x )k
k
xx
k
lim
J. P
aez
296

on inversa
=
0
lo que prueba que f 1 es derivable en y = f (
x ) f (B (
x0 )) y que

Df 1 y = Df 1 f (
x )
1
= Df (
x )
para toda y f (B (
x0 )).
Finalmente probaremos que f 1 es de clase C 1 en f (B (
x0 )) y para ello usaremos el criterio de
la proposici
on 5.17. Antes, observemos que de la desigualdad 5.21 y el hecho de que
Df 1 (f (
x)) = (Df (
x))1
(5.23)

1

Df (f (
x)) (
z ) = (Df (
x))1 (
z )
(5.24)
para toda x
B (
x0 ), se tiene que
1
k
zk
m
para toda z Rn .
Tambien notemos que, si A, B R son diferentes de 0, entonces
1
1
A B
BA
=
AB
1
1
= (B A)
A
B
= A1 (B A) B 1
A1 B 1 =
es decir que
A1 B 1 = A1 (B A) B 1
Ahora observe que esta u
ltima identidad sigue siendo valida si A y B son matrices de n n
invertibles, de modo que si L1 , L2 : Rn Rn son funciones lineales que tienen inversa, entonces se
cumple que
1
1
1
L1
1 L2 = L1 [L2 L1 ] L2
De esta u
ltima identidad, y usando 5.23 para x
, x B (
x0 ), se deduce que

1
Df 1 (f (
x)) Df 1 f (
x ) = (Df (
x))1 Df (
x )

1
= (Df (
x))1 Df (
x ) Df (
x) Df (
x )

= Df 1 (f (
x)) Df x
Df (
x) Df 1 f (
x )
y por la desigualdad 5.24, se tiene que

1

Df (f (
x)) (
z ) Df 1 f (
x ) (
z ) = Df 1 (f (
x)) Df x
Df (
x) Df 1 f (
x ) (
z )
1

= Df (f (
x)) Df x
Df (
x) Df 1 f (
x ) (
z)

1
Df x
Df (
x) Df 1 f (
x ) (
z)
(5.25)
m
297
J. P
aez

on inversa
para todas x
, x
B (
x0 ) y toda z Rn .
Una vez dicho lo anterior, sean y = f (
x ) f (B (
x0 )) y > 0. Como f es de clase C 1 en
B (
x0 ), por la proposici
on 5.17 ( = ), y el hecho de que B (
x0 ) es un abierto, sabemos que existe
x ) entonces
x ) B (
x0 ), y que si x
B (
> 0 con las propiedades de que B (

Df x
Df (
x) (
z ) m2 k
zk
(5.26)
para toda z Rn .
Por tanto, como f 1 es continua en f (B (
x0 )) (que ya probamos que es un conjunto abierto),
y ) entonces
y ) f (B (
x0 )) y que si y = f (
x) B (
sabemos que existe > 0 tal que B (
1

f (
y ) f 1 y = x
x

<
Por lo tanto, aplicando las desigualdades 5.25, 5.26 y 5.24, concluimos que
1
1

Df (
y ) (
z ) Df 1 y (
z ) = Df (f (
x)) (
z ) Df 1 f (
x ) (
z )

1
Df x
Df (
x) Df 1 f (
x ) (
z)
m

1
m2 Df 1 f (
x ) (
z )
m

= m Df 1 f (
x ) (
z )

1
k
zk
m
m
= k
zk
para toda z Rn , de tal forma que nuevamente por la proposici
on 5.17 ( = ) tenemos que f 1
1
es de clase C en f (B (
x0 )), con lo cual terminamos la prueba.
on inversa es un resultado de caracter teorico muy importante, pero
tambien lo es desde un punto de vista pr
actico.
Como prueba de ello, mostraremos como se emplea en el siguiente problema de cambio de
coordenadas: si una funci
on f de R3 en R est
a dada en terminos de coordenadas esfericas, nuestro
problema ser
a encontrar la expresi
on de su derivada en terminos de las coordenadas cartesianas,
sin necesidad de escribir a f en terminos de estas u
ltimas.
Ejemplo 5.24 Sea g : R3 R3 definida como
g (, , ) = ( sen() cos(), sen() sen(), cos())
a de acuerdo, esta funci
on es la funcion de cambio de coordenadas esfericas a coordenadas cartesianas para puntos de R3 .
Tambien podemos concluir con toda certeza que g es de clase C k en R3 para toda k N, y por
lo tanto derivable en todo punto de R3 , con
sen() cos() sen() sen() cos() cos()

Dg (, , ) = sen() sen() sen() cos() cos() sen()
cos()
0
sen()
Si ahora observamos que
det (Dg (, , )) = 2 sen()

J. P
aez
298

on inversa
tendremos que Dg (, , ) es invertible para toda (, , ) R3 , si 6= 0 y 6= k, con k Z.

De esta forma, el teorema de la funci
on inversa nos asegura que, si (0 , 0 , 0 ) R3 es tal que
0 6= 0 y k < 0 < (k + 1) para alguna k Z entonces existe > 0 tal que la funci
on g es
inyectiva en la bola B (0 , 0 , 0 ), que la funci
on g 1 est
a definida en el abierto g (B (0 , 0 , 0 ))
y que
Dg1 (g(, , )) = (Dg (, , ))1
2 sen2 () cos()
2 sen2 () sen()
2 sen() cos()
1
sen()
cos()
0
= 2
sen()
2
sen() cos() cos() sen() cos() sen()
sen ()
sen() cos()
sen() sen()
cos()
sen()
cos()
sen()
0
=
sen()
1
1
1
cos() cos() cos() sen() sen()
para toda (x, y, z) = g (, , ) g (B (0 , 0 , 0 )).

Dado que g es la funci
on de cambio de coordenadas esfericas a coordenadas cartesianas, entonces
1
g ser
a la funci
on de cambio de coordenadas cartesianas a coordenadas esfericas, funci
on que no
es tan sencilla de calcular explcitamente.
Pero aun y cuando no tengamos una expresi
on explcita para g 1 , el hecho de que tengamos
una expresi
on para su derivada nos resulta de mucha ayuda.
En efecto, si f : U R3 R es una funci
on de clase C 1 la cual est
a dada en terminos de
coordenadas esfericas, de la misma forma que hicimos en la subsecci
on 5.3.1 con la funci
on de
cambio de coordenadas polares a cartesianas, podemos asumir que la funci
on f g 1 es la misma
funci
on f s
olo que expresada en terminos de coordenadas cartesianas.
Por tanto, recurriendo nuevamente a la regla de la cadena, tendremos que

D f g1 (
x) = Df g 1 (
x) Dg1 (
x)
y cometiendo el mismo abuso de notaci

on al escribir que g 1 (
x) = x
, y por tanto que f g 1 = f ,
de la identidad anterior obtenemos que las derivadas parciales de f con respecto a las variables
cartesianas x, y y z estar
an dadas por
f
sen() f
1
f
f
(
x) = sen() cos()
(
x)
(
x) + cos() cos()
(
x)
x
sen()
f
cos() f
1
f
f
(
x) = sen() sen()
(
x) +
(
x) + cos() sen()
(
x)
y
sen()
f
f
1
f
(
x) = cos()
(
x) sen()
(
x)
z
Insistimos de nuevo en que, la forma correcta de escribir la identidad anterior en terminos de

las coordenadas cartesianas de x
, es la siguiente:

f g1
(x, y, z)
x

1

f 1
f 1
sen() f 1
= sen() cos()
g (x, y, z)
g (x, y, z) + cos() cos()
g (x, y, z)
sen()
299
J. P
aez

on inversa

f
sen()
f
1
1
g
g
(x, y, z)
(x, y, z)
= sen() cos()
sen()

1
f
1
+ cos() cos()
g
(x, y, z)

f g1
(x, y, z)
y

1

f 1
cos() f 1
f 1
g (x, y, z) +
g (x, y, z) + cos() sen()
g (x, y, z)
= sen() sen()
sen()

f
f
cos()
= sen() sen()
g1 (x, y, z) +
g1 (x, y, z)
sen()

1
f
+ cos() sen()
g 1 (x, y, z)

f g 1
f
f
1
1
1
(x, y, z) = cos()
g
g
(x, y, z) sen()
(x, y, z)
z
N
otese que las identidades anteriores tambien se pueden escribir en terminos de las coordenadas
esfericas, que son de las que depende la funci
on f .
En efecto, si recordamos que (x, y, z) = g (, , ), de las identidades anteriores se obtiene que
f
(, , )
x

f g1
:=
(g (, , ))
x
f
sen() f
1
f
= sen() cos()
(, , )
(, , ) + cos() cos()
(, , )
sen()
f
(, , )
y

f g1
:=
(g (, , ))
y
cos() f
1
f
f
(, , ) +
(, , ) + cos() sen()
(, , )
= sen() sen()
sen()
y

f g1
f
(, , ) :=
(g (, , ))
z
z
f
1
f
= cos()
(, , ) sen()
(, , )
Como mencionamos en la secci

on anterior, con base en el teorema de la funcion inversa podemos
dar la prueba del teorema de la funci
on implcita, y lo m
as interesante es que tambien podemos
hacer lo recproco, es decir, probar el teorema de la funci
on inversa a partir del teorema de la funci
on
implcita (lo que el lector har
a en el problema 25). Este hecho muestra que ambos teoremas son
equivalentes, raz
on por la cual es suficiente con dar la prueba de s
olo uno de ellos.
J. P
aez
300

on inversa

on implcita) Sean g1 , . . . , gm : U Rm Rk R de clase C 1 en
U . Si
n
o
S = (
x, y) = (x1 , . . . , xm , y1 , . . . , yk ) Rm Rk | gi (
x, y) = 0 para i {1, . . . , m}
y (
x0 , y0 ) =
(0)
(0) (0)
(0)
x1 , . . . , xm , y 1 , . . . , y k
g1
x1
gm
x1
S es tal que la matriz

g1
xm
..
.
(
x0 , y0 )
(
x0 , y0 )
..
.
gm
xm
(
x0 , y0 )
..
.
(
x0 , y0 )
es invertible entonces existen r > 0 y h : Br (

y0 ) Rk Rm de clase C 1 en Br (
y0 ) tales que
h (
y0 ) = x
0 y (h (
y0 ).
Demostraci
on. Definamos g : U Rm Rk Rm como
g (
x, y) = (g1 (
x, y) , . . . , gm (
x, y))
y f : U Rm Rk Rm Rk como
f (
x, y) = (g (
x, y) , y)
Es inmediato que f y g son de clase C 1 en U y que adem
as:

1. como (
x0 , y0 ) S entonces f (
x0 , y0 ) = (g (
x0 , y0 ) , y0 ) = 0, y0 , y
2. la matriz
Df (
x0 , y0 ) =
g1
x1
(
x0 , y0 )
..
..
.
.
gm
x0 , y0 )
x1 (
0
..
..
.
.
0
g1
xm
gm
xm
(
x0 , y0 )
..
.
(
x0 , y0 )
0
..
.
0
g1
y1
(
x0 , y0 )
..
..
.
.
gm
x0 , y0 )
y1 (
1
..
..
.
.
0
g1
yk
(
x0 , y0 )
..
.
gm
x0 , y0 )
yk (
0
..
.
1
es invertible.
Por tanto, por el teorema de la funcion inversa sabemos que existe > 0 tal que:

1. f es inyectiva en B (
x0 , y0 ) = (
x, y) Rm Rk | k(
x, y) (
x0 , y0 )k < r U ,
2. f (B (
x0 , y0 )) Rm Rk es un conjunto abierto, y
3. f 1 : f (B (
x0 , y0 )) Rm Rk es de clase C 1 en f (B (
x0 , y0 )).
De esta forma, como
x0 , y0 ) f (B (
x0 , y0 ))
0, y0 = f (

x0 , y0 )). Notese que, si
0, y0 f (B (
existe r > 0 tal que Br
n
o
y Br (
y0 ) = y Rk | k
y y0 k < r
301
J. P
aez
5.6. Problemas

1
entonces 0, y Br
0, y0 . De esta manera, si f 1 = f11 , . . . , fm+k
, definimos
h : Br (
y0 ) Rk Rm
como

1
h (
y ) = f11 0, y , . . . , fm
0, y

x0 , y0 )), se sigue inmediatamente
Dado que f 1 tambien es de clase C 1 en Br 0, y0 f (B (
que h es de clase C 1 en Br (
y0 ).
Ahora mostraremos que (h (
y0 ). Para ello, n
otese que para toda
y Br (
y0 ) se tiene que

0, y = f f 1
0, y

1

1
0, y , . . . , f 1 0, y
= f f11
0, y , . . . , fm
0, y , fm+1
m+k

1
1
0, y
0, y , . . . , fm+k
= f h (
y ) , fm+1

1

1
0, y , . . . , f 1 0, y
0, y , . . . , f 1 0, y , fm+1
= g h (
y ) , fm+1
m+k
de modo que
y
es decir que
m+k

1
0, y , . . . , f 1 0, y
0 = g h (
y) , fm+1
m+k

1
0, y , . . . , f 1 0, y
y = fm+1
m+k

1
0, y , . . . , f 1 0, y
g (h (
y ) , y) = g h (
y ) , fm+1
m+k
=
0
lo que significa que (h (
y) , y) S para toda y Br (
y0 ), que es lo que nos restaba probar.
Con esta prueba concluimos esta secci
on, este captulo y este texto!
5.6
Problemas
1. Sea f : U R2 R derivable en cada punto x

U . Pruebe que:
(a) la gr
afica de f (Gf ) es una superficie suave en todos sus puntos
(b) si x
0 = (x0 , y0 , f (x0 , y0 )) Gf , el plano tangente a Gf en x
0 calculado de acuerdo con
la definicion 4.18 es el mismo que se obtiene si se calcula de acuerdo con la definicion 5.4
2. Calcule una ecuaci
on cartesiana del plano tangente en un punto, de una superficie que est
a
2
3
parametrizada por una funci
on : U R R (definicion 5.4).
3. Pruebe que la proposici
on 5.6 es independiente de las funciones coordenadas de f que se
tomen.
4. Sea f : U Rn Rm derivable en el punto x
0 U . Pruebe que existen r > 0 y M > 0 tales
que
kf (
x) f (
x0 )k
M
k
xx
0 k
para toda x
(Br (
x0 ) \ {
x0 }) U .
J. P
aez
302
5.6. Problemas
5. Sean f : U Rn Rm , g : V Rm R y x
0 U tales que f (U ) V . Definimos
: U Rn Rk como
g(f (
x))g(f (
x0 ))Dg(f (
x0 ))(f (
x )f (
x0 ))
si f (
x) f (
x0 ) 6= 0
kf (
x)f (
x0 )k
(
x) =
0
si f (
x) f (
x0 ) = 0
Pruebe que, si f es continua en x
0 y g es derivable en y0 = f (
x0 ) entonces es continua en
x
0 .
6. Sean f : U Rn R y g : U Rn Rm derivables en el punto x

0 U . Pruebe que la
funci
on (f g)(
x) = f (
x) g(
x) es derivable en x
0 U y de una formula para la D(f g)(
x0 ).

7. Si A = a11 a12 a13 M13 (R) y
b11
B = b21
b31
b1n
b2n M3n (R)
b3n
definimos el producto cruz de la matriz A por la matriz B (que denotaremos por AB), como
la matriz de 3 n (con entradas reales) cuyas entradas de su jesima columna coinciden con
las coordenadas del vector
(a11 , a12 , a13 ) (b1j , b2j , b3j ) = (a12 b3j a13 b2j , a13 b1j a11 b3j , a11 b2j a12 b1j )
es decir que
a12 b31 a13 b21

A B := a13 b11 a11 b31
a11 b21 a12 b11
a12 b3n a13 b2n

a13 b1n a11 b3n M3n (R)
a11 b2n a12 b1n
Sean f = (f1 , f2 , f3 ), g = (g1 , g2 , g3 ) : U Rn R3 derivables en el punto x

0 U . Pruebe
que la funci
on (f g)(
x) := f (
x) g(
x) es derivable en x
0 U y de una formula para la
D(f g)(
x0 ) en terminos del producto cruz de matrices definido en el p
arrafo anterior.
8. Encuentre todas las funciones f : Rn Rn tales que Df (
x) es una matriz diagonal para toda
x
Rn . Pruebe su respuesta.
9. Abusar de la notaci
on (como de cualquier otra cosa) suele causar problemas. En particular,
usar letras (que casi siempre denotan variables) para referirse tambien a funciones nos puede
llevar a errores. Sea w = f (x, y, z) y z = g(x, y). Por la regla de la cadena, se tiene que:
w x w y
w z
w
=
+
+
x
x x
y x
z x
Como x y y son variables independientes, entonces
y
x
= 0 y como
x
x
= 1, se tiene que:
w w z
w
=
+
x
x
z x
z
As, w
z x = 0. Si f (x, y, z) = 2x + y + 3z y g(x, y) = 5x + 18, entonces
por lo tanto 0 = 15. Cu
al es el error?
303
w
z
=3y
z
x
=5y
J. P
aez
5.6. Problemas
10. Sean f y gp
definidas como f (u, v) = (u cos(v), u sen(v)) con 0 < u < y /2 < v < /2; y
g(x, y) = ( x2 + y 2 , arctan(y/x)) con 0 < x < . Calcule D(f g)(x, y) y D(g f )(u, v).
11. (a) Suponga que la variable w est
a en funcion de las variables x, y, z y t (es decir: w =
f (x, y, z, t)), que x = g(u, z, t) y que z = h(u, t). Tomando en cuenta todas estas
relaciones, calcule w
t
(b) si
f (x, y, z, t) = 2xy + 3z + t2
g(u, z, t) = ut sen(z)
h(u, t) = 2u + t
calcule
w
t
para u = 1, t = 2 y y = 3
12. Suponga que f : R2 R es tal que

2f
xy (2, 1)
=1y
2f
(2, 1)
y 2
f
x (2, 1)
f
f
= 3, f
y (2, 1) = 2, x2 (2, 1) = 0, yx (2, 1) =
= 2. Si g(u, v) = (u2 + v, uv) calcule
2 (f g)
vu (1, 1).
13. Sea f : U R2 R de clase C 2 en U tal que f

x (x, y) > 0 para toda (x, y) U , y sea
(x0 , y0 ) U . Si I = {y R |(x0 , y) U }, definimos g : I R R como g(y) = f (x0 , y).
Pruebe que:
(a) existe > 0 y h : (y0 , y0 + ) I R de clase C 1 tal que f (h(y), y) = f (x0 , y0 ) para
toda y (y0 , y0 + )
(b) g tiene un m
aximo (mnimo) local en y0 si y s
olo si h tiene un mnimo (m
aximo) lo2f
cal en y0 . (suponga que y2 (x0 , y0 ) 6= 0, para que todo sea mas facil). Interprete
geometricamente.
14. Sean f, g : U R2 R de clase C 1 en A. Definimos F : U R2 R2 y H : U R2 R
como
F (x, y) = (f (x, y), g(x, y))
y
H(x, y) = kF (x, y)k2
Demuestre que no existe x
0 U que satisfaga las siguientes dos propiedades:
(a) H tiene un m
aximo local en x
0
(b) DF (
x0 ) es invertible
15. Sea f : Rn Rn derivable en un punto x

0 Rn y adem
as supongase que x
0 es un punto fijo
de f (es decir: f (
x0 ) = x
0 ). Si A denota a la matriz Df (
x0 ) y k N, encuentre una funci
on
n
n
k
g : R R derivable en x
0 tal que Dg(
x0 ) = A .
16. Sea f : U R3 R una funci
on que est
a expresada en terminos de las coordenadas cartesianas (x, y, z) de cada punto x
U . Use la funcion de cambio de coordenadas cilndricas
(, , z) a coordenadas cartesianas (x, y, z), y la regla de la cadena, para encontrar (en cada
punto x
U ) una base ortonormal de R3 en la cual se pueda expresar a la derivada de f en
f
f
x
(Df (
x)) en terminos de las derivadas parciales f
, y z . Compare con lo obtenido en
el problema 15 del captulo 4.
17. Repita el problema anterior ahora para las coordenadas esfericas (, , ) y compare con lo
obtenido en el problema 16 del captulo 4.
J. P
aez
304
5.6. Problemas
18. Sean g1 , . . . , gm : U Rm Rk R, S y (
x0 , y0 ) S como
implcita. Si
g1
g1
(
x0 , y0 )
x0 , y0 ) x
x1 (
m
.
..
.
..
..
A=
.
gm
x0 , y0 )
x1 (
gm
x0 , y0 )
xm (
.
..
..
B=
.
gm
x0 , y0 )
y1 (
g1
x0 , y0 )
yk (
pruebe que:
g1
x0 , y0 )
y1 (
en el teorema de la funci
on
..
.
gm
x0 , y0 )
yk (
Dh(
y0 ) = A1 B
donde h es la funci
on cuya existencia es garantizada en el mencionado teorema.
19. Sea f : U Rn R de clase C 1 en U y S = {
x U | f (
x) = cte}. Si x
Rn , denotamos
(i)
n1
por x
el elemento de R
que se obtiene de x
al eliminarle su iesima coordenada, con
(1)
(n)
i {1, . . . , n}. Sea x
0 = (x0 , . . . , x0 ) S.
f
x0 ) 6= 0
xi (
(i)
(i)
Ui , hi (
x0 ) = x0
(a) pruebe que, si

(i)
x
0
entonces existe hi : Ui Rn1 R de clase C 1 en Ui tal que

y
(x1 , . . . , xi1 , hi (x1 , . . . , xi1 , xi+1 , . . . , xn ), xi+1 , . . . , xn ) S

para todo (x1 , . . . , xi1 , xi+1 , . . . , xn ) Ui
(b) si hi es la funci
on del inciso anterior, calcule
en terminos de derivadas parciales de f
(c) si
f
x0 )
xi (
(i)
hi
x0 )
xi+1 (
(para i = n calcule
(n)
hn
x0 ))
x1 (
6= 0 para cada i {1, . . . , n}, pruebe que

h1 (1) h2 (2)
hn1 ((n1)) hn (n)
(
x0 )
(
x0 )
(
x0
)
(
x
) = (1)n
x2
x3
xn
x1 0
g
(
x0 ) 6= 0. Si v 6=
0
20. Sea g : U Rn R de clase C 1 (en U ) y x
0 U tal que g(
x0 ) = 0 y x
n
es tal que v g(
x0 ) = 0, pruebe que existen > 0 y : (, ) R Rn derivable tal que
g((t)) = 0 para toda t (, ), (0) = x
0 y (0) = v. Interprete geometricamente.
x0 ) = 0 y
21. Sea g : U R3 R de clase C 1 (en U ) y x
0 = (x0 , y0 , z0 ) U tal que g(
Pruebe que:
g
x0 )
z (
6= 0.
(a) existe V R2 abierto, y : V R2 R3 de clase C 1 en V , tales que (x0 , y0 ) V y

g((x, y)) = 0 para toda (x, y) V . Interprete geometricamente
(b) el plano tangente al conjunto de nivel 0 de g (N0 (g)) calculado usando la parametrizacion
del inciso anterior, es el mismo si se calcula usando la definicion 4.32
22. Sean g1 , g2 : U R3 R de clase C 1 (en U ) y x

0 = (x0 , y0 , z0 ) U tales que g1 (
x0 ) =
g2 (
x0 ) = 0 y g1 (
x0 ) g2 (
x0 ) 6= 0. Pruebe que:
(a) existe > 0 y : (, ) R Rn derivable tal que g1 ((t)) = g1 ((t)) = 0 para toda
t (, ), (0) = x
0 y (0) 6= 0
305
J. P
aez
5.6. Problemas
(b) la recta tangente en el punto (0) a la curva descrita por , es la misma recta que se
obtiene al intersectar al plano tangente en el punto x
0 del conjunto de nivel 0 de la
funci
on g1 , con el plano tangente en el punto x
0 del conjunto de nivel 0 de la funcion g2 .
Interprete geometricamente
23. Considere el conjunto de soluciones de las ecuaciones:
2x + y + 2z + u v 1 = 0
xy + z u + 2v 1 = 0
yz + xz + u2 + v = 0
(a) Muestre que, en una vecindad del punto (1, 1, 1, 1, 1), las variables x, y y z (del conjunto
de soluciones) se pueden poner en funcion de las variables u y v.
(b) Calcule la derivada de la funcion del inciso anterior en el punto (1, 1).
(c) Encuentre todas la ternas de variables que se puedan poner en funcion de las restantes
dos, en una vecindad del mismo punto.
24. Sea
f (x) =
2
x sen(1/x) +
x
2
si x 6= 0
si x = 0
(a) calcule f (x) para toda x R
(b) pruebe que para toda > 0 existen x, y (, ) tales que f (x) < 0 y f (y) > 0
(c) pruebe que f no es invertible en ninguna vecindad del cero. Este ejemplo contradice el
Teorema de la Funci
on Inversa?
25. Pruebe el teorema de la funci

on inversa a partir del teorema de la funcion implcita.
26. Sean f : Rn Rn de clase C 1 y c > 0 tales que para toda x
, y Rn se tiene que
kf (
x) f (
y)k c k
x yk
Pruebe que:
(a) para toda x
Rn , Df (
x) es invertible
(b) f (Rn ) es abierto
(c) f (Rn ) es cerrado

(d) f es biyectiva y f 1 : Rn Rn es de clase C 1 (en Rn )
27. Sea g = (g1 , . . . , gm ) : A Rn Rm de clase C 1 (en A) con n > m. Sea x
0 A tal que
g(
x0 ) = 0.
(a) Si la matriz
g1
x0 )
x1 (
.
..
..
M =
.
gm
x0 )
x1 (
J. P
aez
306
g1
x0 )
xm (
..
.
gm
x0 )
xm (
5.6. Problemas
es de rango m, pruebe que existen U, V Rn abiertos y f : U V una biyeccion de clase

C 1 en U (y f 1 de clase C 1 en V ) tales que x
0 V A y g(f (x1 , . . . , xn )) = (x1 , . . . , xm )
para todo (x1 , . . . , xn ) U
(b) Describa a el conjunto (g f )1 (0)
(c) Con que teorema coincide el resultado del inciso anterior cuando n = m?
(d) Use el primer inciso para demostrar que si Dg(

x0 ) tiene rango m
aximo (m) entonces
Dg(
x) tiene rango m
aximo para x
en una vecindad de x
0
(e) Si Dg(
x0 ) no tiene rango m
aximo (es decir, si el rango de Dg(
x0 ) es k < m) se sigue
cumpliendo un resultado an
alogo al del primer inciso? al del cuarto inciso? (es decir,
si Dg(
x0 ) tiene rango k < m existe una vecindad de x
0 en la que Dg sigue teniendo
rango k?). Pruebe sus respuestas
(f) Interprete geometricamente
28. Sea g : U Rn Rm de clase C 1 (en U ) con n > m. Pruebe que g no es inyectiva.
29. Sea f : U Rn Rm de clase C 1 (en U ) con n < m.

(0)
(0)
U es tal que Df (
x0 ) tiene rango n (como matriz de m
(a) Si x
0 = x1 , . . . , xn
, V Rm abiertos y h : U
V una biyeccion de clase C 1
n) pruebe que existen U

(y h1 de clase C 1 en V ) tales que x(0) , . . . , x(0)
y
en U
x0 ) U
n , 0, . . . , 0 V , f (
1
) tal que
h(f (x1 , . . . , xn )) = (x1 , . . . , xn , 0, . . . , 0) Rm para todo (x1 , . . . , xn ) f 1 (U
(x1 , . . . , xn , 0, . . . , 0) V
(b) Con que teorema coincide el resultado del inciso anterior cuando n = m?
(c) Use el primer inciso para demostrar que si Df (

x0 ) tiene rango m
aximo (n) entonces
Df (
x) tiene rango m
aximo para x
en una vecindad de x
0
(d) Si Df (
x0 ) no tiene rango m
aximo (es decir, si el rango de Df (
x0 ) es k < n) se sigue
cumpliendo un resultado equivalente al del primer inciso? al del tercer inciso? (es decir,
si Df (
x0 ) tiene rango k < n existe una vecindad de x
0 en la que Df sigue teniendo
rango k?). Pruebe sus respuestas
(e) Interprete geometricamente
30. Sea f (x, y) = (ex cos(y), ex sen(y)).
(a) Pruebe que f no es inyectiva en R2
(b) Pruebe que para cualquier x
= (x, y) R2 existe > 0 tal que f es invertible en B (
x)
(c) Existe una funci

on de R en R que tenga las dos propiedades anteriores? Pruebe su
respuesta
31. Sean f, g : U R3 R de clase C 1 en U . Pruebe que la funcion

F (x, y, z) = (f (x, y, z), g(x, y, z), f (x, y, z) + g(x, y, z))
es tal que, si tuviera inversa en alguna vecindad de alg
un punto de U , esta no sera derivable.
32. Sea f : U Rn Rn de clase C 1 (en U ) y A U . Pruebe que, si det(Df (
x)) 6= 0 para toda
x
int(A) entonces f (int(A)) int(f (A)).
307
J. P
aez
5.6. Problemas
33. Sea f : U R3 R de clase C 2 en U . Si f est

a expresada en terminos de coordenadas
2
x) en terminos de estas mismas coordenadas (sugerencia: proceda como
esfericas, calcule zf2 (
en el ejemplo 5.24).
J. P
aez
308
Bibliografa
[1] Spivak, Michael, Calculus, 3a. edici
on. Editorial Reverte, Barcelona, 2012. 682 pp.
[2] Friedberg, Stephen H., Insen, Arnold J., Spence, Lawrence E. Linear algebra, 4th ed. PHI
Learning, New Delhi, 2013. 601 pp.
[3] Swokowski, Earl William, C
alculo con geometra analtica, 2a. edici
on. Grupo Editorial
Iberoamerica, Mexico, 1998. 1097 pp.
309
Indice de Materias
acumulaci
on
punto de, 27
afn
funcion, 167
aislado
punto, 27
arco
longitud de, 126
parametrizacion por longitud de, 127
base
can
onica, 150
ortonormal, 150
bola
con centro en un punto en Rn , 19
Bolzano-Weierstrass
teorema de, 30
cadena
regla de la, 121, 160, 190, 192, 267
Cauchy
criterio de convergencia de, 73
Cauchy-Schwarz
desigualdad de, 14
cerradura
de un conjunto, 26
cicloide, 113
cilndricas
coordenadas, 47
circunferencia
osculadora, 132
coeficiente multinomial, 250
compacto
conjunto, 95
conexo
conjunto, 36
conjunto
abierto, 19, 23
acotado, 30
cerrado, 23
cerradura de un, 26
compacto, 95
conexo, 36
convexo, 37
de nivel, 62
disconexo, 35
estrellado, 58
exterior, 21
frontera, 21
imagen directa de un, 64
imagen inversa de un, 64
interior, 21
parametrizacion de un, 110
conjuntos
separados, 35
convexo
conjunto, 37
coordenada
funcion, 59
sucesion, 70
coordenadas, 5
cilndricas, 47
esfericas, 50
polares, 43
cuadrados mnimos
metodo de los, 252
cubierta
abierta, 95
curva, 65
curvatura de una, 131
definicion de, 123
longitud de una, 126
regular, 123
reparametrizacion de una, 127
suave, 123
torsi
on de una curva, 134, 135
curvatura, 131
centro de, 132
radio de, 132
311

Indice de Materias
derivada
de una funci
on de Rn en R, 168
de una funci
on de Rn en Rm , 255
direccional, 156
en coordenadas polares, 203
parcial, 164
cruzada, 207
desigualdad
de Cauchy-Schwarz, 14
de Holder, 253
de Minkowski, 253
direccional
derivada, 156
directa
imagen, 64
disconexo
conjunto, 35
distancia, 8
euclideana, 18
esfericas
coordenadas, 50
euclideana
distancia, 18
norma, 8
evoluta, 133
exterior
de un conjunto, 21
punto, 21
forma cuadratica, 223
no degenerada, 224
seminegativa, 224
semipositiva, 224
formas cuadraticas, 234
Frenet-Serret
formulas de, 136
frontera
de un conjunto, 21
punto, 21
funcion
afn, 167
coordenada, 59
de clase C k , 210
gr
afica de una, 60
mnimo de una, 219
mnimo local de una, 220
m
aximo de una, 219
J. P
aez
Indice de Materias
m
aximo local de una, 220
matriz hessiana de una, 224
funcion
lineal, 105
gr
afica
de una funcion, 60
gradiente
en coordenadas polares, 203
vector, 177
Holder
desigualdad de, 253
hessiana
de una funcion, 224
imagen
directa, 64
inversa, 64
implcita
teorema de la funcion, 272, 283
interior
de un conjunto, 21
punto, 21
inversa
teorema de la funcion, 293
Lagrange
multiplicadores de, 243
teorema de los multiplicadores de, 243
lineal
funcion, 105
longitud
de arco, 126
parametrizacion por, 127
de una curva, 126
mnimo
de una funcion, 219
local
de una funcion, 220
m
aximo
de una funcion, 219
local
de una funcion, 220
matriz
hessiana, 224
jacobiana, 263
ortonormal, 153
312

Indice de Materias
Minkowski
desigualdad de, 253
multiplicadores de Lagrange, 243
prueba del teorema de los, 284
norma
euclideana, 8
infinito, 17
uno, 17
ortonormal
base, 150
matriz, 153
parametrizacion
de un conjunto, 110
de una superficie, 258
por longitud de arco, 127, 128
parcial
derivada, 164
plano
osculador, 131
tangente, 172, 194, 257, 258
polares
coordenadas, 43
poligonal, 39
polinomio
de Taylor, 215
producto
interior, 13
punto, 13
punto
aislado, 27
crtico, 221
de acumulaci
on, 27
exterior, 21
frontera, 21
interior, 21
silla, 222
Indice de Materias
sucesion
acotada, 75
coordenada, 70
en Rn , 70
rango de una, 75
superficie, 65, 258
parametrizacion de una, 258
suave, 258
superficies, 257
tangente
plano, 172, 194, 257, 258
recta, 194
Taylor
polinomio de, 215
Teorema de, 215
teorema
de Bolzano-Weierstrass, 30
de la funcion implcita, 272, 283
prueba del, 300
de la funcion inversa, 293
prueba del, 293
de los multiplicadores de Lagrange, 243
de los rect
angulos anidados, 31
de Taylor, 215
torsi
on
de una curva suave, 134, 135
vecindad
agujerada, 27
de un punto en Rn , 19
vector
binormal unitario, 132
gradiente, 177
normal unitario, 131
tangente unitario, 131
rect
angulos anidados
teorema de los, 31
recta
tangente, 194
recta tangente
a una curva, 115
regla
de la cadena, 121, 160, 190, 192, 267
reparametrizacion, 127
313
J. P
aez

J Paez Calculo III

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

J Paez Calculo III

Hochgeladen von

Copyright:

Verfügbare Formate

Calculo diferencial de varias variables

Javier Paez Cardenas

4.1 Un interludio de Algebra

necesidad de revisar previamente algunos conceptos importantes del Algebra

Para empezar, algunos ejemplos

Como mencionamos en la introducci

1.1. Para empezar, algunos ejemplos

1.1. Para empezar, algunos ejemplos

De esta forma, la funci

1.1. Para empezar, algunos ejemplos

1.2. Estructura algebraica de Rn

aprendera (en su curso de Algebra

1.2. Estructura algebraica de Rn

Figura 1.2: La suma (a) y el producto por un escalar (b) de vectores en R2

y que simplemente expresaremos escribiendo que x

1.2. Estructura algebraica de Rn

1.3. Aspectos geometricos de Rn

Figura 1.4: Construccion geometrica del vector x

Como vimos en la secci

para el caso del plano (R2 ), y por

x21 + x22 + x23

1.3. Aspectos geometricos de Rn

Figura 1.5: La cantidad

(desigualdad del tri

distintos de 0, cual es el escalar R que hace que los vectores x

1.3. Aspectos geometricos de Rn

Supongamos que los vectores x

lo cual, escrito en terminos de las coordenadas de los vectores, se traduce en

la cual tiene las soluciones = 0 y

Es importante observar que la soluci

1.3. Aspectos geometricos de Rn

Figura 1.7: Los vectores x

1.3. Aspectos geometricos de Rn

Figura 1.8: El calculo de usando el angulo

1.3. Aspectos geometricos de Rn

y s tuvieran norma 1 (por cierto que, cuando a un vector x

Esta nueva operaci

1.3. Aspectos geometricos de Rn

la cual, por ahora, s

para cualesquiera par de vectores x

Llamada as en honor del matem

1.3. Aspectos geometricos de Rn

(desigualdad del tri

de modo que, sacando raz cuadrada, llegamos a la desigualdad deseada.

1.4. Otras normas

Como el lector habra notado, todo lo realizado en la secci

1.4. Otras normas

propiedades establecidas en la proposici

(para toda i {1, . . . , n}) entonces x2i k

1.4. Otras normas

k(1, . . . , 1)k k(|x1 | , . . . , |xn |)k

Para la segunda desigualdad, observe que

que es la desigualdad que se deseaba probar.

(desigualdad del tri

Como es de esperarse, la prueba de esta proposici

Figura 1.9: Las bolas de radio r con centro en el origen (en R2 y en R3 )

Como seguramente ya habra notado (y podr

Como es de todos conocido, existe x

Tenemos entonces que (x , y ) A y adem

< (r/ 2)2 + (r/ 2)2

Ahora, escogiendo a x y y como en el caso anterior (siempre que se pueda), si x = 1 y y < 1

y y = 1 a la pareja (1, 1). En todos estos casos, dichas parejas pertenecen a Br (

Conjuntos abiertos y cerrados

Una vez que hemos hecho esta clasificaci