Espacios Vectoriales Complejos y Sus Endomorfismos

December 14, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Espacios Vectoriales Complejos y Sus Endomorfismos...

Description

 

Capítulo 1

Espacios vectoriales complejos y sus endomofismos 1.

¿Po ¿Por qué? qué?

Gran parte de los modelos de sistemas con los que la Física describe la Naturaleza están definidos sobre espacios vectoriales. El motivo es su sencillez y versatilidad, que proporciona interesantes propiedades que resultan muy útiles desde el punto de vista operativo. En este primer capítulo recordaremos la de finición de espacio vectorial dedicando especial atención al caso de los espacios vectoriales complejos, que serán de gran importancia en la modelización de sistemas en Mecánica Cuántica. Pasamos ahora a resumir definiciones propiedades principales de los espacios vectoriales, es de el principallas objetivo de estey capítulo. Estamos particularmente interesados en elque caso los espacios vectoriales construidos sobre números complejos aunque veremos que es un caso que no tiene apenas diferencias respecto a su análogo real.

Recordemos que,   grosso grosso modo , un espacio vectorial es un conjunto donde existe una operación suma para sus elementos (es decir, los vectores pueden sumarse) y existe una operación con un conjunto externo, los escalares, que forman un cuerpo y que pueden ser multiplicados por los vectores, que de esta forma son “escalados”. El hecho de que los escalares sean números complejos, que es la principal diferencia que encontraremos en este caso, no va a determinar grandes diferencias desde el punto de vista formal, pero sí algunas desde el punto de vista operativo. 7

 

8

1 . ES PACI O OS S VEC TO TORI A AL LE S COMPLEJ OS OS Y S US US ENDO NDOM OF OF IS ISM OS OS

Por otro lado, el concepto de endomor fismo va a ser de una importancia fundamental en la representación de las magnitudes físicas en Mecánica Cuántica. La razón es simple: las magnitudes físicas se representarán como transformaciones lineales en el espacio de los estados físicos y los posibles valores obtenidos en un experimento serán los posibles valores que tomarán estas aplicaciones en una base particular. Otra importante aplicación de los endomorfismos será la representación de las transformaciones asociadas a los cambios de base de un sistema físico. Estas transformaciones, tan comunes como rotaciones, traslaciones, cambios de escalar, etc serán también representadas por este concepto algebraico. 2.

Núm Número eross comple complejos jos

Definición de cuerpo numérico.  Recordemos en primer lugar la de finición

2.1.

de cuerpo de números: Definición 1.1.   Denominaremos   cuerpo a cuerpo a todo conjunto  K dotado de dos opera +  (suma) y  · (producto),  ·  (producto), que satisfacen las propiedades  ciones, que denotaremos como  + (suma) que convierten al conjunto en un grupo abeliano con respecto a ellas, es decir: son operacion operaciones es asoci asociativa ativas, s, es deci decir, r, dados tres elemento elementoss cual cualesqui esquiera era K  se cumple:

 ∈

α1 , α2 , α3

α1  + ( α2  + α3 ) = (α1  + α2 ) + α3 ,

 

 ·  (α2  · α3 ) = (α1  · α2 ) · α3 ,   (1) α1  · (

existe un elemento neutro para cada operación, es decir, existen en   K   un elemento elem ento que denotar denotaremos emos como   0   y otro que denotaremos como   como   1   que  satisfacen que: 0 + α  =  α + 0 =  α

  1 · α  =  α · 1 =  α

 

  ∀α ∈ K

(2)

las operaciones son conmutativas, es decir, para cualesquiera dos elementos  α1 , α2 K, se cumple que:

 ∈

α1  + α2   =  α 2  + α1

 

 

α1  · α2  =  α 2  · α1

(3)

 ∈

para cualquier elemento   α  K  existe un elemento que representaremos por  α  tal que sumado a   α  es igual al elemento cero (el elemento neutro para la suma). Diremos que  α  es el   elemento opuesto  opuesto   de   α:



  −− α + ( −α) = (−α) + α  = 0.

 

(4)

Para cualquier elemento   α  excepto para el elemento cero, existirá otro elemento cuyo producto producto con   α   es igual al elemento neutro de la operación producto, es decir: α · α−1 =  α −1 · α  = 1.

 

(5)

inverso   de   α  respecto a la operación proDiremos que   α−1 es el   elemento inverso  ducto. Las dos operaciones están además relacionadas por la propiedad distributiva, es  decir, para cualesquiera tres elementos   α1 , α2 , α3 K  se cumple que 

 ∈

 ·  (α2 + α3 ) =  α 1 · α2 + α1 · α3 α1  · (

 

(6)

En el caso de que consideremos un conjunto con una suma que forme un grupo conmutativo, en la que el producto tenga unicamente la propiedad asociativa (es decir,

 

2. NÚMEROS COMPLEJOS

9

perdemos perdem os el inverso, inverso, el elemento elemento neutro y la propiedad propiedad conmutativ conmutativaa del producto), producto), y mantengamos la propiedad distributiva; la estructura recibirá el nombre de  anillo. 2.2.. El cuerpo 2.2 cuerpo de los los números números compl complejo ejos. s. 2.2.1. Visi 2.2.1. Visión ón gene general. ral.  Los números complejos corresponden a una extensión de

los números reales, que podemos colocar en perspectiva en relación a los restantes conjuntos numéricos que conocemos:

Complejos:   C

    

Reales:   R

   

Imaginarios

Racionales:  Q

Irracionales

  

 

Naturales:   N Enteros:  Z Cero Negativos Fraccionarios

(7) Su propiedad más relevante es el hecho de que es un cuerpo algebraicamente cerrado. Esta propiedad puede presentarse de muchas formas, siendo la más frecuente la conocido francés como Teorema Fundamental el del matemático Jean-Robert Argand):del Álgebra (probado por primera vez por ficientes  Teorema  1.1.  Toda polinomio en una variable de grado   n ∈   N  con coe fi  c  ientes  complejos tiene siempre   n  raíces, si tenemos en cuenta sus multiplicidades. 2.2.2. 2.2. 2.

Algun Algunas as notas notas h histó istórica ricas. s.   Desde un punto de vista histórico, podemos

decir que la primera introducción de los números complejos en la literatura se produjo en el siglo I por Herón de Alejandría, al estudiar el volumen de una sección de pirámide cuadrada cuadra da con una relación de distancias distancias que conducen conducen a una raiz de un número nega√  tivo ( 81 − 144  para ser exactos). Sin embargo es difícil estar seguro de que el error se deba a Herón directamente (resulta curioso dado que en el mundo helenístico no se consideraban esos números como posibles) o de algún copista en época posterior. En Europa, no se conocen nuevas referencias al concepto hasta el siglo XVI. En el siglo XII aparece en la India la obra  Lilavati  del   del matemático y astrónomo Bhaskara (1114-1185) con el tratamiento y soluciones análogas a las que se encontrarán en el siglo XVI en Italia, de los raíces de polinomios de segundo, tercer y cuarto grado.  fl

En Italia, a partir del año 1500 se vasobre a conocer un dos interesante orecimiento del estudio de las matemáticas, centradas todo en nombres: Gerolamo Cardano (1501-1576) y Niccolò Fontana (1499/1500-1557, conocido como Tartaglia, por ser tartamudo). En particular, serán los primeros en encontrar la solución general de la ecuación de tercer grado. En este proceso, encontrarán con frecuencia el problema de manejar las raíces cuadradas de números negativos, y ahora de forma completamente consciente, comenzarán a usarlas de forma habitual. Inicialmente llamados “números   ficticios” por Cardano, René Descartes (1596-1650) introducirá el término número imaginario  para  para designar a estos objetos cuyas propiedades aritméticas fueron detalladas por primera vez por Rafaele Bombelli (ca 1526-1572). Pero la verdadera asimilación de estos objetos por parte de la comunidad matemática no llegará hasta el siglo XIX, madurando lentamente. Inicialmente eran considerados meras soluciones extrañas, necesarias para una caracterización de las raíces de los polinomios de segundo, tercer y cuarto grado. Poco a poco fueron estudiándose

 

10

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

sus relaciones en la función exponencial y el logaritmo. Podemos considerar el culmen de esta época los trabajos de Leonhard Leonhard Euler (1707-178 (1707-1783), 3), introduciendo introduciendo la relación relación que lleva su nombre para la representación de la exponencial de un número imaginario y su relación con las funciones trigonométricas: e i φ = cos φ + i senφ.

 

(8)

Fue también Euler quien introdujo la notación  i  para representar la unidad imaginaria, aunque fue Gauss quien popularizó su uso. Pero sin duda son los trabajos de Caspar Wessel (1745-1818), Jean-Robert Argand (1768-1822) y Karl Friedrich Gauss (1777-1855) los que conforman la época madura. Gauss acuñó el término   número complejo  para representar los objetos, y comenzó a usar la representación a +  i b,

aunque solamente en los casos en que   a, b   ∈ ∈   Q. En esta época se introduce la representación del plano complejo que seguimos manejando en la actualidad. Argand además publica la primera demostración rigurosa del teorema fundamental del Álgebra  visto más arriba), que definitivamente da sentido propio al cuerpo y (el Teorema 1.1 Teorema  1.1 visto una entidad fundamental en el mundo matemático. El mismo resultado fue también desarrollado por Gauss, mientras Wessel desarrollaba paralelamente la representación del plano complejo. Pero serán sobre todo Augustin Louis Cauchy (1789-1857), Niels Henrik Abel (1802-1829) y Bernhard Riemann (1826-1866) los que con sus trabajos sobre el análisis complejo, es decir, la rama de las matemáticas que se ocupa de las propiedades de las funciones de variable compleja, den una forma definitiva al área. El proceso de extensión de los números reales a los complejos, es decir, ver un número complejo como un par de números reales con las relaciones adecuadas, se conoce como la construcción de Cayley-Dickinson. Pueden construirse conjuntos más generales que los números complejos, apareciendo así dos nuevos conjuntos como son los  cuaterniones  (bautizados por Hamilton en 1843 y que se suelen representar por el símbolo   H) y los  octoniones, introducidos como  octaves  por John T. Graves (1806-1870) y bautizados forma independiente por Arthur Cayley (1821-1895), en 1845. Se suelen representardepor el símbolo   O. 2.2.3. 2.2. 3. Brev Brevee resume resumen n de las propiedades propiedades de los números números complej complejos. os.   Resumiremos a continuación las propiedades fundamentales que emplearemos a lo largo de este tema y del resto de temas de curso sobre números complejos. Para una exposición más didáctica y fundamentada, recomendamos acudir a cualquier libro de texto sobre análisis complejo. Para la representación de un número complejo emplearemos un punto del plano complejo, que será identificado por dos números reales, bien su parte real e imaginaria, bien su módulo y su fase: •  su parte real   x  y su parte imaginaria   y 

  ∈∈ C �→ z   = x  +  i y



 ∈

x, y   R

 

(9)

 

2. NÚMEROS COMPLEJOS

11

•  o en la representación polar, especi ficando su modulo   |z | φz   ( π , π]: z  C  z   =  | z |e i φz 

 ∈ −

 ∈   R  y su fase

(10) las operaciones de suma y producto se pueden escribir de forma simple en una de las representaciones:

  ∈∈ �→

z 1  +  z 2  = (x 1  +  x 2 ) +  i ( y 1  +  y 2 ) z 1  ·  z 2   =  | z 1 ||z 2 |e i (φz 1 +φz 2 )

  ∈∈ C ⇒ −z   = (−x ) + i (− y ) =0 if  z   z   z 1 , z 2 ∈ C ⇒  z −1 =  | z |−1 e −  

z , w 

i φz 

  (11)   (12)

En cambio, la otra operación resulta relativamente complicada: (z 1 +z 2 ) =

  |z  |sinφz 1 +|z 2 |sinφz 2 z 1 +|z 2 |cosφz 2 1

i ∗arctan |z  1|cosφ

 + | |z 2 |sinφz  )2 e  (|z 1 |sinφz   +  +  |z 2 |cosφz  )2 + (| (|z 1 |cosφz   + |

� 

1

1

2

2

(13) z 1  ·  z 2   = (x 1 x 2 − y 1 y 2 ) +  i (x 1 y 2  +  x 2 y 1 )   (14) Existe una operación característica en el conjunto de los números complejos, que denominamos  conjugación compleja. Desde un punto de vista gráfico, se reduce a la reflexión del número complejo respecto al eje de abscisas.

Desde un punto de vista algebraico, la conjugación asocia a un número complejo dado   z    =   x   +  i y , el número complejo con igual parte real y parte imaginaria opuesta es decir:

 � �→  z z¯   = x   −− i y 

 +  i y   =  z  x  +

 

(15)

 

12

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

Desde un punto de vista axiomático, podemos resumir entonces lo expuesto en la sección en el resultado siguiente: fi

  C  es un conjunto numénicióncomo conjunto de de los los números complejos   1.2.  El rico,De obtenido una extensión números reales, de los que mantienen las  estructuras de cuerpo y satisfacen las condiciones siguientes: todo número real es también un número complejo, y el resultado de las opefinidas   idas sobre ellos es igual al caso real  raciones suma y producto de fi  n existe un número complejo, que denotaremos por   i i , que satisface que   i i 2 = 1 todo número complejo puede escribirse de forma única en la forma

 −

a +  i b

 ∈

a, b   R

las operaciones de suma y producto de fi  finen n   en sobre el conjunto   C  una estructura de cuerpo 

 

3. DEFINICIÓN DE ESPACIOS VECTORIALES

3. 3.1.

13

Definición de espacios vectoriales

Definición.

Definición 1.3.   Sea  V    un conjunto, K un cuerpo y consideremos dos operaciones 

  → V  

+ :  V    × V  

 

·  :  V    × K

(v , w )

 

(α, v )

 �→ v   + w 

→ V  

 �→ α · v .

fica Diremos que   V    es un espacio un  espacio vectorial sobre el cuerpo   K  si se veri fi  c  a la operación suma es asociativa, es decir, dados tres elementos cualesquiera

v 1 , v 2 , v 3

 ∈ V  

 

v 1  + ( v 2  +  v 3 ) = (v 1  +  v 2 ) +  v 3 ,

(16)

la operación suma es conmutativa, es decir, dados dos elementos cualesquiera

 ∈ V  

v 1 , v 2

v 1  +  v 2  =  v 2  +  v 1 ,   (17) 0  V   existe un elemento neutro para la suma, es decir, existe un elemento   �  que veri fi  fica c  a que 

 ∈

0 = �  0 +  v   =  v  v   + � 

 

  ∀v   ∈∈  V ,

(18)

todo elemento tiene un elemento opuesto en el conjunto   V   , es decir, para cualquier elemento   v   V    existe  v   V    cumpliendo 

  ∈∈

  −−   ∈∈  + (−v ) = (−v ) +  v   = �  0, v  +

 

(19)

el producto por escalares es distributivo respecto a la suma de vectores, es    y un escalar   α K, decir, dados dos vectores   v  v 1 , v 2  V   y

 ∈

α(v 1  +  v 2 ) =  α v 1  + αv 2 ,

 ∈

 

(20)

el producto por escalares es distributivo respecto a la suma de escalares, es    vinV    , decir, dados dos escalares cualesquiera   α1 , α2  K  y cualquier vector  vinV   se cumple que 

 ∈

+ α2 v , (α1 + α2 )v   =  α 1 v   +   (21) el pro producto ducto por escalar escalares es es tambi también én distributi distributivo vo resp respecto ecto al pro product ducto o de  escalares, es decir, dados dos escalares cualesquiera   α 1 , α2   K   y cualquier  vector   v  v   V   , se cumple que 

 ∈

 ∈

(α1 · α2 )v   =  α 1 (α2 v ),

 

(22)

 ∈

 y   fi nalmente, nalmente, el elemento unidad   1  K , satisface que para cualquier vector  v   V   : 1 ·  v   =  v .   (23)

 ∈  ∈

Ejemplo  1.1.   El ejemplo más simple en que podemos pensar, en el caso de un espacio vectorial complejo, es el plano   C. Desde el punto de vista que hemos visto  arriba, es un espacio vectorial sobre   C C  de forma trivial. Los vectores y los escalares se  confunden, en este caso.

 

14

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

Es importante darse cuenta que si pensamos en el plano complejo como un plano  real, es decir, usando el hecho de que   C   R2 , tenemos también una estructura de 

 ∼

espacio vectorial, el aunque en este caso es un vectorial esta perspectiva, conjunto de vectores no espacio se confunde con real. el deAnalizado escalares,desde  dado  que tendríamos  K=R V    = R2 Ejemplo  1.2.  El ejemplo que usaremos siempre como referencia en los próximos  capítulos será  V    = Cn K = C. Es decir, los vectores van a corresponder a   n-tuplas de números complejos. El caso más simple, con   n   = 2, será el ejemplo paradigmático para describir los  posibles estados de espín de una partícula de espín   12 , como pueden ser los electrones, los protones o los neutrones. 3.2.. 3.2

Conjunt Conjunto o gener generado adorr y base. base.   Recordaremos también dos conceptos fun-

damentales dentro de la teoría de espacios vectoriales, como es el de sistema generador y el de base. Desde un punto de vista conceptual son bastante simples: dado que podemos considerar combinaciones lineales arbitrarias de los vectores, cabe preguntarse si es posible obtener éstos como combinaciones lineales a partir de un número reducido de ellos. Es decir, dados  v 1 , v 2 ∈  V   , y   α1 , α2 ∈ K, sabemos que el elemento α1 v 1  + α2 v 2

 ∈ V .

De forma análoga, se puede considerar una combinación con   k  elementos: k 



 j =1

 ∈  V  

α j v  j 

De esta forma surge el concepto de conjunto generador:  F   =  { w 1 , w 2 , . . . , wk   }  de elementos de  Definición 1.4.  Diremos que un conjunto  F  V    es un   conjunto generador  generador   del espacio vectorial   V   , si para cualquier elemento de  v   V   existen   existen escalares   α1 , . . . , αk   tales que 

 ∈  ∈

v   =  α 1 w 1  + α2 w 2  +  . . . αk w kk  .

Alternativamente diremos que   V    es el espacio generado por el conjunto, y escribiremos  V   es V   =   = spanF 

  (24) Este concepto está intimamente relacionado con el de independencia lineal, también bien conocido: Sea   {w 1 , . . . , wk   }  un conjunto de vectores de   V   . Decimos que  Definición  1.5.   Sea estos vector estos vectores es son son   linealmente linealmente dependientes   si existen existen un conj conjunto unto de escalar escalares  es  {α1 , . . . , αk }  tales que no son todos nulos, y que cumplen que  α1 w 1  + α2 w 2  +  . . . + αk w kk    = 0

Análogamente: Definición  1.6.  Un conjunto de vectores   vectores   {w 1 , . . . , wk   }  se dice   linealmente independiente cuando dependiente  cuando la única solución de la ecuación α1 w 1  + α2 w 2  +  . . . + αk w kk    = 0,

es   α j   = 0,  j   = 1, . . . , k . 

 ∀

 

3. DEFINICIÓN DE ESPACIOS VECTORIALES

15

Desde un punto de vista geométrico, la dependencia o independencia lineal tiene una fácil imagen: considerando el (hiper)volumen generado por el conjunto {w 1 , . . . , wk   }, un cierto vector será combinación lineallosdeotros ellos si está contenido en él. Será linealmente independiente si de fine, junto con elementos, un (hiper)volumen de una dimensión mayor. Desde un punto de vista físico podemos considerar que la información del sistema sistema que modelizamo modelizamoss con los vectores vectores la asociamos asociamos a ese hipervolumen. hipervolumen. Desde ese punto de vista, la independencia lineal indica simplemente el hecho de que no podemos tomar un subconjunto de vectores que nos proporcione la misma información que aquél que nos han dado. Por supuesto, si un sistema de vectores es linealmente dependiente, querrá decir que en un subconjunto de ese conjunto de vectores tendremos contenida la misma información del estado del sistema. Una vez definidos estos dos conceptos, es fácil introducir el concepto de base de un espacio vectorial: vectores   {e 1 , . . . , en  }  es una  base Definición  1.7.  Diremos que un conjunto de vectores   del espacio vectorial   V   V   cuando   cuando es un sistema generador del mismo y linealmente independiente. Denominaremos  Denominaremos  dimensión   dimensión del espacio vectorial al vectorial  al número de elementos  de una cualquiera de sus bases.

La existencia de una base en un espacio vectorial, permite establecer una relación entre los vectores y las   n-tuplas de elementos del cuerpo sobre el que está definido el espacio vectorial.   Se puede demostrar que esa relación es 1:1, es decir, que dada un base { base  { e 1 , . . . , en  }, por cada  v  K   (i   = 1, . . . , n), tales que

v i 

 ∈  V   existe   existe un solo conjunto de   n  números



n

v   =



v i e ii    .

i =1

B   = { =  { e 1 , . . . , en  } Definición 1.8.  Dado un espacio vectorial   V   V    sobre  K  y una base   B  1 n  {   { }   K de   V   , por cada vector   v   V    el conjunto de numeros  v  , . . . , v    en  se denomina coordenadas de   v   en la base  base   B .

  ∈∈

Las coordenadas se suelen representar con un “vector columna”: v 1

 ↔  ↔



v 2 ... v n

 

(25)

B

y, usualmente, se omite el sufi jo  B  con la indicación de la base. Podemos afirmar que, habiendo   fi jado la base en la que trabajamos, cualquier propiedad verificada en las coordenadas tiene validez. No obstante, en muchas ocasiones deberemos demostrar que la construcción no depende de la base escogida. Es importante destacar que no hay que confundir el vector (un objeto “intrinseco”) y sus coordenadas (que dependen también de la elección de una base). Por ejemplo, vamos a considerar un vector en   C2 ,   v   = (z 1 , z 2 ), es decir, un objeto constituido por una pareja de números complejos dados,   z 1   y   z 2 . En la  base canónica   de   C2 , B cc     =   {e 1   = (1, 0), e 2   = (0, 1)} 1)}, las coordenadas de   v   son efectivamente   (z 1 , z 2 ), z 2   z 1 −z 2 1)}  sus coordenadas son   ( z 1 + pero en la base   B   =   {v 1   = (1, 1), v 2   = (1, −1)} 2   , 2   ).

 

16

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

En otras palabras, z 1 z 2

  

y

Bc 

z 1 +z 2

2

z 1 −z 2

2

B

definen el mismo vector, como se puede verificar inmediatamente observando que v   =  z 1 e 1  +  z 2 e 2  =

  z 1  +  z 2   z 1   v 1  +

2

 − z  2 v 2.

 

2

(26)

Ejercicio 1.1.  Probar que todas las bases de un espacio vectorial tienen el mismo  número de elementos. 3.3.. 3.3

Espacio Espacioss vectoria vectoriales les de dimensi dimensión ón infinita.   Es de destacar que el con-

cepto de espacio vectorial no está restringido al caso de dimensión  fi nita. De hecho en Física, en particular en Mecánica Cuántica, serán muy frecuentes los casos en los que el espacio de estados del sistema tiene dimensión in finita. Desde un punto de vista formal, la definición es completamente análoga. Ninguna propiedad de las comentadas hasta ahora debe ser modi ficada, con la excepción de que los conjuntos generadores y bases de los espacios tendrán ahora un cardinal (esto es, un número de elementos) infinito. Como ejemplo más representativo consideraremos siempre los espacios de funciones, que serán los escogidos para representar los estados en Mecánica Cuántica. Consideremos entonces el conjunto de funciones de una variable obtenidas como combinación lineal de las siguientes:  =  {sin sin k x , cos k x   | Fou  = {

 

  ∈∈ Z}

  k 

(27)

Estamos considerando entonces el conjunto de funciones obtenido como V    = span(Fou) =





f    : R

→ R  |

  f    =





 ∈ R

(αk  cos k x   + +  βk  sin k x )   αk , βk 

k =0

(28) Estos elementos pueden, de forma trivial, ser sumados y escalados, en este caso por elementos reales. Es decir, si consideremos dos elementos de   V   ,   f  1   y   f  2 , de expresiones: ∞

f  1  =





1

1

(αk  cos k x  +  +  βk  sin k x )   f  2   =

k =0 =0



(α2k  cos k x   + +  βk 2 sin k x ));;

k =0 =0

la función suma corresponderá a: ∞

f  1  +  f  2   =





2 1 )cos k x  +  + ( βk 1  +  βk 2 )sin k x  .  + αk  (αk 

k =0 =0

Análogamente, el producto por un escalar  λ  ∈ R  se traducirá en: ∞

λf  1  =



1 (λαk   cos k x  +  + λβk 1 sin k x )

k =0 =0

 

4. SUBESPACIOS VECTORIALES

17

Notaci Notación ón de Dirac. Dirac.  A lo largo del curso, cuando consideremos espacios vectoriales sobre los complejos, emplearemos la llamada  notación de Dirac  o  nota3.4.. 3.4

ción bra-ket  para la representación depróximos los elementos. Aunque explicaremos más en detalle algunos de los conceptos en los capítulos, podemos resumir algunas de las principales características ya a este nivel:

los elementos del espacio vectorial complejo   V    serán representados en la forma |v 1 , |v 2 , . . . ,

 

forma que se denomina “ket”; una combinación lineal de estados de este tipo corresponde entonces a un elemento |w   =  α 1 |v 1 + α2 |v 2







el elemento del espacio vectorial dual   V   ∗ será representado por un “bra”, en la forma  ∗

v | ∈ V   .

De esta forma, para representar la acción del funcional lineal   v 1 |  sobre el estado   |v 2 , tenemos

v 1|v 2 ∈ K. 4. 4.1.

Subespa Subespacios cios vectoria vectoriales les

Definición general.  El concepto de subespacio vectorial en el caso com-

plejo es completamente análogo al caso real. Decimos entonces: Definición  1.9.   Sea   V    un espacio vectorial sobre   K  y consideremos un subcon junto   W    V   . Decimos que   W   es un   subespacio vectorial  vectorial   de   V    si es un espacio  vectorial vectori al (sobre   K) en sí mismo. En particular, esto se traduce en tres condiciones: dados   w 1 , w 2  W , entonces   w 1  +  w 2  W , dado   w   W   y   α K, entonces   αw   W ,  �  0  W .  y   fi nalmente, nalmente, el vector  � 

 ⊂

 ∈  ∈

 ∈

 ∈

 ∈

 ∈

Ejemplo   1.3.   Un ejemplo muy simple podemos encontrarlo en el conjunto de  n-tuplas de   Cn en las que la última componente es nula, es decir  n

 ∈ C |z 1 , z 2 , . . . , z  −1 ∈ C}

 { (z 1 , . . . , zn −1 , 0) W   =  {(

n

 

(29)

De forma completamente análoga podemos considerar el caso real, y tomar el subespacio vectorial   Rn−1 dentro del espacio vectorial   Rn .

Centrándonos en el caso real es donde podemos dar los ejemplos más facilmente representables por imágenes. Vemos así que cualquier plano bidimensional dentro del espacio   R3 es un subespacio vectorial de éste último. De la misma forma una recta dentro de   R2 o   R3 .

 

18

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

Consideremos un espacio vectorial  V   de   de dimensión  n . Si especificamos un conjunto de vectores linealmente independientes B  =  {| v 1 , . . . , |v pp  }, (con p < n), podemos considerar el conjunto de vectores de   V    que se pueden obtener como combinación lineal de los elementos dados. Ese conjunto, recibirá el nombre de   subespacio generado por el conjunto de vectores   B , y será denotado como p  p 

 ∈ V   |∃(α1, . . . , α ) ∈ K

spanB  =  {| z 



tal que   |z   =



α j |v  j  }   j  j 

 

(30)

=1



Conocido un subespacio   W  dentro de un espacio vectorial   V   será   será muchas veces interesante disponer de una base de   V   respecto   respecto a la cual la expresión del subespacio sea lo más sencilla posible. Introducimos así el concepto: Definición  1.10.   Sea  W  un subespacio vectorial de un espacio vectorial  V   . Dire {| e k   V    está  adaptada a  adaptada  a  W  si un subconjunto de los elementos  mos que una base  {| k  }  de  V   de la base determinan una base del subespacio   W , es decir, estamos obteniendo una base de   V   V    completando una base del subespacio   W  W  .



4.2.. 4.2

“Subesp “Subespaci acios” os” especia especiales les en el caso de espaci espacios os vecto vectoria riales les complecomple-

 jos.   Es importante importante hacer una precisión precisión en el caso de espacios espacios vectoriales vectoriales complejos. complejos.

Consideremos un espacio vectorial complejo como   Cn , es decir, un espacio vectorial formado por   n-tuplas de números complejos. Consideremos una base en este espacio en la forma  {| z 1 , . . . , |z n }. Sabemos que un elemento arbitrario del espacio vectorial, corresponde a una combinación lineal de los elementos de esa base, con coe ficientes complejos, es decir: n

|v 

|v   =  α 1 |z 1 + . . . αn |z n



 ∈C





donde   α1 , . . . , αn  son números complejos. Sin embargo, en Física aparecerán con frecuencia situaciones donde, en un espacio vectorial complejo, nos interese definir objetos reales. Podremos considerar así un espacio vectorial real definido como: n

W   =  { w   =



 j =1 =1



n

 

 ∈ R }

 β j |z  j  |( β1 , . . . , βn )

(31)

Ejercicio   1.2.   Probar que el subespacio   (31) 31)   es un espacio real, para el caso  con   |z 1  = (1, i )   y   |z 2  = (1, i ), utilizando la relación 1:1 entre los vectores  n  = 2, con  2 y   |r ( z )   = de   C ,   |z    = (c 1 , c 2 ) = (a1   +  i b 1 , a2   +  i b 2 )   (con   c ii     C,   ai , b i i    R) y   (a1 , b 1 , a2 , b 2 ) R4 .

   ∈





 ∈

 ∈



 

4. SUBESPACIOS VECTORIALES

19

2 x 2, con coe fi  ficientes Ejemplo  1.4.   Consideremos el conjunto de matrices   2 c  ientes complejos   M 2 (C). Se trata de un espacio vectorial complejo de dimensión compleja 4. Consideremos el subconjunto formado por las matrices: 0 1 0 i  σ1   =   σ3   =   σ2  = 1 0 i    0

 

  −

  1 0

0 1

 

 −

(32)

ficientes Son tres matrices con coe fi  c  ientes complejos. Sin embargo, el conjunto de sus comficientes  reales binaciones lineales con coe fi  c  ientes  reales,, en la forma 3

S  =



α j σ j   =

 j =1 =1



  α3   α1  +  i α2

 − i α2   −α3 α1



 

(33)

formarán el conjunto de operadores que medirán el   el   spin de spin  de una partícula, como en el  caso de un electrón o un protón. Sumas Sumas dir direct ectas. as.   Cuando se modelizan sistemas físicos compuestos compuestos de más

4.3.. 4.3

de una partícula, el conjunto de estados se obtienen componiendo de forma adecuada los espacios de estados de los sistemas individuales. Cuando el sistema que estamos estudiando es un sistema clásico, el conjunto de estados será el correspondiente al producto cartesiano de los espacios de estados de los constituyentes. Cuando se trate de un sistema cuántico, deberemos considerar el producto tensorial de los mismos, como veremos en el capítulo siguiente. En el caso de sistemas clásicos (es decir, que se rigen por las reglas de la Mecánica Clásica) la combinación de varios sistemas para formar uno requiere unicamente el producto cartesiano de los conjuntos de estados y combinar las estructuras lineales componente a componente. Desde un punto de vista físico es fácil de entender: si consideramos un sistema no relativista, la composición de dos vectores velocidad en un sistema, tiene que tener sentido para cada uno de los subsistemas independientemente de lo que ocurra en el otro. O la composición de un conjunto de fuerzas aplicadas en cada uno de los subsistemas. Es evidente que estas magnitudes deben combinarse de forma independiente en cada uno de los espacios. Consideraremos pues:  V  2  dos espacios vectoriales de dimensión   fi nita nita sobre  Definición  1.11.   Sean   V  1   y  V   finiremos   iremos la suma constituido  un cuerpo K. De fi  n la suma directa V  1 V  2  como el espacio vectorial constituido  por: el espacio de pares 



V  1

 { (v 1 , v 2 ) | v 1 ∈  V  1   v 2 ∈  V  2 }  ⊕ V  2  =  {(

finida   ida componente a componente: la operación suma de fi  n

(v 1 , v 2 ) + ( v 3 , v 4 ) = (v 1 +  v 3 , v 2  +  v 4 )

  ∀v 1, v 3 ∈ V  1,

v 2 , v 4

el producto por los escalares de fi  finido n   ido globalmente, es decir  α(v 1 , v 2 ) = (αv 1 , αv 2 )

 ∈ V  2

  ∀α ∈ K,   ∀v 1 ∈ V  1 ,   ∀v 2 ∈ V  2

Es muy simple darse cuenta de que cada uno de los espacios están incluidos en el total: V  1 V  2

 { (v 1 , 0) ∈ V  1 ⊕ V  2 |   v 1 ∈  V  1 }  ∼ {(  { (0, v 2 ) ∈ V  1 ⊕ V  2 |   v 2 ∈  V  2 }  ∼ {(0

 

20

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

El concepto de suma directa tiene especial relevancia en la relación entre un espacio vectorial   V   y   y sus subespacios. Sean   W 1   y   W 2  dos subespacios vectoriales de fi

V   , y de namos los conjuntos: . W 1 W 2 =  { v 

 ∩

  ∈∈  W  , (i   = 1, 2) 2)} } , . ∈  V    :  ∃ v 1 ∈ W 1, v 2 ∈ W 2, v   = v 1 + v 2}   . W   =  W 1  +  W 2 =  { v   ∈ ii  

Se puede demostrar que ambos son subespacios de  V   . El siguiente teorema define las condiciones para que   W  sea suma directa: Teorema  1.2.   Consideremos un espacio vectorial   V   . Sean   W 1   y   W 2  dos subespacios vectoriales del mismo, y   W   =  W 1  +  W 2 ,   W   V    Entonces, las tres siguientes  afi rmaciones rmaciones son equivalentes: W   =  W 1 W 2  { 0}: el único elemento común es el vector nulo. W 1 W 2  =  {0 cada vector   v  v   W  se puede escribir de forma única como suma de un vector  de   W 1   y uno de   W 2 , es decir, dado   v    W   existe un único   w 1   W 1   y un único   w 2  W 2  tales que 

  ⊆⊆

 ∩

 ⊕

  ∈∈

 ∈

 ∈

 ∈

v   =  w 1  +  w 2 . Denotaremos esa descomposición escribiendo que  v   =  w 1

 ⊕ w 2 .

Normalmente nos referiremos a los elementos   w 1  y  w 2  como elementos de los subespacios, aun cuando en realidad son elementos del espacio vectorial completo, pero determinados de forma unívoca por los elementos de aquellos. Nótese que el teorema implica que la única combinación lineal nula de vectores w 1 ∈  W 1   y   w 2 ∈  W 2  es la con coeficientes nulos:   αw 1  +  β w 2  = 0 ⇒ α  =  β  = 0. Demostració Demos tración. n. Se deja como ejercicio. ejercicio. 5. 5.1.

 



Definición de endomorfismo

Definición de aplicación lineal.  Consideremos un espacio vectorial  V    so-

bre el cuerpo  K . Podemos pensar que está formado por los estados de un cierto sistema físico, aunque que vamos a presentar son puramente matemáticos y tienen interés  perlos se conceptos . Definición 1.12.   Sean V  1 , V  2  dos espacios vectoriales sobre un cuerpo  K. Diremos  que una aplicación   T   :   V  1 fi ca veri fi c  a que 

 →   V  2   entre los conjuntos es una   aplicación lineal   si se 

T (α1 v 1  + α2 v 2 ) =  α 1 T (v 1 ) + α2 T (v 2 )

  ∀α1 , α2 ∈ K   v 1, v 2 ∈ V  1

 

(34)

Desde un punto de vista menos formal, podemos usar como regla: “la imagen de una combinación lineal en  V  1  es la combinación lineal de las imágenes en   V  2 ”.

Desde un punto de vista práctico estamos pues considerando aquellas transformaciones que respetan la estructura que está identi ficando a nuestro conjunto, que es la estructura de espacio vectorial. Un tipo especial de aplicación lineal va a ser aquella que tiene al mismo espacio como conjunto inicial y   final de la aplicación, es decir aquel en el que  V  1  =  V    =  V  2 :

 

5. DEFINICIÓN DE ENDOMORFISMO

21

Definición  1.13.   Sea   V    un espacio vectorial. Llamaremos   Llamaremos   endomorfismos smos a  a las  aplicaciones lineales   T   :  V    V   , es decir, aquellas que satisfacen

 →

T (α1 v 1  + α2 v 2 ) =  α 1 T (v 1 ) + α2 T (v 2 )

  ∀α1 , α2 ∈ K   v 1, v 2 ∈ V  

Ejemplo 1.5.  Consideremos el caso de un espacio vectorial complejo de dimensión uno,   V    =   C. Consideremos la transformación que multiplica cada número por un número complejo   fi  jo   k  C, es decir:

  ∈∈

C

 z  � �→ k z   ∈∈ C

 

(35)

Es evidente que la imagen de una combinación lineal de números complejos se  transforma en la correspondiente combinación lineal de imágenes: α1 z 1  + α2 z 2

 �→ k (α1 z 1 + α2z 2) = α 1k z 1 + α2 k z 2,

lo que demuestra que la transformación es lineal.

5.2. Núcleo Núcleo de una una aplicaci aplicación ón y conjunt conjunto o imagen. imagen.  Dentro de una aplicación lineal vamos a individualizar dos subconjuntos de enorme importancia: el conjunto de vectores de   V  2  que se pueden obtener como imagen de algún vector de   V  1 . 0  de   V  2 . el conjunto de vectores de   V  1  cuya imagen es el vector  � 

Definición 1.14.   Sea f    :  V  1  V  2  una aplicación lineal. Denominaremos  conjunto   conjunto imagen de imagen  de la aplicación al conjunto de elementos de   V   V  2  para los que existe un elemento  de   V   V  1  que tiene una imagen, es decir 

 →

  (36)  ∈ V  2   | ∃v 1 ∈ V  1  tal que   f  f   (v 1) = v 2} Definición  1.15.   Sea   f    :   V  1 →  V  2  una aplicación lineal. Denominaremos   Denominaremos   núcleo �  0 ∈ V  2 , de la aplicación al conjunto de elementos de   V   V  1  tal que su imagen es el vector   �  es decir: Ker(f   ) =  { v 1 ∈  V  1   |   f   (v 1 ) = �  0 ∈ V  2 }   (37) Im(f   ) =  { v 2

Ker,, que es la más habitual, tiene su origen en el término inglés kernel. La notación  notación   Ker

 

22

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

Ejercicio  1.3.   Consideremos   V   V    = Cn  y la aplicación: f   (z ) =  λ z 

Cn



λ

  ∀  ∈

C.

 ∈

Demostrar que es una aplicación lineal, y determinar, en función de   λ, el conjunto  imagen y el núcleo de la aplicación. Ejercicio  1.4.   Consideremos   V   V    = Cn  y la aplicación: f   (z ) =  z 0

n

  ∀z   ∈∈ C

z 0

n

 ∈ C .

Es decir, la aplicación es tal que cualquier elemento tiene como imagen un elemento  dado, siempre el mismo. Determinar para qué valores de   z 0  es una aplicación lineal. En ese caso, determinar su núcleo y el conjunto imagen.

Estos dos conjuntos determinan la mayor parte de las propiedades de la aplicación f   . La linealidad que hemos asumido en ésta, determina por ejemplo:  �  0  Ker(f   ) Lema  1.1.   El elemento  � 

 ∈

 ⊂ V  1  para cualquier aplicación  f    : V  1 → V  2

Demostració Demos tración. n. Se deja como ejercicio. ejercicio.

 



 )  es un subespacio vectorial de   V  1 , así como   Im(f   ) lo  )  lo es de   V  2 . Lema  1.2.   Ker(f   ) es  

Demostració Demos tración. n. Se deja como ejercicio. ejercicio.



Es importante darse cuenta de que la dimensión como subespacio de   Im(f   )   no tiene por qué ser igual a la del espacio   V  2 .   Ker(f   ) = �  0. Lema  1.3.   La aplicación   f   es   es inyectiva si y sólo si  Ker(

Demostració Demos tración. n. Se deja como ejercicio. ejercicio.

 



De forma análoga, podemos decir que Definición  1.16.  La aplicación es suprayectiva si   Im (f   ) =  V  2 . 5.3.. Composi 5.3 Composició ción n de endo endomo morrfismos.  Una propiedad interesante de las aplicaciones lineales es el hecho de que puede definirse una ley de composición para ellas. caciones Así, podemos pensar que aplicamos una transformación   T 2   :   V  2  →   V  3   a los puntos obtenidos como imagen de una transformación   T 1   :   V  1  →   V  2 . La linealidad de las aplicaciones permite descomponer de manera sencilla la aplicación consecutiva de las mismas: T 2 (T 1 (α1 v 1  + α2 v 2 )) =  T 2 (α1 T 1 (v 1 ) + α2 T 1 (v 2 )) =  α 1 T 2 (T 1 (v 1 )) + α2 T 2 (T 1 (v 2 ))

(38) Con esto hemos probado el siguiente resultado: Lema  1.4.   La aplicación consecutiva de aplicaciones lineales es una operación interna dentro del conjunto de aplicaciones lineales, es decir, la aplicación composición es también lineal.

La ley de composición tiene sentido para cualquier aplicación lineal, y por tanto lo tiene en particular para el caso en que consideramos endomorfismos de un espacio vectorial en sí mismo. Consideremos este caso en lo que sigue. De lo anterior, hemos aprendido que en el conjunto de aplicaciones lineales  End(V   )  podemos definir una ley de composición:  ) × End(  End(V   ) → End(V   ) ◦ : End(V   ) ×

(T 2

 ◦ T 1 )(v ) = T 2(T 1(v ))   ∀v  ∈  ∈  V  

  (39)

 

6. MATRICES ASOCIADAS A ENDORMORFISMOS

23

Esta ley de composición tiene claramente un elemento neutro, que es la aplicación identidad, es decir, aquella que asocia a cada elemento de   V   , el mismo elemento: id(v ) =  V  

Es trivial probar que

 ◦

f   id = id

  ∀v   ∈∈  V .

 

(40)

◦ f     ∀f    ∈ End(V   )

Ejercicio 1.5.  Probar que para que exista el inverso de una aplicación  f    :  V   respecto a esta operación es condición necesaria que 

  → V  

Kerf    = �  0 6.

Matri Matrices ces asociadas asociadas a endormo endormorrfismos

6.1.. Fij 6.1 Fijar ar la base base determi determina na la mat matriz riz..   En esta sección vamos a relacionar el concepto de aplicación lineal con otro concepto bien conocido en el ámbito del álgebra lineal como es el de matriz. Vamos a ver que, debido a la linealidad, podremos caracterizar completamente una aplicación lineal (en particular un endomor fismo) por los valores que la transformación tome sobre los elementos de una base del espacio V   . Proposición   1.1.   Sea   T   :   V  1   V  2  una aplicación lineal. Si consideramos una base del espacio vectorial   V  1   en la forma   {|e  j 1 }, la imagen por la aplicación   T   de  cualquier elemento de   V  1   está completamente determinada por los valores que toma T  sobre los elementos de la base de  V  1 .

 →

 

Demostración. Sabemos que un elemento cualquiera   v   ∈ ∈   V  1  tiene una descomposición única como combinación lineal de los elementos de la base  {| e  j 1 }: v   =



v  j |e  j 1 ,

 j 

 

 

(41)

donde las componentes   {v  j }  son elementos del cuerpo   K. Consideremos ahora que conocemos los valores de la aplicación  T  actuando sobre los elementos de dicha base, es decir, conocemos los valores de T |e  j 1

 

∀ j 

En ese caso, el valor que la aplicación lineal   T  tome sobre el vector genérico   v  será: T (v ) =  T 

      v  j |e  j 1

 j 

=

 j 

v  j T |e  j 1

 

Así pues, conociendo el valor que toma   T  sobre los elementos de la base podemos obtener el valor que toma sobre un vector genérico: basta con calcular la combinación lineal de esos valores usando los coeficientes  { v  j }  de la descomposición de  v  respecto a la base.   � Si además de la base considerada sobre   V  1  consideramos una base en el espacio vectorial V  2   {|e k 2 }, podemos asociar a la aplicación lineal una matriz que representará de manera unívoca toda la transformación. Consideremos así la imagen de un elemento arbitrario de la base de   V  1 ,   T |e  j 1 . Al ser un elemento de   V  2  debe de poder escribirse como combinación lineal de los elementos de su base, dado que todos los elementos

 

24

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

de  V  2  tienen una determinada expresión en ella. Por consiguiente, podemos escribir el elemento   T |e  j 1   como: T |e  j 1  =

 



T k  j |e k 2





El conjunto de números   {T k  j }, donde   j   = 1, . . . , n1  = dimV  1   y   k   = 1, . . . , n2   = dimV  2  determinan por consiguiente la aplicación lineal   T  de forma completa. Veamos ahora cómo es la acción sobre un vector arbitrario del espacio   V  1 :

T (v ) =  T 

      v  j |e  j 1

=

 j 

v  j T |e  j 1  =

 

 j 

 v  j 

T k  j |e k 2



 j 



Dado que   T (v ) ∈ V  2  podremos escribir el vector en función de la base de   V  2 , en la forma: V  2

 =  | w   =   T |v  = |



w k |e k 2 .





Dado que para una misma base la descomposición de un vector es única, podemos escribir: w k  =



T k  j v  j ,

 j 

donde   j   = 1, . . . , n1  = dimV  1   y   k   = 1, . . . , n2  = dimV  2 . Podemos escribir matricialmente la expresión en la forma

   ⇔  ⇔    w 1 w 2



.. .

=

w n2

T 11   T 12   . . . T 21   T 22   . . .

T 1 n1 T 2 n1

T n12   T n22   . . .

T n n21

.. .

Con local concluimos que la matriz

  

T 11   T 12   . . . T 21   T 22   . . .

T 1 n1 T 2 n1

T n12   T n22   . . .

T n n21

.. .

     v 1 v 2

.. .

v n1

  

representa de forma unívoca a la aplicación una vez que las dos bases han sido   fi jadas. En el caso en que la aplicación lineal es un endomor fismo, debemos considerar unicamente una base, y de finiremos así:

 

6. MATRICES ASOCIADAS A ENDORMORFISMOS

25

fismo s  mo de fi  finido n   ido sobre un espacio  Definición  1.17.   Sea   T   :   V     V    un endomor fi   {| e  j  } j =1,...,n=dimV   sobre el espacio vectorial, la vectorial  V   . Si consideramos una base  {|

 →



aplicación lineal determina unívocamente una matriz:1 1 1 T   =

  

T  1   T  2   . . . T 21   T 22   . . .

T  n T 2 n

T n1   T n2   . . .

T n n

.. .

  

 

,

(42)

que representa la expresión coordenada de las imágenes de los elementos de la base  respecto a ella, es decir: n

T |e  j   =





T k  j |e kk   .

 



k =1 =1

(43)

Será denominada  denominada   matriz asociada al endomorfismo   T   en la base   {|e kk   }. Una vez conocemos la expresión de la matriz en esa base, la expresión de la aplicación actuando sobre un vector arbitrario del espacio   V    se traduce en la acción de la matriz sobre las componentes del vector respecto a la misma base, es decir, si 



w   =  T |v  ,



 {| e  j  }  se obtienen a partir de las de   v  en la las componentes de   w  w  respecto a la base  {| forma:

   ⇔   ⇔ 



w 1 w 2

.. .

w n

  

=

  

T 11   T 12   . . . T 21   T 22   . . .

T 1 n T 2 n

T n1   T n2   . . .

T n n

.. .

   

v 1 v 2

.. .

v n

  

(44)

Es muy importante entender que la relación entre el endomor fismo y la matriz tiene sentido únicamente cuando se ha   fi jado una base. Si la base fuese diferente, la matriz también lo sería, porque estamos hablando simplemente de la representación de la Ec. (43 (43). ). Una excepción a esta regla va a estar dada por la aplicación identidad. Ya vimos en la sección anterior que esta es la aplicación lineal que representa el elemento neutro para la operación de composición de endomorfismos comentada. Es inmediato verificar que:

Lema 1.5.   Sea V   un   un espacio vectorial de dimensión  n  y  {|  y  {| e kk   }  una base arbitraria de fi fi nida n   ida sobre él. La representación matricial de la aplicación identidad de fi  finida n   ida como 



Id (v ) =  v 

  ∀v   ∈∈  V ,

 

(45)

corresponde a la matriz identidad:

In   =

  

1 0 .. . 0

0 1 .. . 0

0 0 .. . 0

  ...   0   ...   0

.   . . . ..   ...   1

  

Demostración. Para cada elemento de la base, se va a verificar: Id (|e k  k  ) =  | e k  k 





 

k   = 1, . . . , n .

(46)

 

26

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

En consecuencia, la imagen de cada elemento de la base tiene una sola coordenada en la descomposición del elemento imagen en la base dada.   � Ejercicio  1.6.  Consideremos una aplicación lineal  A : C3

  ∈     −     − z 1 z 2 z 3

que cumple que, para cada elemento 

A

→ C2,

z 1 z 2 z 3

=

fica C3 , se veri fi  c  a

3z 1

4z 2

i z 1

z 3

.

Determinar la matriz que representa la aplicación en la base canónica de cada espacio. Ejercicio  1.7.  Consideremos tres endomor fi  fismos  s  mos  σx   : C2

→ C2,

  σ y   : C2

→ C2, σ   : C2 → C2 z 

de fi fi nidos n   idos por  σx 

      −      z 1 z 2

=

z 2 z 1

z 1 z 2

  σ y 

i z 2 i z 1

=

  σz 

z 1 z 2

=

  z 1 z 2



.

Determinar las correspondientes matrices en la base canónica de   C C 2. 6.2.. 6.2

Rango Rango y n núcl úcleo eo d de e una matriz matriz..  De forma similar a como estudiamos el

conjunto imagen y el núcleo de una aplicación lineal, podemos ahora estudiar cómo se van a traducir estos conceptos en el lenguaje de matrices, una vez que hayamos tomado una base sobre el espacio vectorial donde está definido el endomorfismo. Es sencillo darse cuenta de que el conjunto elementos del núcleo de la aplicación lineal corresponden, en el lenguaje de las matrices, al conjunto de puntos   v  ∈  ∈  V    que satisfacen:

  

T 11   T 12   . . . T 21   T 22   . . .

T 1 n T 2 n

T n1   T n2   . . .

T n n

.. .

             v 1 v 2

.. .

v n

=

0 0

.. .

0

Por consiguiente, la determinación de las coordenadas de los vectores que forman el núcleo es equivalente a la resolución del sistema de ecuaciones lineales:

Ker(f   ) =

   ∈ ∈  v 

  

T 11 v 1  +  T 12 v 2  +  . . . +  T 1n v n   = 0

 V    |   v   =

 k 



v  |e k  k  |



T 21 v 1  +  T 22 v 2  +  . . . +  T 2n v n   = 0

.. .

T n1 v 1  +  T n2 v 2  +  . . . +  T nn v n   = 0

  

(47) De una manera similar podemos pensar en la caracterización del conjunto imagen. Hemos visto ya que la dimensión del conjunto imagen no tiene por qué ser la misma que la del espacio ambiente. Es decir, si consideramos un endomor fismo  f    :  V    →  V   , la dimensión de  Im( f   )  no tiene por qué ser igual a la dimensión de  V   , sino que puede ser

 

6. MATRICES ASOCIADAS A ENDORMORFISMOS

27

más pequeña. Debido a la linealidad de la aplicación, podemos escribir que la imagen de un vector  | v   =  j  v  j  j |e  j  ∈ V   se   se obtiene como una combinación de los elementos:

Por tanto:

f   |v   =





  j 

 ∈ Im (f   ).

v  j f   |e  j 

 { f   |e  j  }  forman un sistema generador de  Im  Im (f   ).  ). Lema  1.6.  Los vectores  {



Pero estos vectores son, precisamente, los que expresados en la base original aparecen en las columnas de la matriz. Para veri ficarlo, basta verificar que si tomamos las coordenadas de los elementos de la base (es decir, una entrada igual a uno, y todas las demás iguales a cero), la expresión que obtenemos es precisamente la que correspon corr esponde de a las entradas de la columna correspondien correspondiente te en la matriz. matriz. Desde otro punto de vista, podemos pensar que aquellos endomor fismos para los que tengamos un núcleo no nulo (esto es, corresponda a un subespacio vectorial de 0 ∈   V   y   y algún otro elemendimensión mayor o igual que uno, al contener el vector   �  to), tendrán asociado un conjunto imagen de dimensión menor que la dimensión de V   . Y recordemos que todo ello puede leerse a partir de las soluciones del sistema de ecuaciones (en 47). ). base Efectivamente, si estoalocurre, la matriz quelineal representa al endomor fismo (47 la escogida, existe menos dada una combinación entre los n  vectores que forman las   filas de la matriz que den como resultado el vector nulo. Pero esto quiere decir que esos vectores no serían linealmente independientes, puesto que una combinación con coeficientes no nulos sería igual al vector cero. Con esto concluimos inmediatamente que:  Im (f   ) coincide  )  coincide con el número de vectores   fi la Lema  1.7.  La dimensión de  Im l a de la matriz asociada que sean linealmente independientes.

En consecuencia, debe existir el mismo número de vectores   fila y de vectores columna que sean linealmente independientes. Pero es evidente también que Lema  1.8.   Sea   f    :  V  

  → V    un endomor fi fismo. s  mo. Entonces, dimIm(f   ) + dim dim Ker Ker (f   ) = dim  V  

 

(48)

  Rank T  Definición 1.18.   Llamaremos  rango de   rango  de una matriz   T  T  y denotaremos por  Rank al número de vectores   fi la la o al número de vectores columna que son linealmente independientes. Análogamente, llamaremos  núcleo de   núcleo  de una matriz al subespacio generado  por las soluciones de la ecuación   (47) 47). Ambos conceptos están relacionados por la expresión Rank T  +   + dimKer T  = dim V,

 (48 48)). que re-escribe la ecuación  ( 3 Ejercicio  1.8.   Sea el endomor fi  fismo s  mo de fi  finido n   ido sobre   C en la forma:

 − i |e 3   6 |e 3  A|e 2   = 5|e 1  + 6| 0 A|e 3   = � 

6 |e 2 A|e 1  = 5|e 1 + 6|

Determinar la matriz del endomor fi  fismo s  mo en esa base. Determinar también su núcleo y  su rango.

 

28

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

6.3.. 6.3

Cambio Cambio d de e bas base e y conjug conjugaci ación. ón.  Hemos visto hasta ahora que la elección

de una base establece una relación unívoca entre un endomor fismo y una matriz cuadrada. Sin embargo, dado ¿qué que en Físicacuando no haycambiamos una base privilegiada respecto otras, es natural preguntarse, ocurre de base? ¿Hay algunaa relación entre la matriz que está asociada al endomorfismo en una de ellas y la que está asociada en la otra? La respuesta es afirmativa y es sencilla de obtener empleando la linealidad del endomor fismo. Consideremos entonces un endomorfismo  f   sobre   sobre un espacio vectorial V   , y dos bases   {|v  j } j =1,...,n   y   {|w α }α=1,...,n . Consideremos también la expresión de cada uno de los elementos de una base respecto a la otra, es decir:

 

|w α  =



C k α |v kk  





o |v  j   =



 β 

S  j |w  β  .



 β 

La información de estas transformaciones queda pues codi ficada en dos matrices:

C   =



C 11   C 12   . . .

C 1 n

C 21   C 22   . . .

2n

C n1   C n2   . . .

C n n

..   ..   ..   C..  . . . .

Evidentemente, ambas verifican que



S  =

S 11   S 12   . . .

S 1n

S 21   S 22   . . .

2n

S n1   S n2   . . .

S nn



..   ..   ..   S.. . . . .



(49)

 = In . CS  =  S  SC  C  =

Veamos ahora si podemos relacionar, usando estas matrices, las expresiones matriciales del endomorfismo   f   en   en una u otra base. Si consideramos que:



f   |v  j   =

 

T k  j |v kk  





y f   |w α  =



U  β α |w  β 



 β 

Podemos usar la expresión de una base respecto a la otra y escribir:  β 



f   |v  j   =



 k 

T   j |v k   =



  β 





S k T   j |w  β 



 

Si consideramos ahora la imagen de un vector arbitrario   |v  una de las bases tiene asociadas componentes  { x i }  y  { x α }: |v   =





x  j |v  j   =



 j 



x �α |w α  =



α

 α,k 

(50)

∈   V    , que en cada

x �α C  j α |v  j  ;



por lo que sabemos que las coordenadas en una y otra base están relacionadas como

  

x  j  =

C  j α x �α

(51)

α

Y con estas relaciones obtenemos:



f   |v   =

k   j  k    j,k  T   j x  |v k  β  �α αβ  U  α x  |w  β 





 

7. EL E ESP SPAC ACIO IO V VECTO ECTORIAL RIAL DE L LOS OS E ENDO NDOMORF MORFISMO ISMOS S DE UN E ESP SPACI ACIO O VECTOR VECTORIAL IAL

29

Pero si usamos la Ecuación (50 ( 50)) podemos escribir: f   |v   =



): Usando la ecuación (51 (51):



f   |v   =

 

k   j   j,k  T   j x  |v k   =  β  �α αβ  U  α x  |w  β 

  

k   j  k   =  j,k  T   j x  |v k   β  �α αβ  U  α x  |w  β 

 β  k   j   j,k , β  S k T   j x  |w  β 







 β  k   j   j,k , β  S k T   j x  |w  β 

 =



(52)



 β  k   j  �α  β   j,k, α, β  S k T   j C  α x  |w 



Dado que la expresión de un vector (siempre es el mismo,   f   |v ) en una misma base debe ser única, los coeficientes de   |w  β   en ambas expresiones tienen que coincidir. Además, siendo el vector   |v   arbitrario, la identificación tiene que valer por cualquier valor de   x �α , así que se deduce: U  β α  =



 β 

S k T k  j C  j α   =

 jk 



(C −1 ) β k T k  j C  j α  = (C −1 T C ) β α

 

(53)

 jk 

Definición  1.19.   Diremos que dos matrices   A   y   B   están   conjugadas  si existe  fica una matriz   Z , invertible, que veri fi  c  a que: B  =  Z −1 AZ 

  (54) Pero entonces, lo que hemos concluido del análisis anterior es Teorema  1.3.   Sea  f    :  V    →  V   un   un endomor fi  fismo. s  mo. Las expresiones que representan

la aplicación lineal respecto a dos bases arbitrarias de   V    están conjugadas entre sí, siendo la matriz invertible que las relaciona la matriz del cambio de base de una a la otra.

Es importante notar que, a pesar de que la anterior es la forma más frecuente de enfocar este problema, problema, podemos pensar también también en un esquema esquema más general en el que separamos la base de partida y de llegada. Basta con admitir que, incluso para el caso de un endomorfismo donde el espacio de salida y llegada es idéntico, se puede pensar en usar dos bases diferentes. Si pensamos entonces en una situación de este tipo, donde consideramos las bases   {|v k k }   y   {|w α }  como base de salida y llegada, podemos recuperar la expresión de la Ecuación (52 ( 52)) y darnos cuenta de que podemos también relacionar los desarrollos en la base   {|w α }   y afirmar que podemos asociar con la aplicación   f    la matriz:

 β  k  k T   j 

  → S

f  

que transforma las coordenadas  x  j  (respecto a la base  {| v  j }) en las coordenadas  x � β  (respecto a la base   {|w  β }). Usaremos este tipo de descomposiciones en el capítulo siguiente al considerar descomposiciones particularmente simples de una matriz dada. 7.

El espaci espacio o vector vectorial ial de de los en endom domor orfismos de un espacio vectorial

7.1.. Estruc 7.1 Estructur tura a de espaci espacio o vector vectorial ial..   Es una propiedad conocida, y de fácil demostración, que el conjunto de matrices sobre un cuerpo  K  de fine un espacio vectorial sobre el mismo, de dimensión  n 2 (siendo   n  la dimensión de las matrices) -o   nm si las matrices no son cuadradas, sino que tienen tamaño   n  ×  m -. En lo que sigue pensaremos solamente en endomorfismos y por consiguiente en matrices cuadradas, aunque casi todos los resultados son extensibles al caso general.

 

30

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

Vamos a considerar pues en lo que sigue el conjunto de matrices cuadradas de dimensión   n  con entradas pertenecientes a un cuerpo   K. Podemos pensar en estos elementos un “vector vectores”, que es lacomo forma quevector, se manejan las matrices encomo los lenguajes de de programación; o bien unen solo que tiene como longitud  n 2 :

  

a11   a12   . .. .. a21   a22   . .. ..

a1n a2n

an1   an2   . . .

ann

..   ..   ..   .. . . . .

  �→               2a f ila

primera f ila

n −esima f ila

 { a11 , . . . , a1n , a21 , . . . , a2n , . . . , an1 , . . . , ann }

Si no consideramos ninguna restricción sobre las matrices (como que sean si2 métricas, o invertibles, etc) , nuestro conjunto es pues isomorfo al conjunto   Kn . Denotaremos este conjunto como   M n (K) Una vez determinado el conjunto, podemos pasar a considerar si podemos extender al conjunto de matrices la operación suma de vectores que sabemos que existe n2 2   K al. lenguaje Efectivamente, es sencillo ver que dadas la operación que sobre traduce de matrices la operación suma de  dos Kn matrices, es:

   .. .

  ..  . 

a11   a12   . . .

a1n

a21   a22   . . .

a2n

+

  ..   ..   . .

an1   an2   . . .

   .. .

ann

  ..  . 

b 1 11 1   b 1 12 2   ...

b1 n

b 2 21 1   b 2 22 2   ...

b2 n

  ..   ..   . .

b n1   b n2   . . .

=

bnn  

  

a11 + b 1 11 1   a12 + b 1 12 2   ...

a1n + b 1n

a21 + b 2 21 1   a22 + b 2 22 2   ...

a2n + b 2n

.. .

 

...

 

.. .

an1 + b n1   an2 + b n2   . . .

 

.. .

ann + b n nn n

Y esta es precisamente la definición de la suma de matrices. Evidentemente, el elemento neutro para una suma así de finida corresponde a la matriz con todos los elementos nulos:

 

0   ...   0

�  0=

..   ..   .. . . .

0   ...   0

 

Análogamente, el producto por un elemento del cuerpo K, si tratamos las matrices como vectores, sería:

λ

  

a11   a12   . . . a21   a22   . . .

a1n a2n

an1   an2   . . .

ann

..   ..   ..   .. . . . .

  

=

  

λa11   λa12   . . .   λa1n λa21   λa22   . . .   λa2n

.. .

 

...   ...   ...

λan1   λan2   . . .   λann

  

.

2

Con estas dos relaciones, y usando el hecho de que sobre   Kn sabemos que definen una operación de espacio vectorial, probamos que: Lema  1.9.   El conjunto de matrices   M n (K)  tiene una estructura de espacio vectorial sobre el cuerpo   K.

  

.

 

7. EL E ESP SPAC ACIO IO V VECTO ECTORIAL RIAL DE L LOS OS E ENDO NDOMORF MORFISMO ISMOS S DE UN E ESP SPACI ACIO O VECTOR VECTORIAL IAL

31

Desde el punto de vista anterior anterior es sencillo entender entender que la base canónica de este espacio de matrices sea   E i j , definida por la matriz:  j 

E iij j    =



  

0   ...   0

   ←

0   ...   0

..   ..   ..   ..   ..   .. . . . . . .

0   ...

  1

  0   ...   0

0   ...   0

0   ...   0

..   ..   ..   ..   ..   .. . . . . . .

(55)  i 

2

Estas matrices traducen directamente los elementos de la base canónica de   K n a la forma de matrices. Ejercicio  1.9.   Probar que el conjunto   {E iij j  }  con   i , j   = 1, . . . , n  forman una base  de   M  M n (K).

Aunque no de forma directa se puede probar también usando el hecho de que son estructuras isomorfas que: fismos Corolario  1.1.   El conjunto de endomor fi  s  mos de un espacio vectorial   V    tiene   ). también estructura de espacio vectorial. Lo denotaremos como  End( como  End(V   ).

La justificación rigurosa no la presentaremos pero sí emplearemos en lo que sigue el resultado. 7.2. Producto de matrice matrices: s: estruct estructura ura de de álgebr álgebra. a.  Aunque no forme parte de la estructura de espacio vectorial, aprovecharemos aquí para implementar sobre este conjunto la ley de composición de endomorfismos que vimos en la sección anterior. Si consideramos la composición de dos endomorfismos   f  1   :   V    →   V    y   f  2   :   V    →   V   , definimos el objeto  f  2 ◦ f  1   :  V    →  V   . ¿Qué expresión adopta la matriz correspondiente? ¿Podemos escribir esa matriz en función de las matrices de   f  1   y   f  2 ? Supongamos entonces que  T 1   y   T 2  son las matrices correspondientes a los endomorfismos f  1  y  f  2 respecto a una cierta base de  V   ,  {| e  }. Sabemos que para determinar la expresión de la matriz asociada al endomorfismo  f  2 ◦ f  1  debemos escribir la imagen de un elemento arbitrario de la base en función de esta misma. Por tanto buscamos

una matriz   P  que cumpla que: f  2

 ◦ f  1 (|e  ) =  j 



P l  j |e l l  .





Consideramos la acción de cada una de las aplicaciones de forma consecutiva y la linealidad que asumimos que poseen:

 ◦ f  1(|e  ) = f  2

f  2

 j 

Pero como   f  2  es lineal, podemos escribir:

 ◦ f  1(|e  ) =

f  2

 j 

Descubrimos entonces:



     

(T 1 )k  j f  2 (|e k  k  )



(T 1 )k  j |e kk  

.



(T 2 )l  k (T 1 )k  j |e l l  .

=







 

32

1. ES ESP PACIOS CIOS VECT VECTOR ORIA IALE LES S COMP COMPLE LEJO JOS S Y SU SUS S ENDO ENDOMO MOFI FISM SMO OS

fismo s  mo compuesto   f  2 f  1  en una base  Lema  1.10.  La matriz asociada al endomor fi  dada   {|e  j  }  es el producto de las matrices asociadas a   f  1   y   f  2  en esa misma base, es  dada

 ◦



decir 

P l  j   =



(T 2 )l  k (T 1 )k  j 

 

(56)



Las propiedades de esta estructura de producto matricial (o equivalentemente de composición de endomorfismos) son bien conocidas: Lema  1.11.   Sea   M n (K)  el espacio vectorial de matrices y consideremos el producto de matrices   (56 56)). Entonces, el producto es asociativo, a sociativo, es decir, para cualesquiera tres matrices   A A 1 , A2 , A3 M n (K)  se cumple que:

 ∈

(A1 .A2 ).A3  =  A 1 .(A2 .A3 ); tiene un elemento neutro, que es la matriz identidad, esto es, para cualquier  A  M n (K)  se cumple que 

 ∈

A.In   = In .A =  A ;

el producto no es conmutativo, es decir, en general para dos matrices arbitrarias   A1 , A2  M n (K)

 ∈

A1 .A2 =  A 2 .A1

 

El conjunto de matrices   M k  k (K)  dotado de la operación suma de matrices ya vista y  la operación producto se convierte así en un  un   anillo asociativo con elemento neutro aunque no conmutativo. Si consideramos el conjunto y las tres operaciones, es decir, la operación producto  fi nida   ida sobre la estructura de espacio vectorial obtenemos una estructura de  álgebra de fi n de  álgebra asociativa y con elemento neutro. neutro. 7.3.. 7.3

La no existe existenci ncia a del inverso inverso del del producto producto..  Una de las propiedades que

más diferencia el producto de matrices del producto numérico usual es la conmutatividad, a la que ya nos hemos referido. Pero uno no menos importante es la no existencia de inverso para todas las matrices. En efecto sabemos que en cualquier cuerpo todo elemento tiene asociado un inversoo para la operación invers operación producto que pertenece pertenece al conjunto. Esto, sin embargo, embargo, no  ×  3  de finida como es cierto en el caso de una matriz. Por ejemplo, la matriz   3 × 3 A  =

 

1 0 0

0 1 0

0 0 0

 

,

no tiene inverso. Es decir, no existe ninguna matriz  B  de dimensión tres que veri fique AB  = I3 .

Si pensamos en el endomorfismo como una aplicación que transforma un espacio vectorial   V   por   por la transformación lineal:

    � �→ w   = Av   ∈∈  V ,

V    v 

 

(57)

 

7. EL E ESP SPAC ACIO IO V VECTO ECTORIAL RIAL DE L LOS OS E ENDO NDOMORF MORFISMO ISMOS S DE UN E ESP SPACI ACIO O VECTOR VECTORIAL IAL

33

es sencillo entender que esta transformaci transformación ón tendrá un inverso solo en aquellos casos en los que el rango de la matriz sea igual a la dimensión del espacio, o equivalentemente, en aquellos casos en los que el núcleo del endomor fismo se reduzca al vector �  0 :  Ker f    = �  0   → V   es   es invertible si y solo si  Ker

fismo  s  mo   f    :  V   Teorema  1.4.   Un endomor fi 

1.8 que  que la condición de que el núcleo se Demostración. Sabemos por el Lema   1.8 anule es equivalente a que el rango de la aplicación   f   sea   sea igual a la dimensión del espacio. Pero si el núcleo se anula también sabemos que la aplicación es inyectiva: a elementos distintos les corresponden imágenes diferentes. Al cubrir todos las posibles imágenes, sabemos que el endomor fismo define una biyección a través de (57 ( 57). ). Por tanto, la aplicación es invertible.   �

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF