Cours de Mécanique Quantique Tome II

September 12, 2017 | Author: Deedee81 | Category: Basis (Linear Algebra), Atoms, Quantum Mechanics, Special Relativity, Schrödinger Equation
Share Embed Donate


Short Description

Download Cours de Mécanique Quantique Tome II...

Description

Mécanique Quantique Tome I. Histoires, bases et anciennes théories I. Introduction II. Histoire III. Bases physiques IV. La théorie de Bohr V. L'expérience de Young VI. Principes de base Tome II. L'équation de Schrödinger I. Hamiltonien II. Equation de Schrödinger III. Applications IV. Etats liés V. Théorie des collisions VI. Formulation matricielle Annexes Tome III. Symétries et spin I. Théorie des groupes II. Symétries III. Spin IV. Particules identiques et spin V. Physique statistique VI. Formulation matricielle Annexes Tome IV. L'atome d'hydrogène, les atomes et la matière I. Atomes et molécules II. Rayonnement III. Structure hyperfine IV. Maser et Laser V. Matière VI. Le magnétisme VII. Supraconductivité Tome V. Mécanique quantique relativiste I. Vers une équation d'onde relativiste II. Equation de Dirac III. Solutions IV. Hydrogénoïdes V. Théorie des trous

VI. Propagation et diffusion Tome VI. Théories à variables cachées, théorèmes et décohérence I. L'intrication quantique II. Contextualité III. Autres théorèmes IV. Logique quantique V. Applications VI. Décohérence VII. Théorie de Bohm Tome VII. Interprétation de la mécanique quantique et classicalité I. Introduction II. Position du problème III. Interprétations IV. Expériences V. Du quantique au classique VI. Références

Tome II. L'équation de Schrödinger I. Hamiltonien I.1. Dépendances des amplitudes en fonction du temps I.1.1. Atomes au repos, états stationnaires I.1.2. Mouvement uniforme I.1.3. Energie potentielle, conservation de l'énergie I.1.4. Forces, la limite classique I.2. Matrice hamiltonienne I.2.1. Amplitudes et vecteurs I.2.2. Décomposition des vecteurs d'états I.2.3. Quels sont les états de base du monde ? I.2.4. Comment les états évoluent dans le temps I.2.5. La matrice hamiltonienne I.2.6. La molécule d'ammoniac I.3. Le méson K de charge nulle I.4. Généralisation aux systèmes à N états II. Equation de Schrödinger II.1. Développement de l'équation II.1.1. Propagation dans un réseau cristallin II.1.1.1. Etats d'un électron dans un réseau à une dimension II.1.1.2. Etats d'énergie définie II.1.1.3. Etats qui varient dans le temps II.1.1.4 Un électron dans un réseau à trois dimensions II.1.1.5. Autres états dans un réseau II.1.1.6. Diffusion par les imperfections dans un cristal II.1.1.7. Capture par une imperfection d'un réseau II.1.1.8. Amplitudes de diffusion et états liés II.1.2. Variation des amplitudes avec la position II.1.2.1. Les amplitudes le long d'une droite II.1.2.2. La fonction d'onde II.1.2.3. Les états de moment défini II.1.2.4. Normalisation des états en x II.1.3. L'équation de Schrödinger II.2. Interprétation de la fonction d'onde II.3. Les niveaux d'énergie quantifiés II.4. Fonctions propres et valeurs propres II.5. Postulats d'interprétation et fonctions propres de l'énergie

II.6. Fonctions propres de l'impulsion III. Applications III.1. Puits de potentiel carré à une dimension III.2. Mouvement d'un paquet d'ondes libre à une dimension IV. Etats liés IV.1. Oscillateur harmonique linéaire IV.2. Potentiels à symétrie sphérique à trois dimensions IV.3. Puits de potentiel carré à trois dimensions V. Théorie des collisions V.1. Barrière de potentiel carrée à une dimension V.2. Collisions à trois dimensions V.3. Diffusion par des potentiels à symétrie sphérique V.4. Diffusion par des potentiels complexes V.5. Diffusion par un champ coulombien VI. Formulation matricielle VI.1. Algèbre matricielle VI.2. Théorie des transformations VI.3. Equations du mouvement VI.4. Théorie matricielle de l'oscillateur harmonique Annexes A.1. Tableau des particules élémentaires

Tome II L'équation de Schrödinger Ce Tome II s'attaque à l'équation de Schrödinger si emblématique de la mécanique quantique. Non contente d'être au cœur de la théorie et des cours sur la mécanique quantique, elle a aussi une importance historique considérable puisque ce fut la première équation formulée dans ce nouveau cadre théorique. Lorsque Schrödinger la présenta la première fois, il fallut d'ailleurs un certain temps pour qu'il explique le cheminement qui l'avait conduit à cette équation qui semblait tomber du ciel. Depuis, bien entendu, elle est nettement mieux maîtrisée et sa déduction peut se faire de diverses manières. Ici nous effectuerons une approche de son élaboration en utilisant ce que nous avons vu, les amplitudes et leurs propriétés. Nous commencerons par revenir un peu sur le formalisme et par introduire la matrice hamiltonienne qui permet de décrire l'évolution des états au cours du temps. Puis, nous en viendrons à la déduction de l'équation de Schrödinger et quelques applications simples. Nous serons alors bien armés pour décrire les deux grands volets des systèmes quantiques : les états liés, comme l'atome, et les états non liés plus communément appelés collisions. Enfin, nous ferons le lien entre le formalisme de la fonction d'onde et un formalisme général, plus proche de celui des amplitudes que nous avons utilisé jusqu'ici et appelé formulation matricielle.

I. Hamiltonien La matrice hamiltonienne est la matrice qui permet d'étudier l'évolution des états quantiques au cours du temps. Le lien avec la formulation hamiltonienne de la mécanique analytique est d'ailleurs immédiat. Nous commencerons par étudier comment les amplitudes varient dans le temps. Puis, après être revenu quelque peu sur le formalisme, nous introduirons la matrice hamiltonienne. Enfin, armé de ce nouvel outil, nous pourrons étudier quelques systèmes simples à deux états.

I.1. Dépendances des amplitudes en fonction du temps I.1.1. Atomes au repos, états stationnaires Nous voudrions maintenant discuter un peu le comportement des amplitudes de probabilité en fonction du temps. Nous disons "un peu" parce que le comportement réel dans le temps implique nécessairement le comportement dans l'espace. On se trouve alors immédiatement entraîné dans la situation la plus compliquée qui soit, dès qu'on veut la décrire correctement et en détail. Nous retrouvons toujours cette difficulté : nous pouvons traiter quelconque chose soit de façon logiquement rigoureuse mais tout à fait abstraite, soit de façon pas rigoureuse du tout mais qui nous donne quelque idée de la situation réelle et en remettant à plus tard un traitement plus soigneux. En ce qui concerne la dépendance en énergie, nous prendrons la deuxième méthode. Nous ferons un grand nombre de pures affirmations. Nous n'essayerons pas d'être rigoureux, nous vous dirons juste les choses telles qu'on a trouvé qu'elles étaient, pour vous donner quelque idée du comportement des amplitudes en fonction du temps. Au cours de l'exposé, la description deviendra de plus en plus précise. Ne vous énervez donc pas si nous avons l'air de sortir les choses d'un chapeau. Bien sûr, ce chapeau contient tout : l'expérience et l'imagination des gens. Mais comme cela nous prendrait trop de temps de suivre le développement historique, nous devons faire un plongeon quelque part. Nous pourrions plonger dans l'abstrait et en déduire tout, ce que vous ne comprendriez pas, ou bien, nous pourrions discuter un grand nombre d'expériences pour justifier chaque affirmation. Nous avons choisi de faire quelque chose qui soit entre les deux. Un électron tout seul dans le vide peut, dans certaines circonstances, avoir une énergie bien définie. Par exemple, s'il est au repos (c'est-à-dire s'il n'a pas de mouvement de translation, pas d'impulsion ni d'énergie cinétique), il a son "énergie de repos". Un objet plus compliqué comme un atome peut aussi avoir une énergie définie quand il est arrêté, mais il peut aussi être excité et être dans l'un de ses niveaux d'énergie (nous décrirons plus tard la machinerie qui est derrière tout cela, il suffit juste de savoir pour le moment que les expériences de spectroscopie confirment cela). Nous considérerons souvent un atome dans un état excité comme ayant une énergie définie mais, en réalité, cela n'est qu'approximatif. Un atome ne reste pas excité éternellement car il peut se décharger de son énergie grâce à son interaction avec le champ électromagnétique. Il y a donc une certaine amplitude pour qu'un nouvel état soit créé, l'atome étant dans un état d'excitation plus bas

et le champ électromagnétique dans un état supérieur (émission d'un photon). L'énergie totale du système est la même avant et après mais l'énergie totale de l'atome est réduite. Si bien qu'il est inexact de dire qu'un atome excité a une énergie bien définie. Mais c'est souvent commode et ce n'est pas trop faux. Incidemment, pourquoi cela se passe-t-il toujours dans le même sens ? Pourquoi un atome rayonnet-il de la lumière ? La réponse a quelque chose à voir avec l'entropie. Lorsque l'énergie est dans le champ électromagnétique, elle peut y être de tant de façons différentes, elle a tellement de places où elle peut aller, que si nous cherchons les conditions d'équilibre, nous trouvons que, dans la situation la plus probable; le champ est excité, c'est un photon, et l'atome est désexcité. Il faut au photon beaucoup de temps pour revenir à la même place et trouver qu'il peut cogner l'atome à nouveau. C'est tout à fait analogue au problème classique : pourquoi une charge accélérée rayonnet-elle (elle pourrait très bien changer de direction sous l'impact d'un photon) ? Ce n'est pas parce qu'elle "veut" perdre de l'énergie, car, en fait, lorsqu'elle rayonne, l'énergie du monde est la même qu'avant. Radiation ou absorption vont toujours dans le sens de l'entropie croissante. La situation est d'ailleurs différente lorsque l'atome est placé dans un bain de photons. Le champ électromagnétique est alors hautement excité et l'atome a nettement plus de chance d'absorber un photon. Nous reviendrons plus tard sur ce problème dit de la "flèche du temps" d'une manière beaucoup plus générale. Les noyaux peuvent aussi exister dans différents niveaux d'énergie et, à l'approximation où l'on néglige tous les effets électromagnétiques, nous pouvons dire qu'un noyau dans un état excité y reste. Bien que nous sachions qu'il n'y reste pas toujours, il est souvent utile de commencer avec une approximation quelque peu idéalisée et plus facile à résoudre. De plus, c'est aussi une approximation légitime dans certaines circonstances. Un exemple typique est l'introduction de la loi de la chute des corps où l'on néglige d'abord la friction et pourtant il n'y a presque aucun cas où il n'y ait une certaine friction. Il y a ensuite les "particules étranges", subnucléaires, et qui ont des masses variées. Mais les plus lourdes se désintègrent spontanément en donnant les plus légères, si bien qu'à nouveau il n'est pas correct de dire qu'elles ont une énergie définie avec précision. Ceci ne serait vrai que si elles vivaient éternellement. Si bien que lorsque nous faisons l'approximation qu'elles ont une énergie

définie, nous oublions le fait qu'elles doivent exploser. Pour le moment, nous oublierons donc, intentionnellement de tels processus et nous apprendrons plus tard comment les prendre en compte. Supposons que nous ayons un atome ou un électron ou n'importe quelle particule qui a au repos une énergie bien définie E 0 . Ce que nous voulons dire par l'énergie E 0 est la masse de l'objet tout entier multipliée par c 2 . Cette masse comprend toute énergie interne, si bien qu'un atome excité a une masse différente de la masse du même atome dans son état fondamental (l'état fondamental est l'état de plus basse énergie). Nous appellerons E 0 "l'énergie au repos". Pour un atome au repos, l'amplitude quantique pour trouver l'atome en un certain endroit est la même partout. Elle ne dépend pas de la position. Cela signifie, bien entendu, que la probabilité de trouver l'atome est partout la même. Mais cela veut dire plus. La probabilité pourrait être indépendante de la position, la phase de l'amplitude, elle, changeant de point en point. Mais, pour une particule au repos, l'amplitude complète est partout la même. Elle dépend cependant du temps. Pour une particule dans état d'énergie défini E 0 , l'amplitude pour trouver la particule en (x, y, z) au temps t est (1) ae − i ( E0 / h )t où a est une certaine constante. L'amplitude pour être en un point quelconque de l'espace est la même pour tous les points, mais elle dépend du temps suivant (1). Nous supposerons simplement que cette règle est vraie. Notons toutefois que cela correspond à une onde stationnaire de longueur d'onde nulle, ce qui est évident si l'on se souvient de la règle de de Broglie liant vitesse et longueur d'onde et sa fréquence est simplement donnée par la règle liant énergie et fréquence. Bien entendu, nous pourrions aussi écrire (1) comme (2) ae − iωt avec (3) hω = hν = E 0 = mc 2 où m est la masse au repos de l'état atomique ou de la particule. Il a trois façons différentes de spécifier l'énergie : par la fréquence d'une amplitude, par l'énergie au sens classique ou par l'inertie. Elles sont toutes équivalentes. Ce sont seulement des façons différentes de dire la même chose.

Vous pensez peut-être qu'il est étrange de penser d'une "particule" qu'elle a la même amplitude pour être trouvée partout dans l'espace. Après tout, nous imaginons d'habitude comme un petit objet situé "quelque part". Mais n'oubliez pas le principe d'indétermination. Si une particule a une énergie définie, elle a aussi une impulsion définie. Si l'incertitude sur l'impulsion est zéro, la relation d'indétermination, ∆p∆x ≥ h , nous dit que l'incertitude sur la position doit être infinie et c'est exactement ce que nous disons quand nous disons qu'il y a la même amplitude pour trouver la particule en tout point de l'espace. Ce caractère ubiquiste est également lié au fait que la particule a aussi des caractéristiques ondulatoires, bien sûr. Si les différentes parties d'un atome sont dans des états différents avec différentes énergies totales, alors, la variation de l'amplitude dans le temps est différente. Si vous ne savez pas dans quel état se trouve l'atome, il y aura une certaine amplitude pour qu'il soit dans un état et une certaine amplitude pour qu'il soit dans un autre et chacune de ces amplitudes aura une fréquence différente. Il y aura une interférence, comme dans un battement, entre ces différentes composantes et elle pourra apparaître comme une probabilité variant dans le temps. Quelque chose "se passera" dans l'atome, même si celui-ci est "au repos", c'est-à-dire si son centre de gravité ne se déplace pas. Par contre, si l'atome a une énergie bien définie et si vous cherchez n'importe quelle probabilité le concernant, la réponse est indépendante du temps. Quoique les amplitudes dépendent du temps, si l'énergie est définie, elles changent comme l'exponentielle d'un nombre imaginaire pur et leur module ne change pas. C'est pourquoi nous disons souvent qu'un atome dans un état d'énergie définie est dans un état stationnaire. Quelles que soient les mesures que vous faites de ce qui est à l'intérieur, vous trouverez que rien ne change avec le temps (pour les probabilités). Pour que les probabilités changent dans le temps, il faut avoir une interférence de deux amplitudes ayant des fréquences différentes et cela veut dire que nous ne pouvons pas savoir quelle est l'énergie. L'objet considéré aura une amplitude pour être dans un des états d'énergie et une autre amplitude pour être dans l'autre état d'énergie. C'est là la description quantique des choses dont le comportement dépend du temps.

Si nous avons des conditions telles qu'il y ait un mélange de deux états différents avec des énergies différentes, alors l'amplitude de chacun des deux états change avec le temps suivant l'équation (2), comme, par exemple −i (R / h )t − i ( E / h )t (4) e 1 et e 2 Et si nous avons une certaine combinaison des deux, nous aurons une interférence. Mais remarquez que rien ne changerait si nous ajoutions une constante aux deux énergies. Si quelqu'un d'autre utilisait une échelle d'énergie différente, dans laquelle toutes les énergies seraient augmentées (ou diminuées) d'une quantité donnée, disons A, les amplitudes des deux états seraient alors, du point de vue de ce quelqu'un −i (E + A )t / h −i (E + A )t / h (5) e 1 et e 2 Toutes ces amplitudes seraient multipliées par le même facteur e −i ( A / h )t et toutes les combinaisons linéaires ou les interférences auraient le même facteur. Lorsque nous prenons le carré du module pour trouver les probabilités, tous les résultats sont identiques. Le choix d'une origine pour notre échelle d'énergie ne change rien. Nous pouvons mesurer l'énergie à partir de n'importe quel zéro. Des considérations relativistes montrent qu'il est plus élégant de mesurer les énergies de telle façon que la masse au repos y soit comprise, mais, pour beaucoup de discussions non relativistes, il est souvent agréable de soustraire une certaine quantité standard de toutes les énergies considérées. Par exemple, dans le cas d'un atome, il est commode, d'habitude, de soustraire l'énergie m s c 2 où ms est la masse de l'ensemble des morceaux, le noyau et les électrons, lorsqu'ils sont séparés, ce qui, bien entendu, est différent de la masse de l'atome tout entier dans son état fondamental. L'énergie qui apparaît alors est juste l'énergie d'excitation de l'atome. Par conséquent, nous déplacerons parfois notre zéro d'énergie d'une constante très grande mais cela ne changera rien à condition que nous déplacions d'une même constante toutes les énergies apparaissant dans un calcul donné. Voilà pour ce qui concerne une particule au repos.

I.1.2. Mouvement uniforme Si nous admettons que la théorie de la relativité est juste, une particule au repos dans un système d'inertie peut être en mouvement uniforme dans un autre système d'inertie. Dans le système de la particule au repos, l'amplitude de probabilité est la même pour tous les x, y, z mais elle change avec t. La grandeur de l'amplitude est la même pour tout t mais la phase dépend de t. Nous pouvons faire une image du comportement de l'amplitude en traçant les lignes d'égales phases, disons les lignes de phase zéro, en fonction de x et de t. Pour une particule au repos, ces lignes d'égale phase sont parallèles à l'axe x et sont également espacées le long de la coordonnée t, comme le montrent les lignes en pointillés de la figure ci-dessous.

Dans un autre système de coordonnées ( x ′, y ′, z ′, t ′) , en mouvement par rapport à la particule, disons dans la direction x, les coordonnées x ′ et t ′ de tout point de l'espace sont reliées à x et à t par les transformations de Lorentz. Cette transformation peut être représentée graphiquement en traçant les axes x ′ et t ′ comme on l'a fait ci-dessus. Vous pouvez voir que dans le système x ′ , t ′ les points d'égale phase ont un espacement différent le long de l'axe t ′ si bien que la fréquence de

la variation dans le temps est différente (nous supposerons que la phase doit avoir la même valeur pour des points correspondant des deux systèmes). C'est là un point subtil puisque la phase d'une amplitude quantique est pour une grande part arbitraire puisque l'on mesure uniquement des probabilités. Une justification complète de cette hypothèse demande une discussion plus détaillée qui tienne compte des interférences de deux ou d'un plus grand nombre d'amplitudes. Mais on en devine aisément le contenu puisque deux phases s'annulant par interférence donnent une amplitude nulle et donc une probabilité et la non survenance d'un événement doit être indépendante du référentiel choisi. Seule une phase constante arbitraire pourrait être ajoutée aux amplitudes et on peut la choisir nulle. Il y a aussi une variation de la phase avec x ′ si bien que l'amplitude de probabilité doit être une fonction de x ′ . Dans une transformation de Lorentz de vélocité v, dans la direction des x négatifs par exemple, le temps t est relié au temps t ′ par t ′ − x ′v / c 2 (1) t = 1− v2 / c2 si bien que notre amplitude varie maintenant comme (2) e

− ( i / h ) E0 t

=e

  − (i / h ) E0t ′ / 1− v 2 / c 2 − E0 vx ′ / c 2 1− v 2 / c 2   

Dans le système primé, elle varie dans l'espace aussi bien que dans le temps. Si nous écrivons l'amplitude comme (3) e

− (i / h ) E ′p t ′ − p ′x′   

nous voyons que E ′p = E0 / 1 − v 2 / c 2 est l'énergie calculée classiquement pour une particule d'énergie au repos E 0 voyageant avec la vitesse v et p ′ = E ′p v / c 2 est l'impulsion correspondante. Vous savez que x µ = (t , x, y, z ) et p µ = (E , p x , p y , p s ) sont des quadrivecteurs et que p µ x µ = Et − p ⋅ x est un scalaire invariant. Dans le système de la particule au repos, p µ x µ est exactement Et. Donc, si nous passons dans un autre système, Et sera remplacé par (4) E ′t ′ − p ′ ⋅ x ′

L'amplitude de probabilité d'une particule d'impulsion p sera alors proportionnelle à − (i / h ) E t − p⋅x 

 p  (5) e où E p est l'énergie d'une particule d'impulsion p, c'est-à-dire

(6) E p =

( pc )2 + E 02

où, comme auparavant, E 0 est l'énergie au repos. Pour les problèmes non relativistes, nous pouvons écrire (7) E p = m s c 2 + W p où W p est l'énergie que l'atome a, en plus de l'énergie au repos m s c 2 de ses constituants. En général, W p inclut à la fois l'énergie cinétique de l'atome et son énergie de liaison ou son énergie d'excitation, que nous pouvons appeler "l'énergie interne". Nous écrirons alors p2 (8) W p = Wint + 2m et l'amplitude serait (9) e

− (i / h ) W p t −p⋅x   

Comme nous ferons en général des calculs non relativistes, nous utiliserons cette expression pour les amplitudes de probabilité. Remarquons que notre transformation relativiste nous a donné la variation de l'amplitude d'un atome qui se déplace dans l'espace, sans aucune hypothèse supplémentaire. Le nombre d'ondes, pour la variation dans l'espace est, d'après (9), p (10) k = h si bien que la longueur d'onde est 2π h (11) λ = = k p

C'est la même longueur d'onde que nous avons employée auparavant pour des particules d'impulsion p. Cette formule fut tout d'abord obtenue par de Broglie, exactement de cette façon. Pour une particule en mouvement, la fréquence des variations d'amplitude est encore donnée par (12) hω = W p Le carré du module de (9) est exactement 1 et, par conséquent, pour une particule en mouvement, ayant une énergie bien définie, la probabilité de la trouver est la même partout et ne change pas avec le temps (il est important de remarquer que l'amplitude est une onde complexe. Si nous utilisions une onde sinusoïdale réelle, son carré changerait de point en point, ce qui ne peut être correct). Nous savons, bien entendu, qu'il y a des situations où les particules vont d'une place à une autre si bien que leur probabilité dépend de la position et change avec le temps. Comment décrivons-nous de telles situations ? Nous pouvons le faire en considérant des amplitudes qui sont des superpositions de deux amplitudes (ou plus), chacune correspondant à un état d'énergie définie. Le calcul est semblable à celui de l'optique et la somme de deux amplitudes ayant des nombres d'onde k (c'est-à-dire des impulsions) et des fréquences ω (c'est-à-dire des énergies) différentes donnent des bosses d'interférence, ou des battements, si bien que le carré de l'amplitude varie dans l'espace et dans le temps. Ces battements se déplacent avec une "vitesse de groupe" donnée par ∆ω (13) v g = ∆k où ∆k et ∆ω sont les différences entre les nombres d'ondes et les fréquences des deux ondes. Pour des ondes plus compliquées, constituées de la somme de plusieurs amplitudes, toutes proche d'une même fréquence, la vitesse de groupe est dω (14) v g = dk En prenant ω = E p / h et k = p / h , nous voyons que (15) v g =

dE p dp

En utilisant l'équation (6), nous avons dE p p (16) = c2 dp Ep Mais E p = mc 2 , si bien que

dE p

p dp m ce qui est précisément la vitesse classique. De même, si nous utilisons l'expression non relativiste, nous avons Wp p (18) ω = et k = h h et dω dW d  p2  p  = (19) = = dk dp dp  2m  m qui est à nouveau la vitesse classique. (17)

=

Notre résultat est alors le suivant : si nous avons plusieurs amplitudes pour des états purs d'énergie ayant presque la même énergie, leur interférence donne des "bosses" dont la probabilité et celles-ci se déplacent dans l'espace avec la vitesse d'une particule classique ayant cette énergie. Nous devons remarquer, cependant, que lorsque nous disons que nous pouvons ajouter deux amplitudes ayant des nombres d'ondes différents, pour obtenir un battement correspondant à une particule en mouvement, nous avons introduit quelque chose de nouveau, quelque chose que nous ne pouvons pas déduire de la théorie de la relativité. Nous avons décrit ce qu'était l'amplitude d'une particule à l'arrêt et nous avons déduit ensuite ce qu'elle deviendrait si la particule était en mouvement. Mais nous ne pouvons pas déduire de ces arguments ce qui se passerait s'il y avait deux ondes se déplaçant avec des vitesses différentes. Si nous arrêtons l'une, nous ne pouvons pas arrêter l'autre. Nous avons donc ajouté tacitement l'hypothèse supplémentaire que non seulement (9) est une solution possible mais encore qu'il peut y avoir de telles solutions avec différentes valeurs de p pour ce même référentiel et que les différents termes interfèrent.

I.1.3. Energie potentielle, conservation de l'énergie Nous voudrions discuter maintenant ce qui se passe lorsque l'énergie de la particule peut changer. Nous commençons en imaginant une particule qui se déplace dans un champ de forces décrit par un potentiel. Nous discutons tout d'abord l'effet d'un potentiel constant. Supposons que nous ayons une grande boite en métal, que nous avons chargée à un potentiel électrostatique φ comme ci-dessous.

S'il y a des objets chargés à l'intérieur de la boite, leur énergie potentielle est qφ , ce que nous appellerons V, et elle est absolument indépendante de la position. La physique ne peut donc pas changer à l'intérieur car un potentiel constant n'introduit aucune différence en ce qui concerne ce qui se passe à l'intérieur de la boite. Nous n'avons maintenant aucun moyen de déduire la réponse si bien que nous devons la deviner. La façon de deviner qui marche est plus ou moins ce que vous attendiez : pour l'énergie, nous devons employer la somme de l'énergie potentielle V et de l'énergie E p qui est elle-même la somme des énergies internes et cinétiques. L'amplitude est proportionnelle à (1) e

− (i / h )  E p +V  t −p⋅x    

Le principe général est que le coefficient de t, que nous pouvons appeler ω , est toujours donné par l'énergie totale du système : énergie interne (ou "masse"), plus énergie cinétique, plus énergie potentielle : (2) hω = E p + V Ou, dans les situations non relativistes, p2 (3) hω = Wint + +V 2m Que peut-on dire maintenant des phénomènes physiques à l'intérieur de la boite ? Qu'obtiendronsnous s'il y a différents états d'énergie ? L'amplitude de chaque état a le même facteur supplémentaire (4) e − (i / h )Vt par rapport à ce qu'elle serait pour V = 0. C'est exactement comme un changement du zéro de l'échelle d'énergie. Cela produit un même changement de phase pour toutes les amplitudes mais, comme nous l'avons vu auparavant, cela ne change aucune des probabilités. Tous les phénomènes physiques sont les mêmes (nous avons supposé que nous parlions de différents états d'un même objet chargé, si bien que qφ est le même pour tous les états. Si un objet pouvait modifier sa charge en passant d'un état dans un autre nous obtiendrions un résultat tout à fait différent. La conservation de la charge évite cela). Jusqu'ici, notre hypothèse est en accord avec ce que nous attendions d'un changement de niveau de référence pour l'énergie. Mais, si elle est vraiment exacte elle devrait également être vraie pour une énergie potentielle qui n'est pas une simple constante. En général, V peut changer de façon arbitraire, à la fois dans le temps et dans l'espace, et le résultat complet pour l'amplitude doit être exprimé par une équation différentielle. Nous n'avons pas l'intention de nous occuper du cas général dès maintenant et nous voulons seulement avoir quelque idée de la façon dont les choses se passent, si bien que nous ne considérerons qu'un potentiel constant dans le temps et variant lentement dans l'espace. Nous pourrons alors faire la comparaison entre les idées classiques et quantiques.

Supposez que nous considérions la situation ci-dessus où l'on a deux boites maintenues à des potentiels constants φ1 et φ 2 et une région intermédiaire où nous supposerons que le potentiel varie doucement d'une boite à l'autre. Nous imaginons qu'une certaine particule a une amplitude pour être trouvée dans l'une de ces régions. Nous supposons aussi que l'impulsion est suffisament grande pour que le potentiel soit presque constant dans n'importe quelle petite région contenant plusieurs longueurs d'onde. On peut alors penser que l'amplitude doit avoir la forme (1) dans toute région de l'espace avec le V correspondant à cette région.

Considérons le cas spécial dans lequel φ1 = 0 , si bien que l'énergie potentielle est zéro à gauche et où de plus qφ 2 est négatif, si bien que, classiquement, la particule aurait plus d'énergie dans la deuxième boite. Classiquement, elle irait plus vite dans la deuxième boite, elle aurait plus d'énergie et, par conséquent, plus d'impulsion. Voyons maintenant comment tout cela peut sortir de la mécanique quantique. Avec notre hypothèse, l'amplitude dans la première boite serait proportionnelle à − (i / h )  Wint + p12 / 2 m +V1  t − p1⋅x 

   (5) e et l'amplitude dans la seconde boite serait proportionnelle à

(6) e − (i / h )[(Wint + p2 / 2 m +V2 )t −p 2 ⋅x ] (nous admettons que l'énergie interne ne change pas et reste la même dans les deux régions). La question est alors : comment les deux amplitudes se raccordent-elles dans la région entre les deux boites ? 2

Nous allons supposer que les potentiels sont tous constants dans le temps, si bien que rien ne change dans les conditions du problème. Nous supposerons alors que les variations de l'amplitude (c'est-à-dire de la phase) ont la même fréquence partout, car, pour ainsi dire, il n'y a rien dans le "milieu" qui change avec le temps. Si rien ne change dans l'espace, nous pouvons considérer que l'onde d'une région "engendre" des ondes secondaires dans tout l'espace, oscillant toutes à la même fréquence, exactement comme des ondes lumineuses passant à travers des objets au repos sans changer de fréquence. Si les fréquences de (5) et (6) sont les mêmes, il faut que nous ayons p2 p2 (7) Wint + 1 + V1 = Wint + 2 + V2 2m 2m Les deux membres de cette équation ne sont rien d'autre que des énergies totales classiques, si bien que (7) est un énoncé de la conservation de l'énergie. En d'autres termes, l'énoncé classique de la conservation de l'énergie est équivalent à l'énoncé quantique, selon lequel la fréquence d'une particule est la même partout si les conditions ne changent pas avec le temps. Tout cela est en accord avec l'idée que hω = E . C'est aussi une justification d cette règle quantique.

Dans le cas particulier où V1 = 0 et V2 est négatif, l'équation (7) montre que p 2 est plus grand que p1 et, par conséquent, que la longueur d'onde des ondes est plus petite dans la région 2. Les surfaces d'égale phase sont indiquées par les lignes en tirets dans la figure. Nous avons fait aussi un dessin de la partie réelle de l'amplitude qui montre à nouveau comment la longueur d'onde décroît en passant de la région 1 à la région 2. La vitesse de groupe des ondes, qui est p / m , augmente également de la façon prévue d'après la conservation classique de l'énergie puisque celle-ci n'est rien d'autre que l'équation (7). Il y a un cas particulier intéressant où V2 devient si grand que V2 − V1 devient plus grand que

p12 / 2m . Alors p 22 , qui est donné par

 p2  (10) p 22 = 2m  1 − V2 + V1   2m  est négatif. Cela veut dire que p 2 est un nombre imaginaire, disons ip ′ . Classiquement, nous dirions que la particule n'entre jamais dans la région 2, elle n'a pas assez d'énergie pour escalader la barrière de potentiel. Cependant, quantiquement, l'amplitude est encore donnée par (6). Sa variation dans l'espace est encore comme (11) e(i / h )p 2 ⋅x Mais si p 2 est imaginaire, la variation dans l'espace devient celle d'une exponentielle réelle. Admettons que la particule va initialement dans la direction +x. L'amplitude varie alors comme (12) e − p′x / h L'amplitude décroît rapidement avec les x croissants

Imaginez que les deux régions avec des potentiels différents soient très proches l'une de l'autre, si bien que l'énergie potentielle change brusquement de V1 à V2 comme le montre la figure (a) cidessus. Si nous dessinons la partie réelle de l'amplitude de probabilité, nous obtenons la dépendance indiquée sur la partie (b) de la figure. L'onde de la première région correspond à une particule essayant d'aller dans la seconde région, mais là, l'amplitude décroît très vite. Il y a une certaine chance pour qu'elle soit observée dans la seconde région, là où elle ne pourrait jamais aller classiquement, mais l'amplitude est très petite sauf au voisinage de la frontière. La situation est très semblable avec la réflexion interne de la lumière. Normalement la lumière ne sort pas, mais nous

pouvons l'observer si nous plaçons quelque chose à moins d'une ou deux longueurs d'onde de la surface (ondes évanescentes). De même, si l'on place une seconde surface près de celle où la lumière se réfléchit complètement, on peut obtenir un peu de lumière transmise dans le deuxième milieu. Il se passe quelque chose de semblable pour les particules en mécanique quantique.

S'il y a, dans une petite région, un potentiel V, assez grand pour que l'énergie cinétique classique soit négative, une particule classique ne peut jamais passer au travers. Mais quantiquement, l'amplitude, qui décroît exponentiellement, peut passer à travers cette région et donner une petite probabilité pour que la particule soit trouvée de l'autre coté, là où l'énergie cinétique est à nouveau positive. La situation est illustrée ci-dessus. Cet effet est appelé "pénétration d'une barrière de potentiel" ou "effet tunnel".

La pénétration d'une barrière par une amplitude quantique donne l'explication, ou la description, de la désintégration α du noyau d'uranium. L'énergie potentielle d'une particule α, comme fonction de la distance au centre est indiquée dans la figure (a) ci-dessus. Si on essayait de tirer une particule α d'énergie E dans le noyau, elle subirait une répulsion électrostatique de la part de la charge nucléaire Z et, classiquement, elle ne viendrait pas à une distance du noyau plus petite que r1 , là où son énergie totale est égale à l'énergie potentielle V. Pourtant, plus près, l'énergie potentielle est beaucoup plus basse à cause de la forte attraction due aux forces nucléaires à courte portée. Comment se fait-il alors que, dans une désintégration radioactive, nous trouvions des particules α

qui sont parties de l'intérieur du noyau et en sortent avec l'énergie E ? C'est parce qu'elles partent de l'intérieur du noyau avec l'énergie E et "s'infiltrent" à travers la barrière de potentiel. L'amplitude de probabilité est à peu près comme on l'a esquissée dans la partie (b) ci-dessus, quoique la décroissance exponentielle soit en fait beaucoup plus rapide que celle qui est indiquée. Il est en fait tout à fait remarquable que la vie moyenne d'une particule α dans le noyau d'uranium soit aussi grande que 4 milliards et demi d'années, alors que les oscillations naturelles à l'intérieur du noyau sont aussi rapides, de l'ordre de 10 22 par secondes ! Comment peut-on obtenir un nombre comme 10 9 années à partir de 10 −22 seconde ? La solution vient de ce que l'exponentielle donne un facteur terriblement petit de l'ordre de e −45 , ce qui donne une probabilité de fuite très petite, quoique définie. Une fois qu'une particule α est dans le noyau, il n'y a presque pas d'amplitude pour la trouver au dehors. Cependant, si vous prenez assez de noyaux et si vous attendez assez longtemps, vous pouvez avoir de la chance et en trouver une qui est sortie.

I.1.4. Forces, la limite classique Supposez que nous ayons une particule en mouvement, passant à travers une région où il y a un potentiel qui varie à angle droit avec le mouvement. Classiquement nous décririons la situation comme on l'a esquissée ci-dessous.

Si la particule se déplace le long de x et entre dans une région où il y a un potentiel qui varie avec y, la particule subit une accélération transverse due à la force F = −∂V / ∂y . Si la force n'est présente que dans une région bien limitée de largeur w, la force n'agit que le temps w/v. La particule reçoit une impulsion transverse w (1) p y = F v L'angle de déflexion δθ est alors p y Fw (2) δθ = = p pv où p est l'impulsion initiale. En employant − ∂V / ∂y pour F, nous obtenons

(3) δθ = −

w ∂V pv ∂y

A nous maintenant de voir si notre idée que les ondes se comportent comme dans la section précédente permet d'expliquer ce même résultat. Nous considérons le même problème quantiquement, en admettant que tout est très grand en comparaison de la longueur d'onde de nos amplitudes de probabilité. Dans n'importe quelle petite région, nous pouvons dire que l'amplitude varie comme (4) e − (i / h )[(W + p

2

)

/ 2 m +V t − p⋅x

]

Pouvons-nous montrer que ceci donne une déflexion de la particule lorsque V a un gradient transversal ? Sur la figure ci-dessus nous avons esquissé ce à quoi ressembleront les ondes d'amplitudes de probabilité. Nous avons dessiné un ensemble de "nœuds" de ces ondes, que vous imaginez comme des surfaces où la phase de l'amplitude est zéro. Dans n'importe quelle petite région, la longueur d'onde, la distance entre deux nœuds successifs, est h (5) λ = p

où p est relié à V par p2 (6) W + + V = const. 2m Dans la région où V est grand, p est plus petit et la longueur d'onde est plus grande. Si bien que l'angle des plans nodaux change comme le montre la figure. Pour trouver la façon dont l'angle entre les plans nodaux change, nous remarquons qu'il y a une différence de potentiel ∆V = (∂V / ∂y )D entre les deux chemins a et b de la figure, si bien qu'il y a une différence ∆p entre les impulsions des deux chemins qui peut être obtenue à partir de (6) :

 p2  p  = ∆p = −∆V (7) ∆  2m  m Le nombre d'ondes p / h est par conséquent différent le long des deux chemins, ce qui signifie que les phases évoluent de façons différentes. La différence entre les accroissements de phase est ∆k = ∆p / h , si bien que la différence de phase accumulée sur la distance totale w est ∆p m ⋅w = − ∆V ⋅ w (8) ∆( phase ) = ∆k ⋅ w = h ph Ceci donne la quantité dont la phase du chemin b est "en avance" sur la phase du chemin a, lorsque les ondes sortent du potentiel. En dehors du potentiel une telle avance de phase correspond à une avance du plan nodal de λ h (9) ∆x = ∆( phase ) = ∆( phase ) 2π p ou m (10) ∆x = − 2 ∆V ⋅ w p

En nous rapportant à la figure, nous voyons que les nouveaux fronts d'onde font un angle δθ donné par (11) ∆x = Dδθ si bien que nous avons m (12) Dδθ = − 2 ∆V ⋅ w p Ceci est identique à l'équation (3) si nous remplaçons p / m par v et ∆V / D par ∂V / ∂y . Le résultat que nous venons d'obtenir n'est correct que si les variations du potentiel sont lentes et sans discontinuités, ce que nous appelons la limite classique. Nous avons montré que dans ces conditions nous obtenons, pour une particule, le même mouvement que celui que nous avions obtenu à partir de F = ma , à la condition que nous supposions que le potentiel change la phase de l'amplitude de probabilité d'une quantité égale à Vt / h . A la limite classique, la mécanique quantique est en accord avec la mécanique newtonienne.

I.2. Matrice hamiltonienne I.2.1. Amplitudes et vecteurs Avant d'introduire la notion de matrice hamiltonienne, revenons sur le formalisme mathématique de la mécanique quantique que nous avons déjà présenté et que nous allons approfondir un peu au risque de quelques répétitions. La première idée est la grande ressemblance mathématique entre les équations de la mécanique quantique et le produit scalaire de deux vecteurs. Vous vous rappelez que si χ et φ sont deux états, l'amplitude pour partir de φ et finir en χ peut être écrite comme la somme, su un ensemble complet d'états de base, des amplitudes pour aller de φ jusqu'à l'un des états de base et ensuite de cet état de base jusqu'en χ : (1) χ φ =



χ i iφ

tout i

Nous voulons comparer l'équation (1) avec la formule du produit scalaire de deux vecteurs B et A. Si B et A sont des vecteurs ordinaires à trois dimensions, nous pouvons écrire le produit scalaire de cette façon : (2) ∑ (B ⋅ e i )(e i ⋅ A ) tout i

avec la convention que le symbole e i indique les trois vecteurs unité selon les directions x, y et z.

B ⋅ e1 est alors ce que nous appelons d'habitude B x , B ⋅ e 2 est ce que nous appelons d'habitude B y et ainsi de suite. L'équation (2) est donc équivalente à (3) B x Ax + B y Ay + B z Az qui est le produit scalaire B ⋅ A . En comparant les équations (1) et (2), nous pouvons voir l'analogie suivante : les états φ et χ correspondent aux deux vecteurs A et B. Les états de base i correspondent aux vecteurs particuliers

e i , par rapport auxquels nous rapportons tous les autres vecteurs. Tout vecteur peut être représenté comme une combinaison linéaire de trois "vecteurs de base" e i . De plus, si vous connaissez les coefficients de chaque vecteur de base dans cette combinaison, c'est-à-dire les trois composantes, vous connaissez tout sur ce vecteur. De façon semblable, tout état quantique peut être écrit complètement par les amplitudes i φ pour aller dans les états de base et si vous connaissez ces coefficients, vous savez tout ce qu'il y a à savoir sur cet état. Du fait de cette grande analogie, on appelle souvent "vecteur d'état" ce que nous avons appelé un "état". Comme les vecteurs de base sont tous à angles droits, nous avons la relation (4) e i ⋅ e j = δ ij Cela correspond au caractère exclusif des états de base (états intermédiaires) entre les états de base i, (5) i j = δ ij qui justifie l'affirmation que les états de base i sont tous "orthogonaux". Il y a une différence mineure entre l'équation (1) et le produit scalaire. Nous savons que (6) φ χ = χ φ



Mais en algèbre vectorielle, (7) A ⋅ B = B ⋅ A Avec les nombres complexes de la mécanique, il nous faut conserver l'ordre des termes alors que pour le produit scalaire habituel, cela n'a pas d'importance. Considérons maintenant l'équation vectorielle suivante : (8) A = ∑ e i ⋅ (e i ⋅ A ) i

Elle est un peu inhabituelle, mais correcte. Elle signifie la même chose que

(9) A = ∑ Ai e i = Ax e x + Ay e y + Az e z i

Remarquez cependant que l'équation (8) contient une quantité qui est différente d'un produit scalaire. Un produit scalaire est seulement un nombre alors que l'équation (8) est une équation vectorielle. L'une des grandes astuces de l'analyse vectorielle fut d'abstraire de ces équations l'idée de "vecteur". On pourrait, de façon semblable, être tenté d'abstraire de la formule quantique (1) quelque chose d'analogue à un "vecteur" et, bien entendu, on peut le faire. Nous ôtons les χ des deux côtés de l'équation (1) et nous écrivons l'équation suivante : (10) φ = ∑ i i φ i

On considère le crochet χ φ comme fait de deux morceaux. Le deuxième morceau φ est souvent appelé un ket, comme nous l'avions déjà signalé, et le premier morceau χ est souvent appelé un bra. Les demi-symboles χ et φ sont souvent aussi appelés vecteurs d'état. De toute façon, ce ne sont pas des nombres, or, en général, nous voulons que les résultats de nos calculs soient des nombres. Si bien que ces quantités "brutes" ne sont que des étapes dans nos calculs. Il se trouve que nous avons écrit la plus part de nos résultats avec des nombres (les amplitudes). Comment nous sommes-nous arrangés pour éviter les vecteurs ? Il est amusant de remarquer que même en algèbre vectorielle ordinaire, nous pourrions faire que toutes les équations ne contiennent que des nombres. Par exemple, au lieu d'une équation vectorielle comme (11) F = ma nous pourrions toujours écrire (12) C ⋅ F = C ⋅ (ma ) Nous avons alors une équation entre produits scalaires qui est vraie pour tout vecteur C. Mais si elle est vraie pour tout C, cela ne fait guère de sens de continuer à écrire le C ! Et si nous choisissons pour C un vecteur de base, l'équation (12) devient une relation entre composantes,

c'est-à-dire aussi une équation (ou plutôt des équations, pour chaques composantes) entre nombre. C'est exactement ce que nous avons fait avec les amplitudes d'être dans tel ou tel état de base i. Regardez maintenant l'équation (1). C'est une équation qui est vraie pour tout χ . Pour alléger l'écriture nous aurions pu laisser le χ de côté et écrire à la place l'équation (10). Elle contient la même information; à condition que nous admettions qu'elle doive toujours être "achevée" en la "multipliant à gauche par", ce qui veut simplement dire en remettant à leur place, un certain χ des deux côtés. L'équation (10) signifie donc exactement la même chose que l'équation (1), ni plus, ni moins. Lorsque vous voulez des nombres, vous y mettez le χ que vous voulez. Vous vous êtes peut-être déjà posé des questions sur le φ de l'équation (10). Comme l'équation est vraie pour tout φ , pourquoi gardons-nous ce φ ? Et de fait, Dirac suggéra que le φ pouvait tout aussi bien être supprimé, si bien que nous n'avons plus que (13) | = ∑ i i i

Et ceci est la grande loi de la mécanique quantique (il n'y a pas d'analogue en analyse vectorielle) ! Cette équation dit que si vous mettez n'importe quelle paire d'états χ et φ à gauche et à droite, vous revenez à l'équation (1). Ce n'est pas vraiment utile, mais c'est une façon commode de se rappeler que l'équation (1) est vraie pour toute paire d'états.

I.2.2. Décomposition des vecteurs d'états Continuons notre approfondissement du formalisme avec la décomposition des vecteurs d'états ce qui va nous permettre d'introduire les opérateurs. Revenons à l'équation (10) de la section précédente. Nous pouvons la considérer de la façon suivante. Tout vecteur d'état peut être représenté comme une combinaison linéaire, avec des coefficients appropriés, d'un ensemble de "vecteurs" de base ou, si vous préférez, comme une superposition de "vecteurs unités" en proportions convenables. Pour bien montrer que les coefficients i φ ne sont que des nombres ordinaires (complexes), supposez que nous écrivions (1) i φ = C i L'équation de la section précédente est alors identique à (2) φ = ∑ i C i i

Nous pouvons écrire une équation semblable pour tout autre vecteur d'état, disons χ , avec bien entendu des coefficients différents, disons Di , nous avons alors (3) χ = ∑ i Di i

Les Di ne sont rien d'autre que les amplitudes i χ . Supposez que nous ayons commencé en ôtant le φ dans l'équation (1) de la section précédente. Nous aurions eut (4) χ = ∑ χ i i i ∗

En vous rappelant que χ i = i χ , nous pouvons écrire ceci comme

(5) χ = ∑ Di∗ i i

Maintenant, le fait intéressant est qu'il nous suffit de multiplier l'une part l'autre les équations (5) et (2) pour obtenir χ φ . Lorsque nous faisons cela, nous devons faire attention à la sommation des indices car ils sont tout à fait différents dans les deux équations. Commençons par récrire l'équation (5) comme (6) χ = ∑ D ∗j j j

ce qui ne change rien puisque nous avons juste renommé un indice muet. En la combinant avec l'équation (2), nous avons (7) χ φ = ∑ D ∗j j i C i ij

Mais rappelez-vous que j i = δ ij , si bien que seuls nous restent les termes de la somme tels que j = i. Nous obtenons (8) χ φ = ∑ Di• C i i

où, bien entendu, Di∗ = i χ avec le produit scalaire (9) A ⋅ B = ∑ Ai Bi



= χ i et C i = i φ . Nous voyons à nouveau la grande analogie

i

La seule différence est dans la conjugaison complexe de Di . L'équation (8) dit donc que si les vecteurs d'états χ et φ sont exprimés en fonction des vecteurs de base i ou i , l'amplitude pour aller de φ à χ est donnée par un genre de produit scalaire comme dans l'équation (8). Cette équation n'est autre, bien sûr, que la première équation de la section précédente écrite avec des symboles différents. Nous n'avons donc fait que tourner en rond, pour nous habituer aux nouveaux symboles.

Nous devrions peut-être insister à nouveau sur le fait que les vecteurs de l'espace à trois dimensions sont écrits à partir de trois vecteurs orthogonaux, par contre, les vecteurs de base i de la mécanique quantique doivent former l'ensemble complet correspondant à un problème particulier. Selon la situation, deux, trois, cinq ou un nombre infini de vecteurs de base peuvent être nécessaires. Considérons maintenant le cas où des particules passent à travers un certain appareil, modifiant les amplitudes. Si nous partons avec ces particules dans un certain état φ et si nous les envoyons ensuite à travers un appareil, si enfin nous faisons une mesure pour voir si elles sont dans un état χ , le résultat est donné par une amplitude qui peut être écrite comme (10) χ A φ où A exprime la modification apportée à l'amplitude par l'appareil. Un tel symbole n'a pas d'analogue direct en algèbre vectorielle (il est en fait plus proche de l'algèbre tensorielle, mais l'analogie n'est pas particulièrement utile, nous aurons des outils plus appropriés avec les opérateurs et les matrices). En considérant les états intermédiaires possibles (les états de base) à l'entrée et à la sortie de l'appareil, on peut automatiquement écrire (10) comme (11) χ A φ = ∑ χ i i A j j φ ij

Ceci est un exemple de la règle fondamentale | = ∑ i i appliquée deux fois. De même, si nous mettons un autre appareil B en série avec A, on peut écrire l'ensemble comme BA (vu comme une simple concaténation des deux symboles ou comme un produit qui reste à définir). On peut alors écrire (12) χ BA φ = ∑ χ i i B j j A k k φ ijk

De nouveau, ceci provient directement de la méthode de Dirac avec la règle fondamentale. Rappelez-vous que nous pouvons toujours mette une barre | à la place du facteur i entre B et A.

Incidemment, nous pouvons considérer l'équation (11) d'une autre façon. Supposez que nous considérions une particule entrant dans l'appareil A dans l'état φ et sortant dans l'appareil A dans l'état ψ . En d'autres termes, nous pourrions nous demander : "pouvons-nous trouver un ψ tel que l'amplitude pour aller de ψ à χ soit toujours et partout identique à l'amplitude χ A φ ?" La réponse est oui. Nous voulons que l'équation (11) soit remplacée par (13) χ ψ = ∑ χ i i ψ j

Clairement, nous pouvons le faire si (14) i ψ = ∑ i A j j φ = i A φ j

ce qui détermine ψ . "Mais non, cela ne détermine pas ψ ", direz-vous, "cela ne détermine que

i ψ ". Et pourtant i ψ détermine bien ψ , car si vous avez tous les coefficients qui relient ψ aux états de base i, ψ est alors défini de manière unique. En fait, nous pouvons jouer avec notre notation et écrire le dernier terme de (14) comme (15) i ψ = ∑ i j j A φ j

Alors, comme cette équation est vraie pour tout i, nous pouvons écrire simplement (16) ψ = ∑ j j A φ j

Nous pouvons dire alors : "l'état ψ est ce que nous obtenons si nous partons avec φ et passons à travers l'appareil A". Un dernier exemple des trucs du métier. Nous partons encore avec l'équation (11). Comme elle est vraie pour tout χ et pour tout φ , nous pouvons les laisser tous les deux de coté ! Nous obtenions alors

(17) A = ∑ i i A j j ij

En toute rigueur on devrait écrire |A| au lieu de A mais cela ressemblerait au symbole pour "valeur absolue de A", si bien qu'on supprime généralement les barres. De façon générale, la barre | se comporte comme le facteur un. Parfois, pour distinguer A d'un nombre ou d'une matrice, on l'écrit comme Â, nous le ferons parfois, mais le contexte permet toujours de savoir la nature de l'objet mathématique présent. Qu'est-ce que cela signifie ? Cela ne signifie ni plus, ni moins que ce que vous obtenez si vous remettez le φ et le χ à leurs places. Telle qu'elle est, c'est une équation "ouverte" et incomplète. Si nous la multiplions "à gauche" par φ , elle devient (18) A φ = ∑ i i A j j φ ij

ce qui est exactement (16), une fois de plus. En fait, nous pourrions simplement laisser les j de coté et écrire cette équation (19) ψ = A φ Le symbole A n'est ni une amplitude, ni un vecteur. C'est une nouvelle sorte d'objet mathématique appelé un "opérateur". C'est quelque chose qui "agit" (opère) sur un état pour produire un nouvel état. L'équation (19) dit que ψ est ce qui résulte de l'action de A sur φ . A nouveau, c'est une équation ouverte jusqu'à ce qu'elle soit complétée par un bra donné comme χ pour donner (20) χ ψ = χ A φ Bien entendu, l'opérateur A est complètement déterminé si nous donnons la matrice des amplitudes i A j , que l'on écrit aussi Aij , en fonction d'un ensemble quelconque de vecteurs de base. Notez aussi que les facteurs intervenant dans (12) ne sont rien d'autre qu'un produit matriciel de A et de B.

Nous n'avons réellement rien ajouté de nouveau avec cette nouvelle notation mathématique. Une des raisons pour l'introduire est de vous montrer comment on écrit des morceaux d'équations car vous trouverez dans de nombreux livres les équations écrites sous leur forme incomplète et il n'y a aucune raison que vous soyez paralysés lorsque vous les rencontrerez. Si vous le préférez, nous pouvons toujours ajouter les morceaux qui manquent pour avoir une équation entre des nombres qui ressemble à quelque chose de plus familier. Par ailleurs, comme vous le verrez, la notation avec les bra et les ket est très commode. D'une part nous pouvons dès maintenant identifier un état en donnant son vecteur d'état. Quand nous voulons désigner un état d'impulsion définie p, nous pouvons dire "l'état p ". Nous pouvons aussi parler d'un état arbitraire ψ . Pour être cohérent nous utiliserons toujours le ket et nous écririons ψ pour désigner un état (c'est évidemment un choix arbitraire et nous aurions tout aussi bien pu choisir d'employer le bra ψ ).

I.2.3. Quels sont les états de base du monde ? Nous avons découvert que n'importe quel état du monde peut être représenté comme une superposition, une combinaison linéaire avec des coefficients convenables, d'états de base. Vous pouvez vous demander tout d'abord, quels états de base ? Et bien, il y a de nombreuses possibilités différentes. Vous pouvez, par exemple, projeter un spin sur la direction z ou sur une autre direction. Il y a beaucoup, beaucoup de représentations différentes, qui sont les analogues des différents systèmes de coordonnées que l'on peut employer pour représenter des vecteurs ordinaires. Comme nous l'avions déjà signalé, un espace vectoriel a une infinité de bases. Ensuite, quels coefficients ? Et bien, ceci dépend des conditions physiques. Des ensembles de coefficients différents correspondent à des conditions physiques différentes. La chose importante à connaître est "l'espace" dans lequel vous travaillez. En d'autres termes, quelle est la signification physique des états de base ? La première chose qu'il faut donc savoir est, en général, à quoi ressemblent les états de base ? Vous pouvez alors comprendre comment décrire une situation donnée en fonction de ces états de base. Nous voudrions anticiper un peu et parler un petit peu de ce que va être la description quantique générale de la nature, en termes d'idées courantes dans la physique d'aujourd'hui. Tout d'abord, on choisit une représentation particulière pour les états de base, différentes représentations sont toujours possibles. Par exemple, pour une particule de spin un demi, nous pouvons utiliser les états "plus" ou "moins" par rapport à l'axe z. Mais l'axe z n'a rien de spécial, vous pouvez toujours prendre n'importe quel autre axe si vous le préférez. Cependant, par souci de cohérence, nous prendrons toujours l'axe z. Supposons que nous commencions avec une situation à un électron. En plus des deux possibilités pour le spin ("en haut" et "en bas" le long de l'axe z), il y a aussi différentes possibilités pour l'impulsion de l'électron. Nous choisissons un ensemble d'états de base, chacun correspondant à une valeur de l'impulsion. Mais que faire si l'électron n'a pas d'impulsion définie ? Cela va encore. Nous ne faisons que dire ce que sont les états de base. Si l'électron n'a pas une impulsion définie il a une certaine amplitude pour avoir une impulsion donnée et une autre amplitude pour avoir une autre impulsion, et ainsi de suite. Et s'il n'est pas nécessairement en train de tourner spin en haut, il a une certaine amplitude pour être spin en haut avec une impulsion donnée et une autre amplitude pour être spin en bas avec la même impulsion, etc. La description complète d'un électron, pour autant que nous le sachions, ne requiert que l'impulsion et le spin pour

décrire les états de base. Un ensemble d'états de base i acceptable pour un seul électron est donc décrit par les différentes valeurs de l'impulsion et les positions en haut ou en bas du spin. Différents mélanges d'amplitudes, c'est-à-dire des combinaisons des C décrivent différentes situations. On décrit ce que fait un électron particulier en disant ce qu'est son amplitude pour être spin en haut ou spin en bas et pour avoir une impulsion ou une autre, et ceci pour toutes les impulsions possibles. Vous voyez ainsi ce qui intervient dans une description quantique complète d'un seul électron. Que dire des systèmes à plus d'un électron ? Les états de base deviennent alors plus compliqués. Supposons que nous ayons deux électrons. Tout d'abord, nous avons quatre états de spin possibles : les deux électrons spin en haut, le premier en bas et le deuxième en haut, le premier en haut et le deuxième en bas, les deux en bas. Nous avons aussi à préciser que le premier électron a l'impulsion p1 et le deuxième électron l'impulsion p 2 . Les états de base pour les deux électrons requièrent que l'on spécifie deux électrons et deux spins. Avec sept électrons, nous avons à spécifier sept de chaque. Si nous avons un proton et un électron, il nous faut spécifier la direction du spin du proton et son impulsion, la direction du spin de l'électron et son impulsion. Du moins, ceci est approximativement vrai. Nous ne savons pas réellement ce qu'est la représentation correcte du monde. C'est très bien de commencer en supposant que si vous spécifiez le spin d'un électron et son impulsion et de même pour un proton, vous avez tous les états de base. Mais alors, et les "entrailles" du proton ? Prenons la chose de la façon suivante. Dans un atome d'hydrogène qui a un proton et un électron, nous avons beaucoup d'états de base différents à décrire, les spins du proton et de l'électron en haut ou en bas et les différentes valeurs possibles des impulsions du proton et de l'électron. Il y a donc différentes combinaisons des amplitudes C i qui, toutes ensembles, décrivent les caractéristiques de l'atome d'hydrogène tout entier comme une "particule". Si nous ne savions pas que l'atome d'hydrogène est fait d'un proton et d'un électron, nous aurions pu commencer en disant "oh !, mais je sais quels sont les états de base, ils correspondent à des impulsions particulières de l'atome d'hydrogène". Non, car l'atome d'hydrogène a des constituants internes. Il peut, par conséquent, avoir différents états d'énergie interne et il faut plus de détails pour décrire sa vraie nature.

La question se pose alors : le proton a-t-il des constituants internes ? La réponse est oui. Devonsnous décrire un proton en donnant tous les états possibles des quarks, gluons, mésons et autres particules étranges ? En principe oui. Et quoique nous supposions que l'électron soit simple, si bien que nous n'ayons à donner que son impulsion et son spin, peut-être allons nous découvrir demain que l'électron a aussi toute une mécanique interne. Cela voudrait dire que notre représentation est incomplète ou fausse ou approximative, de la même façon qu'une représentation de l'atome d'hydrogène qui le décrit seulement par son impulsion est incomplète puisqu'elle ne tient pas compte du fait que l'atome d'hydrogène peut avoir été excité. Si l'électron pouvait être excité et être changé en quelque chose d'autre, en muon par exemple (une espèce d'électron lourd observé en particulier dans les accélérateurs de particules), il serait alors décrit non seulement en donnant les états de la nouvelle particule, mais probablement aussi l'état de quelque mécanique interne compliquée. Aujourd'hui, le problème essentiel dans l'étude des particules fondamentales est de découvrir quelles sont les représentations correctes pour la description de la nature. Actuellement, nous nous contentons de deviner que pour l'électron il suffit de spécifier l'impulsion et le spin. Nous pensons aussi qu'il y a un proton idéal avec une structure interne et entouré de mésons pi, de mésons k, etc., qui doivent tous être décrits. Plusieurs douzaines de particules, c'est de la folie ! La question de savoir ce qui est une particule fondamentale et ce qui n'est pas une particule fondamentale, un sujet dont on entend souvent parler, revient à se demander à quoi ressemblera la représentation finale dans l'ultime description quantique du monde. Les impulsions des électrons seront-elles encore les bonnes quantités pour décrire la nature ? La question elle-même a-t-elle un sens ? On doit toujours se poser cette question dans toute investigation scientifique. Quoi qu'il en soit, il y a là un problème. Comment trouver une représentation ? Nous ne savons pas la réponse ! Nous ne savons même pas si c'est là le "bon" problème. Mais, si c'est le bon, nous devons d'abord essayer de trouver si une particule donnée est fondamentale ou non. En mécanique quantique non relativiste, si les énergies ne sont pas trop élevées de façon que nous ne dérangiez pas le jeu interne des particules, étranges et autres, vous pouvez faire du très bon travail sans vous soucier de ces détails. Vous pouvez décider de ne spécifier que les impulsions et les spins des électrons et des noyaux. Tout se passera très bien. Dans la plupart des réactions chimiques et dans les autres phénomènes à basse énergie, rien ne se passe dans les noyaux. Ils ne sont pas excités. De plus, si un atome d'hydrogène se déplace lentement et qu'il se cogne doucement contre d'autres atomes d'hydrogène, sans jamais passer dans un état excité et sans

rayonner, ni rien faire de compliqué comme cela, mais en restant toujours dans l'état fondamental de son énergie interne, vous pouvez utiliser l'approximation selon laquelle vous parlez de l'atome d'hydrogène comme d'un objet, une particule, et vous pouvez ne pas vous soucier du fait qu'il peut se passer quelque chose à l'intérieur. Cela sera une bonne approximation tant que l'énergie cinétique, dans n'importe quelle collision est bien au-dessous de 10 électrons volts, l'énergie requise pour exciter l'atome d'hydrogène dans un état interne différent. Bien sûr, la mécanique quantique étant probabiliste on pourrait dire qu'il y a toujours une certaine probabilité pour que l'atome se retrouve dans un état excité. Cela est vrai mais on peut alors dire que l'approximation est acceptable si les amplitudes impliquant des changements de l'état interne sont extrêmement petites, négligeables en pratique, devant les amplitudes utilisées pour décrire l'objet comme une particule sans structure interne. Nous ferons souvent l'approximation selon laquelle nous ne tenons pas compte de la possibilité d'un mouvement interne, diminuant ainsi le nombre de détails que nous devons inclure dans nos états de base. Bien entendu, nous oublions alors certains phénomènes qui apparaîtraient (en général) à des énergies plus élevées, mais, en faisant de telles approximations nous pouvons simplifier énormément l'analyse des problèmes. Par exemple, nous pouvons discuter la collision de deux atomes d'hydrogène à basse énergie, ou n'importe quelle réaction chimique, sans nous inquiéter du fait que les noyaux atomiques pourraient être excités. En résumé, quand nous pouvons négliger les effets des états excités d'une particule, nous pouvons choisir un ensemble d'états de base constitué des états dont l'impulsion et la composante z du moment angulaire sont définis. Une telle attitude pourrait être critiquée. Mais elle se justifie parfaitement pour deux raisons et se modère pour une troisième raison :  Nous n'avons pas la connaissance infuse de tout ce qui permet de décrire le monde. Nous sommes bien obliger d'admettre notre méconnaissance de certains détails, de certaines lois physiques, des états de base complets du monde. Mais cela ne doit pas nous paralyser. Nous n'avons aucune chance de découvrir dans un éclair de génie l'infinie complexité du monde. Nous décrivons donc ce que nous connaissons et nous progressons en le confrontant à l'expérience et en améliorant nos théories. C'est d'ailleurs dans l'esprit de la méthode scientifique : c'est l'expérience qui nous guide, qui fixe les limites et qui tranche.  La physique a aussi des buts pratiques. Elle n'est pas conçue uniquement comme une élégante description du monde devant laquelle on serait en extase en soupirant du bonheur du travail

accomplit. La physique est aussi construite pour comprendre les phénomènes physiques les plus divers, prédire leurs comportements, les maîtriser et les utiliser dans toutes sortes d'applications : lasers, transistors, télévisions, etc. Si l'on veut arriver à un tel résultat, il faut pouvoir mener les calculs et obtenir des résultats quantitatifs, des résultats numériques (des tensions, des positions, des intensités, des durées, etc.) Inutile de s'extasier devant des équations si elles ne servent pas ou si l'on est incapable de les résoudre. Or les équations peuvent vite devenir inextricables et impossibles à résoudre. Surtout si le système est un tant soit peut complexe et réaliste. Même des calculs numériques menés sur ordinateur trouvent vite leurs limites. Il faut donc bien, à un moment donné, faire des choix, des approximations. Dans ce cas, pourquoi s'encombrer de détails qui n'ont aucun impact sur les résultats (de préférence, quand même, après l'avoir vérifié) à cause de leur faiblesse (énergie infime par rapport à l'énergie totale, probabilité tellement faible qu'on n'a aucune chance de voir un résultat donné dans la vie d'un homme même pour un très grands nombres de systèmes) ? C'est certainement les premières approximations à effectuer !  Renoncer, dans une situation donnée, pour des raisons pratiques, pédagogiques ou autres, à décrire certains détails n'est pas un aveu d'échec. On sait que certains détails ont été négligés (en tout cas, maintenant, vous le savez). Et ces détails peuvent être étudiés plus tard, séparément ou dans une étude plus complète. Lorsque nous décrivons le fonctionnement d'une horloge en décrivant tous ses engrenages, il n'y a pas de honte à ignorer les cours de la bourse au Japon ou les couleurs du drapeau argentin dans la description de cette horloge. Il en est de même ici. Décrivons chaque chose posément, en fonction des besoins, des possibilités, des désirs,… Complétons progressivement nos descriptions, améliorons petit à petit notre connaissance du monde, c'est inévitable… et c'est aussi plus digeste pour le lecteur ! Rome ne s'est pas construite en un jour. Notre problème, alors, pour décrire la nature est de trouver une représentation adéquate des états de base. Cela n'est que le commencement. Nous voulons de plus être capable de dire ce qui "arrive". Si nous connaissons l'état du monde à un moment donné, nous voulons connaître son état un peu plus tard. Nous avons donc aussi à trouver les lois qui déterminent comment les choses changent dans le temps. Nous abordons maintenant cette deuxième partie de la mécanique quantique, comment les états changent dans le temps.

I.2.4. Comment les états évoluent dans le temps Nous avons déjà discuté la façon de représenter une situation dans laquelle nous plaçons quelque chose dans un appareil. Maintenant, un "appareil" commode, d'un emploi délectable, consiste à attendre simplement quelques minutes, autrement dit : vous préparez un état φ et, avant de l'analyser, vous le laissez tel qu'il est. Peut-être l'abandonnez-vous dans un champ électrique ou magnétique particulier, cela dépend des circonstances. De toute façon, quelles que soient les conditions, vous laissez l'objet tranquille du temps t1 au temps t 2 . Supposez que vous le laissiez sortir du premier appareil à t1 et dans l'état φ et qu'il aille ensuite dans un "appareil", "l'appareil" consistant simplement à attendre jusqu'à t 2 . Pendant ce temps là, il peut se passer diverses choses, on peut appliquer des forces extérieures ou pratiquer d'autres manœuvres de ce genre, si bien que quelque chose se passe. Après avoir attendu, l'amplitude pour trouver l'objet dans un état χ donné n'est pas exactement la même que si on n'avait pas attendu. Comme "attendre" n'est qu'un cas spécial "d'appareil", nous pouvons décrire ce qui se passe en donnant l'amplitude sous la même forme. Comme l'opération "d'attendre" est particulièrement importante, nous l'appellerons U au lieu de A et nous écririons U (t 2 , t1 ) pour spécifier le temps de départ et d'arrivée t1 et t 2 . L'amplitude que nous voulons est (1) χ U (t 2 , t1 )φ

Comme toute autre amplitude, elle peut être représentée dans un système de base quelconque en écrivant (2) ∑ χ i i U (t 2 , t1 ) j j φ ij

U est alors complètement décrit en donnant l'ensemble complet des amplitudes, la matrice (3) i U (t 2 , t1 ) j Incidemment, nous pouvons remarquer que la matrice i U (t 2 , t1 ) j donne beaucoup plus de détails que ce dont nous avons besoin. Le physicien théoricien de grande classe, qui travaille en physique des hautes énergies, considère des problèmes du type général suivant (c'est de cette façon que les

expériences sont généralement faites). Il part avec une paire de particules, comme deux protons, venant l'un vers l'autre de l'infini (dans le laboratoire, en général, une des particules est à l'arrêt et l'autre vient d'un accélérateur qui est pratiquement à l'infini à l'échelle atomique). La collision se produit et il en sort, disons, deux mésons k, six mésons pi et deux neutrons, chacun dans une certaine direction et avec une certaine impulsion. Quelle est l'amplitude pour que cela se produise ? La mathématique ressemble à ceci : l'état φ spécifie les spins et les impulsions des particules incidentes. χ correspond à la question sur ce qui sort. Comme, par exemple, avec quelle amplitude obtenez-vous six mésons sortant dans telle et telle direction et les neutrons dans telles directions avec leurs spins de telle façon ? Autrement dit, χ serait défini en donnant toutes les impulsions et les spins, etc. pour toutes les particules finales. Le travail du théoricien est alors de calculer l'amplitude (1). Cependant, il ne s'intéresse réellement qu'au cas particulier où t1 vaut − ∞ et t 2 vaut + ∞ (il n'y a pas d'information expérimentale sur les détails de la réaction mais seulement sur ce qui entre et sur ce qui sort). La limite de U (t 2 ,t1 ) lorsque t1 → −∞ et t 2 → +∞ est appelé S et ce que le théoricien veut est (4) χ S φ Il pourrait encore, en utilisant la formule (2), calculer la matrice (5) i S j qui est appelée la matrice S. Ainsi, si vous voyez un théoricien faisant les cent pas et disant "tout ce que j'ai à faire est de calculer la matrice S", vous saurez de quoi il s'agit. Comment analyser, comment définir les lois de la matrice S est une intéressante question. En mécanique quantique relativiste, aux hautes énergies, on fait cela d'une certaine façon et, dans la mécanique quantique non relativiste, on le fait d'une autre façon qui est très commode (cette autre façon peut aussi être employée dans le cas relativiste, mais elle n'est plus alors aussi commode). Il s'agit de calculer la matrice U pour un petit intervalle de temps, c'est-à-dire pour t 2 et t1 proches l'un de l'autre. Si nous pouvons trouver une suite de tels U pour des intervalles de temps successifs, nous pouvons étudier comment les choses évoluent en fonction du temps. Vous pouvez vous rendre compte immédiatement que cette façon de faire n'est pas tellement bonne en relativité parce que nous n'avons pas envie de décrire l'aspect des choses, partout, "simultanément". Mais nous n'allons

pas nous inquiéter de cela pour le moment, nous allons seulement nous occuper de mécanique quantique non relativiste. Supposez que nous considérions la matrice U pour un intervalle de temps de t1 à t 3 qui est plus grand que t 2 . Autrement dit, nous prenons trois temps consécutifs : t1 plus petit que t 2 plus petit que t 3 . Nous prétendons alors que la matrice qui fait passer de t1 à c est le produit de ce qui se passe lorsque vous attendez de t1 à t 2 et ensuite de t 2 à t 3 . C'est exactement comme dans la situation où nous avions deux appareils A et B en série. Nous pouvons alors écrire (6) U (t 3 , t1 ) = U (t 3 , t 2 )U (t 2 , t1 ) Autrement dit, nous pouvons analyser tout intervalle de temps si nous pouvons analyser une séquence de petits intervalles de temps. Nous n'avons qu'à faire le produit de tous les morceaux. C'est de cette façon que l'on analyse la mécanique quantique dans le cas non relativiste. Notre problème est alors de comprendre la matrice U (t 2 ,t1 ) pour un intervalle de temps infinitésimal, c'est-à-dire pour t 2 = t1 + ∆t . Nous nous posons la question suivante : si nous avons un état, à quoi ressemble-t-il après un intervalle de temps infinitésimal ∆t ? Voyons comment nous pouvons écrire cela. Appelons l'état au temps t, ψ (t ) (nous étudions la dépendance dans le temps de ψ pour ce que nous entendons par état au temps t soit parfaitement clair). Nous demandons maintenant : quel état avons-nous après le petit intervalle de temps ∆t ? La réponse est (7) ψ (t + ∆t = U (t + ∆t , t ) ψ (t ) Ceci signifie la même chose que l'équation avec opérateur, c'est-à-dire que l'amplitude pour trouver χ au temps t + ∆t est (8) χ ψ (t + ∆t ) = χ U (t + ∆t , t )ψ (t )

Comme nous ne sommes pas encore très forts dans ces raisonnements abstraits, projetons nos amplitudes dans une représentation bien définie. Si nous multiplions les deux cotés de l'équation (7) par i , nous obtenons (9) i ψ (t + ∆t ) = i U (t + ∆t , t )ψ (t ) Nous pouvons aussi décomposer ψ (t ) sur les états de base et écrire (10) i ψ (t + ∆t ) = ∑ i U (t + ∆t , t ) j j ψ (t ) j

Nous pouvons comprendre l'équation (10) de la façon suivante. Si nous appelons C i (t ) = i ψ (t ) l'amplitude pour être dans l'état de base i au temps t, nous pouvons étudier la variation de cette amplitude (qui, souvenez-vous en, n'est qu'un nombre !) au cours du temps. Chaque C i devient une fonction de t. Nous avons aussi de l'information sur la façon dont les amplitudes C i varient avec le temps. A t + ∆t , chaque amplitude est proportionnelle à toutes les autres amplitudes en t, multipliées par un ensemble de coefficients. Appelons U ij la matrice U, ce par quoi nous entendons (11) U ij = i U j Nous pouvons alors écrire l'équation (10) comme (12) C i (t + ∆t ) = ∑ U ij (t + ∆t , t )C j (t ) j

Ceci nous donne une idée de ce que va être la dynamique de la mécanique quantique. Jusqu'ici nous ne savons pas grand chose sur les U ij sauf ceci : nous savons que si ∆t tend vers 0, il ne se passe rien, nous devons obtenir exactement l'état original. Donc U ii tend vers 1 et U ij → 0 si i ≠ j . En d'autres termes, U ij → δ ij pour ∆t → 0 . Nous pouvons aussi supposer que, pour de

petits ∆t , chacun des coefficients U ij doit différer de δ ij par une quantité proportionnelle à ∆t (développement au premier ordre pour des quantités infinitésimales). Nous écrivons donc (13) U ij = δ ij + K ij ∆t Cependant, on a l'habitude de sortir des coefficients K ij un facteur (− i / h ) , pour des raisons

historiques entre autres. Nous avons un petit ennui ici avec nos notations. Dans le facteur (− i / h ) , le i signifie l'unité imaginaire et non pas l'indice i qui désigne le ième état de base ! Nous espérons que vous ne trouverez pas cela trop déroutant. Il n'y a que 26 lettres de l'alphabet, rajoutez les lettres grecques, les majuscules et divers ornements (comme un accent circonflexe) et vous avez pas mal de possibilités mais encore bien limitées face à l'infinie variété des grandeurs physiques. Des symboles utilisés avec plusieurs significations sont malheureusement inévitables. Le problème est amplifié par des usages historiques provenant de communautés de physiciens parfois fort différentes. Ainsi R est utilisé pour désigner la constante des gaz parfaits ou pour l'aimantation réduite ou la matrice de rotation ou parfois pour bien d'autres choses. Le contexte permet toujours de savoir de quoi on parle. Mais un minimum d'attention est requit. On préfère donc écrire (14) U ij (t + ∆t , t ) = δ ij −

i H ij (t )∆t h

C'est bien entendu la même équation que (13) et, si vous voulez, elle ne fait que définir les coefficients H ij (t ) . Les termes H ij sont simplement les dérivées par rapport à t 2 des coefficients U ij (t 2 , t1 ) évalués à t 2 = t1 = t .

En employant cette forme pour U dans l'équation (12), nous avons i   (15) C i (t + ∆t ) = ∑ δ ij − H ij (t )∆t C j (t ) h  j 

En prenant la somme sur le terme δ ij , nous obtenons juste C i (t ) que nous pouvons faire passer dans l'autre membre de l'équation. En divisant alors par ∆t nous reconnaissons une dérivée C (t + ∆t ) − C i (t ) i (16) i = − ∑ H ji (t )C j (t ) ∆t h j ou dC (t ) (17) ih i = ∑ H ij (t )C j (t ) dt j Vous vous rappelez que C i (t ) est l'amplitude i ψ pour trouver l'état ψ dans l'un des états de base i (au temps t). L'équation (17) nous dit donc comment chacun des coefficients i ψ varie dans le temps. Mais c'est la même chose que de dire que l'équation (17) nous donne la façon dont l'état ψ varie dans le temps puisque nous décrivons ψ en fonction des amplitudes i ψ . La variation de ψ dans le temps est décrite en fonction de la matrice H ij , qui doit évidemment inclure tout ce que nous faisons au système pour le faire changer. Si nous connaissons les H ij , qui contiennent la physique du problème et peuvent, en général, dépendre du temps, nous avons une description complète du comportement du système dans le temps. L'équation (17) est alors la loi quantique de la dynamique du monde. Nous devons ajouter que nous prendrons toujours un ensemble d'états de base qui sont fixes et qui ne varient pas dans le temps. Il y a des gens qui utilisent des états de base qui varient aussi. Mais c'est la même chose que d'utiliser un système de coordonnées tournant et nous ne voulons pas entrer dans de telles complications.

I.2.5. La matrice hamiltonienne L'idée, alors, est que pour décrire le monde quantique, il nous faut choisir un ensemble d'états de base i et écrire les lois de la physique en donnant les coefficients de la matrice H ij . Nous avons alors tout ce qu'il nous faut, nous pouvons répondre à n'importe quelle question sur ce qui va se passer. Nous devons donc apprendre quelles sont les règles pour trouver les H ij qui correspondent à une situation physique donnée, à un champ magnétique, ou à un champ électrique, etc. Et c'est là le plus difficile. Par exemple, pour les nouvelles particules étranges, nous n'avons aucune idée du H ij qu'il faut employer. Autrement dit, personne ne connaît le H ij complet pour le monde entier. Une partie de la difficulté vient de ce que l'on peut difficilement espérer découvrir le H ij quand on ne sait même pas quels sont les états de base. Nous avons d'excellentes approximations pour les phénomènes non relativistes et pour quelques autres cas spéciaux. En particulier, nous connaissons les formes dont on a besoin pour décrire les mouvements des électrons dans les atomes, c'est-à-dire pour décrire la chimie. Mais nous ne connaissons pas le vrai H ij complet pour l'univers tout entier. Les coefficients H ij sont appelés "la matrice hamiltonienne" ou, en bref, l'hamiltonien (comment Hamilton, qui travaillait en l'année 1830, a pu donner son nom à une matrice de la mécanique quantique est toute une histoire. Mais on devine le lien, ne fut ce que par l'équation décrivant l'évolution des états dans le temps en fonction de l'hamiltonien, le lien avec l'hamiltonien de la mécanique analytique). Il serait mieux de l'appeler la matrice d'énergie, pour des raisons qui deviendront apparentes au fut et à mesure que nous l'emploierons. Le problème est donc : trouvez votre hamiltonien ! Le hamiltonien a une propriété qui peut être déduite immédiatement, à savoir (1) H ij∗ = H ji (matrice hermitique) Ceci vient de la condition que la probabilité totale pour qu'un système soit dans un état quelconque ne change pas. Si vous commencez avec une particule, un objet ou le monde entier, vous l'avez

encore après tout intervalle de temps. Et même dans le cas de particules instables, pouvant se désintégrer, les états de base doivent en tenir compte (on doit avoir un état sans la particule), on a encore une situation ou l'on a toujours ou bien la particule ou pas. On ne peut mieux comme lapalissade. La probabilité totale de trouver le système dans un état quelconque est (2)

∑ C (t )

2

i

i

qui ne doit pas changer au cours du temps. Pour que ceci soit vrai, en l'appliquant à l'équation décrivant l'évolution dans le temps de ces coefficients, quel que soit l'état de départ φ , il faut que l'équation (1) soit vraie. Comme premier exemple, considérons la situation dans laquelle les conditions physiques ne changent pas avec le temps. Nous voulons dire les conditions physiques extérieures, de sorte que H est indépendant du temps. Il n'y a personne qui branche ou débranche des électro-aimants. Nous choisissons aussi un système qui peut être décrit avec un seul état de base. C'est une approximation que nous pourrions faire pour un atome d'hydrogène au repos ou pour quelque chose de semblable. L'équation d'évolution dans le temps dit alors que dC (3) ih 1 = H 11C1 dt Une seule équation et c'est tout ! Et si H est constant, cette équation différentielle se résout facilement pour donner (4) C1 = (const )e

− (i / h ) H11t

Ceci donne la dépendance dans le temps d'un état d'énergie définie E = H 11 . Vous voyez pourquoi H ij devrait être appelé la matrice d'énergie. C'est une généralisation de l'énergie pour des situations complexes. Ensuite, pour comprendre un peu mieux ce que signifie l'équation, nous considérons un système qui a deux états de base. L'équation d'évolution se lit alors

dC1 = H 11 C1 + H 12 C 2 dt (5) dC ih 2 = H 21 C1 + H 22 C 2 dt ih

De nouveau, si les H sont indépendants du temps, vous pouvez facilement résoudre ces équations. Nous vous laissons essayer de le faire pour vous amuser, nous y reviendrons et nous le résoudrons plus tard. Oui, vous pouvez résoudre les problèmes de mécanique quantique sans connaître les H, tant qu'ils sont indépendants du temps.

I.2.6. La molécule d'ammoniac Nous voulons vous montrer maintenant comment on peut utiliser l'équation dynamique de la mécanique quantique pour décrire des conditions physiques particulières. Nous avons choisi un exemple simple et intéressant dans lequel, en essayant de deviner raisonnablement l'hamiltonien, nous pouvons calculer quelques résultats importants et ayant même une valeur pratique. Nous allons prendre une situation que l'on peut décrire par deux états : la molécule d'ammoniac.

La molécule d'ammoniac a un atome d'azote et trois atomes d'hydrogène disposés dans un plan sous l'azote, si bien que la molécule a la forme d'une pyramide, comme ci-dessus. Cette molécule, comme tout autre, a un nombre infini d'états. Elle peut tourner autour de n'importe quel axe, elle peut se déplacer dans n'importe quelle direction, elle peut vibrer, etc. etc. Par conséquente, ce n'est pas du tout un système à deux états. Mais nous allons faire l'approximation que tous les autres états

restent fixes, car ils n'interviennent pas dans ce qui nous intéresse pour l'instant. Nous considérons que la molécule est juste en train de tourner autour de son axe de symétrie (comme le montre la figure), qu'elle a une impulsion nulle et qu'elle vibre aussi peu que possible (par exemple à très basse température et dans le référentiel de la molécule). Cela définit toutes ses caractéristiques sauf une : il y a encore les deux positions possibles de l'atome d'azote, l'azote peut être d'un coté ou de l'autre du plan des atomes d'hydrogène, comme le montrent les figures (a) et (b). Nous allons donc discuter cette molécule comme si c'était un système à deux états. Cela signifie qu'il n'y a que deux états dont nous allons nous soucier, tout le reste sera supposé ne pas changer. Vous voyez, même si nous savons que la molécule tourne avec un certain moment cinétique autour de l'axe et si nous savons qu'elle se déplace avec une certaine impulsion et qu'elle vibre d'une certaine façon, il y a encore deux états possibles. Nous dirons que la molécule est dans l'état 1 lorsque l'azote est en haut, comme dans la figure (a), et qu'elle est dans l'état 2 quand l'azote est en bas comme dans (b). Les états 1 et 2 seront pris comme états de base pour notre analyse du comportement de la molécule d'ammoniac. A tout instant, l'état réel ψ de la molécule peut être représenté en donnant

C1 = 1 ψ , l'amplitude pour être dans l'état 1 et C 2 = 2 ψ , l'amplitude pour être dans l'état 2 . Alors, nous pouvons écrire le vecteur d'état ψ comme (1) ψ = 1 1 ψ + 2 2 ψ ou (2) ψ = 1 C1 + 2 C 2 Maintenant, le fait intéressant est que si la molécule est dans un certain état à un certain moment donné, elle n'est pas dans le même état un instant plus tard. Les deux coefficients C changeront avec le temps suivant l'équation d'évolution que nous venons de voir, valable pour tout système à deux états. Supposez par exemple, que vous ayez fait une observation ou que vous ayez fait une certaine sélection des molécules et que vous sachiez que la molécule était initialement dans l'état 1 . Un instant plus tard, il y a une certaine chance pour qu'on la trouve dans l'état 2 . Pour trouver ce qu'est cette chance nous devons résoudre l'équation différentielle qui nous dit comment les amplitudes changent avec le temps.

Le seul ennui est que nous ne savons pas quoi prendre pour les coefficients H dans l'équation. Il y a cependant certaines choses que nous pouvons affirmer. Supposez qu'il n'y ait aucune chance pour que la molécule puisse jamais aller dans l'état 2 , une fois qu'elle est dans l'état 1 , et réciproquement. Alors H 12 et H 21 seraient tous les deux zéro et l'équation serait dC dC (3) ih 1 = H 11C1 , ih 2 = H 22 C 2 dt dt Nous pouvons résoudre ces deux équations facilement. Nous obtenons (4) C1 = (const )e

− (i / h ) H11t

, C 2 = (const )e

− (i / h ) H 22t

Ce sont là les amplitudes pour les états stationnaires d'énergie E1 = H 11 et E 2 = H 22 . Nous remarquons cependant que pour la molécule d'ammoniac, les deux états 1 et 2 ont une certaine symétrie. Si la nature est un tant soit peu raisonnable, les deux éléments de matrice H 11 et H 22 doivent être égaux. Nous les appellerons tous les deux E 0 car ils correspondent à l'énergie qu'auraient les états si H 12 et H 21 étaient zéro. Mais les équations (4) ne nous disent pas ce que fait en réalité l'atome ammoniac. Il se trouve que l'azote peut passer à travers les trois hydrogènes et basculer de l'autre coté. C'est très difficile. Il faut beaucoup d'énergie pour franchir la première moitié du chemin. Comment l'azote peut-il faire s'il n'a pas assez d'énergie ? Il y a une certaine amplitude pour qu'il pénètre la barrière de potentiel. Il est possible, en mécanique quantique, de se faufiler rapidement à travers une région illégale du point de vue de l'énergie. C'est l'effet tunnel dont nous avons déjà parlé. Par conséquent, il y a une certaine amplitude, petite, pour qu'une molécule qui part en 1 passe dans l'état 2 . Les coefficients H 12 et H 21 ne sont pas vraiment zéro. A nouveau, par symétrie, ils doivent être tous les deux égaux, au moins en module. En fait, nous savons déjà que de façon générale H ji doit être égal au complexe conjugué de H ij , si bien qu'ils ne peuvent différer que d'une phase. Il se trouve, comme vous le verrez, que nous pouvons les prendre égaux sans perdre de généralité. Il sera commode, plus tard, de les avoir prix égaux à un

nombre négatif. Nous prenons H 12 = H 21 = − A , sans perte de généralité. Nous avons alors la paire d'équations suivante : dC (5) ih 1 = E0 C1 − AC 2 dt dC (6) ih 2 = E 0 C 2 − AC1 dt Ces équations sont très simples et peuvent être résolues de plusieurs façons différentes. Une façon commode est la suivante. En prenant la somme des deux, nous obtenons d (7) ih (C1 + C 2 ) = (E 0 − A)(C1 + C 2 ) dt dont la solution est − (i / h )(E0 − A )t (8) C1 + C 2 = ae Ensuite, en prenant la différente de (5) et (6), nous trouvons que d (9) ih (C1 − C 2 ) = (E0 + A)(C1 − C 2 ) dt ce qui donne − (i / h )(E0 + A )t (10) C1 − C 2 = be Nous avons appelé a et b les deux constantes d'intégration. Bien entendu, il faut les choisir de façon à obtenir les conditions initiales de chaque problème particulier. Maintenant, en ajoutant et en soustrayant (8) et (10), nous obtenons C1 et C 2 : a b (11) C1 (t ) = e − (i / h )( E0 − A )t + e − (i / h )( E0 + A )t 2 2 a b (12) C2 (t ) = e −(i / h )( E0 − A )t − e −(i / h )( E0 + A )t 2 2 Ce sont des équations similaires sauf pour le signe du second terme.

Nous avons les solutions. Mais que veulent-elles dire ? La difficulté avec la mécanique quantique n'est pas seulement de résoudre les équations mais de comprendre ce que leurs solutions signifient ! D'abord, remarquez que si b = 0, les deux termes ont la même fréquence ω = (E 0 − A) / h . Si tout varie avec la même fréquence, cela veut dire que le système est dans un état d'énergie bien définie, ici l'énergie est E 0 − A . Il y a donc un état stationnaire d'énergie pour lequel les deux amplitudes

C1 et C 2 sont égales. Nous trouvons que la molécule d'ammoniac a une énergie définie E 0 − A si les amplitudes pour que l'atome d'azote soit "en haut" ou "en bas" sont égales. Il y a un autre état stationnaire possible si a = 0. Les deux amplitudes ont alors la fréquence (E0 + A) / h . Il y a donc un autre état d'énergie définie E 0 + A si les deux amplitudes sont égales mais de signes opposés : C 2 = −C1 . Ce sont les seuls états d'énergie définie. Nous concluons que, du fait qu'il y a une certaine chance pour que l'atome d'azote passe d'une position à l'autre, l'énergie de la molécule n'est pas exactement E 0 , comme nous aurions pu l'attendre, mais il y a deux niveaux d'énergie E 0 + A et E 0 − A . Chacun des états possibles de la molécule, quelle que soit son énergie, est divisé en deux niveaux. Nous disons chacun des états car, vous vous souvenez, nous avons choisi un état particulier de rotation, d'énergie interne, etc. Pour chaque état possible de ce genre il y a un doublet de niveaux d'énergie dû au "flip-flop" de la molécule. Posons-nous maintenant la question suivante sur la molécule d'ammoniac. Supposez qu'à t = 0, nous sachions que la molécule se trouve dans l'état 1 ou, en d'autres termes, que C1 (0) = 1 et

C 2 (0) = 0 . Quelle est la probabilité pour que l'on trouve la molécule dans l'état 2 au temps t ? Notre état initial nous donne ce que valent a et b dans les équations (11) et (12). En faisant t = 0, nous avons a+b a−b (13) C1 (0 ) = = 1 , C 2 (0 ) = =0 2 2

Clairement, a = b = 1. En mettant ces valeurs dans les formules pour C1 (t ) et C 2 (t ) et en réarrangeant les termes, nous avons  e (i / h ) At + e −(i / h ) At   (14) C1 (t ) = e −(i / h )E0t  2  

 e (i / h ) At − e −(i / h ) At   (15) C2 (t ) = e −(i / h )E0t  2   Nous pouvons les récrire comme At (16) C1 (t ) = e −(i / h )E0t cos h At (17) C2 (t ) = ie −(i / h )E0t sin h Les deux amplitudes ont une grandeur qui varie harmoniquement dans le temps. La probabilité pour que la molécule soit trouvée dans l'état 2 au temps t est le carré du module de

C 2 (t ) : (18) C 2 (t ) = sin 2 2

At h

La probabilité part de zéro (comme il se doit), monte jusqu'à un et oscille ensuite entre zéro et un, comme le montre la courbe P2 de la figure ci-dessous. La probabilité pour être dans l'état 1 ne reste évidemment pas l'unité. Elle "se vide" dans le deuxième état jusqu'à ce que la probabilité de trouver la molécule dans le premier état soit zéro, comme le montre la courbe P1 . La probabilité va et vient entre les deux.

Lorsque vous avez étudié le pendule, vous avez probablement vu ce qui se passe lorsque l'on a deux pendules identiques faiblement couplés. Si nous déplaçons l'un d'eux et si nous le laissons partir, il se balance et progressivement l'autre commence à se balancer. Très vite, le deuxième pendule prend toute l'énergie. Alors le processus se renverse et le pendule numéro un prend toute l'énergie. C'est exactement le même genre de chose. La vitesse à laquelle l'énergie est échangée de l'un à l'autre dépend du couplage entre les deux pendules, c'est-à-dire du taux de fuite "d'oscillations" de l'un vers l'autre. Egalement, il y a deux types de mouvements particuliers de deux pendules, chacun ayant une fréquence définie, que l'on appelle les modes fondamentaux. Si nous déplaçons les deux pendules à la fois, ils se balancent ensemble à la même fréquence. Par ailleurs, si nous déplaçons l'un d'une façon et l'autre d'une autre façon, il y a un autre mode stationnaire également avec une fréquence définie. Eh bien, nous avons ici une situation similaire. L'ammoniac est mathématiquement semblable à une paire de pendules. Les deux fréquences, quand ils oscillent ensemble ou quand ils oscillent en opposition sont (E0 + A) / h et (E0 − A) / h . L'analogie avec des pendules n'est pas beaucoup plus profonde que le fait que deux équations identiques ont des solutions identiques. Les équations linéaires donnant les amplitudes sont tout à fait semblables aux équations linéaires d'oscillateurs harmoniques (en fait, c'est là la raison qui explique le succès de la théorie classique de l'indice de réfraction dans laquelle on remplace l'atome

quantique par un oscillateur harmonique alors que, classiquement, ce n'est pas une vue raisonnable du mouvement des électrons autour du noyau). Si vous tirez l'azote d'un coté, vous obtenez une superposition de ces deux fréquences et vous obtenez une sorte de battement parce que le système n'est pas dans l'un des états de fréquence définie. La séparation des niveaux d'énergie de la molécule d'ammoniac est cependant un effet strictement quantique. La séparation des niveaux d'énergie de la molécule d'ammoniac a d'importantes applications pratiques que nous décrirons plus tard. Enfin, nous avons un exemple de problème de physique pratique que vous pouvez comprendre avec la mécanique quantique !

I.3. Le méson K de charge nulle Nous allons maintenant décrire un système à deux états qui appartient au monde des particules étranges, un système pour lequel la mécanique quantique donne une prédiction des plus remarquables. Le décrire complètement nous entraînerait dans tout un tas de considérations sur les particules étranges, nous serons donc obligés malheureusement de prendre quelques raccourcis. Nous ne pouvons que vous décrire dans les grandes lignes la façon dont certaines découvertes ont été faites, afin de vous montrer le type de raisonnement qui a été utilisé. Cela commence par la découverte par Gell-Mann et Nishijima du concept d'étrangeté et d'une nouvelle loi, la conservation de l'étrangeté. C'est en analysant les conséquences de ces nouvelles idées que GellMann et Pais en arrivèrent à la prédiction d'un phénomène extrêmement remarquable que nous allons décrire. Néanmoins, nous allons d'abord vous parler un peu de "l'étrangeté". Il nous faut commencer par ce qu'on appelle les interactions fortes des particules nucléaires. Ce sont les interactions responsables des forces nucléaires fortes. Elles se distinguent en particulier des interactions électromagnétiques, relativement plus faibles. Ces interactions sont "fortes" en ce sens que si deux particules s'approchent suffisament pour enfin interagir, elles interagissent de façon intense et produisent facilement d'autres particules. Les particules nucléaires ont aussi ce qu'on appelle une "interaction faible" par laquelle certaines choses peuvent se produire, telle que la désintégration bêta, mais toujours très lentement du moins à l'échelle du temps nucléaire. Les interactions faibles sont de beaucoup, beaucoup d'ordres de grandeur plus faibles que les interactions fortes et même beaucoup plus faibles que les interactions électromagnétiques. C'est d'ailleurs une des raisons pour laquelle ces interactions faibles sont souvent associées au neutrino, particule légère, non chargée électriquement et insensible aux interactions fortes. Lorsque l'on s'est mis à étudier les interactions fortes à l'aide des grands accélérateurs, ont fut surpris de trouver que certaines choses qui "auraient dû" se produire, et auxquelles ont s'attendait, ne se réalisaient pas. Par exemple, dans certaines interactions, une particule d'un certain type ne se manifestait pas quand on l'attendait. Gell-Mann et Nishijima se sont aperçus que beaucoup de ces observations surprenantes pouvaient s'expliquer immédiatement par l'invention d'une nouvelle loi de conservation : la conservation de l'étrangeté. Ils suggérèrent l'existence d'un attribut d'une nouvelle sorte associé à chaque particule, dénommé par eux nombre "d'étrangeté", tout comme peut

l'être, par exemple, la charge électrique, et la conservation de la "quantité d'étrangeté" dans toute interaction forte. Supposez, par exemple, qu'un méson négatif de grande énergie, disons une énergie de plusieurs milliards d'eV, percute un proton. De l'interaction, peuvent provenir beaucoup d'autres particules : mésons pi, mésons K, particules lambda, particules sigma, n'importe lequel des mésons et baryons répertoriés dans les expériences de physique des particules (voir en annexe). On observe cependant que certaines combinaisons seulement apparaissent et d'autres jamais. On connaissait déjà certaines lois de conservation. Tout d'abord, l'énergie et l'impulsion sont toujours conservées. L'énergie et l'impulsion totales après l'événement doivent être les mêmes qu'avant. Il y a en second lieu la conservation de la charge électrique qui exige que la charge totale des particules sortantes soit égale à la charge totale apportée par les particules initiales. Dans notre exemple d'un méson K et d'un proton qui se rencontrent ont réellement lieu : (1) K − + p → p + K − + π + + π − + π 0 ou K − + p → Σ − + π + Et nous n'obtiendrons jamais (2) K − + p → p + K − + π + ou K − + p → Λ 0 + π + à cause de la conservation de la charge. On savait aussi que le nombre de baryons est conservé. Le nombre de baryons sortants doit être égal au nombre de baryons entants. D'après cette loi, l'antiparticule d'un baryon est comptée moins un baryon. Cela signifie que nous pouvons observer et de fait nous l'observons (3) K − + p → Λ0 + π 0 ou K − + p → p + K − + p + p (ou p est l'antiproton, lequel transporte une charge négative). Mais nous ne voyons jamais (4) K − + p → K − + π + + π 0 ou K − + p → p + K − + n (même lorsqu'il y a beaucoup d'énergie disponible), parce que les baryons ne seraient pas conservés. Néanmoins, ces lois n'expliquent pas l'étrange absence des réactions suivantes, qui ne semblent pas à première vue particulièrement différentes de certaines autres dans (1) et (3) : (5) K − + p → p + K − + K 0 ou K − + p → p + π − ou K − + p → Λ0 + K 0

De toute évidence cela est lié au méson K auquel on peut attribuer une quantité appelée étrangeté et qui serait conservée. On a donc un nombre associé à chaque particule, son étrangeté S, et une loi qui existe selon laquelle l'étrangeté totale sortante, pour toute interaction forte, doit être égale à l'étrangeté totale entrante. Le proton et l'antiproton (p, p ), le neutron et l'antineutron (n, n ) et les mésons ( π + , π 0 , π − ) ont tous zéro pour nombre d'étrangeté, les mésons K + et K 0 ont l'étrangeté +1, le K − et le K 0 (l'anti K 0 ou K zéro bar) ont l'étrangeté -1. On a aussi découvert une particule d'étrangeté -2, la particule Ξ ("ksi" majuscule) et d'autres peut-être non encore connues. Mettons ces étrangetés dans un tableau S -2 -1 0 +1 + p Σ 0 0 Baryons n Λ , Σ0 Ξ − − Ξ Σ π+ K+ Mésons K0 π0 K0 K− π− Voyons comment fonctionne la conservation de l'étrangeté pour certaines des réactions que nous avons écrites. Si nous avons au départ un K − et un proton, l'étrangeté totale est de -1 + 0 = -1. La conservation de l'étrangeté nous dit que l'étrangeté des produits après réaction doit aussi avoir -1 comme somme. Vous voyez qu'il en est ainsi pour les réactions (1) et (3). Mais dans les réactions (5), l'étrangeté du terme de droite est zéro dans chaque cas. De telles réactions ne conservent pas l'étrangeté et ne se produisent pas. Pourquoi ? Cela est lié à la composition en quarks de ces particules, la charge étrange étant portée par le quark étrange, et par les propriétés de l'interaction forte qui remanie les quarks mais ne les transforme pas. Mais nous n'aurons pas besoin de nous plonger dans la structure en quarks de ces particules pour comprendre la suite. Donc, à ce stade on peut juste considérer que la conservation de l'étrangeté est un constat. Voyons maintenant la réaction suivante : un π − heurte un proton. Vous pourriez obtenir, par exemple, une particule Λ0 plus un méson K neutre, deux particules neutres. Mais quel K neutre

obtenez-vous ? Du fait que la particule Λ a l'étrangeté -1 et le π et le p + une étrangeté zéro et puisqu'il s'agit d'une réaction de production rapide, l'étrangeté ne doit pas changer. La particule K doit avoir l'étrangeté +1. Il faut donc que ce soit le K 0 . La réaction est (6) π − + p → Λ0 + K 0 avec S = 0 + 0 = -1 + +1 (conservé) Si c'était le K 0 au lieu du K 0 , l'étrangeté sur la droite serait -1, ce que la nature ne permet pas puisque l'étrangeté sur la gauche est zéro. Par contre, on peut produire un K 0 dans d'autres réactions telles que (7) n + n → n + p + K 0 + K + S = 0 + 0 = 0 + 0 + +1 + -1 Ou (8) K − + p → n + K 0 S = -1 + 0 = 0 + -1 Peut-être vous dites-vous : "tout cela, c'est du vent, car comme savez-vous s'il s'agit d'un K 0 ou d'un K 0 ? Ils se ressemblent tout à fait. Ils sont antiparticules l'un de l'autre, ils ont donc exactement la même masse et tous deux ont une charge électrique zéro. Le K pourrait être sa propre antiparticule comme le photon. Comment les distinguez-vous ?" Par les réactions qu'ils produisent. Par exemple, un K 0 peut interagir avec la matière pour produire une particule Λ , comme ceci : (9) K 0 + p → Λ0 + π + un K 0 ne le peut pas. Par aucun moyen un K 0 ne pourra produire une particule Λ lorsqu'il interagit avec la matière ordinaire (des protons et des neutrons). Sauf, bien sûr, s'il produit aussi deux K + ou d'autres particules d'étrangeté totale +1. Il suffit d'imaginer qu'il s'agit ici de réactions où l'énergie est insuffisante pour produire ces particules supplémentaires étranges. Et, quoi qu'il en soit, ces différents cas sont expérimentalement faciles à distinguer en regardant les particules produites. Les K 0 produits par certaines réactions produisent eux-mêmes certaines réactions et les K 0 produits par d'autres réactions produisent certaines réactions différentes. Il y a clairement deux

particules différentes. Ainsi, une distinction expérimentale possible entre le K 0 et le K 0 serait que l'un d'eux produise ensuite des Λ et l'autre pas. L'une des prédictions de la théorie de l'étrangeté consiste donc en ceci : si, au cours d'une expérience avec des pions de haute énergie, une particule Λ est produite en même temps qu'un méson K neutre, ce méson K neutre rencontrant à nouveau la matière ne produira jamais un Λ . L'expérience pourrait se faire à peu près de cette façon : vous envoyez un faisceau de méson π − dans une grande chambre à bulles à hydrogène (qui ne laisse la trace que des particules chargées électriquement). La trace d'un π − disparaît, mais quelque part ailleurs une paire de trace apparaît (un proton et un π − ) montrant qu'une particule Λ s'est désintégrée. Vous savez alors qu'il existe quelque part un K 0 que vous ne pouvez pas voir.

Vous pouvez quand même savoir par où il est parti en utilisant la conservation de l'impulsion et de l'énergie (il pourrait se manifester plus tard en se désintégrant en deux particules chargées, comme indiqué dans la figure (a)). Tandis qu'il continue son chemin, le K 0 peut rencontrer l'un des noyaux d'hydrogène (un proton) et produire peut-être d'autres particules. La théorie de l'étrangeté prédit qu'il ne produira jamais une particule Λ , du moins au moyen d'une réaction simple telle que (9) K 0 + p → Λ0 + π + alors qu'un K 0 peut très bien le faire. Autrement dit, dans une chambre à bulles, un K 0 pourrait produire l'événement schématisé dans la figure (b), dans lequel un Λ0 est vu grâce à sa

désintégration, un K 0 par contre ne peut pas le produire. C'est la première partie de notre histoire : la conservation de l'étrangeté. Notons que les trajectoires dans les chambres à bulles représentées droites sont en réalité courbées par la présence d'un champ magnétique qui permet ainsi, par la mesure du rayon de courbure, de mesurer l'impulsion de chaque particule chargée laissant une trace. La conservation de l'étrangeté n'est pas absolument stricte. Il existe des désintégrations très lentes de particules étranges, elles prennent beaucoup de temps, typiquement de l'ordre de 10 −10 sec , dans lesquelles l'étrangeté n'est pas conservée (un temps caractéristique, pour les interactions fortes, est plutôt de l'ordre de 10 −23 sec ). Ainsi la particule Λ à l'état libre se désintègre lentement, par le biais d'une interaction faible. Les produits de désintégration sont ou bien un p et un π − ou bien un n et un π 0 . Le temps de vie est de 2,2 × 10 −10 sec . De même, le K 0 se désintègre en deux mésons pi (+ et -) avec une durée de vide de 10 −10 sec . C'est d'ailleurs grâce à ces désintégrations que les particules K furent d'abord observées. Notez que la réaction de désintégration (10) K 0 → π + + π − ne conserve pas l'étrangeté et ne peut donc pas avoir lieu "rapidement" par interaction forte. Elle ne peut procéder que d'une interaction faible. Le K 0 se désintègre lui aussi de cette manière, en deux mésons pi, et aussi avec la même durée de vie (11) K 0 → π + + π − A nouveau, nous avons une désintégration faible puisque l'étrangeté n'est pas conservée. Il existe un principe selon lequel à toute réaction correspond une autre réaction, où "matière" est remplacé par "antimatière" et vice versa. L'antimatière étant ce qui est obtenu après renversement du signe de toutes les charges, y compris les charges des particules internes dans le cas où la particule possède une structure interne (ce qui est le cas des mésons qui contiennent deux quarks). C'est une simple opération de symétrie. Le K 0 étant l'antiparticule du K 0 , il devrait se désintégrer en donnant les antiparticules du π + et su π − , mais l'antiparticule d'un π + c'est le π − (ou vice versa, si vous préférez. Dans le cas des mésons pi, il se trouve que peu importe lequel on appelle "matière"). Du

fait des désintégrations faibles, le K 0 et le K 0 peuvent transiter vers les mêmes produits finaux. Quand ils sont "vus" par leur désintégration, comme dans une chambre à bulles, ils semblent être la même particule. Seules les interactions fortes sont différentes. Enfin, nous voilà prêts à décrire le travail de Gell-Mann et de Pais. Ils ont d'abord noté que le K 0 et le K 0 peuvent l'un et l'autre se transformer en des états formés de deux mésons pi, il doit exister une certaine amplitude pour que le K 0 puisse devenir un K 0 et aussi pour que le K 0 puisse devenir un K 0 . En écrivant les réactions comme on le fait en chimie, nous aurions (12) K 0 ↔ π − + π + ↔ K 0 Ces réactions impliquent qu'il existe une certaine amplitude par unité de temps, disons − i / h que multiplie K 0 W K 0 , pour qu'un K 0 se transforme en K 0 par le biais de l'interaction faible responsable de la désintégration en deux mésons pi. Il existe aussi l'amplitude correspondante K 0 W K 0 pour le processus inverse. Du fait que matière et antimatière se comportent exactement de la même manière, ces deux amplitudes sont égales numériquement. Nous les désignons l'une et l'autre par A : (13) K 0 W K 0 = K 0 W K 0 = A C'est là, on dit Gell-Mann et Pais, une situation très intéressante. Là où les gens ont vu jusqu'à présent deux états distincts du monde, le K 0 et le K 0 , il n'y aurait lieu de voir en fait qu'un seul système à deux états puisqu'il existe une amplitude pour passer de l'un à l'autre état. Pour une analyse complète, il faudrait bien sûr s'occuper de beaucoup plus que deux états, car il y a aussi les états de pi et autres. Mais étant surtout intéressés par la relation entre le K 0 et le K 0 , ils n'ont pas eut à trop compliquer les choses et ils ont pu faire l'approximation d'un système à deux états. Il fut tenu compte des autres états dans la mesure où leur effet contribuait implicitement aux amplitudes de l'équation (13). En conséquence, Gell-Mann et Pais ont analysé la particule neutre comme un système à deux états. Ils commencèrent par choisir, pour les deux états de base, les états K 0 et K 0 (à partir de là,

l'histoire se déroule de manière très similaire à celle de la molécule d'ammoniac). Tout état ψ de la particule K neutre pouvait alors être défini en précisant les amplitudes pour qu'il soit dans l'un et l'autre des états de base. Nous désignerons ainsi ces amplitudes (14) C + = K 0 ψ , C − = K 0 ψ L'étape suivante fut d'écrire les équations hamiltoniennes pour ce système à deux états. S'il n'y avait pas de couplage entre le K 0 et le K 0 , les équations seraient simplement dC ih + = E 0 C + dt (15) dC − ih = E0 C − dt Mais puisqu'il existe une amplitude K 0 W K 0 pour que le K 0 se transforme en K 0 , om faut inclure le terme additionnel (16) K 0 W K 0 C − = AC − ajouté à droite de la première équation. Il faut de même insérer le terme AC + dans l'équation concernant le taux de variation de C − . Mais ce n'est pas tout. Lorsqu'on tient compte de l'effet des deux pions, il faut additionner l'amplitude pour que le K 0 se transforme en lui-même par le processus (17) K 0 → π − + π + → K 0 L'amplitude additionnelle que nous pourrions écrire K 0 W K 0 est égale exactement à K 0 W K 0 puisque les amplitudes pour passer du système de deux pions ou pour en revenir sont

les mêmes, qu'il s'agisse d'un K 0 ou d'un K 0 . Si vous le désirez, la démonstration détaillée peut se faire ainsi : (18) K 0 W K 0 = K 0 W 2π 2π W K 0

et (19) K 0 W K 0 = K 0 W 2π 2π W K 0 Nous faisons ici une simplification car le système de deux pions peut avoir beaucoup d'états correspondant aux diverses impulsions des mésons pi. Nous devrions écrire le coté droit de cette équation sous la forme d'une somme portant sur les divers états de base des pi. Mais le traitement complet conduirait aux même conclusions avec juste des notations beaucoup plus lourdes. Du fait de la symétrie entre matière et antimatière, on a (20) 2π W K 0 = 2π W K 0 et aussi (21) K 0 W 2π = K 0 W 2π Il s'ensuit que K 0 W K 0 = K 0 W K 0 et aussi que K 0 W K 0 = K 0 W K 0 , ainsi que nous l'avions dit plus haut. De toute manière, il y a les deux amplitudes K 0 W K 0 et K 0 W K 0 , l'une et l'autre égale à A, qu'il faut insérer dans les équations hamiltoniennes. La première donne un terme AC + dans le coté droit de l'équation concernant dC + / dt et la seconde un terme AC − dans l'équation concernant dC − / dt . En raisonnant de cette façon, Gell-Mann et Pais conclurent que les équations hamiltoniennes pour le système de mésons K neutres devaient être dC ih + = E 0 C + + AC − + AC + dt (22) dC ih − = E 0 C − + AC + + AC − dt Il nous faut rectifier quelque chose que nous avons dit au cours des sections précédentes : à savoir que deux amplitudes concernant deux processus inverses, comme K 0 W K 0 et K 0 W K 0 sont toujours des complexes conjugués. C'était vrai tant qu'il s'agissait de particules qui ne se désintégraient pas. Mais si les particules peuvent se désintégrer, et donc "se perdre", les deux

amplitudes ne sont plus nécessairement des complexes conjugués. Le raisonnement permettant de montrer que les amplitudes étaient conjuguées utilisait le fait que le passage d'un état A vers B, si on le renversait dans le temps, donnait le passage de l'état B vers A. Mais ici il existe un autre état : un état avec deux pions s'échappant, définitivement. Il existe donc une "perte" et il n'est pas toujours possible de revenir à la situation initiale. Ainsi le méson K 0 peut se transformer en K 0 mais le retour n'est pas toujours possible si, avant, les deux mésons pi s'échappent. La description en deux états n'est qu'approximative, comme nous l'avions signalé plus haut, et le détail est caché dans l'amplitude A. L'égalité (13) ne signifie donc pas que les amplitudes sont des nombres réels. Elles sont en fait complexes. Par conséquent le coefficient A est complexe et nous ne pouvons pas simplement l'incorporer dans l'énergie E 0 . Ayant souvent été confronté à des systèmes à deux états comme celui de l'ammoniac ou le spin de l'électron, nos héros savaient que les équations hamiltoniennes signifiaient qu'il existait une autre paire d'états de base que l'on pourrait utiliser aussi pour représenter le système de la particule K et qui auraient des comportements particulièrement simples. Tout comme nous avons vu dans le cas de l'ammoniac que des combinaisons des états de base donnaient des états stationnaires. Ils se dirent "prenons la somme et la différence de ces deux équations. D'autre part, mesurons toutes nos énergies en prenant E 0 pour origine et prenons des unités d'énergie et de temps pour lesquelles h = 1 " (c'est ce que font toujours les théoriciens modernes de la physique. Cela ne change rien à la physique mais les équations prennent une forme plus simple et réintroduire la ou les constantes manquantes à la fin peut se faire par simple analyse dimensionnelle, ce qui revient à revenir à des unités plus conventionnelles). Voici leur résultat : d d (23) i (C + + C − ) = 2 A(C + + C − ) , i (C + − C − ) = 0 dt dt On voit immédiatement que les combinaisons d'amplitudes (C + + C − ) et (C + − C − ) agissent indépendamment l'une de l'autre (elles correspondent bien sûr aux états stationnaires que nous avons étudiés antérieurement). Ils pensèrent donc que l'utilisation d'une représentation différente pour la particule K serait plus pratique. Ils définirent les deux états 1 1 (24) K 1 = K 0 + K 0 , K2 = K0 − K0 2 2

(

)

(

)

Les facteurs racine carrée de deux sont là pour normaliser les amplitudes. C'est-à-dire pour veiller à ce que la probabilité de trouver la particule dans l'état K 0 ou K 0 est la même que la probabilité de trouver la particule dans l'état K 1 ou K 2 ce que vous pouvez facilement vérifier. Ils dirent qu'au lieu de penser aux mésons K 0 et K 0 , on peut tout aussi bien penser en termes de deux particules (ou "états") K 1 et K 2 . Cela n'a rien d'extraordinaire puisque nous avons vu que ces deux mésons sont en fait deux états d'un même système, d'une même particule pouvant prendre plusieurs états. Mais Gell-Mann et Pais ne firent pas tout cela dans le seul but de donner de nouveaux noms aux particules. Il y a aussi dans tout cela une certaine physique étrange et nouvelle. Supposez que C1 et

C 2 sont les amplitudes pour qu'un certain état ψ soit un méson K 1 ou K 2 : (25) C1 = K 1 ψ , C 2 = K 2 ψ Des équations (24), on peut tirer 1 (26) C1 = (C + + C − ) , C 2 = 1 (C + − C − ) 2 2 L'équation (23) devient alors dC dC (27) i 1 = 2AC1 , i 2 = 0 dt dt Les solutions en sont (28) C1 (t ) = C1 (0 )e − i 2 At , C 2 (t ) = C 2 (0 ) où, bien sûr, C1 (0) et C 2 (0) sont les amplitudes à t = 0.

Ces équations nous disent que si une particule K neutre commence, à t = 0, dans l'état K 1

( C1 (0) = 1 et C 2 (0) = 0 ), les amplitudes au temps t seront

(29) C1 (t ) = e − i 2 At , C 2 (t ) = 0

Si l'on se souvient que A est un nombre complexe, il est commode de poser A = α − iβ (nous écrivons moins iβ parce que la partie imaginaire de 2A se trouve être négative). Après cette substitution, C1 (t ) devient (30) C1 (t ) = C1 (0 )e − β t e − iα r

La probabilité de trouver une particule K 1 à l'instant t est le carré du module de cette amplitude, soit e −2 β t . Et, du fait des équations (28), la probabilité de trouver l'état K 2 est nulle à tout moment. Cela signifie que si vous mettez une particule K dans un état K 1 , la probabilité de la retrouver dans le même état décroît exponentiellement avec le temps, mais vous ne la retrouverez jamais dans l'état K 2 . Où va-t-elle ? Elle se désintègre en deux mésons pi avec la vie moyenne τ = 1 / 2 β laquelle est, expérimentalement, 10 −10 sec . Nous tenions compte de cela lorsque nous disions que A était complexe. D'autre part, les équations (28) nous disent que si nous mettons une particule K entièrement dans l'état K 2 , elle y restera pour toujours. Eh bien, ce n'est pas tout à fait vrai. Expérimentalement, on observe qu'il se désintègre en trois mésons pi, mais 600 fois plus lentement que la désintégration en deux pions que nous avons décrite. Mais, tant que l'on considère seulement la désintégration en deux pions, le K 2 a une durée "éternelle". Maintenant, terminons l'histoire de Gell-Mann et Pais. Ils en vinrent à considérer ce qui se passe lorsque la particule K est produite en même temps qu'une particule Λ0 dans une interaction forte. Puisqu'elle doit dans ce cas avoir l'étrangeté +1, elle doit être produite dans l'état K 0 . Ainsi, à t = 0, ce n'est ni un K 1 ni un K 2 mais un mélange. Les conditions initiales sont (31) C + (0) = 1 , C − (0) = 0

Mais, d'après (25), cela signifie que 1 1 (32) C1 (0 ) = , C 2 (0 ) = 2 2 et encore, d'après (27), 1 − β t −iα t 1 (33) C1 (t ) = e e , C 2 (t ) = 2 2 Maintenant, souvenez-vous que K 1 et K 2 sont l'un et l'autre des combinaisons linéaires de K 0 et K 0 . Dans les équations (33), les amplitudes ont été choisies de sorte qu'à t = 0, les contributions de K 0 s'annulent l'une l'autre par interférence, laissant seul l'état K 0 . Mais l'état K 1 varie avec le temps alors que l'état K 2 ne varie pas. Au-delà de t = 0, l'interférence entre C1 et C 2 donnera des amplitudes finies pour K 0 et K 0 . Que signifie tout cela ? Revenons-en à l'expérience que nous avions schématisée dans la figure plus haut. Un méson π − produit une particule Λ0 et un méson K 0 qui se ballade à travers l'hydrogène de la chambre. Tandis qu'il progresse, il a une certaine chance, faible mais constante, de percuter un noyau d'hydrogène. Au début, nous pensions que la conservation de l'étrangeté empêcherait la particule K de fabriquer un Λ0 dans une telle interaction. Nous voyons maintenant que ceci n'est pas vrai. Car, bien que notre particule K soit, lors de sa création, un K 0 , lequel ne peut pas fabriquer de Λ0 , elle ne reste pas dans cet état. Bientôt, il y aura une certaine amplitude pour qu'elle ait basculé dans l'état K 0 . On doit donc s'attendre à observer parfois un Λ0 produit sur le parcours de la particule K. Les chances que cela arrive sont données par l'amplitude C − que nous pouvons relier à C1 et C 2 (en utilisant à rebours les équations (26)). Cette relation s'écrit 1 (34) C − = (C1 − C 2 ) = 1 e − β t e −iα t − 1 2 2

(

)

Tandis que notre particule K continue son chemin, la probabilité pour qu'elle "agisse comme" un 2

K 0 est égale à C − , c'est-à-dire (35) C −

2

=

(

1 1 + e − 2 β t − 2e − β t cos αt 4

)

Un résultat étrange et compliqué ! Voilà donc la remarquable prédiction de Gell-Mann et Pais. Quand un K 0 est produit, les chances pour qu'il se transforme en K 0 , fait que pourra mettre en évidence la production d'un Λ0 , varient avec le temps selon l'équation (35). Cette prédiction provient seulement de la logique pure et des principes de base de la mécanique quantique, sans qu'il soit nécessaire de rien savoir du fonctionnement interne de la particule K. Etant donné que personne ne savait rien à l'époque sur les rouages internes, Gell-Mann et Pais ne pouvaient pas aller au-delà. Ils ne pouvaient pas donner des valeurs théoriques à α et β . Et personne n'a su le faire depuis même si les rouages internes ont été décryptés (la structure en quark et l'interaction faible dont la violation de la symétrie dite CP, que nous verrons plus tard. Mais l'importance de cette violation reste un paramètre libre, non calculé). Ils ont pu donner pour β une valeur déduite du taux expérimental de désintégration en deux pi ( 2 β = 1010 sec ), mais, quant à α , ils ne purent rien en dire.

Nous avons fait le graphique des fonctions (35) ci-dessus pour deux valeurs de α . Vous voyez que la forme dépend très fortement du rapport entre α et β . Au départ, la probabilité K 0 est nulle. Elle croît ensuite. Si α est grand, la probabilité aura de fortes oscillations. Si α est petit, il y aura peu ou pas d'oscillations, la probabilité aura simplement une croissance régulière jusqu'à 1/4. Dans une situation expérimentale typique, la particule K, dotée d'une très grande énergie, se déplace à une vitesse constante proche de la vitesse de la lumière. Les courbes ci-dessus représentent donc aussi la probabilité d'observer un K 0 en fonction de la longueur parcourue, avec des distances qui sont typiquement de quelques centimètre. Vous pouvez voir ce que cette prédiction a d'étonnant. Vous produisez une seule particule et au lieu de se désintégrer simplement, elle fait quelque chose d'autre. Parfois elle se désintègre et parfois, elle se transforme en une particule d'un type différent. Sa probabilité caractéristique de produire un effet varie d'étrange manière le long de son parcours. Il n'y a rien de tout à fait semblable dans la nature. Et cette prédiction des plus remarquables a été déduite de spéculations portant seulement sur les interférences entre amplitudes. S'il existe un endroit où l'on a des chances de vérifier de la manière la plus pure les principes essentiels de la mécanique quantique, la superposition des amplitudes se produit-elle ou pas ?, c'est bien là. Depuis, de nombreuses expériences conçues dans le but d'étudier finement ce mécanisme ont été menées confirmant les prédictions de Gell-Mann et Pais. Notons que cet effet manifeste aussi quelque chose d'extraordinaire. En effet, on part d'une particule de matière, le K 0 , et on aboutit à une particule d'antimatière, le K 0 . Il y a donc une légère asymétrie dans la matière - antimatière. C'est la seule manifestation connue de cette asymétrie car cette symétrie, fortement reliée à la symétrie CP, est parfaitement respectée par les interactions électromagnétiques et fortes. Il est possible que cette petite différence puisse être à l'origine de l'abondance de matière dans l'univers et de la rareté de l'antimatière. L'analyse que nous venons de décrire est très caractéristique de la façon dont on utilise aujourd'hui la mécanique quantique pour la recherche d'une compréhension des particules étranges. Toutes les théories compliquées dont vous pouvez entendre parler à ce sujet ne sont ni plus ni moins que de simples tours de passe-passe de ce genre là, utilisant le principe de superposition et autres principes

de mécanique quantique de cet acabit. Certains prétendent avoir des théories qui leur permettent de calculer α et β , ou au moins α , connaissant β , mais ces théories n'ont aucun intérêt. Par exemple, la théorie qui prédit la valeur de α connaissant β , nous dit que cette valeur de α devrait être infinie. L'ensemble des équations dont ils partent concerne deux mésons pi qui transitent vers un K 0 et ainsi de suite. Après manipulation, on aboutit en effet à deux équations similaires à celles que nous avons ici. Mais comme il y a un nombre infini d'états à deux pions, selon leurs impulsions, l'intégration sur toutes les possibilités donne un α infini. Pourtant l' α de la nature n'est pas infini. Les théories dynamiques sont donc fausses. Il est vraiment remarquable que les seules prédictions que l'on puisse faire dans le monde des particules étranges aient pour origine les principes de mécanique quantique du niveau de ce cours.

I.4. Généralisation aux systèmes à N états Nous en avons terminé avec les systèmes à deux états dont nous voulions parler. Nous reviendrons à des systèmes de ce genre lorsque nous aborderons le spin. Dans la suite, nous en viendrons à l'étude des systèmes à d'avantages d'états. L'extension aux systèmes à N états des idées que nous avons développées pour les systèmes à deux états est assez directe. Cela se fait ainsi. Si un système à N états distincts, nous pouvons représenter chaque état ψ (t ) comme une combinaison linéaire d'un ensemble quelconque d'états de base i , où i = 1, 2, 3,… N. (1) ψ (t ) =

∑ i C (t ) i

tout

i

Les coefficients C i (t ) sont les amplitudes i ψ (t ) . Le comportement des amplitudes C i en fonction du temps est déterminé par les équations dC (2) ih i = ∑ H ij C j dt j où la matrice H ij décrit la physique du phénomène. Cela ressemble au cas de deux états. Seulement, cette fois, i et j doivent chacun avoir pour domaine l'ensemble des N états de base et la matrice énergie H ij , ou si vous préférez, l'hamiltonien, est une matrice N par N avec N 2 éléments. Comme avant, H ij∗ = H ji , pour autant que les particules soient conservées (contrairement au cas des mésons K, par exemple) et les éléments diagonaux de H ij sont des nombres réels. Nous avons déjà trouvé les solutions pour les C d'un système à deux états lorsque la matrice énergie est constante (indépendante de t). Il n'est pas non plus difficile de résoudre l'équation (2) pour un système à N états quand H ne dépend pas du temps. A nouveau, commençons par chercher une solution possible pour laquelle les amplitudes ont toutes la même dépendance en temps. Nous essayons (3) C i = a i e − (i / h )Et

Quand on substitue ces C i dans (2), les dérivées dC i / dt deviennent simplement (− i / h )EC i . En supprimant le facteur commun à tous les termes, on obtient : (4) Ea i = ∑ H ij a j j

C'est un ensemble de N équations algébriques linéaires pour N inconnues a1 , a 2 , …, a N et il n'y a de solution que si vous avez de la chance, uniquement si le déterminant des coefficients de tous les a est nul. Mais il n'y a pas lieu d'être aussi compliqué. Vous pouvez simplement commencer à résoudre les équations de la manière que vous voudrez et vous trouverez qu'on ne peut les résoudre que pour certaines valeurs de E (rappelez-vous que E est la seule chose ajustable que nous ayons dans ces équations). Si néanmoins vous voulez être formalistes, vous pouvez écrire (4) sous la forme (5) ∑ (H ij − δ ij E )a j = 0 j

Vous pouvez ensuite utiliser la règle, si vous la connaissez, selon laquelle ces équations n'ont une solution que pour les valeurs de E qui satisfont à (6) det (H ij − δ ij E ) = 0 Chaque terme du déterminant est simplement H ij sauf que E est soustrait de chaque élément diagonal. Ainsi, l'équation (6) signifie simplement H 12 H 13 L  H 11 − E   H 22 − E H 23 L  H 21 (7) det  =0 H 31 H 32 H 33 − E L    L  L L L  

Ce n'est là, bien sûr, qu'une forme particulière d'équation algébrique pour la variable E. C'est la somme d'un tas de produits portant sur tous les termes pris dans un certain ordre. Ces produits donneront toutes les puissances de E jusqu'à E N . Nous avons donc un polynôme du Nième ordre égal à zéro. Il y a en général N racines (nous devons nous souvenir que certaines d'entre elles peuvent être des racines multiples, autrement dit, plusieurs racines peuvent être égales). Désignons ces N racines par (8) E I , E II , E III , …, En , …, E N (nous utiliserons n pour représenter le nième chiffre romain. n prend donc toutes les valeurs I, II, …, N). Il se peut que certaines de ces énergies soient égales, disons E II = E III , mais nous préférons leur conserver des noms différents. Les équations (4) ou (5) ont une seule solution pour chaque valeur de E. Si nous portons l'une quelconque des valeurs de E, disons En , dans (4) et si nous cherchons les solutions pour les a i , nous obtenons un ensemble de valeurs associées à l'énergie En . Nous désignons ces solutions par a i (n ) . En portant ces a i (n ) dans (3), nous obtenons les amplitudes C i (n ) , amplitudes pour qu'un état d'énergie définie soit dans l'état de base i . En désignant par n le vecteur d'état représentant à t = 0 l'état d'énergie définie, nous pouvons écrire (9) C i (n ) = i n e avec (10) i n = ai (n )

(i / h )En t

L'état d'énergie définie complet ψ n (t ) peut alors s'écrire (11) ψ n (t ) = ∑ i ai (n )e i

ou

− (i / h ) Ent

(12) ψ n (t ) = n e

(i / h )En t

Les vecteurs d'état n décrivent la configuration des états d'énergie définie, mais le facteur de dépendance au temps est omis. Ils constituent ainsi des vecteurs constants que l'on peut utiliser comme nouvelle base si on le désire. Chacun des états n a la propriété suivante, que vous pouvez facilement établir, sous l'action de l'opérateur hamiltonien Hˆ , il redonne simplement le même état que multiplie En . (13) Hˆ n = E n n

L'énergie En apparaît ainsi comme un nombre caractéristique de l'opérateur hamiltonien Hˆ . Comme nous l'avons vu, un hamiltonien aura en général plusieurs énergies caractéristiques. Dans le monde des mathématiciens, on les appelle "valeurs propres" de la matrice H ij . Les physiciens leur donnent habituellement également ce nom ou celui de "eigen" de H ("eigen" est le mot allemand pour "caractéristique" ou "propre"). A chaque valeur de "eigen" de H, autrement dit, à chaque énergie, correspond un état d'énergie définie, état que nous avons désigné par "stationnaire". On désigne le plus souvent ces états n comme "états propres" ou "eigen" ou "vecteurs propres" de Hˆ . A chaque état propre correspond une valeur propre particulière E . n

De manière générale, les états n , qui sont au nombre de N, peuvent définir une base. Pour que ce soit vrai, il faut que tous les états soient orthogonaux, ce qui signifie que pour deux quelconques d'entre eux, disons n et m , (14) n m = 0 Ceci sera automatiquement vrai si toutes les énergies sont différentes. On peut d'autre part multiplier tous les a i (n ) par un facteur approprié pour que tous états soient normalisés, par là nous entendons que,

(15) n n = 1 pour tout n . Quand il arrive par accident que l'équation (7) a deux racines (ou plus) à la même énergie, il y a encore quelques complications mineures. Tout d'abord, il y a bien encore deux séries différentes de coefficients a i même pour des valeurs égales de l'énergie, mais les états qu'ils définissent peuvent ne pas être orthogonaux. Supposez qu'ayant procédé de façon normale, vous trouviez deux états stationnaires avec des énergies égales, désignons les par µ et ν . Il se peut qu'ils ne soient pas orthogonaux, si vous êtes malchanceux, vous aurez (16) µ ν ≠ 0 Mais il vous sera chaque fois possible de mijoter deux nouveaux états que nous désignerons par µ ′ et ν ′ qui, tout en ayant la même énergie, sont aussi orthogonaux. On aura donc (17) µ ′ ν ′ = 0 Vous pouvez aboutir à cela en construisant µ ′ et ν ′ comme des combinaisons linéaires de µ et ν dont les coefficients sont choisis de manière à satisfaire (17). Nous supposerons en général que ceci a été fait et, par conséquent, que tous nos états d'énergie propre sont orthogonaux. Nous aimerions, pour le plaisir, prouver que deux états stationnaires d'énergies différentes sont toujours orthogonaux. Pour l'état n d'énergie En , on a (18) Hˆ n = E n n

Cette équation d'opérateur implique en fait une équation entre nombres. D'ailleurs, après que nous ayons remis les parties manquantes, elle s'écrit (19) ∑ i Hˆ j j n = E i n n

j

Si nous prenons le complexe conjugué de cette équation, nous obtenons (20)



i Hˆ j



jn



= En∗ i n



j

Souvenez-vous maintenant que le complexe conjugué d'une amplitude est l'amplitude du processus inverse. Ainsi, (20) peut se récrire sous la forme (21) ∑ n j j Hˆ i = E ∗ n i n

j

Cette équation étant vraie quel que soit i, elle a pour "forme condensée" (22) n Hˆ = En∗ n C'est ce qu'on appelle la relation "adjointe" de (18). On peut maintenant prouver sans difficulté que En est un nombre réel. Nous multiplions (18) par

n pour obtenir (23) n Hˆ n = En puisque n n = 1 . Nous multiplions ensuite (22) sur la gauche par n et nous obtenons (24) n Hˆ n = En∗ En comparant (23) et (24), on voit immédiatement que (25) E n = E n∗ ce qui signifie que En est réel. Nous pouvons effacer l'étoile de En dans l'équation (22).

Nous voilà enfin en mesure de prouver que les états d'énergies différentes sont orthogonaux. Prenons n et m , deux quelconques des états de base d'énergie définie. En appliquant à l'état m l'équation (22) et en multipliant ensuite par n , nous obtenons (26) m Hˆ n = Em m n Si, d'autre part, nous multiplions (18) par m , nous obtenons (27) m Hˆ n = En m n Les termes de gauche de ces deux équations étant égaux, les termes de droite le sont aussi, d'où : (28) Em m n = En m n Si Em = En , l'équation ne nous apprend rien. Mais si les énergies des deux états m et n sont différentes ( Em ≠ En ), l'équation (28) nous dit que m n doit être nul. C'est ce que nous voulions

montrer. Les deux états sont nécessairement orthogonaux, pour autant que En et Em sont numériquement différents.

II. Equation de Schrödinger II.1. Développement de l'équation Nous en arrivons maintenant au développement de l'équation de Schrödinger. En nous servant de ce que nous avons vu avec les solutions des équations quantiques dans le cas à N états, nous allons étudier comment peut se comporter un électron lorsqu'il se propage dans un cristal. A partir de là, par analogie et un passage à la limite, nous pourrons en déduire l'équation de Schrödinger pour une particule libre ou plongée dans un potentiel.

II.1.1. Propagation dans un réseau cristallin II.1.1.1. Etats d'un électron dans un réseau à une dimension Nous pourrions penser, à première vue, qu'un électron de basse énergie aurait beaucoup de difficultés à passer au travers d'un bloc de cristal. Les atomes sont tassés, leurs centres n'étant distants que de quelques angströms et le diamètre effectif de l'atome pour diffuser un électron est lui aussi de l'ordre de l'angström. Autrement dit, les atomes sont grands par rapport à leur espacement et vous vous attendriez à ce que le parcours moyen entre collisions soit de l'ordre de quelques angströms, ce qui n'est pratiquement rien. Vous vous attendriez à ce que l'électron se heurte presque immédiatement à quelqu'atome. Néanmoins, si le réseau est parfait, les électrons peuvent voyager avec aisance au travers du cristal, pratiquement comme s'ils étaient dans le vide. C'est un phénomène d'ubiquité de la nature. C'est ce fait étrange qui permet aux métaux de conduite l'électricité si facilement. Il a aussi permis le développement de nombreux systèmes d'intérêt pratiques. C'est lui, par exemple, qui permet à un transistor d'imiter la lampe radio. Dans une lampe radio, les électrons se déplacent librement à travers le vide, tandis que dans le transistor ils se déplacent librement à travers un réseau cristallin. Les mécanismes qui expliquent le comportement des transistors seront décrits dans ce qui suit mais nous verrons plus tard les applications de ces principes dans divers dispositifs d'intérêt pratique. La conduction des électrons dans un cristal est un exemple parmi d'autres d'un phénomène très général. Il n'y a pas que les électrons à pouvoir voyager à travers des cristaux, d'autres "choses" aussi, telles que les excitations atomiques peuvent se comporter de manière semblable. Ainsi, le phénomène dont nous voulons discuter apparaît de multiples façons dans l'étude de la physique à l'état solide. Nous avons déjà discuté d'exemples de systèmes à deux états. Imaginons maintenant un électron qui puisse se trouver dans l'une des deux positions, l'environnement restant du même type dans l'un et l'autre cas. Supposons aussi qu'il existe une certaine amplitude pour qu'il passe d'une position à l'autre et bien sûr la même amplitude pour le passage inverse. Les lois de la mécanique quantique donnent alors les résultats suivants. Il existe deux états d'énergie définie possible pour l'électron. Tout état peut être décrit en donnant les amplitudes pour que l'électron soit dans chacune des deux

positions de base. Pour l'un et l'autre état d'énergie définie, les grandeurs de ces amplitudes sont constantes dans le temps et les phases varient en fonction du temps avec une même fréquence. Par ailleurs, si l'électron est au départ dans une position, il passera plus tard à l'autre et plus tard encore il sera de retour à la première position. L'amplitude est analogue au mouvement de deux pendules couplés. Considérez maintenant un réseau cristallin parfait et imaginez qu'un électron puisse y être situé dans une sorte de "trou", près d'un certain atome et qu'il ait une certaine énergie. Supposez en outre que cet électron a une certaine amplitude de se déplacer dans un trou différent, près de l'un des atomes voisins. C'est un peu comme le système à deux états, mais avec une complication supplémentaire. Une fois l'électron arrivé à l'atome voisin, il peut repartir vers une nouvelle destination ou bien revenir au point de départ. Nous avons maintenant une situation analogue non pas à deux pendules couplés mais à une infinité de pendules tous couplés les uns avec les autres. Cela peut vous rappeler l'une de ces machines, faite d'une longue série de barres montées sur un fil de torsion, et que l'on utilise en première année de physique pour démontrer la propagation des ondes. Si vous avez un oscillateur harmonique couplé à un autre oscillateur harmonique, celui-ci étant couplé à un autre et ainsi de suite… et si vous provoquez une irrégularité en un endroit, cette irrégularité se propagera comme une onde le long de la ligne. La même situation existe si vous placez un électron près de l'un des atomes d'une longue chaîne d'atomes. Habituellement, la manière la plus simple d'analyser le problème mécanique n'est pas de penser à ce qui se passe si une impulsion est donnée en un point précis mais plutôt de considérer les solutions d'ondes stationnaires. Il existe certains modes de perturbation qui se propagent au travers du cristal comme une onde de fréquence constante et unique. La même chose se produit avec l'électron et pour les mêmes raisons car il est décrit, en mécanique quantique, par le même type d'équations. Cependant vous devez bien comprendre ceci : l'amplitude pour que l'électron soit en un lieu est une amplitude et non une probabilité. Si l'électron ne faisait que s'écouler d'un endroit vers l'autre, comme l'eau à travers un trou, le comportement serait complètement différent. Par exemple, si nous

avions deux réservoirs réunis par un tuyau permettant un certain écoulement de l'un vers l'autre, les niveaux tendraient exponentiellement à s'égaliser. Mais ce qui se passe pour l'électron, c'est un écoulement d'amplitude et non pas un banal écoulement de probabilité. Et c'est une caractéristique du terme imaginaire, le i dans les équations différentielles de mécanique quantique, qui change la solution exponentielle en une solution oscillatoire. Ce qui se passe alors est tout à fait différent de l'écoulement entre deux réservoirs reliés entre eux.

Nous voulons maintenant analyser de façon quantitative la situation quantique. Imaginez un système à une dimension, constitué d'une longue ligne d'atomes comme indiqué sur la figure cidessus (un cristal, bien sûr, a trois dimensions, mais la physique est pratiquement la même. Une fois que vous aurez compris le cas à une dimension, vous pouvez comprendre ce qui se passe à trois dimensions). Nous voulons voir ensuite ce qui se passe si nous mettons un électron et un seul sur

cette ligne d'atomes. Bien sûr, dans un cristal réel, il y a déjà des milliers d'électrons. Mais la plus part (presque tous dans un cristal isolant) prennent place dans un mouvement d'un certain type, chacun autour de son atome, et tout est pratiquement stationnaire. Mais ce que nous voulons savoir c'est ce qui se passe si nous introduisons un électron supplémentaire. Nous ne nous occuperons pas de ce que font les autres car nous supposons qu'il faudrait, pour changer leur mouvement, énormément d'énergie d'excitation. Nous allons ajouter un électron comme s'il s'agissait de produire un ion négatif faiblement lié. En observant ce que fait cet unique électron supplémentaire, nous faisons une approximation, nous négligeons le mécanisme interne des atomes. L'expérience montre que cette approximation est généralement bien justifiée. Bien sûr, l'électron peut ensuite passer à un autre atome, transférant ailleurs l'ion négatif. Nous supposerons que cet électron peut sauter d'un atome à l'atome voisin de droite ou de gauche avec une certaine amplitude. Comment décririons-nous un tel système ? Quels seront les états de base raisonnables ? Vous pouvez aisément deviner comment cela va se passer. Supposez que, dans notre rangée d'atomes, tous les espaces sont égaux (c'est un cristal) et nous donnons à chaque atome un numéro d'ordre, comme indiqué sur la figure (a). L'un des états de base correspond à l'électron situé sur l'atome numéro 6, pour un autre état de base, l'électron est à l'atome numéro 7, ou à l'atome numéro 8 et ainsi de suite. Nous pouvons décrire le nième état de base en disant que l'électron est à l'atome numéro n. Disons que c'est l'état de base n . La figure ci-dessus montre ce que nous entendons par les trois états n − 1 , n et n + 1 . A partir de ces états de base, nous pouvons décrire tout état φ de notre cristal à une dimension en donnant l'amplitude n φ pour que l'état φ soit dans l'un des états de base, autrement dit l'amplitude pour que l'électron soit localisé à un atome particulier. Nous pouvons ensuite écrire l'état φ comme une superposition des états de base (1) φ = ∑ n n φ n

Puis, nous supposerons que l'électron, situé à l'un des atomes, a une certaine amplitude pour passer à l'atome voisin de droite ou de gauche. Et pour prendre le cas le plus simple, nous supposerons qu'il ne peut passer qu'aux atomes immédiatement voisins pour atteindre le plus proche parmi les autres, il lui faut donc procéder en deux étapes. Nous poserons que les amplitudes pour le saut d'un atome au suivant sont iA / h (par unité de temps). Pour le moment nous représenterons par C n l'amplitude n φ pour que l'électron soit au nième atome. Alors l'équation (1) devient (2) φ = ∑ n C n n

Si nous connaissions chacune des amplitudes C n à un instant donné, nous pourrions prendre le carré de leurs modules et obtenir la probabilité que vous trouviez l'électron, si vous le cherchiez à l'atome n à cet instant. Quelle sera la situation un peu plus tard ? Par analogie avec les systèmes à deux états que nous avons étudiés, nous pouvons supposer que les équations hamiltoniennes pour ce système doivent être de ce type : dC (t ) (3) ih n = E 0 − AC n+1 (t ) − AC n −1 (t ) dt Le premier coefficient sur la droite, E 0 , est, physiquement, l'énergie qu'aurait l'électron s'il ne pouvait pas passer d'un atome à l'autre (ce que nous représentons par E 0 importe peu. E 0 ne représente en effet, comme nous l'avons déjà vu, rien d'autre que notre convention de niveau zéro d'énergie). Le terme suivant représente l'amplitude par unité de temps pour que l'électron passe dans le nième trou venant du (n+1)ième et le dernier terme est l'amplitude pour qu'il y vienne à partir du (n-1)ième. Comme d'habitude nous supposerons que A est une constante (indépendante du temps).

La description intégrale du comportement de tout état φ demanderait que nous ayons une équation telle que (3) pour chacune des amplitudes C n . Comme le cristal que nous considérons a un très grand nombre d'atomes, nous supposerons qu'il y a un nombre infiniment grand d'états et que la chaîne d'atomes s'étend à l'infini dans les deux directions (pour traiter le cas fini, il nous faudra faire particulièrement attention à ce qui se passe aux extrémités). Si le nombre N de nos états de base est infiniment grand, nos équations hamiltoniennes sont aussi en nombre infini ! Nous n'en écrirons qu'un échantillon : M M

dC n −1 = E0 C n −1 − AC n − 2 − AC n dt dC (4) ih n = E 0 C n − AC n −1 − AC n +1 dt dC ih n +1 = E0 C n +1 − AC n − AC n + 2 dt M M ih

II.1.1.2. Etats d'énergie définie Il y a beaucoup de choses que l'on pourrait étudier concernant un électron dans un réseau, mais essayons d'abord de trouver les états d'énergie définie. Autrement dit, comme nous l'avons vu précédemment, il nous faut trouver une situation telle que les amplitudes varient toutes avec la même fréquence, si, du moins elles varient avec le temps. Nous cherchons des solutions de la forme (1) C n = a n e − iEt / h Le nombre complexe a n nous renseigne sur la partie, invariante avec le temps, de l'amplitude pour que l'on trouve l'électron au nième atome. Si nous essayons cette solution dans notre système d'équations pour voir ce qui en résulte, nous obtenons ceci : (2) Ea n = E0 a n − Aa n +1 − Aa n −1 Nous avons un nombre infini d'équations de ce type, concernant un nombre infini d'inconnues a n , ce qui est assez effrayant. Tout ce que nous avons à faire, c'est de prendre le déterminant… mais attendez ! Des déterminants pour 2, 3 ou 4 équations, cela va bien. Mais s'il y a un grand nombre d'équations ou un nombre infini, les déterminants ne sont plus très pratiques. Nous ferions mieux d'essayer de résoudre les équations directement. Désignons d'abord les atomes par leurs positions. Nous dirons que l'atome n est à x n et l'atome (n+1) à x n +1 . Si l'espacement des atomes est b, nous aurons x n +1 = x n + b . En choisissant notre origine à l'atome 0, nous avons simplement x n = nb . Nous pouvons récrire ainsi l'équation (1) (3) C n = a ( x n )e − iEt / h et l'équation (2) devient alors (4) Ea ( x n ) = E 0 a ( x n ) − Aa ( x n +1 ) − Aa ( x n −1 ) Ou encore, en utilisant le fait que x n +1 = x n + b (5) Ea ( x n ) = E 0 a ( x n ) − Aa ( x n + b ) − Aa ( x n − b )

Cette équation est un peu semblable à une équation différentielle. Elle nous dit qu'une certaine quantité a( x ) en un point x n est reliée à la même quantité en certains points voisins, x n ± b (une équation différentielle relie la valeur d'une fonction en un point à ses valeurs en des points infiniment proches). Les méthodes que nous utilisons habituellement pour résoudre les équations différentielles pourraient peut-être marcher ici, essayons. Les équations différentielles linéaires avec coefficients constants peuvent toujours se résoudre en termes de fonctions exponentielles. Nous pouvons essayer la même chose ici. Essayons la solution (6) a ( x n ) = e

ikxn

L'équation (4) devient alors (7) Ee ikxn = E0e ikxn − Aeik ( xn + b ) − Aeik ( xn −b ) Nous pouvons diviser par le facteur commun e ikxn . On obtient (8) E = E 0 − Ae ikb − A − ikb Les deux derniers termes sont simplement 2 A cos kb , ainsi (9) E = E0 − 2 A cos kb Nous avons trouvé que, pour n'importe quelle constante k, il y a une solution dont l'énergie est donnée par cette équation. Il y a différentes énergies possibles qui dépendent de k et à chaque valeur de k correspond une solution différente. Il y a un nombre infini de solutions, ce qui n'est pas surprenant puisque nous sommes partis d'un nombre infini d'états de base. Voyons ce que signifient ces solutions. Pour chaque k, les a sont donnés par (6). Les amplitudes C n sont alors données par (10) C n = e

ikxn

e − (i / h )Et

où l'énergie E, il ne vous faut pas l'oublier, dépend aussi de k selon l'équation (9). La dépendance d'espace de ces amplitudes est eikxn . Les amplitudes oscillent quand nous nous déplaçons d'atome en atome.

Ce que nous disons, c'est que, dans l'espace, l'amplitude se comporte comme une oscillation complexe, la grandeur est la même en chaque atome, mais la phase à un instant donné augmente (ikb) d'un atome à l'autre. Nous pouvons nous représenter ce qui se passe en dessinant une ligne verticale qui, à chaque atome, représente uniquement la partie réelle. Ce que nous avons fait dans la figure ci-dessus. L'enveloppe de ces lignes verticales (indiquée par le trait discontinu) est, bien entendu, une sinusoïde. La partie imaginaire de C n est aussi une fonction oscillante mais dont la phase est décalée de 90°, de sorte que le carré du module (qui est la somme des carrés des parties réelles et imaginaires) est le même pour tous les C. Ainsi, ayant choisi un k, nous avons un état stationnaire d'énergie particulière E. Et pour tout état de ce type, on a une chance égale de trouver l'électron à chacun des atomes, il n'y a pas de préférence pour un atome ou pour un autre. La phase seule est différente pour différents atomes. De plus, lorsque le temps passe, les phrases varient. D'après l'équation (10), les parties réelles et imaginaires de propagent le long du cristal comme des ondes, précisément comme les parties réelles et imaginaires de (11) e

[

i kxn − ( E / h )t

]

L'onde peut voyager vers les x positifs ou négatifs selon le signe que nous avons choisi pour k. Notez que nous avons supposé réel le nombre k placé dans notre solution d'essai (6). Nous pouvons voir maintenant pourquoi il doit en être ainsi, lorsque nous avons une ligne infinie d'atomes. k ′x Supposez que nous ayons k imaginaire, disons ik ′ . Les amplitudes a n varieraient comme e n , l'amplitude deviendrait donc de plus en plus grande lorsque nous irions vers les grand x, vers les x négatifs si k ′ est négatif. Ce type de solution pourrait marcher si nous avions affaire à une ligne d'atomes qui ait une fin, mais ne peut pas être une solution physique pour une chaîne infinie d'atomes. Il en résulterait des amplitudes non bornées et donc des probabilités non bornées, quel que soit le facteur de normalisation qui serait choisi, ce qui ne peut représenter une situation réelle. Plus loin nous verrons un exemple dans lequel un k imaginaire aurait un sens.

La relation entre l'énergie E et le nombre d'ondes k donnée par l'équation (9) est représentée cidessus. Comme vous pouvez le voir sur la figure, l'énergie peut aller de E 0 − 2 A pour k = 0 à

E 0 + 2 A pour k = ±π / b . Le dessin est fait pour A positif. Si A était négatif, la courbe serait simplement renversée, mais le "domaine" serait le même. Le résultat significatif est que toute

énergie est possible à l'intérieur d'un certain domaine, d'une certaine "bande" d'énergies, mais pas à l'extérieur. Dans le cadre de nos hypothèses, si un électron dans un cristal est dans un état stationnaire, il ne peut avoir d'énergie dont la valeur ne soit dans cette bande. Selon (6), les plus petits k correspondent aux états de basse énergie, E ≈ E0 − 2 A . Si k augmente en valeur absolue (vers des valeurs positives ou négatives) l'énergie commence par croître, mais elle atteint un maximum à k = ±π / b , comme indiqué sur la figure. Pour des k plus grand que π / b , l'énergie recommencerait à décroître. Mais il n'y a pas lieu de considérer de telles valeurs de k car elles ne donnent pas de nouveaux états, elles ne font que répéter les états que nous avons déjà pour k plus petit. Nous pouvons voir cela de la manière suivante. Considérez l'état d'énergie minimum, pour lequel k = 0. Le coefficient a ( x n ) est le même pour tout x n . Nous aurions la même énergie pour k = 2π / b . Mais alors (6) nous donne (12) a ( x n ) = e

i ( 2π / b ) xn

Si nous prenons x0 comme origine, nous pouvons poser x n = nb et a ( x n ) devient

(13) a ( x n ) = e i 2π n = 1

L'état décrit par ces a ( x n ) est physiquement le même que celui que nous avons obtenu pour k = 0. Il ne représente pas une autre solution.

Pour prendre un autre exemple, supposez que k soit égal à π / 4b . La partie réelle de a ( x n ) varierait comme indiqué par la courbe 1 ci-dessus. Si k était sept fois plus grand ( k = 7π / 4 ), la partie réelle de a ( x n ) varierait comme indiqué par la courbe 2 (les sinusoïdes complètes n'ont bien entendu aucune signification en soit. Tout ce qui importe ce sont les valeurs aux points x n . Les courbes ne sont là que pour vous aider à voir ce qui se passe). Vous voyez que les deux valeurs de k donnent les mêmes amplitudes pour tous les x n . En conséquence, pour avoir toutes les solutions possibles de notre problème, il nous suffit de prendre les k dans un certain domaine fini. Nous choisirons le domaine allant de − π / b à + π / b , celui de la figure plus haut. Dans ce domaine, l'énergie des états stationnaires croît uniformément lorsque k croît en valeur absolue. Une remarque en passant à propos d'une liberté que vous avez. Supposez que l'électron puisse non seulement sauter d'un atome à son voisin le plus proche avec l'amplitude iA / h , mais qu'il ait aussi la possibilité de passer d'un seul bon jusqu'à l'atome suivant avec quelqu'autre amplitude iB / h . Vous verrez que la solution peut à nouveau s'écrire sous la forme a n = e n , ce type de solution est universel. Vous trouverez également que les états stationnaires de nombre d'onde k ont une énergie égale à E 0 − 2 A cos kb − 2 B cos 2kb . Ceci montre que la forme de la courbe de E en fonction de k ikx

n'est pas universelle mais dépend des hypothèses particulières au problème. Ce n'est pas toujours une forme sinusoïdale et, même, il n'y a pas toujours une symétrie par rapport à une quelconque ligne horizontale. Ce qui reste vrai, c'est que la courbe se répète à l'extérieur de l'intervalle allant de − π / b à + π / b . Il n'y a donc jamais lieu de s'occuper des autres valeurs de k. Regardons d'un peu plus près ce qui se passe pour les petites valeurs de k, c'est-à-dire lorsque les variations des amplitudes d'un x n au suivant sont très lentes. Choisissons le zéro d'énergie de sorte que E 0 = 2 A . Le minimum de la courbe est alors à l'énergie zéro. Pour k suffisament petit, nous pouvons écrire (14) cos kb ≈ 1 − k 2 b 2 / 2 et l'énergie de l'équation (9) devient (15) E = Ak 2 b 2 Nous obtenons pour ces états une énergie proportionnelle au carré du nombre d'ondes qui décrit les variations spatiales des amplitudes C n .

II.1.1.3. Etats qui varient dans le temps A présent, nous voudrions discuter, de façon plus détaillée, le comportement des états dans un réseau à une dimension. Si l'amplitude pour qu'un électron soit en x n est C n , la probabilité de le 2

trouver là est C n . Pour les états stationnaires décrits plus haut, cette probabilité est la même pour tous les x n et ne change pas avec le temps. Comment représenter une situation que nous pourrions décrire grossièrement en disant qu'un électron d'une certaine énergie est localisé en une certaine région, de sorte que l'on a plus de chance de le trouver en un endroit plutôt qu'un autre ? Cela peut se faire par la superposition de plusieurs solutions stationnaires dont les valeurs de k diffèrent légèrement, et donc aussi les énergies. Alors, au moins à t = 0, l'amplitude variera avec la position du fait de l'interférence entre les divers termes, tout comme l'on obtient des battements lorsqu'on a un mélange d'ondes de différentes longueurs d'onde. Nous pouvons ainsi fabriquer un "paquet d'ondes" ayant un nombre d'ondes dominant k 0 mais contenant d'autres nombres d'ondes voisins de

k 0 (à condition de ne pas chercher à faire un paquet trop étroit). Dans notre superposition d'états stationnaires, les amplitudes avec différents k représenteront des états d'énergie un peu différente et donc de fréquences un peu différentes. Par suite, pour le C n total, la figure d'interférence variera aussi avec le temps, elle présentera des battements. Les 2

maximums des battements (les maximums de C n ) se déplacent le long de x lorsque le temps passe. Ils se déplacent avec une vitesse appelée "vitesse de groupe". Cette vitesse de groupe est reliée à la variation de k en fonction de la fréquence dω (1) v groupe = dk

Un électron dont l'état serait un "bouquet" d'états de base, le C n variant dans l'espace comme le paquet d'ondes ci-dessus, se déplacerait le long du "cristal" à une dimension à une vitesse v égale à dω / dk où ω = E / h . En utilisant pour E l'équation obtenue précédemment, nous obtenons 2 Ab 2 (2) v = k h Autrement dit, l'électron se déplace avec une vitesse proportionnelle à la valeur centrale de k. L'équation vue précédemment nous dit alors que son énergie est proportionnelle au carré de sa vitesse, il se comporte comme une particule classique. Tant que nous regardons les choses d'assez loin pour ne pas voir la structure fine, notre description quantique commence à donner des résultats semblables à ceux que donne la physique classique. De fait, en substituant dans la dernière équation de la section précédente le k déduit de (2), on obtient (3) E = 12 meff v 2

où meff est une constante. Le complément "d'énergie de mouvement" dans un paquet d'ondes a la même dépendance en vitesse qu'une particule classique. La constante meff , appelée "masse effective", est donnée par h2 (4) meff = 2 Ab 2 Notez que nous pouvons aussi écrire (5) meff v = hk Si nous désignons par convention meff v comme "impulsion", celle-ci est alors reliée au nombre d'ondes k de la même façon que pour une particule libre. N'oubliez pas que meff n'a rien à voir avec la masse réelle d'un électron. Il peut y avoir une très grande différence, mais en général dans les cristaux, l'ordre de grandeur reste voisin, environ deux à vingt fois la masse de l'électron libre. Nous avons pu expliquer ce grand mystère, comment un électron dans un cristal (comme par exemple un électron ajouté à un cristal de germanium) peut-il le traverser et s'y déplacer librement, bien qu'il doive se heurter à tous les atomes ? Il peut le faire parce que ses amplitudes font bip-bipbip d'un atome à l'autre, lui frayant ainsi son trajet. C'est pour cette raison qu'un solide peut conduire l'électricité.

II.1.1.4. Un électron dans un réseau à trois dimensions Voyons un peu comment on pourrait appliquer les mêmes idées pour voir ce qui arrive à un électron dans l'espace à trois dimensions. On aboutit à des résultats très similaires. Supposez que nous ayons un réseau rectangulaire d'atomes d'espacements a, b, c, suivant les trois directions (si vous voulez un réseau cubique, prenez a, b, et c tous égaux). Supposez que les amplitudes pour un bond jusqu'à l'atome voisin dans l'alignement x, y ou z soient respectivement iAx / h , iAy / h ,

iAz / h . Et maintenant, comment devons nous décrire les états de base ? Comme dans le cas à une dimension, un état de base est constitué pat l'électron situé près de l'atome de coordonnées x, y, z, où (x, y, z) est un des points du réseau. Si nous prenons l'un des atomes pour origine, les positions des points sont toutes données par (1) x = n x a , y = n y b et z = n z c où n x , n y et n z sont trois entiers quelconques. Mais il nous suffira de dire x, y et z en sousentendant qu'il s'agit de l'un des points du réseau. On peut alors représenter l'état de base par le symbole électron en x, y, z et l'amplitude pour qu'un électron dans un état ψ soit dans cet état de base est donnée par C ( x, y, z ) = électron en x, y, z ψ . Comme précédemment, les amplitudes C ( x, y, z ) peuvent varier avec le temps. Avec nos hypothèses, les équations hamiltoniennes devraient être comme ceci : dC ( x, y, z ) ih = E 0 C ( x, y, z ) ) − Ax C ( x + a, y, z ) − Ax C ( x − a, y, z ) dt (2) − Ay C (x, y + b, z ) − Ay C (x, y − b, z )

− Az C ( x, y, z + c ) − Az C ( x, y, z − c )

C'est un peu long, mais on voit bien l'origine de chaque terme. Nous allons essayer de trouver un état stationnaire pour lequel tous les C varient de la même manière avec le temps. A nouveau, la solution est une exponentielle :

i  k x x + k y y + k z z  

(3) C ( x, y, z ) = e −iEt / h e 

Si vous portez ceci dans (2), vous voyez que ça marche, pourvu que l'énergie E soit reliée à k x , k y et k z de la manière suivante (4) E = E0 − 2 Ax cos k x a − 2 Ay cos k y b − 2 Az cos k z c L'énergie dépend maintenant de trois nombres d'ondes k x , k y et k z , lesquels sont, incidemment, les composantes d'un vecteur à trois dimensions k. De fait, nous pouvons écrire (3) en notation vectorielle (5) C ( x, y, z ) = e − iEt / h e − ik ⋅r L'amplitude varie comme une onde plane complexe à trois dimensions, se déplaçant dans la

(

direction de k et dont le nombre d'ondes est k = k x2 + k y2 + k z2

)

1/ 2

.

L'énergie associée à ces états stationnaires dépend des trois composantes de k de la manière compliquée donnée par l'équation (4). Le mode de variation de E en fonction de k dépend des signes et grandeurs relatifs de Ax , Ay et Az . Si ces trois nombres sont tous positifs et si nous nous intéressons aux petites valeurs de k, la dépendance est relativement simple. En développant les cosinus comme nous l'avions fait plus haut, nous obtenons cette fois (6) E = E min + Ax a 2 k x2 + Ay b 2 k y2 + Az c 2 k z2 Pour un simple réseau cubique d'espace a, nous attendons que Ax , Ay et Az soient tous égaux, mettons à A, et l'on doit avoir simplement (7) E = E min + Aa 2 k x2 + k y2 + k z2 ou (8) E = E min + Aa 2 k 2

(

)

Ce que nous avions déjà pour le cristal à une dimension. Si nous suivons les raisonnements utilisés, nous devons en conclure que le paquet d'ondes à trois dimensions représentant un électron (formé de la superposition de nombreux états d'énergies très voisines) se déplace lui aussi comme une particule classique avec une certaine masse effective. Dans un cristal de moindre symétrie qu'un cube (ou même dans un cristal cubique dans le cas où l'état de l'électron à chaque atome n'est pas symétrique, les trois coefficients Ax , Ay et Az sont différents. Alors la "masse effective" d'un électron localisé dans une petite région dépend de la direction de son mouvement. Par exemple, il pourrait avoir une inertie différente selon x et selon y (pour décrire avec exactitude cet état de chose, on fait parfois appel au "tenseur de masse effective").

II.1.1.5. Autres états dans un réseau Selon l'équation de l'énergie dans un réseau, les états d'électron dont il a été question ont leurs énergies confinées dans une certaine "bande" qui s'étend depuis le niveau minimum (1) E 0 − 2(Ax + Ay + Az ) jusqu'au niveau maximum (2) E 0 + 2(Ax + Ay + Az ) D'autres énergies sont possibles, mais elles concernent des états d'électron d'un type différent. Jusqu'à présent, nous avons imaginé des états de base constitués d'un électron situé à l'un des atomes d'un cristal où il occupe un certain état, mettons l'état d'énergie minimum. Si, à un atome libre dans l'espace, vous ajoutez un électron pour former un ion, l'ion peut se former de diverses façons. L'électron peut s'arranger pour former l'état d'énergie minimum, il peut aussi former l'un ou l'autre des nombreux "états excités" de cet ion dont chacun a une énergie définie audessus de l'énergie minimum. La même chose peut se passer dans un cristal. Supposons que l'énergie E 0 que nous avons choisie ci-dessus corresponde aux états de base pour lesquels les ions ont l'énergie la plus faible possible. Nous pourrions aussi imaginer un nouvel ensemble d'états de base pour lesquels l'électron est agencé de manière différente avec son atome, dans l'un des états excités de l'ion, de sorte que l'énergie E 0 se trouve alors notablement plus grande. Comme précédemment, il y a une certaine amplitude A (pas la même) pour que l'électron saute de son état excité vers un même état excité dans un atome voisin. Toute l'analyse se déroule comme précédemment et nous trouvons une bande d'énergies possibles centrées à un niveau plus élevé. En général, il y aura de nombreuses bandes, chacune correspondant à un niveau d'excitation différent. Il y a encore d'autres possibilités. Il peut y avoir une certaine amplitude pour que l'électron passe d'un état excité dans un atome vers un état non excité dans un autre atome voisin (cela s'appelle une interaction entre bandes). La théorie mathématique devient de plus en plus compliquée, lorsque vous considérez un nombre de bandes de plus en plus grand et que vous ajoutez de plus en plus de

coefficients de fuite entre les états possibles. Mais il n'y a là aucune idée nouvelle. Les équations se posent comme nous l'avons fait dans notre exemple simple. Il nous faudrait aussi noter qu'il n'y a pas grand chose à ajouter sur les divers coefficients qui, telle l'amplitude A, apparaissent dans la théorie. Ils sont en général très difficiles à calculer. Par suite, dans les cas d'intérêt pratique, la théorie ne nous apprend pas grand chose sur ces paramètres et tout ce que nous pouvons faire, c'est utiliser les valeurs déterminées expérimentalement. Il y a d'autres situations dont la physique et la mathématique sont presque exactement les mêmes que ce que nous avons trouvé dans le cas d'un électron qui se déplace dans un cristal mais dans lesquelles "l'objet" en mouvement est tout autre. Par exemple, supposez que notre cristal de départ, ou plutôt notre réseau linéaire, soit constitué d'une rangée d'atomes neutres, ayant chacun un électron extérieur faiblement lié. Puis imaginez que nous retirons un électron. Lequel des atomes a perdu son électron ? Désignons par C n l'amplitude pour que l'électron manquant provienne de l'atome n. Il y aura en général une certaine amplitude iA / h pour que l'électron d'un atome voisin, mettons le (n-1)ième atome, saute au nième, laissant le (n-1)ième sans son électron. Il revient au même de dire qu'il y a une amplitude A pour que l'électron manquant saute du nième atome au (n1)ième. Comme vous pouvez le voir, les équations sont exactement les même mais, bien sûr, la valeur de A peut ne pas être la même. Nous aurons à nouveau les mêmes formules pour les niveaux d'énergies, pour les "ondes" de probabilités qui se déplacent à travers le cristal avec une vitesse de groupe, une certaine masse effective, etc. Mais, cette fois, les ondes décrivent le comportement d'un électron manquant, d'un "trou" comme on l'appelle. Un "trou" agit donc tout à fait comme une particule ayant une certaine masse effective meff . Cette particule vous paraîtra avoir une charge positive. Nous reparlerons de ces trous en étudiant les semi-conducteurs. Un autre exemple encore : imaginez une rangée d'atomes neutre tous identiques, mais dont l'un a été mis dans un état excité, il a donc une énergie supérieure au niveau minimum. Soit C n l'amplitude pour que le nième atome ait cette excitation. Il peut interagir avec l'atome voisin en lui passant son excès d'énergie et en retournant lui-même à l'état minimum. Soit iA / h l'amplitude correspondante. Vous voyez que c'est encore et toujours la même mathématique. L'objet en mouvement s'appelle maintenant un exciton. Il se comporte comme une "particule" neutre qui, se

déplaçant à travers le cristal, transporte l'énergie d'excitation. Un mouvement de ce type est impliqué dans certains processus biologiques, tels que la vision ou les photosynthèses. On a supposé que l'absorption de la lumière dans la rétine produit un "exciton" qui se déplace à travers une certaine structure périodique et que ces excitons s'accumulent en un point particulier où l'énergie est utilisée pour induire une réaction chimique. Ces excitons se propage à travers des molécules telles que la rhodopsine ou la chlorophylle.

II.1.1.6. Diffusion par les imperfections dans un cristal Considérons maintenant le cas d'un électron unique dans un cristal qui ne soit pas parfait. Notre étude précédente nous a montré que les cristaux parfaits ont une conductivité parfaite, les électrons peuvent glisser sans frottement à travers le cristal, comme dans le vide. Parmi les choses susceptibles d'arrêter ce mouvement perpétuel de l'électron, l'une des plus importantes consiste en une imperfection ou irrégularité dans le cristal. A titre d'exemple, supposez qu'il y ait un atome manquant quelque part dans le cristal ou bien supposez que quelqu'un ait mis un mauvais atome en l'un des emplacements de sorte que la situation n'y soit pas la même qu'aux autres emplacements. Admettons que l'énergie E 0 ou bien l'amplitude A y diffèrent. Comment pourrions-nous décrire ce qui se passe dans ce cas ? Pour préciser les choses, revenons au cas à une dimension et supposons que l'atome "zéro" est un atome "d'impureté" pour lequel E 0 n'a pas la même valeur que pour les autres atomes. Désignons cette énergie par E 0 + F . Que va-t-il se passer ? Quand l'électron arrive à l'atome "zéro", il y a une certaine probabilité pour que l'électron soit diffusé vers l'arrière. Si un paquet d'ondes se propage et s'il atteint un endroit où les choses sont un peu différentes, une partie du paquet va continuer sa route et l'autre partie va rebondir vers l'arrière. Il est très difficile d'analyser une situation de ce genre à l'aide des paquets d'ondes parce qu'alors tout change avec le temps. Il est bien plus facile de travailler sur les solutions stationnaires. C'est ce que nous ferons donc et nous verrons que ces états stationnaires peuvent se représenter en termes d'ondes continues ayant des parties transmises et des parties réfléchies. En trois dimensions, nous aurions une onde diffusée au lieu d'une onde réfléchie car elle serait alors éparpillée dans diverses directions. Nous partons d'une série d'équations qui sont exactement les mêmes que celles que nous avions vues à l'exception de l'équation pour n = 0 qui diffère des autres .Les cinq équations pour n = -2, -1, 0, +1 et +1 sont comme ceci :

M

M

Ea − 2 = E0 a − 2 − Aa −1 − Aa −3 Ea −1 = E 0 a −1 − Aa 0 − Aa − 2

(1) Ea 0 = (E0 + F )a 0 − Aa1 − Aa −1

Ea1 = E0 a1 − Aa 2 − Aa 0 Ea 2 = E 0 a 2 − Aa3 − Aa1 M

M

Bien sûr, il y a en plus toutes les autres équations pour n plus grand que 2. Elles seront exactement semblables aux équations que nous avions vues. Pour nous placer dans le cas le plus général, il nous faudrait prendre une valeur de A différente, suivant qu'il s'agit de l'amplitude pour que l'électron saute de ou vers l'atome "zéro". Mais l'exemple simplifié pour lequel tous les A sont égaux suffit à dégager les grandes lignes. ikx

La solution exponentielle complexe e n que nous avions vue continuerait à être une solution pour toutes les équations à l'exception de l'équation à l'atome "zéro", cela ne marche pas à cause de cette seule équation. Il nous faut une solution différente que nous pouvons mijoter de la manière suivante. Cette solution représente une onde se déplaçant dans la direction des x positifs. Une onde se déplaçant dans la direction des x négatifs aurait été une solution tout aussi bonne. Elle s'écrirait

(2) a ( x n ) = e

− ikxn

La solution la plus générale serait une combinaison linéaire d'une onde vers l'avant et d'une onde vers l'arrière, à savoir (3) a n = αe

ikxn

+ βe

− ikxn

Cette solution représente une onde complexe d'amplitude α se déplaçant dans la direction +x et une onde d'amplitude β se déplaçant dans la direction -x.

Regardez maintenant les équations de notre nouveau problème, l'équation (1) et les équations pour tous les autres atomes. Les équations concernant les a n tels que n ≤ 1 sont toutes satisfaites par l'équation (3) à la condition que k soit relié à E et au pas du réseau b par (4) E = E0 − 2 A cos kb Cela représente physiquement une onde "incidente" d'amplitude α s'approchant de l'atome "zéro" (le "diffuseur") en venant de la gauche et une onde "diffusée" ou "réfléchie" d'amplitude β repartant vers la gauche. Nous ne perdons rien de la généralité si nous imposons à l'amplitude α de l'onde incidente la valeur 1. En général l'amplitude β est alors un nombre complexe. Nous pouvons dire exactement la même chose à propos des solutions de a n pour n ≥ 1 . Comme les coefficients peuvent être différents, nous écrivons (5) a n = γe

ikxn

+ δe

− ikxn

Ici γ est l'amplitude d'une onde allant vers la droite et δ celle d'une onde venant de la droite. Considérons la situation physique dans laquelle, initialement, il n'y a qu'une onde venant de la gauche et, au-delà du diffuseur, ou atome d'impureté, il n'y a qu'une onde "transmise". Nous allons essayer une solution pour laquelle δ = 0 . Nous pouvons certainement satisfaire toutes les équations pour les a n à l'exception des trois du milieu de l'équation (1), par les solutions d'essai suivantes (6)

a n (pour n < 0 ) = e

ikxn

a n (pour n > 0 ) = γe

+ βe

− ikxn

ikxn

La situation dont nous parlons est illustrée ci-dessous

Si nous utilisons les formules de l'équation (6) pour a −1 et a +1 , les trois équations centrales de (1) nous permettront de calculer a 0 et les coefficients β et γ . Nous aurons ainsi trouvé une solution complète. Si nous posons x n = nb , les trois équations qu'il faut résoudre sont

(E − E0 ){e ik (−b ) + βe −ik (−b ) } = − A{a0 + e ik (−2b ) + βe −ik (−2b ) } (7) (E − E0 − F )a 0 = − A{γe ikb + e ik (−b ) + βe −ik (−b ) } (E − E0 )γe ikb = − A{γe ik (2b ) + a 0 }

Rappelez-vous que E est donné en fonction de k par (4). En portant cette valeur de E dans les équations et en vous souvenant que cos x = 12 e ix + e − ix , vous tirez de la première équation (8) a 0 = A + β et de la troisième (9) a 0 = γ

(

)

Ces deux équations sont compatibles à condition que (10) γ = 1 + β Cette équation nous dit que l'onde transmise ( γ ) est exactement l'onde initiale incidente (1) avec une onde supplémentaire égale à l'onde réfléchie. Ce n'est pas toujours vrai mais c'est ainsi pour une diffusion par un atome seulement. S'il y avait un amas d'atomes d'impureté, la quantité ajoutée à l'onde se propageant vers l'avant ne serait pas nécessairement égale à l'onde réfléchie.

Nous pouvons obtenir l'amplitude β de l'onde réfléchie à l'aide de l'équation centrale de (7). Nous trouvons −F (11) β = F − 2iA sin kb Nous avons la solution complète pour le réseau avec un unique atome anormal. Vous vous demandez peut-être comment l'onde transmise peut-être "plus" que l'onde incidente, comme il apparaît dans l'équation (10). Mais souvenez-vous que β et γ sont des nombres complexes et que le nombre de particules dans une onde (ou plutôt la probabilité d'y trouver une particule) est proportionnel au carré du module de l'amplitude. De fait, il n'y aura "conservation des électrons" que si (12) β + γ 2

2

=1

Vous pouvez montrer que ceci est vrai pour notre solution.

II.1.1.7. Capture par une imperfection d'un réseau Il existe un cas d'un intérêt particulier, qui peut se produire si F est un nombre négatif. Si l'énergie de l'électron à l'endroit de l'atome d'impureté (à n = 0) est plus faible qu'ailleurs, il peut y être capturé. En d'autres termes, si E 0 + F est en-dessous de la limite inférieure E 0 − 2 A de la bande d'énergie permise, l'électron peut alors se trouver "piégé" dans un état tel que E < E 0 − 2 A . Une telle solution ne peut ressortir de ce que nous avons fait jusqu'à présent. Nous l'obtiendrons, par contre, en accordant au nombre k la possibilité d'être imaginaire dans la solution d'essai précédente. Posons k = iκ . Cette fois encore, nous pourrons avoir des solutions différentes pour n < 0 et pour n > 0. Une solution possible pour n < 0 serait (1) a n (pour n < 0 ) = ce

+ κx n

Nous devons prendre le signe plus pour l'exposant, autrement l'amplitude augmenterait indéfiniment pour les valeurs négatives élevées de n. De même, une solution possible pour n > 0 serait (2) a n (pour n > 0 ) = c ′e −κxn Si nous portons ces solutions d'essai dans les équations, toutes, à part les trois du milieu, sont satisfaites à condition que (3) E = E0 − A e κb + e −κb

(

)

La somme des deux termes exponentiels étant toujours plus grande que deux, cette énergie est en dessous de la bande régulière et c'est ce que nous cherchons. Les trois équations restantes sont satisfaites si c = c ′ et si κ est choisi de telle sorte que (4) A e κb − e −κb = − F

(

)

En combinant cette équation avec (3), nous obtenons l'énergie de l'électron piégé : (5) E = E0 − 4 A 2 + F 2

L'électron piégé a une énergie unique, quelque peu en-dessous de la bande de conduction.

Notez que nos amplitudes (1) et (2) ne disent pas que l'électron piégé se trouve exactement là où se trouve l'atome d'impureté. La probabilité de trouver l'électron au niveau des atomes voisins est donnée par le carré de ces amplitudes. Pour un choix particulier des paramètres, elle pourrait varier comme indiqué par les barres verticales ci-dessus. C'est à l'endroit de l'atome d'impureté que la probabilité de trouver l'électron est la plus grande. Pour les atomes voisins, la probabilité tombe exponentiellement avec la distance depuis l'atome d'impureté. C'est un autre exemple de "barrière de pénétration". D'un point de vue de la physique classique, l'électron n'a pas assez d'énergie pour s'échapper du "puits" d'énergie, mais, en mécanique quantique, il peut prendre un peu de large.

II.1.1.8. Amplitudes de diffusion et états liés Enfin, notre exemple peut servir à illustrer un point très utile actuellement en physique des particules de hautes énergies. Ce point concerne la relation entre les amplitudes de diffusion et les états liés. Supposez que nous ayons découvert, par l'expérience ou par l'analyse théorique, comment les pions diffusent sur les protons. Puis une nouvelle particule est découverte et quelqu'un se demande si ce ne pourrait pas être tout simplement une combinaison d'un pion et d'un proton maintenus ensemble dans un certain état lié (tout comme un électron est lié à un proton pour faire un atome d'hydrogène). Par état lié, nous entendons une association ayant une énergie inférieure à celle des deux particules libres. Il y a une théorie générale qui affirme ceci : il existera un état lié à l'énergie pour laquelle l'amplitude de diffusion, que l'on obtient par extrapolation algébrique (en mathématique on parle de "prolongement analytique") dans les domaines d'énergie en dehors de la bande permise, deviendra infinie. La signification physique est la suivante. Un état lié constitue une situation où il n'y a que des ondes attachées à un point, sans qu'aucune onde vienne de l'extérieur pour mettre en route ce système qui fonctionne tout seul. Le rapport entre ce que l'on appelle l'onde "diffusée" ou l'onde créée, d'une part, et l'onde "incidente" d'autre part, est infinie. Nous pouvons essayer cette idée dans notre exemple. Ecrivons notre expression pour l'amplitude diffusée, directement en termes de l'énergie E de la particule diffusée (au lieu que ce soit en termes de k). Nous pouvons récrire ainsi l'équation (1) 2 A sin kb = 4 A 2 − (E − E0 ) et l'amplitude diffusée devient −F (2) β = 2 F − i 4 A 2 − (E − E 0 )

2

De la façon dont nous avons établi dette équation, nous ne devions l'utiliser que pour des états réels, ceux dont l'énergie est dans la bande permise, E = E0 ± 2 A . Mais supposez qu'ayant oublié ce fait,

nous étendions la formule dans le domaine 'non physique" où E − E 0 > 2 A . Pour ce domaine non physique, nous pouvons écrire (3) 4 A 2 − (E − E 0 ) = i (E − E 0 ) − 4 A 2 (la question du signe à choisir est un détail technique. Il dépend du signe permis pour κ . Nous laissons de coté cette discussion). 2

2

"L'amplitude de diffusion", quoi qu'elle signifie, peut s'écrire −F (4) β = 2 F + (E − E 0 ) − 4 A 2 La question est maintenant : y a-t-il une énergie E pour laquelle β devienne infini (c'est-à-dire pour laquelle l'expression pour β a un "pôle") ? Oui, si du moins F est négatif, le dénominateur de (4) deviendra nul lorsque 2 (5) (E − E0 ) − 4 A 2 = F 2 ou lorsque (6) E = E0 ± 4 A 2 + F 2 Le signe moins nous donne exactement la valeur que nous avions trouvée plus haut pour l'énergie de capture. Et le signe plus ? Il donne une énergie au-dessus de la bande permise. Et de fait, il y a là un autre état lié et nous sommes passés à coté lorsque nous avons résolu les équations. A vous de trouver l'énergie et les amplitudes a n pour cet état lié. La relation entre la diffusion et les états liés est l'un des fils directeurs les plus utiles dans les recherches actuelles pour une compréhension des observations expérimentales sur les nouvelles particules étranges.

II.1.2. Variation des amplitudes avec la position Nous allons maintenant regarder comment varient dans l'espace les amplitudes de probabilité de la mécanique quantique. Dans ce qui a précédé, vous avez pu avoir cette impression désagréable que certaines choses étaient laissées de coté. Par exemple, quand nous avons parlé de la molécule d'ammoniac, nous avons pris l'option de la décrire en termes de deux états de base. Pour l'un de ces états de base, nous avons pris la situation pour laquelle l'atome d'azote se trouve "au-dessus" du plan des trois atomes d'hydrogène et, pour l'autre, celle où il est "en-dessous". Pourquoi avons-nous pris uniquement ces deux états ? Pourquoi ne serait-il pas possible que l'atome d'azote soit à 2 angströms au-dessus du plan des trois atomes d'hydrogène, ou bien à 3 angströms ou à 4 ? Très certainement, l'atome d'azote pourrait occuper beaucoup de positions diverses. Il est évident que nous avons laissé beaucoup de détails de coté. Nous avons sciemment éludé ces détails. Nous avons dit que seuls certains aspects du problème nous intéressaient et, par suite, nous avons supposé que l'atome d'azote placé au-dessus du plan des atomes d'hydrogènes se mettrait dans une certaine condition assez bien définie. Alors, la probabilité de trouver l'azote aurait eut une certaine distribution assez bien définie au-dessus du plan des atomes d'hydrogènes, mais les détails ne nous importaient pas. On peut aussi voir les choses d'une autre manière. Dans notre discussion sur la molécule d'ammoniac, nous avions choisi une description approchée, lorsque nous parlions en termes de deux états de base. En réalité, il y a une foule d'états. Par exemple, pour l'électron se propageant dans un cristal, l'électron peut se mettre dans la situation de l'état le plus bas, mais il y a aussi de nombreux états excités. Nous l'avions déjà suggéré. Pour chaque état excité, la distribution de l'électron au voisinage de l'atome est différente. Nous avons ignoré ces détails en déclarant que seul nous importait la présence de l'électron au voisinage de l'atome. Nous avons ignoré le détail des états excités. Mais ce sont justement ces états excités qui donnent lieu à des distributions diverses de l'électron autour de l'atome. Si nous voulons décrire en détail les atomes, nous devons prendre aussi en considération ces autres états de base possibles. Nous pourrions le faire de diverses manières dont l'une consisterait à considérer de plus près des états pour lesquels la position de l'électron dans l'espace est plus explicitement décrite.

Nous sommes maintenant en mesure d'envisager une procédure plus élaborée qui nous permettra de parler de manière précise de la position de l'électron, ceci en donnant une amplitude probabilité pour trouver l'électron en quelque endroit que ce soit. Cette théorie plus complète fournira les soubassements des approximations que nous avons faites dans nos discussions antérieures. Les équations que nous avions alors peuvent apparaître comme une sorte d'approximation d'une théorie plus complète. Mais pourquoi n'avons nous pas commencé par la théorie plus complète, en faisant des approximations au fur et à mesure ? Nous avons pensé qu'il vous serait plus facile de saisir les rouages de la mécanique quantique en commençant par les approximations à deux états pour tendre progressivement vers la théorie plus complète, plutôt qu'en abordant le sujet en sens inverse. Notre façon d'aborder le sujet se trouve ainsi être l'ordre inverse de celui que vous trouverez dans beaucoup de livres. Quand nous entrerons dans le vif du sujet, vous remarquerez l'abandon d'une règle que nous avons toujours suivie jusqu'à présent. Chaque fois que nous avons abordé un sujet, nous avons essayé de donner une description plus ou moins complète de la physique, cherchant, si possible, à vous montrer où conduisaient les idées énoncées. Tout en décrivant certains détails particuliers, nous nous sommes efforcés de vous montrer les conséquences générales d'une théorie, de sorte que vous puissiez voir où elle pouvait conduire. Nous allons abandonner cette règle. Nous allons voir comment on peut parler des amplitudes de probabilité dans l'espace et vous montrer les équations différentielles qui les gouvernent. Nous n'aurons pas la possibilité de traiter toutes les implications qui découlent directement de cette théorie. De fait, nous ne pourrons pas même aller jusqu'à relier cette théorie à certaines des formules approchées que nous avons utilisées précédemment, en ce qui concerne par exemple la molécule d'ammoniac. Nous pourrons toutefois montrer de nombreux prolongements et développements de la théorie et il sera toujours possible au lecteur d'approfondir certains domaines ou applications à travers la littérature spécialisée. Après tout, il nous faut bien laisser quelque chose pour l'avenir.

II.1.2.1. Les amplitudes le long d'une droite Comment un électron peut-il se déplacer le long d'une ligne d'atomes ? Revoyons une fois encore ce que nous avons appris à ce sujet. Quand un électron a une certaine amplitude pour sauter d'un atome à l'atome voisin, il existe alors des états d'énergie définie, pour lesquels l'amplitude de probabilité pour trouver l'électron est distribuée le long du réseau sous la forme d'une onde progressive. Pour de grandes longueurs d'onde, c'est-à-dire pour les faibles valeurs du nombre d'ondes k, l'énergie de l'état est proportionnelle au nombre d'ondes. Pour un réseau cristallin de pas b, dans lequel l'amplitude par unité de temps pour le saut de l'électron d'un atome à l'autre est iA / h , l'énergie de l'état est reliée à k (pour kb petit) par (1) E = Ak 2 b 2 Nous avons vu aussi qu'un groupe d'ondes de ce type avec des énergies voisines pouvait constituer un paquet d'ondes ayant le comportement d'une particule classique de masse effective meff donnée par : h2 (2) meff = 2 Ab 2 Du fait que les ondes d'amplitude de probabilité se comportent dans un cristal comme une particule, on pourrait bien s'attendre à ce que la description quantique d'une particule présente le même type de comportement ondulatoire. Imaginez un réseau linéaire et supposez que nous rendions le pas b de plus en plus petit. A la limite, nous pourrions trouver l'électron n'importe où le long de la ligne. Ce serait une manière de décrire le mouvement d'un électron dans le vide. En d'autres termes, si nous imaginons l'espace comme une infinité de points tous très proches les uns des autres et si nous savons établir les équations qui relient les amplitudes en un point aux amplitudes aux points voisins, nous aurons les lois quantiques du mouvement d'un électron dans l'espace. Il peut sembler quelque peu audacieux de remplacer une ligne d'atomes par une simple ligne de points. Après tout, les atomes sont pour le moins différents des points de l'espace ! Mais ce qui a servi à élaborer les équations (1) et (2) n'est pas tant le fait que ces atomes soient particuliers avec une certaine structure plus ou moins complexe que le fait que l'électron était localisé au voisinage

de l'atome. En outre, si un électron est localisé autour d'une petite zone de l'espace, qu'elle soit occupée par un atome ou pas, l'électron a une certaine amplitude pour se déplacer autour d'une autre petite zone de l'espace. La comparaison est donc plus qu'une analogie et les équations utilisées peuvent s'appliquer telles qu'elles. En outre, les équations (1) et (2) ont été obtenues avec l'approximation de kb petit et pour l'espace, où b tend vers zéro (les points sont contigus), cette approximation est évidemment valide. Nous ne rencontrerons évidemment pas ici des situations telles qu'un atome dans un état excité étant entendu qu'un point de l'espace est immatériel et pourrait difficilement être dans un état excité. Commençons par rappeler certains des principes généraux de la mécanique quantique. Supposez que nous ayons dans un système quantique une particule qui peut se trouver dans diverses conditions. Nous appelons "état" toute condition particulière dans laquelle un électron peut se trouver et nous la représentons par un vecteur d'état, disons φ . Une autre condition peut être représentée par un autre vecteur d'état, disons ψ . Nous introduisons ensuite l'idée d'états de base. Nous disons qu'il y a un ensemble d'états de base 1 , 2 , 3 , 4 , etc. ayant les propriétés suivantes. D'abord, tous ces états sont tout à fait distincts, nous disons qu'ils sont orthogonaux. Par là, nous voulons dire que pour deux états de base quelconques i et j , l'amplitude i j pour qu'un électron que l'on sait être dans l'état j soit aussi dans l'état i est égale à zéro, à moins bien sûr que i et j représentent le même état. Symboliquement, nous écrivons (3) i j = δ ij Vous vous souviendrez que le symbole de Kronecker δ ij = 0 si i et j sont différents et que δ ij = 1 si i et j sont un même nombre. Ensuite, les états de base i doivent constituer un ensemble complet, de sorte que n'importe quel état puisse être représenté en termes de ces états de base. C'est-à-dire que n'importe quel état φ doit pouvoir être décrit complètement par la donnée des amplitudes i φ pour qu'une particule

dans l'état φ se trouve aussi dans l'état i . En fait, le vecteur d'état φ est égal à la somme de tous les états de base, chacun étant multiplié par un coefficient qui est l'amplitude pour que l'état φ soit aussi dans l'état i : (4) φ = ∑ i i φ i

Finalement, si nous considérons deux états quelconques φ et ψ , l'amplitude pour que l'état ψ soit aussi dans l'état φ sera déterminée en faisant d'abord la projection de l'état ψ sur les états de base et en projetant à nouveau à partir de ces états de base sur l'état φ . Nous écrivons cela de la manière suivante : (5) φ ψ = ∑ φ i i ψ i

La somme s'étend bien sûr à tout l'ensemble des états de base i . Quand nous considérions un électron sur une ligne d'atomes, nous avions pris pour états de base l'ensemble des états pour lesquels l'électron est localisé en l'un des atomes. L'état de base n représentait la condition pour laquelle l'électron est localisé à l'atome numéro "n" (que nous appelions nos états de base n au lieu de i n'a bien sûr aucune signification particulière). Un peu plus tard, nous avons préféré désigner les états de base par la coordonnée x n de l'atome plutôt que par son numéro d'ordre. L'état x n est le même que l'état n , seule l'écriture a changé. Ensuite, selon les règles générales, n'importe quel état, disons ψ , est déterminé une fois les amplitudes données pour qu'un électron dans l'état ψ soit aussi dans les divers états x n . Pour des raisons pratiques, nous avons utilisé le symbole C n pour ces amplitudes (6) C n = x n ψ

Du fait que les états de base sont associés à des positions sur la ligne, nous pouvons concevoir l'amplitude C n comme une fonction de la coordonnée x et écrire C ( x n ) . De façon générale, les

amplitudes C ( x n ) vont varier avec le temps et sont donc aussi des fonctions de t. Mais, sauf exception, nous ne nous soucierons pas d'écrire explicitement cette dépendance.

Nous avons ensuite conjecturé que la variation des amplitudes C ( x n ) avec le temps devait être dictée par l'équation hamiltonienne. Dans notre nouvelle notation, cette équation s'écrit ∂C ( x n ) (7) ih = E0 C (x n ) − AC ( x n + b ) − AC ( x n − b ) ∂t Les deux derniers termes sur la droite représentent le processus par lequel un électron venant de l'atome n + 1 ou de l'atome n - 1 vient se placer en n. Nous avons trouvé que l'équation (7) a des solutions qui correspondent à des états d'énergie définie, que nous avons écrit ainsi (8) C ( x n ) = e iEt / h e

ikxn

Pour les états de faible énergie, les longueurs d'onde sont grandes (k est faible) et l'énergie est reliée à k par (9) E = (E 0 − 2 A) + Ak 2 b 2 elle est aussi donnée par l'équation (1) si nous choisissons notre zéro d'énergie de façon à ce que E0 − 2 A = 0 . Voyons ce qui se passerait si nous faisions tendre le pas b vers zéro, tout en conservant le nombre d'ondes k inchangé. Si seul b changeait, le dernier terme de (9) tendrait tout simplement vers zéro et il n'y aurait plus de physique. Mais supposez que A et b varient ensemble de sorte que le produit Ab 2 reste constant quand b tend vers zéro. Cela se justifie intuitivement puisque si le point voisin est beaucoup plus proche, on imagine facilement que l'électron a plus facile pour s'y rendre et donc que l'amplitude augmente. En faisant appel à l'équation (2), nous remplaçons Ab 2 par la constante

h 2 / 2meff . Dans ces conditions, l'équation (9) resterait la même, mais que deviendrait alors l'équation différentielle (7) ? Nous allons d'abord écrire (7) sous la forme ∂C ( x n ) (10) ih = (E 0 − 2 A)C ( x n ) + A[2C ( x n ) − C ( x n + b ) − C ( x n − b )] ∂t Avec notre choix pour E 0 , le premier terme disparaît. Nous pouvons ensuite penser à une fonction

continue C ( x ) qui passe par les valeurs propres C ( x n ) en chaque x n . Quand le pas b tend vers

zéro, les points x n se rapprochent de plus en plus et la quantité entre crochets (si nous maintenons

une variation de C ( x ) suffisament régulière) devient tout simplement proportionnelle à la dérivée seconde de C ( x ) . Nous pouvons écrire, comme vous pourrez vous en convaincre en faisant le développement de Taylor de chaque terme ou en passant directement par la définition de la dérivée, l'égalité ∂ 2 C (x ) (11) 2C ( x ) − C (x + b ) − C ( x − b ) ≈ −b 2 ∂x 2 A la limite de b nul, en maintenant Ab 2 égal à K, l'équation (7) devient h 2 ∂ 2 C (x ) ∂C ( x ) (12) ih =− ∂t 2meff ∂x 2

Nous avons une équation qui nous dit que le taux de variation de C ( x ) , l'amplitude pour trouver l'électron en x, en fonction du temps, dépend de l'amplitude pour trouver l'électron en des points voisins et ceci de manière proportionnelle à la seconde dérivée de l'amplitude par rapport à la position. L'équation quantique correcte pour le mouvement d'un électron dans l'espace libre fut découverte en premier par Schrödinger. Pour un mouvement le long d'une droite, elle a exactement la forme de

l'équation (12) après que l'on ait remplacé la masse effective meff par la masse m de l'électron dans l'espace libre. Pour un mouvement le long d'une droite dans l'espace libre, l'équation s'écrit ∂C ( x ) h 2 ∂ 2 C (x ) (13) ih =− ∂t 2m ∂x 2 Nous ne voulons pas vous faire croire que nous avons établi l'équation de Schrödinger, mais seulement vous montrer une manière de voir les choses. Quand Schrödinger a écrit cette équation pour la première fois, il en a donné une sorte de démonstration fondée sur des raisonnements heuristiques et sur quelques brillantes suppositions intuitives. Certains des raisonnements qu'il a utilisés étaient même faux, mais cela n'a pas d'importance. Ce qui importe c'est qu'en fin de compte l'équation donne une description correcte de la nature. Le but de notre discussion était simplement de vous montrer que l'équation fondamentale de la mécanique quantique (13) a la même forme que celle que vous obtenez pour le cas limite d'un électron se déplaçant sur une ligne d'atomes. On peut donc penser à l'équation différentielle (13) comme la description de la diffusion d'une amplitude de probabilité d'un point à l'autre le long d'une ligne. Autrement dit, si l'électron a une certaine amplitude pour être en un point, il aura, un instant plus tard, une certaine amplitude pour être en des points voisins. De fait, l'équation ressemble un peu aux équations de diffusion. Mais il y a une différence essentielle : le coefficient imaginaire devant la dérivée par rapport au temps donne un comportement complètement différent de celui que vous obtiendriez pour la diffusion ordinaire, par exemple pour un gaz se répandant autour d'un tube fin. La diffusion ordinaire donne lieu à des solutions exponentielles réelles, tandis que les solutions de (13) sont des ondes complexes.

II.1.2.2. La fonction d'onde Maintenant que vous avez une certaine idée sur la façon dont les choses vont se présenter, nous voulons revenir au point de départ et étudier la description du mouvement d'un électron le long d'une droite sans avoir à considérer des états associés à des atomes dans un réseau. Nous voulons retourner au point de départ et voir quelles idées nous devons utiliser si nous voulons décrire le mouvement d'une particule libre dans l'espace. Etant donné que nous nous intéressons au comportement d'une particule libre dans un milieu continu, nous aurons affaire à un nombre infini d'états possibles et, comme vous le verrez, les idées que nous avons élaborées pour traiter d'un nombre fini d'états devront subir quelques modifications techniques. Tout d'abord, nous maintenons le vecteur d'état x comme représentation d'un état pour lequel une particule est exactement localisée à la coordonnée x. A toute valeur de x le long de la ligne, par exemple 1.73, 9.67 ou 10, correspond un état. Nous prendrons ces états x comme états de base et, si nous incluons tous les points de la droite, nous aurons un ensemble complet pour un mouvement à une dimension. Supposez que nous ayons maintenant un type différent d'état, disons ψ , pour lequel un électron est distribué d'une certaine manière le long de la droite. Une façon de décrire cet état est de donner toutes les amplitudes pour que l'électron se trouve aussi dans chacun des états de base x . Nous devons donner un ensemble infini d'amplitudes, une pour chaque x. Nous écrirons ces amplitudes sous la forme x ψ . Chacune de ces amplitudes est un nombre complexe et puisqu'il y a un nombre complexe de ce type pour chaque valeur de x, l'amplitude x est tout simplement une fonction de x. Nous pouvons aussi l'écrire sous la forme C ( x ) , (1) C ( x ) ≡ x ψ

Nous avons déjà eut affaire à des amplitudes qui varient d'une manière continue en fonction des coordonnées lorsque nous avons parlé des variations de l'amplitude avec le temps. Nous avons montré par exemple que l'amplitude pour une particule d'impulsion définie doit avoir une variation particulière dans l'espace. Si une particule a une impulsion définie p et une énergie correspondante E, l'amplitude pour qu'elle se trouve en une position x quelconque doit avoir l'aspect suivant

(2) x ψ = C ( x ) ∝ e + ipx / h Cette équation exprime un principe général important de la mécanique quantique qui relie les états de base correspondant aux diverses positions dans l'espace à un autre système d'états de base, à savoir : tous les états d'impulsion définie. Les états d'impulsion définie sont souvent plus pratique que les états en x pour certains types de problèmes. L'un et l'autre ensemble d'états de base sont bien sur tout aussi acceptables pour la description d'une situation de mécanique quantique. Nous reviendrons plus tard sur la question de leur relation réciproque. Pour le moment, nous voulons nous en tenir à notre discussion sur une description en termes des états x . Avant de continuer, nous voulons faire un petit changement de notation qui, nous l'espérons, n'introduira pas trop de confusion. La fonction C ( x ) définie dans (1) aura une forme qui dépendra bien entendu de l'état ψ considéré. Il nous faudrait l'indiquer d'une manière ou d'une autre. Par

exemple, nous pourrions spécifier de quelle fonction C ( x ) il s'agit par un indice, disons Cψ (x ) . Ceci serait une notation parfaitement satisfaisante, mais elle est un peu compliquée et ce n'est pas celle que vous trouverez dans la plupart des livres. Presque tout le monde laisse tomber la lettre C et utilise le symbole ψ pour définir la fonction (3) ψ ( x ) ≡ Cψ ( x ) = x ψ

Cette notation étant la plus utilisée dans le monde entier, il vaut mieux vous y habituer pour ne pas être déroutés quand vous la rencontrerez quelque part. C'est d'ailleurs avec cette notation que nous avons présentée brièvement la fonction d'onde au début. Gardez cependant à l'esprit que nous allons maintenant utiliser ψ de deux manières différentes. Dans l'équation (1), ψ est une désignation que nous avons donnée à un état physique particulier de l'électron. Par contre, dans (3), le symbole ψ est utilisé pour définir une fonction mathématique de x laquelle est égale à l'amplitude pour être localisé en chaque point x de la ligne. Nous espérons que ce ne sera pas trop déroutant une fois que vous vous serez fait à cette idée. Rappelons à ce propos que la fonction ψ ( x ) est habituellement appelée la "fonction d'onde" car c'est le plus souvent une fonction complexe des variables, qui représente une onde.

Ayant défini ψ ( x ) comme l'amplitude pour qu'un électron dans l'état ψ se trouve à la position x, nous serions tenté d'interpréter le module carré de ψ comme probabilité de trouver un électron à la position x. Malheureusement, la probabilité de trouver une particule exactement en un point est généralement nulle. En général, l'électron sera étalé sur une certaine région de la droite et comme il y a sur tout un segment même petit un nombre infini de points, la probabilité que l'électron soit en l'un de ces points ne peut pas être un nombre non nul (la somme sur l'infinité de points donnerait forcément une probabilité supérieure à un, ce qui est une absurdité). On ne peut décrire la probabilité de trouver un électron qu'au moyen d'une distribution de probabilité (ou densité de probabilité) qui fixe la probabilité relative de trouver l'électron en diverses positions approximatives le long de la droite. Soit prob( x, ∆x ) la chance de trouver l'électron dans un petit intervalle ∆x au voisinage de x. Pour toute situation physique, si nous nous plaçons à une échelle suffisament petite, la probabilité variera d'une manière régulière d'un endroit à l'autre et, pour tout segment ∆x , petit mais non nul, elle sera proportionnelle à ∆x . Nous pouvons modifier nos définitions de manière à tenir compte de cela. On peut concevoir l'amplitude x ψ comme représentant une sorte de "densité d'amplitude" pour tous les états de base x dans une petite région. Puisque la probabilité de trouver un électron dans un petit intervalle ∆x doit être proportionnelle à cet intervalle, nous modifions notre définition de x ψ de façon qu'elle réponde à la relation suivante : (4) prob( x, ∆x ) = x ψ

2

∆x

L'amplitude x ψ est donc proportionnelle à l'amplitude pour qu'un électron dans l'état ψ se trouve dans l'état de base x et la constante de proportionnalité est choisie de manière à ce que le module carré de l'amplitude x ψ donne la densité de probabilité pour trouver l'électron dans une petite région quelconque. On peut récrire l'équation ci-dessus sous la forme (5) prob( x, ∆x ) = ψ ( x ) ∆x 2

Notons que toutes ces modifications ne sont pas arbitraires. Elles sont conformes au passage à la limite que nous avons fait en passant d'un nombre fini d'états à un nombre infini, ainsi qu'au passage à la limite en théorie des probabilités lorsque l'on passe de probabilités discrètes à une densité de probabilités. Il nous faut maintenant modifier certaines de nos équations précédentes pour les rendre compatibles avec cette nouvelle définition d'une amplitude de probabilité. Supposez que nous ayons un électron dans l'état ψ et que nous voulions connaître l'amplitude pour le trouver dans un état différent φ , lequel peut correspondre à un autre type d'étalement de l'électron. S'il s'agissait d'un ensemble fini d'états discrets, nous aurions utilisé la relation habituelle. Avant la modification de notre définition des amplitudes, nous aurions écrit (6) φ ψ = ∑ φ x x ψ tout x

Si l'une et l'autre de ces amplitudes sont normalisées de façon que nous avons décrite ci-dessus, une somme sur tous les états d'une petite région x donnerait la même chose qu'une multiplication par x et la somme sur toutes les valeurs de x devient alors tout simplement une intégrale. Avec nos définitions modifiées, la forme correcte devient (7) φ ψ = ∫ φ x x ψ dx tout x

L'amplitude x ψ est ce que nous appelons maintenant ψ ( x ) et de façon similaire, nous décidons que l'amplitude sera représentée par φ (x ) . Nous souvenant que φ x est le conjugué complexe de

ψ ( x ) , nous pouvons récrire (6) (8) φ ψ = ∫ φ ∗ ( x )ψ ( x )dx

Avec nos nouvelles définitions, toutes les formules que nous avions précédemment s'appliquent à condition de remplacer tout signe de sommation par une intégrale sur x.

Il nous faut ajouter une précision à ce que nous venons de dire. Tout ensemble satisfaisant d'états de base doit être complet pour que son utilisation donne une description correcte de ce qui se passe. Pour un électron dans une dimension, ne spécifier que les états de base x ne suffit pas car, pour chacun de ces états, l'électron peut avoir son spin ou bien en haut, ou bien en bas. Une façon d'obtenir un ensemble complet consiste à prendre deux ensembles d'états suivant x, l'un pour le spin vers le haut et l'autre pour le spin vers le bas. Mais nous ne nous soucierons pas de ces complications pour l'instant.

II.1.2.3. Les états de moment défini Supposez que nous ayons un électron dans un état ψ décrit par l'amplitude de probabilité

x ψ = ψ ( x ) . Nous savons que ceci représente un état pour lequel l'électron est étalé le long de la ligne suivant une certaine distribution, de sorte que la probabilité de trouver l'électron dans un petit intervalle dx à l'emplacement x est simplement 2 (1) prob( x, dx ) = ψ ( x ) dx Que pouvons-nous dire sur l'impulsion de l'électron ? Nous pourrions nous demander quelle est la probabilité pour que cet électron ait l'impulsion p ? Calculons d'abord l'amplitude pour que l'état ψ soit dans un autre état mom p , que nous définissons comme un état d'impulsion définie p. Nous pouvons trouver cette amplitude en utilisant la dernière équation de la section précédente, qui est la clef pour le calcul des amplitudes. En termes de l'état mom p (2) mom p ψ = ∫

+∞

x = −∞

mom p x x ψ dx

Et la probabilité pour que l'on trouve l'électron avec l'impulsion p devrait être donnée par le module carré de cette amplitude. Nous avons cependant, cette fois encore, une petite difficulté au sujet des normalisations. De manière générale, nous pouvons nous interroger seulement sur la probabilité de trouver un électron avec une impulsion à l'intérieur d'un petit domaine dp au voisinage de p. La probabilité pour que l'impulsion ait exactement une certaine valeur p doit être nulle (à moins que l'état se trouve être un état d'impulsion définie). Si nous demandons la probabilité de trouver l'impulsion à l'intérieur d'un petit domaine dp alors nous obtiendrons une probabilité finie. Il y a diverses manières d'ajuster les normalisations. Nous choisirons celle que nous considérons être la plus pratique, bien que cet aspect puisse vous échapper pour l'instant. Nous définissons les normalisations de manière à ce que la probabilité soit reliée à l'amplitude par 2 dp (3) prob( p, dp ) = mom p ψ 2πh

Avec cette définition, la normalisation de l'amplitude mom p ψ est déterminée. L'amplitude

mom p ψ est bien sûr le conjugué complexe de l'amplitude x mom p , cette dernière étant celle que nous avons donné au début de la section précédente. Avec la normalisation que nous avons choisie, il se trouve que la constante de proportionnalité placée devant l'exponentielle est tout simplement égale à 1. Plus précisément ∗ (4) mom p x = x mom p = e −ipx / h L'équation (3) devient alors +∞

(5) mom p ψ = ∫ e −ipx / h x ψ dx −∞

L'ensemble de cette équation et de l'équation (3) nous permet de déterminer la distribution d'impulsion pour tout état ψ . Prenons un cas particulier, par exemple celui d'un électron localisé dans une certaine région au voisinage de x = 0. Prenons une fonction d'onde ayant la forme suivante : (6) ψ ( x ) = Ke − x

2 / 4σ 2

La distribution de probabilité en x pour cette fonction d'onde en est le module carré, c'est-à-dire (7) prob( x, dx ) = P( x )dx = K 2 e − x

2 / 2σ 2

dx

La fonction densité de probabilité est une courbe gaussienne représentée ci-dessus. La plus grande partie de la probabilité est concentrée entre x = +σ et x = −σ . Nous disons que la "demi-largeur" de la courbe est σ (plus précisément, pour quelque chose de réparti suivant cette distribution, σ est égal à la racine carrée de la moyenne des carrés de la coordonnée x, c'est l'écart type). Il nous faudrait choisir la constante K de façon à ce que la densité de probabilité P( x ) ne soit pas simplement proportionnelle à la probabilité par unité de longueur de trouver l'électron mais une échelle telle que P( x )∆x soit égal à la probabilité de trouver l'électron dans l'intervalle ∆x au voisinage de x. Nous obtenons la constante K qui correspond à cela, en imposant que +∞

∫ P(x )dx = 1 , puisqu'il doit y avoir une probabilité unité pour que l'électron soit trouvé quelque −∞

part, c'est-à-dire sur un intervalle couvrant toute la droite. Dans le cas présent, après le calcul de

(

l'intégrale, nous obtenons K = 2πσ 2

)

−1 / 4

.

Pour calculer cette intégrale il suffit d'utiliser le résultat mathématique classique



+∞

−∞

2

e −t dt = π .

Cherchons maintenant la distribution en impulsion. Soit φ ( p ) l'amplitude pour trouver l'électron avec l'impulsion p, (8) φ ( p ) ≡ mom p ψ En portant (6) dans (5) nous obtenons +∞

(9) φ ( p ) = ∫ e −ipx / h ⋅ Ke − x

2 / 4σ 2

−∞

dx

L'intégrale peut être récrite sous la forme (10) Ke

− p 2σ 2 / h 2



+∞

−∞

e

−  1 / 4σ 2   x + 2 ipσ 2 / h    

2

dx

Nous pouvons maintenant faire la substitution u = x + 2ipσ 2 / h et l'intégrale devient (11)



+∞

−∞

e −u

2

/ 4σ 2

du = 2σ π

Les mathématiciens ne seraient sans doute pas tout à fait d'accord avec notre manière de procéder, néanmoins le résultat est correct.

(

(12) φ ( p ) = 8πσ 2

)

1/ 4

e− p σ 2

2

/ h2

D'où le résultat intéressant que la fonction d'amplitude en p a précisément la même forme mathématique que la fonction d'amplitude en x. Seule la largeur de la gaussienne est différente. Nous pouvons aussi écrire

(

)

(13) φ ( p ) = 2πη 2 e − p / 4η où la demi-largeur η de la distribution de p est reliée à la demi-largeur de la distribution de x par h (14) η = 2σ −1 / 4

2

2

Notre résultat dit ceci : si nous donnons à x une distribution très étroite, en faisant σ très petit, η devient très grand et la distribution en p est très étalée. Ou, à l'inverse, si nous avons une distribution étroite en p, il doit y correspondre une distribution étalée en x. Nous pouvons considérer σ et η comme une certaine mesure de l'incertitude sur la détermination de l'impulsion et de la position de l'électron dans l'état que nous étudions. Si nous les appelons respectivement ∆p et ∆x , l'équation (14) devient h (15) ∆p∆x = 2 On peut prouver, c'est assez étonnant, que pour aucune autre forme de distribution en x ou en p, le produit ∆p∆x ne peut être plus petit que celui que nous avons trouvé ici. La distribution gaussienne donne la plus petite valeur possible pour le produit des moyennes quadratiques. De manière générale, nous pouvons dire que h (16) ∆p∆x ≥ 2 C'est là une expression quantitative du principe d'indétermination de Heisenberg dont nous avons déjà discuté de façon qualitative. Généralement, nous disions, de façon approximative, que la valeur minimum du produit ∆p∆x est du même ordre que h .

II.1.2.4. Normalisation des états en x Revenons à la discussion sur les modifications qu'il nous faut introduire dans les équations générales lorsque nous avons affaire à un continuum d'états de base. Lorsque nous avons un nombre fini d'états discrets, une condition fondamentale à laquelle doit répondre l'ensemble des états de base est (1) i j = δ ij Si une particule est dans un état de base, l'amplitude pour qu'elle soit dans un autre état de base est nulle. En choisissant une normalisation appropriée, nous avons fait en sorte que i i soit 1. Ces deux choses sont inclues dans (1). Nous voulons voir maintenant comment on peut modifier cette relation lorsque l'on utilise les états de base x d'une particule sur une droite. Si l'on sait que la particule est dans l'un des états de base x , quelle est l'amplitude pour qu'elle soit dans un autre état de base x ′ ? Si x et x' sont deux emplacements différents le long de la droite, l'amplitude

x x ′ est certainement nulle, ce qui est en accord avec l'équation (1). Mais si x et x' sont égaux, l'amplitude x x ′ ne sera pas 1, à cause de ce bon vieux problème de normalisation. Pour voir comment nous pouvons arranger les choses, retournons à l'équation donnant les amplitudes entre états en fonction des états de base que nous appliquons au cas particulier où l'état φ est précisément l'état de base x ′ . Nous obtenons ainsi (2) x ′ ψ = ∫ x ′ x x ψ dx L'amplitude x ψ est tout simplement ce que nous avons appelé la fonction ψ ( x ) . De même, l'amplitude x ′ ψ , qui se réfère au même état ψ , est la même fonction de la variable x', à savoir

ψ ( x ′) . Nous pouvons donc écrire l'équation (2) sous la forme (3) ψ ( x ′) = ∫ x ′ x ψ ( x )dx

Cette équation doit être vraie pour tout état ψ et donc pour toute fonction arbitraire ψ ( x ) . Cette exigence devrait déterminer complètement la nature de l'amplitude x x ′ , c'est bien sûr une fonction qui dépend de x et x'. Nous sommes ramenés au problème qui consiste à trouver une fonction f ( x, x ′) qui multipliée par ψ ( x ) et intégrée sur tous les x donne simplement la quantité ψ ( x ′) . Or, il n'existe pas de fonction mathématique qui puisse faire cela ! Du moins, rien qui ressemble à ce que nous appelons normalement une "fonction". Prenons pour x' le nombre particulier 0 et définissons l'amplitude 0 x comme une certaine fonction de x, disons f ( x ) . L'équation (1) devient alors ceci : (4) ψ (0 ) = ∫ f ( x )ψ ( x )dx

Quelle sorte de fonction f ( x ) pourrait bien satisfaire à cette équation ? Puisque l'intégrale ne peut pas dépendre des valeurs que prend ψ ( x ) sauf pour x nulle, il faut que f ( x ) soit 0 pour tout x autre que 0. Mais si f ( x ) est 0 partout, l'intégrale sera zéro elle aussi et l'équation (4) ne sera pas satisfaire. Nous avons donc une situation impossible : nous voulons une fonction qui soit nulle partout, sauf en un point, et qui cependant donne une intégrale finie. Comme nous ne pouvons pas trouver de fonction qui remplisse ces conditions, une échappatoire consiste à dire que la fonction f ( x ) est définie par l'équation (2). C'est-à-dire que f ( x ) est la fonction qui rend (4) correcte. Cette fonction, inventée par Dirac, porte son nom. On l'écrit δ ( x ) . Plus exactement, c'est ce qu'on appelle une distribution ou une fonction généralisée et les mathématiciens ont donné un support mathématique rigoureux à cette approche intuitive à travers la théorie des distributions. Ainsi, en remplaçant f ( x ) par cette fonction dans (4), l'intégrale sélectionne la valeur de ψ ( x ) pour x = 0. Tout ce que nous avons à dire de la fonction δ ( x ) est qu'elle possède cette étrange propriété. Et puisque l'intégrale ne doit pas dépendre des valeurs de ψ ( x ) pour tout x différent de zéro, la fonction δ ( x ) doit être nulle partout sauf en x = 0. En résumé, nous pouvons écrire

(5) 0 x = δ (x )

où δ ( x ) est définie par

(6) ψ (0 ) = ∫ δ ( x )ψ ( x )dx Remarquez ce qui se passe lorsque l'on prend pour ψ la fonction particulière "1". L'équation (6) devient alors (7) 1 = ∫ δ ( x )dx Autrement dit, la fonction δ ( x ) qui a la propriété d'être nulle partout sauf en x = 0 a cependant une intégrale finie de valeur 1. Il nous faut donc imaginer un infini fantastique en un point pour que la surface totale sous δ ( x ) soit égale à 1.

Une façon de concevoir ce qu'est la fonction δ de Dirac, consiste à imaginer une série de rectangles ou, à votre choix, toute autre fonction qui ait la forme d'un pic (voir plus bas), qui soient de plus en plus étroits et de plus en plus hauts en gardant toujours une surface unité, comme dans la figure ci-dessus. L'intégrale de cette fonction de − ∞ à + ∞ est toujours 1. Si vous la multipliez par une fonction ψ ( x ) quelconque et si vous intégrez le produit, vous obtenez quelque chose qui est approximativement la valeur de la fonction en x = 0 (moyennée sur la largeur du rectangle), l'approximation devenant meilleure au fur et à mesure que le rectangle devient plus étroit. Vous pouvez donc imaginer la fonction δ ( x ) comme la limite de ce processus. Mais la seule chose importante est que la fonction est définie de sorte que l'équation (6) soit vraie pour toute fonction

ψ ( x ) . Cela définit de manière unique la fonction δ . Ses propriétés sont alors telles que nous les avons décrites. Si nous changeons l'argument x de la fonction δ en x - x', les relations correspondantes sont δ ( x − x ′) = 0 x ′ ≠ x (8) ∫ δ (x − x′)ψ (x )dx = ψ (x′)

Si nous prenons pour l'amplitude x x ′ l'expression δ ( x − x ′) , l'équation (3) est alors satisfaite. Ainsi, la condition correspondant à (1) pour nos états de base en x est (9) x ′ x = δ ( x − x ′) Nous en avons ainsi terminé avec les modifications des équations fondamentales, modifications qu'il nous fallait faire pour traiter du continuum des états de base qui correspondent aux points le long d'une droite. L'extension à trois dimensions est assez immédiate. Nous remplaçons d'abord la coordonnée x par le vecteur r. Les intégrales sur x sont alors remplacées par des intégrales sur x, y et z. Elles deviennent des intégrales de volumes. Et enfin, Il faut remplacer la fonction δ à une dimension tout simplement par le produit de trois fonctions δ , l'une en x, une autre en y et la troisième en z, δ ( x − x ′)δ ( y − y ′)δ ( z − z ′) . En rassemblant toutes ces choses, nous obtenons l'ensemble suivant d'équations sur les amplitudes pour une particule à trois dimensions : (10) φ ψ = ∫ φ r r ψ dV (11) r ψ = ψ (r ) (12) r φ = φ (r )

(13) φ ψ = ∫ φ ∗ (r )ψ (r )dV

(14) r r ′ = δ ( x − x ′)δ ( y − y ′)δ ( z − z ′)

Que se passe-t-il lorsqu'il y a plus d'une particule ? Nous allons vous dire comment l'on traite le cas de deux particules et vous verrez aisément ce qu'il faut faire si vous voulez vous occuper d'un

nombre plus grand. Supposez que deux particules que nous appelons particule N° 1 et particule N° 2. Qu'allons nous prendre pour états de base ? Si nous décrivons un état en disant que la particule 1 est en x1 et la particule 2 est en x 2 , nous aurons un ensemble tout à fait correct, que nous écrirons

x1 , x 2 . Notez que la donnée de la position de l'une des deux particules ne définit pas un état de base. Chaque état de base doit décrire le système entier. Vous ne devez pas penser que chaque particule se déplace indépendamment comme une onde à trois dimensions. Tout état physique peut se définir en donnant toutes les amplitudes x1 , x 2 pour trouver les deux particules en x1 et x 2 . L'amplitude généralisée est donc une fonction de deux ensembles de coordonnées x1 et x 2 . Vous voyez qu'une telle fonction n'est pas une onde, au sens d'une oscillation qui se déplace dans les trois dimensions. De façon générale, ce n'est pas non plus le simple produit de deux ondes individuelles, une pour chaque particule, mais une sorte d'onde selon les six dimensions définies par x1 et x 2 . S'il y a dans la nature deux particules qui interagissent entre elles, il n'y a pas moyen de décrire ce qui arrive à l'une des deux particules en cherchant à écrire une fonction d'onde pour elle uniquement. Ce caractère non séparable des particules est une des particularités les plus étonnantes (mais qui complique aussi singulièrement les calculs). Elle conduit à des situations parfois difficiles à saisir et que nous aurons l'occasion d'examiner. Certaines de ces situations semblent paradoxales et ont donné beaucoup de difficultés aux gens qui, à tort, essayaient de penser à la fonction d'onde pour une particule toute seule et non à la fonction d'onde correcte qui dépend des coordonnées des deux particules. La description complète ne peut se faire de façon correcte qu'en utilisant des fonctions des coordonnées des deux particules.

Une représentation de la fonction de Dirac Donnons une autre représentation de la fonction de Dirac qui a parfois son utilité dans les calculs lorsque l'on utilise un processus de passage à la limite comme avec les rectangles ci-dessus. Une représentation particulière qui est assez utile implique sin ( gx ) / πx comme une fonction de x où g est un nombre positif. Son avantage par rapport aux rectangles est d'être une fonction infiniment dérivable. Elle a la valeur g / π en x = 0 et oscille avec une amplitude décroissante et avec la période 2π / g lorsque x croit. Elle a également une intégrale unité pour x variant de − ∞ à + ∞ , indépendamment de la valeur de g. Donc, la limite de ces fonctions lorsque g → ∞ a toutes

les propriétés de la fonction δ . Elle devient infiniment grande en x = 0, elle a une intégrale unité et les oscillations infiniment rapides lorsque x croît signifie que la contribution entière de l'intégrale contenant cette fonction vient du voisinage infinitésimal de x = 0. Nous pouvons donc poser sin gx (15) δ ( x ) = lim g →∞ πx

Quelques propriétés de la fonction de Dirac Il est important de noter que, à cause de son caractère singulier, la fonction δ ne peut pas être le résultat final d'un calcul et n'a de signification que si une intégration subséquente sur son argument est effectuée. Avec cela en tête, nous pouvons écrire quelques relations entre fonctions δ . δ ( x ) = δ (− x ) δ ′( x ) = −δ ′(− x ) xδ ( x ) = 0 xδ ′( x ) = −δ ( x ) (16) δ (ax ) = a −1δ ( x ) a > 0

δ (x 2 − a 2 ) = (2a )−1 [δ ( x − a ) + δ ( x + a )] a > 0

∫ δ (a − x )δ (x − b )dx = δ (a − b ) f ( x )δ ( x − a ) = f (a )δ ( x − a )

Ici l'apostrophe indique la dérivée par rapport à l'argument. Chacune des six premières équations peut être établie en multipliant les deux cotés par une fonction différentiable continue f ( x ) et en intégrant sur x. Par exemple, la quatrième équation donne d (17) ∫ f ( x )xδ ′( x )dx = − ∫ δ ( x ) [xf ( x )]dx = − ∫ δ ( x )[ f ( x ) + xf ′( x )]dx = − ∫ f (x )δ ( x )dx dx où le terme de conditions aux limites résultant de l'intégration par partie s'annule. Donc, xδ ′( x ) a le même effet lorsqu'il est un facteur dans l'intégrand que − δ ( x ) . De même, la septième équation

signifie que les deux cotés donnent le même résultat quand ils sont multipliés par f (a ) ou f (b ) et intégrés sur a et b. La dernière équation est vérifiée en intégrant les deux cotés sur x ou a.

II.1.3. L'équation de Schrödinger Jusqu'à présent, nous nous sommes uniquement souciés de décrire des états susceptibles de représenter un électron situé en n'importe quel point de l'espace. Il nous faut maintenant voir comment insérer dans notre description la physique de ce qui peut se produire dans diverses circonstances. Comme précédemment, il nous faut voir comment les états peuvent varier dans le temps. Si nous avons un état ψ qui se transforme un peu plus tard dans un autre état ψ ′ , nous pouvons décrire la situation à tout instant en faisant de la fonction d'onde, qui n'est rien d'autre que l'amplitude r ψ , une fonction du temps aussi bien que des coordonnées. On peut alors décrire une particule dans une situation donnée par une fonction d'onde dépendant du temps ψ (r, t ) = ψ ( x, y, z , t ) . Cette fonction d'onde, qui varie avec le temps, décrit l'évolution des états successifs qui se produisent au cours du temps. Cette "représentation d'espace", qui donne des projections de l'état ψ sur les états de base r peut ne pas être toujours la plus pratique, mais c'est elle que nous allons considérer d'abord. Plus tôt, nous avons décrit la variation des états en fonction du temps en terme de l'hamiltonien H ij . La variation des diverses amplitudes en fonction du temps était donnée par l'équation matricielle dC (1) ih i = ∑ H ij C j dt j Cette équation nous dit que la variation de chaque amplitude C i en fonction du temps est proportionnelle à toutes les autres amplitudes C j , avec les coefficients de proportionnalité H ij . Quel aspect peut bien prendre l'équation (1) lorsqu'on utilise un continuum d'états de base x ? Souvenons-nous d'abord que l'équation (1) peut aussi s'écrire d i ψ = ∑ i Hˆ j j ψ (2) ih dt j

Ce que nous avons à faire est maintenant très clair. Pour la représentation x nous pouvons écrire d (3) ih x ψ = ∫ x Hˆ x ′ x ′ ψ dx ′ dt La somme sur tous les états de base j se trouve remplacée par une intégrale sur x'. Puisque x Hˆ x ′ doit être une certaine fonction de x et de x', nous pouvons l'écrire sous la forme H ( x, x ′) , ce qui correspond au H ij de l'équation (1). L'équation (3) est donc identique à (4) ih

d ψ ( x ) = ∫ H ( x, x ′)ψ ( x ′)dx ′ dt

avec (5) H ( x, x ′) ≡ x Hˆ x ′ D'après l'équation (4), le taux de changement de ψ au point x doit dépendre de la valeur de ψ en tous les autres points x'. Le facteur H ( x, x ′) est l'amplitude par unité de temps pour que l'électron saute de x' à x. Cependant, il se trouve que dans la nature cette amplitude est nulle sauf pour des points x' très proches de x. C'est une manifestation de la localité que l'on retrouve explicitement en relativité : les phénomènes physiques se propagent de proche en proche. Cela implique, comme nous l'avons vu dans l'exemple de la chaîne d'atomes, que le terme de droite de (4) peut être exprimé en terme de ψ et des dérivées de ψ par rapport à x, toutes évaluées au point x. Pour une particule se déplaçant librement dans l'espace, sans qu'il y ait de force ni de perturbation, la loi correcte de la physique est h2 d 2 (6) ∫ H (x, x ′)ψ ( x ′)dx ′ = − ψ (x ) 2m dx 2 Où avons-nous trouvé cette forme ? Nulle part. Il n'est pas possible de la déduire de quoi que ce soit que vous connaissiez. Elle est sortie de l'esprit de Schrödinger, lorsqu'il luttait pour trouver une compréhension des observations expérimentales du monde réel. Pourquoi doit-elle être ainsi, vous

pouvez en avoir une certaine intuition en pensant à la façon dont nous avons établi la version pour une particule libre à partir de la considération de la propagation d'un électron dans un cristal. La naissance originale de cette équation est d'ailleurs représentative. Au départ, Schrödinger présenta son équation sans explication sur la manière de l'obtenir. Mais les physiciens n'aiment pas trop voir quelque chose tiré comme d'un chapeau de magicien sans avoir ne fut ce qu'une idée de la manière dont on a pu l'obtenir, même si cette équation marche admirablement bien ce qui, a posteriori, en constitue la seule validation expérimentale valable. Ce n'est que sur l'insistance de ses pairs que Schrödinger donna le cheminent de sa pensée ayant abouti à ce résultat. Nous donnerons ci-dessous une autre "déduction" intuitive plus proche de cette approche traditionnelle. Les particules libres ne sont pas, à vrai dire, très excitantes. Que se passe-t-il si nous faisons agir des forces sur la particule . Eh bien, si la force sur la particule peut être dérivée d'un potentiel scalaire, nous pensons à des forces électriques, non magnétiques, et si nous nous en tenons à des énergies faibles, de sorte que nous pouvons ignorer les complications dues aux mouvements relativistes, l'hamiltonien qui s'adapte au monde réel donne alors ceci h2 d 2 (7) ∫ H (x, x ′)ψ ( x ′)dx ′ = − ψ ( x ) + V ( x )ψ ( x ) 2m dx 2 A nouveau, vous pouvez vous faire une certaine idée de l'origine de cette équation si vous revenez au mouvement de l'électron dans un cristal et si vous regardez comment il faudrait modifier les équations pour tenir compte d'une lente variation de l'énergie de l'électron d'un emplacement atomique à l'autre, ce serait le cas s'il y avait un champ électrique à travers le cristal. Le terme E 0 varierait alors lentement avec la position et correspondrait au nouveau terme que nous avons ajouté dans (7). Vous vous demandez sans doute pourquoi nous sommes allés directement de l'équation (6) à l'équation (7) au lieu de vous donner tout simplement l'expression correcte pour l'amplitude H ( x, x ′) = x Hˆ x ′ . La raison en est que H ( x, x ′) ne peut s'exprimer qu'au moyen de fonctions algébriques étranges, bien que toute l'intégrale à droite de l'équation (6) puisse s'écrire avec des choses qui vous sont maintenant familières. Si vous êtes vraiment curieux, H ( x, x ′) peut s'écrire de la manière suivante :

h2 δ ′′( x − x ′) + V ( x )δ (x − x ′) 2m où δ ′′ représente la dérivée seconde de la fonction de Dirac. Cette fonction assez étrange peut être remplacée par un opérateur algébrique différentiel qui lui est totalement équivalent  h2 d 2  (9) H ( x, x ′) = − + V ( x )δ ( x − x ′) 2  2m dx 

(8) H ( x, x ′) = −

Nous n'utiliserons pas ces expressions et nous travaillerons directement avec la forme (7). Si nous portons l'expression (7) dans l'intégrale en (3), nous obtenons pour ψ ( x ) = x ψ l'équation différentielle suivante : ∂ψ h2 ∂2 (10) ih =− ψ ( x ) + V ( x )ψ ( x ) ∂t 2m ∂x 2 Si nous nous intéressons à un mouvement à trois dimensions, nous voyons clairement comment modifier l'équation (10). Il suffit de remplacer d 2 / dx 2 par ∂2 ∂2 ∂2 (11) ∇ 2 = 2 + 2 + 2 ∂x ∂y ∂z et V ( x ) par V ( x, y, z ) . L'amplitude ψ ( x, y, z ) pour un électron qui se place dans un potentiel V ( x, y, z ) obéit à l'équation différentielle ∂ψ h2 2 (12) ih =− ∇ ψ + Vψ ∂t 2m C'est ce qu'on appelle l'équation de Schrödinger et ce fut la première équation de mécanique quantique jamais écrite. Elle a été écrite par Schrödinger avant qu'aucune des équations quantiques décrites jusqu'ici n'ait été découverte. Bien que nous ayons abordé le sujet selon une voie complètement différente, le grand moment historique de la naissance de la description quantique de la matière s'est produit lorsque

Schrödinger en 1926 a écrit pour la première fois son équation. Pendant de longues années, la structure atomique interne de la matière était restée un grand mystère. Personne n'avait été capable de comprendre ce qui maintient la matière ensemble, pourquoi il y a des forces de liaisons chimiques et surtout comment il peut se faire que des atomes puissent être stables. Si Bohr avait su donner une description du mouvement interne d'un électron dans un atome d'hydrogène, description qui paraissait expliquer le spectre de la lumière émise par cet atome, la raison pour laquelle les électrons se déplacent de cette manière restait un mystère. La découverte par Schrödinger des équations propres du mouvement des électrons à l'échelle atomique a fourni une théorie à partir de laquelle on peut calculer des phénomènes atomiques de façon quantitative, précise et détaillée. En principe, l'équation de Schrödinger permet d'expliquer tous les phénomènes atomiques sauf ceux qui font intervenir le magnétisme et la relativité. Elle permet d'expliquer les niveaux d'énergie d'un atome ainsi que tous les faits qui concernent les liaisons chimiques. Cependant, ceci n'est vrai qu'en principe, pour résoudre exactement n'importe quel problème sauf les plus simples, les calculs deviennent rapidement trop compliqués. Seuls les atomes d'hydrogène et d'hélium ont pu être calculés avec une grande précision. Cependant, à l'aide de diverses approximations, dont certaines sont assez vaseuses, de nombreux faits concernant des atomes plus compliqués et concernant les liaisons chimiques de molécules ont pu être compris. Nous vous avons montré certaines de ces approximations dans ce qui a précédé. Depuis, avec l'usage de calculateurs de plus en plus puissant et le développement du calcul numérique massif, des calculs précis de situations un peu plus compliquées que l'atome d'hélium ont pu être abordés avec succès. Mais les méthodes d'approximations restent indispensables pour des situations plus complexes. Cette limite à la capacité du calcul peut sembler un défaut de la théorie. Le fait que l'équation soit difficile à résoudre dans les cas compliqués n'enlève rien au fait que l'équation est correcte et on ne peut évidemment simplifier cette équation, dans le simple but d'avoir des calculs plus simples, sans obtenir un résultat qui ne correspond en rien à la réalité. La nature n'existe pas telle qu'elle est dans le but de nous rendre la vie facile. En outre, ce genre de situation ne devrait pas tellement surprendre. Déjà, avec la théorie de la gravitation de Newton, dont les équations sont particulièrement simples, les équations générales pour trois corps ne peuvent être résolues exactement et, pire encore, les solutions manifestent un comportement chaotique dans de nombreux régimes, ce qui rend l'analyse des solutions, même numériques, très difficile. Enfin, il va de soit qu'il est plus facile de décrire le plan d'une maison en donnant les dimensions des murs qu'en

donnant la position de chaque brique. Plus on rentre dans le détail et plus le travail devient considérable. L'équation de Schrödinger permet de descendre dans l'infiniment petit et de comprendre les comportements des atomes mais reconstruire le monde qui nous entoure avec toute sa complexité et ses milliards de milliards d'atomes ne peut évidemment se faire sans difficulté. L'équation de Schrödinger, telle que nous l'avons écrite, ne tient compte d'aucun effet magnétique. Il est possible de tenir compte de ces effets d'une manière approchée en ajoutant quelques termes de plus à l'équation. Cependant, le magnétisme est essentiellement un effet relativiste. Une description correcte du mouvement d'un électron dans un champ électromagnétique arbitraire ne peut donc se faire que par une équation relativiste. L'équation relativiste correcte pour le mouvement d'un électron a été découverte par Dirac une année après que Schrödinger ait proposé son équation. Elle se présente sous une forme très différente. Avant de regarder certaines conséquences de l'équation de Schrödinger, nous voudrions vous montrer comment elle se présente pour un système avec un grand nombre de particules. Nous voulons vous la montrer pour que vous puissiez bien voir que la fonction d'onde n'est pas simplement une onde ordinaire dans l'espace mais qu'elle est une fonction de beaucoup de variables. S'il y a beaucoup de particules, l'équation devient ∂ψ (r1 , r2 , r3 , K) h 2  ∂ 2ψ ∂ 2ψ ∂ 2ψ  (13) − ih =∑  2 + 2 + 2  + V (r1 , r2 , r3 ,K)ψ ∂t ∂y i ∂z i  i 2mi  ∂xi La fonction de potentiel V est l'équivalent classique de l'énergie potentielle totale de toutes les particules. Si aucune force extérieure n'agit sur les particules, la fonction V est simplement l'énergie électrostatique d'interaction de toutes les particules. Autrement dit, si la ième particule porte la charge Z i q e , la fonction V est alors simplement (avec la convention selon laquelle e 2 = q e2 / 4πε 0 ) Zi Z j 2 (14) V (r1 , r2 , r3 , K) = ∑ e rij

Développement de l'équation Nous allons maintenant présenter une autre approche pour déduire l'équation de Schrödinger par la recherche d'une équation d'onde généralisant les propriétés ondulatoires des particules quantiques. Cette déduction a l'avantage de la rapidité mais elle n'offre pas la profondeur de compréhension physique qui a été apportée par la déduction précédente. Toutefois, cette déduction à l'avantage de bien mettre en avant le coté ondulatoire des particules quantiques en même temps que le fait que ce ne sont pas tout à fait des ondes classiques.

Ondes harmoniques progressives La première tâche est de développer d'une manière plus quantitative les propriétés de la fonction d'onde à une dimension ψ ( x, t ) dont les propriétés ondulatoires ont été discutées qualitativement au début de ce cours. Nous avons vu que pour une onde harmonique progressive continue, la longueur d'onde et le moment sont reliés ainsi que l'énergie et la fréquence. Récrivons ces relations : (15) p = hk (16) E = hω Une fonction d'onde ψ ( x, t ) qui représente une particule de position totalement indéterminée voyageant dans la direction de x positif avec un moment connu avec précision p et une énergie cinétique E devrait avoir une des formes cos(kx − ω t ) (17)

sin (kx − ω t ) e i (kx −ω t )

e −i ((kx −ω t )) ou une combinaison linéaire de ces solutions. Cela suit directement des expériences de diffractions et d'interférences et de l'exigence qu'un paquet d'ondes d'approximativement le nombre d'ondes k et la pulsation ω a une vitesse de groupe égale à celle d'une particule libre classique de moment p et d'énergie E.

A la recherche d'une équation d'ondes Afin d'aller au-delà du problème très simple d'une onde harmonique continue, il est désirable d'avoir une équation dont les ondes harmoniques et les ondes plus compliquées sont solution. Un exemple d'un domaine plus familier de la physique devrait aider à clarifier ce point. Dans le cas des ondes sonores à trois dimensions dans un gaz, il est possible d'obtenir une solution du problème de la diffusion du son par une sphère rigide en superposant des ondes harmoniques progressives voyageant dans différentes directions. Mais il est beaucoup plus simple de résoudre l'équation différentielle pour les ondes sonores directement en coordonnées sphériques. Si la température du gaz change de point en point, aucun progrès ne peut être fait dans le cas général sans une telle équation différentielle. L'équation correcte pour les ondes sonores peut être trouvée directement à partir de considérations sur les propriétés mécaniques du gaz. Bien que ce ne soit pas le cas avec l'équation dont les fonctions d'onde sont solutions, il n'est pas moins impératif de trouver la forme de l'équation. La nécessité devient encore plus évidente quand la fonction d'onde d'écrit le mouvement d'une particule sous l'influence de forces externes. Cette situation s'avère être l'analogue de la propagation des ondes sonores dans un gaz non homogène. Nous allons donc trouver une telle équation pour ψ puis nous la regarderons comme un attribut plus fondamental de la fonction d'onde que les formes harmoniques (17). L'équation doit avoir deux propriétés de base. Tout d'abord elle doit être linéaire, afin que les solutions puissent obéir au principe de superposition, produire des effets d'interférences (dans le cas à trois dimensions).et permettre la construction de paquets d'ondes. Et, ensuite, les coefficients de l'équation doivent seulement impliquer des constantes telles que h et la masse et la charge de la particule, et non les paramètres d'un type particulier de mouvement de la particule (impulsion, énergie, nombre d'ondes et fréquence). La raison de cette exigence est que nous désirons laisser ouvert la possibilité de superposer des solutions qui possèdent différentes valeurs de ces paramètres. Cela signifie qu'une telle fonction d'onde plus générale ne peut pas être solution d'une équation qui implique ces paramètres dans sa structure. Puisque les équations différentielles sont les plus faciles à manipuler, il est intéressant d'essayer de type d'équation d'abord et il s'avère que les exigences peuvent être satisfaites par une équation différentielle.

Avec toutes ces considérations à l'esprit, nous regardons d'abord l'équation d'onde à une dimension la plus familière qui décrit le mouvement d'une onde transverse sur une corde ou une onde sonore plane dans un gaz : ∂ 2ψ ∂ 2ψ γ (18) = ∂t 2 ∂x 2 où γ est le carré de la vitesse de l'onde. La substitution des formes (17) dans l'équation (18) montre que chacune des quatre solutions harmoniques et donc leurs combinaisons linéaires satisfont l'équation différentielle si et seulement si nous posons p2 ω2 E2 (19) γ = 2 = 2 = k p 4m 2 où m est la masse de la particule décrite par l'équation (18). A cause de la structure (19), il est évident que le coefficient γ qui apparaît dans (18) implique les paramètres du mouvement (E ou p). Nous écartons donc cette équation différentielle.

L'équation d'onde à une dimension Pour trouver une équation appropriée, il est utile de noter que la différentiation par rapport à x des fonctions d'onde comme celles (17) a l'effet général de multiplier la fonction par k (et quelque fois aussi d'échanger sinus et cosinus) tandis que la différentiation par rapport à t a l'effet général de multiplier par ω . Alors, la relation E = p 2 / 2m , qui est équivalente à la relation ω = hk 2 / 2m , suggère que l'équation différentielle que nous recherchons contient une dérivée première par rapport à t et une dérivée seconde par rapport à x. ∂ψ ∂ 2ψ =γ (20) ∂t ∂x 2 La substitution montre que les deux premières fonctions d'onde (17) ne sont pas solutions de (20) mais que les deux dernières le sont (mais pas les deux en une fois) si la constante γ est choisir de manière appropriée. En particulier, si nous choisissons i ω i hE i h (21) γ = 2 = 2 = 2m k p

alors la troisième fonction d'onde (17) satisfait (20). De plus, la valeur de γ donnée dans (21) implique seulement les constantes h et m. Nous sommes donc conduit à la forme à une dimension de l'équation d'onde de Schrödinger pour une particule libre de masse qui, à partir de (20) et (21), peut être écrite ∂ψ h 2 ∂ 2ψ (22) ih =− ∂t 2m x 2 La forme particulière sous laquelle (22) est écrite est significative pour la solution harmonique, la troisième fonction d'onde (17), car elle transforme le coté gauche en Eψ et le coté droit en

(p

2

)

/ 2m ψ .

Equation à trois dimensions Le traitement à une dimension précédent est facilement étendu à trois dimensions. Il est naturel de récrire (16) comme (23) p = hk k = k où k est appelé le vecteur d'onde. De même, la troisième des fonctions d'onde (17) devient (24) exp i (k ⋅ t − ω t ) où r est le vecteur position de la particule. Alors, par une extension évidente de l'argument qui nous a conduit à (22), on voit que l'équation de Schrödinger à trois dimensions pour une particule qui est représentée par la fonction d'onde ψ (r, t ) est (25) ih

h2 2 ∂ψ =− ∇ψ ∂t 2m

Une comparaison des équations (23) et (25) et l'équation classique de l'énergie p2 (26) E = 2m suggère que, au moins pour une particule libre, l'énergie et le moment peuvent être représentés par des opérateurs différentiels qui agissent sur la fonction d'onde ψ .

(27) E → ih

∂ ∂t

p → i h∇

Les développements ultérieurs montreront que ce sont aussi des représentations valides quand la particule n'est pas libre.

Inclusion des forces Le prochain problème est d'étendre l'équation de la particule libre (25) pour inclure les effets de forces extérieures qui peuvent agir sur la particule. Nous supposerons pour le moment que ces forces sont d'une nature (électrostatique, gravitationnelle, peut-être nucléaire) telle qu'elles peuvent être combinées en une seule force F qui est dérivable d'une énergie potentielle réelle V. (28) F(r, t ) = −∇V (r, t ) Tout comme la relation classique entre l'énergie et le moment est utilisée ci-dessus pour en déduire la structure de l'équation (25), il est maintenant désirable de partir de la relation classique correspondante qui inclut les forces extérieures. Cela est simplement exprimé en terme de l'énergie potentielle p2 (29) E = + V (r, t ) 2m où E est maintenant l'énergie totale et le premier et le second termes sur la droite sont respectivement les énergies cinétiques et potentielles de la particule. Puisque V ne dépend pas de p ni de E, les équations (29) et (27) suggèrent que l'équation (25) se généralise en ∂ψ h2 2 =− ∇ ψ + V (r, t )ψ (30) ih ∂t 2m C'est l'équation d'onde que nous recherchions. Cette déduction comme la précédente ne donnent qu'un caractère plausible à l'équation de Schrödinger. Cela ne peut en aucun cas constituer une démonstration de cette équation. Mais c'est

bien sûr l'accord des solutions de (30) avec l'expérience dans des cas particuliers qui démontrer la validité et l'utilité de cette équation.

II.2. Interprétation de la fonction d'onde Nous allons maintenant approfondir l'interprétation de la fonction d'onde que nous avions effleurée dans la section II.1.2.2. La fonction d'onde ψ (r, t ) qui est solution de l'équation de Schrödinger est maintenant supposée fournir une description complète en mécanique quantique du comportement d'une particule de masse m avec l'énergie potentielle V (r, t ) et est donc l'analogue de la trajectoire classique r (t ) . La signification de la fonction d'onde doit toutefois être agrémentée de détails concernant son interprétation qui nous permet d'extraire de ψ le maximum d'information permis par la nature. Tout comme la validité de l'équation de Schrödinger, l'interprétation de la fonction d'onde doit être jugée par sa consistance logique et sont adéquation aux résultats expérimentaux.

Interprétation statistique Revenons sur le fait que la fonction d'onde est en fait une amplitude et fournit donc les probabilités de trouver la particule à un endroit déterminé. Cela signifie qu'en pratique, on doit interpréter ψ en termes statistiques. Nous pouvons imaginer un nombre très grand de régions de l'espace identiques, indépendantes et sans parties communes, suffisament grandes pour contenir toutes les propriétés intéressantes du mouvement et dans chacune le comportement d'une particule avec l'énergie potentielle V (r, t ) est décrit par la même fonction d'onde ψ (r, t ) . Dans chaque cas, r se rapporte à une origine dans la région concernée. Ou bien, nous pouvons imaginer un très grand nombre de répétitions du même mouvement dans la même région de l'espace avec, à chaque fois, t se rapportant à une origine particulière du temps. Le lien entre amplitude et probabilité découle d'une hypothèse, due à Born, que le résultat numérique de la mesure à un moment particulier t (pour autant que le moment où la mesure est faite puisse être spécifié) de toute quantité physique significative, tel que position moment ou énergie, ne sera en général pas le même dans chaque région mais sera plutôt une distribution de valeurs qui peut être décrit par une fonction de probabilité.

Il est naturel de relier cette probabilité à la fonction ψ mais celle-ci est en général un nombre complexe. L'hypothèse de Born est de supposer que le produite de ψ avec son complexe conjugué

ψ ∗ donne la densité de probabilité de la position. Comme nous l'avions vu. (1) P(r, t ) = ψ ∗ (r, t )ψ (r, t ) = ψ (r, t )

2

Cela signifie que P(r, t )dxdydz est la probabilité de trouver une particule dans son élément de volume dx dy dz autour du point r à l'instant t, quand un grand nombre de mesures précises de la position sont effectuées sur des particules indépendantes, chacune décrite par la fonction d'onde à une particule ψ (r, t ) .

Normalisation de ψ La probabilité de trouver la particule quelque part dans la région doit être l'unité. L'équation (1) implique donc que la fonction d'onde est normalisée :

(2) ∫ ψ (r, t ) d 3 r = 1 2

où l'intégrale s'étend sur la région entière. Ici d 3 r est l'élément de volume à trois dimensions dx dy dz. Si ψ est un paquet d'onde, l'intégrale (2) converge et le coefficient numérique de ψ peut être ajusté pour que l'intégrale soit égale à l'unité. Une telle normalisation ne change pas le fait que ψ est une solution de l'équation de Schrödinger car celle-ci est homogène en ψ . Il y a cependant des solutions, comme une onde plane, telles que l'intégrale (2) ne converge pas sur un volume infini. De telles fonctions nécessitent des considérations particulières sur lesquelles nous reviendrons. Pour le moment, nous pouvons imaginer que la fonction d'onde est définie dans une région de l'espace éventuellement très grande mais finie. Dans ce cas, l'intégrale (2) est faites sur un volume fini et elle converge, permettant la normalisation. Le coefficient de ψ qui normalise doit être indépendant du temps afin que ψ satisfasse l'équation de Schrödinger. Donc, si (2) est satisfait, l'interprétation de ψ comme densité de probabilité nécessite que l'intégrale de normalisation soit indépendante du temps. C'est en fait le cas et cela 2

peut être vérifié en calculant la dérivée par rapport au temps de l'intégrale de P sur tout volume fixé Ω :  ∗ ∂ψ ∂ψ ∗  3 ∂ 3 P(r, t )d r = ∫ ψ + ψ d r Ω ∂t ∫Ω ∂ t ∂ t  

[

) ]

(

ih ψ ∗ ∇ 2ψ − ∇ 2ψ ∗ ψ d 3 r ∫ Ω (3) 2m ih = ∇ ⋅ ψ ∗ ∇ψ − ∇ψ ∗ ∇ψ d 2 r ∫ Ω 2m ih = ψ ∗∇ψ − ∇ψ ∗ ∇ψ n dA ∫ A 2m =

[

(

[

(

) ]

) ]

où on a remplacé ∂ψ / ∂t en utilisant l'équation de Schrödinger et son conjugué complexe. La dernière intégrale est obtenue par intégration partielle (théorème de Green) où A est la surface frontière de la région d'intégration et l'indice n indique la composante du vecteur entre crochet dans la direction normale vers l'extérieure à l'élément de surface dA. Nous définissons le vecteur S(r, t ) , h ψ ∗∇ψ − (∇ψ ∗ )ψ (4) S(r, t ) = 2im

[

]

Ce qui nous donne ∂ (5) P(r, t )d 3 r = − ∫ ∇ ⋅ Sd 3 r = − ∫ S n dA ∫ Ω Ω A ∂t Dans le cas d'un paquet d'ondes pour lequel ψ s'annule à grande distance et l'intégrale de normalisation converge, l'intégrale de surface est évidemment zéro quand Ω est l'espace entier. Pour une fonction d'onde de type onde plane, ψ peut être définie dans une région finie Ω telle qu'elle s'annule ou a une structure périodique le long de la frontière, comme nous verrons. Dans

tous ces cas, on vérifie sans difficulté que l'intégrale de surface dans (6) est nulle, tel que l'intégrale de normalisation dans (1) est constante dans le temps.

Densité de courant de probabilité La dérivation de (5) montre aussi que la relation différentielle ∂P (r, t ) (6) + ∇ ⋅ S(r, t ) = 0 ∂t est valide. Elle a la forme familière associée à la conservation du flux d'un fluide de densité P et de densité de courant S dans laquelle il n'y a ni source ni fuite. Il est donc raisonnable d'interpréter S(r, t ) donnée par l'équation (4) comme une densité de courant de probabilité. Cette interprétation rend plus plausible l'identification de − ih∇ avec l'impulsion même quand une force est présente. Alors (h / im )∇ est l'opérateur vitesse et il est évident que h   (7) S(r, t ) = Reψ ∗ ∇ψ   im  Bien que cette interprétation de S soit suggestive, on doit bien comprendre que S n'est pas susceptible d'une mesure directe dans le sens où P l'est. Il serait trompeur, par exemple, de dire que S(r, t ) est la moyenne du flux de particule mesuré au point r et au moment t car une mesure du flux local moyen implique des mesures simultanées de haute précision de la position et de la vitesse (qui est équivalente à l'impulsion) et est donc inconsistante avec la relation d'indétermination. Néanmoins, il est quelque fois utile de voir S comme un vecteur de flux, en particulier quand il dépend seulement légèrement ou pas du tout de r tel qu'une détermination précise de la vitesse peut être faite sans altérer l'utilité du concept de flux.

Valeur moyenne L'existence de la densité de probabilité de position P(r, t ) rend possible le calcul de ce que nous appelons la valeur moyenne du vecteur position d'une particule, qui est définie comme le vecteur dont les composantes sont les moyennes pondérées des composantes correspondantes de la position de la particule. La valeur moyenne est la moyenne mathématique (dans le sens de la théorie des probabilités) pour le résultat d'une seule mesure ou est la moyenne des résultats d'un grand nombre

de mesures sur des systèmes indépendant du type discuté au début de cette section. Nous écrivons la valeur moyenne de r comme (8) r = ∫ rP (r, t )d 3 r = ∫ψ ∗ (r, t )rψ (r, t )d 3 r qui est équivalente aux trois équations (9) x = ∫ψ ∗ xψd 3 r y = ∫ψ ∗ yψd 3 r

z = ∫ ψ ∗ zψ d 3 r

où ψ est normalisé. Attention de ne pas confondre la notation < > pour une moyenne avec la notation des crochets de Dirac pour les amplitudes. Il arrive parfois que certaines notations se trouvent avoir plusieurs usages, ce dont nous sommes désolés, mais il est préférable de suivre les notations conventionnelles pour ne pas que vous soyez déroutés en lisant des articles spécialisés dans le domaine. La valeur moyenne est une fonction de seulement le temps puisque ψ et P dépendent de t et que les coordonnées spatiales ont été intégrées. Les valeurs moyennes de toute autre quantité physiquement significative peut être obtenue d'une manière similaire si elles sont uniquement fonctions de la coordonnée de la particule r. Donc, la valeur moyenne de l'énergie potentielle est (10) V = ∫ V (r, t )P(r, t )d 3 r = ∫ψ ∗ (r, t )V (r, t )ψ (r, t )d 3 r Une quantité telle que l'impulsion ou l'énergie doivent, cependant, être exprimées en fonction de r et de t avant qu'un calcul de ce type puisse être fait. Nous supposons qu'il est possible d'utiliser les représentations sous forme d'opérateurs différentiels que nous avons vues. Nous reviendrons sur ce point. La question qui est cependant immédiatement soulevée est comment de tels opérateurs différentiels doivent être combinés avec la densité de probabilité P. On peut répondre à la question en imposante l'exigence raisonnable suivante aux valeurs moyennes :

p2 + V 2m en analogie avec l'équation classique de l'énergie. Cette exigence est raisonnable car on s'attend à ce qu'en moyenne, les particules quantiques obéissent aux équations classiques. En termes d'opérateurs différentiels, (11) peut être écrit ∂ h2 2 (12) ih = − ∇ + V ∂t 2m

(11) E =

Il est visible que l'équation (12) est consistante avec l'équation de Schrödinger seulement si la valeur moyenne est définie dans le cas général avec l'opérateur agissant sur ψ et multiplié à gauche par ψ ∗ . Nous obtenons donc, par exemple, ∂ψ 3 (13) E = ∫ψ ∗ih d r p = ∫ψ ∗ (− ih )∇ψd 3 r ∂t Comme dans l'équation (8), la deuxième équation (13) est équivalente aux équations sur les composantes ∂ψ 3 p x = −i h ∫ ψ ∗ d r ∂x ∂ψ 3 d r (14) p y = −ih ∫ψ ∗ ∂y ∂ψ 3 p z = −i h ∫ ψ ∗ d r ∂z

Théorème d'Ehrenfest Il est assez raisonnable de s'attendre à ce que le mouvement d'un paquet d'ondes soit en accord avec le mouvement d'une particule classique quant l'énergie potentielle change de manière négligeable sur les dimensions du paquet. Ce que nous avons déjà constaté pour la propagation d'un électron dans un cristal ou la limite classique des forces. Si nous entendons par vecteurs "position" et "impulsion" du paquet les moyennes pondérées ou valeurs moyennes de ces quantités, nous

pouvons montrer que les équations classiques et quantiques sont toujours en accord. Une composante de la "vitesse" du paquet sera le taux de changement dans le temps de la valeur moyenne de cette composante de la position car x dépend seulement du temps et la variable x dans l'intégrand de (9) est une variable d'intégration, c'est-à-dire d d ∂ψ 3 ∂ψ ∗ (15) x = ∫ψ ∗ xψd 3 r = ∫ψ ∗ x d r+∫ xψd 3 r dt dt ∂t ∂t On peut simplifier cette expression en substituant, aux dérivées du temps de la fonction d'onde et de son complexe conjugué, la partie droite de l'équation de Schrödinger et en annulant les termes V où nous continuons à supposer pour le moment que V est réel :   h2 2   h2 2 ∗  d i x = −  ∫ψ ∗ x − ∇ ψ + Vψ d 3 r − ∫  − ∇ ψ + Vψ ∗  xψd 3 r  dt h  2m   2m   (16) ih = ψ ∗ x ∇ 2ψ − ∇ 2ψ ∗ xψ d 3 r ∫ 2m

[ (

) (

) ]

La deuxième intégrale peut être intégrée par partie : (17) ∫ ∇ 2ψ ∗ xψd 3 r = − ∫ ∇ψ ∗ ⋅ (∇ψ )d 3 r + ∫ xψ∇ψ ∗ n dA

(

)

(

)

A

(

)

où l'intégrale de la composante normale de xψ∇ψ ∗ sur la frontière A à l'infini s'annule car un paquet d'ondes ψ s'annule à grande distance. Une deuxième intégration par partie, dans laquelle l'intégrale de surface s'annule à nouveau, donne (18) ∫ ∇ 2ψ ∗ xψd 3 r = ∫ψ ∗ ∇ 2 ( xψ )d 3 r

(

Donc

)

[

]

d ih x = ψ ∗ x∇ 2ψ − ∇ 2 ( xψ ) d 3 r dt 2m ∫ (19) ih ∂ψ 3 1 = − ∫ψ ∗ d r= px m ∂x m

Puisque x est toujours un nombre réel à cause de la forme de (10), l'équation (19) montre que l'on a également p x réel. On peut aussi le montrer sur la deuxième équation (13) lorsque ψ représente un paquet d'ondes en utilisant une intégration par partie. De même, nous pouvons calculer le taux de changement dans le temps d'une composante de "l'impulsion" de la particule comme d d ∂ψ 3 p x = −i h ∫ ψ ∗ d r dt dt ∂x  ∗ ∂ ∂ψ 3 ∂ψ ∗ ∂ψ 3   d r+∫ d r  = −i h  ∫ ψ ∂ x ∂ t ∂ t ∂ x  

= − ∫ψ ∗ (20)

  h2 2 ∗  ∂ψ 3 ∂  h2 2  − d r ∇ ψ + Vψ d 3 r + ∫  − ∇ ψ + Vψ ∗  ∂x  2m   2m  ∂x

∂ψ  3 ∂ = − ∫ψ ∗  (Vx ) − V d r ∂x   ∂x ∂V ψd 3 r = − ∫ψ ∗ ∂x ∂V = − ∂x à nouveau en utilisant l'équation de Schrödinger et en intégrant deux fois par parties. Les équations (19) et (20) ainsi que pour les autres composantes constituent le théorème d'Ehrenfest. Elles sont les analogues des équations classiques du mouvement : dr p dp (21) = = −∇V dt m dt Le théorème d'Ehrenfest fournit un exemple du principe de correspondance introduit par Bohr et qui affirme que les équations quantiques et classiques correspondent lorsque l'on peut négliger les "fluctuations" statistiques quantiques ou lorsque l'on pose h = 0 . En effet, ce théorème montre

qu'un paquet d'ondes se comporte comme une particule classique lorsque les valeurs moyennes donnent une bonne représentation de la variable classique correspondante. C'est habituellement la limite macroscopique où la taille finie et la structure interne du paquet peut être ignorée.

II.3. Les niveaux d'énergie quantifiés La fonction d'onde de Schrödinger admet une simplification considérable lorsque l'énergie potentielle V (r ) ne dépend pas du temps. Il est alors possible d'exprimer sa solution générale comme une somme de produits de fonctions de r et de t séparément.

Séparation de la fonction d'onde Considérons une solution particulière de l'équation de Schrödinger qui peut être écrite comme un produit : ψ (r, t ) = u (r ) f (t ) . Une solution générale peut alors être écrite comme une somme de telles solutions séparées. Si nous introduisons cette expression dans l'équation de Schrödinger et que nous divisons par ce produit, nous obtenons  ih df 1  h 2 2 (1) = − ∇ u + V (r )u  f dt u  2m  Puisque le coté gauche de (1) ne dépend que de t et le coté droit que de r, les deux cotés doivent être égaux à la même constante de séparation que nous appellerons E (le lecteur ne doit pas s'inquiéter d'un risque de confusion avec l'énergie car ce choix n'est pas innocent comme nous allons le voir). Alors, l'équation pour f est facilement intégrée pour donner (2) f (t ) = Ce − iEt / h où C est une constante arbitraire et l'équation pour u devient  h2 2  (3) − ∇ + V (r )u (r ) = Eu (r )  2m  Puisque l'équation (3) est homogène en u, la constante C peut être choisie pour normaliser u. Alors une solution particulière de l'équation de Schrödinger est (4) ψ (r, t ) = u (r )e − iEt / h

Signification de la constante de séparation E L'opérateur dérivée du temps donnée comme une représentation de l'énergie peut être appliqué à ψ de l'équation (4) pour donner ∂ψ (5) ih = Eψ ∂t Une équation de ce type est appelée une équation aux valeurs propres. Une fonction ψ solution de cette équation est appelée une fonction propre ou un état propre de l'opérateur qui apparaît à gauche et la constante multiplicative E qui apparaît à droite est appelée valeur propre. Une fonction propre, comme la fonction ψ donnée par (4), est appelée un état stationnaire de la particule puisque ψ est constant dans le temps. Nous avions déjà vu auparavant de telles solutions stationnaires d'énergie bien définie dans certains cas particuliers, comme les particules libres. 2

L'équation (3) est aussi une équation aux valeurs propres. Elle dit que u (et donc aussi ψ ) est une

(

)

fonction propre de l'opérateur − h 2 / 2m ∇ 2 + V (r ) avec la même valeur propre E. On s'attend bien sûr à ce que ψ soit une fonction propre de cet opérateur si c'est une fonction propre de l'opérateur dérivée dans le temps puisque selon l'équation de Schrödinger les deux opérateurs sont équivalents non seulement pour des fonctions séparées de la forme (4) mais aussi pour des solutions plus générales. Nous allons anticiper un peu sur la discussion de la signification physique des fonctions propres et des valeurs propres que nous verrons bientôt et nous allons supposer que les valeurs propres E sont les seuls résultats possibles de mesures précises de l'énergie totale d'une particule. Il est alors intéressant de se demander si oui ou non des solutions physiques intéressantes u (r ) de l'équation (3) existent pour toute valeur réelle de E. Une réponse ne peut pas être obtenue sans avoir précisé la signification de "physiquement intéressantes" en fonction des conditions aux limites imposées à

u (r ) . Cette spécification et le caractère général des valeurs propres de l'énergie qui sont associées avec différents types de fonctions d'énergies potentielles V (r ) seront alors considérées. Conditions aux limites à grande distance Nous avons jusqu'ici rencontré essentiellement deux types de fonctions d'onde : les paquets d'ondes qui sont bien localisés et pour lesquels l'intégrale de normalisation ∫ ψ d 3 r converge et les ondes 2

harmoniques qui se propagent qui ont une grandeur constante à grande distance tel que l'intégrale de normalisation prise sur un volume infini diverge. La première classe peut être interprétée comme représentant des particules qui sont initialement bien localisées ou qui sont restreintes à une région particulière de l'espace par des forces extérieures dérivées d'une énergie potentielle V (r ) . La deuxième classe représente des particules qui ne sont ni localisées ni restreintes mais qui se propagent à travers la région considérée sur de grandes distances. De telles fonctions d'onde seront utiles pour décrire la diffusion de particules par un champ de force. Dans les deux cas, les fonctions d'onde sont bornées à grande distance dans toutes les directions. Une autre classe possible consiste en fonctions d'onde qui deviennent infinies à grande distance. Cependant, elles ne sont pas physiquement intéressantes puisque nous n'avons aucune raison d'être concerné par des particules dont la densité de probabilité de position devient arbitrairement grande dans les régions éloignées de l'espace. Normaliser une telle fonction nécessiterait de diviser la densité de probabilité par une grandeur infinie, puisque même pour une région de taille finie la fonction d'onde n'est pas bornée à grande distance, ce qui conduirait au résultat absurde que dans toute région on a une probabilité nulle de trouver la particule !

Conditions de continuité L'équation de Schrödinger indépendante du temps (3) est une équation différentielle linéaire du second ordre en r. Donc, tant que V (r ) est fini, qu'il soit ou non continu, une connaissance de la fonction d'onde et de son gradient le long d'une surface rend possible l'intégration de l'équation pour obtenir la fonction d'onde en tout point. Il est donc raisonnable d'exiger que la fonction d'onde et son gradient soit continu, fini et avec une seule valeur en tout point de l'espace afin qu'une situation physique définie puisse être représentée de manière unique par une fonction d'onde. Ces

exigences ont aussi la conséquence que la densité de probabilité de position P(r ) et la densité de courant de probabilité S(r ) soient finis et continus partout.

Conditions aux limites pour une énergie potentielle infinie Si V (r ) est infini quelque part, la condition aux limites appropriée peut être établie par un processus limite qui par de V fini et des conditions de continuité précédentes. Supposons, par exemple, qu'il y a une discontinuité infinie dans V à travers une surface continue, tel que l'énergie potentielle est finie d'un coté et + ∞ de l'autre, et nous voulons déterminer la condition aux limites sur u (r ) et ∇u à cette surface. Les propriétés essentielles du problème sont gardées si nous remplaçons la surface continue par le plan qui est tangent au point considéré et l'énergie potentielle changeant de manière continue d'un coté de la surface par un potentiel constant qui peut, sans perte de généralité, est choisi égal à zéro puisque tout changement constant dans V est équivalent à un changement identique dans E. Nous choisissons l'origine des coordonnées au point considéré et l'axe des x perpendiculaires au plan tangent. L'équation (3) se sépare alors dans les coordonnées spatiales et la dépendance de u en y et z n'est pas affectée par la discontinuité de V au plan x = 0. Nous voulons donc résoudre l'équation à une dimension h 2 d 2u (6) − + V ( x )u = Eu 2m dx 2 où V ( x ) = 0 pour x < 0, V ( x ) = V0 pour x > 0 et nous passerons ensuite à la limite V0 → +∞ . Si nous supposons que 0 ≤ E < V0 , les solutions générales de (6) sont 1

u ( x ) = A sin αx + B cos αx

x0

 2m(V0 − E )  2 β = +  h2  

La condition aux limites que u est borné à grande distance nécessite que nous posions D = 0. Ensuite, la continuité de u en x = 0 donne la relation B = C et la continuité de du / dx donne la relation αA = − βC . Puisque β devient infini quand V0 devient infini et que la solution pour x < 0 doit être finie, la deuxième relation montre que C tend vers zéro lorsque V0 → +∞ donnant donc aussi une valeur zéro pour B. A n'est pas déterminée à partir de ces relations mais peut être fixé par normalisation. Donc, la condition aux limites sur une surface où il y a un saut infini de potentiel est que la fonction d'onde y vaut zéro et la composante du gradient de la fonction d'onde normale à la surface n'est pas déterminée. L'hypothèse ci-dessus que E < V0 n'est évidemment pas une restriction puisque V0 tend vers l'infini. Pour E < 0, le sinus et le cosinus dans la solution pour x < 0 sont remplacés par des sinus et cosinus hyperboliques (ce qui est autorisé puisque la solution a seulement besoin d'être valide près de x = 0) sans changement sur le résultat final. On notera qu'à la fois P et S x s'annulent lorsque x → 0 pour les valeurs négatives de x et sont donc continues en x = 0 même si du / dx ne l'est pas. Une frontière de ce type représente un mur impénétrable et parfaitement rigide puisque dans la situation classique analogue, une particule de toute énergie fini aurait sa composante x de l'impulsion instantanément renversée au contact de la surface.

Valeurs propres de l'énergie à une dimension Les fonctions propres de l'énergie qui représentent des particules qui sont restreintes à une région particulière de l'espace par l'énergie potentielle (première classe) sont toujours caractérisées par des valeurs propres discrètes tandis que les fonctions propres qui ne s'annulent pas à grande distance (deuxième classe) possèdent un domaine continu de valeurs propres. Il peut sembler très surprenant qu'une équation différentielle n'impliquant que des fonctions continues aboutisse au final à des solutions discrètes. Cela peut être constaté qualitativement en considérant la nature des solutions de l'équation à une dimension (6).

Nous supposerons d'abord que V ( x ) devient égal à une certaine valeur constante qui peut être posée égale à zéro pour des valeurs négatives et positives de x suffisament grandes et que E < 0. Une particule classique avec cette énergie totale E ne peut pas s'évader à l'infini et ne peut en effet exister dans la région que si E est plus grand ou égal à la plus petite valeur Vmin de V ( x ) . La forme permise de la fonction d'onde pour x suffisament grand pour que V = 0 est évidemment e

−β x



β = +(− 2mE / h 2 )2 . Ces deux solutions pour de grand x positifs et négatifs peuvent être prolongées 1

jusqu'à un certain point intermédiaire, disons x = 0, en utilisant l'équation de Schrödinger et les conditions de continuité. A ce point, u peut toujours être rendu continu en choisissant les constantes multiplicatives arbitraires pour les solutions approchées de x positif et négatif. Alors un peu de réflexion montre que, pour une valeur arbitraire de E, elles ne se rencontreront pas avec la même valeur de du / dx . Il peut, cependant, y avoir des valeurs particulières de E pour lesquelles à la fois u et du / dx sont continues en x = 0. Les conditions pour cela peuvent être vues de la manière suivante.

(

)

Dans les régions où E < V ( x ) , d 2 u / dx 2 / u est positif et ainsi u est convexe vers l'axe des x. Donc, les deux solutions qui sont prolongées depuis ± ∞ ont des signes opposés pour leur rapport de pente à la valeur, (du / dx ) / u , aussi longtemps qu'elles sont dans les régions où E est inférieur à V. Cela est illustré dans la figure (b) ci-dessus pour le potentiel (a). Les deux choix de signe pour u sont montrés pour x < 0. Les points où E = V ( x ) sont des points d'inflexion (PE) ou "points de demi-tour" pour le mouvement classique puisqu'ils sont les limites du mouvement d'une particule classique d'énergie E où la particule fait demi-tour et renverse son mouvement. En ces points d 2 u / dx 2 = 0 et u a une courbure nulle. Clairement, ce qui est nécessaire pour que les deux solutions se rejoignent doucement est une région dans laquelle E > V ( x ) , afin que d 2 u / dx 2 / u soit négatif et que u soit concave vers l'axe des x. Cela permet au rapport des pentes aux valeurs de devenir égales. La figure (c) montre les deux solutions prolongées jusqu'à ce qu'elles se rencontrent, mais pour une valeur assez petite de E et lorsque les u sont identiques au même endroit x = 0, les pentes ne sont pas égales (courbes pleines) ou quand les pentes sont identiques en x = 0 les u ne sont pas égaux (courbe en tiret à gauche et pleine à droite). La figure (d) montre une valeur de E un peu plus grande et la figure E une valeur encore plus grande. Les valeurs de E et de Vmin sont indiquées sur l'axe des u et les points d'inflexion sont indiqués sur l'axe des x, dans les trois derniers cas.

(

)

Niveaux d'énergie discrets Nous voyons qu'une fonction propre qui satisfait les conditions aux limites et les conditions de continuité et qui représente une particule liée par l'énergie potentielle V ( x ) peut exister pour la valeur particulière de E illustrée dans la figure (d). En analogie avec la situation classique, une condition nécessaire pour qu'une telle fonction propre existe est que Vmin < 0 , auquel cas E est entre Vmin et 0. Comme dans le cas classique, cette condition est aussi suffisante à une dimension bien que ce ne soit pas le cas à trois dimensions.

Si le puits de potentiel illustré dans la figure (a) précédente est suffisament large ou profond, il peut exister une autre fonction propre correspondant à une valeur propre de l'énergie encore négative. Les figures (a), (b) et (c) ci-dessus montrent une série de fonctions d'onde analogues à celles montrées dans les figures (c), (d) et (e) précédentes pour des valeurs de E successivement croissantes (successivement moins négatives). Les deux signes de u sont montrés pour x < 0. Donc la figure (d) précédente et (b) ci-dessus montrent les fonctions propres pour les deux valeurs propres de l'énergie les plus basses ou niveaux d'énergie d'une particule liée par le potentiel V ( x ) . Il est facile de voir par un prolongement des arguments qualitatifs précédents que s'il y a des niveaux

d'énergie discrets plus élevés, chaque fonction d'onde a un nœud de plus que celle correspondant à la valeur propre plus basse suivante. Donc, pour une énergie potentielle qui approche une valeur constante finie lorsque x → ±∞ , il peut y avoir un nombre fini de niveaux d'énergie discrets ou, dans certains cas, un nombre infini (si V ( x ) diminue suffisament lentement pour de grands x ), selon V ( x ) et la masse de la particule.

Cependant, si V ( x ) → +∞ lorsque x → ±∞ , un argument comme celui donné ci-dessus montre qu'il y aura toujours un nombre infini de niveaux d'énergie discrets. En dehors de constantes multiplicatives arbitraires, il y aura une seule fonction propre u ( x ) pour chaque niveau.

Valeurs propres continues de l'énergie Il est possible de trouver des fonctions propres qui obéissent aux conditions aux limites et de continuité pour toutes les valeurs propres de l'énergie qui excède le plus petit des deux nombres V (+ ∞ ) et V (− ∞ ) . Si, par exemple, l'énergie potentielle a la forme illustrée plus haut, alors des solutions de l'équation de Schrödinger peuvent être trouvées pour toute valeur positive de E. Cela est dû aux solutions pour de grands x qui ont la forme 1

 2mE  2 (8) A sin α x + B cos α x α = + 2   h  et il n'y a aucune raison pour ne pas garder les deux termes. Donc il est toujours possible d'ajuster la phase de chacune des fonctions d'onde pour de grands x (ce qui est équivalent à ajuster le rapport A / B pour les solutions pour les grands x positifs et négatifs) de manière à ce qu'elles se rejoignent doucement quand elles sont prolongées en x = 0. Un exemple de ce type que nous avons déjà vu est l'électron diffusé par une impureté dans un cristal. Les termes classiques périodiques (ou avec périodicité multiple) et apériodique sont parfois utilisés pour désigner les mouvements des particules associés avec respectivement les valeurs propres discrètes et continues de l'énergie.

Valeurs propres discrètes et continues à trois dimensions Nous supposerons sans plus approfondir que tous les résultats précédents peuvent se généraliser naturellement à l'équation de Schrödinger à trois dimensions. Nous pouvons nous attendre à ce que, si V (r ) → +∞ lorsque r → ∞ dans toutes les directions, alors il y aura un ensemble infini de niveaux d'énergie discrets s'étendant jusqu'à + ∞ . Si V (r ) est borné lorsque r → ∞ dans une certaine direction, il y aura un nombre fini ou infini de niveaux d'énergie, selon la forme de V. Dans ce cas, les niveaux d'énergie ne peuvent pas excéder la plus petite valeur de V (∞ ) dans toute direction. Pour des valeurs de E plus grandes que ce plus petit V (∞ ) , les valeurs propres de l'énergie couvrent un domaine continu s'étendant jusque + ∞ .

II.4. Fonctions propres et valeurs propres L'interprétation physique de la fonction d'onde a été discutée précédemment. Elle se rattache essentiellement au calcul de valeurs moyennes des opérateurs qui représentent différentes quantités physiques. En plus, une densité de probabilité de position a été introduite. Nous sommes donc dans la position de calculer à partir de la fonction d'onde toute propriété qui dépend de la distribution spatiale d'une particule (par exemple, l'écart type de sa position par rapport à la moyenne) mais nous ne pouvons calculer que des valeurs moyennes pour les opérateurs autres que la position. Clairement, ce dont nous avons besoin pour boucler notre interprétation de la fonction d'onde est une méthode de calcul des fonctions de probabilité pour les opérateurs en général. Cela nous permettrait en plus d'obtenir des expressions pour les valeurs moyennes sans hypothèse séparée. Nous allons maintenant poser trois postulats physiques à partir desquels l'interprétation complète de la fonction d'onde peut être dérivée. L'interprétation présentée précédemment peut être vue comme un cas particulier du traitement plus général que nous allons voir.

II.5. Postulats d'interprétation et fonctions propres de l'énergie

Nous partons de la fonction d'onde ψ (r, t ) solution de l'équation de Schrödinger qui décrit le mouvement d'une particule de masse m avec une énergie potentielle V (r ) . A partir de cette fonction d'onde, nous voulons obtenir une description aussi complète que possible des propriétés du mouvement de la particule qui soit consistante avec la relation d'indétermination dont nous avons discuté.

Variables dynamiques comme opérateurs Nous postulons d'abord que chaque variable dynamique qui se rapporte au mouvement de la particule peut être représentée par un opérateur linéaire. Un opérateur Ω est linéaire s'il satisfait l'équation Ω(a1ψ 1 + a 2ψ 2 ) = a1Ωψ 1 + a 2 Ωψ 2 pour des nombres complexes a i et des fonctions ψ i arbitraires. L'opérateur peut être simplement un opérateur multiplication tel que r pour la position ou il peut être un opérateur différentiel tel que − ih∇ pour l'impulsion. A chaque opérateur peut être associé une équation linéaire aux valeurs propres. Donc, à l'opérateur Ω on peut associer l'équation (1) Ωv µ = ω µ v µ où v µ est la fonction propre de Ω correspondant à la valeur propre ω µ . Notre deuxième postulat est que les valeurs propres ω µ sont les seuls résultats possibles d'une mesure précise de la variable dynamique représentée par Ω . Cela implique que les valeurs propres de tout opérateur qui représente une quantité physique mesurable sont des nombres réels. L'ensemble des valeurs propres est aussi appelé le spectre de l'opérateur.

Développement en fonctions propres Nous supposons que toutes les fonctions propres de toute variable dynamique constitue un ensemble complet de fonctions dans le sens qu'une fonction continue arbitraire peut être développée en fonction de ces fonctions propres. C'est une hypothèse mathématique et non physique que nous analyserons plus loin en relation avec les fonctions propres de l'énergie et de l'impulsion. Supposons maintenant qu'une fonction d'onde particulière ψ est développée en terme des fonctions propres v µ de l'opérateur Ω . Nous adoptons l'interprétation statistique de ψ que nous avons vue selon laquelle il y a un grand nombre de régions identiques indépendantes de l'espace ou des intervalles de temps dans lesquels une particule est décrite par ψ . Nous faisons alors des mesures de la variable dynamique représentée par Ω sur chacune de ces particules. Notre troisième postulat physique est que le nombre de mesures qui donnent la valeur propre ω µ est proportionnel au carré de la grandeur du coefficient de v µ dans le développement de ψ . Ce postulat dû à Born nous permet d'associer une fonction de probabilité à chaque variable dynamique. Un corollaire est que nous sommes certains de mesurer une valeur propre particulière ω µ seulement quand la fonction d'onde qui décrit la particule est la fonction propre correspondante v µ . Plutôt que de développer les conséquences de ces postulats pour un opérateur arbitraire Ω , nous allons considérer ici l'énergie totale de la particule et l'impulsion. La plus part des résultats obtenus sont facilement généralisables aux autres opérateurs physiques.

Liens entre postulats et amplitudes Mais avant, revenons à notre approche à travers les amplitudes pour faire le lien avec les postulats qui viennent d'être posés. Il est facile de voir que ces postulats sont une conséquence des résultats que nous avions obtenus. Soit une particule passant à travers un processus physique déterminé Ω . L'amplitude pour passer d'un état à un autre en passant par ce processus est φ Ω ψ . Nous avions alors identifié un

ensemble d'états de base qui sont associés à ce processus (éventuellement un processus de mesure). Par exemple, le passage de la particule à travers des fentes ou la position de la particule autour d'un atome dans un cristal. Cet ensemble d'états de base peut être développé sur la base position et cela nous fournit immédiatement un ensemble complet de fonctions d'ondes associées aux états du processus. Par construction, les seuls états propres qui peuvent être mesurés sont ceux associés à ces états ou fonctions propres particulières. De plus, en développant un état ψ arbitraire sur cet ensemble d'états de base et avec l'interprétation probabiliste nous avons immédiatement le troisième postulat. Le lien entre valeurs propres et valeurs mesurées est moins immédiat. Nous avions déjà vu ce lien avec l'énergie et l'opérateur hamiltonien. Le premier postulat est simplement une généralisation à tout opérateur. C'est aussi une manière de définir les opérateurs associés aux quantités physiques.

L'opérateur énergie totale Selon la relation d'indétermination, une mesure précise de l'énergie totale ne peut pas être faite en une durée finie. Donc, si l'énergie totale a une valeur définie, il est essentiel que l'énergie potentielle V (r ) soit indépendante du temps. Alors l'opérateur − h 2 / 2m ∇ 2 + V (r ) est équivalent a l'opérateur énergie totale ih(∂ / ∂t ) . Il a les fonctions propres u (r ) qui n'ont pas besoin d'impliquer le temps. L'équation aux valeurs propre de l'énergie est  h2 2  (2) − ∇ + V (r )u E (r ) = Eu E (r )  2m 

(

)

où la fonction propre u E (r ) correspond à la valeur propre E et obéit aux conditions aux limites et de continuité.

Comme nous l'avons vu, les fonctions propres de l'énergie peuvent être divisées en deux classes : celles qui sont bien localisées et qui sont associées avec des valeurs propres discrètes et celles qui restent finies à grande distance et qui possèdent un domaine continu de valeurs propres.

Normalisation dans une boite Il est souvent souhaitable de traiter ces deux classes sur la même base. Cela peut être obtenu en enfermant la particule analysée dans une boite de volume arbitrairement grand mais fini. La situation physique la plus simple à laquelle cette approche est applicable est une où les murs de la boîte sont parfaitement rigides tel que la fonction d'onde s'y annule. Les discussions précédentes montrent alors que toutes les valeurs propres sont discrètes. Si la boite est grande par rapport aux dimensions physiques caractéristiques du problème, les valeurs propres qui étaient discrètes en l'absence de la boite sont pratiquement inaffectées puisque avant que les murs ne soient introduits, la fonction d'onde était extrêmement petite à cet endroit. De même, les valeurs propres qui étaient continues en l'absence de la boîte sont très peu espacées. Nous le verrons explicitement pour une particule libre. Il est plus pratique de supposer que la fonction d'onde obéit à des conditions aux limites périodiques sur les murs de la boite plutôt que de les annuler puisqu'il est alors possible d'avoir une description plus simple des fonctions propres du moment, comme nous le verrons. Nous choisissons la région finie comme un cube avec des cotés de longueur L centré sur l'origine et nous demandons que chaque fonction d'onde ait la même valeur pour les points correspondants sur les faces opposées du cube et la même dérivée normale au mur. Ces conditions aux limites rendent discrètes les valeurs propres continues puisque la phase de la fonction propre à grande distance n'est plus arbitraire. Comme avec la boite rigide, la présence des murs a un effet négligeable en dehors de légèrement discrétiser les valeurs propres continues et de fournir un volume fini dans lequel ces fonctions d'onde peuvent être normalisées. Nous continuerons à utiliser le mot "continu" pour décrire ces fonctions même quand la boite de normalisation est utilisée.

Orthonormalité des fonctions propres de l'énergie L'intégrale

∫ u (r ) E

2

d 3 r qui converge dans tous les cas pour les fonctions propres de l'ensemble

discret convergent pour toutes les fonctions propres quand elles sont normalisées dans la boite de volume fini L3 . Le coefficient de u E peut être choisi pour que cette intégrale soit égale à l'unité et les u E (r ) sont normalisés.

Nous allons maintenant montrer que les fonctions propres de deux valeurs propres différentes E et E' sont orthogonales, c'est-à-dire que l'intégrale du produit de l'une par le complexe conjugué de l'autre sur le domaine commun est zéro. Nous avions déjà eut l'occasion de voir cela sous la forme des amplitudes pour les états de l'hamiltonien. A partir de (2) nous avons que u E∗ ′ (r ) satisfait l'équation (où V est à nouveau supposé réel)  h2 2  (3) − ∇ + V (r )u E∗ ′ (r ) = E ′u E∗ ′ (r )  2m  En accord avec notre interprétation physique, nous avons supposé que E' est réel. Cela sera vérifié ci-dessous. Nous multiplions (2) par u E∗ ′ et (3) par u E et nous intégrons sur le volume L3 puis nous prenons la différence entre les deux équations résultantes. Les termes en V s'annulent et il reste h2 u E∗ ′ ∇ 2 u E − u E ∇ 2 u E∗ ′ d 3 r = (E − E ′)∫ u E∗ ′ u E d 3 r (4) − 2m ∫

(

)

L'intégrale du coté gauche de (4) peut être transformée par le théorème de Green en une intégrale de surface sur la surface A du cube : u E∗ ′ ∇ 2 u E − u E ∇ 2 u E∗ ′ d 3 r = ∫ ∇ ⋅ u E∗ ′ ∇u E − u E ∇u E∗ ′ d 3 r ∫ (5) = ∫ u E∗ ′ ∇u E − u E ∇u E∗ ′ n dA

(

A

(

) )

(

)

où l'indice n désigne la composante du vecteur dans la direction sortante normale à l'élément de surface dA. Puisque l'imposition des conditions aux limites périodiques donne à chaque fonction d'onde et sa dérivée normale les mêmes valeurs aux points correspondants des faces opposées du cube, la dérivée normale sortante a des signes opposés sur des faces opposées et l'intégrale de surface (5) s'annule. Alors, l'équation (4) nous dit que, si E ≠ E ′ , u E et u E ′ sont orthogonaux. Il est évident que cette démonstration d'orthogonalité peut être appliquée à un ensemble discret de fonctions propres même si la boite n'est pas introduite puisque les u s'annulent rapidement à grande distance et l'intégrale de surface, qui est alors une sphère de rayon infini, est zéro. L'ensemble continu de fonctions propres de l'énergie peut aussi être traité sans utiliser la normalisation dans une boite.

Une valeur propre de l'énergie E est dite dégénérée quand deux ou plusieurs fonctions propres linéairement indépendantes u1 , u 2 , … lui correspondent. Des combinaisons linéaires orthogonales de fonctions propres dégénérées peuvent être trouvées de plusieurs manières, comme nous l'avions déjà vu avec les états. Par exemple, u a = a1u1 + a 2 u 2 peut être rendu orthogonale à u1 en choisissant les coefficients constants a1 et a 2 tels que u1∗ u 2 d 3 r a1 ∫ (6) =− 2 a2 u1 d 3 r



Ce choix n'interfère pas avec la normalisation de u a et u a est encore une fonction propre de l'énergie avec la valeur propre E. Evidemment, le choix des combinaisons linéaires orthogonales n'est pas unique. En continuant cette procédure, toutes les fonctions propres de l'énergie peuvent être rendues orthogonales les unes aux autres même si certaines valeurs propres sont dégénérées. Un tel ensemble de fonctions propres, toutes normalisées et orthogonales les unes aux autres, est appelé un ensemble orthonormal de fonctions. Nous spécifions un ensemble orthonormal de fonctions propres de l'énergie non dégénérées par la relation (7) ∫ u E∗ ′ (r )u E (r )d 3 r = δ EE ′ où δ EE ′ est le symbole δ symétrique de Kronecker qui est égal à l'unité si E = E ′ et zéro autrement. S'il y a dégénérescence, (7) doit être remplacé par (8) ∫ u E∗ ′s′ (r )u Es (r )d 3 r = δ EE ′δ ss′ où l'indice s distingue les fonctions propres dégénérées orthogonales. Il est souvent pratique d'omettre explicitement la mention de s et d'utiliser (7) également pour les situations dégénérées, auquel cas l'indice s est implicite.

Réalité des valeurs propres de l'énergie Nous pouvons maintenant voir directement que E est un nombre réel, comme cela a été supposé. Multiplions (2) par u E∗ ′ (r ) et intégrons sur le volume L3 de la boite. Si u E est normalisé, le résultat est h2 2 u E∗ ∇ 2 u E d 3 r + ∫ V (r ) u E d 3 r (9) E = − ∫ 2m qui peut être exprimé en fonction des valeurs moyennes comme (1 / 2m ) p 2 + V . Le deuxième terme V est réel puisque son intégrand est réel. Le premier terme peut être montré explicitement comme étant réel en utilisant une intégration par partie : (10) − ∫ u E∗ ∇ 2 u E d 3 r = ∫ ∇u E∗ ⋅ (∇u E )d 3 r − ∫ u E∗ (∇u E )n dA

(

)

A

L'intégrale de volume à droite est manifestement réelle et l'intégrale de surface, comme dans (5), s'annule à cause des conditions aux limites périodiques sur les murs de la boite. Il est intéressant de noter que p 2 ne peut pas être négatif.

Développement en fonctions propres de l'énergie Comme mentionné au début de cette section, nous faisons l'hypothèse mathématique que l'ensemble des fonctions propres u E (r ) de l'opérateur énergie totale constitue un ensemble complet de fonctions dans le sens qu'une fonction continue arbitraire peut être développée en terme de ces fonctions. Alors, si nous avons une fonction d'onde quelconque ψ (r ) à un instant particulier du temps, normalisée dans la boite L3 et qui obéit aux conditions aux limites périodiques sur les mures, l'existence supposée du développement (11) ψ (r ) = ∑ AE u E (r ) E

rend possible de trouver des coefficients uniques AE qui ne dépendent pas de r.

Les coefficients dans le développement (11) peuvent être déterminés en multipliant les deux cotés par u E∗ ′ et en intégrant sur la boite. Nous supposons que l'ordre de la sommation et de l'intégrale peut être renversé. La propriété de permutation de l'ordre des sommations et des intégrales doit être en principe analysé séparément dans chaque cas. Les considérations mathématiques impliquées vont au-delà du but cherché ici et nous supposerons toujours qu'une telle permutation est autorisée dans les situations physiquement intéressantes. Nous obtenons alors (12) ∫ u E∗ ′ (r )ψ (r )d 3 r = ∑ AE ∫ u E∗ ′ (r )u E (r )d 3 r = ∑ AE δ EE ′ = AE ′ E

E

où l'on a utilisé (7) ou (8).

La propriété de fermeture La substitution de l'expression (12) pour AE dans (11) donne

[

]

(13) ψ (r ) = ∑ ∫ u E∗ (r ′)ψ (r ′)d 3 r ′ u E (r ) E

que nous réarrangeons pour donner   (14) ψ (r ) = ∫ψ (r ′)∑ u E∗ (r ′)u E (r ) d 3 r ′ E  Puisque ψ (r ) est une fonction continue arbitraire de r, l'équation (14) implique que la partie entre crochet de l'intégrand s'annule sauf si r' = r puisque autrement la valeur de ψ au point r donnée par (14) changerait quand les valeurs de ψ en d'autres points r ′ ≠ r seraient modifiées et cela serait contraire à l'hypothèse que ψ peut avoir une forme arbitraire. De plus, l'intégrale du terme entre crochet doit être l'unité quand le volume d'intégration inclut le point r' = r. Nous en concluons donc que

∑ u (r ′)u (r ) = 0 ∗ E

(15)

r′ ≠ r

E

E

∫ ∑ u (r )u (r )d ∗ E

3

E

r =1

E

si le volume d'intégration inclut le point r' = r. L'équation (15) décrit la propriété de fermeture de l'ensemble orthonormal de fonctions u E (r ) et dérivent directement de leur complétude exprimée par (11), que ce soit des fonctions propres de l'énergie ou pas.

Fonction de probabilité et valeur moyenne Les deuxièmes et troisièmes postulats présentés au début de cette section disent que les valeurs propres de l'énergie sont les seuls résultats possibles de mesures précises de l'énergie totale et que la probabilité de trouver une valeur E particulière quand la particule est décrite par la fonction 2 d'onde ψ (r ) est proportionnelle à AE . Il est facile de voir que le facteur de proportionnalité est l'unité car si nous posons la fonction de probabilité de l'énergie 2 (16) p (E ) = AE nous voyons que la somme des P(E ) donne l'unité

∑ P(E ) = ∑ ∫ u (r )ψ (r )d r ∫ u (r ′)ψ (r ′)d ∗ E

E



3

E

3

r′

E

  (17) = ∫∫ψ ′(r ′)ψ (r )∑ u E∗ (r )u E (r ′) d 3 rd 3 r ′ E  = ∫ ψ (r ) d 3 r = 1 2

puisque ψ est normalisé. Nous avons utilisé ici les équations (15). Nous pouvons aussi calculer la valeur moyenne de l'énergie à partir de la fonction de probabilité : (18) E = ∑ EP(E ) = ∑ ∫ Eu E∗ (r )ψ (r )d 3 r ∫ u E (r ′)ψ ∗ (r ′)d 3 r ′ E

E

Si nous remplaçons Eu E∗ (r ) par (2), la première intégrale de (18) peut être intégrée deux fois par partie comme suit :  h2 2  ∗ ∗ 3 3 ∫ Eu E (r )ψ (r )d r = ∫ψ (r )− 2m ∇ + V (r )u E (r )d r (19)  h2 2  = ∫ u E∗ (r )− ∇ + V (r )ψ (r )d 3 r  2m  Les deux intégrales de surface qui résultent des intégrations par partie s'annulent à cause des conditions aux limites périodiques sur u E et ψ . Donc, avec l'aide de (15), l'équation (18) devient

 h2 2  E = ∑ ∫ u (r )− ∇ + V (r )ψ (r )d 3 r ∫ u E (r ′)ψ ∗ (r ′)d 3 r E  2m  2  h    (20) = ∫∫ψ ∗ (r ′)− ∇ 2 + V (r )ψ (r )∑ u E∗ (r )u E (r ′) d 3 rd 3 r ′     2m  E  h2 2  = ∫ψ ∗ (r )− ∇ + V (r )ψ (r )d 3 r  2m  ∗ E

Le résultat obtenu dans (20) confirme l'hypothèse faites plus tôt que la valeur moyenne d'un opérateur doit être calculée en insérant l'opérateur entre ψ ∗ (r ) et ψ (r ) pour qu'il opère seulement sur ce dernier et ensuite en intégrant sur r.

Solution générale de l'équation de Schrödinger Si l'énergie potentielle V (r ) est indépendante de t et que nous connaissons la solution de l'équation de Schrödinger à un instant particulier, nous pouvons écrire une expression formelle pour la solution à tout instant. Nous développons ψ (r, t ) en fonctions propres de l'énergie au temps t, auquel cas les coefficients de développement dépendent du temps (21) ψ (r, t ) = ∑ AE (t )u E (r ) AE (t ) = ∫ u E∗ (r )ψ (r, t )d 3 r E

En substituant l'équation (21) dans l'équation de Schrödinger, on a d (22) ih ∑ u E (r ) AE (t ) = ∑ AE (t )Eu E (r ) dt E E A cause de l'orthonormalité des u E , l'équation (22) est équivalente à d (23) ih AE (t ) = EAE (t ) dt qui peut directement être intégré pour donner − iE (t −t 0 ) / h (24) AE (t ) = AE (t 0 )e Notons que P(E ) = AE (t ) : AE (t 0 ) est constant dans le temps. 2

2

Donc, si ψ (r, t ) est connu au temps t = t 0 , la solution à tout instant t est donnée par (21) et (24) : − iE (t −t 0 ) / h ψ (r, t ) = ∑ AE (t 0 )e u E (r ) E (25) AE (t 0 ) = ∫ u E∗ (r ′)ψ (r ′, t 0 )d 3 r ′ ou

 − iE (t −t 0 ) / h  3 (26) ψ (r, t ) = ∫ ∑ u E∗ (r ′)u E (r )e ψ (r ′, t 0 )d r ′ E  La solution (25) est une combinaison linéaire des fonctions propres de l'énergie.

II.6. Fonctions propres de l'impulsion Les fonctions propres de l'opérateur impulsion linéaire − ih∇ fournissent un deuxième exemple instructif de l'application des idées générales développées au début de la section précédente. Elles sont aussi d'une utilité considérable pour résoudre des problèmes physiquement intéressant. Ce sera aussi un approfondissement de l'analyse des fonctions propres de l'impulsion que nous avions déjà vue dans la section II.1.2.3.

Forme des fonctions propres Les fonctions propres de l'impulsion sont solutions des trois équations aux valeurs propres (1) − ih∇u p (r ) = pu p (r ) ou ∂ − ih u p (r ) = p x u p (r ) ∂x ∂ (2) − ih u p (r ) = p y u p (r ) ∂y ∂ − ih u p (r ) = p z u p (r ) ∂z Elles ont la forme i (p ⋅ r ) (3) u p (r ) = C exp h où C est une constante de normalisation. Il est utile de passer du vecteur impulsion p au vecteur de propagation k = p / h et de réécrire les fonctions propres de l'impulsion (4) u k (r ) = C exp(ik ⋅ r ) Ce sont des fonctions propres de l'opérateur impulsion avec les valeurs propres hk .

Normalisation dans une boîte Comme avec les fonctions propres de l'énergie, nous pouvons restreindre le domaine des u k (r ) à une boîte cubique arbitrairement grande mais finie de volume L3 centrée à l'origine et sur les murs de laquelle les fonctions obéissent à des conditions aux limites périodiques. Alors u k est normalisé −

3

si C = L 2 . De plus, k n'est plus un vecteur réel arbitraire. Ses composantes sont restreintes aux valeurs 2πn y 2πn x 2πn z (5) k x = kz = ky = L L L où n x , n y et n z sont des entiers positifs, négatifs ou nuls. L'espacement des vecteurs k voisins et de leurs valeurs propres h 2 k 2 / 2m peut être rendu aussi petit que souhaité en prenant L suffisament grand. Il est toujours supposé que la limite L → ∞ est prise à la fin des calculs. Il est intéressant de noter que les fonctions propres de l'impulsion (4) ne peuvent pas exister dans une boîte qui a des murs parfaitement rigides car ces fonctions propres ne s'annulent nul part. C'est analogue à la situation classique où l'impulsion d'une particule qui est reflété par un mur rigide n'est pas conservée. D'un autre coté, la boîte cubique avec des conditions aux limites périodiques est équivalente à une situation dans laquelle l'espace entier est divisé en cubes adjacents et toutes les fonctions d'onde sont périodiques à travers tout l'espace avec la période L le long des trois axes. Si la périodicité de l'espace est transposée à la situation classique analogue, une particule passant à travers un mur serait équivalente à une qui frappe ce mur et apparaît au point correspondant du mur opposé avec son vecteur impulsion inchangé. L'orthonormalité des fonctions propres de l'impulsion −

3 2

(6) u k (r ) = L exp(ik ⋅ r ) est facilement établie. En intégrant sur le volume L3

∫ u (r )u (r )d ∗ l

(7)

1 L3

k

1 L 2 1 − L 2



3

r= 1

e i (k x −l x )x dx ∫ 21 e L

− L 2

(

)

i k y −l y y

1

dy ∫ 21 e i (k z −lz )z dz L

− L 2

= δ k xlx δ k y l y δ k z l z ≡ δ kl où nous avons utilisé (5). L'orthogonalité pourrait aussi être montrée par la méthode plus générale utilisé pour les fonctions propres de l'énergie.

Normalisation avec la fonction de Dirac On a dit dans la section précédente que les ensembles continus de fonctions propres peuvent être manipulés sans introduire la boîte avec les conditions aux limites périodiques (ce qui a l'effet de rendre l'ensemble discret avec un espacement des valeurs propres arbitrairement petit). En utilisant la fonction de Dirac, on a par exemple pour la fermeture des fonctions propres de l'énergie : (8) ∑ u E∗ (r ′)u E (r ) = δ ( x − x ′)δ ( y − y ′)δ ( z − z ′) ≡ δ 3 (r − r ′) E

La comparaison avec l'orthonormalité montre que la propriété de fermeture est une sorte d'orthonormalité des fonctions propres par rapport à la sommation sur les valeurs propres. On peut aussi l'appliquer à la normalisation (7) où nous n'imposons maintenant pas de boîte de normalisation et nous permettons aux fonctions propres de l'impulsion d'avoir la forme (4) sur tout l'espace avec tout vecteur réel k. L'intégrale ∫ u l∗ (r )u k (r )d 3 r est le produit de trois intégrales qui peuvent être exprimées avec l'aide de la fonction de Dirac. En utilisant la représentation de cette fonction à l'aide d'un sinus, on a :





e

(

)

i k x −l x x

−∞

g

dx = lim ∫ e

(

)

i k x −l x x

g →∞ − g

dx

2 sin g (k x − l x ) g →∞ k x − lx

(9) = lim

= 2πδ (k x − l x )

Donc, les fonctions propres du moment dans un espace infini peuvent être écrites (10) u k (r ) = (8π 3 ) 2 exp(ik ⋅ r ) et la relation d'orthonormalité devient (11) ∫ u ∗j (r )u k (r )d 3 r = δ (k x − l x )δ (k y − l y )δ (k z − l z ) ≡ δ 3 (k − l ) −

1

Nous aurons l'occasion de voir que dans un problème typique, la normalisation des fonctions propres de l'impulsion par une boîte ou par fonction Delta donne le même résultat final.

Fermeture La propriété de fermeture des fonctions propres de l'impulsion, avec la normalisation dans une boîte ou avec les fonctions Delta, peut être établie sans l'aide de l'hypothèse de complétude qui a été faites dans la section précédente pour les fonctions propre de l'énergie. Avec la normalisation dans une boîte, l'expression analogue, l'expression analogue au coté gauche de (8) est (12)

∑ uk∗ (r ′)u k (r ) = L−3 k





∑ ∑



∑e

2πu  n x ( x − x′ )+ n y ( y − y ′ )+ n z ( z − z ′ ) / L  

n x = −∞ n y = −∞ n z = −∞

On l'évalue facilement à la limite des grands L auquel cas le contenu de la sommation change d'une quantité négligeable lorsque chaque n change d'une unité. Nous pouvons alors voir n x comme une ∞

variable continue et remplacer



n x = −∞

par





−∞



dn x = (L / 2π )∫ dk x . Nous obtenons alors −∞

∑ u (r′)u (r ) → (8π ) ∫ ∫ ∫ (13) ∗ k

k

∞ 3 −1

k

L →∞





−∞ − ∞ − ∞

e

[

] dk x dk y dk z

i k x ( x − x′ )+ k y ( y − y ′ )+ k z ( z − z ′ )

= δ ( x − x′)δ ( y − y′)δ ( z − z ′) = δ 3 (r − r′) où nous avons utilisé (9). Un calcul similaire peut être effectué, en utilisant la normalisation par la fonction de Dirac, auquel cas nous obtenons de (10) et (9) (14) ∫ u k∗ (r ′)u k (r )d 3 k = ∫∫∫ u k∗ (r ′)u k (r )dk x dk y dk z = δ 3 (r − r ′) La relation de fermeture (13) ou (14) montre que les fonctions propres de l'impulsion sont orthonormales par rapport à la sommation ou l'intégration sur les valeurs propres k aussi bien que par rapport à l'intégration sur le vecteur position r.

Développement en fonctions propres de l'impulsion Une fonction continue arbitraire ψ (r ) peut être écrite en utilisant la fonction Delta comme

(15) ψ (r ) = ∫ψ (r ′)δ 3 (r − r ′)d 3 r ′

Si nous substituons le coté gauche de (13) à la place de la fonction Delta dans (16), nous obtenons ψ (r ) = ∫ψ (r ′)∑ u k∗ (r ′)u k (r )d 3 r ′ = ∑ Ak u k (r ) k k (16) ∗ 3 Ak = ∫ u k (r ′)ψ (r ′)d r ′ De même, si nous substituons à la fonction Delta l'expression (14), nous obtenons (17) ψ (r ) = ∫ψ (r ′)∫ u k∗ (r ′)u k (r )d 3 kd 3 r = ∫ Ak u k (r )d 3 k avec la même expression pour Ak . Les équations (16) et (17) montrent qu'il est possible de développer une fonction arbitraire en fonctions propres du moment qu'elles soient normalisées dans une boîte ou au moyen de la fonction de Dirac.

Notons que ces résultats, bien qu'établis ici avec assez peu de rigueur, sont équivalents aux théorèmes mathématiques de développement des fonctions en séries de Fourier et en intégrales de Fourier.

Fonction de probabilité et valeur moyenne La fonction de probabilité impulsion associée avec une fonction d'onde normalisée ψ (r ) est 2

proportionnelle à Ak . Le facteur de proportionnalité est l'unité car si nous posons (18) P(k ) = Ak il est facile de montrer en analogie avec le cas de l'énergie que (19) ∑ P(k ) = 1 et ∫ P(k )d 3 k = 1 2

k

pour, respectivement, la normalisation dans une boîte et avec la fonction de Dirac. La valeur moyenne de l'impulsion quand une normalisation dans une boîte est utilisée est (20) p = h ∑ kP(k ) = h ∑ ∫ ku k∗ (r )ψ (r )d 3 r ∫ u k (r ′)ψ ∗ (r ′)d 3 r ′ k

k

A partir du conjugué complexe de (4), nous pouvons remplacer ku k∗ (r ) par i∇u k∗ (r ) . Alors, la première intégrale dans (20) peut être intégrée par partie et l'intégrale de surface s'annule à cause des conditions aux limites périodiques sur ψ et u k∗ . Donc, avec l'aide de (13), l'équation (20) devient p = −ih ∑ ∫ u k∗ (r )∇ψ (r )d 3 r ∫ u k (r ′)ψ ∗ (r ′)d 3 r ′ k

(21) = −ih ∫∫ψ (r ′)[∇ψ (r )]δ 3 (r − r ′)d 3 rd 3 r ′ ∗

= −ih ∫ψ ∗ (r )∇ψ (r )d 3 r Ceci est en accord avec ce que nous avions déjà postulé.

Quand la normalisation par fonction Delta est utilisée, les détails du calcul sont très similaires à ceux donnés ci-dessus excepté que l'intégrale de surface qui résulte de l'intégration partielle est sur une sphère de rayon infini. Elle est nulle car ψ devient infiniment petit à grand distance. Ceci est consistant avec l'hypothèse que ψ est normalisé, autrement, ni

∫ P(k )d

3

k ni p n'auraient de

signification physique. Le résultat du calcul dans ce cas est le même que l'équation (21).

III. Applications III.1. Puits de potentiel carré à une dimension Après toute cette théorie, passons maintenant à quelques exemples. Comme exemple explicite simple du calcul des niveaux d'énergie discret d'une particule en mécanique quantique, considérons le mouvement à une dimension d'une particule qui est restreinte par des murs réflecteurs qui terminent une région d'énergie potentielle constante. Deux types simples d'énergie potentielle sont considérés.

La figure (a) ci-dessus montre une situation où V ( x ) = 0 pour − a < x < a et V ( x ) = +∞ pour

x > a , correspondant à des murs parfaitement rigides, impénétrables aux points x = ± a . Dans la

figure (b) l'accroissement de l'énergie potentiel aux murs est abrupt mais fini, tel que V ( x ) = V0

pour x > a . A cause de son apparence, il est souvent appelé un puits carré de potentiel. Le mouvement d'une particule classique avec une énergie totale E inférieure à V0 est le même pour ces deux potentiels mais, comme nous le verrons, le comportement quantique est différent. En général, un accroissement abrupt mais fini d'énergie potentielle aux limites d'une région force une particule vers l'intérieur de la région. Un tel potentiel peut être vu comme un cas limite d'un potentiel plus réaliste comme celui étudié dans la discrétisation des niveaux d'énergie et où la force − dV / dx est toujours dirigée vers x = 0. La force associée à un puits de potentiel carré est nulle excepté aux frontières, ainsi la particule ne subit aucune force excepté une soudaine impulsion dirigée vers l'origine lorsqu'elle passe les points x = ± a .

Murs parfaitement rigides Nous avons vu que la fonction d'onde doit s'annuler aux points x = ± a , quand l'énergie potentielle a la forme montrée dans (a). L'équation de Schrödinger pour x < a est simplement h 2 d 2u = Eu 2m dx 2 qui a les solutions générales

(1) −

1

(2) u ( x ) = A sin αx + B cos αx

 2mE  2 α = + 2   h 

L'application des conditions aux limites en x = ± a donne A sin αa + B cos αa = 0 (3) − A sin αa + B cos αa = 0 d'où nous obtenons (4) A sin αa = 0 B cos αa = 0 Nous ne voulons pas que A et B soient tous les deux zéros car cela donnerait la solution physiquement sans intérêt u = 0 partout. De même, nous ne pouvons pas avoir à la fois sin αa et cos αa égaux à zéro pour une valeur donnée de α ou E. Il y a donc deux classes possibles de solutions. Pour la première classe

(5) A = 0 et cos αa = 0 et pour la deuxième classe (6) B = 0 et sin αa = 0 Donc, αa = nπ / 2 , où n est un entier impair pour la première classe et un entier pair pour la deuxième classe. Les deux classes de solutions et leurs valeurs propres de l'énergie sont alors nπ x (7) u ( x ) = B cos n impair 2a nπx (8) u ( x ) = A sin n pair 2a π 2h 2n 2 (9) E = dans les deux cas 8ma 2 Il est évident que n = 0 donne le résultat physiquement sans intérêt u = 0 et que les solutions pour des valeurs négatives de n ne sont pas linéairement indépendantes de celles pour n positif. Les constantes A et B peuvent être facilement choisies dans chaque cas pour que les fonctions propres u ( x ) soient normalisées. Il y a donc une séquence infinie d'énergies discrètes qui correspondent à toutes les valeurs entières positives du nombre quantique n. Il y a juste une fonction propre pour chaque niveau et le nombre de nœuds de la nième fonction qui est dans le puits de potentiel est n - 1. Ces résultats sont en accord avec la discussion que nous avons eut sur les solutions générales. Il est intéressant de noter que l'ordre de grandeur du niveau d'énergie le plus bas ou état de base est en accord avec le principe d'indétermination. L'incertitude de la position de l'ordre de a implique une incertitude sur le moment au moins de l'ordre de h / a qui, en retour, implique une énergie cinétique minimale de l'ordre de h 2 / ma 2 .

Echelon de potentiel fini Quand l'énergie potentielle a la forme (b), il est nécessaire de compléter la solution générale (2), qui est encore valide pour x < a puisque l'équation (1) est inchangée, par une solution pour x > a . L'équation de Schrödinger dans cette région est h 2 d 2u (10) − + V0 u = Eu 2m dx 2 qui a la solution générale pour E < V0 (états liés) 1

(11) u ( x ) = Ce − β x + De β x

 2m(V0 − E )  2 β = +  h2  

Les conditions aux limites en x = ±∞ nécessitent que nous posions D = 0 si (11) représente la solution pour x > a et C = 0 si c'est la solution pour x < -a. Nous imposons maintenant sur les solutions (2) et (11) les exigences que u et du / dx soient continus en x = ± a . A sin α a + B cos α a = Ce − β a (12)

α A cos α a − α B sin α a = − βCe − β a − A sin α a + B cos α a = De − β a

α A cos α a + α B sin α a = βDe − β a d'où nous tirons (13) 2 A sin α a = (C − D )e − β a

(14) 2 B cos α a = (C + D )e − β a

2α A cos α a = − β (C − D )e − β a 2α B sin α a = β (C + D )e − β a

A moins que A = 0 et C = D, les équations (13) ont comme conséquence (15) α cot α a = − β De même, à moins que B = 0 et C = -D, les équations (14) donnent

(16) α tan α a = β Il est impossible pour les équations (15) et (16) d'être valides en même temps puisqu'en éliminant β il faudrait que tan 2 α a = −1 ce qui donnerait un α imaginaire et un β négatif, contrairement à (11). De même, nous ne souhaitons pas que A, B, C et D s'annulent tous. Donc, les solutions peuvent nouveau être divisées en deux classes. Pour la première classe (17) A = 0 C=D α tan α a = β et pour la deuxième classe (18) B = 0 C = −D α cot α a = − β

Niveaux d'énergie Les niveaux d'énergie sont trouvés par une solution numérique ou graphique des équations (15) et (16) avec les définitions de α et β donnés par (2) et (11). Une simple méthode graphique pour trouver ces solutions est décrite ici, puisqu'elle montre assez clairement la manière avec laquelle le nombre de niveaux discrets dépend de V0 et a. Nous posons ξ = α a et η = β a . Donc, l'équation (16) devient ξ tan ξ = η avec (19) ξ 2 + η 2 =

2mV0 a 2 h2

Puisque ξ et η sont restreint à des valeurs positives, les niveaux d'énergie peuvent être trouvés dans ce cas à partir des intersections dans le premier quadrant de la courbe ξ tan ξ avec le cercle de

(

)

1

rayon connu 2mV0 a 2 / h 2 2 . La construction est tracée ci-dessus pour trois valeurs de V0 a 2 . Pour chacune des deux plus petites de ces valeurs il y a une solution à l'équation (16) et pour la plus grande, il y en a deux.

La figure ci-dessus est une construction similaire pour la solution de (15) dans laquelle les niveaux d'énergie sont obtenus à partir des intersections des même cercles avec la courbe − ξ cot ξ dans le premier quadrant. La plus petite valeur de V0 a 2 ne donne aucune solution et les deux plus grandes en donnent une. Donc les trois valeurs croissantes de V0 a 2 donnent respectivement une, deux et trois niveaux d'énergie. Il est clair à partir de ces figures que pour une particule de masse donnée, les niveaux d'énergie dépendent du paramètre de l'énergie potentielle à travers la combinaison V0 a 2 . Pour V0 a 2 entre zéro et π 2 h 2 / 8m , il y a seulement un niveau d'énergie de la première classe. Pour V0 a 2 entre

π 2 h 2 / 8m et quatre fois cette valeur, il y a un niveau d'énergie de chaque classe. Lorsque V0 a 2 croit, des niveaux d'énergie apparaissent successivement dans les premières et deuxièmes classes. Il

n'est pas difficile de voir à partir de (11) que lorsqu'elles sont ordonnées avec des valeurs propres croissantes, la nième fonction propre a n - 1 nœuds.

Parité Il suit de la discussion précédente que les fonctions propres de la première classe sont paires par rapport au changement de signe de x ( u (− x ) = u ( x ) ) tandis que les fonctions propres de la deuxième classe sont impaires ( u (− x ) = −u ( x ) ). Cette division des fonctions propres en types pairs et impairs n'est pas accidentelle et nous allons montrer maintenant que c'est une conséquence directe du fait que la fonction énergie potentielle V ( x ) est symétrique par rapport à x = 0. Si nous changeons le signe de x dans l'équation de Schrödinger : h 2 d 2u + V ( x )u ( x ) = Eu ( x ) (20) − 2m dx 2 et si V (− x ) = V ( x ) , nous obtenons (21) −

h 2 d 2 u (− x ) + V ( x )u (− x ) = Eu (− x ) 2m dx 2

Donc, u ( x ) et u (− x ) sont solutions de la même équation avec la même valeur propre R. Supposons d'abord qu'il y a seulement une fonction propre linéairement indépendante qui correspond à ce niveau d'énergie. Alors u ( x ) et u (− x ) peuvent différer seulement par une constante multiplicative : (22) u (− x ) = εu ( x ) Changer le signe de x dans (22) donne u ( x ) = εu (− x ) . A partir de ces deux équations, il s'ensuit que (23) ε 2 = 1 ou ε = ±1 Donc, de telles fonctions propres d'un potentiel symétrique sont ou paires ou impaires par rapport au changement de signe de x. De telles fonctions sont dites avoir une parité paire ou impaire.

Si une valeur propre a plus d'une fonction propre linéairement indépendante, l'argument précédent échoue et ces fonctions propres n'ont pas nécessairement une parité définie. Elles n'ont pas besoin d'être paires ou impaires. Cependant, nous pouvons facilement voir que des combinaisons linéaires de telles fonctions propres peuvent être trouvées de telles manières que chacune a une parité paire ou impaire. Supposons qu'une fonction propre u ( x ) n'a pas de parité définie. On peut toujours écrire (24) u ( x ) = u p ( x ) + u i ( x )

où u p ( x ) = 12 [u ( x ) + u (− x )] est pair, u i ( x ) = 12 [u ( x ) − u (− x )] est impair et u p et u i sont linéairement dépendant. Alors, si l'équation (20) est symétrique, nous pouvons l'écrire comme 2 h2 d u p h 2 d 2ui ( ) (25) − + V − E u − + (V − E )u i = 0 p 2m dx 2 2m dx 2 En changeant le signe de x dans (25), on obtient 2 h2 d u p h 2 d 2ui ( ) (26) − + V − E u + − (V − E )u i = 0 p 2m dx 2 2m dx 2 L'addition et la soustraction de (25) et (26) montre que u p et u i sont séparément des solutions de l'équation de Schrödinger avec la même valeur propre E.

Une solution simplifiée Savoir que les solutions possèdent une parité définie simplifie quelque fois la détermination des niveaux d'énergie puisque nous avons alors seulement besoin de trouver la solution pour x positif. Les solutions paires ont une pente nulle et les solutions impaires ont une valeur zéro en x = 0. Si, par exemple, nous voulons trouver les solutions paires, les équations (2) et (11) peuvent être remplacées par u ( x ) = B cos αx 0< xa

Au lieu de rendre u et du / dx continus en x = a, il est suffisant de rendre le rapport (1 / u )(du / dx ) continu en x = a puisque les constantes de normalisation B et C sont ainsi éliminées. Cela donne directement l'équation (16). De même, les solutions impaires sont u ( x ) = A sin αx 0> 1, nous pouvons utiliser la formule de Stirling pour maximiser ln An . En négligeant les termes d'ordre ln n et inférieurs

1   1 ln An ≈ n ln ξ 0 − ln 2  − n(ln n − 1) 2   2 (41) 2 1 Ka n0 ≈ ξ 02 = 2 2hω c 1  Donc le niveau d'énergie E n0 =  n0 + hω c dont l'essentiel du voisinage contribue à ψ est 2  1 approximativement égal à l'énergie 2 Ka 2 de l'oscillateur classique qui a la même amplitude.

IV.2. Potentiels à symétrie sphérique à trois dimensions Il est généralement impossible d'obtenir des solutions analytiques à l'équation de Schrödinger à trois dimensions à moins qu'elle puisse être séparée en équations différentielles pour chacune des trois coordonnées spatiales. On a pu montrer qu'il y a onze systèmes de coordonnées dans lesquels l'équation de Schrödinger pour la particule libre (avec V = 0) peut être séparée. Un des plus importants est le système de coordonnées sphériques en fonction duquel les coordonnées rectangulaires sont données par x = r sin θ cos φ (1) y = r sin θ sin φ z = r cosθ

Si l'énergie potentielle est à symétrie sphérique, tel que V (r ) = V (r ) est seulement fonction de la grandeur r de r mesurée à partir d'une certaine origine, l'équation de Schrödinger peut toujours être

séparée en coordonnées sphériques. Plusieurs problèmes physiquement intéressant peuvent être représentés exactement ou approximativement en fonction de potentiels à symétrie sphérique de différentes formes. Dans cette section, nous allons effectuer la séparation et résoudre les équations différentielles en θ et φ . Nous traiterons de la solution radiale pour des formes particulière de V (r ) dans la section suivante ainsi que lorsque nous résoudrons le cas de l'atome d'hydrogène.

Séparation de l'équation de Schrödinger L'équation de Schrödinger avec une énergie potentielle à symétrie sphérique peut être écrite en coordonnées sphériques : h2  1 ∂  2 ∂  1 ∂  ∂  1 ∂2  θ r + sin + (2) −      u + V (r )u = Eu 2m  r 2 ∂r  ∂r  r 2 sin θ ∂θ  ∂θ  r 2 sin 2 θ ∂φ 2  Nous séparons d'abord les parties radiales et les parties angulaires en substituant (3) u (r ,θ , φ ) = R(r )Y (θ , φ ) dans (2) et en divisant par u 1 d  2 dR  2mr 2 1 1 ∂  1 ∂ 2Y  ∂Y  (4) r  + 2 [E − V (r )] = −   sin θ +  R dr  dr  Y  sin θ ∂θ  ∂θ  sin 2 θ ∂φ 2  h Puisque le coté gauche de l'équation (4) dépend seulement de r et le coté droit dépend seulement de θ et φ , les deux cotés doivent être égaux à une constante que nous appelons λ . Donc, (5) nous donne une équation radiale 1 d  2 dR   2m λ (5) 2 r  +  2 [E − V (r )] − 2  R = 0 r dr  dr   h r  et une équation angulaire 1 ∂  ∂Y  1 ∂ 2Y (6) + λY = 0  sin θ + sin θ ∂θ  ∂θ  sin 2 θ ∂φ 2 L'équation angulaire (6) peut être encore séparée en substituant Y (θ , φ ) = Θ(θ )Φ(φ ) dedans et en suivant la même procédure pour obtenir

d 2Φ + νΦ = 0 dφ 2 dΘ   1 d  ν  (8)  sin θ  + λ − Θ = 0 dθ   sin θ dθ  sin 2 θ 

(7)

L'équation en φ (7) peut être résolue directement. Sa solution générale peut être écrite 1 iν φ 2

1 − iν φ 2

+ Be (9) Φ(φ ) = Ae Φ(φ ) = A + Bφ ν =0

ν ≠0

L'exigence que Φ(φ ) et dΦ (φ ) / dφ soient continus dans tout le domaine 0 à 2π de φ implique que ν soit choisi égal au carré d'un entier. Nous remplaçons donc (9) par (10) Φ(φ ) = (2π ) 2 e imφ où maintenant toutes les solutions physiquement significatives sont inclues si m peut être un entier −

1

positif, négatif ou nul. La constante multiplicative est choisie égale à (2π ) normalisé à l'unité sur le domaine de φ .



1 2

afin que Φ soit

Notons que la constante m ne doit pas être confondue avec la masse de la particule. Il y a un léger risque de confusion que nous regrettons mais l'usage veut que le nombre quantique associé à la composante φ soit noté m (qui est l'abréviation de "magnétique" pour des raisons qui apparaîtront plus tard).

Polynômes de Legendre A moins que V (r ) soit spécifié, le plus loin où nous pouvons aller dans notre traitement est de résoudre l'équation θ (8) où maintenant ν = m 2 . Il est pratique de substituer w = cosθ à θ et de poser (11) Θ(θ ) = P(ω )

Alors (8) devient  d  m2  2 dP   P = 0 (12) 1 − w + λ − dw  dw   1 − w 2 

(

)

Puisque le domaine de θ est de 0 à π , le domaine de w est de 1 à -1. La procédure pour résoudre l'équation (12) est en plusieurs points similaires à la solution de l'équation de Schrödinger de l'oscillateur harmonique que nous avons présenté dans la section précédente et nous ne donnerons donc pas tous les détails. Puisque (12) est une équation différentielle du second ordre, elle a deux solutions linéairement indépendantes. Excepté pour des valeurs particulières de λ , les deux sont infinies en w = ±1 et ne sont pas physiquement acceptables. Si, cependant, λ = l (l + 1) , où l est un entier positif ou nul, une des solutions est finie en w = ±1 (l'autre ne l'est pas). Cette solution finie a

(

la forme 1 − w 2

)

1 m 2

fois un polynôme d'ordre l − m en w et a la parité de l − m .

Les solutions physiquement acceptables de (12) quand m = 0 sont appelées polynômes de Legendre Pl (w) . Tout comme dans le cas des polynômes de Hermite, leurs propriétés peuvent être discutées en terme d'une fonction génératrice

(

T (w, s ) = 1 − 2 sw + s 2 (13)



= ∑ Pl (w)s l

)



1 2

s 0. Dans ce cas, les fonctions propres dégénérées ont toutes la même parité que nous allons montrer être la parité de l. Quand r est renversé par rapport à l'origine, la partie radiale R(r ) de la solution est inchangée, la partie Φ(φ ) donnée par (10) a la parité de m

(

et la partie Pl m (cosθ ) a la parité de l − m puisque Pl m (w) est égal à une partie paire 1 − w 2

)

1 m 2

fois un polynôme en w qui a la parité l − m par rapport au changement de signe de w ou de cosθ .

Donc, Ylm (θ , φ ) et donc u (r ) a la parité de l.

Moment angulaire L'équation de Schrödinger radiale (5) peut être récrite sous une forme qui ressemble à l'équation de Schrödinger à une dimension. Si nous posons R(r ) = χ (r ) / r , l'équation pour la fonction d'onde radiale modifiée χ peut être écrite

h2 d 2χ  l (l + 1)h 2  (22) − + V (r ) +  χ = Eχ 2m dr 2  2mr 2 

Donc, le mouvement radial est similaire au mouvement à une dimension d'une particule dans un potentiel l (l + 1)h 2 (23) V (r ) + 2mr 2 "L'énergie potentielle" supplémentaire peut être vue physiquement comme étant reliée au moment angulaire de la manière suivante. Une particule classique qui a un moment angulaire L autour de l'axe passant par l'origine et perpendiculaire au plan de son orbite a la vitesse angulaire ω = L / r 2 quand sa distance radiale à l'origine est r. Une force centripète L2 (24) mω 2 r = mr 3 est requise pour maintenir la particule sur son orbite. Cette force centripète est fournie par l'énergie potentielle et donc ajoute au V (r ) qui apparaît dans le mouvement une "énergie potentielle centrifuge" supplémentaire L2 / 2mr 2 . Elle a exactement la forme du terme supplémentaire dans (23) si nous posons (25) L = [l (l + 1)]2 h 1

L'argument physique précédent pour identifier le nombre quantique l avec le moment angulaire de la particule peut être mis sous forme quantitative en trouvant les opérateurs qui correspondent aux trois composantes du vecteur moment angulaire. Classiquement, nous avons L = r × p et donc, en mécanique quantique, nous prenons

 ∂ ∂  L x = yp z − zp y = −ih y − z  ∂y   ∂z ∂  ∂ (26) L y = zp x − xp z = −ih z − x  ∂z   ∂x  ∂ ∂ L z = xp y − yp x = −ih x − y  ∂x   ∂y L'équation (26) peut être transformée en coordonnées sphériques pour donner  ∂ ∂   L x = ih sin φ + cot θ cos φ ∂θ ∂φ  

 ∂ ∂   (27) L y = ih − cos φ + cot θ sin φ ∂θ ∂φ   ∂ L z = −i h ∂φ L'opérateur qui représente le carré du moment angulaire total est alors obtenu à partir de (27) comme L2 = L2x + L2y + L2z (28)

 1 ∂  ∂  1 ∂2  = −h 2   sin θ +  ∂θ  sin 2 θ ∂φ 2   sin θ ∂θ 

La comparaison de (28) et (6) montre que Ylm (θ , φ ) est une fonction propre de L2 avec la valeur

propre l (l + 1)h 2 :

(29) L2Ylm (θ , φ ) = l (l + 1)h 2Ylm (θ , φ )

De manière similaire, il suit de la structure de (10) et de la dernière relation (27) que Φ m (φ ) et

donc aussi Ylm (θ , φ ) sont fonction propre de L z avec la valeur propre mh :

(30) L z Ylm (θ , φ ) = mhYlm (θ , φ )

Donc, la séparation de l'équation de Schrödinger en coordonnées sphériques conduit à des fonctions d'onde qui sont fonctions propres à la fois du moment angulaire total et de la composante du moment angulaire le long de l'axe polaire. Le nombre quantique l qui apparaît est appelé nombre quantique azimutal ou de moment angulaire total. Le nombre quantique m qui apparaît dans (30) est appelé, comme nous l'avions déjà signalé, nombre quantique magnétique à cause de son importance dans la théorie de l'effet Zeeman lequel implique la composante du moment angulaire le long du champ magnétique (axe z). On notera qu'en général l'équation de Schrödinger ne peut pas être séparée de cette manière et les fonctions propres du moment angulaire obtenues si l'énergie potentielle V (r ) n'est pas à symétrie sphérique. Cela correspond au résultat classique que le moment angulaire est une constante du mouvement seulement pour un champ de force central (qui peut être décrit par un potentiel à symétrie sphérique). Il y a, cependant, la différence caractéristique entre la théorie classique et quantique que les trois composantes de L peuvent être spécifiées avec précision simultanément en la théorie classique tandis que seuls L z et L2 peuvent, en général, être spécifiés avec précision simultanément en théorie quantique puisque Ylm (θ , φ ) n'est pas une fonction propre de L x et L y (excepté pour le cas l = 0). Le choix de la direction de l'axe polaire qui distingue L z de L x et L y est, bien sûr, totalement arbitraire. On peut construire des fonctions d'onde qui sont fonctions propres de, par exemple, L x et L2 mais pas de L z et L y . Il suffit pour cela de choisir un autre axe polaire pour construire les harmoniques sphériques.

IV.3. Puits de potentiel carré à trois dimensions Nous sommes maintenant en position de trouver les niveaux d'énergie d'un état lié qui correspond à des choix particuliers de l'énergie potentielle V (r ) et du nombre quantique de moment angulaire l en résolvant l'équation de Schrödinger radiale.

Comme exemple, considérons le puits de potentiel de profondeur finie pour lequel V (r ) = −V0 , r <

a, V (r ) = 0 , r > a, où V0 est positif. Une région sphérique de ce type dans laquelle le potentiel est inférieur à l'environnement sert à attirer une particule tout comme dans le cas à une dimension que nous avons vu.

Moment angulaire zéro Quand l = 0, il est plus facile de résoudre l'équation de Schrödinger sous la forme modifiée avec R(r ) = χ (r ) / r . L'équation est

h2 − 2m (1) h2 − 2m

d 2χ − V0 χ = Eχ dr 2 d 2χ = Eχ dr 2

ra

La solution de l'équation (1) est la même que celle obtenue pour l'échelon de potentiel fini excepté sur trois points. Tout d'abord, l'échelle d'énergie est abaissée partout dans ce problème de la quantité V0 . Deuxièmement, le domaine de r est 0 à + ∞ au lieu du domaine − ∞ à + ∞ . Et troisièmement, la condition aux limites que la fonction d'onde ne devienne pas infinie en x = −∞ est maintenant remplacée par la même condition en r = 0. A partir des résultats déjà trouvés, on voit que les solutions de (1) sont  2m(V0 − E ) 2 χ (r ) = A sin αr + B cos αr α =   h2   1

(2)

ra h   où nous sommes intéressés par les niveaux d'énergie pour les états liés pour lesquels E < 0. L'exigence que R(r ) soit fini en r = 0 implique que nous posions B = 0 dans la première équation de (2). Donc, la solution a la forme de la solution a parité impaire du problème a une dimension. Les niveaux d'énergie sont obtenus en égalisant les deux valeurs de (1 / χ )(dχ / dr ) en r = a (ce qui est équivalent à rendre (1 / R )(dR / dr ) continu en ce point) et sont données en résolvant (3) α cot αa = − β qui est le même que la relation obtenue à une dimension. On en déduit qu'il n'y a pas de niveau d'énergie sauf si V0 a 2 > π 2 h 2 / 8m , qu'il y a un état lié si π 2 h 2 / 8m < V0 a 2 < 9π 2 h 2 / 8m , etc.

Solutions intérieures pour l arbitraire Pour des valeurs non nulles de l, il est plus pratique de travailler avec l'équation radiale originale qu'avec l'équation pour χ . Si nous posons ρ = αr où α est défini comme dans (2), l'équation de Schrödinger pour r < a devient d 2 R 2 dR  l (l + 1)  (4) + + 1 − R = 0 dρ 2 ρ dρ  ρ2  La forte ressemblance entre (4) et l'équation de Bessel suggère que R(r ) puisse être exprimé en terme des fonctions de Bessel. C'est en fait le cas. Si nous définissons la "fonction de Bessel sphérique" jl ( ρ ) qui est régulière en ρ = 0 par 1 2

π   J 1 ( ρ ) (5) jl ( ρ ) =  2 ρ   l+ 2 où J est une fonction de Bessel ordinaire d'ordre demi entier, on vérifie facilement que jl ( ρ ) satisfait (4). De même, la "fonction de Neumann sphérique" est 1

2 l +1  π   J 1 ( ρ ) (6) nl ( ρ ) = (− 1)   2 ρ  −l − 2

On peut montrer que J

l+

1 2

(ρ ) , où l est un entier positif, négatif ou zéro, peut s'exprimer comme une 1

somme de produits de sin ρ et cos ρ avec des polynômes d'ordre impair en ρ 2 . En particulier, des expressions explicites pour les trois premières fonctions j et n sont

j0 (ρ ) =

sin ρ

(7) j1 ( ρ ) =

sin ρ

ρ ρ

2



cos ρ

ρ

n0 ( ρ ) = −

cos ρ

n1 (ρ ) = −

cos ρ

ρ ρ

2



sin ρ

ρ

 3  3 1 3 1 3 j 2 ( ρ ) =  2 −  sin ρ − 2 cos ρ n 2 ( ρ ) = − 2 −  cos ρ − 2 sin ρ ρ ρ ρ ρ ρ ρ Les termes dominant pour ρ petit sont (8)

jl ( ρ ) →

ρ →0

ρl

(2l + 1)!!

nl ( ρ ) → −

(2l + 1)!!≡ 1 ⋅ 3 ⋅ 5L (2l + 1)

ρ →0

(2l − 1)!! ρ l +1

Ces équations sont des approximations utiles pour ρ 2 un peu plus petit que 4l+6 et 2 respectivement. Et les termes dans le développement asymptotique sont 1 1   jl ( ρ ) → cos  ρ − (l + 1)π  ρ →∞ ρ 2   (9) 1 1   nl ( ρ ) → sin  ρ − (l + 1)π  ρ →∞ ρ 2   Ces équations sont des approximations utiles pour ρ un peu plus grand que 12 l (l + 1) . Cependant les grandeurs (mais pas les phases) de jl et nl sont données à une bonne approximation par (9) si ρ est un peu plus grand que l, ce qui est approximativement la valeur de ρ pour laquelle la grandeur de jl est la plus grande. Quelques propriétés des j et des n sont

∫ j (ρ )ρ

[

]

[

]

1 3 2 ρ j 0 ( ρ ) + n0 ( ρ ) j1 ( ρ ) 2 1 3 2 2 2 ∫ n0 (ρ )ρ dρ = 2 ρ n0 (ρ ) − j0 (ρ )n1 (ρ ) (10) 1 nl −1 ( ρ ) jl ( ρ ) − nl (ρ ) jl −1 ( ρ ) = 2 2 0

2

dρ =

l>0

ρ

jl ( ρ )

1 d d nl ( ρ ) − nl ( ρ ) jl ( ρ ) = 2 dρ dρ ρ

Les propriétés suivantes sont valables à la fois pour les j et les n : 2l + 1 jl −1 ( ρ ) + jl +1 ( ρ ) = jl ( ρ ) l>0

ρ

1 d jl ( ρ ) = [ljl −1 (ρ ) − (l + 1) jl +1 (ρ )] dρ 2l + 1 l +1 = jl −1 ( ρ ) − jl (ρ )

ρ

[

]

[

]

d l +1 ( ) l +1 ( ) (11) dρ ρ j l ρ = ρ jl −1 ρ d ρ −l j l ( ρ ) = − ρ −l jl +1 ( ρ ) dρ

l >0

∫ j (ρ )dρ = − j (ρ ) ∫ j (ρ )ρ dρ = ρ j (ρ ) 1

0

2

2

0

∫ j (ρ )ρ 2 l

1

2

dρ =

[

]

1 3 2 ρ jl ( ρ ) − jl −1 ( ρ ) j l +1 ( ρ ) 2

l>0

Puisque R(r ) doit être fini pour r = 0, la solution désirée pour r < a est

(12) R(r ) = Ajl (αr )

Solutions extérieures pour l arbitraire L'équation de Schrödinger pour r > a peut être mise sous la forme (4) si nous redéfinissons ρ comme iβr , où β est donné dans (2). Puisque le domaine de ρ ne s'étend maintenant pas à zéro, il n'y a pas de raison pour que nl ne puisse pas apparaître dans la solution. La combinaison linéaire de jl et nl à sélectionner sera déterminée par la forme asymptotique qui doit diminuer exponentiellement pour r grand. Cela suggère que nous définissions les fonctions de Hankel sphériques hl(1) = jl ( ρ ) + inl ( ρ ) (13) (2 ) hl = jl ( ρ ) − inl ( ρ ) qui, à l'aide de (9), ont les formes asymptotiques (1)

hl



ρ →∞

(14) (2 )

hl



ρ →∞

1

ρ 1

ρ

e

 1  i  ρ − (l +1)π  2  

e

 1  −i  ρ − (l +1)π  2  

On peut montrer que le développement asymptotique, dont (14) donne le terme dominant, ne contient pas de terme pour lequel l'exposant a le signe opposé à celui donné. La solution désirée pour r > a est alors (15) R(r ) = Bhl(1) (iβr ) = B[ j l (iβr ) + inl (iβr )] Les trois premières fonctions sont

h0(1) (iβr ) = −

1 − βr e βr

 1 1  (16) h1(1) (iβr ) = i + 2 2 e − βr  βr β r   1 3 3  h2(1) (iβr ) =  + 2 2 + 3 3 e − βr β r   βr β r Niveaux d'énergie Les niveaux d'énergie sont obtenus en exigeant que (1 / R )(dR / dr ) soit continu en r = a. Quand cette condition est appliquée à la solution intérieure (12) et la solution extérieure (15) avec l = 0, nous obtenons l'équation (3). On peut l'écrire comme 2mV0 a 2 ξ 2 +η2 = (17) ξ cot ξ = −η h2 où nous avons posé ξ = αa et η = βa . La même condition appliquée aux solutions l = 1 se réduit, avec l'aide de (7) et (16), à 2mV0 a 2 cot ξ 1 1 1 − 2 = + 2 ξ 2 +η2 = (18) ξ η η h2 ξ Les équations (18) peuvent être résolues numériquement ou graphiquement comme nous l'avions déjà vu dans le cas des équations (17). En général, il n'y a pas de dégénérescence entrer les valeurs obtenues pour la solution des équations comme (17) et (18) pour différentes valeurs de l. Il est facile de voir combien on a de niveaux d'énergie (17) pour différentes valeurs de V0 a 2 sans plonger dans le travail numérique. Un nouveau niveau apparaît quand η est zéro ou cot ξ est infini. Cela se produit en ξ = π ,2π , K . Donc, il n'y a pas de niveau d'énergie avec l = 1 quand (19) V0 a 2 ≤

π 2h 2 2m

Il y a un état lié avec l = 1 si π 2 h 2 / 2m < V0 a 2 ≤ 2π 2 h 2 / m , etc. La plus petite valeur de V0 a 2 pour laquelle il existe un état lié avec l = 1 est plus grande que la valeur correspondante de V0 a 2 pour l = 0. C'est raisonnable d'un point de vue physique. L'interprétation du terme l dans l'équation de Schrödinger radiale comme une énergie potentielle supplémentaire qui correspond à une "force centrifuge" répulsive suggère qu'une particule possédant un moment angulaire nécessite un potentiel attractif plus fort pour la lier qu'une particule sans moment angulaire. En effet, il s'avère que la "force" minimale du puits de potentiel carré V0 a 2 nécessaire pour lier une particule de nombre quantique de moment orbital l croît de manière monotone avec l croissant. On peut montrer que les états liés apparaissent avec une énergie zéro pour une valeur particulière l quand [(1 / R )(dR / dr )]r = a = −(l + 1) / a . Pour l > 0, c'est équivalent à la condition jl −1 (ξ ) = 0 où

(

maintenant ξ = 2mV0 a 2 / h 2

)

1 2

.

Exercices 1. La règle de quantification de Bohr peut s'exprimer sous une forme beaucoup plus générale. Elle dit que l'intégrale de l'impulsion par rapport à la coordonnée sur un cycle est égal à un nombre entier fois la constante de Planck. Appliquez cette règle au cas de l'atome d'hydrogène à titre de vérification puis appliquez cette règle à l'oscillateur harmonique linéaire et comparez aux résultats obtenus dans la section IV.1. 2. Quelle est l'ordre de grandeur de la dispersion des nombres quantiques et des énergies des états qui contribuent de manière significative à la solution du paquet d'onde oscillant pour l'oscillateur harmonique ? 3. Utilisez la fonction génératrice des polynômes de Hermite pour évaluer





−∞

u n∗ ( x )x 2 u m ( x )dx

où les fonctions u sont les fonctions d'onde normalisées de l'oscillateur harmonique. 4. Utilisez la fonction génératrice des polynômes de Legendre pour évaluer

∫ P (w)P (w)dw 1

−1

l

l′

5. Obtenez une expression analytique approchée pour le niveau d'énergie dans un puits de potentiel carré (l = 0) quand V0 a 2 est nettement plus grand que π 2 h 2 / 8m . 6. Montrez que pour un puits de potentiel carré, les valeurs limites de V0 a 2 qui correspondent à de nouveaux niveaux d'énergie avec une valeur de l plus grande que zéro sont données par h 2 z 2 / 2m , où les nombres z sont les solutions non nulles de l'équation jl −1 ( z ) = 0 . 7. Supposez que l'interaction entre le neutron et le proton qui constituent un deutéron puisse être représentée par un puits de potentiel carré avec a = 2.00 × 10 −13 cm . Si le niveau d'énergie le plus bas (l = 0) du système est -2.23 MeV, calculez V0 en MeV pour les trois figures significatives. Comparez cette réponse avec celle obtenue à partir de la formule approximative dérivée dans le problème 5. 8. Considérez l'équation (22) de la section de la section IV.2 avec l = 0 et V (r ) = −V0 e − r / a . Faites un changement de variable de r à z = e − r / 2 a et montrez que le résultat est l'équation de Bessel.

Quelles conditions aux limites doivent être imposées sur χ comme fonction de z et comment l'utiliser pour déterminer les niveaux d'énergie ? Quelle est la limite inférieure de V0 pour laquelle un état lié existe ? 9. Trouvez les expressions pour les fonctions propres et les niveaux d'énergie d'une particule dans une boîte circulaire à deux dimensions qui a des murs parfaitement rigides. 10. On a montré dans la section III.1 qu'un puits de potentiel carré a une dimension a des états liés pour toute valeur positive de V0 a 2 et dans la section IV.3 qu'un puits de potentiel carré à trois dimensions à symétrie sphérique a un état lié seulement pour V0 a 2 > π 2 h 2 / 8m . Quelle est la situation analogue pour un puits de potentiel carré à deux dimensions à symétrie circulaire ? Quelle est la signification physique de ces résultats ? 11. L'équation de Schrödinger pour un corps rigide qui est contraint à tourner autour d'un axe fixe et qui a un moment d'inertie I par rapport à cet axe est h 2 ∂ 2ψ ∂ψ ih =− 2 I ∂φ 2 ∂t où ψ (φ , t ) est une fonction du temps t et de l'angle φ de rotation autour de l'axe. Quelles conditions aux limites doivent être appliquées aux solutions de cette équation ? Trouvez les fonctions propres normalisées et les valeurs propres de l'énergie. Y a-t-il dégénérescence ? 12. Trouvez les niveaux d'énergie de l'oscillateur harmonique isotrope à trois dimensions ( V (r ) = 12 Kr 2 ) en résolvant l'équation de Schrödinger en coordonnées cartésiennes. Quelle est la dégénérescence de chaque niveau ? Montrez que cette équation peut aussi être séparée en coordonnées sphériques et cylindriques.

V. Théorie des collisions Les problèmes pour lesquels les valeurs propres de l'énergie sont distribuées de manière continue apparaissent habituellement en relation avec les collisions d'une particule avec un champ de force. La méthode d'approche est différente de celle employée pour les états liés. Dans ce denier cas, les conditions aux limites à grande distance étaient utilisées pour déterminer les niveaux d'énergie discrets de la particule. Dans un problème de collision, l'énergie est spécifiée à l'avance et le comportement de la fonction d'onde à grande distance en est déduit. Ce comportement asymptotique peut alors être relié à des quantités de diffusion de la particule par le champ de force. Le nombre relativement faible de solutions exactes qui sont obtenues ici sont d'un usage plus large qu'il pourrait sembler au premier abord puisqu'elles peuvent servir de fondations à des calculs approchés pour des systèmes plus compliqués. Il est intéressant de noter que l'étude des collisions est particulièrement important en relation avec le noyau atomique et les particules élémentaires où très peu d'information peut être obtenue par d'autres moyens.

V.1. Barrière de potentiel carrée à une dimension

Nous considérons d'abord la collision à une dimension d'une particule avec la barrière de potentiel carrée V ( x ) montrée ci-dessus. Dans ce problème, nous sommes intéressés par une particule qui approche de la région avec x négatif et qui est réfléchie ou transmise par la barrière. Dans le problème classique correspondant, la particule est toujours réfléchie si son énergie est inférieure à celle du sommet de la barrière et est toujours transmise si son énergie est plus grande. Nous verrons que, dans le problème quantique, la réflexion et la transmission se produisent tous les deux avec une probabilité finie pour la plus part des énergies de la particule. A cause du manque de symétrie entre x positif et négatif qui est introduit dès le départ, il est désavantageux de travailler avec des solutions qui ont des parités définies et ainsi il n'y a aucune raison pour rendre V ( x ) symétrique par rapport à x = 0. Nous supposons donc que V ( x ) = 0 pour x < 0 et x > a et V ( x ) = V0 pour 0 < x < a, où V0 est positif.

Comportement asymptotique Nous sommes intéressés par représenter une particule qui approche de la gauche avec une énergie E > 0 et qui peut être renvoyée par la barrière ou y pénétrer. Donc, le comportement asymptotique

(dans les régions où V ( x ) = 0 ) est le suivant : pour x < 0, nous désirons que la fonction d'onde représente une particule se déplaçant vers le gauche (particule réfléchie) aussi bien que vers la droite (particule incidente). Pour x > a, nous désirons que la fonction d'onde représente seulement une particule se déplaçant vers la droite (particule transmise). Une particule dans une région sans potentiel qui se déplace dans une direction définie avec une énergie définie a une impulsion définie et donc peut être représentée par une fonction propre de l'impulsion à une dimension u ( x )e ipx / h si la particule se déplace dans la direction des x positifs avec l'impulsion p et u ( x ) ∝ e − ipx / h si la particule se déplace dans la direction des x négatifs avec la même énergie. Donc, puisque l'équation de Schrödinger dans la région où V ( x ) = 0 est

h 2 d 2u (1) − = Eu 2m dx 2 nos solutions asymptotiques sont u ( x ) = Ae ikx + Be − ikx x≤0 (2) u ( x ) = Ce ikx x≥a où k = p / h = + (2mE / h 2 )2 est la grandeur du nombre d'ondes. Les solutions (2) sont appropriées pour les régions sans potentiel qui sont externes au potentiel diffuseur qu'il ait ou pas la forme simple montrée plus haut. 1

Normalisation La signification physique des coefficients A, B et C peut être inférée en substituant (2) dans la forme à une dimension de la densité de courant de probabilité. 2 2 S (x ) = v A − B xa où v = hk / m est la vitesse de la particule avec le nombre d'odes k. Puisque ces expressions sont indépendantes de x, elles peuvent être interprétées comme le flux net (positif vers la droite) dans les deux régions. Cette interprétation est consistante avec l'affirmation ci-dessus que A, B et C sont les amplitudes des fonctions d'onde incidentes, réfléchies et transmises, respectivement.

(

)

La normalisation absolue des fonctions d'ondes (2) est peu important pour ce problème car nous 2

2

2

sommes seulement intéressés par les rapports B et C à A qui sont, respectivement, les coefficients de réflexion et de transmission de la barrière. Il est quelque fois utile, cependant, de 1 2

normaliser la fonction d'onde incidente à un flux unité. Cela correspond à prendre A = 1 / v . Une telle normalisation ne doit pas être interprétée comme indiquant que u ( x ) représente plus d'une particule. Cela signifie plutôt que nous choisissons un nombre assez grand de systèmes (chacun décrit par u ( x ) ) qui sont identiques et indépendant de manière telle que le flux incident total pour tous est l'unité. Une normalisation plus précise mais quelque fois moins pratique supposerait une "boîte" à une dimension de longueur L avec des conditions aux limites périodiques et en exigeant que (4)

∫( ) u (x )

2

L

dx = 1

Coefficients de diffusion Le caractère de la solution à l'intérieur de la barrière de potentiel dépend du fait que E est plus grand ou plus petit que V0 . Supposons d'abord que E > V0 , de manière à ce que nous puissions

[

]

1

définir un nombre d'onde à l'intérieur de la barrière : α = 2m(E − V0 ) / h 2 2 . Alors la solution à l'intérieur est (5) u ( x ) = Fe iαx + Ge − iαx 0≤ x≤a La continuité de u et du / dx en x = 0 et x = a nécessité par les conditions aux limites fourni quatre relations entre les cinq coefficients. Nous pouvons éliminer F et G et résoudre pour les rapports B/A et C/A. B k 2 − α 2 1 − e 2iαa = A (k + α )2 − (k − α )2 e 2iαa (6) C 4kαe i (α −k )a = A (k + α )2 − (k − α )2 e 2iαa

(

)(

)

Le carré absolu des rapports (6) sont les coefficients de diffusion (réflexion et transmission)

(7)

2   B 4k 2α 2 = 1 +  2 A k 2 − α 2 sin 2 αa  

C A

2

(  (k = 1 + 

2

) )

2 − α 2 sin 2 αa   4k 2α 2 

−1

−1

 4 E ( E − V0 )  = 1 + 2  2  V0 sin αa 

−1

 V 2 sin 2 αa  = 1 + 0   4 E (E − V0 ) 

−1

2

2

On vérifie facilement à partir de (7) que B / A + C / A = 1 comme on s'y attendait.

Les équations (7) montrent que le coefficient de transmission tend vers

−1

 mV0 a 2   (8) 1 + 2 2 h   lorsque l'énergie de la particule approche l'énergie du sommet de la barrière ( E → V0 ). Pour E croissant ( E > V0 ), le coefficient de transmission oscille entre une enveloppe croissante et l'unité (voir ci-dessus). Il y a une transmission parfaite lorsque αa = π ,2π , K , c'est-à-dire quand la barrière contient un nombre entier de demi longueurs d'onde. Ce effet se produit aussi lorsque V0 < 0 auquel cas la barrière carrée devient un puits carré. Les coefficients de transmission sont donnés par (7) si le signe de V0 est changé ainsi que dans l'expression de α . Des phénomènes d'interférence de ce type sont bien connus dans la transmission de la lumière à travers de fines lames transparentes. Les coefficients de réflexion et de transmission pour 0 < E < V0 sont plus facilement obtenus en remplaçant α par iβ dans (6) où 1

 2m(V0 − E )  2 (9) β =   h2   Le résultat pour le coefficient de transmission est −1

 V02 sinh 2 βa  C (10) = 1 +  A 4 E (V0 − E )   qui décroît de manière monotone de la valeur (8) lorsque E décroît sous V0 . Ce comportement est souvent appelé effet tunnel à travers la barrière. Quand βa >> 1 , le coefficient de transmission (10) devient très petit et est donné approximativement par 16 E (V0 − E ) − 2 βα (11) e V02 2

La figure ci-dessus est un tracé du coefficient de transmission calculé avec (7) et (10) pour une barrière plutôt "opaque" : mV0 a 2 / h 2 = 8 .

Diffusion d'un paquet d'ondes Le traitement précédent de la diffusion utilise des solutions stationnaires de l'équation de Schrödinger indépendante du temps qui correspondent à des valeurs particulières de l'impulsion incidente. Il est aussi possible de travailler avec l'équation dépendant du temps bien que cela soit plus difficile puisque même dans le cas à une dimension nous devons travailler avec une équation aux dérivées partielles de deux variables indépendantes, x et t. Il y a, cependant, l'avantage que nous pouvons alors étudier le mouvement d'un paquet d'ondes de la forme générale que nous avons vue et voir de quelle manière il est réfléchi ou transmis par le potentiel. Il y a deux manières d'approcher le problème. La solution peut être développée en fonctions propres de l'énergie et la sommation effectuée explicitement. Bien que cela puisse être fait de manière analytique dans le cas d'une particule libre, cela est généralement impossible quand un potentiel est présent. L'autre approche consiste à effectuer une intégration numérique en choisissant des intervalles de temps petits mais finis et d'approcher l'équation différentielle dans le temps par une équation aux différences. Même dans le cas à une dimension, cela est réalisable seulement avec un calculateur rapide et des techniques de calculs spéciales doivent être imaginées pour rendre le problème abordable. I.

II.

III.

IV.

Dans ces calculs, les unités sont choisies telles que h = 1 et m = 12 . L'unité de longueur peut encore être choisie arbitrairement et est légèrement plus longue que l'abscisse totale montrée dans chaque graphique. Alors le temps et l'inverse de l'énergie sont exprimés en termes d'une unité qui est le carré de l'unité de longueur. Le paquet d'onde incident est de forme gaussienne avec ∆x = 0.035 et 2 p = 50π , 70.7π et 100π . Le potentiel a la largeur a = 0.064 et l'intensité V0 = ±(70.7π ) , ainsi l'énergie moyenne du paquet d'ondes incident est 12 V0 , V0 et 2V0 . Les images successives sont montrées dans la figure I lorsque l'énergie moyenne du paquet d'ondes est la moitié de la hauteur de la barrière et dans la figure II quand l'énergie moyenne est égale à V0 . Les figures III et IV montrent le cas attractif dans lesquels l'énergie moyenne est la moitié de la profondeur du puits et égale à la profondeur du puits, respectivement. Dans tous les cas, ψ est tracé comme ordonnée et x comme abscisse et la hauteur et la largeur du potentiel sont également tracés. Le nombre dans chaque image indique le temps en unités arbitraires. La figure II est particulièrement intéressante car elle montre comme la probabilité décroît lentement puis rebondi et passe à travers la barrière quand l'énergie cinétique moyenne de la particule dans la barrière est zéro. 2

V.2. Collisions à trois dimensions Ce qui nous intéresse particulièrement est la situation des collisions à trois dimensions où une particule heurte un champ de force fixe ou lorsque deux particules se heurtent. Dans le cas du mouvement relativiste de deux particules, lorsque les seules forces présentent dépendent seulement de leurs mouvements relatifs, on peut séparer le problème en deux problèmes à une seule particule. L'un décrit le mouvement des particules relativement l'une à l'autre ou par rapport au centre de masse et l'autre décrit le mouvement libre du centre de masse. Ce résultat valide en mécanique classique s'étend à la mécanique quantique (cela peut paraître évident pour des raisons de lois de conservation de l'impulsion, mais nous allons le vérifier ci-dessous). Bien que le centre de masse puisse être pris au repos dans le calcul des niveaux d'énergie des mouvements internes, il a un mouvement définit dans une collision qui ne peut pas être ignoré dans le calcul des résultats d'une telle expérience. La raison en est que la procédure habituelle en laboratoire consiste à bombarder une particule qui est initialement au repos avec une autre particule qui porte l'énergie totale E 0 = E + E ′ . Donc, l'énergie E du mouvement relatif des deux particules est différent de l'énergie de bombardement E 0 et la diffusion observée dépend du fait que la particule est initialement au repos ou du fait que le centre de masse est initialement au repos. Nous appelons le système de coordonnées dans lequel la particule bombardée est initialement au repos le système de coordonnées du laboratoire et le système de coordonnées dans lequel le centre de masse des deux particules est (initialement et toujours) au repos le système de coordonnées du centre de masse. Il est évidemment plus facile de calculer le résultat d'une expérience de collision dans le système du centre de masse que dans le système du laboratoire puisque seuls trois degrés de liberté apparaissent dans le premier à comparer aux six du second. Le processus de collision dans le système du centre de masse peut être vu comme celui d'une particule qui a la masse réduite µ = m1 m2 / (m1 + m2 ) et une vitesse initiale v qui entre en collision avec un centre de diffusion fixe. La distribution en angles de la particule diffusée sera affectée par la transformation entre le système de coordonnées du centre de masse, dans lequel les calculs sont faits, et le système de coordonnées du laboratoire, dans lequel les observations sont faites.

Masse réduite L'équation de Schrödinger décrit le mouvement d'une seule particule dans un champ de force externe. Nous sommes maintenant intéressés par le mouvement de deux particules qui sont attirées l'une par l'autre ou qui se repoussent par une force qui dépend seulement de la distance entre elles. La forme de l'équation de Schrödinger a utiliser pour deux particules est suggérée par l'extension de l'équation de Schrödinger de une à trois dimensions. Cette extension utilisait le fait la fonction d'onde dépend des trois coordonnées rectangulaires x, y et z au lieu de juste x et en introduisant l'impulsion correspondant aux nouvelles coordonnées telle qu'elles apparaissent dans l'expression classique de l'énergie. Une extension similaire de trois à six coordonnées rectangulaires conduit directement à l'équation de Schrödinger, que nous avions déjà suggérée, pour deux particules de masse m1 et m2 : ih

∂ ψ ( x1 , y1 , z1 , x 2 , y 2 , z 2 , t ) = ∂t

 h2  ∂2  ∂2 ∂2  h2  ∂2 ∂2 ∂2      − + + − + + + V ( x , y , z , x , y , z , t )   1 1 1 2 2 2 2 2  2 2  (1)  2  2  2m1  ∂x1 ∂y1 ∂z1  2m2  ∂x 2 ∂y 2 ∂z 2   ψ ( x1 , y1 , z1 , x 2 , y 2 , z 2 , t ) où l'énergie potentielle est supposée dépendre d'une manière arbitraire des six coordonnées et du temps. Si maintenant l'énergie potentielle dépend seulement des coordonnées relatives, c'est-à-dire V = V ( x1 − x 2 , y1 − y 2 , z1 − z 2 ) , une simplification importante peut être faite. Nous définissons les coordonnées relatives x, y, z et les coordonnées du centre de masse X, Y, Z par x = x1 − x 2 y = y1 − y 2 z = z1 − z 2 (2) MX = m1 x1 + m2 x 2 MY = m1 y1 + m2 y 2 MZ = m1 z1 + m2 z 2 Ici, M = m1 + m2 est la masse totale du système. L'équation (1) peut être récrite en fonction des nouvelles coordonnées  ∂ψ  h 2  ∂ 2 ∂2 ∂2  h2  ∂2 ∂2 ∂2      + V ( x, y, z )ψ (3) ih = − + + − + + 2 2 2  2 2 2   ∂t  2 M  ∂X ∂Y ∂Z  2 µ  ∂x ∂y ∂z  



m1 m2 m1 + m2 est appelée masse réduite. (4) µ =

Deux séparations de l'équation (3) peuvent maintenant être faites. Tout d'abord, la dépendance en temps peut être séparée, comme nous l'avons déjà vu, et, deuxièmement, une séparation peut être faite en un produit de fonctions des coordonnées relatives et des coordonnées du centre de masse. Le processus est immédiat et simple et le résultat est ψ ( x, y, z, X , Y , Z , t ) = u ( x, y, z )U ( X , Y , Z )e −i ( E + E ′ )t / h (5) −

h2 2 ∇ u + Vu = Eu 2µ

h2 2 ∇ U = E ′U 2M où les opérateurs ∇ 2 dans la deuxième et troisième équation impliquent la différentiation par rapport aux coordonnées relatives et du centre de masse, respectivement. La deuxième équation (5) décrit le mouvement relatif des deux particules et est la même que l'équation du mouvement d'une particule qui a la masse réduite µ dans une énergie potentielle externe V . La troisième équation (5) nous dit que le centre de masse du système de deux particules se déplace comme une particule libre de masse M, comme on s'y attendait. −

Section efficace de diffusion La distribution angulaire des particules diffusées par un centre de force fixe ou par d'autres particules est décrit en pratique en terme d'une section efficace de diffusion, omniprésent dans les études expérimentales. Supposons que nous bombardions un groupe de n particules ou centres diffusion avec un flux parallèle de N particules par unité de surface et par unité de temps et que nous comptions le nombre de particules incidentes qui émergent par unité de temps dans un petit angle solide ∆ω 0 centré autour d'une direction qui a les angles sphériques θ 0 et φ 0 par rapport à la direction de bombardement prise comme axe polaire. Ce nombre sera proportionnel à N, n et ∆ω 0

pourvu que le flux soit assez faible pour qu'il n'y ait pas d'interférence entre les particules envoyées et pas de diminution appréciable des particules par leur éjection hors de la zone cible et pourvu aussi que les particules bombardées soient suffisament écartées pour que chaque processus de collision implique seulement une d'entre elles. Alors le nombre de particules incidentes qui émerge par unité de temps dans ∆ω 0 peut s'écrire (6) nNσ 0 (θ 0 , φ 0 )∆ω 0

où le facteur de proportionnalité σ 0 (θ 0 , φ 0 ) et appelé section efficace différentielle de diffusion.

Puisque (6) a la dimension de l'inverse d'un temps, σ 0 (θ 0 , φ 0 ) a la dimension d'une surface.

σ 0 (θ 0 , φ 0 )∆ω 0 est égale à la section efficace du flux parallèle incident qui contient le nombre de particules diffusées dans ∆ω 0 par une seule particule cible ou centre de diffusion. L'intégrale de σ 0 (θ 0 , φ 0 ) sur la sphère est appelée section efficace totale de diffusion (7) σ 0 = ∫ σ 0 (θ 0 , φ 0 )dω 0

Pour la collision d'une particule avec un centre de diffusion fixe, la définition (6) de la section efficace différentielle de diffusion est également valide dans les systèmes de coordonnées du laboratoire et du centre de masse puisqu'un centre de diffusion qui est fixé à une masse effective infinie et ainsi le centre de masse du système ne se déplace pas. Pour une collision entre deux particules de masse finie, cependant, la section efficace différentielle (6) s'applique en général seulement au système de coordonnées du laboratoire et à l'observation de la particule incidente diffusée. Elle ne décrit pas l'observation des particules bombardées éjectées dans le système du laboratoire bien qu'il soit bien sûr possible d'obtenir une section efficace différentielle pour l'éjection des particules à partir de σ 0 (θ 0 , φ 0 ) . Dans le système du centre de masse, la section

efficace différentielle σ (θ , φ ) peut être définie en analogie avec (6) où, à nouveau, la particule incidente diffusée est celle qui est observée et le flux N de particules incidentes est calculé par rapport aux particules bombardées, par le centre de masse. Puisque dans ce système de coordonnées les deux particules se déplacent dans des directions opposées l'une de l'autre après la collision, il est clair que la section efficace différentielle pour l'observation des particules bombardées éjectées dans la direction θ , φ est juste σ (π − θ , φ + π ) .

Relation entre les angles dans le laboratoire et le centre de masse

La relation entre les sections efficaces différentielles et les angles dans le système du laboratoire et dans le système du centre de masse peuvent être trouvées en déplaçant le système du laboratoire dans la direction de la particule incidente avec une vitesse suffisante pour mettre le centre de masse au repos. La figure (a) ci-dessus montre une particule de masse m1 et une vitesse initiale va frapper une particule de masse m2 initialement au repos. Le centre de masse se déplace vers la droite avec la vitesse v ′ = m1v / (m1 + m2 ) , comme on peut le voir de la conservation de l'impulsion. Donc, dans le système du centre de masse, les particules de masse m1 et m2 approchent du centre de masse avec les vitesses m2 v (8) v ′′ = v − v ′ = m1 + m2 et v ′ , respectivement. Si la collision est élastique, elles s'écartent évidemment du centre de masse après la collision avec les mêmes vitesses (figure (b)). Il suit de la géométrie de la situation que θ et φ sont reliés à θ 0 et φ 0 par v ′′ cosθ + v ′ = v1 cosθ 0 (9) v ′′ sin θ = v1 sin θ 0

φ = φ0 A partir des deux premières équations de (9), nous obtenons, en éliminant v1 , sin θ v′ m (10) tan θ 0 = γ = = 1 v ′′ m2 γ + cosθ Les équations (9) et (10) peuvent être valides pour des collisions non élastiques aussi. Considérons une collision binaire générale (par exemple, une réaction nucléaire) dans laquelle une particule de masse m1 frappe une particule de masse m2 initialement au repos et, après la collision, les particules de masse m3 et m4 émergent, où m1 + m2 = m3 + m4 . Si en plus une quantité d'énergie Q est convertie de l'énergie interne en énergie cinétique des particules émergentes (Q est positif pour des collisions exothermiques et négatif pour des collisions endothermiques) et la particule de masse m3 est observée, la première équation de (10) est encore valide. Dans ce cas, γ est encore égal au

rapport de la vitesse du centre de masse dans le système du laboratoire à la vitesse de la particule observée dans le système du centre de masse puisque tout cela est déduit de simples considérations géométriques. Cependant, γ n'est plus m1 / m2 mais on peut montrer qu'il est donné par 1 2

mm E   (11) γ = + 1 3 m m E + Q  2 4  2 où E = m1 m2 v / 2(m1 + m2 ) est l'énergie initialement associée au mouvement relatif dans le système du centre de masse.

Relation entre sections efficaces La relation entre les sections efficaces dans les systèmes de coordonnées du laboratoire et du centre de masse peut être obtenue à partir de leurs définitions, qui impliquent que le même nombre de particules sont diffusées dans l'angle solide différentiel dω 0 autour de θ 0 , φ 0 que dans dω autour de θ , φ . (12) σ 0 (θ 0 , φ 0 ) sin θ 0 dθ 0 dφ 0 = σ (θ , φ ) sin θ dθ dφ Avec l'aide de la dernière équation (9) et la première équation (10), l'équation (12) donne

) = (1 + γ

)

1

+ 2γ cosθ 2 (13) σ 0 (θ 0 , φ 0 σ (θ , φ ) 1 + γ cosθ où en général γ est donné par (6). On notera que la section efficace totale est la même dans les deux systèmes du laboratoire et du centre de masse puisque le nombre total de collisions qui se produisent est indépendant du mode de description du processus. 2

Dépendance en γ Pour γ < 1 , l'équation (10) montre que θ 0 croît de manière monotone de 0 à π lorsque θ croît de 0 à π . Pour γ = 1 , θ 0 = 12 θ et varie de 0 à 12 π lorsque θ varie de 0 à π . Dans ce cas (14) σ 0 (θ 0 , φ 0 ) = 4 cosθ 0σ (2θ 0 , φ 0 )

et aucune particule n'apparaît dans l'hémisphère arrière dans le système du laboratoire. Pour γ > 1 ,

θ 0 croît d'abord de 0 à une valeur maximale sin −1 (1 / γ ) , puis décroît jusqu'à 0 pendant que θ varie jusque π . Dans ce cas, σ 0 (θ 0 , φ 0 ) est habituellement infini a la valeur maximale de θ 0 bien que cette singularité donne une contribution finie à la section efficace totale. Aucune particule n'apparaît au-delà du maximum de θ 0 dans le système du laboratoire. Les deux valeurs de θ qui

conduisent à une valeur particulière de θ 0 entre 0 et sin −1 (1 / γ ) peuvent être distinguées par l'énergie de la particule observée qui est d'autant plus grande que θ est petit.

Ce dernier cas ( γ > 1 ) est illustré schématiquement dans la figure (c). La résultante de la vitesse v ′′ de la particule observée dans le centre de masse et la vitesse v ′ du centre de masse dans le système du laboratoire donne la vitesse v1 de la particule observée dans le système du laboratoire. Le lieu des points terminaux de v1 quand son origine est au point O est le cercle de rayon v ′′ . Donc, quand v ′′ < v ′ , l'angle θ 0 de la résultante v1 avec la direction de bombardement ne peut pas excéder l'angle v ′′ 1 (15) sin −1 = sin −1 v′ γ Lorsque le rapport γ = v ′ / v ′′ décroît, le cercle devient relativement plus large et le domaine angulaire de v1 s'accroît. L'utilisation des relations géométriques dans la discussion précédente est valide aussi bien en mécanique quantique qu'en mécanique classique car ce sont essentiellement des relations entres vecteurs impulsions qui sont appliquées dans la région asymptotique où les particules n'ont pas besoin d'être localisées avec précision dans l'espace et donc peuvent avoir des impulsions définies. Il est intéressant de noter que la différence entre les systèmes du laboratoire et du centre de masse est négligeable dans les collisions d'électrons avec des atomes à cause du grand rapport de masse des particules en jeu. Dans les collisions nucléaires, cependant, la différence entre les deux systèmes de coordonnées est habituellement significative.

Comportement asymptotique La section efficace différentielle de diffusion σ (θ , φ ) dans le système de coordonnées du centre de masse peut être trouvée à partir de la forme asymptotique de la solution à la deuxième équation (5), h2 2 (16) − ∇ u + Vu = Eu 2µ qui est l'équation de Schrödinger pour le mouvement relatif. La fonction d'onde u peut être écrite comme une fonction des angles θ , φ et de la distance radiale entre les deux particules. L'énergie E associée au mouvement relatif se lit sur la figure ci-dessus comme m2 E0 (17) E = m1 + m2 où E 0 est l'énergie initiale de la particule incidente. Il est intéressant de noter que E est égal à l'énergie cinétique de la particule dont la masse est la masse réduite µ et dont la vitesse est la vitesse relative v. Donc, nous pouvons voir (16) comme représentant la collision élastique d'une particule de masse µ , de vitesse initiale v et d'énergie cinétique E = 12 µv 2 avec un centre de diffusion fixe qui est décrit par l'énergie potentielle V (r ) où r est la distance entre la particule fictive µ et l'origine du potentiel de diffusion. Comme dans la section précédente, la diffusion est déterminée par la forme asymptotique de u (r ,θ , φ ) dans la région où V = 0. Quand les particules qui se heurtent sont très éloignées, nous désirons que u contiennent une partie qui représente une particule incidente de masse µ se déplaçant dans une direction particulière avec la vitesse v et une partie qui représente une particule sortante radiale : µv (18) u (r ,θ , φ ) → A e ikz + r −1 f (θ , φ )e ikr k= r →∞ h

[

]

Le premier terme dans (18) représente une particule se déplaçant dans la direction des z positifs ou le long de l'axe polaire θ = 0 puisque z = r cosθ . C'est une onde plane infinie de la forme d'une fonction propre de l'impulsion où le vecteur de propagation k a la grandeur k et est dirigé le long de l'axe polaire. Le deuxième terme dans (18) représente une particule qui se déplace radialement vers

l'extérieur. Son amplitude dépend de θ et de φ et inversement proportionnelle à r puisque le flux radial doit diminuer comme l'inverse du carré de la distance. On vérifie facilement que (18) satisfait l'équation (16) asymptotiquement à travers des termes d'ordre 1 / r dans la région où V = 0 pour toute forme de la fonction f (θ , φ ) .

Normalisation La signification physique du coefficient A et de la fonction angulaire f peut être obtenue par un calcul du flux de particule, comme dans la section précédente. Une substitution directe de (18) dans l'équation de la densité de courant de probabilité conduit cependant à des termes d'interférence entre les ondes incidentes et diffusées qui n'apparaissent pas dans la plus part des arrangements expérimentaux. Le fait qu'ils ne peuvent pas apparaître peut être vu de la manière suivante.

En pratique, les particules incidentes et diffusées sont séparées l'une de l'autre en les collimatant l'une sur l'autre. Supposons, par exemple, que l'arrangement expérimental est comme indiqué

schématiquement ci-dessus, tel que les particules incidentes venant de la source S sont collimatées par les diaphragmes DD en un faisceau plus ou moins bien défini. Un tel faisceau collimaté n'est pas une onde plane infinie de la forme e ikx mais peut être obtenue en superposant une infinité d'ondes planes qui sont des vecteurs de propagation de grandeurs et directions légèrement différentes. La dispersion angulaire totale en radians sera de l'ordre du rapport de la longueur d'onde de la particule au diamètre du collimateur (diffraction) et ainsi peut être extrêmement petit en pratique. Maintenant, f ne varie habituellement pas très rapidement avec l'angle, tel que la petite dispersion en directions des vecteurs de propagation incidents n'affecte pas f de manière significative. Donc, au point d'observation P, seul le terme f est présent et est essentiellement le même que celui qui apparaît dans (18). Le flux incident peut être calculé à partir du terme d'onde plane seul puisque si nous allons suffisament loin de la zone de diffusion, le terme f peut être rendu négligeable. Donc, dans la région observée, les termes d'interférences sont une conséquence de l'idéalisation implicite en supposant une onde plane infinie dans (18) et ils n'ont habituellement pas de signification physique sauf dans quelques cas exceptionnels. La substitution des deux termes de (18) séparément dans l'équation de la densité de flux de 2

probabilité montre que le flux incident est de grandeur v A le long de l'axe polaire et que le terme dominant dans le flux diffusé est de grandeur v A f (θ , φ ) 2

(19)

2

r2 le long d'un rayon vers l'extérieur. A partir de la définition de la section efficace, il s'ensuit que (20) σ (θ , φ ) = f (θ , φ )

2

Comme discuté dans la section précédente, le choix du coefficient A n'est pas important tant que le calcul de la diffusion est considéré. La fonction d'onde peut être normalisée à un flux incident unité 1 2

en choisissant A = 1 / v ou elle peut être normalisée en posant

∫u

2

d 3 r = 1 dans une grande boîte

qui a des conditions aux limites périodiques. Nous poserons souvent simplement A égal à l'unité.

V.3. Diffusion par des potentiels à symétrie sphérique Le comportement asymptotique de la fonction d'onde détermine la section efficace différentielle mais ne peut pas en elle-même être trouvée sans résoudre l'équation de Schrödinger dans tout l'espace. Comme cela est le cas dans le calcul des niveaux d'énergie, cela peut être fait seulement quand l'équation de Schrödinger est séparable et un cas particulier de grand intérêt physique est celui dans lequel l'énergie potentielle est à symétrie sphérique. Nous allons supposer ici que V est seulement fonction de r et nous allons trouver la relation entre les solutions séparées en coordonnées sphériques et la forme asymptotique. Cette procédure est appelée la méthode des ondes partielles. Dans la suite nous ne distinguerons généralement pas les collisions d'une particule avec un centre fixe de diffusion et les collisions entre deux particules traitées dans le système de coordonnées du centre de masse. La diffusion élastique, pour laquelle V est réel, est considérée ici. La situation où V est complexe sera discutée plus loin et est intéressante puisque certains processus inélastiques peuvent être décrits approximativement de cette manière.

Comportement asymptotique Il est évident que le problème possède maintenant une symétrie autour de l'axe polaire tel que u, f et σ sont indépendants de l'angle φ . La solution générale de l'équation de Schrödinger peut être écrite comme une somme de produits de fonctions radiales et de polynômes de Legendre. Pour des raisons pratiques, nous l'écrivons sous la forme ∞

u (r ,θ ) = ∑ (2l + 1)i l Rl (r )Pl (cosθ ) (1)

l =0



= ∑ (2l + 1)i l r −1 χ l (r )Pl (cosθ ) l =0

où Pl est le polynôme de Legendre d'ordre l et χ l satisfait l'équation

d 2χl  2 l (l + 1)  χl = 0 + k − U (r ) − 2 dr r 2   (2)

1

 2 µE  2 k = 2   h 

U (r ) =

2 µV (r ) →0 h 2 r →∞

La condition aux limites en r = 0 que Rl soit fini ou que χ l s'annule détermine la forme asymptotique de la solution à (2) excepté pour une constante multiplicative arbitraire. Afin de trouver la nature générale de ce comportement asymptotique, nous considérons r si grand que les termes U et l dans (2) peuvent être négligés. Alors la solution à (2) est de la forme e ± ikr . Pour avoir une meilleure approximation, nous posons r (3) χ l (r ) = A exp  ∫ f (r ′)dr ′ e ±ikr  a  où a et A sont des constantes. La première exponentielle est supposée être une fonction de r variant lentement pour de grands r, ce qui implique que f (r ) diminue plus rapidement que t −1 lorsque r → ∞ . La substitution de (3) dans (2) donne l'équation suivante pour f : l (l + 1) (4) f ′ + f 2 ± 2ikf = U (r ) + ≡ W (r ) r2 où l'apostrophe indique la dérivée par rapport à r. Si maintenant W (r ) diminue comme r − s pour de grands r (s > 0), le dernier terme sur le coté gauche est le terme dominant et f diminue aussi comme r − s . Dans ce cas, χ l varie comme e ± ikr pour de grands r si s > 1 puisque alors l'intégrale dans l'exponentielle de (3) converge pour de grands r. Si, d'autre part, W diminue comme une exponentielle ou une fonction d'erreur de r (ce qui implique que l = 0), le premier et le troisième terme sur le coté gauche de (4) doivent être considérés tous les deux. On peut alors montrer sans difficulté que χ l varie encore comme e ± ikr pour de grands r. Le champ coulombien, pour lequel U et W varie comme r −1 pour de grands r indépendamment de la valeur de l est le seul cas physiquement intéressant qui nécessite une attention particulière et qui sera discuté plus loin.

La forme asymptotique de χ l peut être écrite assez généralement (5) χ l (r ) → Al′ sin (kr + δ l′ ) r →∞

où jusqu'à preuve du contraire Al′ et δ l′ peuvent être complexe. La solution de (2) qui s'annule en r = 0 est unique à une constante multiplicative près. On peut montrer que cette solution est réelle partout si elle est réelle en r = 0, puisque k, U et l sont tous réels. Donc, δ l′ doit être réel bien que Al′ n'a pas besoin de l'être. Cela étant dit, on vérifie facilement que le flux radial total de particules à travers une grande sphère s'annule : π

(6) lim 2πr 2 ∫ S r sin θdθ = 0 r →∞

0

où S r est la composante radiale du vecteur densité de flux de probabilité calculé en y substituant u (r ,θ ) de (1). Cela signifie qu'aucune source ou puits de particules ne sont présent et les particules qui sont diffusées radialement vers l'extérieur sont fournies par l'onde plane incidente.

Section efficace différentielle Il est utile de redéfinir l'amplitude Al′ et l'angle de phase δ l′ qui apparaissent dans (5) en fonction d'un problème un peu plus spécifique. On supposera que U (r ) peut être négligé pour r plus grand qu'une certaine distance a. Dans les cas pratiques intéressant, a peut être suffisament petit pour que le terme l dans (2) soit négligeable. Nous pouvons alors diviser le domaine de r en trois régions. Dans la première, U (r ) ne peut pas être négligé et la forme de Rl (r ) dépend de U. Dans la seconde, U (r ) peut être négligé mais le terme l dans (2) n'est pas négligeable. Alors, la forme la plus générale pour Rl (r ) qui soit réelle (excepté pour une constante multiplicative complexe éventuelle) est, comme nous l'avons vu dans l'étude du puits de potentiel (7) Rl (r ) = Al [cos δ l j l (kr ) + sin δ l nl (kr )] où δ l est réel. Dans la troisième région, le terme l est négligeable tout comme U et Rl (r ) est obtenu à partir des formules asymptotiques −1 (8) Rl (r ) → (kr ) Al sin (kr − 12 lπ + δ l ) r →∞

Les équations (5) et (8) sont en accord si Al = kAl′ et δ l = δ l′ + 12 lπ . Nous voulons maintenant identifier la forme asymptotique de (1) avec la forme asymptotique vue dans la section précédente. Pour faire cela, nous avons besoin d'un développement de e ikz = e ikr cosθ en polynômes de Legendre : ∞

(9) e ikr cos θ = ∑ (2l + 1)i l jl (kr )Pl (cosθ ) l =0

En substituant (9) dans la forme asymptotique de la section précédente avec A = 1 et en égalant à la forme asymptotique (1), nous obtenons ∞

∑ (2l + 1)i (kr ) (10)

l

l =0



−1

sin (kr − 12 lπ )Pl (cosθ ) + r −1 f (θ )e ikr

= ∑ (2l + 1)i l Al (kr ) sin (kr − 12 lπ + δ l )Pl (cosθ ) −1

l =0

Lorsque les fonctions sinus sont écrites sous forme d'exponentielles complexes, les coefficients de e ikr et e −ikr des deux cotés de cette équation doivent être égaux : ∞

2ikf (θ ) + ∑ (2l + 1)i e (11)

l

l =0



∑ (2l + 1)i e l

l =0

1 ilπ 2

1 − ilπ 2



Pl (cosθ ) = ∑ (2l + 1)i Al e l

1   i  δ l − lπ  2  

l =0



Pl (cosθ ) = ∑ (2l + 1)i Al e l =0

l

1   −i  δ l − lπ  2  

Pl (cosθ )

Pl (cosθ )

Puisque ces relations sont vraies pour toute valeur de θ et que les polynômes de Legendre sont orthogonaux, la deuxième équation (11) devient (12) Al = e

iδ l

La substitution de cette valeur dans la première équation (11) donne pour l'amplitude de diffusion

(13) f (θ ) = (2ik )

−1

∑ (2l + 1)(e ∞

2 iδ l

l =0

)

− 1 Pl (cosθ )

Donc, la section efficace différentielle est (14) σ (θ ) = f (θ )

2

1 = 2 k



∑ (2l + 1)e

iδ l

l =0

sin δ l Pl (cosθ )

2

Il est utile de noter que la relation asymptotique de la section précédente, (13) et (14), qui se rapportent toutes au comportement asymptotique de la fonction d'onde, sont aussi valides quand la relativité restreinte est prise en compte. Aussi longtemps que nous travaillons avec le mouvement dans le système de coordonnées du centre de masse, qui peut être décrit par une fonction u des coordonnées relatives, nous pouvons spécifier la diffusion de cette manière en fonction de δ l où hk est l'impulsion relative. Cela est vrai même quand l'interaction ne peut pas être décrite par un potentiel.

Section efficace élastique totale La section efficace élastique totale est l'intégrale de (14) sur la sphère. A cause de l'orthogonalité des polynômes de Legendre, elle ne contient pas de produits de facteurs impliquant des valeurs différentes de l. π 4π ∞ (15) σ = 2π ∫ σ (θ )sin θdθ = 2 ∑ (2l + 1)sin 2 δ l 0 k l =0 La section efficace totale peut aussi être reliée à f (0) . Il suit de la fonction génératrice des polynômes de Legendre que Pl (1) = 1 pour tout l, tel que (13) donne pour θ = 0 (16) f (0 ) = (2ik )

−1

∑ (2l + 1)(e ∞

l =0

2 iδ l

)

−1

La comparaison avec (13) montre alors que

(17) σ =

2π 4π f (0 ) − f ∗ (0 ) = Im f (0 ) ik k

[

]

L'interprétation physique de (17) est la suivante : afin que la diffusion prenne place, les particules doivent être éliminées dans quantité proportionnelle à σ du flux incident, tel que son intensité est plus petite derrière la région de diffusion ( θ ≈ 0 ) qu'en face d'elle. Cela peut se produire seulement par interférence entre les deux termes dans l'expression asymptotique de la section précédente. Puisqu'un tel terme d'interférence doit être une fonction linéaire de l'amplitude de diffusion vers l'avant, on s'attend à une relation générale de la forme de (17). Un calcul réel de ce terme d'interférence montre que (17) doit être valable plus généralement : quand f dépend aussi bien de φ que de θ et quand σ inclut une diffusion inélastique et de l'absorption en plus de la diffusion élastique.

Décalages de phase L'angle δ l est appelé décalage de phase de la lième onde partielle puisque selon (8) c'est la différence de phase entre les formes asymptotiques de la fonction radiale Rl (r ) et la fonction radiale jl (kr ) en l'absence de potentiel de diffusion (U = 0). Le décalage de phase détermine complètement la diffusion et la section efficace de diffusion s'annule quand chacun des δ l est 0° ou 180°. On notera que la dérivation de (13) est valide qu'il existe ou pas le rayon supposé a au-delà duquel U (r ) est négligeable pourvu que U (r ) diminue plus rapidement que 1 / r . Cependant, la méthode des ondes partielles est la plus utile pour le calcul des sections efficaces de diffusion si un tel rayon a existe, particulièrement si ka est de l'ordre de l'unité ou moins. La raison en est que le premier et plus grand maximum de jl (kr ) est approximativement en r = l / k . Pour r beaucoup plus petit, jl est petit et croît comme r l . Donc, si a > (ka )

2

et pour estimer l'ordre de grandeur de nl , l'inégalité dans (20) devient l (22) ε l > (ka ) , δ l a le signe opposé de ε l . Si maintenant le terme d'énergie potentielle V ou U est positif, correspondant à des forces qui sont principalement répulsives, l'équation (2) montre que le rapport de la courbure à la valeur de la fonction d'onde radiale est plus positive que dans le cas libre. Cela signifie que le rapport de la pente à la valeur est plus positif en r = a que dans le cas où U = 0. Donc, un potentiel répulsif rend ε l positif et δ l 2

négatif. Un décalage de phase négatif signifie que la fonction d'onde radiale est "poussée vers l'extérieur" en comparaison de la fonction d'onde libre. De même, nous voyons qu'un potentiel négatif rend ε l négatif et δ l positif. Cela signifie que la fonction d'onde est "tirée vers l'intérieur" par le potentiel attractif.

Cela peut être vu graphiquement en comparant rj 0 (kr ) et χ 0 (kr ) quand ont les fait démarrer arbitrairement avec la même pente en r = 0. Les figures (a) et (b) montrent le résultat de calculs numériques effectués pour des potentiels carrés répulsifs et attractifs, respectivement. Les unités sont choisies tel que h = 1 , m = 12 et la longueur unité est un cinquième de la longueur totale de l'abscisse montrée dans le graphique. Le potentiel a le rayon a = 1 et l'intensité V0 = ±2 , l'énergie est E = 4 tel que ka = 2 . Dans chaque cas la courbe en tiret est rj 0 (kr ) et la courbe pleine est

χ 0 (kr ) .

Effet Ramsauer-Townsend La figure (b) suggère qu'un potentiel attractif peut être assez fort pour que l'onde partielle l = 0 soit tirée de juste un demi cycle et son décalage de phase est 180°. Si c'était le cas, le terme correspondant dans l'expression (13) pour f (θ ) s'annulerait et il n'y aurait pas de contribution à la diffusion.

La situation est montrée ci-dessus, à nouveau calculée numériquement. Ici a = 2, V0 = −5 et E = 1

tel que ka = 2 . La courbe en tiret est rj 0 (kr ) et la largeur du potentiel est également indiquée.

Dans une telle situation, il peut arriver que ka soit assez petit et le potentiel attractif assez fort pour tous les autres décalages de phase soient négligeables quand δ 0 = 180° . L'amplitude de diffusion

f (θ ) s'annule alors pour tout θ et il n'y a pas de diffusion. C'est l'explication de l'effet RamsauerTownsend, le minimum extrêmement bas observé dans la section efficace de diffusion des électrons par les atomes de gaz rares à une énergie de bombardement d'environ 0.7 eV. Cette explication fut suggérée par Bohr puis montrée raisonnable quantitativement par Faxén et Holtsmark. Un atome de gaz rare, qui consiste entièrement en une coquille fermée, est relativement petit et la force combinée du noyau et des électrons atomiques exercée sur les électrons incidents est forte et d'une portée bien définie. Il est clair que cette section efficace minimale se produit à une énergie définie puisque la forme de la fonction d'onde à l'intérieur du potentiel est insensible à l'énergie de bombardement relativement faible tandis que la phase de la fonction d'onde libre en dépend rapidement.

Physiquement, l'effet Ramsauer-Townsend peut être vu comme une diffraction de l'électron autour de l'atome de gaz rare dans laquelle la fonction d'onde à l'intérieur de l'atome est déformée juste ce qu'il faut pour s'ajuster à la fonction d'onde régulière et non déformée à l'extérieur. Cet effet est analogue à la transmission parfaite trouvée à des énergies particulière dans le problème à une dimension que nous avons examiné. Contrairement à la situation à une dimension, cependant, l'effet Ramsauer-Townsend ne peut pas se produire avec un potentiel répulsif car ka devrait être au moins de l'ordre de l'unité pour avoir δ 0 = −180° et un potentiel de ce large domaine produirait des décalages de phase à des l plus grands.

Diffusion par une sphère parfaitement rigide Comme premier exemple de la méthode des ondes partielles, calculons la diffusion par une sphère parfaitement rigide qui est représentée par le potentiel V (r ) = +∞ pour r < a et V (r ) = 0 pour r > a. La solution pour r > a est juste (7). La condition aux limites que u (a,θ ) = 0 est équivalente à l'exigence que toutes les fonctions d'ondes radiales s'annulent en r = a. Les décalages de phase peuvent alors être obtenus en posant Rl (a ) donné dans (7) égal à 0 ou γ l dans (19) égal à l'infini : (25) tan δ l =

jl (ka ) nl (ka )

Le calcul de la diffusion est particulièrement simple à la limite des faibles énergies : ka = 2πa / λ > 1 ), on peut s'attendre à retrouver le résultat classique puisqu'il est alors possible d'avoir des paquets d'ondes qui sont petit par rapport à la taille de la région diffusante et ils peuvent suivre des trajectoires classiques sans se disperser de manière appréciable. Cela correspond à la limite de l'optique géométrique en théorie ondulatoire de la lumière ou du son. La section efficace différentielle de diffusion est assez difficile à trouver et nous voulons seulement indiquer le calcul du terme dominant dans la section efficace totale. La substitution de (25) dans (15) donne 4π ∞ (2l + 1) jl2 (ka ) (28) σ = 2 ∑ 2 k l =0 jl (ka ) + nl2 (ka ) Nous pouvons utiliser les développements asymptotiques des fonctions de Bessel qui sont valides quand l'argument est grand. Le calcul montre que la plus part des contributions de la somme dans (28) viennent de (29) l < (ka ) − C (ka ) 2 1

où C est un nombre de l'ordre de l'unité. Le terme dominant ici est

1 2

(ka )2 . Les deux autres parties

de la somme, pour (ka ) − C (ka ) 2 < l < (ka ) + C (ka ) 2 et pour l > (ka ) + C (ka ) 2 contribuent chacune 1

1

1

à des termes de l'ordre de (ka ) 3 et peuvent donc être négligés à limite des hautes énergies. Donc 4

(30) σ ≈ 2πa 2 qui est deux fois la limite classique. Le terme suivant a été calculé par Rubinox et Wu. Le résultat est  0.99615   + L (31) σ = 2πa 2 1 + 2   (ka ) 3  

La raison du résultat anormal apparent (30) est que la forme asymptotique de la fonction d'onde ainsi posée dans la section précédente tel qu'à la limite classique la diffusion est comptée deux fois : une fois est la vraie diffusion (qui s'avère être à symétrie sphérique comme dans le problème classique) et à nouveau dans l'ombre de la sphère diffusante qui apparaît dans la diffusion en avant puisque cette ombre est produite par interférence entre l'onde plane incidente e ikx et l'onde diffusée f (θ )e ikr / r . Cependant, aussi longtemps que ka est fini, la diffraction autour de la sphère dans la direction en avant se produit réellement et la section efficace totale mesurée (si la mesure peut être faite pour inclure le fort pic de diffusion en avant) est approximativement 2πa 2 .

Diffusion par un puits de potentiel carré Comme deuxième exemple de la méthode des ondes partielles, considérons le problème un peu compliqué de la diffusion par un puits de potentiel carré à symétrie sphérique. La fonction d'onde intérieure (r < a) qui est finie en r = 0 est donnée par analogie avec celle que nous avions vue comme 1

(32) Rl (r ) = Bl jl (αr )

 2 µ (E + V0 )  2 α =  h2  

Donc, les décalages de phase sont donnés par (19) où le rapport de la pente à la valeur de la lième onde partielle en r = a est αj ′ (αa ) (33) γ l = l j l (αa ) A la limite basse énergie ( ka 0 agit comme une barrière de potentiel qui empêche l'évasion de la particule qui est dans ce niveau d'énergie virtuel. La figure ci-dessus illustre cette barrière qui est caractérisée par une petite transmission à basse énergie de la même manière que la barrière de potentiel qui nous avions étudiée. Donc, le niveau virtuel a une sorte d'existence transitoire et produit une plus grande distorsion de la fonction d'onde incidente à son énergie qu'aux énergies voisines. A la limite de l'énergie zéro, on peut montrer que la transmission de la barrière centrifuge est zéro et ainsi la particule ne peut pas fuir si l > 0. La résonance à énergie zéro conduit à un véritable état lié si l n'est pas zéro.

Distribution angulaire à basse énergie Quand l'énergie de bombardement est petite mais non nulle, l'onde partielle l = 2 peut avoir un effet observable sur la diffusion. Si seuls δ 0 et δ 1 sont différents de zéro de manière appréciable, les équations (14) et (15) deviennent 1 σ (θ ) = 2 sin 2 δ 0 + 6 sin δ 0 sin δ 1 cos(δ 1 − δ 0 ) cosθ + 9 sin 2 δ 1 cos 2 θ k (41) 4π σ = 2 sin 2 δ 0 + 3 sin 2 δ 1 k

[

(

]

)

En l'absence de résonance, nous voyons avec les équations (34) et (41) que le rapport des 4 contributions à la section efficace totale des ondes partielles l = 1 et l = 0 est de l'ordre de (ka ) . Cependant, le rapport du terme le plus grand dépendant de l'angle dans la section efficace 2 différentielle (qui est proportionnel à cosθ ) au terme constant est de l'ordre de (ka ) . Donc, l'onde partielle l =1 se manifeste dans la distribution angulaire à basse énergie avant de devenir significative dans la section efficace totale. Cela est dû aux interférences avec l'onde partielle plus forte l = 0. Par exemple, si δ 0 = 20° et δ 1 = 2° à une énergie de bombardement donnée, l'onde partielle l = 1 contribue seulement à 3 pour-cent de la section efficace totale mais elle rend la diffusion en avant ( θ = 0° ) 3.5 fois plus grande que la diffusion en arrière ( θ = 180° ).

V.4. Diffusion par des potentiels complexes

On a supposé jusqu'ici que l'énergie potentielle V (r ) était réelle. C'est une hypothèse naturelle puisque V est issu de la mécanique classique. Cependant, il y a des situations dans lesquelles il est utile d'utiliser un potentiel complexe comme une description fortement abrégée d'un système physique beaucoup plus compliqué. Par exemple, les neutrons peuvent être diffusés de manière élastique ou inélastique par des noyaux d'atomes. Dans le premier cas, le noyau est laissé dans son état original et la somme des énergies cinétiques du neutron et du noyau est la même avant et après la collision. Dans une collision inélastique, le noyau est laissé dans un état excité et la quantité Q, définie en relation avec la valeur de γ dans le cas inélastique, est négative. La diffusion inélastique et l'absorption de neutrons pour former un noyau différent sont des processus dans lesquels les neutrons sont enlevés du flux incident et ne réapparaissent pas comme une partie de l'amplitude de diffusion f (φ ,θ ) . Tant que l'on considère seulement l'effet de ces autres processus sur la diffusion élastique, une approximation utile consiste à voir l'interaction entre le neutron et le noyau comme étant représenté par un potentiel complexe. Cela fut utilisé la première fois dans ce but par Feshbach, Porter et Weisskopf en 1954. Cela est habituellement appelé le modèle optique du potentiel en analogie avec l'utilisation de longue date d'un indice de réfraction complexe pour discuter des propriétés optiques de médiums partiellement absorbants. Cette section décrit les modifications de la théorie développée jusqu'ici qui sont nécessaires dans l'hypothèse dans potentiel V complexe.

Conservation de la probabilité On a montré que la densité de probabilité de position P(r, t ) et la densité de courant de probabilité S(r, t ) obéissent à une relation différentielle de conservation. La dérivation de cette relation fait un usage essentiel de l'hypothèse que V est réel. Si nous supposons maintenant que V est complexe et que nous l'écrivons pour des raisons pratiques sous la forme (1) V = VR − iV I

où VR et VI sont réels, une répétition de la dérivation montre que la relation de conservation est remplacée par 2V ∂P(r, t ) (2) + ∇ ⋅ S(r, t ) = − I P(r, t ) ∂t h Puis que P est non négatif, le coté droit de cette équation agit comme une source si VI est négatif et comme une perte si VI est positif. Pour les raisons physiques discutées ci-dessus, nous supposerons toujours que VI ≥ 0 . S'il y a une région où ∇ ⋅ S = 0 , l'équation (2) montre que P diminue exponentiellement dans le temps, P ∝ e −2VI t / h et on s'attend à ce que la fonction d'onde ait une dépendance en le temps ψ ∝ e (−iE −VI )t / h . L'intégration de (2) sur un volume fixé Ω borné par la surface A conduit à ∂ 2 P(r, t )d 3 r = − ∫ S n dA − ∫ V I Pd 3 r (3) ∫ A ∂t Ω h Ω Si ψ est suffisament borné à grande distance pour que l'intégrale de surface s'annule quand Ω est l'espace entier, nous voyons que l'intégrale de normalisation décroît au cours du temps. C'est ce à quoi on s'attendait puisque les particules sont absorbées. Il est plus intéressant d'appliquer (3) à une situation de diffusion. Dans ce cas, nous demandons que ψ soit stationnaire, avec la dépendance en le temps ψ ∝ e −iEt / h . La discussion de (2) montre alors qu'il n'y a pas de région où VI ≠ 0 et ∇ ⋅ S = 0 . Le coté gauche de (3) est maintenant zéro et lorsque Ω devient grand, le premier terme sur le coté droit, − ∫ S n dA devient le flux entrant total A

de particules entrant dans Ω en venant de très grandes distances. Dans la discussion sur le comportement asymptotique dans la section précédente, il fut signalé que l'annulation de cette intégrale impliquait que les particules diffusées vers l'extérieur sont fournies par l'onde plane incidente. Dans la situation actuelle, nous voyons que cette intégrale est le flux de particules éliminées de l'onde incidence plus l'onde diffusée élastiquement par le potentiel complexe pourvu que ψ soit normalisé à une onde plane d'amplitude unité à l'infini. Elle peut donc être posée égale à

vσ abs où v est la vitesse relative et σ abs est la somme de l'absorption totale et de la section efficace inélastique. Nous obtenons donc la relation 2 2 (4) σ abs = VI ψ d 3 r ∫ hv Bien que cette équation soit valide quand ψ est normalisé de manière appropriée, elle est utile seulement si ψ est connu dans la région où VI ≠ 0 .

Décalages de phase complexes Si le potentiel est à symétrie sphérique, la méthode des ondes partielles peut être employée que V soit complexe ou non. La discussion sur le comportement asymptotique de la section précédente a montré que les décalages de phase sont réels si le potentiel l'est. Le même argument montre que δ l est généralement complexe si V est complexe et ainsi nous posons (5) δ l = α l + iβ l où α l et β l sont réel et nous définissions aussi (6) S l ≡ e

2 iδ l

=e

2 iα l − 2 β l

La dérivation de l'expression pour l'amplitude de diffusion est inchangée, ainsi l'équation devient (7) f (θ ) = (2ik )

−1



∑ (2l + 1)(S l =0

l

− 1)Pl (cosθ )

La section efficace différentielle élastique est f (θ ) et la section efficace totale élastique est 2

π

σ el = 2π ∫ f (θ ) sin θdθ 2

0

(8) = =

π k

2

π k

2

∑ (2l + 1)(1 − 2e ∞

− βl

l =0 ∞

∑ (2l + 1)1 − S l =0

2

l

cos 2α l + e

−4 βl

)

Elle se réduit à l'expression que nous avons vue quand β l = 0 comme attendu. La section efficace d'absorption peut aussi être exprimée en fonction des décalages de phase. Comme signalé ci-dessus, elle est égale à − v −1 ∫ S n dA où il est maintenant pratique de choisir la A

surface A comme une grande sphère de rayon r : 2π π 1 σ abs = − lim r 2 ∫ ∫ S r sin θdθdφ v r →∞ 0 0 (9) π 1 = − lim 2πr 2 ∫ S r sin θdθ 0 v r →∞ Le flux radial est h  ∗ ∂u ∂u ∗ u (10) S r = − 2iµ  ∂r ∂r

 u  

La dérivée de u (r ,θ ) donné au début de la section précédente donne ∞ 1 ∂χ l ∂u  1 (11) Pl (cosθ ) + O 2  =∑ ∂r l =0 r ∂r r  tel que (9) devient 2πi ∞ 1  ∗ ∂χ l ∂χ l∗   χl − (12) σ abs = χ l  ∑ ∂r ∂r k l =0 2l + 1   évalué en r = ∞ . La forme asymptotique de Rl (r ) vue dans la section précédente montre que

2

A  ∗ ∂χ l ∂χ l∗   χl χ l  → l [sin (kr − 12 lπ + α l − iβ l ) cos(kr − 12 lπ + α l + iβ l ) −  ∂r ∂r   r →∞ k (13) − cos(kr − 12 lπ + α l − iβ l )sin (kr − 12 lπ + α l + iβ l )]

=

Al

2

k

sin (− 2iβ l ) = −

i Al

2

k

sinh 2 β l

La substitution dans (12) et l'expression Al

σ abs = (14) =

π k

2

π k

2

∑ (2l + 1)(1 − e ∞

l =0

∑ (2l + 1)(1 − S ∞

l =0

2

l

−4 β l

)

2

= (2l + 1) e 2

−2 β l

conduit à

)

Nous nous attendons donc à ce que β l ≥ 0 . La section efficace totale est définie comme la somme des sections efficaces élastiques et d'absorption. Avec (8) et (14), on a 2π ∞ −2 β σ tot = 2 ∑ (2l + 1) 1 − e l cos 2α l k l =0 (15) 2π ∞ = 2 ∑ (2l + 1)[1 − Re(S l )] k l =0

(

)

Relations asymptotiques Trois relations utiles et intéressantes, le théorème de réciprocité, le théorème optique généralisé et le théorème optique, peuvent être dérivées à partir de considérations sur le comportement asymptotique de la fonction d'onde diffusée. Nous allons les obtenir dans l'ordre indiqué bien que ce ne soit pas la séquence historique. Le théorème optique fut d'abord dérivé de cette manière par

Feenberg en 1932. Cette approche fut ensuite généralisée, pour conduite aux deux autres théorèmes, par Glauber et Schomaker en 1953. Il est utile de récrire la forme asymptotique de la section précédente, avec A = 1, sous une forme qui n'insiste pas sur le rôle particulier joué par l'axe z : (16) u k (r ) → exp(ik ⋅ r ) + r −1 f (k r , k )e ikr r →∞

Ici l'onde plane est incidente le long de la direction k et l'amplitude f (k r , k ) correspond à la diffusion de k vers k r qui est un vecteur qui a la grandeur k et la direction de r. Pour une autre solution qui correspond à la direction initiale − k ′ , (17) u −k ′ (r ) → exp(− ik ′ ⋅ r ) + r −1 f (k r ,−k ′)e ikr r →∞

Puisque u k (r ) et u −k ′ (r ) satisfont tous les deux l'équation de Schrödinger avec la même valeur de E, il s'ensuit que (18) u −k ′ ∇ 2 u k − u k ∇ 2 u −k ′ = 0 que V soit réel ou complexe. L'équation (18) peut être intégrée sur un grand volume sphérique Ω de rayon r et cette intégrale peut être transformée en une intégrale sur la surface de la sphère : 2π π  ∂u ∂u  (19) ∫ u −k ′ ∇ 2 u k − u k ∇ 2 u −k ′ d 3 r = r 2 ∫ ∫  u −k ′ k − u k −k ′  sin θ r dθ r dφ r = 0 Ω 0 0 ∂r ∂r   où θ r , φ r sont les angles polaires de r par rapport à un axe polaire choisi arbitrairement. La substitution des formes asymptotiques (16) et (17) donne à la limite des grands r 2π π  1  ik r 2 ∫ ∫ ik (cosθ + coθ ′)e ikr (cosθ −cosθ ′ ) +  (1 + cosθ ′) − 2  f (k r , k )e ikr (1−cos θ ′ ) 0 0 r  r  (20)  1  ik −  (1 − cosθ ) − 2  f (k r ,−k ′)e ikr (1+cos θ )  sin θ r dθ r dφ r = 0 r  r 

(

)

où θ est l'angle entre k et r et θ ′ est l'angle entre k ′ et r. Le premier terme dans l'intégrand s'annule sur l'intégration sur les directions de r puisque pour toute paire d'angles θ , θ ′ il y a une paire qui s'annule avec π − θ ′ , π − θ . Les termes en 1 / r 2 dans l'intégrand ainsi que les autres termes en 1 / r 2 qui ont été ignorés dans le développement de (16) peuvent être négligés pour une raison qui deviendra claire dans la discussion de (22) ci-dessous. Il nous reste donc l'équation (21) ikr ∫



0

π ∫ [(1 + cosθ ′) f (k 0

]

, k )e ) ik (1−cos θ ′ ) − (1 − cosθ ) f (k r ,−k ′)e ikr (1+cos θ ) sin θ r dθ r dφ r = 0

r

qui doit être évaluée à la limite r → ∞ . Dans le premier terme, nous pouvons décaler l'axe polaire de son choix initial arbitraire vers la direction k ′ et donc remplacer les variables d'intégration θ r , φ r par θ ′ , φ ′ . Alors, avec w ≡ cosθ ′ , nous considérons l'intégrale (22) r ∫ F (w, φ ′)e ikr (1− w ) dw 1

−1

à la limite des grands r, où F (w, φ ′) ≡ ik (1 + w) f (k r , k ) . L'intégration par partie donne

i (23) F (w, φ ′)e ikr (1− w ) k

1

− −1

i k

1



−1

∂F ikr (1− w ) e dw ∂w

On voit que des intégrations par partie supplémentaires conduiraient successivement à des puissances de plus en plus grandes de r au dénominateur et ainsi seuls les premiers termes doivent être gardés à la limite r → ∞ . C'est la raison pour laquelle les termes mentionnés ci-dessus en 1 / r 2 pouvaient être négligés. Nous trouvons donc que la limite de (22) est i (24) F (1, φ ′) − F (− 1, φ ′)e 2ikr k

[

]

Avec la forme ci-dessus de F (w, φ ′) , nous voyons que F (− 1, φ ′) = 0 . Cependant le second terme de (24) pourrait avoir été éliminé avant puisque le facteur e 2ikr oscille autour de zéro lorsque r → ∞ . C'est une application de la méthode des phases stationnaires qui est quelque fois utile pour obtenir des expressions asymptotiques des intégrales. Dans ce cas, le point w = 1 est appelé point de phase stationnaire, puisque la phase de l'intégrand de (22) est stationnaire lorsque w approche l'unité.

Théorème de réciprocité Le point de phase stationnaire du premier terme de (22) est cosθ ′ = 1 ou θ ′ = 0 . Cela correspond à r le long de k ′ ou la substitution de k ′ à k r dans l'amplitude de diffusion f (k r , k ) . De plus, l'intégrand ne dépend pas de φ ′ et ainsi l'intégration sur φ ′ introduit seulement un facteur multiplicatif 2π . De même, le deuxième terme dans (22) a son point de phase stationnaire en cos α = −1 ou θ = π , tel que k r est remplacé par -k dans f (k r ,−k ′) . Nous obtenons donc le théorème de réciprocité (25) f (k ′, k ) = f (− k ,−k ′) qui dit que l'amplitude de diffusion de k à k ′ est égale à l'amplitude de diffusion pour la direction finale renversée − k ′ à la direction initiale renversée -k. Il est important de noter que ce théorème est valide que V soit réel ou complexe. Il arrive souvent que V (r ) = V (− r ) tel que V possède une symétrie par inversion de l'espace. Alors, tous les vecteurs dans le problème de diffusion peuvent être inversés sans altérer la situation physique et nous avons que (26) f (− k ,−k ′) = f (k , k ′) La combinaison de (25) et (26) conduit à un théorème de réciprocité spécialisé : (27) f (k ′, k ) = f (k , k ′)

Théorème optique généralisé La procédure suivie dans les deux sous sections précédentes peut maintenant être répétée avec u k∗′ au lieu de u −k ′ . Alors l'équation (18) est remplacée par 4iµ (28) u k∗′ ∇ 2 u k − u k ∇ 2 u k∗′ + 2 V I u k∗′ u k = 0 h L'intégration sur un grand volume sphérique Ω de rayon r conduit à

(29) r

2



π

0

0

∫ ∫

 ∗ ∂u k ∂u k∗′  4iµ  u k ′  sin θ r dθ r dφ r + 2 − uk ∂r ∂r  h 

∫Vu Ω

I

∗ k′

uk d 3 r = 0

La substitution des formes asymptotiques comme (16) dans le premier terme donne alors à la limite de r grand 2π π  1  ik r 2 ∫ ∫ ik (cosθ + cosθ ′)e ikr (cos θ −cos θ ′ ) +  (1 + cosθ ′) − 2  f (k r , k )e ikr (1−cosθ ′ ) 0 0 r  r 

 1 2ik  ik (30) +  (1 + cosθ ) + 2  f ∗ (k r , k ′)e −ikr (1−cos θ ) + 2 f ∗ (k r , k ′) f (k r , k ) sin θ r dθ r dφ r r  r r  4iµ + 2 ∫ VI u k∗′ u k d 3 r = 0 h où l'intégrale de volume est maintenant sur tout l'espace. Comme avant, le premier terme donne zéro et les termes qui sont produits de 1 / r 2 et d'exponentielles peuvent être négligés. Les deux termes exponentiels restant peuvent être évalués par la méthode des phases stationnaires. Le premier terme a son point de phase stationnaire au même endroit : cosθ ′ = 1 ou k r = k ′ . Cependant, le second terme a maintenant son point de phase stationnaire en cosθ = 1 ou k r = k plutôt qu'en k r = −k comme avant. Il y a aussi un changement de signe qui vient du signe altéré dans l'exponentielle. L'équation (30) devient donc 2π π 4iµ (31) − 4πf (k ′, k ) + 4πf ∗ (k , k ′) + 2ik ∫ ∫ f ∗ (k r , k ′) f (k r , k ) sin θ r dθ r dφ r + 2 ∫ V I u k∗′ u k d 3 r = 0 0 0 h Comme telle, cette relation n'est pas utile car le dernier terme est difficile à évaluer et n'a en général pas d'interprétation physique simple. Nous considérons donc d'abord le cas où V est réel et donc VI = 0 . L'équation (31) est alors appelée théorème optique généralisé : 2π π 2πi ∗ (32) ∫ ∫ f ∗ (k r , k ′) f (k r , k )sin θ r dθ r dφ r = f (k , k ′) − f (k ′, k ) 0 0 k

[

]

Si V possède une inversion par symétrie, la relation (27) peut être utilisée pour simplifier cette relation : 2π π 4π (33) ∫ ∫ f ∗ (k ′, k r ) f (k r , k )sin θ r dθ r dφ r = Im[ f (k ′, k )] 0 0 k Il est important de noter que les équations (31) et (32) sont valides seulement si V est réel. L'équation (33) peut être utilisée en conjonction avec l'approximation de Born, que nous verrons plus tard, de la manière suivante. L'approximation de Born donne une expression approchée extrêmement simple pour l'amplitude de diffusion f qui est du premier ordre en V et ce f est réel quand V est réel. L'équation (33) nous permet donc de calculer la partie imaginaire de f qui est à l'ordre le plus bas en V et de montrer qu'elle est en réalité du second ordre.

Théorème optique Il y a une situation dans laquelle l'intégrale de volume dans (31) a une interprétation physique simple, c'est-à-dire quand k ′ = k . Alors, en accord avec (4), 1 (34) ∫ V I u k∗ u k d 3 r = hvσ abs 2 puisque la normalisation de u k est en accord avec celle utilisée plus tôt pour ψ . Alors l'équation (31) devient 2π π 4π 2 (35) ∫ ∫ f (k r , k ) sin θ r dθ r dφ r + σ abs = Im[ f (k , k )] 0 0 k Le premier terme sur le coté gauche est la section efficace totale élastique σ el tel que le coté gauche est égal à σ tot . Nous obtenons donc le théorème optique : 4π (36) σ tot = σ el + σ abs = Im[ f (k , k )] k

C'est une généralisation de la section efficace totale vue dans la section précédente en ce qu'elle s'applique même quand V n'est ni à symétrie sphérique ni réel. En réalité, le théorème optique est même valide plus généralement que ce qu'indique la phrase précédente car il peut être dérivé dans référence à un potentiel. Tout ce qui est nécessaire est la forme asymptotique de la densité de courant de probabilité S (r, t ) obtenue avec (16). Alors, l'intégrale de sa composante radiale sur une sphère infinie est proportionnelle au taux de disparition des particules de l'onde plane plus l'onde diffusée et donc est proportionnelle à σ abs . L'équation (36) suit alors immédiatement de l'application de la méthode des phases stationnaires. Le théorème optique est également valide quand la relativité restreinte est prise en compte. On voit que f (k , k ) entre dans le théorème optique à travers une interférence entre les ondes

planes et diffusées dans (16). Cette interférence est caractérisée par le facteur de phase e ikr (1−cos θ ) qui, comme fonction de θ , oscille rapidement autour de zéro pour de grands r excepté dans le voisinage de θ = 0 . Donc, la densité de courant de probabilité asymptotique consiste en une partie de l'onde plane seule qui est partout dans la direction k, une partie de l'onde diffusée seule qui est toujours radialement sortante et qui s'intègre en σ el et une partie qui vient de l'interférence. Cette dernière est appréciable seulement quand kr (1 − cosθ ) ≤ 1 et proche de 1. Pour de grands kr et de

petits θ , c'est équivalent à θ ≤ (kr ) 2 . Dans cette région angulaire, l'onde diffusée interfère de manière destructive avec l'onde plane enlevant donc de l'onde plane juste assez du flux incident pour prendre en compte l'absorption et la diffusion inélastique et toute la diffusion élastique sauf pour les angles infinitésimaux. −

1

Dans la région asymptotique, ce domaine angulaire d'interférence peut être vu comme un résidu de l'ombre qui ne peut pas s'étendre au-delà d'une distance rs telle que la partie qui interfère ou la

partie imaginaire de l'amplitude diffusée en avant, Im[ f (k , k )] / rs est de l'ordre de l'amplitude de

l'onde plane, qui est l'unité, et donc rs ~ Im[ f (k , k )] ~ kσ tot . A cette distance limite, le diamètre de

l'ombre est d ~ (rs / k ) 2 ~ (σ tot ) 2 . Maintenant, σ tot est de l'ordre du carré du diamètre du diffuseur 1

1

à la limite classique ou des courtes longueurs d'ondes. Donc le diffuseur et l'ombre sont à peu près de la même taille à la distance limite où l'ombre existe, comme on s'y attendrait.

V.5. Diffusion par un champ coulombien On avait noté plus tôt que le champ coulombien est un diffuseur exceptionnel en ce qui concerne l'application de la méthode des ondes partielles. Si V (r ) = ZZ ′e 2 / r pour une collision entre des particules de charge Ze et Z ′e , il est facile de voir que la relation (3) de la section sur la diffusion par un potentiel sphérique devient (1) χ l (r ) ∝ e ± i (kr −n ln r ) Ici n = µZZ ′e 2 / h 2 l = ZZ ′e 2 / hv où v est la vitesse relative et µ la masse réduite. Donc, les solutions radiales n'approchent jamais les solutions sinusoïdales des particules libres puisqu'il y a toujours une contribution logarithmique à la phase à grande distance qui ne peut pas être négligée. Bien qu'il soit encore possible d'obtenir une solution de ce problème de diffusion en coordonnées sphériques (nous verrons cela plus loin), les décalages de phase δ l que nous avions introduit sont altérés de manière significative. Cette section présente le travail analytique dans les grandes lignes et indique les principaux résultats d'un traitement plus approfondi.

Coordonnées paraboliques Aussi longtemps que σ (θ ) pour un champ coulombien pur est tout ce qui souhaité, il est plus simple de travailler avec la séparation de l'équation de Schrödinger en coordonnées paraboliques qu'en coordonnées sphériques. La raison en est que la solution désirée dépend presque entièrement de la variable ξ définie ci-dessous et pas des deux autres variables η et φ . Les coordonnées paraboliques ξ , η et φ sont données en fonction des coordonnées sphériques par les relations ξ = r − z = r (1 − cosθ ) (2) η = r + z = r (1 + cosθ )

φ =φ

Les surfaces de ξ constant sont un ensemble de paraboloïdes confocaux de révolution autour de l'axe z ou axe polaire avec le foyer à l'origine qui sont ouvert dans la direction des z positifs ou θ = 0 . Les surfaces de η constant sont des ensembles similaires de paraboloïdes confocaux qui s'ouvrent dans la direction des z négatifs ou θ = π . Les surfaces de φ constant sont les mêmes qu'en coordonnées sphériques : des plans autour de l'axe polaire. L'équation de Schrödinger pour un potentiel coulombien en coordonnées paraboliques est h 2  4  ∂  ∂u  ∂  ∂u  1 ∂ 2 u  2 Ze 2 η  + + (3) − u = Eu  −  ξ 2 µ ξ + η  ∂ξ  ∂ξ  ∂η  ∂η  ξη ∂φ 2  ξ + η La séparation est obtenue en substituant (4) u (ξ ,η , φ ) = f (ξ )g (η )Φ (φ ) dans(3) et en divisant par u. La partie φ de l'équation se sépare immédiatement : (5)

4ξη  1 d  df  1 d  dg  4µZe 2ξη 2µ E ξη 1 d 2Φ     + + − = − ξ η   Φ dφ 2 ξ + η  f dξ  dξ  g dη  dη  h 2 (ξ + η ) h2

Puisque le coté gauche de (5) dépend seulement de ξ et η et le coté droit seulement de φ , les deux cotés doivent être égaux à une constante que nous appelons m 2 . Cela donne la solution en φ normalisée : (6) Φ m (φ ) = (2π ) 2 e imφ −

1

Le reste de l'équation (5) peut être séparé en parties ξ et η :  1 d  dg  m 2 µ E  µZe 2 1 d  df  m 2 µ E  ξ  − η  − − 2 ξ + 2 = − − 2 η = ν f dξ  dξ  4ξ 2h h  g dη  dη  4η 2h  où la constante de séparation ν est déterminée par les conditions aux limites. Donc les équations pour f et g sont

(7)

  df   m 2 µ E ξ µZe 2  ξ  −  + − 2 + ν  f = 0 2 h 2h  dξ   4ξ  (8)  d  dg   m 2 µ E η η  −  + − ν  g = 0 2 dη  dη   4η 2h  d dξ

Puisque ces deux équations sont de la même forme et diffèrent seulement dans leurs termes constants, il est suffisant d'en résoudre une. Il est apparent que la solution n'impliquera pas φ à cause de la symétrie axiale du problème. Si maintenant le terme e ikz de l'onde plane incidente est sorti comme facteur, il est plausible que le reste de la solution n'implique pas η . Nous posons (9) u c = e ikz f où u c représente la fonction d'onde coulombienne complète (onde incidente plus diffusée). Maintenant u c doit contenir une partie dont le comportement asymptotique dominant est de la forme r −1e ikr mais aucune partie qui se comporte comme r −1e −ikr . Puisqu'une expression e ikz f (r − z ) peut être de cette forme tandis qu'une expression e ikz f (r + z ) ne le peut pas, nous anticipons que la fonction f apparaissant dans (9) dépendra seulement de ξ = r − z . Nous substituons (2) dans (3) après avoir remplacé Z par − ZZ ′ et en nous souvenant que E > 0 . L'équation différentielle pour f est alors d2 f df (10) ξ + (1 − ikξ ) − nkf = 0 2 dξ dξ L'équation hypergéométrique confluente d 2F dF − aF = 0 (11) z 2 + (b − z ) dz dz qui a la solution F (a, b, z ) est équivalente à (10) si nous posons (12) f (ξ ) = CF (− in,1, ikξ )

où C est une constante.

Fonction hypergéométrique confluente La solution de (11) qui est régulière en z = 0 peut être écrite comme un développement en série : ∞ Γ(a + s )Γ(b )z s F (a, b, z ) = ∑ s = 0 Γ (a )Γ (b + s )Γ (1 + s ) (13) az a (a + 1)z 2 = 1+ + +L b1! b(b + 1)2! Il est utile de poser F (a, b, z ) = W1 (a, b, z ) + W2 (a, b, z où W1 et W2 sont séparément solutions de (11). Un développement asymptotique pour F peut alors être obtenu à partir des relations suivantes : Γ(b ) (− z )−& g (a, a − b + 1,− z ) W1 (a, b, z ) = Γ(b − a ) Γ(b ) z a −b (14) W2 (a, b, z ) = e z g (1 − a, b − a, z ) Γ(a ) αβ α (α + 1)β (β + 1) g (α , β , z ) → 1 + + +L z →∞ z1! z 2 2! La solution de (11) qui est régulière à l'origine peut être prise comme (15) G (a, b, z ) = iW1 (a, b, z ) − iW2 (a, b, z ) Nous prendrons la solution non régulière pour les problèmes dans lesquels le champ coulombien ne s'étend pas en r = 0. La forme asymptotique de la fonction d'onde coulombienne peut être obtenue à partir des équations (1), (12) et (14). Le résultat à des termes de l'ordre r −1 est

1 nπ 2

 i [kz + n ln k (r − z )]   Ce n2  + e 1 + r −1 f c (θ )e i (kr − n ln 2 kr )     r →∞ Γ (1 + in )  ik (r − z )   

(16) u c → où

f c (θ ) =

(17) =

1   −in ln  sin 2 θ  2  

Γ(1 + in ) e 1 iΓ(− in ) 2k sin 2 θ 2

1   −in ln  sin 2 θ  + iπ + 2 iη 0 2  

n

e 1 2k sin θ 2 η 0 = arg Γ(1 + in ) 2

Rappelons que la fonction arg pour un nombre complexe est définie comme φ = arg z avec

z = z e iφ . Section efficace de diffusion et renormalisation Le terme f c sur le coté droit de (16) représente l'onde diffusée sortante puisque c'est le seul terme dans lequel le facteur r −1e ikr apparaît. Le premier terme dans (16) correspond de même à l'onde incidente "plane". Le facteur multiplicatif − n 2 / ik (r − z ) peut être ignoré dans la région asymptotique. Les ondes incidentes et diffusées sont déformées à des distances infinies par des facteurs de phase logarithmiques. La section efficace différentielle de diffusion est

σ c (θ ) = f c (θ ) (18)

2

2

  n  =  2 1   2k sin 2 θ 

 ZZ ′e 2   cosec 4 12 θ =  2   2 µv 

2

C'est exactement la formule obtenue par Rutherford à partir de la dynamique classique et qui a été vérifiée expérimentalement par les collisions de particules alpha (noyaux d'hélium) avec des noyaux lourds. On notera, cependant, que la partie dépendant de l'angle du facteur de phase dans l'amplitude diffusée f c (θ ) donnée dans l'équation (17) peut se manifester de manière non classique quand les particules qui se heurtent sont identiques (on verra cela plus tard). Si le flux incident est normalisé au flux unité, la constante C doit être choisie comme −

1 2

1 − nπ 2

(19) C = v Γ(1 + in )e et la fonction d'onde coulombienne est ainsi −

(20)

1

u c = v 2 Γ(1 + in )e −

1

= v 2 Γ(1 + in )e

1 − nπ 2

1 − nπ 2

e ikr F (− in,1, ikξ )

(

e ikr cos θ F − in,1,2ikr sin 2 12 θ

)

Alors la densité de particules en r = 0 est trouvée à partir du développement en série (13) comme 2 2 2 u c (0) = C = v −1 Γ(1 + in ) e − nπ (21) 2nπ = v e 2πn − 1

(

)

Pour de petites vitesses de collision ( n >> 1 ), l'équation (21) nous dit que u c (0 ) ≈

2π n

u c (0 ) ≈

2π n

2

(22) 2

cas attractif, n < 0

v v

e −2 nπ

cas répulsif, n > 0

La deuxième équation (22) a un certain intérêt pratique. L'exponentielle est le facteur dominant dans le taux de réactions entre des noyaux positivement chargés pour des énergies de bombardement faibles, quand le rayon nucléaire peut être supposé suffisament petit pour que les noyaux qui se heurtent passent à travers la barrière de potentiel par effet tunnel jusqu'à la distance

2

zéro afin d'initier une réaction. Dans ce cas, E −2πZZ ′e / hv est appelé le facteur de Gamow et c'est le terme dominant dans le taux de plusieurs réactions nucléaires pour de faibles énergies de bombardement.

Solution en coordonnées sphériques Dans les problèmes de collisions nucléaires, tel que celui de la diffusion de protons de plusieurs millions d'électrons volts dans l'hydrogène, l'écart à la loi de Coulomb de l'interaction à courte distance entre les particules en collision peut affecter la section efficace de diffusion. De tels problèmes peuvent être traités par une modification de la méthode des ondes partielles développée précédemment dans laquelle un développement en harmoniques sphériques est fait pour le pur champ coulombien et des modifications introduites pour les premières valeurs de l. Afin d'appliquer une telle technique, nous souhaitons d'abord une solution pour la diffusion purement coulombienne en ondes partielles sphériques. Nous posons ∞

(23) u c = ∑ Rl (r )Pl (cosθ ) l =0

où l'équation de Schrödinger radiale est 1 d  2 dRl   2 2nk l (l + 1)  − Rl = 0 (24) 2 r + k − dr   r r dr  r 2  Si nous substituons Rl (r ) = r l e ikr f l (r ) , l'équation pour f l devient (25) r

d 2 fl df + [2ikr + 2(l + 1)] l + [2ik (l + 1) − 2nk ] f l = 0 2 dr dr

C'est l'équivalent de l'équation hypergéométrique confluente (11) et elle a comme solution régulière en r = 0 (26) f l (r ) = C l F (l + 1 + in,2l + 2,−2ikr )

La forme asymptotique de (26) peut être trouvée de (14) et donne pour la fonction d'onde radiale à grande distance (27) Rl (r ) →

Cl e

Γ(2l + 2 )

(2k ) Γ(l + 1 + in )kr = arg Γ(l + 1 + in ) . l

r →∞

où η l

1 nπ + iηl 2

sin (kr − 12 lπ − n ln 2kr + η l )

Les coefficients C l doivent être déterminés tel que le développement en ondes partielles (23) soit identique avec la solution (20) en coordonnées paraboliques. A cause de l'orthogonalité des polynômes de Legendre, nous avons la relation 2l + 1 π (28) Rl (r ) = Pl (cosθ )u c (r ,θ )sin θdθ 2 ∫0 où u c (r ,θ ) est donné par la deuxième équation (20). L'évaluation complète de cette intégrale peut être évitée en utilisant le fait que nous savons tout de la fonction Rl (r ) excepté le facteur

multiplicatif C l . C l peut être trouvé en faisant correspondre la forme connue de Rl (r ) de (12) près de r = 0. C'est-à-dire

(2ik ) e l

(29) C l =

1 − nπ 2

Γ(l + 1 + in )

1 2

v (2l )!

Nous obtenons donc comme expression alternative à (20) 1 1 − − nπ ∞ Γ (l + 1 + in ) 2 (2ikr )l e ikr F (l + 1 + in,2l + 2,−2ikr )Pl (cosθ ) (30) u c = v e 2 ∑ (2l )! l =0 Il est aussi possible de développer f c (θ ) donné par (17) en une série de polynômes de Legendre. Le résultat est 1 ∞ (31) f c (θ ) = (2l + 1)e 2iηl Pl (cosθ ) ∑ 2ik l =0

Cela semble surprenant au premier abord puisque f c (θ ) ne semble pas s'annuler à la limite n → 0 , ce qui correspond à aucune interaction. Nous obtenons à la place 1 ∞ (32) lim f c (θ ) = ∑ (2l + 1)Pl (cosθ ) n →0 2ik l =0 La série sur la droite peut être sommée pour donner ∞

(33)

∑ (2l + 1)P (cosθ ) = 4δ (1 − cosθ ) l =0

l

L'équation (33) peut être vérifiée en multipliant des deux cotés par Pl ′ (cosθ ) et en intégrant sin θdθ de 0 à π et en se souvenant que l'intégrale sur la droite est effectuée sans passer par le point θ = 0 . Nous trouvons donc que f c (θ ) s'annule effectivement à la limite n → 0 pour θ ≠ 0 mais qu'elle a une singularité de Dirac en θ = 0 telle que θ i (34) lim ∫ 0 f c (θ ) sin θdθ = − 0 n →0 k pour toute valeur finie θ 0 . L'équation (34) est facilement vérifiée par intégration directe de (17) pourvu que la valeur de l'intégrale à la limite inférieure soit interprétée comme la moyenne de sa valeur en ε lorsque ε → 0 . Ce comportement particulier vient du caractère longue portée du champ coulombien. Peut importe la faiblesse de l'interaction elle force toujours les particules qui passent à grande distance à être déviée d'un très petit angle.

Champ coulombien modifié Si le potentiel réel dévie de la forme coulombienne pour seulement de petites valeurs de r, nous nous attendons, en analogie avec le traitement des ondes partielles, que seules les premiers termes de (30) soient altérés. Puisque chaque fonction d'onde radiale partielle doit être une solution de (24) en dehors de l'anomalie de potentiel, le seul changement que nous pouvons faire dans la fonction f l et être encore une solution de (25) est d'ajouter une certaine fonction irrégulière G (l + 1 + in,2l + 2,−2ikr ) défini par (15). La manière avec laquelle G est ajoutée est déterminée par

l'exigence que la fonction d'onde complète doit représenter asymptotiquement une onde coulombienne incidente plus diffusée plus une onde diffusée supplémentaire sortante. Nous devons donc substituer à chaque terme F dans (30) une combinaison linéaire de F et G dans laquelle la quantité du terme entrant W2 est inchangée. Une telle combinaison est (35) eiδ l (F cos δ l + G sin δ l ) = W1e 2iδ l + W2 La fonction d'onde modifiée, qui est une solution de l'équation de Schrödinger sortante de l'anomalie de potentiel, peut alors être écrite 1 1 − − nπ ∞ Γ(l + 1 + in ) 2 (36) um = uc + v e 2 ∑ (2ikr )l eikr e 2iδ l − 1 W1 (l + 1 + in,2l + 2,−2ikr )Pl (cosθ ) (2l )! l =0

(

)

La forme asymptotique de u m est (37) um → v r →∞



1 ∞ 2

∑ (2l + 1)i e (η δ ) (kr ) l =0

l i

l+ l

−1

sin (kr − 12 lπ − n ln 2kr + ηl + δ l )Pl (cosθ )

Comme montré en relation avec la forme asymptotique de χ l dans l'analyse des potentiels sphériques, si V est réel, chaque terme sur le coté droit de (37) doit être une fonction réelle de r excepté pour des facteurs multiplicatifs complexes, tel que δ l soit être réel. Les décalages de phase supplémentaires δ l peuvent être trouvés en faisant correspondre chaque onde radiale partielle dans (36) avec la solution intérieure au bord de l'anomalie de potentiel, exactement de la même manière que les décalages de phase furent trouvés dans l'analyse des potentiels sphériques. Bien que les décalages de phase δ l représentaient l'écart de la fonction d'onde à celle d'une particule libre, elles représentent ici l'écart de la fonction d'onde à celle d'une particule diffusée par un champ coulombien pur. Le calcul de δ l dans (36) nécessite la connaissance de G pour de petits r. Les formules ont été données par Yost, Wheeler et Breit en 1936. On peut montrer à partir de (36) que la forme asymptotique de u m peut être écrite sous la forme (16) où f c (θ ) est remplacée par



(38) f m (θ ) = f c (θ ) + ∑ k −1 (2l + 1)e l =0

(

i 2ηl +δ l

)

sin δ l Pl (cosθ )

La section efficace différentielle de diffusion est juste f m (θ ) et contient en général des termes 2

d'interférence entre l'amplitude de diffusion coulombienne f c (θ ) et les termes supplémentaires qui sont déterminés par les δ l .

Il est important de noter que ces δ l ne sont pas égaux à ceux qui seraient obtenus de l'anomalie de potentiel en l'absence du champ coulombien.

Limite classique pour un champ coulombien pur Comme cela a déjà été discuté, nous nous attendons à ce que les résultats des théories quantiques et classiques coïncident quand il est possible de construire des paquets d'ondes qui suivent la trajectoire classique sans se disperser de manière appréciable et qui sont assez petits pour que les forces soient sensiblement constantes sur leurs dimensions. La plus petite dispersion d'un paquet d'ondes durant un intervalle de temps t fut trouvée être de l'ordre de (ht / µ ) 2 ou (hd / µv ) 2 = (Dd ) 2 où d = vt est la distance parcourue par le paquet d'ondes durant le temps t et D ≡ λ / 2π = h / µv est la longueur d'onde réduite du mouvement relatif. Donc, la théorie classique peut être utilisée quand 1

(Dd ) 2

1

> 1 où d est la distance sur laquelle la force varie d'une fraction appréciable. Pour un champ coulombien répulsif, d est de l'ordre de la distance classique d'approche ZZ ′e 2 / 12 µv 2 . Cela fournit aussi une estimation utile pour un champ coulombien 1

1

attractif puisque dans toutes les collisions, excepté le nombre relativement faible où les particules sont diffusées sur de grands angles, elles ne vont jamais plus proche que cette distance. La condition pour la validité de la théorie classique est alors 1 ZZ ′e 2 (39) n 2 = >> 1 hv

1

De grands n impliquent que la partie dépendant de l'angle de la phase de f c (θ ) donnée par (17) varie rapidement avec θ afin que ces oscillations rapides dans l'amplitude de diffusion aient peu d'effet sur la diffusion quand les particules sont identiques. Il est intéressant de noter que pour le champ coulombien, la limite classique est approchée pour de petits v tandis que pour des potentiels qui ont un domaine fini a tels que ceux discutés précédemment, la limite classique est approchée quand (a / D ) 2 >> 1 , c'est-à-dire pour de grands v. 1

Cela est dû à la "taille" ZZ ′e 2 / µv 2 du champ coulombien qui s'accroît plus rapidement que D = h / µv lorsque v décroît.

Exercices 1. Montrez que les coefficients de diffusion par un puits de potentiel carré à une dimension sont donnés par l'équation (7) de la section V.1 si le signe de V0 y est changé ainsi que dans l'expression de α . Discutez de la dépendance du coefficient de transmission avec E dans ce cas. 2. Montrez que les équations (10) et (13) de la section V.2 sont valides pour une collision binaire générale si γ est donné par (11). Utilisez la conservation de l'énergie et de la masse. 3. Montrez que quand une particule de masse m1 entre en collision élastique avec une particule de masse m2 qui est initialement au repos, toutes les particules éjectées (de masse m2 ) sont diffusées dans l'hémisphère avant dans le système de coordonnées du laboratoire. Si la distribution angulaire est à symétrie sphérique dans le système du centre de masse, quelle estelle pour m2 dans le système du laboratoire ? 4. Exprimez la fonction d'onde diffusée (1) de la section V.3 hors du potentiel de diffusion (mais pas nécessairement dans la région asymptotique) comme la somme d'une onde plane et d'une série infinie de fonctions de Hankel sphériques du premier type (voir les équations (13) de la section IV.3). A partir de cette expression et de la discussion des équations (14) de la section IV.3, montrez que l'onde diffusée est purement sortante même dans la région asymptotique. 5. Deux objets A et B, ont des formes irrégulières et sont identiques en taille et forme. L'objet A est remplit avec un potentiel positif infini (impénétrable) et diffuse des particules de masse m. L'objet B est fait de métal et a une certaine capacité électrostatique C quand il est isolé des autres objets. Dérivez des expressions pour les sections différentielles et totales pour la diffusion élastique de particules de masse m par l'objet A à la limite k  0 et en fonction de la capacité C de l'objet B. 6. Trouvez une expression générale pour le décalage de phase produit par un potentiel de diffusion V (r ) = A / r 2 , où A > 0. La section efficace totale est-elle finie ? Si non, est-ce que la divergence se produit pour de petits angles de diffusion ou de grands angles et pourquoi ? Quelles modifications du calcul sont nécessaires si A < 0 ? Y a-t-il des difficultés rencontrées dans ce dernier cas ?

7. Que doit valoir V0 a 2 pour un puits de potentiel carré à trois dimensions afin que la section de diffusion totale soit zéro à une énergie de bombardement égale à zéro (effet RamsauerTownsend) ? Trouvez le terme dominant dans les expressions des sections efficaces différentielles et totales pour de faibles énergies de bombardement. Montrez que les ondes partielles avec l > 2 peuvent être négligées. 8. Enoncez clairement les hypothèses qui mènent à la dérivation de l'équation (40) de la section V.3 et vérifiez que c'est une approximation appropriée pour la section efficace totale pour de faibles énergies de bombardement quand l'onde l = 0 est en résonance. 9. Utilisez l'équation (40) de la section V.3 et le résultat du problème 5 à la fin de la section IV.3 pour obtenir une expression approchée de la section efficace totale de diffusion par un potentiel particulier en fonction de l'énergie de bombardement E et de l'énergie de liaison ε d'une particule dans ce potentiel, quand E et ε sont petit par rapport à V0 . 10. Calculez et tracez en, coordonnées polaire la section efficace différentielle d'une sphère parfaitement rigide lorsque ka = 1 / 2 en utilisant les trois premières ondes partielles (l = 0, 1, 2). Quelle est la section efficace totale dans ce cas et quelle est la précision approchée de ce résultat quand les trois termes sont utilisés ? 11. Calculez les sections efficaces élastiques de diffusion et d'absorption pour un potentiel de la forme V (r ) = −V0 (1 + iξ ) si r < a et V (r ) = 0 si r > a. V0 et ξ sont positifs. Supposez que k et ξ sont très petits et qu'il n'y a ni résonance ni effet de Ramsauer-Townsend. Gardez seulement le terme dominant en k et ξ dans chaque section efficace. 12. Montrez que l'inégalité suivante est valide pour tout potentiel :

 kσ  σ el (0) ≥  tot   4π  La quantité à gauche est la section efficace différentielle de diffusion élastique dans la direction en avant. 13. Des protons de 200000 eV sont diffusés par de l'aluminium. L'intensité diffusée directement vers l'arrière ( θ = 180° ) est trouvée égale à 96% de celle calculée avec la formule de Rutherford. Supposez que cela est dû à une modification du potentiel coulombien à suffisament courte portée pour que seule le décalage de phase l = 0 soit affecté. Cette modification est-elle 2

attractive ou répulsive ? Trouvez le signe et la grandeur du changement du décalage de phase pour l = 0 produit par la modification.

VI. Formulation matricielle Dans les chapitres précédents, l'équation d'onde de Schrödinger a été développée et ses solutions obtenues dans un certain nombre de cas physiquement intéressants. Nous allons maintenant revenir à la formulation de la mécanique quantique que nous avons partiellement utilisée au début avec la forme matricielle, par exemple de l'hamiltonien, mais que nous allons développer de manière plus formelle et plus systématique. Dans cette formulation, les variables telles que les coordonnées, les composantes de l'impulsion et l'énergie d'une particule apparaissent explicitement dans les équations du mouvement du système sans devoir les multiplier ou différentier une fonction d'onde. Les équations classiques ont exactement cette structure et ainsi on peut s'attendre à ce qu'il y ait une plus grande ressemblance entre le formalisme classique et quantique ici que dans la théorie de Schrödinger. C'est réellement le cas. La principale différence formelle est que les variables dynamiques quantiques n'obéissent pas à la loi commutative de la multiplication. Il est pratique de représenter de telles variables dynamiques non commutatives, qui sont souvent simplement appelées opérateurs, comme des matrices. La théorie matricielle fournit un schéma de représentation particulièrement flexible puisqu'il y a un nombre arbitrairement grand de manières de choisir les lignes et les colonnes d'une matrice, toutes étant également valides. C'est suite à cette ressemblance formelle entre la mécanique quantique matricielle et la dynamique classique que la mécanique quantique matricielle fut historiquement la première formulation de la théorie quantique à être découverte, par Heisenberg en 1925. La relation entre la mécanique quantique matricielle et l'équation de Schrödinger fut établie par Schrödinger et Eckart en 1926. Dans ce chapitre, nous allons d'abord rappeler brièvement les plus importantes propriétés des matrices puis montrer leur relation avec la théorie quantique et leur utilité dans des problèmes particuliers.

VI.1. Algèbre matricielle Nous allons restreindre notre discussion d'abord aux matrices qui ont un nombre fini de lignes et de colonnes puis nous indiquerons comment les résultats obtenus peuvent être étendus aux matrices qui ont un nombre infini de lignes et de colonnes.

Addition et multiplication matricielle Une matrice est un tableau carré ou rectangulaire de nombres qui peut être ajoutée ou multipliée à une autre matrice selon certaines règles. Nous indiquerons une matrice par une lettre majuscule, telle que A, et les nombres ou éléments qui la composent par la même lettre avec des indices, tel que Akl . Ici, k désigne la ligne et l la colonne où l'élément de matrice Akl apparaît. Deux matrices peuvent être additionnées quand elles ont le même rang, c'est-à-dire le même nombre lignes et le même nombre de colonnes. L'addition est commutative : (1) A + B = B + A Si la matrice somme est appelée C, alors (2) C kl = Akl + Bkl Une matrice peut multiplier à gauche une matrice B si le nombre de colonnes de A est égal au nombre de lignes de B. Alors, la matrice produit C a le nombre de lignes de A et le nombre de colonnes de B. (3) C = AB C kl = ∑ Akm Bml m

où la sommation se fait sur l'indice m qui indique les colonnes de A et les lignes de B. Il suit directement de (2) et (3) que la loi de distributivité de la multiplication est valide (4) A(B + C ) = AB + AC De même, la loi d'associativité de la multiplication (et de l'addition) est valide : (5) A(BC ) = ( AB )C

où le coté gauche signifie que A multiplié à gauche le produit de B et de C tandis que le coté droit signifie que le produit de A et de B multiplie à gauche C. Le produit (5) s'écrit simplement comme ABC et, à l'aide de (3), a la forme explicite (6) D = ABC Dkl = ∑ Akm Bmn C nl m,n

Il est clair, en voyant (3) que AB n'est, en général, pas égal à BA . Donc la loi de commutativité de la multiplication n'est généralement pas valide.

Matrices nulles, unités et constantes Pour une matrice carrée arbitraire A, la matrice nulle O est définie par les équations AO = O (7) OA = O d'où il suit que tous les éléments de O sont zéro. Si A n'est pas carré, les éléments de O sont encore zéro mais les O qui apparaissent aux différents endroits dans (7) n'ont pas le même nombre de lignes et de colonnes. La matrice unité 1 est définie par (8) 1 A = A B1 = B pour des matrices arbitraires A et B. A partir de (8), il s'ensuit que 1 est une matrice carrée dont le rang (le nombre de lignes ou de colonnes) est égal au nombre de lignes de A ou au nombre de colonnes de B. De plus, 1 doit avoir des éléments unité le long de sa diagonale principale (k = l) et zéro autre part tel que les éléments de 1 sont égaux au symbole de Kronecker δ kl . Le produit d'un nombre c et d'une matrice A est la matrice cA qui est obtenue en multipliant chaque élément de A par c. Donc, si nous définissons une matrice constante C comme un multiple de la matrice unité tel que chaque élément non nul est c au lieu de l'unité, alors (9) cA = CA C kl = cδ kl

Trace, déterminant et inverse d'une matrice La trace d'une matrice, parfois appelée somme diagonale, est la somme des éléments diagonaux de la matrice :

(10) tr ( A) = ∑ Akk k

Il est facile de montrer, avec l'aide de (3), que la trace possède la propriété cyclique (11) tr ( ABC L EF ) = tr (BC L EFA) La déterminant d'une matrice carrée, noté det ( A) , est trouvé par la méthode habituelle de calcul de déterminant d'un tableau carré de nombre. Nous ne le détaillerons pas ici. Si A et B sont carrés et de même rang, alors (12) det ( AB ) = det ( A) ⋅ det (B ) Une matrice peut ou non posséder une inverse A −1 qui est définie par les relations (13) AA −1 = 1 A −1 A = 1 A est dite non singulière si elle possède une inverse et singulière sinon. Si A est non singulière et de rang fini, on peut montrer qu'elle est carrée et qu'une des deux équations (13) implique l'autre. L'élément kl de A −1 est juste le cofacteur de Akl divisé par det ( A) . Donc, A est singulière si son déterminant s'annule. On vérifie facilement que pour des matrices non singulières A, B, C −1 (14) ( ABC ) = C −1 B −1 A −1

Matrices hermitiques et unitaires L'adjoint hermitique A + d'une matrice A est la matrice obtenue en échangeant les lignes et les colonnes (transposée) et en prenant le complexe conjugué de chaque élément. Donc, si (15) B = A + , alors Bkl = Alk∗ On vérifie facilement que l'adjoint hermitique du produit d'une série de matrices est le produit de leurs adjoints dans l'ordre inverse : + (16) ( ABC ) = C + B + A +

Une matrice est hermitique ou auto adjointe si elle est égale à son adjoint hermitique. Donc, H est hermitique si (17) H = H + Evidemment, seules les matrices carrées peuvent être hermitiques. Une matrice est unitaire si son adjoint hermitique est égal à son inverse. Donc, U est une matrice unitaire si (18) U + = U −1 ou si UU + = 1 et U +U = 1 Les matrices unitaires de rang fini doivent être carrées et l'une des deux dernières relations dans (18) entraîne l'autre.

Transformation et diagonalisation des matrices Nous définissons la transformation d'une matrice carrée A en une matrice carrée A′ par une matrice non singulière S par l'équation suivante : (19) SAS −1 = A′ Il est alors évident que S −1 retransforme A′ en A. La forme d'une équation matricielle est inaffectée par une transformation. Donc, l'équation (20) AB + CDE = F peut être transformée en (21) SABS −1 + SCDES −1 = SFS −1 ce qui est équivalent à (22) SAS −1 SBS −1 + SCS −1 SDS −1 SES −1 = SFS −1 ou (23) A′B ′ + C ′D ′E ′ = F ′ où l'apostrophe désigne les matrices transformées. Cette invariance des équations matricielles par rapport aux transformations rend possible de travailler avec toute transformation pratique d'un

ensemble de matrices sans affecter la validité de tout résultat obtenu. On notera aussi que tr ( A) et det ( A) sont inchangés par une transformation. Une matrice carrée est diagonale si elle a des éléments non nuls seulement le long de sa diagonale principale (k = l). Les éléments diagonaux sont alors appelés les valeurs propres de la matrice. Il est facile de voir que la puissance nième d'une matrice diagonale est aussi diagonale et a comme valeurs propres les puissances nième des valeurs propres de la matrice originale. La matrice A dans (19) est dite diagonalisée par la matrice S si la matrice A′ qui résulte de la transformation est diagonale, tel que Akl′ = Ak′ δ kl . Pour trouver A′ explicitement, multiplions (19) à droite par S, où nous supposons qu'un tel S existe. (24) SA = A′S L'ensemble des équations algébriques qui sont obtenues en écrivant les éléments de (24) pour une ligne particulière k et toute colonne l est (25) ∑ S km Aml = Ak′ S kl ou ∑ S km ( Aml − Ak′ δ ml ) = 0 m

m

où Ak′ est une valeur propre particulière de A′ et l'indice m est supposé aller de un jusqu'au rang N de la matrice A. (25) peut être vu comme un ensemble de N équations algébriques homogènes pour les éléments de matrice S km où k est fixé. La condition nécessaire et suffisante pour que ces équations aient une solution est que le déterminant de leurs coefficients s'annule ou que le déterminant de la matrice carrée ( Aml − Ak′ δ ml ) soit zéro. Cela fournit une équation algébrique simple appelée équation séculaire, qui est d'ordre N et a N racines Ak′ . Donc, les valeurs propres de la matrice diagonale A′ résultant de A par transformation sont les mêmes quelle que soit la manière dont A est diagonalisée, excepté peut-être pour l'ordre dans lequel elles sont arrangées. Pour cette raison elles sont aussi appelées les valeurs propres de la matrice originale A non diagonale. On parle aussi, pour l'ensemble des valeurs propres, du spectre. A′ et A sont dits dégénérées quand deux ou plusieurs valeurs propres sont égales.

Il n'est pas difficile de voir qu'en général les équations qui impliquent à la fois A et A + ne sont pas invariantes par rapport à une transformation sauf si la matrice S de transformation est unitaire.

Fonctions de matrices Une fonction d'une matrice peut souvent être définie avec un développement en série. Donc, si f ( z ) est un polynôme en le nombre z, alors f ( A) est le même polynôme en la matrice A. Avec des séries infinies, on doit faire attention à la convergence. Il est évident que, si A peut être diagonalisé et est mis sous sa forme diagonale A′ = SAS −1 , alors S transforme aussi f ( A) en la forme diagonale f ( A′) et la kième valeur propre de f ( A′) est simplement f ( Ak′ ) . Donc, si le développement en série f ( z ) converge quand z est égal à chaque valeur propre de A, le développement en série S −1 f ( A′)S = f ( A) est bien défini. Cette dernière forme peut fournir une définition utile de f ( A) même quand f ( z ) ne peut pas être représenté par un développement en série. Les fonctions exponentielles et trigonométriques des matrices peuvent être représentées par des développements en séries qui convergent pour toute valeur finie de leurs arguments et donc son

( )

bien définie. Il est facile de voir, par exemple, que e A hermitique.

+

+

= e A et ainsi e iH est unitaire si H est

Un autre résultat utile est la relation (26) det e A = e tr ( A )

( )

Matrices de rang infini Les règles (2) et (3) pour l'addition et la multiplication des matrices peuvent être étendues d'une manière évidente aux matrices qui ont un nombre infini de lignes et de colonnes pourvu que la somme infinie dans (3) converge. Nous aurons quelque fois à faire à des matrices qui ont un nombre infini non dénombrable de lignes ou de colonnes ou les deux. Dans ce cas, un ou deux des indices de la matrice deviennent une variable continue et la sommation habituelle sur l'indice est remplacée par une intégration sur cette variable. Nous ne considérons pas ces possibilités en détail ici mais nous supposons simplement que tout résultat raisonnable peut être prolongé des matrices

de rang fini à infini sans difficulté. L'affirmation qu'une matrice de rang infini est carrée signifie que ses lignes et colonnes sont indicées de la même manière. Une matrice unitaire de rang infini n'a pas besoin d'être carrée. Ses lignes et colonnes peuvent être indicées différemment. Par exemple, le nombre de lignes peut être infini dénombrable et le nombre de colonnes infini non dénombrable. En mécanique quantique, nous sommes concernés principalement par les matrices hermitiques et unitaires, surtout de rang infini. Un théorème fondamental que nous supposerons sans preuve est que toute matrice hermitique peut être diagonalisée par une transformation unitaire. Un corollaire de ce théorème est que les valeurs propres résultantes de la matrice hermitique sont uniques, excepté peut-être pour l'ordre dans lequel elles sont arrangées. En partant de ce théorème, il n'est pas difficile de montrer que la condition nécessaire et suffisante pour que deux matrices hermitiques puissent être diagonalisées par la même transformation unitaire est qu'elles commutent (les matrices A et B commutent si AB = BA ). Il suit aussi de ce théorème que les valeurs propres d'une matrice hermitique sont réelles. Si le S et le A dans (19) sont unitaires et hermitiques, respectivement, cette équation peut être récrite (27) SAS + = A′ L'adjoint hermitique de (27) est, en utilisant (16), (28) SAS + = A′ + Puisque A′ + = A′ , cela montre que la propriété d'hermiticité est maintenue durant les transformations par une matrice unitaire. Si A′ est diagonale et hermitique, il suit de (15) que ses valeurs propres sont réelles. Il est facile de voir que l'inverse est aussi vrai : une matrice qui peut être diagonalisée par une transformation unitaire et qui a des valeurs propres réelles est hermitique. Il est important de noter avec les matrices de rang infini que les deux équations (13) doivent être valides pour que A −1 soit l'inverse de A. De même, les deux équations (18) doivent être valides pour que U soit unitaire.

VI.2. Théorie des transformations L'apparition des matrices en mécanique quantique peut être reliée d'une manière simple avec la solution de l'équation de Schrödinger. Dans cette section, nous adoptons la notation hamiltonienne et nous la justifierons en détail dans la section suivante. Nous récrivons la fonction de Schrödinger comme (1) Hu k (r ) = E k u k (r ) où l'indice k indique les différents membres de l'ensemble complet orthonormal de fonctions propres de l'énergie u k (r ) et leurs valeurs propres correspondantes E k . k spécifie l'énergie et distingue aussi les fonctions propres dégénérées. Elle inclut donc à la fois E et s, comme nous l'avions vu. Par exemple, k représente k x , k y et k z , dans le cas des ondes planes et n x , n y et n z dans le cas des fonctions propres de l'oscillateur harmonique à trois dimensions. L'opérateur hamiltonien ou énergie H est donné par h2 2 p2 (2) H = + V (r ) = − ∇ + V (r ) 2m 2m où nous supposerons dans ce chapitre que V est réel afin que les E k soient aussi réels. K peut être un ensemble discret ou continu de variables, discret sur une partie de son domaine et continu sur le reste. Nous utiliserons le symbole de sommation généralisée sommation



S ou S

k

sur les valeurs discrètes de l'indice k et une intégration

pour indiquer à la fois une

∫ dk

sur la partie continue

k

de son domaine. Nous utiliserons aussi l'accent circonflexe quand il semblera désirable de distinguer entre un opérateur comme (2) et sa matrice équivalente.

Matrice unitaire W Supposons que nous ayons un deuxième ensemble orthonormal complet de fonctions v µ (r ) qui sont fonctions propres d'un certain opérateur Ω avec les valeurs propres réelles ω µ :

(3) Ωv µ (r ) = ω µ v µ (r )

Ω peut, par exemple, être l'opérateur impulsion ou l'hamiltonien pour un certain potentiel différent de celui dans (2). Les v µ peuvent être développés en fonction des u k avec les coefficients de développement wkµ : (4) v µ (r ) =

Sw k



u k (r )

Les deux cotés de cette équation peuvent être multipliés par u k∗ (r ) et intégrés pour obtenir

(5) wkµ = ∫ u k∗ (r )v µ (r )d 3 r

La complétude de l'ensemble u k a été utilisée pour obtenir (4) et son orthonormalité pour obtenir (5). De même, u k peut être développé en fonction des v µ : (6) u k (r ) =

S

µ

wk∗µ v µ (r )

Nous pouvons montrer que la matrice W, dont les wkµ sont les éléments, est unitaire en calculant un élément de matrice typique de WW + :

(WW ) +

(7)

kl

=

S

µ

wkµ wl∗µ =

S ∫u µ

∗ k

(r )v µ (r )d 3 r ∫ v µ∗ (r ′)u l (r ′)d 3 r ′

= ∫∫ u k∗ (r )δ 3 (r − r ′)u l (r ′)d 3 rd 3 r ′ = ∫ u k∗ (r )u l (r )d 3 r

Nous avons utilisé ici la propriété de fermeture de tout ensemble orthonormal complet de fonctions qui a la forme ici (8)

S

v (r )v µ∗ (r ′) = δ 3 (r − r ′)

µ µ

La dernière intégrale sur le coté droit de (7) est ou un symbole de Kronecker ou une fonction de Dirac selon que k est un ensemble discret ou continu d'indices. Dans tous les cas, cette intégrale est équivalente à un élément de la matrice unité et ainsi WW + = 1 . De même, on peut établir que

(

(9) W +W

)

µν

=

Sw k

∗ kµ

wkν = (1)µν

Transformation de l'hamiltonien avec W Nous avons montré que W est une matrice unitaire qui relie deux ensembles de fonctions u k et v µ . Elle peut aussi être utilisée pour transformer la matrice hamiltonienne H ′ que nous définissons par ses éléments de matrice (10) H kl′ = ∫ u k∗ (r )Hˆ u l (r )d 3 r = E k δ kl ou E k δ (k − l ) où Hˆ est l'opérateur différentiel (2). Nous avons utilisé ici (1) pour montrer que H ′ est sous forme diagonale avec les éléments diagonaux qui sont les valeurs propres de l'énergie E k . Une autre matrice hamiltonienne H ′′ peut être construire en utilisant les fonctions v µ : ′′ = ∫ v µ∗ (r )Hˆ vν (r )d 3 r (11) H µν

Elle n'a pas la forme diagonale. Nous suivons maintenant la définition des transformations et nous transformons H ′′ avec W :

(WH ′′W ) = S S w H ′′ w (12) = S S ∫ u (r ′)v (r ′)d r ′∫ v (r )Hˆ v (r )d r ∫ v (r ′′)u (r ′′)d +

µ

kl

µ

ν

∗ k

ν

µ



3

∗ lν

µν



µ

ν

3



ν

l

3

r ′′

= ∫∫∫ u k∗ (r ′)δ 3 (r ′ − r )Hˆ δ 3 (r − r ′′)u l (r ′′)d 3 r ′d 3 rd 3 r ′′ où Hˆ opère seulement sur la variable r à sa droite. L'intégration sur r ′′ peut être effectuée en sortant Hˆ de l'intégrale sur r ′′ : (13) ∫ Hˆ δ 3 (r − r ′′)u l (r ′′)d 3 r ′′ = Hˆ ∫ δ 3 (r − r ′′)u l (r ′′)d 3 r ′′ = Hˆ u l (r ) Nous obtenons donc (14) (WH ′′W + )kl = ∫ ul∗ (r )H op ul (r )d 3r = H kl′ Cela peut être écrit dans l'utilisation explicite des indices sous forme d'équation matricielle (15) WH ′′W + = H ′

Donc, nous voyons que W est la matrice unitaire qui transforme la matrice non diagonale H ′′ en la forme diagonale H ′ . W + transforme aussi H ′ en H ′′ . Une autre manière de décrire ce qui a été fait jusqu'ici est de dire que le processus de résolution de l'équation de Schrödinger (1) est complètement équivalent au processus de diagonalisation d'une matrice particulière. La matrice H ′′ peut être calculée à partir de l'opérateur Hˆ (2) en utilisant un ensemble orthonormal complet quelconque de fonctions v µ (r ) qui s'avère pratique. Si sa diagonalisation peut être effectuée, à la fois la forme diagonale H ′ , qui consiste en les valeurs propres E k , et la matrice de transformation W sont obtenus dans le processus. Une fois W connu, les fonctions propres u k (r ) peuvent être obtenues en utilisant (6).

Il est intéressant de noter que W n'est pas nécessairement une matrice carrée. C'est-à-dire que ces lignes et colonnes peuvent être indicées différemment. Par exemple, les fonctions u k peuvent être les fonctions propres d'un oscillateur harmonique à trois dimensions qui forment un ensemble discret complet et les fonctions v µ peuvent être les fonctions propres de l'impulsion, qui forment un ensemble entièrement continu. Cependant, les matrices hamiltoniennes H ′ et H ′′ sont toutes les deux carrées. Il est évident que H ′ et H ′′ sont hermitiques puisque leurs valeurs propres sont réelles. La discussion que nous avons eue sur les valeurs propres de tout opérateur disaient qu'elles représentent une quantité physiquement mesurable. Elles sont donc réelles puisque ce sont les seuls résultats de mesures précises de ces quantités. Donc une variable dynamique qui est physiquement mesurable est représentée par une matrice hermitique quand elle est sous forme diagonale. Il suit alors de la discussion de la section précédente que toute transformation unitaire de cette matrice est aussi hermitique.

Transformation de l'hamiltonien avec U Il n'y a pas besoin de voir l'opérateur H donné dans (2) comme ayant un statut fondamentalement différent des matrices H ′ et H ′′ définit par (10) et (11). La forme matricielle naturelle pour Hˆ est

celle où les lignes et colonnes sont indicées par les coordonnées r et r ′ . La matrice unité correspondante est (16) (1)rr′ = δ 3 (r − r ′) en analogie avec le coté droit de (7) quand k est un ensemble continu d'indices. Une matrice diagonale peut alors être écrite comme f (r )δ 3 (r − r ′) où f est une fonction multiplicative de r mais pas un opérateur différentiel. Cela peut être, par exemple, l'énergie potentielle. Nous nous attendons alors à ce que la forme matricielle de l'opérateur hamiltonien soit (17) H rr ′ = Hˆ δ 3 (r − r ′) où sur le coté droit Hˆ opère seulement sur la variable r. Nous nous rapportons à cette matrice H quand les indices ne sont pas écrits explicitement. Il est important de noter que H rr′ n'est pas diagonal puisque Hˆ n'est pas une fonction multiplicative mais contient des opérateurs différentiels dans sa partie énergie cinétique. L'équation (17) a des éléments de matrice non nuls qui sont à une distance infinitésimale de la diagonale r = r ′ . L'équation (15) montre que W transforme H ′′ en H ′ . Il est intéressant de se demander qu'elle matrice unitaire U transforme H, défini par (17), en H ′ : (18) UHU + = H ′ Cette équation peut être écrite HU + = U + H ′ qui devient, lorsqu'elle est exprimée en éléments de matrice, (HU + )rk = (U + H ′)rk ou (19) Ici

S

S

(20)

r′

r′

H rr′ (U + )r′k =

S (U ) +

l

rl

H lk′

est identique à ∫ d 3 r ′ . En substituant (17), le coté gauche de (19) devient

∫ Hˆ δ (r − r ′)(U ) +

3

r ′k

d 3 r ′ = Hˆ ∫ δ 3 (r − r ′)(U + )r′k d 3 r ′ = Hˆ (U + )rk

où Hˆ opère sur la dépendance en r de (U + )rk . Le coté droit de (19) peut être récrit en utilisant (10), il devient (U + )rk E k . Donc (19) est équivalent à (21) Hˆ U + = E U +

( )

rk

k

( )

rk

La comparaison avec l'équation de Schrödinger (1) montre que (U + )rk doit être identifié avec la

fonction propre de l'énergie u k (r ) .

Nous sommes donc conduit naturellement à un prolongement du formalisme selon lequel un ensemble complet de fonctions orthonormales u k (r ) peut être vu comme une matrice unitaire : (22) U kr = u k∗ (r )

Dans ce cas particulier, U transforme H en H ′ en accord avec (18). Il est facilement vérifié que U est, en fait, unitaire. Par exemple,

(

(23) UU +

)

kl

=

S U (U ) = ∫ u +

r

kr

rl

∗ k

(r )u l (r )d 3 r = (1)kl

par orthonormalité et

(24) (U +U )rr′ = par fermeture.

S (U ) +

k

rk

U kr ′ =

Su k

k

(r )u k∗ (r ′) = (1)rr′

Transformation de l'hamiltonien avec V L'ensemble de fonctions v µ (r ) peut aussi, selon (22), être vu comme une matrice unitaire V :

(25) Vµ r = v µ∗ (r )

où à nouveau V est unitaire car l'ensemble de fonctions v µ (r ) est orthonormal et grâce à la fermeture. Comme on s'y attend, la transformation de H avec V donne H ′′ : (26) VHV + = H ′′ Les éléments de matrice µν des deux cotés de cette équation sont précisément les deux cotés de (11). La matrice H peut être éliminée entre les équations (18) et (26) comme suit :

(27)

H = V + H ′′V H ′ = UHU + = UV + H ′′VU +

C'est en accord avec l'équation (15) si nous posons (28) V = UV + Sous forme d'éléments de matrice, on a

( )

(29) (W )kµ = rU kr V + rµ ou (30) wkµ = ∫ u k∗ (r )v µ (r )d 3 r

S

qui est le même que l'équation (5). L'équation (28) peut aussi être écrite sous les formes V + = U +W et U + = V +W + qui sont le même que les équations (4) et (6), respectivement.

Représentations des opérateurs Les trois matrices hamiltoniennes H, H ′ , H ′′ sont différentes représentations du même opérateur Hˆ . Chaque représentation est caractérisée par la quantité dont les valeurs propres sont utilisées pour indicer les lignes et les colonnes de la matrice (r, E k , ω µ , ou de manière plus concise, r, k, µ ). Donc, H, H ′ et H ′′ sont les hamiltoniens en les coordonnées, l'énergie et Ω , respectivement. Une matrice unitaire dont les lignes et colonnes sont indicées par les valeurs propres de A et B, respectivement, transforme un opérateur de la représentation B à la représentation A. Par exemple, U transforme tout opérateur de la représentation coordonnées à la représentation énergie et U + de la représentation énergie à la représentation coordonnées. De la même façon, V transforme de la représentation coordonnées à la représentation Ω et W de la représentation Ω à la représentation énergie. Donc, l'application de V suivi de W transforme de la représentation coordonnées à la représentation Ω puis à la représentation énergie. L'effet global est représenté par le produit WV puisque la représentation la plus à droite agit la première. L'équation (28) montre que WV = U comme attendu puisque U transforme la représentation coordonnées en la représentation énergie. Un opérateur est diagonal dans la représentation dont les lignes et les colonnes sont indicées par les

valeurs propres de cet opérateur. Donc H ′ est diagonal puisque c'est l'hamiltonien exprimé dans la représentation énergie. Les remarques du paragraphe précédent peuvent être illustrées en l'appliquant à l'opérateur Ω . Dans la représentation coordonnées, il doit avoir la forme ˆ δ 3 (r − r ′) (31) Ω rr′ = Ω ˆ opère seulement sur la variable r. Nous appelons cette matrice Ω et nous où sir le coté droit Ω trouvons sa transformation dans la représentation énergie, qui doit être UΩU + :

(UΩU ) = S S U (32) +

kl

r

r′

kr

= ∫ u (r )Ω op ul (r )d r ∗ k

( )

Ω rr ′ U +

r ′l

3

comme attendu. De même, la transformation à la représentation Ω donne (33) VΩV + µν = ω µ (1)µν qui est sous forme diagonale.

(

)

Une identité utile L'équation (31) peut être utilisée pour écrire (34) Ω opψ β (r ) = ∫ Ω rr′ψ β (r′)d 3 r ′ où ψ β (r ) est une fonction arbitraire. Alors

[

]

(35) ∫ψ α∗ (r ) Ω opψ β (r ) d 3r = ∫∫ψ α∗ (r )Ω rr′ψ β (r′)d 3rd 3r ′

où ψ α (r ) est une autre fonction arbitraire. Nous ne supposons pas nécessairement que les ψ α (r ) sont des membres d'un ensemble orthonormal complet de fonctions. Puisque Ω rr′ est une matrice ˆ, avec les lignes et les colonnes indicées par r et r ′ et donc n'est pas le même que l'opérateur Ω nous pouvons réarranger les termes sur le coté droit de (35) pour donner (36)

∫ [∫ (Ω ) +

r ′r

]



ψ α (r )d 3 r ψ β (r ′)d 3 r ′

où (Ω + )r′r = Ω ∗r ′r sont les éléments r ′ , r de la matrice Ω + qui est l'adjoint hermitique de Ω . ˆ + en accord L'équation (31) peut aussi être utilisée pour définit l'opérateur adjoint hermitique Ω avec ˆ +ψ (r ) = (Ω + ) ′ψ (r ′)d 3 r ′ (37) Ω α ∫ rr α Donc, (35) peut être récrit

[

]

[

]

+ ψ α (r ) ψ β (r )d 3r (38) ∫ψ α∗ (r ) Ω opψ β (r ) d 3 r = ∫ Ω op ∗

L'équation (38) est quelque fois utile puisqu'une intégrale de ce type peut être plus facilement ˆ opère sur une des fonctions ψ , ψ plutôt que sur l'autre. Les intégrations par évaluée quand Ω α β ˆ parties que nous avons utilisées sont des exemples de l'application de (38). Dans ces exemples, Ω est un opérateur différentiel et sa représentation coordonnées implique des dérivées de δ 3 (r − r ′) . ˆ n'a pas besoin d'être de ce type spécialisé mais peut avoir des éléments de matrice Cependant, Ω ˆ représente une variable dynamique physiquement non nuls pour r − r ′ fini. En tout cas, si Ω ˆ + peut être remplace par Ω ˆ sur le coté droit de mesurable, il doit être hermitique, auquel cas Ω (38).

Matrices lignes et colonnes Nous avons travaillé jusqu'ici avec des matrices carrées telles que H et Ω qui représentent des variables dynamiques et qui sont hermitiques, et des matrices rectangulaires comme U, V et W qui transforment une représentation en une autre et qui sont unitaires. Un état α particulier d'un système peut être représenté par une fonction ψ α (r ) qui peut être vue comme une matrice avec une colonne et dont les lignes sont indicées par la coordonnée r. Comme remarqué ci-dessus, α n'a pas besoin d'indicer un ensemble complet de fonctions mais peut être considéré en lui-même. Puisque les u k (r ) sont un ensemble complet, ψ α peut être développé en terme de ces fonctions : (39) ψ α (r ) =

Sa k

αk

u k (r )

où les coefficients aαk sont donnés par

(40) aαk = ∫ u k∗ (r )ψ α (r )d 3 r Ces équations peuvent être écrites sous forme matricielle comme (41) ψ α = U + aα et aα = Uψ α respectivement, où aα est une matrice colonne dont les lignes sont indicées par k. Donc, tout comme U transforme un opérateur comme H de la représentation coordonnées à la représentation énergie avec (18), elle transforme aussi une fonction d'état de la représentation coordonnées à la représentation énergie avec la deuxième équation (41). De même, nous pouvons écrire (42) ψ α (r ) =

Sb

v (r ) et bαµ = ∫ v µ∗ (r )ψ α (r )d 3 r

µ αµ µ

sous forme matricielle comme (43) ψ α = V + bα et bα = Vψ α La combinaison des équations (39), (40) et (28) donne (44) aα = Uψ α = UV + bα = Wbα Donc, W transforme la fonction d'état de représentation Ω bα à la représentation énergie aα comme attendu. Une propriété importante des transformations unitaires est qu'elles laissent la norme d'une fonction d'état inchangée. Dans la représentation coordonnées, la norme est juste l'intégrale de normalisation qui peut être écrite comme (45) ∫ψ α∗ (r )ψ α (r )d 3 r =

Sψ r



α

(r )ψ α (r ) = ψ α+ψ α

Le coté droit est le produit matriciel d'une matrice ligne ψ α+ , qui est l'adjoint hermitique de ψ α et a ses colonnes indicées par la coordonnée r, et la matrice colonne ψ α . Le résultat est une matrice

avec une ligne et une colonne, qui est simplement un nombre. Il est évident que la norme est réelle et non négative. Avec l'aide de (41), la norme peut être écrite (46) ψ α+ψ α = aα+UU + aα = aα+ aα

S

qui est égal à k aαk . De même, ψ α+ψ α = bα+ bα , ainsi les trois représentations de la fonction d'état ont la même norme. Une fonction d'état pour laquelle la norme existe (c'est-à-dire, n'est pas infinie) 2

(

peut être normalisée en la divisant par ψ α+ψ α

)

1 2

, auquel cas sa norme devient égale à l'unité.

Il est intéressant de noter que l'identité (38) devient trivialement valide quand elle est récrite dans la représentation matricielle coordonnées des fonctions d'états ψ α et ψ β :

(

)

+

(46) ψ α+ Ωψ β = Ω +ψ α ψ β L'équation (22) montre que les deux cotés sont identiques. La structure du produit matriciel est tel que chaque coté est une matrice avec une ligne et une colonne et donc un nombre.

Espace de Hilbert Une image géométrique qui est souvent utilisé considère une fonction d'état telle que ψ α , aα ou bα comme un vecteur d'état dans un espace de Hilbert avec une infinité de dimensions. Chaque dimension correspond à une des lignes de la matrice colonne qui décrit l'état et la composante du vecteur d'état le long de cet axe de l'espace de Hilbert est numériquement égale à l'élément de matrice correspondant. Différents choix pour l'orientation des axes dans l'espace de Hilbert correspondent à différents choix pour la représentation. Par exemple, la représentation énergie correspond à choisir les axes de telle manière qu'un vecteur d'état orienté le long d'un de ces axes est un état propre de l'hamiltonien. Plus généralement, le vecteur aα a la composante aαk le long de l'axe qui est rattaché à la valeur propre de l'énergie E k . La norme d'une fonction d'état est juste le carré de la longueur du vecteur d'état correspondant dans l'espace de Hilbert, où "longueur" est généralisé de manière appropriée pour prendre en compte les

composantes qui peuvent être des nombres complexes. La norme est un cas particulier du produit scalaire de deux vecteurs d'état ψ α et ψ β défini comme (47) (ψ α ,ψ β ) = ψ α+ψ β = ∫ψ α∗ (r )ψ β (r )d 3 r

et est aussi un nombre. Quand α et β sont le même état, il est égal à la norme. Quand le produit scalaire s'annule, les vecteurs d'état sont dits orthogonaux. Les produits scalaires de ces vecteurs d'états, exprimés dans les représentations énergie et Ω , sont (48) (aα , a β ) = aα+ a β et (bα , bβ ) = bα+ bβ respectivement. On voit sur (41) et (43) que le produit scalaire est indépendant de la représentation, tout comme la norme. Il s'ensuit qu'une transformation d'une représentation à l'autre correspond à une rotation des axes dans l'espace de Hilbert sans changer les vecteurs d'états. Un vecteur d'état particulier a différentes composantes quand on le rapporte à des axes différents et ils constituent les représentations différentes de l'état. ˆ effectue une transformation du vecteur d'état ψ tel qu'il Il s'ensuit que l'opération sur ψ β avec Ω β devient un autre vecteur d'état Ωψ β . Nous nous référons à cette transformation comme une rotation généralisée du vecteur d'état dans l'espace de Hilbert, le mot "généralisé" indiquant que la rotation peut impliquer une dilatation ou une contraction des composantes aussi bien qu'une rotation "pure". En particulier, la rotation généralisée ne conserve habituellement pas la norme du vecteur d'état. L'élément de matrice ψ α+ Ωψ β = (ψ α , Ωψ β ) est alors le produit scalaire des vecteurs d'état ψ α et Ωψ β . Il est facile de voir qu'il est indépendant de la représentation.

Lien avec la notation bra et ket On est maintenant armé pour faire le lien entre la représentation matricielle et la représentation compacte de Dirac, ainsi la boucle sera bouclée. Nous décrivons une fonction d'état ou vecteur d'état, qu'il soit représenté par ψ α , aα ou bα , par le ket α et l'état adjoint hermitique ψ α+ , aα+ ou bα+ par le bra α . Le produit scalaire de deux vecteurs d'états est écrit

(49) ψ α+ψ β = α β qui est un nombre. Opération sur un vecteur ket à gauche avec Ω produit un autre vecteur ket (50) Ω β = β ′ et l'opération sur un vecteur bra à droite avec Ω produit un autre vecteur bra (51) α Ω = α ′′ L'élément de matrice de Ω entre les états α et β est un nombre et être écrit sous plusieurs formes équivalentes

[

]

Ωαβ = ∫ψ α∗ (r )Ωψ β (r )d 3 r = ∫ Ω +ψ α (r ) ψ β (r )d 3 r

(

(52) = (ψ α , Ωψ β ) = Ω +ψ α ,ψ β

)



= α β ′ = α ′′ β = α Ω β La première et la dernière sont les notations utilisées le plus fréquemment. Les éléments de matrice de l'opérateur adjoint hermitique Ω + sont donnés par ∗ (53) (Ω + )βα = Ωαβ = β Ω+ α = α Ω β



Un exemple particulier des équations (50) et (52) est celui où Ω est l'opérateur unité : (54) α 1 β = α β Ces équations peuvent être utilisées pour obtenir une expression pour la matrice unitaire W de (5) en identifiant ψ α avec u k et ψ β avec v µ : (55) wkµ = k µ = µ k



Nous sommes maintenant en position de récrire les principales équations de cette section dans les notations de Dirac et ainsi de clôturer définitivement la relation entre toutes les notations que nous avons utilisées. Nos trois représentations seront spécifiées par les trois ensembles complets de kets k , µ et r . Tout comme k est un état propre de l'énergie avec la valeur propre E k et µ un état propre de Ω avec la valeur propre ω µ , r est un état propre des coordonnées avec la valeur propre r. Alors, en analogie avec (52), (22) peut être écrit sous les formes (56) k r = u k∗ (r ) et r k = u k (r ) De même, nous pouvons écrire (57) µ r = v µ∗ (r ) et r µ = v µ (r ) A nouveau, en identifiant ψ α avec u k , nous obtenons (58) ψ α (r ) = r α

aαk = k α

bαµ = µ α

Une convention de sommation sera employée tel que tout symbole d'état qui apparaît deux fois dans une expression données (une fois dans le ket et une fois dans le bra) est supposé être sommé sur un ensemble complet orthonormal d'états. Donc, le symbole la forme (59)

S

µ

S

µ

sera omis des expressions de

Lµ µL

C'est une convention semblable à la convention de sommation d'Einstein sur la sommation sur les indices muets dans les expressions vectorielles et tensorielles. Les équations récrites ci-dessous sont numérotées avec des apostrophes sur leur numérotation originale. (3') Ω µ = ω µ µ ou r Ω r ′ r ′ µ = ω µ r µ (4') µ = k k µ ou r µ = r k = k µ

(5') k µ = k r r µ (6') k = µ µ k ou r k = r µ µ k (7') k µ µ l = k r r l = k l (8') r µ µ r ′ = r r ′ (9') µ k k ν = µ ν (10') h H l = E k k l (15') k µ µ H ν ν l = k H l (19') r H r ′ r ′ k = r l l H k (26') µ r r H r ′ r ′ ν = µ H ν (28') k µ = k r r µ (39') r α = r k k α (40') k α = k r r α (43') r α = r µ µ α et µ α = µ r r α (47') α β = α r r β A l'exception des équations (3') et (10') qui sont des équations aux valeurs propres pour Ω et H, respectivement, toutes ces équations ont une propriété en commun. Si nous supposons qu'un symbole répété (k, µ ou r), qui est sous-entendu sommé sur un ensemble orthonormal complet d'états comme dans (59), est équivalent à l'opérateur unité, ces équations deviennent des identités triviales. Par exemple, chacun des deux cotés de (15') devient égal à r H k puisque r ′ r ′ et

l l peut être remplacé par des opérateurs unités sur les cotés gauches et droits, respectivement. Nous avions déjà vu cette propriété. Ce replacement est évidemment équivalent à l'utilisation de la propriété de fermeture de tout ensemble complet orthonormal de fonctions. Inversement, des opérateurs unités peuvent toujours être insérés, comme lorsque l'on passe du coté gauche au coté

droit de (4'). La preuve la plus simple de l'exactitude de ces hypothèses est l'observation que la suppression ou l'insertion de tels symboles d'états répétés conduit toujours à des équations valides. Notons qu'une insertion peut aussi être faite entre deux opérateurs. Par exemple, (60) ΩΓ = Ω k k Γ

Opérateurs projection Considérons l'équation (61) α =

S

µ

µ µ α = S µ Pµ α

où l'opérateur Pµ est définit par (62) Pµ ≡ µ µ pour un état unique µ , c'est-à-dire sans effectuer la sommation généralisée. Il est clair en voyant (3') que Pµ α est un état propre de Ω avec la valeur propre ω µ . Donc, un ket arbitraire α peut être écrit comme une somme généralisée des états propres de tout opérateur Ω avec (61). L'opérateur Pµ est appelé opérateur de projection puisqu'il projette α sur la partie qui est un état propre particulier de Ω . Supposons maintenant que Ω a seulement deux valeurs propres distinctes ω1 et ω 2 avec une très grande dégénérescence. En exemple peut être l'opérateur parité avec les valeurs propres ± 1 ou la composante du moment angulaire de spin d'une particule de spin 1/2 avec les valeurs propres ± 12 h (voir le tome suivant). Dans une telle situation, il est quelquefois souhaitable d'écrire tout état α comme une somme de deux parties, chacune étant un état propre de Ω avec les valeurs propres ω1 et ω 2 . Cela peut être obtenu en définissant les opérateurs projection par les équations (63) Pi ≡

S

µ = µi



avec i = 1, 2, au lieu de (62). Alors Pi α est un état propre de Ω avec la valeur propre ω i . On vérifie facilement que

(64) P1 =

Ω −ω2 Ω − ω1 et P2 = ω1 − ω 2 ω 2 − ω1

et que (65) ∑ Pi = 1 Pi Pj = δ ij Pi i

Les équations (63) peuvent être généralisées à des situations où Ω a plus de deux valeurs propres distinctes. Avec la définition (63), nous avons maintenant Ω −ω j (66) Pi = ∏ j ≠1 ω i − ω j et les équations (65) sont encore valides. Puisque Ω est hermitique, ses valeurs propres ω µ sont réelles et les Pµ et Pi sont évidemment

hermitiques. Finalement, il est facile de voir que tr (Pµ ) = 1 si µ est un état propre normalisé qui correspond à une valeur propre discrète. Dans ce cas tr (Pi ) est égal au nombre d'états propres

linéairement indépendant qui ont la valeur propre ω i . Donc, il est égal aux nombres de dimensions du sous-espace de Hilbert qui correspond à ω i .

Signification physique des éléments de matrice Nous avons vu que les éléments de matrice diagonaux d'un opérateur qui est sous forme diagonale sont juste les valeurs propres de cet opérateur. La comparaison avec ce que nous avons vu montre que si l'opérateur n'est pas sous forme diagonale, les éléments de matrice diagonaux sont les valeurs moyennes de l'opérateur pour des états qui sont normalisés. Plus généralement, α Ω α / α α est la valeur moyenne de l'opérateur pour l'état représenté par le ket normalisable α . Jusqu'ici, nous n'avons pas d'interprétation simple des éléments non diagonaux tels que α Ω β . Nous verrons plus tard qu'ils sont, entre autres choses, reliés aux probabilités de transition entre états.

VI.3. Equations du mouvement La théorie des transformations développée dans la section précédente ne fait pas référence à la dynamique. Elle traite de la description d'un système physique à un instant du temps. Cette description implique trois sortes d'objets. Tout d'abord, il y a ceux qui spécifient l'état du système à un moment particulier. Ils peuvent être écrits comme des fonctions d'état ψ α (r ) , comme des matrices colonnes ψ α , aα ou bα , comme des vecteurs de l'espace de Hilbert ou comme des kets

α . A chacun correspond une quantité adjointe hermitique tel que ψ α+ ou α . Ensuite, il y a les transformations unitaires qui peuvent être écrites comme des matrices rectangulaires tel que U et dont les éléments sont les expressions k r . Leur effet est de changer une représentation en une autre. Du point de vue de l'espace de Hilbert, elles tournent les axes sans changer les vecteurs d'états de manière à ce qu'un vecteur d'état particulier se rapporte à un ensemble différent d'axes. Les troisièmes, ce sont les variables dynamiques, tel que Ω , qui peuvent être écrites comme des opérateurs ou des matrices carrées. Les éléments de ces matrices peuvent être calculés par rapport à un ensemble d'axes particuliers dans l'espace de Hilbert et une matrice unitaire transforme leurs valeurs d'un ensemble d'axes ou représentation à un autre. Donc, U transforme Ω de la représentation coordonnées r Ω r ′ à la représentation énergie k Ω l , tout comme elle transforme

α de la représentation coordonnées r α à la représentation énergie k α . De manière alternative, les éléments de matrice de Ω peuvent être calculés par rapport à des vecteurs d'état particuliers ψ α , qui n'ont pas besoin d'être les membres d'un ensemble complet. Ces éléments de matrice sont le produit scalaire (ψ α , Ωψ β ) = α Ω β et ils sont invariants par rapport

aux transformations unitaires (choix des axes dans l'espace de Hilbert). Le résultat de l'opération avec Ω sur un ket β est un nouveau ket Ω β qui est relié à β par une rotation généralisée du vecteur d'état dans l'espace de Hilbert. Si β est un état propre µ de Ω , alors la "rotation" consiste simplement à multiplier le vecteur d'état par ω µ sans changer sa direction.

Une distinction doit être faite entre les rotations des axes dans l'espace de Hilbert sans changer les vecteurs d'états, qui sont produit par les transformations unitaires, et les rotations généralisées des vecteurs d'états sans changer les axes, qui sont produites par les variables dynamiques. Nous allons considérer dans cette section la manière avec laquelle un système physique change d'un instant à l'autre. Comme nous le verrons, cette dépendance au temps peut être vue de différentes manières comme un changement dans les vecteurs d'états, dans les variables dynamiques ou les deux. Il s'avère qu'il y a un point de vue qui met les équations du mouvement sous une forme très similaire à celle des équations classiques du mouvement dans leur formulation hamiltonienne. Cette similarité suggère une méthode assez générale pour trouver les équations quantiques qui sont en accord sous une limite appropriée avec les équations classiques du même système.

Point de vue de Schrödinger Nous prenons comme point de départ l'équation de Schrödinger dépendant du temps et nous l'écrivons en fonction d'un ket dépendant du temps α S (t ) et de l'hamiltonien H : (1) ih

d α S (t ) = H α S (t ) dt

La dérivée totale par rapport au temps est utilisée ici puisque la dépendance du ket par rapport aux coordonnées ou d'autres variables n'apparaît pas explicitement. L'indice S se rapporte au ket vu dans le point de vue de Schrödinger, selon lequel il varie dans le temps conformément à l'équation différentielle ordinaire (1). L'équation adjointe hermitique du mouvement est d (2) − ih α S (t ) = α S (t ) H + = α S (t ) H dr puisque H est hermitique. Les solutions des équations différentielles (1) et (2) sont faciles à trouver si H est indépendant du temps, ce que nous supposerons être le cas : (3) α S (t ) = e − iHt / h α S (0) α S (t ) = α S (0) e iHt / h

Le fait que les équations différentielles dérivent de (3) peut être vérifié en développant les exponentielles en séries et en différentiant terme à terme. L'opérateur e − iHt / h est une somme infinie de puissances de H, chacune étant une variable dynamique qui peut être écrite comme un opérateur ou une matrice carrée. Donc, la série entière est aussi une variable dynamique. Dans ce cas particulier, on voit facilement qu'elle est unitaire puisque H est hermitique. Cependant, il est essentiel de se souvenir que e − iHt / h n'est pas une transformation unitaire dans le même sens que U, V ou W. Elle ne passe pas d'une représentation à une autre (rotation des axes dans l'espace de Hilbert) mais change plutôt le ket α S (0) en le ket

α S (t ) et effectue ainsi une rotation généralisée du vecteur d'état dans l'espace de Hilbert.

Cependant, puisque e − iHt / h est unitaire, la norme du ket est inchangée et la rotation généralisée est dans cas une rotation pure. Le taux de changement dans le temps d'un élément de matrice d'une variable dynamique Ω S dans le point de vue de Schrödinger est facile à trouver avec l'aide de (1) et (2) : d α S (t ) Ω S β S (t ) dt ∂Ω d  d  (4) =  α S (t )  Ω S β S (t ) + α S (t ) β S (t ) + α S (t ) Ω S  β S (t )  ∂t  dt   dt  ∂Ω 1 = α S (t ) β S (t ) + α S (t )(Ω S H − HΩ S ) β S (t ) ∂t ih

Le premier terme sur le coté droit est la partie du changement dans l'élément de matrice qui vient de la dépendance explicite de Ω S avec le temps et le second terme est celui causé par le changement dans le temps des vecteurs d'états. L'opérateur qui apparaît dans le second terme est appelé un commutateur et est défini par (5) [ A, B ] ≡ AB − BA

Notons qu'en accord avec les définitions de la formulation matricielle, le commutateur n'a pas de signification à moins que les deux matrices ne soient carrées et avec les lignes et colonnes indicées de la même manière. Un cas particulier intéressant de (4) est celui où Ω S commute avec H et n'a pas de dépendance explicite avec le temps. Alors, le coté droit est zéro et tous les éléments de matrice de Ω S sont constants dans le temps. Une telle variable dynamique est dite être une constante du mouvement.

Point de vue de Heisenberg La substitution de (3) dans (4) donne d α S (0) e iHt / h Ω S e −iHt / h β S (0 ) = dt (6) ∂Ω S −iHt / h 1 α S (0) e iHt / h e β S (0) + α S (0) e iHt / h Ω S e −iHt / h , H β S (0) ∂t ih où nous avons utilisé le fait que H commute avec e ± iHt / h . Il est utile de définir les vecteurs d'états indépendants du temps avec (7) α H (t ) ≡ α S (0) = e iHt / h α S (t ) et les variables dynamiques dépendant du temps avec (8) Ω H ≡ e iHt / h Ω S e − iHt / h

[

]

A moins que Ω S ne commute avec H, Ω H dépend de t même si Ω S n'a pas de dépendance explicite au temps. L'indice H indique le point de vue de Heisenberg. Le temps t = 0 où les kets et opérateurs dans le point de vue de Schrödinger sont les mêmes que ceux dans le point de vue de Heisenberg est, bien sûr, arbitraire et choisi par facilité. Si ce temps était t = t 0 , alors e ± iHt / h serait ± iH (t −t 0 ) / h remplacé par e . Puisque α H (t ) ne dépend pas du temps, la mention explicite de t peut être omise. De plus, la dérivée par rapport au temps sur le coté gauche de (6) peut être mise dans l'élément de matrice et l'équation devient ainsi

∂Ω H d 1 ΩH β H = α H β H + α H [Ω H , H ] β H dt ∂t ih où selon (8) nous avons défini ∂Ω H  ∂Ω  iHt / h ∂Ω S (10) ≡ e −iHt / h  =e ∂t ∂t  ∂t  H

(9) α H

Puisque (9) est valide pour des bras et des kets arbitraires, elle doit être valide pour les opérateurs eux-mêmes. Nous sommes donc conduit à l'équation du mouvement vue dans le point de vue de Heisenberg : dΩ H ∂Ω H 1 = + [Ω H , H ] (11) ∂t dt ih Cette équation qui suit aussi directement de la différentiation de (8) est celle qui est la plus proche de l'équation correspondante du mouvement, comme nous le verrons ci-dessous. On notera que selon (8) H est le même dans les points de vue de Schrödinger et de Heisenberg. Nous voyons donc que la description du changement dans le temps d'un système physique peut être vue de deux manières opposées. Dans le point de vue de Schrödinger, les variables dynamiques sont constantes dans le temps (sauf éventuelle dépendance explicite avec le temps) et les vecteurs d'états varient selon (1). Dans le point de vue de Heisenberg les vecteurs d'états sont constants dans le temps et les variables dynamiques varient selon (11). La transformation d'un point de vue à l'autre se fait avec l'aide de la variable dynamique e ± iHt / h selon (7) et (8). Nous avons délibérément évité d'appeler ces "points de vue" des "représentations" comme cela se fait parfois puisque nous voulons réserver le terme "représentation" pour désigner le choix des axes dans l'espace de Hilbert ou, de manière équivalente, le choix d'un ensemble orthonormal complet de fonctions par rapport auxquelles les états et variables dynamiques sont spécifiés. Il est important de noter que les équations (1), (7), (8) et (11) ont la même forme dans toutes les représentations, comme on le montre facilement. D'autre part, nous utilisons le terme "transformation" en relation avec le changement d'un point de vue à l'autre puisqu'il est accomplit au moyen d'un opérateur unitaire. A cause de cela, toutes les normes et produits scalaires des vecteurs d'états sont

indépendants du point de vue et constants dans le temps aussi bien qu'indépendants de la représentation.

Point de vue interaction La discussion qui précède montre que ni les vecteurs d'états seuls ni les variables dynamiques seules ne sont centraux pour la description du développement d'un système dans le temps. Les deux peuvent être altérés au moyen de la transformation unitaire e − iHt / h et les deux points de vue obtenus sont également valides. Les quantités qui ne sont pas altérées sont les éléments de matrice des variables dynamiques calculées sur des paires d'états tel que α Ω β . Ils fournissent le contenu physique essentiel de la théorie puisque les valeurs propres, les valeurs moyennes et les probabilités de transition peuvent en être tirés. Il est évident que toute transformation unitaire; qu'elle dépende ou non du temps, peut être appliquée aux états et variables dynamiques sans affecter les valeurs des éléments de matrice. On peut donc trouver un nombre arbitrairement grand de points de vue différents tout autant que de représentations différentes. Un troisième point de vue particulièrement utile peut être spécifié en divisant l'hamiltonien en deux parties, (12) H = H 0 + H ′ tel que H 0 ne dépend pas explicitement du temps et a aussi une structure simple. Par exemple, H 0 peut être l'énergie cinétique et H ′ l'énergie potentielle. Ou H 0 peut être l'hamiltonien pour un potentiel relativement simple tel que le champ coulombien et H ′ une certaine interaction supplémentaire tel qu'un champ électromagnétique externe. Dans ce dernier cas, il est souvent intéressant d'autoriser H ′ à dépendre explicitement du temps et ainsi nous admettrons cette possibilité dans ce qui suit. Puisque H, H 0 et H ′ ne commutent en général pas l'un avec l'autre, un indice doit être utilisé pour distinguer les différents points de vue. Nous définissons le point de vue interaction par les équations α I (t ) ≡ e iH 0 S t / h α S (t ) (13) Ω I (t ) ≡ e iH 0 S t / h Ω S e −iH 0 S t / h

Les points de vue interaction et de Heisenberg sont les mêmes quand H ′ = 0 . Nous savons que H H = H S et la deuxième équation (13) montre que H 0 I = H 0 S . En général, H I ≠ H S , H 0 H ≠ H 0 S et H S′ , H H′ et H I′ sont tous différents. La différentiation de la première équation (13)

donne pour l'équation du mouvement de α I (t )

d d α I (t ) = − H 0 S e iH 0 S t / h α S (t ) + ihe iH 0 S t / h α S (t ) dt dt − iH 0 S t / h iH 0 S t / h α I (t ) HSe (14) = − H 0 S α I (t ) + e = e iH 0 S t / h H S′ e −iH 0 S t / h α I (t ) ih

= H I′ α I (t ) où nous avons utilisé (1) et (12) et la deuxième équation de (13). De même, la différentiation de la deuxième équation (13) donne pour l'équation du mouvement de Ω I (t ) dΩ I ∂Ω I 1 ∂Ω I 1 (15) = + [Ω I , H 0 S ] = + [Ω I , H 0 I ] dt ih ih ∂t ∂t Ce que le point de vue interaction réalise est d'assigner une partie de la dépendance avec le temps aux vecteurs d'états et une partie aux variables dynamiques au lieu d'avoir l'un constant et l'autre avec une dépendance dans le temps due à l'hamiltonien complet. Dans ce point de vue, les vecteurs d'états changent en accord avec H ′ et les variables dynamiques en accord avec H 0 . Notez la ressemblance des équations (1) et (14) d'un coté et des équations (11) et (15) de l'autre. Cela est utile si H ′ est une petite perturbation puisque alors les variables dynamiques ont la forme non perturbée et les fonctions d'états sont presque constantes dans le temps.

Représentation énergie La représentation énergie est spécifiée par les kets k qui sont valeurs propres de l'hamiltonien complet H avec les valeurs propres E k . L'équation (1) montre alors que dans le point de vue de Schrödinger, le ket dépendant du temps k S (t ) satisfait l'équation

d k S (t ) = H k S (t ) = E k k S (t ) dt qui s'intègre en (17) k S (t ) = k S (0) e − iEk t / h (16) ih

L'équation (17) et son adjointe peuvent être utilisées pour trouver la dépendance dans le temps des éléments de matrice dans le point de vue de Schrödinger d'un opérateur qui n'a pas de dépendance explicite avec le temps : (18) k S (t ) Ω S l S (t ) = k S (0 ) Ω S l S (0 ) e i ( Ek − Et )t / h On vérifie facilement explicitement que cela est égal à l'élément de matrice k H Ω H l H , comme on s'y attend. L'équation (18) montre que les éléments non diagonaux dans la représentation énergie oscillent dans le temps avec des fréquences qui sont proportionnelles à la différence d'énergie entre les états stationnaires, en accord avec la règle de Bohr. Cela est consistant avec la remarque à la fin de la section précédente que les éléments de matrice sont reliés aux probabilités de transition entre états. Il suit aussi de (18) que les éléments de matrice diagonaux ou les valeurs moyennes dans la représentation énergie sont constants dans le temps pour des opérateurs qui n'ont pas de dépendance explicite avec le temps.

Equations lagrangiennes et hamiltoniennes classiques du mouvement Afin de mettre en évidence la similarité entre (11) et l'équation classique correspondante, repassons brièvement en vue la structure de la théorie hamiltonienne classique. Les équations du mouvement d'un système dynamique conservatif qui a f degrés de liberté peuvent être dérivées d'un lagrangien L(q1 , K , q f , q&1 , K , q& f , t ) des coordonnées q i , des vitesses q& i ≡ dqi / dt et du temps au moyen d'un principe variationnel : (19) δ ∫ Ldt = 0 δq i (t1 ) = δq i (t 2 ) = 0 t2

t1

Les équations lagrangiennes résultantes sont d  ∂L  ∂L  − (20) = 0 i = 1,… f dt  ∂qi  ∂qi Si maintenant nous définissons un moment canoniquement conjugué à q i comme pi ≡ ∂L / ∂q& i et une fonction hamiltonienne des coordonnées et des moments comme (21) H (q1 ,K, q f , p1 ,K, p f , t ) = ∑ pi q& i − L f

i =1

La variation de H conduit aux équations hamiltoniennes du mouvement ∂H ∂H (22) q& i = p& i = − i = 1,… f ∂p i ∂q i La dépendance avec le temps de toute fonction des coordonnées, des moments et du temps, calculée le long d'un point de phase en mouvement (trajectoire physique dans l'espace des variables ou espace des phases ou espace de configuration) est f  ∂F d ∂F ∂F  F (q1 , K , q f , p1 , K , p f , t ) = + ∑  q& i + p& i  dt ∂t i =1  ∂q i ∂pi  (23) f  ∂F ∂H ∂H ∂F  ∂F  + ∑  − ∂t i =1  ∂q i ∂p i ∂q i ∂pi 

en utilisant les équations hamiltoniennes (22). Le crochet de Poisson {A, B} de deux fonctions des coordonnées et des moments est définit comme f  ∂A ∂B ∂B ∂A   (24) {A, B} ≡ ∑  − ∂qi ∂pi  i =1  ∂q i ∂p i En terme des crochets de Poisson, l'équation du mouvement pour la fonction F des variables dynamiques devient

(25)

dF ∂F + {F , H } = ∂t dt

Le coté gauche de (25) est la dérivée totale par rapport au temps de F le long d'un point de phase en mouvement. Le premier terme sur le coté droit prend en compte la dérivée explicite par rapport au temps de F et le dernier terme est le changement de F venant du mouvement du point de phase où F est évalué.

Crochets de Poisson et commutateurs La forte ressemblance entre (11) et (25) suggère que l'analogue quantique des équations du mouvement peut être trouvé en général en substituant le commutateur divisé par ih au crochet Poisson, 1 (26) {A, B} → [ A, B ] ih et à travailler avec le point de vue de Heisenberg. Il y a deux observations qui tendent à supporter cette suggestion. La première concerne les conditions classiques pour une transformation d'un ensemble de variables canoniques q i , p i à un autre Qi , Pi :

(27) {Qi , Pj } = δ ij

{Q , Q } = 0 {P , P } = 0 i

j

i

j

où les crochets de Poisson sont calculés par rapport aux variables originales q i , p i . Nous avons vu qu'un passage correct de la théorie classique à la théorie quantique pouvait être obtenu en substituant l'opérateur différentiel − ih(∂ / ∂x ) à p x , etc. Le commutateur de x et p x peut alors être

trouvé en opérant sur une fonction arbitraire g (r ) des coordonnées. ∂g ∂ (28) ( xp x − p x x )g (r ) = −ihx + ih ( xg ) = ihg (r ) ∂x ∂x

Puisque g (r ) est arbitraire, cette relation et les autres commutateurs peuvent être écrits comme des équations d'opérateurs :

∂   ∂ xp x − p x x = −ih x − x  = ih  ∂x ∂x   ∂ ∂  x  = 0 (29) xp y − p y x = −ih x −  ∂y ∂y  xy − yx = 0 px py − p y px = 0 etc. Elles sont en accord avec les équations classiques (27) quand la substitution (26) est faite. La deuxième observation est que les propriétés algébriques des commutateurs sont identiques à celles des crochets de Poisson. On vérifie facilement à partir de la définition (24) que {A, B} = −{B, A}

{A, c} = 0 (30) {( A1 + A2 ), B} = {A1 , B} + {A2 , B} {A1 A2 , B} = {A1 , B}A2 + A1 {A2 , B} {A, {B, C}} + {B, {C , A}} + {C , {A, B}} = 0 où c est un nombre.

L'ordre des facteurs éventuellement non commutant n'a pas été altéré. Dirac a montré que la forme de l'analogue quantique des crochets de Poisson est déterminée par les équations (30) remplacé par le coté droit de (26). La constante h est, bien sûr, arbitraire tant que l'on se cantonne à cette discussion.

Quantification d'un système classique Nous avons maintenant une procédure plausible pour trouver un système quantique qui se réduit à tout système classique spécifié selon le principe de correspondance ou la limite classique. Nous écrivons simplement les équations hamiltoniennes classiques en fonction des crochets de Poisson et nous remplaçons les crochets de Poisson par les commutateurs en accord avec (26). L'équation

classique du mouvement devient alors l'équation quantique (11) qui dit comment les variables dynamiques changent dans le temps dans le point de vue de Heisenberg. De même, les relations classiques (27) deviennent (31) [qi , p i ] = ihδ ij q i , q j = 0 p i , p j = 0

[

]

[

]

Notons que l'on peut alors montrer, comme nous l'avons fait pour la position et l'impulsion, que pour toute paire de variables canoniques : ∆q i ⋅ ∆p i ≥ 12 h . Ces conditions quantiques sont une généralisation de (29) et on vérifie facilement qu'elles sont valides dans tous les points de vue discutés au début de cette section. Donc, le point de vue de Heisenberg doit seulement être précisé pour les équations du mouvement. Nous supposerons toujours que c'est le cas dans le reste de cette section et l'indice H sera omis. Deux précautions sont nécessaires pour appliquer cette procédure de quantification. Tout d'abord, les coordonnées et moments doivent être exprimés en coordonnées cartésiennes. Deuxièmement, les ambiguïtés sur l'ordre des facteurs non commutant sont habituellement résolues en prenant une moyenne symétrique des différents ordres possibles. Ces précautions sont illustrées dans l'exemple suivant. Il est important de réaliser qu'il n'y a pas de manière unique d'effectuer la transition de la mécanique classique à la mécanique quantique. Des termes peuvent toujours être ajoutés aux équations quantiques du mouvement s'ils s'annulent à la limite classique ou de correspondance. D'autre part, si le comportement classique d'un système est connu, certaines restrictions sont placées sur ses équations quantiques. La procédure actuelle conduit généralement au système quantique le plus simple qui a la limite classique correcte. Ce système le plus simple peut omettre certains aspects intéressants de la vraie situation. Ainsi, le spin intrinsèque et le moment magnétique que possèdent certaines particules chargées n'apparaissent pas dans l'exemple traité cidessous.

Mouvement d'une particule dans un champ électromagnétique Comme exemple de la procédure de quantification précédente, considérons le problème du mouvement d'un point de masse chargé dans un champ électromagnétique général externe.

L'hamiltonien classique, exprimé en fonction des variables canoniques r, p et les potentiels électromagnétiques A(r, t ) , φ (r, t ) est (les unités de Gauss sont utilisées dans ce qui suit) 2

1  e  (32) H =  p − A  + eφ 2m  c  où e est la charge de la particule et c est la vitesse de la lumière. Les champs électriques et magnétiques sont donnés en fonction des potentiels par 1 ∂A − ∇φ H = ∇ × A (33) E = − c ∂t Les conditions quantiques (31) en coordonnées cartésiennes sont (34) [x, p x ] = y, p y = [z , p z ] = ih les autres paires de coordonnées et de composantes de l'impulsion commutants. Nous allons maintenant utiliser l'équation (11) avec l'expression (32) de H et les relations (34) pour calculer les expressions pour la vitesse de la particule dr / dt et l'accélération d 2 r / dt 2 pour les comparer aux expressions classiques correspondantes.

[

]

Evaluation des commutateurs Afin de faciliter l'évaluation de certains des commutateurs qui apparaissent dans la substitution dans (11), nous allons dériver quelques résultats élémentaires. Toutes les fonctions de r commutent puisque toutes les composantes de r commutent. Il suit de (34) que x 2 p x − p x x 2 = x ( p x x + ih ) − p x x 2 (35) = ( p x x + ih )x + ihx − p x x 2 = 2ihx On montre facilement par induction que (36) x n p x − p x x n = nihx n−1 Il suit de (36) que pour toute fonction f (r ) qui peut être exprimée comme un développement en série en x, y, z, la relation

∂ f (r ) ∂x est valide. Cela correspond à la relation classique { f (r ), p x } = ∂f (r ) / ∂x . L'équation (37) peut aussi être établie pour des fonctions plus générales que les développements en série en utilisant la représentation de p x comme − ih(∂ / ∂x ) comme dans (28). Si nous opérons avec la gauche de (37) (37) [ f (r ), p x ] = f (r ) p x − p x f (r ) = ih

sur une fonction arbitraire g (r ) , nous obtenons ∂ ∂    ∂  (38) [ f (r ), p x ]g (r ) = −ih  f (r ) − f (r ) g (r ) = g (r )ih f (r ) ∂x ∂x    ∂x  qui est équivalent à l'égalité d'opérateurs (37) puisque g (r ) est arbitraire. Par application répétée de (37), on montre facilement que ∂f ∂2 f  ∂f ∂f  + p x  = 2ih px + h 2 2 (39) f (r ) p x2 − p x2 f (r ) = ih p x ∂x ∂x  ∂x ∂x 

Vitesse et accélération d'une particule chargée L'hamiltonien (32) peut maintenant être écrit, avec l'aide de (37), p2 e e2 (p ⋅ A + A ⋅ p ) + H= − A 2 + eφ 2 2m 2mc 2mc (40) 2 p e ieh e2 = − A⋅p + ∇⋅A + A 2 + eφ 2m mc 2mc 2mc 2 La dérivée par rapport au temps d'une composante de r est facilement trouvée à partir de (11) dx 1  e  (41) =  p x − Ax  dt m  c  en accord avec la relation classique entre la vitesse et l'impulsion d'une particule en présence d'un champ électromagnétique. Le calcul d'une composante de l'accélération de la particule

d 2 x 1  dp x e dAx  =  −  dt 2 m  dt c dt  (42) 1 = [ p x , H ] − e ∂Ax − e [Ax , H ] i hm mc ∂t ihmc est immédiat mais assez ennuyeux. Le résultat peut être écrit dx 2 e  1 ∂Ax ∂φ  =−  + + 2 ∂x  m  c ∂t dt (43)

e  e  ∂Ay ∂Ax   ∂Ay ∂Ax  e      p − A − + − p − Ay       y y y c  ∂x ∂y   ∂x ∂y  c  2m 2 c  −

∂A   ∂A ∂A  e  e  ∂A e  p − Az  x − z  +  x − z  p z − Az  2  z ∂x   ∂z ∂x  c  ∂z c  2m c 

La force de Lorentz L'équation (43), avec des équations similaires pour les composantes y et z, peut être écrite comme une seule équation vectorielle pour la "force" : d 2r  1 ∂A  m 2 = e − − ∇φ  dt   c ∂t 1 e1  e  1 e  (44) +  p − A  × (∇ × A ) − (∇ × A ) ×  p − A   2 c m  c  m c  1 e  dr dr   ×H −H×  2 c  dt dt  où nous avons utilisé (33) et (41). L'équation (44) avec l'équation classique correspondante e (45) eE + (v × H ) c où v = dr / dt est la vitesse de la particule, si nous prenons une moyenne symétrique des deux termes v × H et − H × v . Elles sont identiques en mécanique classique mais diffèrent en mécanique = eE +

quantique car le v donné par (41) ne commute pas avec H. De même, bien que leur comme soit hermitique, les termes séparés ne le sont pas. L'équation (44) inclut une généralisation du théorème d'Ehrenfest. Si nous considérons un élément diagonal, le coté gauche est le produit de la masse et de la dérivée seconde par rapport au temps de la valeur moyenne du vecteur position de la particule puisque les kets du point de vue de Heisenberg sont indépendant du temps. Le coté droit est la valeur moyenne de la force de Lorentz agissant sur la charge de la particule. Donc, (44) dit qu'un paquet d'ondes se déplace comme une particule classique si elle est suffisament bien localisée pour que le champ électromagnétique change d'une quantité négligeable sur ses dimensions. Ce résultat peut aussi être obtenu par la méthode que nous avons vu avec le théorème d'Ehrenfest si, en accord avec (1) et (40), l'équation de Schrödinger dans le point de vue de Schrödinger est prise comme  ∂ψ  h 2 2 ieh ieh e2 (46) ih =  − ∇ + A⋅∇ + ∇⋅A + A 2 + eφ ψ 2 ∂t  2m mc 2mc 2mc 

Théorème du viriel Une preuve du théorème du viriel en mécanique quantique peut être donnée en analogie avec la démonstration correspondante en mécanique classique. Dans cette dernière, le point de départ est la moyenne dans le temps de la dérivée par rapport au temps de la quantité r ⋅ p qui est zéro pour un système périodique. La quantité analogue en mécanique quantique est la dérivée par rapport au temps de la valeur moyenne de r ⋅ p ou l'élément de matrice diagonal du commutateur de r ⋅ p et H dans la représentation énergie, qui est aussi zéro. d 1 [(r ⋅ p ), H ] = 0 r ⋅p = dt ih   p2 + p2 + p2 [(r ⋅ p ), H ] = (xp x + yp y + zp z ), x y z + V (x, y, z ) 2m (47)    ∂V ih 2 ∂V ∂V   = p x + p y2 + p z2 − ih x +y +z m ∂y ∂z   ∂x

(

)

= 2ihT − ih(r ⋅ ∇V )

où T est l'énergie cinétique. Nous en concluons que (48) 2 T = r ⋅ ∇V Notez que cela n'a pas d'importance de commencer avec r ⋅ p ou p ⋅ r puisque la différence entre les deux est une constante et donc commute avec H. Si V est à symétrie sphérique et proportionnel à r n et si la valeur moyenne existe, (48) montre que 2T =nV .

VI.4. Théorie matricielle de l'oscillateur harmonique L'oscillateur harmonique a été discuté du point de vue de l'équation de Schrödinger. Ce système peut aussi être traité en manipulant directement les équations matricielles. L'hamiltonien est de la forme à une dimension avec V ( x ) = 12 Kx 2 : p2 1 2 + Kx 2m 2 où x et p sont hermitiques puisque ce sont des variables dynamiques physiquement mesurables. La condition quantique est (2) xp − px = ih

(1) H =

Aucune autre information n'est nécessaire pour obtenir les valeurs propres de l'énergie et les fonctions propres.

Représentation énergie Nous travaillons d'abord dans la représentation énergie où H est diagonal. L'équation (1) peut être écrite en notation de Dirac comme 1 (3) k H l = E k k l = k p j j p l + 12 K k x j j x l 2m où le symbole de sommation (4) j p l = l p + j



= lpj

S

j

a été omit. Maintenant



puisque p est hermitique et une expression semblable existe pour les éléments de matrice de x. Donc, pour les éléments diagonaux de (3), le coté droit est une somme de carrés des valeurs absolues des éléments matriciels et donc est non négatif. Une valeur propre de l'énergie E k peut être zéro seulement si les éléments de matrice k p j et k x j sont zéro pour tout j. Cependant, cela serait inconsistant avec l'élément de matrice diagonal k de (2). Nous en concluons donc que toutes les valeurs propres de l'énergie sont positives.

Comme prochaine étape, nous calculons le commutateur de x et p avec H : ih (5) xH − Hx = p pH − Hp = −ihKx m Des équations de ce type sont généralement utiles si la représentation est choisie telle qu'un des facteurs dans le commutateur est diagonal puisque alors une différente entre deux valeurs propres apparaît quand un élément de matrice est pris. Donc, la première équation (5) devient ih (6) k x j j H l − k H j j x l = (El − E k ) k x l = k pl m De même, la deuxième équation (5) devient (7) (El − E k ) k p l = −ihK k x l Il suit de l'élimination de k x l des équations (6) et (7) que ou bien k x l = k p l = 0 ou 1

 K 2 (8) El − E k = ± h  = ± hω c m où ω c est la fréquence angulaire de l'oscillateur harmonique classique correspondant. Si nous écartions la première possibilité, les valeurs propres de l'énergie différeraient les unes des autres par un entier multiple de hω c . Il est alors possible de montrer, comme cela sera fait ci-dessous, que ces valeurs propres sont égales à (n + 12 )hω c où n est un entier positif ou zéro. Si nous essayons d'exploiter la première possibilité afin d'avoir des états avec différentes valeurs propres de l'énergie, nous voyons que les matrices qui représentent x et p sont identiquement zéro pour les nouveaux états et cela est à nouveau inconsistant avec (2). Donc, les seuls états possibles sont ceux dont les valeurs propres de l'énergie diffèrent d'un multiple entier de hω c . Opérateurs de création et de destruction Les équations (6) et (7) peuvent aussi être combinées d'une manière différente en multipliant la première par − imω c et en l'ajoutant à la seconde. Le résultat est

(9) (El − E k − hω c ) k ( p − imω c x ) l = 0 Donc, k ( p − imω c x ) l est non nul seulement quand E k = El − hω c . Cela signifie que le résultat de l'opération avec p − imω c x sur le ket l est un certain multiple du ket k qui a une énergie diminuée de hω c . De même, il est facile de voir que l'opérateur adjoint hermitique p + imω c x augmenter l'énergie de tout état de hω c . L'application répétée de l'opérateur d'abaissement sur tout ket conduira finalement à une difficulté puisque l'énergie doit être positive, sauf s'il y a un état d'énergie la plus basse 0 tel que (10) ( p − imω c x ) 0 = 0 L'état d'énergie la plus basse peut être trouvé avec (10) en opérant sur lui à gauche avec p + imω c x . Le résultat est ( p + imω c x )( p − imω c x ) 0 = p 2 + m 2ω c2 x 2 + imω c (xp − px ) 0 (11) = p 2 + m 2ω c2 x 2 − mhω c 0 = 2m(H − 12 hω c ) 0 = 0

(

)

[

]

Donc, 0 est un état propre de H avec la valeur propre 12 hω c . L'application de l'opérateur d'augmentation p + imω c x sur 0 donne un multiple du ket 1 qui a l'énergie

3 2

hω c . Des

applications supplémentaires génèrent une séquence infinie d'états propres qui sont indicés n avec les valeurs propres de l'énergie (12) E n = (n + 12 )hω c n = 0, 1, 2,… Il est souvent pratique de mettre les opérateurs d'augmentation et d'abaissement sous forme sans dimension en les multipliant par − i (2mhω c )



1 2

et i (2mhω c ) 2 , respectivement. Nous appelons −

1

opérateurs de destruction et de création obtenus de cette manière a + et a, respectivement. Il est facile de voir que

(13) aa + =

H 1 + hω c 2

a+a =

H 1 − hω c 2

Donc, a et a + satisfont la relation de commutation (14) aa + − a + a = 1 et H peut être écrit en fonction de ces opérateurs comme (15) H = (a + a + 12 )hω c Il suit des équations (12) et (15) que les valeurs propres de a + a sont les entiers positifs et zéro. Pour cette raison, a + a est souvent appelé l'opérateur de nombre. Ce résultat est une conséquence directe de la relation de commutation (14) et ne nécessite aucune autre information. Le fait que les valeurs propres de a + a , quand a est tout opérateur qui satisfait (14), soient les entiers positifs ou zéro est utile en relation avec la quantification des champs. Les opérateurs a + et a y apparaissent ab initio plutôt que comme des combinaisons de x et p et ont la signification physique de respectivement augmenter de diminuer le nombre de particules représentées par le champ. D'où leur nom d'opérateurs de création et de destruction. Dans le même contexte, l'opérateur de nombre a + a spécifie le nombre de particules présentes dans l'état propre du champ.

Matrices pour a, x et p Les seuls éléments de matrice non nuls de a sont n − 1 a n , que nous appellerons λ n . De même, les seuls éléments non nuls de a + sont n a + n − 1 , ils sont égaux à λ∗n . Alors, un élément de matrice diagonal de a + a est (16) n a + a n = n a + n ′ n ′ a n = λ n

2

où une sommation sur l'ensemble complet n ′ est sous-entendue. Puisque cet élément diagonal est 1

égal à n, λ n est égal à n 2 à un facteur de phase multiplicatif de grandeur unité près, que nous pouvons choisir égal à un. Donc, les matrices pour a et a + sont

0  0  0 a= 0      0 1   0 + a = 0     (17) 

1

0

0 2

          ⋅ 

0

1 2

0 1

0 0

32 0

0 0

⋅ ⋅ 0 0 2

1 2

0

0 0

0 0

0

0

3

1 2

0 ⋅ ⋅

          ⋅ 

Le produit a + a peut être effectué à partir de ces matrices. Il est diagonal avec les valeurs propres 0, 1, 2,… comme attendu. Les expressions pour a et a + en fonction de x et p sont facilement résolues pour donner 1

 h (18) x =   2mω c

(

2 +  a + a 

)

1

 mhω c  2 + p = i  a −a  2 

(

)

Des matrices explicites pour x et p sont faciles à trouver à partir de (17) et (18). Chacune a des éléments non nuls qui bordent la diagonale principale sur les deux cotés.

Représentation coordonnées Le ket 0 peut être trouvé en représentation coordonnées x 0 en résolvant (10) dans cette représentation. Nous avons (19) x ( p − imω c x ) 0 = x ( p − imω c x ) x ′ x ′ 0 = 0 où (20) x p x ′ = −ih

d δ ( x − x ′) et x x x ′ = xδ ( x − x ′) dx

et donc d   (21)  − ih − imω c x  x 0 = 0 dx   La solution est (22) x 0 = A0 e − (mω c / 2 h ) x

2

où A0 est une constante arbitraire. La normalisation (23) 0 x x 0 ≡ ∫



−∞

2

x 0 dx = 1 1

1

montre que A0 = (mω c / πh ) 2 = α 2 / π 4 où α a été définit dans l'étude précédente de l'oscillateur harmonique. 1

Comme remarqué ci-dessus, l'application répétée de l'opérateur de création p + imω c x sur x 0 génère tous les états propres (non normalisés) x n . On vérifie facilement que pour une fonction arbitraire g ( x )

( p + imω c x )g (x ) = −ih d

 dx

(24) = −i he

mω c x 2 / 2 h



mω c  x  g (x ) h 

d  − mω c x 2 / 2 h e g (x )  dx 

Une deuxième application de p + imω c x donne mω x 2 / 2 h d  − mω c x 2 / 2 h 2 (25) ( p + imω c x ) g ( x ) = −ihe c [( p + imω c x )g (x )] e dx   et la substitution dans (24) donne 2 2 2 mω x / 2 h d e −mω c x 2 / 2h g (x ) (26) (− ih ) e c 2   dx  L'induction à ( p + imω c x ) g ( x ) est évidente. Donc, quand g ( x ) est choisi comme (22), nous obtenons n mω x 2 / 2 h d − mω c x 2 / 2 h (27) x n = An e c e dx n où An est une constante de normalisation. n

Tous ces résultats sont en accord avec ceux obtenus lors de notre étude précédente de l'oscillateur harmonique.

Exercices 1. Supposez qu'une matrice hermitique donnée puisse être diagonalisée par une matrice unitaire. Montrez alors que la condition nécessaire et suffisante pour que deux matrices hermitiques puissent être diagonalisées par la même transformation unitaire est qu'elles commutent. 2. Montrez qu'une matrice non singulière de rang fini doit être carrée. Montrez aussi que dans ce cas, l'équation AA −1 = 1 implique l'équation A −1 A = 1 . 3. Montrez que det e A = e tr ( A ) . Donnez les conditions sur A qui doivent être supposées dans votre démonstration. 4. Trouvez deux matrices A et B qui satisfont les équations suivantes : A2 = O

( )

AA + + A + A = 1 B = A+ A où O est la matrice nulle et 1 la matrice unité. Montrez que B 2 = B . Obtenez des expressions explicites pour A et B dans une représentation où B est diagonale, en supposant qu'elle est non dégénérée. Est-ce que A peut être diagonalisée dans une certaine représentation ? 5. Trouvez trois matrices A, B et C qui satisfont les équations suivantes : A2 = B 2 = C 2 = 1 AB + BA = BC + CB = CA + AC = O où O est la matrice nulle et 1 la matrice unité. Obtenez des expressions explicites pour les trois matrices dans une représentation où A est diagonal, en supposant qu'elle est non dégénérée. 6. Trouvez trois matrices A, B et C qui satisfont les équations suivantes : A2 = B 2 = C 2 = 1 BC − CB = iA où 1 est la matrice unité. Montrez que AB + BA = AC + CA = O , où O est la matrice nulle. Obtenez des expressions explicites des trois matrices dans une représentation où A est diagonal, en supposant qu'elle est non dégénérée.

7. Si A et B sont deux matrices carrées de même rang et C ≡= [B, A] , montrez que A+ B

1 C 2

e =e e e pourvu que [C , A] = [C , B ] = 0 . A

B

8. Si H = p 2 / 2 µ + V (x ) pour le mouvement à une dimension d'une particule et si V ( x ) peut être exprimé comme un développement en série de x, montrez par des méthodes purement matricielles que dx p = dt µ dp dV =− dt dx où x et p sont considérés dans le point de vue de Heisenberg. 9. A( x, p ) et B( x; p ) peuvent être exprimés comme des développements en série de x et p et [x, p] = ih . Montrez par des méthodes purement matricielles que 1 lim [A, B ] = {A, B} h → 0 ih où le coté droit est le crochet de Poisson calculé comme si x et p étaient des variables classiques. 10. L'hamiltonien H = p 2 / 2 µ + V (r ) a un ensemble de vecteurs propres k avec les valeurs propres E k . Montrez que, si l est un vecteur donné qui a une valeur propre discrète,

h2 S k (E k − E l ) k x l = 2µ où x st une composante cartésienne de r. Comme sous-produit de votre solution, donnez une démonstration matricielle du problème 9 à la fin de la section III.2. 11. L'hamiltonien de l'oscillateur harmonique peut être écrit en représentation coordonnées comme h2 d 2 1 x H x′ = − δ ( x − x ′) + Kx 2δ ( x − x ′) 2 2m dx 2 Transformez H dans la représentation impulsion et trouvez les fonctions d'onde dans cette 2

représentation qui correspondent aux fonctions d'onde dans la représentation x données dans l'équation (19) de la section IV.1 ou l'équation (27) de la section VI.4. 12. Montrez que la matrice pour x obtenue à partir des équations (17) et (18) de la section VI.4 est en accord avec l'équation (28) de la section IV.1 et que l'équation (27) de la section VI.4 est en accord avec les équations (17) et (19) de la section IV.1.

Annexes A.1. Tableau des particules élémentaires L'ensemble des particules élémentaires et résonances (particules dans un état excité et de très courte durée de vie) est considérable. Nous n'avons repris ici que les principales particules ainsi que les quelques propriétés qui nous intéressent. Nous ne donnons que les valeurs approximatives. Ce tableau ne constitue donc qu'un tout petit aperçu des particules élémentaires. Nous n'avons pas indiqué les particules d'antimatière. Elles se déduisent des particules existantes par le changement de signe des charges. L'ensemble de ces particules et leurs propriétés est le résultat de décennies d'étude à l'aide des accélérateurs de particules élémentaires. Les particules composites ont une structure interne composée de quarks. On peut avoir plusieurs structures possibles suivant la charge. Lorsque l'on donne une addition, il s'agit en fait d'une superposition quantique. La barre sur un symbole indique l'antiparticule.

Particule

Nature

Charge

e p n

Electron Proton Neutron Muon Tau Neutrino Quark Quark Quark Interaction

-1 +1 0 -1 -1 0 2/3 -1/3 -1/3 0

µ τ ν

u d s Photon

Masse (MeV) 0.511 938.28 939.57 105.66 1784.2 ~0 336 336 540 0

Durée de vie (s) Stable Stable 898 2.19 ⋅ 10 −6 3.4 ⋅ 10 −13 Stable

Stable

Etrangeté

Spin Structure

0 0 0 0 0 0 0 0 1 0

1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1

Elémentaire uud ddu Elémentaire Elémentaire Elémentaire Elémentaire Elémentaire Elémentaire Elémentaire

Λ Σ

électromag nétique Interaction forte Interaction faible Interaction faible Baryon Baryon

Ξ

Gluon W Z

0

0

Stable

0

1

Elémentaire

+1

0

1

Elémentaire

0

0

1

Elémentaire uds uus uds dds uus dss ud uu + dd ud us ds d s us us ds ds us

0 0, +1, -1

1115.6 1190

-1 2.6 ⋅ 10 −10 −20 0 -1 Σ 5.8 ⋅ 10 −10 autre 10

1/2 1/2

Baryon

0, -1

1320

2 ⋅ 10 −10

1/2

π

Méson

0, +1, -1

135

π + 2.6 ⋅ 10 −8 0 π 0 0.8 ⋅ 10 −16

0

η

Méson

0

548.8

Proche de 0

0

0

K

Méson

0, +1, -1

497

K+ 1.23 ⋅ 10 −8 autre 0.9 ⋅ 10 −10

+1, -1

0

-2

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF