Matrice aléatoire

En théorie des probabilités et en physique mathématique , une matrice aléatoire est une variable aléatoire à valeurs matricielles — c'est-à-dire une matrice dont certaines ou toutes les valeurs sont tirées aléatoirement d'une distribution de probabilité . La théorie des matrices aléatoires (TMA) étudie les propriétés des matrices aléatoires, notamment lorsqu'elles deviennent de grande taille. La TMA propose des techniques telles que la théorie du champ moyen , les méthodes diagrammatiques, la méthode de la cavité ou la méthode des répliques pour calculer des quantités comme les traces , les densités spectrales ou les produits scalaires entre vecteurs propres. De nombreux phénomènes physiques, tels que le spectre des noyaux d'atomes lourds , la conductivité thermique d'un réseau cristallin ou l'émergence du chaos quantique , peuvent être modélisés mathématiquement comme des problèmes impliquant de grandes matrices aléatoires.

Enrico Fermi et d'autres chercheurs ont démontré que l'on ne peut pas considérer que les nucléons individuels se déplacent indépendamment, ce qui a conduit Niels Bohr à formuler l'idée d'un noyau composé . Faute de connaissances sur les interactions directes nucléon-nucléon , Eugene Wigner et Leonard Eisenbud ont proposé d'approximer l' hamiltonien nucléaire par une matrice aléatoire. Pour les atomes plus grands, la distribution des valeurs propres de l'énergie de l'hamiltonien a pu être calculée afin d'approximer les sections efficaces de diffusion en utilisant la distribution de Wishart .

Applications

Physique

En physique nucléaire , les matrices aléatoires ont été introduites par Eugene Wigner pour modéliser les noyaux d'atomes lourds. Wigner a postulé que les espacements entre les raies du spectre d'un noyau d'atome lourd devraient ressembler aux espacements entre les valeurs propres d'une matrice aléatoire, et ne dépendre que de la classe de symétrie de l'évolution sous-jacente. En physique du solide , les matrices aléatoires modélisent le comportement d' hamiltoniens désordonnés de grande taille dans l' approximation du champ moyen .

En matière de chaos quantique , la conjecture de Bohigas–Giannoni–Schmit (BGS) affirme que les statistiques spectrales des systèmes quantiques dont les homologues classiques présentent un comportement chaotique sont décrites par la théorie des matrices aléatoires.

En optique quantique , les transformations décrites par des matrices unitaires aléatoires sont essentielles pour démontrer l'avantage du calcul quantique sur le calcul classique (voir, par exemple, le modèle d'échantillonnage bosonique ). De plus, ces transformations unitaires aléatoires peuvent être directement implémentées dans un circuit optique, en associant leurs paramètres à des composants de circuit optique (par exemple, des séparateurs de faisceau et des déphaseurs).

Statistiques mathématiques et analyse numérique

En statistique multivariée , les matrices aléatoires ont été introduites par John Wishart , qui cherchait à estimer les matrices de covariance de grands échantillons . Les inégalités de type Chernoff , Bernstein et Hoeffding peuvent généralement être renforcées lorsqu'elles sont appliquées à la valeur propre maximale (c'est-à-dire la valeur propre de plus grande magnitude) d'une somme finie de matrices hermitiennes aléatoires . La théorie des matrices aléatoires est utilisée pour étudier les propriétés spectrales des matrices aléatoires, telles que les matrices de covariance d'échantillon, ce qui présente un intérêt particulier en statistique de grande dimension . Cette théorie a également trouvé des applications dans les réseaux de neurones et l'apprentissage profond . Des travaux récents ont démontré que les réglages d'hyperparamètres peuvent être transférés à moindre coût entre de grands réseaux de neurones sans nécessiter de réentraînement

En analyse numérique , les matrices aléatoires sont utilisées depuis les travaux de John von Neumann et Herman Goldstine pour décrire les erreurs de calcul dans des opérations telles que la multiplication matricielle . Bien que les entrées aléatoires soient des entrées « génériques » classiques d'un algorithme, la concentration de la mesure associée aux distributions de matrices aléatoires implique que ces matrices ne permettent pas de tester de larges portions de l'espace d'entrée d'un algorithme.

théorie des nombres

En théorie des nombres , la distribution des zéros de la fonction zêta de Riemann (et d'autres fonctions L ) est modélisée par la distribution des valeurs propres de certaines matrices aléatoires. Ce lien a été découvert par Hugh Montgomery et Freeman Dyson . Il est lié à la conjecture de Hilbert-Pólya .

Probabilité libre

Le lien entre les probabilités libres et les matrices aléatoires est une des raisons principales de l'utilisation répandue des probabilités libres dans d'autres domaines. Voiculescu a introduit le concept de liberté vers 1983 dans un contexte d'algèbre des opérateurs ; initialement, il n'existait aucun lien avec les matrices aléatoires. Ce lien n'a été révélé que plus tard, en 1991, par Voiculescu lui-même ; il était motivé par le fait que la distribution limite qu'il avait trouvée dans son théorème central limite libre était déjà apparue dans la loi du demi-cercle de Wigner, dans le contexte des matrices aléatoires.

neurosciences computationnelles

En neurosciences computationnelles, les matrices aléatoires sont de plus en plus utilisées pour modéliser le réseau de connexions synaptiques entre les neurones cérébraux. Il a été démontré que les modèles dynamiques de réseaux neuronaux à matrice de connectivité aléatoire présentent une transition de phase vers le chaos lorsque la variance des poids synaptiques franchit une valeur critique, à la limite d'un système de taille infinie. Les résultats obtenus avec les matrices aléatoires ont également montré que la dynamique des modèles à matrice aléatoire est insensible à la force moyenne des connexions. En revanche, la stabilité des fluctuations dépend de la variation de cette force et le temps de synchronisation dépend de la topologie du réseau

Dans l'analyse de données massives telles que l'IRMf , la théorie des matrices aléatoires est appliquée pour réduire la dimensionnalité. Lors de l'application d'un algorithme comme l'ACP , il est important de pouvoir sélectionner le nombre de composantes significatives. Les critères de sélection peuvent être multiples (variance expliquée, méthode de Kaiser, valeurs propres, etc.). La distribution de Marchenko-Pastur est un exemple représentatif de la théorie des matrices aléatoires ; elle garantit les bornes théoriques des valeurs propres associées à la matrice de covariance d'une variable aléatoire. La matrice ainsi calculée constitue l'hypothèse nulle, permettant d'identifier les valeurs propres (et leurs vecteurs propres) qui s'écartent de l'intervalle théorique. Les composantes ainsi exclues forment l'espace de dimension réduite (voir exemples en IRMf ).

Contrôle optimal

En théorie du contrôle optimal , l'évolution temporelle de n variables d'état dépend à chaque instant de leurs valeurs propres et de celles de k variables de contrôle. Dans le cas d'une évolution linéaire, des matrices de coefficients apparaissent dans l'équation d'état (équation d'évolution). Pour certains problèmes, les valeurs des paramètres de ces matrices sont incertaines ; on parle alors de matrices aléatoires dans l'équation d'état, et le problème relève du contrôle stochastique Un résultat fondamental concernant le contrôle linéaire-quadratique avec matrices stochastiques est que le principe d'équivalence de certitude ne s'applique pas : alors qu'en l'absence d' incertitude sur le multiplicateur (c'est-à-dire avec une incertitude uniquement additive), la politique optimale avec une fonction de perte quadratique coïncide avec celle qui serait adoptée si l'incertitude était négligée, la politique optimale peut différer si l'équation d'état contient des coefficients aléatoires.

Mécanique computationnelle

En mécanique numérique , les incertitudes épistémiques liées à la connaissance imparfaite de la physique du système modélisé engendrent des opérateurs mathématiques associés au modèle numérique qui présentent certaines limitations. Ces opérateurs sont dépourvus de certaines propriétés liées à la physique non modélisée. Lors de leur discrétisation pour réaliser des simulations numériques, leur précision est limitée par ces lacunes physiques. Pour pallier cette limitation, il ne suffit pas de rendre aléatoires les paramètres du modèle ; il est nécessaire de considérer un opérateur mathématique aléatoire capable de générer des familles de modèles numériques, dans l’espoir que l’un d’eux capture la physique manquante. Les matrices aléatoires ont été utilisées à cette fin , avec des applications en vibroacoustique, propagation des ondes, science des matériaux, mécanique des fluides, transfert de chaleur, etc.

Ingénierie

La théorie des matrices aléatoires peut être appliquée aux efforts de recherche en génie électrique et des communications pour étudier, modéliser et développer des systèmes radio MIMO (Multiple-Input Multiple-Output) massifs.Les distributions de matrices aléatoires les plus étudiées sont les ensembles gaussiens : GOE, GUE et GSE. Elles sont souvent désignées par leur indice de Dyson : β = 1 pour GOE, β = 2 pour GUE et β = 4 pour GSE. Cet indice compte le nombre de composantes réelles par élément de matrice.

Définitions

L' ensemble unitaire gaussien est décrit par la mesure gaussienne de densité sur l'espace des matrices hermitiennes . est une constante de normalisation, choisie de sorte que l'intégrale de la densité soit égale à un. Le terme « unitaire » indique que la distribution est invariante par conjugaison unitaire. L'ensemble unitaire gaussien modélise les hamiltoniens dépourvus de symétrie d'inversion temporelle.

L' ensemble orthogonal gaussien est décrit par la mesure gaussienne avec densité sur l'espace des matrices symétriques réelles n × n H = ( H _ij )

L' ensemble symplectique gaussien est décrit par la mesure gaussienne avec densité sur l'espace des matrices quaternioniques hermitiennes n × n , par exemple des matrices carrées symétriques composées de quaternions ,

Propriétés de base

Fonctions de corrélation ponctuelle Les ensembles tels que définis ici ont des éléments de matrice distribués gaussiens avec une moyenne ⟨ H _ij ⟩ = 0 et des corrélations à deux points données par lesquelles toutes les corrélations supérieures découlent du théorème d'Isserlis .

La fonction génératrice des moments pour le GOE est où est la norme de Frobenius .

Distribution spectrale

La densité de probabilité $valeurs propres$

où Z _{β , n} est une constante de normalisation qui peut être calculée explicitement (voir l'intégrale de Selberg ). Dans le cas de l'équation universelle généralisée (GUE) ( β = 2), la formule (1) décrit un processus ponctuel déterminantal . Les valeurs propres se repoussent car la densité de probabilité conjointe s'annule (d' ordre n) pour des valeurs propres coïncidentes λβ et λβ .

Plus succinctement, où se trouve le déterminant de Vandermonde ?

La distribution de la plus grande valeur propre pour GOE et GUE est explicitement soluble. Elles convergent vers la distribution de Tracy-Widom après translation et mise à l'échelle appropriées.

Le spectre, divisé par , converge en distribution vers une distribution semi-circulaire sur l'intervalle : . représente la variance des éléments hors diagonale. La variance des éléments sur la diagonale est négligeable.

Matrices de Wishart

transposée conjuguée . Dans le cas particulier important considéré par Wishart, les coefficients de X sont des variables aléatoires gaussiennes identiquement distribuées (réelles ou complexes).

La limite de la mesure spectrale empirique des matrices de Wishart a été trouvée par Vladimir Marchenko et Leonid Pastur .

matrice de bande aléatoire

distance de taxi entre les deux positions. Pour tous i, j et toutes valeurs non nulles de , les variances sont du même ordre de grandeur, normalisées de sorte que pour chaque valeur de j.

W | je - j | > W

Matrices unitaires aléatoires

Types de convergence

Étant donné un ensemble de matrices, on dit que ses mesures spectrales convergent faiblement vers si et seulement si, pour tout ensemble mesurable , la moyenne de l'ensemble converge : Convergence faiblement presque sûre : Si nous échantillonnons indépendamment de l'ensemble, alors avec une probabilité de 1, pour tout ensemble mesurable .

Dans un autre sens , la convergence faible presque sûre signifie que nous échantillonnons , non pas indépendamment, mais en « faisant croître » (un processus stochastique ), alors avec une probabilité de 1, pour tout ensemble mesurable .

Par exemple, nous pouvons « faire croître » une séquence de matrices à partir de l'ensemble gaussien comme suit :

Échantillonner une séquence infinie doublement infinie de variables aléatoires standard .
Définissons chaque où est la matrice composée d'entrées .

Notez que les ensembles de matrices génériques ne nous permettent pas de croître, mais que la plupart des ensembles courants, tels que les trois ensembles gaussiens, nous permettent de croître.

Régime mondial

Dans le régime global , on s'intéresse à la distribution des statistiques linéaires de la forme .

La limite de la mesure spectrale empirique pour les matrices de Wigner a été décrite par Eugene Wigner ; voir la distribution en demi-cercle de Wigner et la supposition de Wigner . En ce qui concerne les matrices de covariance d’échantillon, une théorie a été développée par Marčenko et Pastur .

La limite de la mesure spectrale empirique des ensembles de matrices invariantes est décrite par une certaine équation intégrale qui provient de la théorie du potentiel .

Fluctuations

Pour les statistiques linéaires

Le problème variationnel pour les ensembles unitaires

Considérons la mesure

où représente le potentiel de l'ensemble et soit la mesure spectrale empirique.

Nous pouvons réécrire avec comme

la mesure de probabilité est maintenant de la forme

où se trouve la fonction ci-dessus à l'intérieur des crochets ?

Laissez-moi maintenant

Soit l'espace des mesures de probabilité unidimensionnelles et considérons le minimiseur

Car il existe une mesure d'équilibre unique grâce aux conditions variationnelles d'Euler-Lagrange pour une certaine constante réelle

où se situe le support de la mesure et définir

.

La mesure d'équilibre a la densité de Radon-Nikodym suivante

Régime mésoscopique

L'énoncé typique de la loi semi-circulaire de Wigner est équivalent à l'énoncé suivant : Pour chaqueintervallefixecentré sur un point, lorsque, le nombre de dimensions de l'ensemble gaussien augmente, la proportion des valeurs propres tombant dans l'intervalle converge vers, oùest la densité de la distribution semi-circulaire.

Si l'on peut autoriser la diminution de à mesure que augmente, alors on obtient des théorèmes strictement plus forts, appelés « lois locales » ou « régime mésoscopique ».

Le régime mésoscopique est intermédiaire entre le régime local et le régime global. Dans ce régime , on s'intéresse à la distribution limite des valeurs propres dans un ensemble qui tend vers zéro, mais suffisamment lentement pour que le nombre de valeurs propres à l'intérieur de cet ensemble tende vers zéro .

Par exemple, l'ensemble de Ginibre possède une loi mésoscopique : pour toute séquence de disques se contractant d'aires comprises dans le disque unité, si les disques ont une aire , la distribution conditionnelle du spectre à l'intérieur des disques converge également vers une distribution uniforme. Autrement dit, si l'on découpe les disques se contractant en conservant le spectre qu'ils contiennent, puis que l'on agrandit les disques à une aire unitaire, on observe que les spectres convergent vers une distribution uniforme dans les disques.

Régime local

Dans le régime local , on s'intéresse à la distribution limite des valeurs propres dans un ensemble qui se réduit si rapidement que le nombre de valeurs propres reste .

En règle générale, cela signifie l'étude des espacements entre les valeurs propres et, plus généralement, de la distribution conjointe des valeurs propres dans un intervalle de longueur de l'ordre de 1/ n . On distingue entre les statistiques globales , relatives aux intervalles à l'intérieur du support de la mesure spectrale limite, et les statistiques de bord , relatives aux intervalles proches de la frontière du support.

Statistiques en masse

Formellement, fixons à l' intérieur du support de . Considérons ensuite le processus ponctuel où sont les valeurs propres de la matrice aléatoire.

Le processus ponctuel capture les propriétés statistiques des valeurs propres au voisinage de . Pour les ensembles gaussiens , la limite de est connue ; ainsi, pour GUE, il s’agit d’un processus ponctuel déterminantal dont le noyau est (le noyau sinus ).

Le principe d'universalité postule que la limite de ne doit dépendre que de la classe de symétrie de la matrice aléatoire (et ni du modèle spécifique de matrices aléatoires ni de ). Des preuves rigoureuses de l'universalité sont connues pour les ensembles de matrices invariantes et les matrices de Wigner.

Statistiques Edge

distribution de Tracy-Widom .

Prenons comme autre exemple l'ensemble de Ginibre. Il peut être réel ou complexe. L'ensemble de Ginibre réel possède des entrées gaussiennes standard indépendantes et identiquement distribuées (i.i.d.) , tandis que l'ensemble de Ginibre complexe possède des entrées gaussiennes standard indépendantes et identiquement distribuées (i.i.d.) .

Soit maintenant un échantillon de l'ensemble réel ou complexe, et soit la valeur absolue de sa valeur propre maximale : Nous avons le théorème suivant pour les statistiques de bord :

Ce théorème affine la loi circulaire de l'ensemble de Ginibre . En d'autres termes, la loi circulaire stipule que le spectre de se répartit presque sûrement uniformément sur le disque unité. Le théorème des statistiques de bord, quant à lui, indique que le rayon du disque quasi-unité est d'environ et fluctue sur une échelle de , conformément à la loi de Gumbel.

Rigidité spectrale

Le phénomène de rigidité spectrale stipule que les valeurs propres des ensembles matriciels les plus couramment utilisés tendent à être distribuées de manière plus uniforme que si elles étaient échantillonnées indépendamment et aléatoirement. Autrement dit, elles se regroupent moins qu'un processus ponctuel de Poisson pur . On parle également de rigidité des valeurs propres ou de répulsion des niveaux .

Plus précisément, supposons qu'un ensemble de matrices possède une mesure de densité spectrale limite . Fixons un sous-ensemble tel que . Il s'agit de la proportion de valeurs propres qui se situent dans à la limite des grandes valeurs de , donc le nombre attendu de valeurs propres se situant dans est . Or, un processus ponctuel de Poisson pur impliquerait que le nombre réel de , puisque est l'écart-type du nombre de points se situant dans lorsque les points sont complètement indépendants les uns des autres. Inversement, si les points sont complètement rigides, alors le nombre réel serait égal à sans fluctuation. Or, il s'avère que dans de nombreux ensembles de matrices, le nombre de points se situant dans est , c'est-à-dire qu'ils ne sont pas complètement rigides, mais très proches de l'être. La rigidité spectrale a été observée numériquement dans les zéros de la fonction zêta de Riemann .

Fonctions de corrélation

La densité de probabilité conjointe des valeurs propres de matrices hermitiennes aléatoires , dont les fonctions de partition sont de la forme où et est la mesure de Lebesgue standard sur l'espace des matrices hermitiennes , est donnée par . Les fonctions de corrélation à (ou distributions marginales ) sont définies comme , qui sont des fonctions antisymétriques de leurs variables. En particulier, la fonction de corrélation à un point, ou densité d'états , est . Son intégrale sur un ensemble borélien donne le nombre moyen de valeurs propres contenues dans .

Le résultat suivant exprime ces fonctions de corrélation comme des déterminants des matrices formées en évaluant le noyau intégral approprié aux paires de points apparaissant dans le corrélateur.

Théorème [Dyson-Mehta] Pour tout , la fonction de corrélation à -points peut s'écrire sous la forme d'un déterminant où est le i-ème noyau de Christoffel-Darboux associé à , exprimé en termes de quasipolynômes où est une suite complète de polynômes unitaires, de degrés indiqués, satisfaisant les conditions d'orthogonalité

Généralisations

Les matrices de Wigner sont des matrices hermitiennes aléatoires telles que les éléments au-dessus de la diagonale principale sont des variables aléatoires indépendantes de moyenne nulle et ayant des moments d'ordre deux identiques.

Les ensembles gaussiens peuvent être étendus en utilisant l'astuce tridiagonale de Dumitriu-Edelman. On les appelle les se généralisent aux matrices aléatoires sous forme d'ensembles de matrices à queue lourde .

Bibliographie sélective

Livres

Mehta, ML (2004). Matrices aléatoires . Amsterdam : Elsevier/Academic Press. ISBN0-12-088409-7.
ISBN978-0-8218-4737-4.
ISBN978-0-691-12829-0.
ISBN978-0-521-19452-5.
doi : 10.1007/978-1-4419-0661-8 . ISBN978-1-4419-0660-1. ISSN 0172-7397 .
ISBN978-0-19-957400-1.
ISBN978-0-8218-7430-1.
doi : 10.1017/9781108768900 . ISBN978-1-108-76890-0.

Articles de sondage

Bibcode : 2005AcNum..14..233E . doi : 10.1017/S0962492904000236 . S2CID : 16038147 .
Bibcode : 1973RuMaS..28....1P . doi : 10.1070/RM1973v028n01ABEH001396 . S2CID : 250796916 .
Diaconis, Persi (2003). « Modèles de valeurs propres : la 70e conférence Josiah Willard Gibbs » . Bulletin of the American Mathematical Society . Nouvelle série. 40 (2) : 155–178 . doi : 10.1090/S0273-0979-03-00975-3 . MR 1962294 .
Diaconis, Persi (2005). « Qu'est-ce qu'une matrice aléatoire ? » . Notices of the American Mathematical Society . 52 (11) : 1348–1349 . ISSN 0002-9920 . MR 2183871 .
arXiv : 1510.04430v2 [ math-ph ].
arXiv : cond-mat/9612179 . Bibcode : 1997RvMP...69..731B . doi : 10.1103/RevModPhys.69.731 .

œuvres historiques

Bibcode : 1955AnMat..62..548W . doi : 10.2307/1970079 . JSTOR : 1970079 .
doi : 10.1093/biomet/20a.1-2.32 .
doi : 10.1090/S0002-9904-1947-08909-6 .

Plus d articles de Worldlex Wiki

Revenez a l index pour explorer davantage de pages sur l histoire, la science, la culture, la geographie et la societe en francais.

Explorer l index