Les distributions de probabilité sont étroitement liées aux variables aléatoires . Une variable aléatoire est une fonction qui associe une valeur à chaque résultat d'une expérience probabiliste ; elle induit une distribution de probabilité sur l'ensemble des valeurs qu'elle peut prendre. Par exemple, le résultat d'un lancer de pièce peut être représenté par une variable aléatoire les fonctions de répartition , les fonctions de masse de probabilité ou les fonctions de densité de probabilité . Le choix de la description dépend de la nature de la distribution : les fonctions de masse de probabilité sont utilisées pour les distributions discrètes , tandis que les fonctions de densité de probabilité sont utilisées pour de nombreuses distributions continues .
Les distributions de probabilité qui se produisent fréquemment ou qui ont une importance théorique particulière reçoivent souvent des noms spécifiques ; des exemples sont rassemblés dans la liste des distributions de probabilité .
probabilités d'événements, c'est-à-dire des sous-ensembles de l' espace échantillonnal . L'espace échantillonnal, souvent représenté par Ω, est l' ensemble de tous les résultats possibles d'un phénomène aléatoire observé. L'espace échantillonnal peut être n'importe quel ensemble de nombres , de vecteurs , d'étiquettes, ou autre. Par exemple, l'espace échantillonnal d'un lancer de pièce pourrait être de dé , il pourrait êtreDéfinition générale de la probabilité
Soit un espace de probabilité , un espace mesurable et une variable aléatoire à valeurs dans . Alors la distribution de probabilité de est la mesure image directe de la mesure de probabilité sur induite par . Plus précisément, cette mesure image directe sur est donnée par pour
Toute distribution de probabilité est une mesure de probabilité sur (en général différente de , sauf si est l'application identité).
Une distribution de probabilité peut être décrite sous diverses formes, telles qu'une fonction de masse de probabilité ou une fonction de répartition. L'une des descriptions les plus générales, valable pour les variables absolument continues et discrètes, utilise une fonction de probabilité dont l'espace d'entrée est une σ-algèbre et qui donne en sortie une probabilité réelle , en particulier un nombre appartenant à .
La fonction de probabilité peut prendre comme arguments des sous-ensembles de l'espace échantillonnal lui-même, comme dans l'exemple du lancer de pièce, où la fonction a été définie de sorte que variables aléatoires , qui transforment l'espace échantillonnal en un ensemble de nombres (par exemple, , ), il est plus courant d'étudier les distributions de probabilité dont les arguments sont des sous-ensembles de ces ensembles particuliers (ensembles de nombres) , et toutes les distributions de probabilité abordées dans cet article sont de ce type. On note généralement la probabilité qu'une certaine valeur de la variable appartienne à un certain événement .
La fonction de probabilité ci-dessus ne caractérise une distribution de probabilité que si elle satisfait tous les axiomes de Kolmogorov , c'est-à-dire :
Le concept de fonction de probabilité est rendu plus rigoureux en le définissant comme l'élément d'un espace de probabilité , où est l'ensemble des résultats possibles, est l'ensemble de tous les sous-ensembles dont la probabilité peut être mesurée, et est la fonction de probabilité, ou mesure de probabilité, qui attribue une probabilité à chacun de ces sous-ensembles mesurables .
Les distributions de probabilité appartiennent généralement à l'une de ces deux classes.
Une distribution de probabilité discrète s'applique aux scénarios où l'ensemble des résultats possibles est discret (par exemple, un lancer de pièce, un lancer de dé) et où les probabilités sont codées par une liste discrète des probabilités des résultats ; dans ce cas, les probabilités sont décrites par une fonction de masse de probabilité , et la distribution de probabilité est donnée par une somme de la fonction de masse de probabilité.
Une distribution de probabilité absolument continue s'applique aux situations où l'ensemble des résultats possibles peut prendre des valeurs dans un intervalle continu (par exemple, les nombres réels), comme la température d'un jour donné. Dans ce cas, les probabilités sont décrites par une fonction de densité de probabilité , et la distribution de probabilité est, par définition, l'intégrale de cette fonction. La distribution normale est une distribution de probabilité absolument continue courante. Des expériences plus complexes, telles que celles impliquant des processus stochastiques définis en temps continu , peuvent nécessiter l'utilisation de mesures de probabilité plus générales .
Une distribution de probabilité dont l'espace d'échantillonnage est unidimensionnel (par exemple, les nombres réels, une liste d'étiquettes, des étiquettes ordonnées ou binaires) est dite univariée , tandis qu'une distribution dont l'espace d'échantillonnage est un espace vectoriel de dimension 2 ou plus est dite multivariée . Une distribution univariée donne les probabilités qu'une variable aléatoire unique prenne différentes valeurs ; une distribution multivariée (ou distribution de probabilité conjointe ) donne les probabilités qu'un vecteur aléatoire – une liste de deux variables aléatoires ou plus – prenne différentes combinaisons de valeurs. Parmi les distributions de probabilité univariées importantes et courantes, on trouve la distribution binomiale , la distribution hypergéométrique et la distribution normale . La distribution normale multivariée est une distribution multivariée courante .
Outre la fonction de probabilité, la fonction de répartition cumulative, la fonction de masse de probabilité et la fonction de densité de probabilité, la fonction génératrice des moments et la fonction caractéristique servent également à identifier une distribution de probabilité, car elles déterminent de manière unique une fonction de répartition cumulative sous-jacente.

Terminologie
Quelques concepts et termes clés, largement utilisés dans la littérature sur le sujet des distributions de probabilité, sont énumérés ci-dessous.
termes de base
- Variable aléatoire : prend des valeurs issues d'un espace d'échantillonnage ; les probabilités décrivent quelles valeurs et quels ensembles de valeurs sont les plus susceptibles d'être obtenus.
- Événement : ensemble des valeurs possibles (résultats) d'une variable aléatoire qui se produit avec une certaine probabilité.
- Fonction de probabilité ou mesure de probabilité : décrit la probabilitéque l'événementse produise.
- Fonction de répartition cumulative : fonction évaluant la probabilité queprenne une valeur inférieure ou égale àpour une variable aléatoire (uniquement pour les variables aléatoires à valeurs réelles).
- Fonction quantile : l'inverse de la fonction de répartition. Elle donneles valeurs telles que, avec probabilité,ne dépasse pas.
Distributions de probabilité discrètes
- Distribution de probabilité discrète : pour de nombreuses variables aléatoires ayant un nombre fini ou dénombrable de valeurs.
- Fonction de masse de probabilité ( pmf ) : fonction qui donne la probabilité qu'une variable aléatoire discrète soit égale à une certaine valeur.
- Distribution de fréquence : un tableau qui affiche la fréquence des différents résultatsDistribution de fréquence relative : une distribution de fréquence où chaque valeur a été divisée (normalisée) par un nombre de résultats dans un échantillon (c.-à-d. la taille de l'échantillon).
- Distribution catégorielle : pour les variables aléatoires discrètes avec un ensemble fini de valeurs.
Distributions de probabilité absolument continues
- Distribution de probabilité absolument continue : pour de nombreuses variables aléatoires avec une infinité non dénombrable de valeurs.
- Fonction de densité de probabilité ( pdf ) ou densité de probabilité : fonction dont la valeur à tout échantillon (ou point) donné dans l' espace d'échantillonnage (l'ensemble des valeurs possibles prises par la variable aléatoire) peut être interprétée comme fournissant une probabilité relative que la valeur de la variable aléatoire soit égale à cet échantillon.
Termes associés
- Support : l'ensemble des valeursa
- Valeur attendue ou moyenne : la moyenne pondérée des valeurs possibles, en utilisant leurs probabilités comme pondérations ; ou son analogue continu.
- Médiane : la valeur telle que l'ensemble des valeurs inférieures à la médiane et l'ensemble des valeurs supérieures à la médiane ont chacun une probabilité inférieure ou égale à un demi.
- Mode : pour une variable aléatoire discrète, la valeur ayant la plus grande probabilité ; pour une variable aléatoire absolument continue, un emplacement où la fonction de densité de probabilité présente un pic local.
- Quantile : le q-quantile est la valeurtelle que.
- Variance : le second moment de la variable aléatoire autour de sa moyenne ; une mesure importante de la dispersion de la distribution.
- Écart type : la racine carrée de la variance, et donc une autre mesure de dispersion.
- Symétrie : une propriété de certaines distributions dans laquelle la partie de la distribution située à gauche d'une valeur spécifique (généralement la médiane) est une image miroir de la partie située à sa droite.
- Asymétrie : mesure de la déviation d’une fonction de masse de probabilité ou d’une fonction de densité de probabilité autour de sa moyenne. Le troisième moment standardisé de la distribution.
- Kurtosis : mesure de l’« épaisseur » des queues de distribution d’une fonction de masse de probabilité ou d’une fonction de densité de probabilité. Le quatrième moment normalisé de la distribution.
Fonction de répartition cumulative
distribution de probabilité discrète




Une distribution de probabilité discrète est la distribution de probabilité d'une variable aléatoire ne pouvant prendre qu'un nombre dénombrable de valeurs ( presque sûrement ) , ce qui signifie que la probabilité de tout événement peut être exprimée comme une somme (finie ou dénombrable ) : où est un ensemble dénombrable tel que . Ainsi, les variables aléatoires discrètes (c'est-à-dire les variables aléatoires dont la distribution de probabilité est discrète) sont précisément celles dont la fonction de masse de probabilité est . Dans le cas où l'ensemble des valeurs est dénombrable, ces valeurs doivent tendre vers zéro suffisamment rapidement pour que la somme des probabilités soit égale à 1. Par exemple, si pour , la somme des probabilités serait .
Parmi les distributions de probabilité discrètes couramment utilisées en modélisation statistique, on trouve la distribution de Poisson , la distribution de Bernoulli , la distribution binomiale , la distribution géométrique , la distribution binomiale négative et la distribution catégorielle . Lorsqu'un échantillon (un ensemble d'observations) est prélevé dans une population plus large, les points de l'échantillon suivent une distribution empirique discrète, fournissant ainsi des informations sur la distribution de la population. De plus, la distribution uniforme discrète est fréquemment utilisée dans les programmes informatiques qui effectuent des sélections aléatoires équiprobables parmi plusieurs choix.
Fonction de répartition cumulative
Une variable aléatoire discrète à valeurs réelles peut être définie de manière équivalente comme une variable aléatoire dont la fonction de répartition ne croît qu'aux discontinuités — autrement dit, sa fonction de répartition croît uniquement lorsqu'elle « saute » à une valeur supérieure, et reste constante sur les intervalles sans discontinuité. Les points de discontinuité correspondent précisément aux valeurs que peut prendre la variable aléatoire. Ainsi, la fonction de répartition a la forme suivante : [formule mathématique]. Les points de discontinuité de la fonction de répartition forment toujours un ensemble dénombrable ; cet ensemble peut être quelconque et peut donc être dense dans l'ensemble des nombres réels.
Représentation delta de Dirac
Une distribution de probabilité discrète est souvent représentée par des mesures de Dirac , également appelées distributions à un point (voir ci-dessous), qui sont les distributions de probabilité de variables aléatoires déterministes . Pour tout résultat , soit la mesure de Dirac concentrée en . Étant donné une distribution de probabilité discrète, il existe un ensemble dénombrable tel que et une fonction de masse de probabilité . Si est un événement quelconque, alors ou en bref,
De même, les distributions discrètes peuvent être représentées avec la fonction delta de Dirac comme une fonction de densité de probabilité généralisée , où ce qui signifie pour tout événement
représentation de la fonction indicatrice
Pour une variable aléatoire discrète , soient les valeurs qu'elle peut prendre avec une probabilité non nulle. Notons . Ce sont des ensembles disjoints , et pour de tels ensembles . Il s'ensuit que la probabilité que prenne une valeur autre que est nulle, et donc on peut écrire comme sauf sur un ensemble de probabilité nulle, où est la fonction indicatrice de . Ceci peut servir de définition alternative des variables aléatoires discrètes.
Distribution à un point
Un cas particulier est celui de la distribution discrète d'une variable aléatoire ne pouvant prendre qu'une seule valeur fixe, autrement dit, une mesure de Dirac. Formellement, la variable aléatoire possède une distribution à un point si elle admet une valeur possible telle que Toutes les autres valeurs possibles ont alors une probabilité nulle. Sa fonction de répartition passe brusquement de 0 à 1 en . Elle est étroitement liée à une distribution déterministe, qui ne peut prendre aucune autre valeur, tandis qu'une distribution à un point peut prendre d'autres valeurs, mais uniquement avec une probabilité nulle. Dans la plupart des applications pratiques, les deux notions sont équivalentes.
Distribution de probabilité absolument continue
définition de Kolmogorov
Autres types de distributions

Les distributions absolument continues et discrètes à support défini sur ℝⁿ sont extrêmement utiles pour modéliser une multitude de phénomènes , car la plupart des distributions pratiques sont à support défini sur des sous-ensembles relativement simples, tels que les hypercubes ou les boules . Cependant, ce n'est pas toujours le cas, et il existe des phénomènes dont le support est en réalité une courbe complexe dans un espace donné , ou un espace similaire. Dans ces cas, la distribution de probabilité est à support défini sur l'image d'une telle courbe et est généralement déterminée empiriquement, plutôt que par une formule explicite
Un exemple est présenté dans la figure de droite, qui illustre l'évolution d'un système d'équations différentielles (communément appelées équations de Rabinovich-Fabrikant ) permettant de modéliser le comportement des ondes de Langmuir dans un plasma . Lors de l'étude de ce phénomène, les états observés du sous-ensemble sont indiqués en rouge. On peut alors se demander quelle est la probabilité d'observer un état à une position donnée dans ce sous-ensemble rouge ; si une telle probabilité existe, elle est appelée mesure de probabilité du système.
This kind of complicated support appears quite frequently in dynamical systems. It is not simple to establish that the system has a probability measure, and the main problem is the following. Let
Note that even in these cases, the probability distribution, if it exists, might still be termed "absolutely continuous" or "discrete" depending on whether the support is uncountable or countable, respectively.
Lebesgue decomposition
The Lebesgue decomposition theorem states that any probability distribution on the real line can be uniquely decomposed into a mixture of three fundamental types:
- Discrete: The probability is concentrated on a countable set of values (points). The cumulative distribution function (CDF) is a step function.
- Absolutely continuous: The distribution has a probability density function
- Singular continuous: The CDF is continuous everywhere, but its derivative is zero almost everywhere (with respect to Lebesgue measure). The probability is concentrated on a set of measure zero (e.g., the Cantor set). A classic example is the Cantor distribution.
Most standard distributions in statistical applications are either purely discrete (
Random number generation
Distributions de probabilité courantes et leurs applications
Voici une liste de quelques-unes des distributions de probabilité les plus courantes, regroupées selon le type de processus auquel elles se rapportent. Pour une liste plus complète, voir la liste des distributions de probabilité , qui les regroupe selon la nature du résultat considéré (discret, absolument continu, multivarié, etc.).
Toutes les distributions univariées ci-dessous sont unimodales ; autrement dit, on suppose que les valeurs se regroupent autour d’un seul point. En pratique, les quantités observées peuvent se regrouper autour de plusieurs valeurs. Ces quantités peuvent être modélisées à l’aide d’une distribution de mélange .
Croissance linéaire (ex. erreurs, décalages)
- Distribution normale (distribution gaussienne), pour une seule quantité de ce type ; la distribution absolument continue la plus couramment utilisée
Croissance exponentielle (ex. prix, revenus, populations)
- Distribution log-normale , pour une quantité unique de ce type dont le logarithme est normalement distribué.
- Distribution de Pareto , pour une quantité unique de ce type dont le logarithme suit une loi exponentielle ; la distribution prototypique en loi de puissance
quantités uniformément réparties
- Distribution uniforme discrète , pour un ensemble fini de valeurs (par exemple le résultat d'un dé équilibré)
- distribution uniforme continue , pour des valeurs absolument continues
Épreuves de Bernoulli (événements binaires oui/non, avec une probabilité donnée)
- Distributions de base :
- Distribution de Bernoulli , pour le résultat d'une seule épreuve de Bernoulli (par exemple succès/échec, oui/non)
- Distribution binomiale , pour le nombre d'« occurrences positives » (par exemple, succès, votes « oui », etc.) étant donné un nombre total fixe d' occurrences indépendantes
- Distribution binomiale négative , pour des observations de type binomial, mais où la quantité d'intérêt est le nombre d'échecs avant qu'un nombre donné de succès ne survienne.
- Distribution géométrique , pour les observations de type binomial, mais où la quantité d'intérêt est le nombre d'échecs avant le premier succès ; un cas particulier de la distribution binomiale négative
- Concernant les méthodes d'échantillonnage sur une population finie :
- Distribution hypergéométrique , pour le nombre d'« occurrences positives » (par exemple, succès, votes « oui », etc.) étant donné un nombre total d'occurrences fixe, en utilisant un échantillonnage sans remise
- Distribution bêta-binomiale , pour le nombre d'« occurrences positives » (par exemple, succès, votes « oui », etc.) étant donné un nombre total d'occurrences fixe, échantillonnage à l'aide d'un modèle d'urne de Pólya (en quelque sorte, l'« opposé » de l'échantillonnage sans remise )
Résultats catégoriels (événements avec Distribution catégorielle , pour une seule variable catégorielle (par exemple oui/non/peut-être dans une enquête) ; une généralisation de la distribution de BernoulliDistribution multinomiale , pour le nombre de chaque type de résultat catégoriel, étant donné un nombre total de résultats fixé ; une généralisation de la distribution binomiale Distribution hypergéométrique multivariée , similaire à la distribution multinomiale , mais utilisant un échantillonnage sans remise ; une généralisation de la distribution hypergéométrique Processus de Poisson (événements qui se produisent indépendamment à un taux donné)
- Distribution de Poisson , pour le nombre d'occurrences d'un événement de type Poisson dans une période de temps donnée
- Distribution exponentielle , pour le temps précédant le prochain événement de type Poisson.
- Distribution gamma , pour le temps précédant les k prochains événements de type Poisson
Valeurs absolues de vecteurs dont les composantes sont normalement distribuées
- La distribution de Rayleigh décrit la distribution des amplitudes vectorielles dont les composantes orthogonales suivent une loi normale. On la retrouve dans les signaux RF présentant des composantes réelles et imaginaires gaussiennes.
- La distribution de Rice est une généralisation de la distribution de Rayleigh lorsqu'il existe une composante de signal de fond stationnaire. Elle est observée dans l'affaiblissement de Rice des signaux radio dû à la propagation multi-trajets et dans les images IRM présentant des interférences dues au bruit sur les signaux RMN non nuls.
Quantités normalement distribuées, traitées par somme des carrés
- Distribution du chi carré , la distribution d'une somme de carrés de variables normales standard ; utile par exemple pour l'inférence concernant la variance d'échantillons normalement distribués (voir test du chi carré ).
- Distribution t de Student , la distribution du rapport entre une variable normale standard et la racine carrée d'une variable chi carré normalisée ; utile pour l'inférence concernant la moyenne d'échantillons normalement distribués avec une variance inconnue (voir test t de Student )
- Distribution F , la distribution du rapport de deux variables chi carré normalisées ; utile par exemple pour les inférences impliquant la comparaison de variances ou impliquant le R² (le coefficient de corrélation au carré ).
En tant que distributions a priori conjuguées dans l'inférence bayésienne
Distribution bêta , pour une probabilité unique (nombre réel entre 0 et 1) ; conjuguée à la distribution de Bernoulli et à la distribution binomialeDistribution gamma , pour un paramètre d'échelle non négatif ; conjuguée au paramètre de taux d'une distribution de Poisson ou d' une distribution exponentielle , à la précision (inverse de la variance ) d'une distribution normale , etc. Distribution de Dirichlet , pour un vecteur de probabilités dont la somme doit être égale à 1 ; conjuguée à la distribution catégorielle et à la distribution multinomiale ; généralisation de la distribution bêta Distribution de Wishart , pour une matrice symétrique non négative définie ; conjuguée à l'inverse de la matrice de covariance d'une distribution normale multivariée ; généralisation de la distribution gamma Quelques applications spécialisées des distributions de probabilité
- Les modèles de langage de cache et autres modèles de langage statistiques utilisés dans le traitement automatique du langage naturel pour attribuer des probabilités à l'occurrence de mots et de séquences de mots particuliers le font au moyen de distributions de probabilité.
- En mécanique quantique, la densité de probabilité de trouver une particule en un point donné est proportionnelle au carré de la norme de sa fonction d'onde en ce point (voir la règle de Born ). Par conséquent, la fonction de distribution de probabilité de la position d'une particule est décrite par , la probabilité que la position intégrale triple similaire en dimension trois. Il s'agit d'un principe fondamental de la mécanique quantique.
- L'analyse probabiliste des flux de charge dans les études de flux de puissance explique les incertitudes des variables d'entrée sous forme de distribution de probabilité et fournit également le calcul du flux de puissance en termes de distribution de probabilité.
- Prédiction de l'occurrence de phénomènes naturels basée sur des distributions de fréquence antérieures telles que les cyclones tropicaux , la grêle, le temps entre les événements, etc.
Convenable
L'ajustement de distribution de probabilité , ou simplement ajustement de distribution, consiste à ajuster une distribution de probabilité à une série de données relatives à la mesure répétée d'un phénomène variable. L'objectif de cet ajustement est de prédire la probabilité ou la fréquence d' occurrence de l'amplitude du phénomène dans un intervalle donné.Il existe de nombreuses distributions de probabilité (voir la liste des distributions de probabilité ), dont certaines s'ajustent mieux que d'autres à la fréquence observée des données, selon les caractéristiques du phénomène et de la distribution. La distribution qui s'ajuste le mieux aux données est censée permettre de bonnes prédictions. Lors de l'ajustement d'une distribution, il est donc nécessaire de sélectionner une distribution adaptée aux données.
Processus de Poisson (événements qui se produisent indépendamment à un taux donné)
- Distribution de Poisson , pour le nombre d'occurrences d'un événement de type Poisson dans une période de temps donnée
- Distribution exponentielle , pour le temps précédant le prochain événement de type Poisson.
- Distribution gamma , pour le temps précédant les k prochains événements de type Poisson
Valeurs absolues de vecteurs dont les composantes sont normalement distribuées
- La distribution de Rayleigh décrit la distribution des amplitudes vectorielles dont les composantes orthogonales suivent une loi normale. On la retrouve dans les signaux RF présentant des composantes réelles et imaginaires gaussiennes.
- La distribution de Rice est une généralisation de la distribution de Rayleigh lorsqu'il existe une composante de signal de fond stationnaire. Elle est observée dans l'affaiblissement de Rice des signaux radio dû à la propagation multi-trajets et dans les images IRM présentant des interférences dues au bruit sur les signaux RMN non nuls.
Quantités normalement distribuées, traitées par somme des carrés
- Distribution du chi carré , la distribution d'une somme de carrés de variables normales standard ; utile par exemple pour l'inférence concernant la variance d'échantillons normalement distribués (voir test du chi carré ).
- Distribution t de Student , la distribution du rapport entre une variable normale standard et la racine carrée d'une variable chi carré normalisée ; utile pour l'inférence concernant la moyenne d'échantillons normalement distribués avec une variance inconnue (voir test t de Student )
- Distribution F , la distribution du rapport de deux variables chi carré normalisées ; utile par exemple pour les inférences impliquant la comparaison de variances ou impliquant le R² (le coefficient de corrélation au carré ).
En tant que distributions a priori conjuguées dans l'inférence bayésienne
Quelques applications spécialisées des distributions de probabilité
- Les modèles de langage de cache et autres modèles de langage statistiques utilisés dans le traitement automatique du langage naturel pour attribuer des probabilités à l'occurrence de mots et de séquences de mots particuliers le font au moyen de distributions de probabilité.
- En mécanique quantique, la densité de probabilité de trouver une particule en un point donné est proportionnelle au carré de la norme de sa fonction d'onde en ce point (voir la règle de Born ). Par conséquent, la fonction de distribution de probabilité de la position d'une particule est décrite par , la probabilité que la position intégrale triple similaire en dimension trois. Il s'agit d'un principe fondamental de la mécanique quantique.
- L'analyse probabiliste des flux de charge dans les études de flux de puissance explique les incertitudes des variables d'entrée sous forme de distribution de probabilité et fournit également le calcul du flux de puissance en termes de distribution de probabilité.
- Prédiction de l'occurrence de phénomènes naturels basée sur des distributions de fréquence antérieures telles que les cyclones tropicaux , la grêle, le temps entre les événements, etc.
Convenable
Il existe de nombreuses distributions de probabilité (voir la liste des distributions de probabilité ), dont certaines s'ajustent mieux que d'autres à la fréquence observée des données, selon les caractéristiques du phénomène et de la distribution. La distribution qui s'ajuste le mieux aux données est censée permettre de bonnes prédictions. Lors de l'ajustement d'une distribution, il est donc nécessaire de sélectionner une distribution adaptée aux données.
Convergence
Un concept fondamental de la théorie des probabilités est la convergence des suites de distributions de probabilité. On dit qu'une suite de distributions de probabilité converge faiblement (ou en distribution ) vers une distribution de probabilité si, pour tout ensemble dont la frontière a une probabilité nulle.
De manière équivalente, en utilisant les fonctions de répartition cumulatives , la suite converge vers si pour tout en lequel est continue.
Ce concept est essentiel pour le théorème central limite , qui stipule que la distribution de probabilité de la somme standardisée de variables aléatoires indépendantes et identiquement distribuées converge vers la distribution normale standard , quelle que soit la distribution sous-jacente des variables individuelles.
