fonction de densité de probabilité

Diagramme en boîte et fonction de densité de probabilité d'une distribution normale

Distributions univariées absolument continues

Une fonction de densité de probabilité est le plus souvent associée aux distributions univariées absolument continues . Une variable aléatoire a pour densité , où est une fonction Lebesgue-intégrable non négative , si :

Par conséquent, si est la fonction de répartition de , alors : et (si est différentiable en )

Intuitivement, on peut considérer qu'il s'agit de la probabilité de tomber dans l' intervalle infinitésimal .

Définition formelle

( Cette définition peut être étendue à toute distribution de probabilité en utilisant la définition de la probabilité basée sur la théorie de la mesure . )

Une variable aléatoire à valeurs dans un espace mesurable (généralement dont les ensembles de Borel sont des sous-ensembles mesurables) a pour distribution de probabilité la mesure directe X _∗P sur : la densité de par rapport à une mesure de référence sur est la dérivée de Radon-Nikodym :

Autrement dit, f est une fonction mesurable quelconque possédant la propriété suivante : pour tout ensemble mesurable

Discussion

Dans le cas univarié continu présenté ci-dessus , la mesure de référence est la mesure de Lebesgue . La fonction de masse de probabilité d'une variable aléatoire discrète est sa densité par rapport à la mesure de comptage sur l'espace d'échantillonnage (généralement l'ensemble des entiers , ou un sous-ensemble de celui-ci).

Il n'est pas possible de définir une densité par rapport à une mesure arbitraire (par exemple, on ne peut pas choisir la mesure de comptage comme référence pour une variable aléatoire continue). De plus, lorsqu'elle existe, la densité est quasi unique, ce qui signifie que deux densités quelconques coïncident presque partout .

Plus de détails

Contrairement à une probabilité, une fonction de densité de probabilité peut prendre des valeurs supérieures à un ; par exemple, la distribution uniforme continue sur l'intervalle $distribution normale standard a pour densité de probabilité$

Si une variable aléatoire $espérance de$

Toutes les distributions de probabilité n'ont pas de fonction de densité : les distributions des variables aléatoires discrètes n'en ont pas ; la distribution de Cantor non plus , même si elle ne comporte aucune composante discrète, c'est-à-dire qu'elle n'attribue aucune probabilité positive à un point individuel.

Une distribution possède une fonction de densité si sa fonction de répartition $absolument continue . Dans ce cas : presque partout différentiable, et sa dérivée peut être utilisée comme densité de probabilité.$

Si une distribution de probabilité admet une densité, alors la probabilité de tout ensemble à un point $distribution de probabilité si elles ne diffèrent que sur un ensemble de mesure de Lebesgue nulle .$

En physique statistique , une reformulation non formelle de la relation ci-dessus entre la dérivée de la fonction de répartition et la fonction de densité de probabilité est généralement utilisée comme définition de la fonction de densité de probabilité. Cette définition alternative est la suivante :

Lien entre les distributions discrètes et continues

Il est possible de représenter certaines variables aléatoires discrètes, ainsi que des variables aléatoires comportant à la fois une partie continue et une partie discrète, par une fonction de densité de probabilité généralisée utilisant la fonction delta de Dirac . (Ceci n'est pas possible avec une fonction de densité de probabilité au sens défini précédemment ; cela peut être réalisé avec une distribution .) Par exemple, considérons une variable aléatoire discrète binaire suivant la distribution de Rademacher — c'est-à-dire prenant les valeurs −1 ou 1, avec une probabilité de 1/2 pour chaque valeur . La densité de probabilité associée à cette variable est :

Plus généralement, si une variable discrète peut prendre

Cela unifie sensiblement le traitement des distributions de probabilité discrètes et continues. L'expression ci-dessus permet de déterminer les caractéristiques statistiques d'une telle variable discrète (telles que la moyenne , la variance et le kurtosis ), à partir des formules données pour une distribution continue de la probabilité.

Familles de densités

Il est courant que les fonctions de densité de probabilité (et les fonctions de masse de probabilité ) soient paramétrées, c'est-à-dire caractérisées par des paramètres non spécifiés . Par exemple, la distribution normale est paramétrée en fonction de sa moyenne et de sa variance , notées respectivement et , donnant ainsi la famille de densités . Différentes valeurs des paramètres décrivent différentes distributions de différentes variables aléatoires sur le même espace d'échantillonnage (l'ensemble de toutes les valeurs possibles de la variable) ; cet espace d'échantillonnage est le domaine de la famille de variables aléatoires que décrit cette famille de distributions. Un ensemble donné de paramètres décrit une seule distribution au sein de la famille, partageant la même forme fonctionnelle que la densité. Du point de vue d'une distribution donnée, les paramètres sont des constantes, et les termes d'une fonction de densité qui ne contiennent que des paramètres, et non des variables, font partie du facteur de normalisation de la distribution (le facteur multiplicatif qui garantit que l'aire sous la courbe de densité — la probabilité qu'un événement se produise dans le domaine — est égale à 1). Ce facteur de normalisation est extérieur au noyau de la distribution.

Puisque les paramètres sont des constantes, reparamétrer une densité en fonction de paramètres différents pour caractériser une variable aléatoire différente de la famille revient simplement à substituer les nouvelles valeurs des paramètres dans la formule à la place des anciennes.

Densités associées à plusieurs variables

Pour des variables aléatoires continues

Si $répartition du vecteur partielle$

Densités marginales

Pour

Indépendance

Les variables aléatoires continues $indépendantes les unes des autres si$

Corollaire

Si la fonction de densité de probabilité conjointe d'un vecteur de $indépendantes les unes des autres, et la fonction de densité de probabilité marginale de chacune d'elles est donnée par$

Exemple

Cet exemple élémentaire illustre la définition ci-dessus des fonctions de densité de probabilité multidimensionnelles dans le cas simple d'une fonction d'un ensemble de deux variables. Appelons un vecteur aléatoire bidimensionnel de coordonnées

Fonction des variables aléatoires et changement de variables dans la fonction de densité de probabilité

Si la fonction de densité de probabilité d'une variable aléatoire (ou d'un vecteur)

Les valeurs des deux intégrales sont identiques dans tous les cas où $fonction bijective . Dans certains cas, le calcul de la seconde intégrale est beaucoup plus simple que celui de la première. Voir la loi du statisticien inconscient .$

Scalaire à scalaire

Soit une fonction monotone , alors la fonction de densité résultante est

Ici $fonction inverse .$

Cela découle du fait que la probabilité contenue dans une aire différentielle doit être invariante par changement de variables. C'est-à-dire, ou

Pour les fonctions qui ne sont pas monotones, la fonction de densité de probabilité pour

Vecteur à vecteur

Supposons que $fonction bijective et différentiable , alors jacobien de l'inverse de$

Vecteur vers scalaire

Soit f une fonction différentiable et θ un vecteur aléatoire à valeurs dans ℝⁿ , soit f la fonction de densité de probabilité de f et δ la fonction delta de Dirac . Il est possible d'utiliser les formules ci-dessus pour déterminer f(θ) , la fonction de densité de probabilité de f , qui sera donnée par

Ce résultat conduit à la loi du statisticien inconscient :

Preuve:

Soit une variable aléatoire réduite de fonction de densité de probabilité (c'est-à-dire une constante égale à zéro). Soit le vecteur aléatoire et la transformée définis comme

Il est clair que est une application bijective, et le jacobien de est donné par : qui est une matrice triangulaire supérieure avec des uns sur la diagonale principale , donc son déterminant est 1. En appliquant le théorème de changement de variable de la section précédente, nous obtenons que qui, marginalisé sur , conduit à la fonction de densité de probabilité souhaitée.

Sommes de variables aléatoires indépendantes

indépendantes $convolution de leurs fonctions de densité respectives : Il est possible de généraliser la relation précédente à une somme de N variables aléatoires indépendantes, avec des densités Cela peut être déduit d'un changement de variables à deux voies impliquant Ensuite, la densité conjointe marginalisant La valeur absolue du déterminant de la matrice jacobienne de cette transformation est : Ainsi: Et la distribution de marginalisant Cette méthode exige impérativement que la transformation de U, V vers Y, Z soit bijective . La transformation ci-dessus satisfait cette condition car monotone . Il en va de même pour la somme aléatoires normales standard Nous effectuons la transformation décrite ci-dessus : Cela conduit à : Il s'agit de la densité d'une distribution de Cauchy standard .$

Plus d articles de Worldlex Wiki

Revenez a l index pour explorer davantage de pages sur l histoire, la science, la culture, la geographie et la societe en francais.
Explorer l index