Article de reference

fonction de densité de probabilité

Diagramme en boîte et fonction de densité de probabilité d'une distribution normale 2 )"}},"i":0}}] N (0, σ 2 ) . Visualisation géométrique du mode , de la médiane et de la moye...

Diagramme en boîte et fonction de densité de probabilité d'une distribution normale
Visualisation géométrique du mode , de la médiane et de la moyenne d'une fonction de densité de probabilité unimodale arbitraire.

En théorie des probabilités , une fonction de densité de probabilité ( FDP ) , ou simplement densité d'une variable aléatoire absolument continue , est une fonction dont la valeur en tout point de l' espace d'échantillonnage (l'ensemble des valeurs possibles de la variable aléatoire) peut être interprétée comme une « probabilité relative » que la valeur de la variable aléatoire soit égale à ce point. Autrement dit, la densité de probabilité est la probabilité par unité de longueur. La probabilité absolue qu'une variable aléatoire continue prenne une valeur particulière est nulle. Par conséquent, la valeur de la FDP en deux points différents permet d'estimer, pour chaque tirage de la variable aléatoire, la probabilité relative que la variable aléatoire soit proche d'un point plutôt que de l'autre.

Plus précisément, la fonction de densité de probabilité (PDF) sert à spécifier la probabilité que la variable aléatoire prenne des valeurs comprises dans un intervalle donné , plutôt que de prendre une valeur unique. Cette probabilité est donnée par l' intégrale de la PDF de la variable continue sur cet intervalle, où l'intégrale correspond à l'aire non négative sous la courbe de densité entre les valeurs minimale et maximale de l'intervalle. La PDF est non négative partout, et l'aire totale sous la courbe est égale à un, de sorte que la probabilité que la variable aléatoire prenne des valeurs comprises dans l'ensemble des valeurs possibles est de 100 %.

Les termes « fonction de distribution de probabilité » et « fonction de probabilité » peuvent également désigner la fonction de densité de probabilité. Cependant, cet usage n'est pas standard parmi les probabilistes et les statisticiens. Dans d'autres sources, l'expression « fonction de distribution de probabilité » peut être employée lorsque la distribution de probabilité est définie comme une fonction sur des ensembles de valeurs quelconques, ou encore pour désigner la fonction de répartition (ou fonction de répartition cumulative), ou bien pour désigner une fonction de masse de probabilité (FMP) plutôt que la densité. Le terme « fonction de densité » est lui-même parfois utilisé pour désigner la fonction de masse de probabilité, ce qui contribue à la confusion. En général, la FMP est utilisée dans le contexte des variables aléatoires discrètes (variables aléatoires prenant des valeurs sur un ensemble dénombrable ), tandis que la fonction de densité de probabilité (FDP) est utilisée dans le contexte des variables aléatoires continues. La FMP et la FDP sont deux concepts fondamentaux de l'inférence statistique .

Exemples de quatre fonctions de densité de probabilité continues.

Supposons que les bactéries d'une certaine espèce vivent généralement entre 20 et 30 heures. La probabilité qu'une bactérie vive infinitésimal autour de 5 heures, où dt est la durée de cet intervalle. Par exemple, la probabilité qu'il vive plus de 5 heures, mais moins de (5 heures + 1 nanoseconde), est de (2 heures −1 )×(1 nanoseconde) ≈conversion d'unités intégrale de f sur n'importe quelle fenêtre de temps (non seulement des fenêtres infinitésimales mais aussi de grandes fenêtres) est la probabilité que la bactérie meure dans cette fenêtre.

Distributions univariées absolument continues

Une fonction de densité de probabilité est le plus souvent associée aux distributions univariées absolument continues . Une variable aléatoire a pour densité , où est une fonction Lebesgue-intégrable non négative , si :

Par conséquent, si est la fonction de répartition de , alors : et (si est différentiable en )

Intuitivement, on peut considérer qu'il s'agit de la probabilité de tomber dans l' intervalle infinitésimal .

Définition formelle

( Cette définition peut être étendue à toute distribution de probabilité en utilisant la définition de la probabilité basée sur la théorie de la mesure . )

Une variable aléatoire à valeurs dans un espace mesurable (généralement dont les ensembles de Borel sont des sous-ensembles mesurables) a pour distribution de probabilité la mesure directe X P sur : la densité de par rapport à une mesure de référence sur est la dérivée de Radon-Nikodym :

Autrement dit, f est une fonction mesurable quelconque possédant la propriété suivante : pour tout ensemble mesurable

Discussion

Dans le cas univarié continu présenté ci-dessus , la mesure de référence est la mesure de Lebesgue . La fonction de masse de probabilité d'une variable aléatoire discrète est sa densité par rapport à la mesure de comptage sur l'espace d'échantillonnage (généralement l'ensemble des entiers , ou un sous-ensemble de celui-ci).

Il n'est pas possible de définir une densité par rapport à une mesure arbitraire (par exemple, on ne peut pas choisir la mesure de comptage comme référence pour une variable aléatoire continue). De plus, lorsqu'elle existe, la densité est quasi unique, ce qui signifie que deux densités quelconques coïncident presque partout .

Plus de détails

Contrairement à une probabilité, une fonction de densité de probabilité peut prendre des valeurs supérieures à un ; par exemple, la distribution uniforme continue sur l'intervalle distribution normale standard a pour densité de probabilité

Si une variable aléatoire espérance de

Toutes les distributions de probabilité n'ont pas de fonction de densité : les distributions des variables aléatoires discrètes n'en ont pas ; la distribution de Cantor non plus , même si elle ne comporte aucune composante discrète, c'est-à-dire qu'elle n'attribue aucune probabilité positive à un point individuel.

Une distribution possède une fonction de densité si sa fonction de répartition absolument continue . Dans ce cas : presque partout différentiable , et sa dérivée peut être utilisée comme densité de probabilité.

Si une distribution de probabilité admet une densité, alors la probabilité de tout ensemble à un point distribution de probabilité si elles ne diffèrent que sur un ensemble de mesure de Lebesgue nulle .

En physique statistique , une reformulation non formelle de la relation ci-dessus entre la dérivée de la fonction de répartition et la fonction de densité de probabilité est généralement utilisée comme définition de la fonction de densité de probabilité. Cette définition alternative est la suivante :

Si

Lien entre les distributions discrètes et continues

Il est possible de représenter certaines variables aléatoires discrètes, ainsi que des variables aléatoires comportant à la fois une partie continue et une partie discrète, par une fonction de densité de probabilité généralisée utilisant la fonction delta de Dirac . (Ceci n'est pas possible avec une fonction de densité de probabilité au sens défini précédemment ; cela peut être réalisé avec une distribution .) Par exemple, considérons une variable aléatoire discrète binaire suivant la distribution de Rademacher — c'est-à-dire prenant les valeurs −1 ou 1, avec une probabilité de 1/2 pour chaque valeur . La densité de probabilité associée à cette variable est :

Plus généralement, si une variable discrète peut prendre

Cela unifie sensiblement le traitement des distributions de probabilité discrètes et continues. L'expression ci-dessus permet de déterminer les caractéristiques statistiques d'une telle variable discrète (telles que la moyenne , la variance et le kurtosis ), à partir des formules données pour une distribution continue de la probabilité.

Familles de densités

Il est courant que les fonctions de densité de probabilité (et les fonctions de masse de probabilité ) soient paramétrées, c'est-à-dire caractérisées par des paramètres non spécifiés . Par exemple, la distribution normale est paramétrée en fonction de sa moyenne et de sa variance , notées respectivement et , donnant ainsi la famille de densités . Différentes valeurs des paramètres décrivent différentes distributions de différentes variables aléatoires sur le même espace d'échantillonnage (l'ensemble de toutes les valeurs possibles de la variable) ; cet espace d'échantillonnage est le domaine de la famille de variables aléatoires que décrit cette famille de distributions. Un ensemble donné de paramètres décrit une seule distribution au sein de la famille, partageant la même forme fonctionnelle que la densité. Du point de vue d'une distribution donnée, les paramètres sont des constantes, et les termes d'une fonction de densité qui ne contiennent que des paramètres, et non des variables, font partie du facteur de normalisation de la distribution (le facteur multiplicatif qui garantit que l'aire sous la courbe de densité — la probabilité qu'un événement se produise dans le domaine — est égale à 1). Ce facteur de normalisation est extérieur au noyau de la distribution.

Puisque les paramètres sont des constantes, reparamétrer une densité en fonction de paramètres différents pour caractériser une variable aléatoire différente de la famille revient simplement à substituer les nouvelles valeurs des paramètres dans la formule à la place des anciennes.

Densités associées à plusieurs variables

Pour des variables aléatoires continues

Si répartition du vecteur partielle

Densités marginales

Pour

Indépendance

Les variables aléatoires continues indépendantes les unes des autres si

Corollaire

Si la fonction de densité de probabilité conjointe d'un vecteur de indépendantes les unes des autres, et la fonction de densité de probabilité marginale de chacune d'elles est donnée par

Exemple

Cet exemple élémentaire illustre la définition ci-dessus des fonctions de densité de probabilité multidimensionnelles dans le cas simple d'une fonction d'un ensemble de deux variables. Appelons un vecteur aléatoire bidimensionnel de coordonnées

Fonction des variables aléatoires et changement de variables dans la fonction de densité de probabilité

Si la fonction de densité de probabilité d'une variable aléatoire (ou d'un vecteur)

Les valeurs des deux intégrales sont identiques dans tous les cas où fonction bijective . Dans certains cas, le calcul de la seconde intégrale est beaucoup plus simple que celui de la première. Voir la loi du statisticien inconscient .

Scalaire à scalaire

Soit une fonction monotone , alors la fonction de densité résultante est

Ici fonction inverse .

Cela découle du fait que la probabilité contenue dans une aire différentielle doit être invariante par changement de variables. C'est-à-dire, ou

Pour les fonctions qui ne sont pas monotones, la fonction de densité de probabilité pour

Vecteur à vecteur

Supposons que fonction bijective et différentiable , alors jacobien de l'inverse de

Vecteur vers scalaire

Soit f une fonction différentiable et θ un vecteur aléatoire à valeurs dans ℝⁿ , soit f la fonction de densité de probabilité de f et δ la fonction delta de Dirac . Il est possible d'utiliser les formules ci-dessus pour déterminer f(θ) , la fonction de densité de probabilité de f , qui sera donnée par

Ce résultat conduit à la loi du statisticien inconscient :

Preuve:

Soit une variable aléatoire réduite de fonction de densité de probabilité (c'est-à-dire une constante égale à zéro). Soit le vecteur aléatoire et la transformée définis comme

Il est clair que est une application bijective, et le jacobien de est donné par : qui est une matrice triangulaire supérieure avec des uns sur la diagonale principale , donc son déterminant est 1. En appliquant le théorème de changement de variable de la section précédente, nous obtenons que qui, marginalisé sur , conduit à la fonction de densité de probabilité souhaitée.

Sommes de variables aléatoires indépendantes

indépendantes convolution de leurs fonctions de densité respectives :

Plus d articles de Worldlex Wiki

Revenez a l index pour explorer davantage de pages sur l histoire, la science, la culture, la geographie et la societe en francais.

Explorer l index