Indépendance conditionnelle des variables aléatoires
Deux variables aléatoires discrètes et sont conditionnellement indépendantes étant donné une troisième variable aléatoire discrète si et seulement si leurs distributions de probabilité conditionnelles sont indépendantes étant donné . Autrement dit, et sont conditionnellement indépendantes étant donné si et seulement si, pour toute valeur de , la distribution de probabilité de est la même pour toutes les valeurs de et la distribution de probabilité de est la même pour toutes les valeurs de . Formellement :
où est la fonction de répartition cumulative conditionnelle de et étant donné .
Deux événements et sont conditionnellement indépendants étant donné une σ -algèbre si
où désigne l' espérance conditionnelle de la fonction indicatrice de l'événement , , étant donné l'algèbre sigma . C'est-à-dire,
Deux variables aléatoires et sont conditionnellement indépendantes étant donné une σ-algèbre si l'équation ci-dessus est vérifiée pour tout dans et dans .
Deux variables aléatoires et sont conditionnellement indépendantes étant donné une variable aléatoire si elles sont indépendantes étant donné σ ( W ) : la σ-algèbre engendrée par . On écrit généralement ceci :
Ceci se lit « est indépendant de , étant donné » ; la condition s'applique à l'ensemble de l'énoncé : « ( est indépendant de ) étant donné ».
Cette notation s'étend à « est indépendant de ».
Si X et Y prennent des valeurs dénombrables , cela équivaut à l'indépendance conditionnelle de X et Y pour les événements de la forme X ∈ Y. L'indépendance conditionnelle de plus de deux événements, ou de plus de deux variables aléatoires, se définit de manière analogue.
Les deux exemples suivants montrent que ni n'implique ni n'est impliqué par .
Supposons d'abord que W vaut 0 avec une probabilité de 0,5 et 1 sinon. Lorsque W = 0, considérons que X et Y sont indépendants, chacun prenant la valeur 0 avec une probabilité de 0,99 et la valeur 1 sinon. Lorsque Y = 0 , W et Y sont à nouveau indépendants, mais cette fois-ci ils prennent la valeur 1 avec une probabilité de 0,99. Alors Y = 0. Cependant, X et Y sont dépendants, car Pr( X = 0) < Pr( X = 0 | Y = 0). En effet, Pr( X = 0) = 0,5, mais si Y = 0, il est très probable que W = 0 et donc que X = 0 également, de sorte que Pr( X = 0 | Y = 0) > 0,5.
Dans le second exemple, supposons que X et Y prennent chacun les valeurs 0 et 1 avec une probabilité de 0,5. Soit Y le produit de X et Y. Alors , lorsque X = Y, Pr( X = 0) = 2/3, mais Pr( X = 0 | Y = 0) = 1/2, donc l'hypothèse nulle est fausse. Ceci est également un exemple de raisonnement fallacieux. Voir le tutoriel de Kevin Murphy où X et Y prennent les valeurs « intelligent » et « sportif ».
Indépendance conditionnelle des vecteurs aléatoires
Deux vecteurs aléatoires et sont conditionnellement indépendants étant donné un troisième vecteur aléatoire si et seulement si leurs fonctions de répartition conditionnelles sont indépendantes étant donné . Formellement :
où , et et les distributions cumulatives conditionnelles sont définies comme suit.
Utilisations en inférence bayésienne
Soit p la proportion d'électeurs qui voteront « oui » lors d'un prochain référendum . Pour réaliser un sondage d'opinion , on sélectionne aléatoirement n électeurs parmi la population. Pour i = 1, ..., n , soit X<sub> i</sub> = 1 ou 0, selon que l' électeur i sélectionné votera ou non « oui ».
Dans une approche fréquentiste de l'inférence statistique, on n'attribuerait aucune distribution de probabilité à p (à moins que les probabilités puissent être interprétées d'une manière ou d'une autre comme des fréquences relatives d'occurrence d'un événement ou comme des proportions d'une population) et on dirait que X 1 , ..., X n sont des variables aléatoires indépendantes .
En revanche, dans une approche bayésienne de l'inférence statistique, on attribue une distribution de probabilité à p, indépendamment de l'existence d'une interprétation en termes de « fréquence », et on interprète les probabilités comme des degrés de croyance que p se situe dans un intervalle donné. Dans ce modèle, les variables aléatoires X₁ , ..., Xₙ ne sont pas indépendantes, mais elles le sont conditionnellement étant donné la valeur de p . Plus précisément, si un grand nombre de X₁ sont observés égaux à 1, cela implique une forte probabilité conditionnelle , étant donné cette observation, que p soit proche de 1, et donc une forte probabilité conditionnelle , étant donné cette observation, que le prochain X₁ observé soit égal à 1.
Règles d'indépendance conditionnelle
Un ensemble de règles régissant les énoncés d'indépendance conditionnelle a été dérivé de la définition de base.
Ces règles ont été appelées « axiomes graphoïdes » par Pearl et Paz, parce qu'elles sont valables dans les graphes, où est interprété comme signifiant : « Tous les chemins de X à A sont interceptés par l'ensemble B ».
Symétrie
Preuve:
D'après la définition de l'indépendance conditionnelle,
Décomposition
Démonstration. À partir de la définition de l'indépendance conditionnelle, nous cherchons à démontrer que :
Le membre de gauche de cette égalité est :
, où l'expression à droite de cette égalité est la somme sur telle que de la probabilité conditionnelle de sur . En décomposant davantage,
Les cas particuliers de cette propriété comprennent
Syndicat faible
Preuve:
Étant donné que , nous visons à montrer
Nous commençons par le membre de gauche de l'équation.
. À partir de la condition donnée
Ainsi , nous avons montré que .
Cas particuliers :
Certains manuels présentent la propriété comme
On peut démontrer que les deux versions découlent de la propriété d'union faible donnée initialement par la même méthode que dans la section de décomposition ci-dessus.
Contraction
Preuve
Cette propriété peut être prouvée en remarquant que chaque égalité est affirmée respectivement par et .
Intersection
Pour les distributions de probabilité strictement positives, ce qui suit est également vrai :
Preuve
Par hypothèse :
En utilisant cette égalité, ainsi que la loi des probabilités totales appliquée à :
Puisque et , il s'ensuit que .
Note technique : puisque ces implications sont valables pour tout espace de probabilité , elles le resteront si l’on considère un sous-univers en conditionnant tout par rapport à une autre variable, par exemple K. Par exemple, cela signifierait également que .