Article de reference

Problème d'urne

Deux urnes contenant des boules blanches et rouges En probabilités et en statistiques , le problème de l'urne est un exercice mental simplifié où des objets d'intérêt réel (atom...

Deux urnes contenant des boules blanches et rouges

En probabilités et en statistiques , le problème de l'urne est un exercice mental simplifié où des objets d'intérêt réel (atomes, personnes, voitures, etc.) sont représentés par des boules colorées dans une urne ou un autre récipient. On simule le tirage d'une ou plusieurs boules ; le but est de déterminer la probabilité de tirer une couleur plutôt qu'une autre, ou d'autres propriétés. Plusieurs variantes importantes sont décrites ci-dessous.

Un modèle d'urne est soit un ensemble de probabilités qui décrivent des événements au sein d'un problème d'urne, soit une distribution de probabilité , ou une famille de telles distributions, de variables aléatoires associées aux problèmes d'urne.

son ouvrage *Ars Conjectandi * (1713), Jacob Bernoulli s'est penché sur le problème de la détermination, à partir d'un certain nombre de cailloux tirés d'une urne, des proportions de cailloux de différentes couleurs présentes dans cette urne. Ce problème, connu sous le nom de problème inverse des probabilités , a fait l'objet de recherches au XVIIIe siècle et a notamment attiré l'attention d' Abraham de Moivre et de Thomas Bayes .

Bernoulli a utilisé le mot latin « urna » , qui signifie principalement un récipient en argile, mais qui désignait également dans la Rome antique tout type de récipient servant à recueillir les bulletins de vote ou à effectuer des tirages au sort ; le mot italien ou espagnol actuel pour urne est toujours « urna » . Bernoulli s’est peut-être inspiré des loteries , des élections ou des jeux de hasard impliquant le tirage de boules dans un récipient. On a avancé que les élections dans la Venise médiévale et de la Renaissance , y compris celle du doge , incluaient souvent le choix des électeurs par tirage au sort , à l’aide de boules de différentes couleurs tirées d’une urne.

Modèle d'urne de base

Dans ce modèle d'urne simple en théorie des probabilités , l'urne contient x boules blanches et y boules noires, bien mélangées. Une boule est tirée au hasard de l'urne et sa couleur est observée ; elle est ensuite remise dans l'urne (ou non), et le processus de sélection est répété.

Voici quelques exemples de questions auxquelles ce modèle peut répondre :

  • Puis-je déduire la proportion de boules blanches et noires à partir de n observations ? Avec quel degré de confiance ?
  • Connaissant x et y , quelle est la probabilité de tirer une séquence spécifique (par exemple un blanc suivi d'un noir) ?
  • Si je n'observe que n boules, comment puis-je être sûr qu'il n'y a pas de boules noires ? (Une variante de la première et de la deuxième question)

Exemples de problèmes d'urnes

  • distribution binomiale : la distribution du nombre de tirages réussis (essais), c'est-à-dire l'extraction de boules blanches, étant donné n tirages avec remise dans une urne contenant des boules noires et blanches.
  • Distribution multinomiale : il y a des boules de plus de deux couleurs. Chaque fois qu’une boule est tirée, elle est remise dans le bac avant qu’une autre ne soit tirée. On appelle aussi cela « tirage de boules dans des bacs ».
  • Problème d'occupation : la distribution du nombre d'urnes occupées après l'affectation aléatoire de k boules dans n urnes, liée au problème du collectionneur de coupons et au problème des anniversaires .
  • distribution binomiale négative : nombre de tirages avant qu'un certain nombre d'échecs (tirages mal colorés) ne se produise.
  • distribution géométrique : nombre de tirages avant le premier tirage réussi (correctement coloré).
  • Distribution hypergéométrique : les billes ne sont pas remises dans l’urne après avoir été tirées. Par conséquent, le nombre total de billes dans l’urne diminue. On parle alors de « tirage sans remise », par opposition au « tirage avec remise ».
  • distribution hypergéométrique multivariée : les boules ne sont pas remises dans l'urne une fois extraites, mais avec des boules de plus de deux couleurs.
  • Tirage mixte avec ou sans remise : l’urne contient x boules blanches et y boules noires. Après chaque tirage, les boules noires sont mises de côté (sans remise), tandis que les boules blanches sont remises dans l’urne (avec remise). La probabilité P(m,k) de tirer k boules noires après m tirages peut être calculée par récurrence à l’aide de la formule suivante :
  • Urne de Pólya / distribution bêta-binomiale : à chaque tirage, une boule est remplacée par une autre de la même couleur. Le nombre total de boules dans l’urne augmente ainsi.
  • Urne Hoppe : une urne Pólya avec une bille supplémentaire appelée « mutateur » . Lorsque le mutateur est tiré, il est remplacé par une bille supplémentaire d’une couleur entièrement nouvelle.
  • Physique statistique : dérivation des distributions d'énergie et de vitesse.
  • Le paradoxe d'Ellsberg .