Sur Twitter, je vous ai posé la question suivante :

Traduction : vous avez lancez une pièce non-pipée N fois et avez obtenu 80% de faces. Quelle est la valeur la plus probable de N ?

  • 10
  • 100
  • 1 000
  • Aucune des trois

Vous êtes 60% à avoir bien répondu et donc, 40% à vous être trompés. Évidemment, la bonne réponse était 10 : il est beaucoup plus probable d’obtenir 8 faces sur 10 lancers à pile ou face que 80 sur 100 lancers (et je vous passe 800 faces sur 1 000 lancers).

Juste pour illustrer le propos, avec 5 lancers vous avez 32 ($2^5$) scénarios possibles dont 5 dans lesquels vous obtenez quatre faces (80%) : FFFFT, FFFTF, FFTFF, FTFFF et TFFFF. Ça nous donne donc une probabilité de l’ordre de 15.6%. Avec 10 lancers, ça nous fait 1 24 ($2^{10}$) scénarios possibles dont 45 avec huit faces (80%) soit une probabilité de seulement 4.4%. Sur 100 lancers, la probabilité d’avoir 80 faces tombe à à environ 0.00000004% et avec 1 000 lancers, la probabilité d’obtenir 800 des faces est… plus que ridicule.

Intuitivement : plus la taille de l’échantillon (le nombre de lancers) augmente, plus on va naturellement converger vers un nombre sensiblement égal de piles et de faces.

C’est-à-dire que la taille de l’échantillon, dans ce type de problème, a une importance cruciale et vous êtes donc 40% à être tombés dans le piège de l’insensibilité à la taille de l’échantillon.

D’une façon générale, après $n$ lancers et une probabilité $p$ de tomber côté face (soit $\frac{1}{2}$ puisque la pièce n’est pas pipée, la probabilité d’obtenir $k$ face est de :

$$ \binom{n}{k} p^k (1-p)^{n-k} $$

Avec :

$$ \binom{n}{k} = \frac{n!}{k!(n-k)!} $$

Sous R, pour ceux qui veulent essayer :

n <- 10
k <- 8
p <- 1/2
bin <- factorial(n)/(factorial(k)*factorial(n-k))
bin * p^k * (1-p)^(n-k)