Sur Twitter, je vous ai posé la question suivante :
You’ve been flipping a fair coin N times and got 80% of heads. What is the most probable value of N?
— Guillaume Nicoulaud (@ordrespontane) 3 février 2017
Traduction : vous avez lancez une pièce non-pipée N fois et avez obtenu 80% de faces. Quelle est la valeur la plus probable de N ?
- 10
- 100
- 1 000
- Aucune des trois
Vous êtes 60% à avoir bien répondu et donc, 40% à vous être trompés. Évidemment, la bonne réponse était 10 : il est beaucoup plus probable d’obtenir 8 faces sur 10 lancers à pile ou face que 80 sur 100 lancers (et je vous passe 800 faces sur 1 000 lancers).
Juste pour illustrer le propos, avec 5 lancers vous avez 32 ($2^5$) scénarios possibles dont 5 dans lesquels vous obtenez quatre faces (80%) : FFFFT, FFFTF, FFTFF, FTFFF et TFFFF. Ça nous donne donc une probabilité de l’ordre de 15.6%. Avec 10 lancers, ça nous fait 1 24 ($2^{10}$) scénarios possibles dont 45 avec huit faces (80%) soit une probabilité de seulement 4.4%. Sur 100 lancers, la probabilité d’avoir 80 faces tombe à à environ 0.00000004% et avec 1 000 lancers, la probabilité d’obtenir 800 des faces est… plus que ridicule.
Intuitivement : plus la taille de l’échantillon (le nombre de lancers) augmente, plus on va naturellement converger vers un nombre sensiblement égal de piles et de faces.
C’est-à-dire que la taille de l’échantillon, dans ce type de problème, a une importance cruciale et vous êtes donc 40% à être tombés dans le piège de l’insensibilité à la taille de l’échantillon.
D’une façon générale, après $n$ lancers et une probabilité $p$ de tomber côté face (soit $\frac{1}{2}$ puisque la pièce n’est pas pipée, la probabilité d’obtenir $k$ face est de :
$$ \binom{n}{k} p^k (1-p)^{n-k} $$
Avec :
$$ \binom{n}{k} = \frac{n!}{k!(n-k)!} $$
Sous R, pour ceux qui veulent essayer :
n <- 10 k <- 8 p <- 1/2 bin <- factorial(n)/(factorial(k)*factorial(n-k)) bin * p^k * (1-p)^(n-k)
10 février 2017 at 23 h 33 min
Euh… Excusez moi mais donc la bonne réponse est la 4 non la 1.
Si avec 5 lancés on a une probabilité de 15,6% d’avoir 80% de Face
Avec 10 lancés on a une probabilité de 4,4% d’avoir 80% de Face,
à la question « Quelle est la valeur la plus probable de N quand on a obtenu 80% de Face », La réponse est 5 donc Aucune des réponses proposées donc réponse 4.
Ou alors, j’ai un bug dans ma matrice interne
Alek
11 février 2017 at 9 h 28 min
Bug. Plus le nombre de lancer est petit plus la proba d’avoir 80% de faces est élevée.
11 février 2017 at 15 h 11 min
Donc la bonne réponse à ton sondage est bien la réponse numéro 4 et non la réponse numéro 1 .
« vous avez lancez une pièce non-pipée N fois et avez obtenu 80% de faces. Quelle est la valeur la plus probable de N ?
La valeur la plus probable c’est N=5 , or tu proposes 10,100 et 1000. La bonne réponse au sondage est donc la réponse numéro 4, « Aucune des trois propositions »
11 février 2017 at 15 h 12 min
PS: Si la question avait été « Quelle est la valeur la plus probable PARMI ces propositions ? » alors oui la réponse 1 était la bonne.
11 février 2017 at 15 h 14 min
Je viens de comprendre ton problème. Tu est le seul je crois 🙂 Mais argument recevable, je te l’accordes.
12 février 2017 at 11 h 25 min
Un petit raisonnement simple illustre bien cette convergence : quelle est la probabilité d’obtenir 100% de pile quand on lance n fois une pièce ?
Si je lance une fois une pièce, j’ai 50% d’obtenir 100% de pile.
Si je lance deux fois une pièce, j’ai cette fois seulement 25% de chance d’obtenir PP (les autres combinaisons étant PF, FP et FF).
On voit bien immédiatement que la probabilité n’est pas stable et décroit très raidement avec l’augmentation de N. Je trouve ça plus intuitive pour la majorité des gens, pour qui les factoriels et les puissances de 10 ne sont pas familières.