Mise à jour du 2017-01-27 @ 11:35 : les résultats sont en dessous du questionnaire ! Vous pouvez toujours y répondre mais faites-le avant de lire la suite de l’article.

Cette semaine et pour donner suite au très étrange phénomène observé avec la réponse C, nous vous proposons de tester votre capacité à faire des choix au hasard. Il n’y a ni bonnes ni mauvaises réponses : vous devez simplement vouloir répondre de la façon la plus aléatoire possible ; c’est-à-dire que votre mission, si vous l’acceptez, est de faire en sorte que nous ne soyons pas capables de prédire vos réponses (qui doivent être vos réponses et pas celles d’un générateur de nombres pseudo-aléatoires…)

Plus nous auront de réponses, plus les résultats seront intéressants : n’hésitez pas à faire participer votre famille, vos amis, vos collèges et vos contacts sur les réseaux sociaux : les résultats seront publiés ici même, la semaine prochaine.

Résultats

Le 21 janvier 2017 vers 2 heures du matin, nous avions 1 376 réponses. Pour un premier questionnaire de ce type, c’est plutôt bien mais gardez à l’esprit que ça reste un petit échantillon. Par ailleurs, non seulement il est petit mais il est aussi très biaisé. La plupart de celles et ceux qui ont répondu ont un compte Twitter, bien sûr, mais vous étiez aussi une écrasante majorité de garçons (73.26%), vous aviez plutôt entre 20 et 40 ans (67.81% contre 26.24 de plus de 40 ans et 5.96% de moins de 20 ans) et vous étiez presque exclusivement européens (86.77% contre 7.78% d’américain du nord et moins de 2% pour les autres continents).

En principe, si vous posiez ces questions à un algorithme supposé simuler des tirages aléatoires, les réponses devraient suivre une loi uniforme discrète ; c’est-à-dire qu’en notant n le nombre de choix possibles, la probabilité pour qu’une réponse en particulier soit choisie devrait être d’environ 1/n.

Pour faciliter la lecture de ce qui suit, je vais vous indiquer à chaque fois le nombre de votes qu’aurait dû recevoir chaque réponse si vos choix étaient vraiment aléatoires : on appellera ça le seuil d’uniformité. Une réponse au-dessus de ce seuil d’uniformité signifie que vous avez tendance à la favoriser (et inversement).

Choisissez un nombre entier de 1 à 10

Le seuil d’uniformité est à 137.6, voici les résultats :

Et c’est donc le 7 qui l’emporte largement. Croyez-le ou non : c’est exactement ce à quoi nous nous attendions ; c’est visiblement ce qui se passe dans la plupart des tests de ce type. Sur la base de ce test, 7 a une probabilité de l’ordre de 14.6% d’être sélectionné (contre 10% pour un algorithme). Suivent le 8, le 2 et le 3 mais ça n’est pas très significatif. En revanche, le score du 10 est intéressant : il ne recueille qu’à peine plus de 4% de vos votes.

Choisissez un nombre entier de 1 à 20

Le seuil d’uniformité est à 68.8, voici les résultats :

Vos réponses à cette question, en revanche, sont assez surprenante. Nous pensions que le 17 serait largement en tête1)Voir, notamment, John Conway, The Power of 17. et il fait effectivement un bon score (7.7% contre 5% dans une loi uniforme) mais c’est le 12 qui remporte la mise avec 10.47% des votes, deux fois plus que dans un vrai tirage aléatoire. Le 2, le 3, le 7 et le 8 connaissent encore un succès certain2)Et ce ne sont pas nécessairement ceux qui avaient voté pour ces chiffres à la question précédente. Parmi ceux qui ont voté pour le 7 à la première question (qui était la troisième dans le test), 11.4% ont re-voté pour le 7 mais 12.9% ont choisi le 12, et 12.4% on préféré le 17. , ainsi que le 19. En revanche, vous continuez à bouder le 10 et seuls 2.7% des participants ont voté pour le 20.

Choisissez un nombre entier de 1 à 100

Le seuil d’uniformité est à 13.76, voici les résultats :

Dans cette question, qui était la première du questionnaire, on retrouve le 7 (2.83% contre 1% dans une loi uniforme) et le 17 (2.11%). Mais si vous y regardez de près, la plupart des nombres qui se terminent par 7 connaissent le même succès, sauf 97 : au total, ces dix nombres ont recueilli plus de 20.7% des votes soit le double de ce qu’aurait fait un algorithme. On observe un effet similaire avec la séquence 2, 12, 22, 32, 42 (bien sûr…), 72 et avec 3, 23, 33, 53, 73. Vous avez aussi plutôt tendance à choisir des nombres de 1 à 50 (55.89%) plutôt que de 51 à 100 (les 44.11% restants). Enfin, le 1 (le premier), le 50 (au milieu), 99 (l’avant dernier), les combinaisons de 7 et de 8 (78 et 87) et les combinaisons de 7 et de 3 (37 et 73) remportent un franc succès.

En revanche, à l’exception de 50, vous n’aimez pas les chiffres ronds, sans doute pas assez aléatoires à votre goût : au total, la séquence 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 n’obtient que 6.61% des votes (contre 10% dans une loi uniforme). On a aussi quelques creux bien marqués comme 8-11, 13-16, 18-21, 29-31, 38-41, 60-65, 79-86 et, last but not least, 89-98.

Choisissez une lettre de l’alphabet

Le seuil d’uniformité est à 52.92, voici les résultats :

Et le gagnant est A avec 8.58% des suffrages (contre 3.85% dans une loi uniforme) ce qui est d’autant plus surprenant que vous avez par ailleurs boudé les voyelles : E, I, O, U et Y n’ont collectivement collecté que 11.85% des votes (contre 19.23%). Plus surprenants : les scores de H, G, K et J qui obtiennent respectivement 7.34%, 7.12%, 6.83% et 6.4%. Sans tenir compte de I, pas moins de 43.17% d’entre-vous ont voté pour une des sept lettres qui vont de F à M (contre 26.92% si les tirages avaient été fait par un algorithme).  Enfin, 68.02% des votes se sont portés sur l’une des 13 premières lettres de l’alphabet tandis que les 13 autre ne recueillaient que 31.98% des suffrages.

Choisissez un code à quatre chiffres

Cet exercice était un peu différent : il n’avait pas vocation à deviner votre code PIN — pour ça, il existe des statistiques bien plus robustes — mais à voir s’il existait des différences notables avec les exercices précédents et s’il y avait là des régularités intéressantes.

Sur l’ensemble des chiffres que vous avez utilisé, sans tenir compte de leurs positions, c’est le 4 qui revient le plus fréquemment (dans 12.06% des cas contre 10% dans une loi uniforme) et il est suivi du 2 (11.72%). À l’opposé, vous avez boudé le 9 (8.87%) et surtout le 0 (6.2%).

En tenant compte des positions, c’est le 1 qui arrive en tête pour le premier chiffre dans 15.84% des cas ; il est suivit du 2 (11.92%) et du 4 (11.26%) — et oui, ça ressemble un peu à une loi de Benford. À l’opposé, le 0 tombe très rarement en première position (5.23% des cas). En seconde position, c’est le 4 qui arrive premier avec 12.65%. Il est suivi du 6 (12.14%), du 8 (11.92%) et du 5 (11.70%). En revanche, le 0 tombe encore plus rarement en deuxième position : à peine 4.36% de vos codes. En troisième position, c’est le 3 qui est le plus fréquemment donné (12.57%) ; devant le 2 et le 4 (11.05% chacun). Le 0 trouve enfin ça place (9.45%) mais le 5 et le 6 s’y trouvent dans moins de 8.5% des cas. Enfin, en quatrième et dernière position, le 2 (13.59%) et le 4 (13.30%) sont les plus fréquents tandis qu’encore une fois vous boudez le 0 (5.74%).

En résumé, 1432 est potentiellement le code le plus fréquent (même si seulement l’un d’entre vous l’a choisi tel quel) et 0060 a extrêmement peu de chance d’être utilisé (et d’ailleurs, personne ne l’a fait.)

Juste pour le fun, le code le plus fréquent, et de loin, était bien-sûr 1234 : c’est effectivement le code PIN le plus fréquent dans la vraie vie et c’est surtout l’exemple que nous donnions dans l’énoncé : 27 petits malins l’ont choisi. Il est suivi de 0000 (10 votes) qui, comme ses cousins 9999 (8 votes), 1111 (6), 4444 (5), 5555 (5), 2222 (3) et les autres 6666, 7777 et 8888 (2) sont effectivement des codes PIN parmi les plus fréquents. En revanche, notez que personne n’a pris 3333. En quatrième et sixième positions, on trouve 5678 et 4567 avec 7 et 6 occurrences chacun (je vous laisse deviner pourquoi) et, bien sûr, un certain nombre d’entre vous on utilisé des années : j’ai deux 1515 (Marignan) et pas mal d’années de naissance (les deux qui ont répondu 1948, par exemple, déclarent avoir 69 et 68 ans…) Enfin, les premiers codes un peu élaborés qui reviennent relativement souvent sont 1337, 2512, 3141, 4242, 4321, 5468 et 5632 avec 4 occurrences chacun. Ces choses-là s’expliquent très bien avec une image et en gardant en tête que 86% à 87% des homo sapiens sont droitiers :

Eh oui, ce sont les touches de téléphone les plus accessibles pour un droitier3)Regret : on aurait dû vous demander avec quoi vous remplissiez le questionnaire et si vous étiez droitiers… (raison, sans doute, du peu de succès du 0, du 9 et du 6) et nous sommes très nombreux à choisir nos codes en fonction du « dessin » qu’ils font sur un clavier : 13374)Erratum (2017-01-27 @ 13:22) : on m’apprend que 1337, c’est une référence au 1337 5|*34|< ! J’en apprends tous les jours…, 4242, 4321, 5632 mais aussi 1245, 4578 etc.

Toutes les données sont accessibles ici, faites-en bon usage.

References   [ + ]

1. Voir, notamment, John Conway, The Power of 17.
2. Et ce ne sont pas nécessairement ceux qui avaient voté pour ces chiffres à la question précédente. Parmi ceux qui ont voté pour le 7 à la première question (qui était la troisième dans le test), 11.4% ont re-voté pour le 7 mais 12.9% ont choisi le 12, et 12.4% on préféré le 17.
3. Regret : on aurait dû vous demander avec quoi vous remplissiez le questionnaire et si vous étiez droitiers…
4. Erratum (2017-01-27 @ 13:22) : on m’apprend que 1337, c’est une référence au 1337 5|*34|< ! J’en apprends tous les jours…