A partir de début avril, mon compte Twitter (ici, si vous ne venez pas déjà de là) a commencé à publier quotidiennement des projections de sièges pour les élections européennes qui auront lieu, en France1)Les élections n’ont en effet pas lieu à la même date dans tous les pays, pour conserver les habitudes nationales. Les Pays-Bas, qui ont l’habitude de voter le jeudi, seront donc les premiers à voter le 23 mai. Les résultats ne seront en revanche publiés qu’à la clôture des derniers bureaux de vote, le dimanche 26 mai., le 26 mai. Des sondages sont publiés régulièrement mais aucun ne fournit d’estimation du nombre de sièges qu’emporterait chaque parti, pour des raisons qui ont probablement assez largement à voir avec les caveats que je présente en fin d’article.

Mode d’emploi

Le mode de scrutin des élections européennes a, on le sait, été modifié cette année : alors que le scrutin était précédemment à la proportionnelle sur huit grandes circonscriptions, en 2019 celui-ci aura lieu sur une circonscription unique, ce qui nous simplifiera quelque peu le travail. En revanche, il reste impossible de couper un député en deux, sans compter le seuil de représentation fixé à 5%, ce qui oblige à utiliser une procédure pour allouer les sièges de manière à ce que leur répartition soit la plus proche possible du vote, dans le respect de ces contraintes.

Celle qui est utilisée pour les élections européennes répond au nom de représentation proportionnelle à la plus forte moyenne2)L’autre variante étant la représentation proportionnelle au plus fort reste qui n’est pas utilisée en France. et elle est d’ailleurs utilisée aussi, avec des contraintes légèrement différentes3)Par exemple, une prime majoritaire., pour les autres scrutins de liste proportionnels (élections professionnelles, municipales etc.).

Le quotient électoral

Il était une fois, Tout commence avec le quotient électoral, soit le nombre de suffrages exprimés divisé par le nombre de sièges à pourvoir. Dit autrement c’est le « coût » en voix d’un siège, chaque parti recevant dans un premier temps autant de sièges qu’il a obtenu de multiples entiers du coefficient électoral4)C’est une présentation qui parait inutilement complexe, mais elle a l’avantage d’être flexible et de ne pas laisser de cas douteux sous certaines contraintes un peu complexes., pour autant qu’il respecte les autres conditions.

Exemple

Pour que les choses soient un peu plus claires, nous allons utiliser un exemple qui nous suivra tout au long de cet article. Il s’agit d’une élection obéissant aux mêmes règles que l’élection européenne, dont le nombre de sièges à attribuer, mais avec seulement quatre partis, imaginaires pour ne pas faire de jaloux. Les résultats sont les suivants :

Parti Suffrages Pourcentage Sièges
FLNJ 4,568 31.76% 25
Parti sans retour 658 4.58% 0
En avant toute 6,578 45.74% 36
Parti d’en rire 2,578 17.93% 14
Total 14,382 100.00% 75

Le quotient électoral est de 14,382/79= 182.05. Le Front de Libération des Nains de Jardin obtient donc 4,658/182.05=25.09, arrondi à la baisse, soit 25 sièges lors de cette première phase. De la même manière, En Avant Toute obtient 36 sièges et le Parti d’en Rire, 14. En revanche, le Parti sans Retour n’atteint pas le seuil nécessaire pour obtenir des élus, bien qu’une application directe du quotient électoral lui en eut donnés5)C’est un des cas de figure où la formulation via le quotient électoral évite des incertitudes par rapport à une formulation via une division entière..

Tout cela est bel et bon, mais nous n’avons à ce stade attribué que 75 des 79 sièges et c’est ici que la méthode de la plus forte moyenne prend le relais.

La méthode de la plus forte moyenne

L’idée derrière la méthode de la plus forte moyenne est d’attribuer itérativement chaque siège à la liste qui aura le plus de voix par élu, c’est à dire qui sera la moins surreprésentée par rapport aux autres, après attribution du siège en question, l’objectif étant d’arriver à la répartition finale la plus proche possible du vote exprimé. On divise donc le nombre de voix de chaque liste par son nombre d’élus, plus un, et on attribue le siège à la liste qui obtient le nombre le plus élevé6)Cela peut paraître une complication inutile, mais ajouter un siège à une liste qui en a 1 ou à une liste qui en a 50 n’a évidemment pas le même effet sur la moyenne post-attribution. L’objectif étant d’avoir une répartition équilibrée après l’attribution, on simule donc l’attribution à chaque liste pour faire le calcul. En très résumé.

Exemple

Dans cet exemple, En Avant Toute a le plus grand nombre de suffrages par siège attribué si l’on ajoute un siège à chaque liste, ce parti obtient donc le 76ème siège, ce qui fera bien sûr mécaniquement baisser sa moyenne à l’itération suivante (Le Parti Sans Retour n’apparaît pas, puisqu’il n’atteint pas les 5% nécessaires).

Parti Suffrages Sièges Voix/(sièges+1)
FLNJ 4,568 25 175.69
En avant toute 6,578 37 177.78
Parti d’en rire 2,578 14 171.87
Total 13,724 76  

De la même manière, le FLNJ obtient le 77ème siège, le Parti d’en Rire le 78ème, puis à nouveau En Avant Toute pour le 79ème. 

Vous noterez que la méthode à la plus forte moyenne privilégie une représentation équilibrée des électeurs, et donc les listes ayant obtenu le plus de voix, à l’inverse, la méthode au plus fort reste est plus égalitaire, en quelque sorte, mais a tendance à plus distordre le résultat du vote. Dans le cas peu probable pour les européennes où deux listes auraient exactement le même nombre de suffrages, c’est l’age du capitaine qui sera pris en compte, ou plus exactement la moyenne d’age de la liste.

Caveats

  1. Cette projection quotidienne utilise un seul sondage, le rolling IFOP qui a l’avantage d’être publié de manière régulière. Il est mieux d’utiliser des moyennes de sondages provenant d’instituts différents mais cela pose d’autres problèmes (certains testent une liste Gilets Jaunes, pas d’autres par exemple). Des éditions spéciales seront publiées avec des moyennes lorsque suffisamment de sondages sortiront sur une période restreinte, mais pour les publications quotidiennes, gardez cette limite en tête.
    • Corollaire : ces projections peuvent s’arrêter à tout moment si l’IFOP le demande de manière justifiée.
  2. Le rolling IFOP est trop stable. Bien qu’il soit lissé sur trois jours ouvrables, la variabilité est inférieure à ce qu’on attendrait sur la simple base de l’erreur d’échantillonnage. En l’absence de méthodologie détaillée, il est difficile de savoir de quelle manière les données sont lissées mais cela doit inciter à la prudence.
  3. Trois partis sont très proches du seuil de 5% : l’impact est évident pour eux (PS, DLF, potentielle liste Gilets Jaunes) mais cela a aussi un impact sur le nombre de sièges à répartir dans la seconde phase (très vraisemblablement, même si cela dépend des scores exacts, prioritairement pour LaREM et le RN, et probablement LR). A la moindre variation de score dans les sondages, les attributions de sièges peuvent assez largement varier, c’est une incertitude due au mode de scrutin et la question se posera aussi le 26 mai si un de ces partis est très proche du seuil dans les premiers dépouillements7)C’est probablement une des raisons pour lesquelles les sondeurs ne les publient pas, d’ailleurs.
  4.  Les sondages sont des estimations à un moment donné. Les deux morceaux de la phrase sont importants : « à un moment donné » car l’opinion peut évoluer d’ici à l’élection et « estimations » car outre la bien connue erreur d’échantillonnage, les sondages peuvent avoir une erreur systémique liée à des évolutions de l’électorat, des circonstances différentes des élections précédentes ayant servi à calibrer les modèles etc. Combiné au point 3 cela impose de prendre les résultats avec des précautions.
  5. Si il est peu probable que deux listes obtiennent exactement le même nombre de suffrages lors du scrutin, il est en revanche possible qu’elles obtiennent le même score lors d’un sondage. Cette possibilité est prise en compte dans l’algorithme. Dans ce cas, j’attribue des fractions de siège pour marquer l’incertitude. Par défaut, les sièges sont affichés sous forme entière, si le cas devait se produire, l’affichage passerait en format décimal.

References   [ + ]

1. Les élections n’ont en effet pas lieu à la même date dans tous les pays, pour conserver les habitudes nationales. Les Pays-Bas, qui ont l’habitude de voter le jeudi, seront donc les premiers à voter le 23 mai. Les résultats ne seront en revanche publiés qu’à la clôture des derniers bureaux de vote, le dimanche 26 mai.
2. L’autre variante étant la représentation proportionnelle au plus fort reste qui n’est pas utilisée en France.
3. Par exemple, une prime majoritaire.
4. C’est une présentation qui parait inutilement complexe, mais elle a l’avantage d’être flexible et de ne pas laisser de cas douteux sous certaines contraintes un peu complexes.
5. C’est un des cas de figure où la formulation via le quotient électoral évite des incertitudes par rapport à une formulation via une division entière.
6. Cela peut paraître une complication inutile, mais ajouter un siège à une liste qui en a 1 ou à une liste qui en a 50 n’a évidemment pas le même effet sur la moyenne post-attribution. L’objectif étant d’avoir une répartition équilibrée après l’attribution, on simule donc l’attribution à chaque liste pour faire le calcul. En très résumé.
7. C’est probablement une des raisons pour lesquelles les sondeurs ne les publient pas, d’ailleurs.