|
Les paradoxes du calcul elo par ins9262 le
[Aller à la fin] |
| Arbitrage | |
Le classement elo représente "la force du joueur". Or, l'algorithme du calcul des points elo semble comporter quelques paradoxes.
Petit rappel : La règle du calcul du classement elo de la FFE
Prenons un exemple concret.
La saison passée, Sophie a pris sa première licence et a obtenu un classement de 1600 elo. Pierre, qui joue régulièrement depuis quelques temps, possède un classement de 1900. Sophie vient aux cours
le jeudi soir et joue de mieux en mieux.
En ce début de saison échiquéenne, Pierre et Sophie se lancent un défi : un match en 16 parties homologuées. Résultats : 8 partout !
Conclusion du match ? Les deux joueurs sont de force égale.
Maintenant, petits calculs mathématiques ;-)
Les 2 joueurs n'ont joué que ces 16 parties officielles durant cette session. Elles sont toutes compatibles (300 points d'écart).
Calculons le nouveau classement de Sophie :
- la moyenne des classements de ses adversaires est 1900
- ses résultats sont de 50% (8/16) soit dans la table de bonus/malus une correspondance à 0.
La performance de Sophie s'établit donc à 1900, supérieure à ses 1600 points initiaux, donc le nouveau classement de Sophie est 1900 elo.
Calculons le nouveau classement de Pierre :
- la moyenne des classements de ses adversaires est 1600,
- ses résultats sont de 50% (8/16) soit dans la table de bonus/malus une correspondance à 0.
La performance de Pierre s'établit donc à 1600, inférieure à ses 1800 points initiaux, donc le frein de contre-performance s'applique :
(Rappel : Ej = ((16 x Ei) + (Nj x Pj)) / (16 + Nj) + Arrondi
((16 x 1900) + (16 x 1600)) / (16 + 16) = 1750
donc le nouveau classement de Pierre est 1750 elo.
Conclusion du classement elo ? Sophie est plus forte que Pierre...
Mais ce n'est pas fini.
Pierre veut sa revanche, et demande donc à Sophie un nouveau match, en 16 parties également. Ce match comptera pour la 2ème session de la saison(janvier - avril). Résultat du match, qui reflète timidement la progression de Sophie : 9 à 7 en faveur de la féminine.
Conclusion du match ? Sophie légèrement plus forte que Pierre.
Les 2 joueurs n'ont joué que ces 16 parties officielles durant cette session. Elles sont toutes compatibles (150 points d'écart).
La FFE calcule leur nouveau classement :
Calculons le nouveau classement de Sophie :
- la moyenne des classements de ses adversaires est 1750,
- ses résultats sont de 56,25% (9/16) soit dans la table de bonus/malus une correspondance à +45 environ.
La performance de Sophie s'établit donc à 1795, inférieure à ses 1900 points initiaux, donc le frein de contre-performance s'applique :
(Rappel : Ej = ((16 x Ei) + (Nj x Pj)) / (16 + Nj) + Arrondi
((16 x 1900) + (16 x 1841)) / (16 + 16) = 1847,5
donc le nouveau classement de Sophie est 1850 elo.
Calculons le nouveau classement de Pierre :
- la moyenne des classements de ses adversaires est 1900,
- ses résultats sont de 43,75% (7/16) soit dans la table de bonus/malus une correspondance à -45 environ.
La performance de Pierre s'établit donc à 1855, supérieure à ses 1750 points initiaux, donc le nouveau classement de Pierre est 1860 elo.
Conclusion du classement elo ? Pierre est très très légèrement plus fort que Sophie...
Où sont les bugs ?!
|
|
le bug principal de ton raisonnement qui a d'ailleurs déjà été discuté il y a un moment, mais c'est toujours intéressant, c'est que la méthode Elo est statistique, et deux joueurs ce n'est pas un échantillon suffisamment grand pour être pertinent. Cette méthode est valable avec de nombreux joueurs dont les résultats s'entrecroisent, et sur le long terme (normal, c'est statistique, donc il faut du temps pour obtenir de la cohérence).
|
|
moi j'avais compris que le principe de calcul du ELO etait faussé par la non transitivité des résultats , et le fait que les probabilités de gain/défaite ne sont pas connues entre 2 joueurs.
dans l'exemple de kavaliov on n'a pas ces 2 problemes.
donc le probleme ne vient pas de l'echantillon mais bien de la formule.
|
|
ben non le probleme ici c est que le classement est explicite.. et pas implicite. Ca veut tout simplement dire que NouveauElo=f(AncienEloDesAdversaires) et non pas NouveauElo=f(NouveauEloDesAdversaires). Une methode explicite peut devenir instable quand le pas de temps devient trop grand (ici le pas de temps c est le nombre de parties entre deux actualisations du classement).
|
|
en d'autres termes, sjakk si on actualisait après chaque partie, au bout de16 ce serait plus cohérent?
|
|
ref IDFX bien sur, plus le pas est faible, meilleurs sont les resultats !! Prends l exemple du premier match: Sophie(1600) qui fait 8/16 contre Pierre (1900). Si le classement elo etait actualise apres chacune des parties, le elo de Pierre diminuerait progressivement, tandis que celui de Sophie augmenterait. A la fin ils seraient equivalents. L erreur ici est de considerer que Pierre est 1900 pendant les 16 parties, alors qu en fait son elo diminue. Le plus simple serait d utiliser une methode implicite pour faire les calculs, peut etre qu une methode "predictor-corrector" serait ok. (ici ce serait calculer le preditNouveauElo de Pierre par l ancienne methode: 1750, ainsi que le preditNouveauElo de Sophie par l ancienne methode: 1900, puis de refaire les calculs avec l ancienne methode en prenant les elos predits et non pas les vieux elos).
|
|
donc si le logiciel de calcul fédéral était capable de prendre en compte la date où se jouent les parties , et de faire un calcul itératif sur cette base pour tout le monde (peut-être pas partie par partie, mais par tranches de deux ou trois, ou par tournoi) en respectant la chronologie, ce serait une amélioration..
|
|
ref IDFX.... non la date des parties n a rien a voir. Le tout c est de considerer le NouveauElo dans les calculs et pas l AncienElo ! Au lieu de dire "Sophie a fait 50% contre une moyenne a 1900", il faudrait dire "Sophie a fait 50% contre une moyenne a NouveauEloDePierre". puis "Pierre a fait 50% contre une moyenne a NouveauEloDeSophie". Il s en suit un systeme d equations lineaires qui se limite ici a NouveauEloDeSophie=NouveauEloDePierre et NouveauEloDePierre=NouveauEloDeSophie.S il y a 3000 joueurs il y aura un systeme de 2999 equations a 3000 inconnues (les NouveauElos de chacun des 3000 joueurs). Il n y a plus qu a resoudre ;). Un autre probleme est qu il faudra une equation supplementaire (i.e. un etalon-elo) pour resoudre. Quelqu un dont on dit:"il est 2000 et reste 2000 toute sa vie, le niveau des autres joueurs se comparant a lui".
|
|
ref IDFX 2..... euh pardon, en fait ce que tu dis c est de prendre une methode explicite a petits pas de temps, ce qui ameliorera les choses c est sur !
|
|
Est-ce que l'erreur ... n'est pas plutôt dans le fait que pour le premier tournoi il n'y a pas de frein appliqué à Sophie ? Alors qu'il y en a un dans le 2ème !
Elle a déjà un classement, alors pourquoi cette "faveur" ?
|
|
Ref Yvap Dans le premier cas, il n'y a pas de frein car elle a fait une perf supérieure à son ELO et un nombre suffisant de parties, dans ce cas ELO = perf.
|
|
L'exemple est mal approprié Un match entre deux joueurs avec 300 points ELO de différence qui se termine par 8-8, c'est une sérieuse incohérence. Le nouveau calcul peut paraître bizarre, mais il est moins incohérent que le résultat du match, et l'exemple choisi montre bien qu'au fil du temps, l'erreur de classement tend à diminuer (assez rapidement d'ailleurs).
|
|
re sjakk ce que tu décris, c'est exactement la méthode de calcul du elo des non-classés: une itération sur la base du classment fictif, uniquement pour les parties non-classés vs classés, sans incidence sur les classés, puis une autre avec le classement ainsi obtenu, puis, si je ne m'abuse, une troisième mouture, mais je n'en suis pas sûr... Dernière minute! je viens de vérifier sur le site FFE:
IV TRAITEMENT DES NON-CLASSÉS
1) Remarque : les estimations proposées soit par les Clubs, soit par l'ordinateur des affiliations
en fonction de l'âge du joueur ne sont jamais incorporées dans les calculs.
2) Méthode itérative :
Toute la méthode exposée ci-dessus suppose un classement initial qui fait donc défaut ici.
D'une façon dynamique, les performances des non-classés sont calculées une première fois à
partir d'une valeur quelconque et sans plage de compatibilité. Les performances ainsi établies qui
n'ont pas de véritables sens deviennent la 1ère estimation du joueur non-classé. Une nouvelle
performance est calculée en tenant compte de la plage de compatibilité. Si cette performance diffère
de moins de 20 points de la première estimation créditée juste avant alors cette estimation est
conservée et considérée comme un premier classement (qui ne sera publié que si le quota de 8
parties compatibles est atteint). Si la performance diffère de plus de 20 points de la première
estimation, une moyenne arithmétique est calculée et sert de nouvelle estimation pour le tour de
calcul suivant.
Le cycle estimation / performance / comparaison / moyenne / nouvelle estimation est repris
jusqu'à 25 fois et d'une façon dynamique, c'est-à-dire que tel non-classé estimé correctement au tour
x mais avec des parties contre un ou plusieurs non-classés eux même non encore "figés" peut être ré
estimé au tour x + 2 ou plus tard si besoin.
Cette procédure rend donc pratiquement impossible le calcul manuel du ELO dès que l'un des
adversaires est non-classé.
|
|
C'est bien ce que je dis Matendeux ... c'est idiot !
Pas de frein parce que sa perf est supérieure à son Elo ? Et alors ?
Pourquoi y en aurait-il un si elle est inférieure ? Et pourquoi n'y en a-t'il pas un dans les deux sens ?
Tout cela si j'ai bien compris pour favoriser la progression des jeunes ou nouveaux joueurs.
Pourquoi les favoriser ? Ce sont des joueurs comme les autres.
Et en dehors du fait que cela procure des classements artificiellement gonflés, c'est une absurdité pédagogique. Comment ces jeunes ou nouveaux joueurs peuvent-ils avoir une idée réelle de leur progression et du chemin à accomplir puisqu'en réalité on les "flatte" ?
Sans parler des pleurs et grincements de dents lorsqu'ils passent FIDE ! ;o)
|
|
Les algorithmes.. tout ce que j'adore :-) ref sjakk: no entiendo nada!!!
|
|
ref yvap je trouve que c'est le frein qui est injuste en favorisant les anciens, et pas l'absence de frein.
|
|
Quoi ? (me suis jamais intéressé à l'elo). Il y a un frein si on fait une contre-perf et pas de frein si on fait une perf ???
Alors, il y a inflation générale de l'elo moyen dans le temps ???? D'ailleurs nos deux amis ont au départ un elo moyen de 1750 et finalement de 1857,5. Bon, ce n'est pas linéaire et donc ma moyenne est un peu débile... C'est un peu comme faire une moyenne arithmétique des indices de Richter des tremblements de terre...
|
|
si mes souvenirs sont bons... Bonnet avait fait un article dans un europe echecs d'il y a 2 ou 3 ans dans lequel il racontait exactement la même histoire... sauf que c'était avec Donald et Gontran, qui avaient le même élo avant de jouer leur premier match... et après le match de revanche, Gontran, qui a perdu les deux matchs... a un élo plus fort que celui de Donald!
|
|
Et picsou ?
|
|
Picsou après opération a eu un élo féminin. Sérieusement, je suis entièrement d'accord avec Passleoinj et Xavientas (même si ils ne sont pas d'accord entre eux!).
|
|
frein le frein joue dans les deux sens evidemment. Il est indispensable, sinon quelqu'un qui ne joue que deux ou trois parties par classement va voir son elo fluctuer dans des proportions considerables, du reste la perf est incalculable quand on a 100% (ou 0), ce qui peut facilement arriver sur un petit nombre de parties.
|
|
Réf IDFX Effectivement, tu m'y fais penser. Je demande la suppression de ce frein qui m'a injustement empêché d'avoir un Elo de 2590 au 1er janvier 2000 (une seule partie compatible sur la période, gagnée contre un 2116, donc perf à 2116+470=2586, et je n'ai gagné que 60 malheureux points).
|
|
J ai depose un copyright sur mon systeme de classement predicteur-correcteur semi-implicite... qui permet de calculer le classement de N joueurs en O(N) operations. Je suis actuellement en pour-parlers avec la FidB (Federation Internationale du Bambin) pour que mon systeme de classement devienne le systeme officiel de la FidB.
|
|
Picsou, ca change de l'algorithme :-)
|
|
Je pense
|
|
mince :-) Je pense qu'il y a aussi une histoire de compromis entre coherence et logistique.
J'aime bien le principe de "petit pas" formulé par IDFX, le nouvel elo calculé à chaque partie. Mais vla la logistique derrière.
|
|
convergence Il est généralement admis qu'une meilleure façon de procéder serait de recalculer le elo après chaque partie (ce qui implique de trier les parties par ordre chronologique avant de les traiter) et de traiter les parties individuellement, à la mode FIDE. Le phénomène que vous relevez disparaît alors.
|
|
Ah ces matheux Toujours de bonnes idées :-)
Qd je pense que c'est à cause d'eux que l'on a fait admettre que la mécanique quantique était vraie :-)
Les pauvres physiciens, alala
|
|
Dualité onde/particule Le physicien observe :
Tiens, une particule arrive, je vais lui mettre deux trous en face, elle va surement en choisir un et pas l'autre.
Mince !! incroyable, la particule passe dans les deux trous en meme temps, bein ca alors !!
Un mathematicien passe par là
"Eh mon pote, regarde la particule c'est chelou nan ?
"Bah oui dit le matheux, c'est chelou en effet, bon reflechissons."
"Ah mais oui dit le matheux, j'ai trouvé, la particule se transforme en onde et donc, l'onde passe par les deux trous, et ensuite, hop il revient en particule de l'autre coté"
Le physicien, "Ah ouai, trop fort, merci Mr le matheux, c'est trop cool parce que la, je comprenais plus".
|
|
Le quantum Le physisien : "Whouah, chelou ces quantas, ils absorbent et emettent de l'energie par paquet, incroyable ca nan"
"le ptit garcon "euh, comprend pas la Msieur"
"ah oui, alors t'es sur une balancoire, je te pousse avec une force de +1, tu vas monter a une hauteur de +1 ok. Maintenant, je te pousse avec une force de +1.5, bein tu vas rester à une hauteur de +1. Je te pousse maintenant avec une force de +2, et la hop, tu montes a une hauteurs de + 2. T'as compris là ?"
Ah ouai, Msieur, mais, c'est chelou oui, car moi, si je pousse un peu plus fort, bein, la balancoire monte un peu plus a chaque fois ?"
"Ouai ptit gars, mais bon, c'est la magie du quanta :-)"
|
|
correction "magie du quantum" quanta étant le pluriel de quantum :-)
|
|
Clarac est un quantum ! La preuve ? ... ses posts sont passés dans 2 fils simultanément !
C'est vrai qu'il est "Young" ! ;o)
|
|
sympa la blague yvap :-)
|
|
C'est l'heure du repas... Ah vous voulez en bouffer du plat à la "sauce élo" et bien voici votre assiette...
Bon on a l'arène, les lions, ben voici le reste...!!!
|
|
c'est pour ca que le calcul FIDE semble le seul correct, en tout cas le moins problématique car chaque partie est prise en compte indépendemment des autres et donc de la performance.
|
|
épilogue Moi je trouve ça louche l'organisation d'un match en 16 parties entre deux membres d'un club de sexe opposé ... A mon avis à la fin Sophie et Pierre se marient, et ils eurent plein de petits ELO ... (Enfin, j'exagère, à ce compte Karpov et Kasparov auraient fini par sortir ensemble !)
Sinon globalement le ELO est d'autant plus cohérent qu'on fait beaucoup de parties. D'où l'astuce (à mon humble avis). Sur le plan national, on considère assez de parties pour que le système soit très stable (à mon avis toujours).
|
|
Soyez clairs !! je n'ai compris que le premier post de cette page et aucun des suivants !!
Ca me rappelle mes partiels de maths à la fac : Je comprenais le probleme posé, mais je ne savais pas le résoudre !!
Hélas pour moi cette malediction me poursuit devant l'echiquier : je vois souvent pourquoi ma position est mauvaise, mais je n'arrive pas à l'ameliorer !!!
Qui peut m'aider ??
|
|
?? si tu avais des maths en fac, c'est que tu es beaucoup plus balèze que moi qui n'en avais déjà plus (ou presque) en Terminale ;oD Donc tu plaisantes ???
|
|
ref IDFX je ne plaisante pas helas...j'ai etudié les maths a la fac pour finir avec un doctorat de chimie physique à montpellier
mais j'ai beaucoup joué au tarot et aux echecs aussi à la fac !!
Je confirme que les problemes de maths ou de physiques à la fac etaient assez faciles à comprendre (Ah oui je comprends le probleme !) mais pour le resoudre ? alors là c'est une autre histoire !!
|
|
Analogie medicale c'est un peu comme faire un diagnostic exact du malade mais ne pas savoir comment le guerir !!
|
|
La dualité onde particule est un debat dépassé aujourd'hui ...
les physiciens modernes sont tous par necessité des matheux...
il faut presque etre philosophe a la facon de PASCAL pour avoir l'intuition que la matiere dans sa nature profonde nous est inconnue...
La theorie cherche a unifier l'aspect dualité matiere / energie en parlant de la theorie des cordes...qui vibrent...
Une vibration est un son ...un son est energie...l'energie est matiere..dans tous les ordres...bientot on arrivera à cette conclusion (jean) "Au Début etait la Parole, ...La parole etait Dieu..."
|
|
enfin un post interessant. D'ailleurs un grand physicien contemporain d'Einstein etait un joueur d'echecs averti.
Quel est son nom ?
|
|
bof Lasker était pote avec Einstein en tout cas mais plutôt philosophe que physicien même si c'était un touche-à-tout.
|
|
ben tiens! Eh! Kavaliov? On se fait un match à 50 parties homologuées?????
mdr
|
|
|